brunch

라이킷 2 댓글

You can make anything
by writing

C.S.Lewis

계정을 잊어버리셨나요?

by being cognitive May 27. 2024

인간의 언어/지식을 넘어선 Language Model

'24.4월

"인간의 언어/지식을 넘어선 Language Model"에 대한 생각의 묶음.

1. 작년 말에 네이버 하정우센터장님이 권순우기자의 압권 채널에서 인터뷰하신 영상에서, (카더라 채널에 따르면) 샘 알트먼이 OpenAI 이사회에 의해서 해고되는 시점에, OpenAI에서 딥마인드의 알파제로와 유사한 개념으로, 사람의 언어를 기반으로 하지 않는 언어모델 GPT-Zero같은 것을 봤다는 소문이 있다- 라는 말씀을 하신 것이 인상적이었습니다.

https://www.youtube.com/watch?v=7UHzJaVFZvg

2. 그리고, 작년에 Stephen Wolfram 박사님 말씀들도 "스티븐 울프럼의 챗GPT 강의 (박해선 역)"와 Tedtalk 영상 등을 통해서 접해보았는데, 우리가 현재 수립한 언어체계에 대해서는 "우리가 생각했던 것보다 계산적으로 얕은 문제"라고 표현하고,

현재의 수학/물리의 체계 또한, 수많은 가능성 가운데 우리가 "선택"해온 것일 뿐 수많은 다른 방식의 수학과 물리학이 존재할 수 있었을 것이라고 설명하고 있습니다. (미분적분기호도 제가 발명했다면 기호를 한글을 본따서 만들었겠죠...?)

https://www.youtube.com/watch?v=fLMZAHyrpyo

3. (OpenAI를 퇴사한 ^^;) Andrej Karpathy의 영상 중에, 현재의 LLM은 즉각적인 반응을 해내는 System 1에 대해서는 잘 동작하지만, 깊은 사고를 요하는 System 2에 대해서는 아직 수행을 잘 못하고 있으며, 이를 앞으로 어떻게 잘 해낼 수 있을지에 대한 것이 다음의 Challenge이다-

https://www.youtube.com/watch?v=zjkBMFhNj_g

4. 샘알트먼과 빌게이츠와 인터뷰하는 영상에서 보면, 흔하디 흔한 'the'라는 토큰을 생성하는 것과, 리만가설에서 토큰 하나를 생성하는 것이 동일한 cost라는 것이 말이 안되는 것 같다며, 변경을 해야한다는 언급을 합니다.

https://www.youtube.com/watch?v=PkXELH6Y2lM

5. (요건 아직 다 못 본 영상이지만) Yann Lecun 교수님의 Lex Fridman 인터뷰에 따르면, 단순한 autoregression을 넘어서 문제의 깊이에 따라서 다른 양의 연산을 수행해야한다는 언급이 있으셨다고 '합니다' (영상 완주를 못해서 죄송합니다;;)

https://www.youtube.com/watch?v=5t1vTLU7s40

6. 그리고, 어제 AIGRID라는 채널에 따르면, "You don't get superhuman performance by doing better imitation learning on human data"라는 트윗을 OpenAI 직원 Noam Brown이라는 분이 올렸다가 삭제하는 일이 있었다고 합니다. 또한, 영상에서 보면, 암치료제에 대한 연구를 할 때에 / 리만가설에 대한 답을 구할 때에, 우리는 '빠른' 답변보다는 '좋은' 답변을 기대한다는 언급이 나옵니다.

https://www.youtube.com/watch?v=rYH381pZIBc

7. +LLM Prompting 기법에서도, Take a deep breath, and think step-by-step 이라는 문장을 줬을 때에, 더 좋은 답변이 나온다는 발견도 있었죠...

==> 이 여러가지 힌트들을 종합해보면, 현재의 거대 AI 연구자들은 아래의 방향으로 진행되는게 아닐까? 라는 방구석 상상을 해봅니다.

A. System 2 thinking, 깊은 사유, 과학적인 발견의 과정에서 AI를 활용하기 위해, "빠른" 추론보다는 "(느리더라도) 깊은" 추론을 하는 방향을 추구하고 있다.

B. 그리고, 아마도 그 발견의 수단으로 현재의 사람의 언어체계/수학체계를 따라가지 않을 가능성이 제기되는 것 같다.

C. 그렇다면, 현재의 AI 연구는 Human Level Intelligence를 목표로 연구하는 것이 아니라, Super-human level intelligence를 타겟으로 이미 누군가는 굉장한 진전을 보고 있는 것이 아닐까...라고 생각합니다.

==> Puck이 있는 곳이 아니라, 있을 곳으로 가야한다는 하키선수 Wayne Gretzky님의 말씀대로, 우리도 AI 전쟁의 방향을 위와 같이 변경해나가야하는건 아닐지...

+ 우리가 이해하지 못하는 AI'만'의 세계가 펼쳐질 때, 우리가 자칫 irrelevant해지지 않도록 alignment의 과제에 더욱 힘을 쏟아야하겠구나...라는 상념들을 하면서,

방구석 전문가의 글 여기서 마칩니다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari