brunch

You can make anything
by writing

C.S.Lewis

by 게으른 개발자 Apr 06. 2023

앞으로 인공지능은 배우는 법을 배운다

앞으로 어떤 세상이 될까요?

배우는 법을 배운다

"배우는 법을 배운다"는 말이 무슨 뜻일까요? 현재 매우 핫한 이슈인 ChatGPT는 정말 빠른 속도로 성장하고 있습니다. 사람들은 필요한 정보를 이전처럼 구글에서 얻는 것이 아닌 ChatGPT에게 물어보고 답을 얻고 있고요. 그런데 이 정보가 정말 완벽한 정보였을까요? 그렇지는 않았습니다. 아직 "배우는 법"을 모르기 때문입니다.


ChatGPT의 출발점

이제 GPT-4는 이미지 인식 기능을 탑재하고, 머지않아 음성 인식까지 연동하게 될 것입니다. 기술적으로는 그렇게 어려운 것이 아닙니다. 하지만 이러한 기능들의 추가를 한다고 해서 ChatGPT가 완벽해지는 것은 아닙니다. 이 역시 한계점이 존재합니다. 


혹시 기술쪽에 종사하시는 분이라면 이를 쉽게 눈치채실 수 있는데요. 최근 뉴스에도 나왔듯이 ChatGPT는 답변을 생성하는 인공지능이지 질문자의 의도에 맞는 정확한 답을 제공해주는 인공지능은 아닙니다.


이것은 출발점을 보면 알 수 있는데요. GPT는 Generative Pre-trained Transformer 의 약자로서 우리말로 번역해보면 사전에 훈련된 생성기 라는 뜻을 가집니다. 말이 어려울 수 있는데 다음에 올 내용을 적절하게 생성해주는 생성기라는 뜻이죠.


정말 단순하게 풀어보자면 "휴대O 다음에 올 말은 휴대폰"이 될 수 있듯이 사람들이 보기에 의미가 이어지는 언어 생성기인 셈입니다.


ChatGPT의 현재

먼저, GPT-4 역시 3과 마찬가지로 2021년까지의 데이터를 기반으로 학습하였습니다. 최근 데이터는 아직 학습하지 못했기 때문에, 최신 정보에 대해서는 약한 모습을 보여주고 있습니다. 생성해야 할 자료의 데이터가 부족하니 최신 정보에 대한 질문을 하면 답을 할 수가 없었던 것이죠.


그럼 인터넷에 돌아다니는 내용들을 모두 긁어서 계속 학습하면 되지 않을까요?


이게 바로 open AI 에서 하고 싶은 일 중 하나가 아닐까 생각됩니다. 그런데 현재는 이것이 불가능합니다. 왜 그럴까요?


우선은 인터넷에 올라오는 데이터는 너무나도 많습니다. 우리가 하루에 생산해내는 컨텐츠만 보더라도 아무리 기계라고 한들 모든 내용을 학습할 수는 없습니다. 하지만 이것보다 더 큰 문제가 있습니다.


가장 중요한 것은 데이터의 품질입니다. 만약 정제되지 않은 데이터를 학습시키게 되면 원하지 않는 결과물을 제공하게 될 가능성이 높습니다. 그래서 이러한 일은 과학자와 개발자들이 품질 좋은 자료들을 정제해서 직접 학습시키게 됩니다.


그렇게 하더라도 문제가 완벽하게 해결되지 않습니다. 어느 한 쪽으로 편향된 결과물이 나와서는 안 되기 때문인데요. 정치, 성, 인종, 종교 등의 내용을 다뤄야 할 때 chatGPT는 답변을 기피하게 되어 있습니다. 이것은 의도적으로 개발자들이 막아둔 것이기 때문이죠.


만약 인터넷에 돌아다니는 모든 내용을 학습시킨다면 더더욱 이런 편향된 자료들, 검증이 되지 않은 루머 등등을 학습하게 될 것입니다. 그런 상태가 되면 조금이라도 민감한 질문을 하면 잘못된 답변을 내 놓을 가능성도 높아지는 것이죠.


배우는 법

그럼 어떻게 학습해야 할 자료가 학습할만한 자료인지 아닌지 구분할 수 있을까요? 이게 가능한 일일까요?


가까운 미래에는 의미 있는 데이터와 의미 없는 데이터를 구분하는 능력이 개발될 가능성이 높습니다. 이것은 인공지능의 개발에서 꼭 필요한 것이기 때문입니다. 현재는 학습을 수동으로 하고 있지만 곧 자동화가 된다는 의미와 같기 때문인데요.


자동화라는 것은 기계를 다룰때 직접 하나 하나 컨트롤 하는 것이 아니라 기계가 알아서 자동으로 역할을 수행하게끔 하는 것을 말합니다. 그렇다면 결국 엄청난 속도로 정보를 학습할 수 있게 됩니다. 인공지능은 결국 스스로 새로운 정보를 찾아 학습하고, 사용자에게 더욱 빠르고 정확한 정보를 제공할 수 있게 됩니다.


예를 한번 들어볼까요?


ChatGPT한테 오늘 날씨를 물어보면 답을 할 수 없습니다. 학습된 자료만 가지고 있을 뿐이죠. 이 역시 조만간 해결되겠지만 일부의 인터넷 정보만을 가지고 와서 답변해주는 것에 그칩니다.


그런데 스스로 학습하는 것이 가능해진다면 단순히 날씨의 결과만 제공해 주는 수준을 넘는 답변을 할 것입니다. 지난 날씨에 따른 사건 사고, 최신 뉴스 등을 모두 조합해서 오늘 날씨에 따르면 어떤 음식을 먹고, 어디에 방문하기 보단 이곳이 나을것 같다는 제안까지 하게 될 것입니다.


결국 사람들은 의사 결정을 지원하고, 작업을 자동화하며, 삶의 질을 향상시키기 위해 점점 더 AI에 의존하게 될 것입니다.


예상외의 걸림돌

그렇다고 마냥 핑크빛 세상이 오는 것은 아닐 겁니다. 인공지능은 결국 힘이고, 이 힘을 어떻게 쓰는지는 사용자에게 달렸습니다. 휴대폰이 보급되던 시절 모든 사람들에게 불을 다루는 법을 알려준 것이라면 인공지능이 보급되는 세계에서는 모든 사람들에게 원자폭탄을 다루는 법을 알려준 것과 같습니다.


그래서 수많은 나라들이 각종 규제를 통해 이를 해결하려고 할 것입니다. 이 과정에서 해결할 수 있는 좋은 점과 나쁜 점들이 생겨나고 그 와중에도 인공지능의 힘을 빌려서 나쁜 행동을 하는 사람들은 계속 존재하기에 관련된 사고가 난다면 더더욱 부각될 수밖에 없을 겁니다.


그러한 사고들은 더 강한 규제를 낳게 되겠죠...


결론

지금은 꽤...


엄청나게 복잡한 시기를 살고 있다고 봐도 과언이 아닙니다. 저를 포함해 이 글을 보는 여러분들은 세상의 전환점이 되는 시대에 살고 있다고 말씀드릴 수 있습니다. 


일론머스크, 빌 게이츠 등 많은 사람들도 이 인공지능의 힘을 알고 우려하고 있는 것도 사실입니다. 그리고 그게 저도 틀린 말은 아니라고 생각됩니다. 아무리 규제를 해도 이것은 막을 수가 없고, 정말 머지 않아서(15년 안에) 지금 사는 세상과는 엄청나게 다른 세상이 될 것이라고 확신합니다.


다만 저는 이것이 좋은 방향으로 흘러갔으면 좋겠습니다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari