brunch

You can make anything
by writing

C.S.Lewis

by 이지 Jul 30. 2023

AI든 사람이든 '데이터'가 중요하다

알고리즘을 뛰어넘는 데이터의 힘

* 이 글은 <비전공자도 이해할 수 있는 AI 지식>(박상길 저자)을 읽고 얻은 정보와 인사이트를 바탕으로 작성하였습니다.


<뉴요커>의 논설위원 '제임스 서로위키'는 <대중의 지혜>라는 책을 통해 '집단 지성'의 개념을 세상에 알렸다. 이는 다양한 집단의 의견이 모였을 경우 소수 전문가의 의견보다 더 정답에 가까운 결과를 얻어낼 수 있다는 원리이다. 이미 다양한 실험으로 여러 차례 증명되어 왔던 이 원리는 평범한 다수가 탁월한 소수보다 훨씬 현명할 수 있다는 가능성, 즉 데이터 집합의 힘을 보여준다.


평범한 다수가 탁월한 소수보다 훨씬 현명할 수 있다는 가능성은 CPU와 GPU의 성능 차이로도 증명이 가능하다. 컴퓨터의 두뇌인 CPU는 성능이 좋은 비싼 코어를 열 몇 개 장착한 구조를 지니고, 게임 그래픽 카드의 두뇌인 GPU는 성능이 상대적으로 떨어지는 코어를 매우 많이 장착한 구조를 지닌다. 

실질적인 제품을 예로 설명해보자면, 2020년 출시된 엔비디아의 게임 그래픽 카드인 RTX 3080은 성능이 조금 떨어지는 코어를 무려 8,700개나 장착하고 있다. 반면 인텔의 최신 CPU인 코어 i7 프로세스의 코어는 약 8개 정도에 그쳤다. GPU가 지닌 코어 각각의 성능은 CPU의 코어보다 떨어질지라도, 어마어마한 코어 개수 차이로 인해 GPU의 작업 처리 속도는 CPU보다 훨씬 빠르다. 

이미지 출처 : '원시 기술' 블로그


데이터의 중요성은 인공지능의 자연어 처리 문제에서도 두드러진다. 2001년 마이크로소프트의 논문에 따르면, 입력 단어의 수(데이터)를 늘리면 어떤 알고리즘을 쓰든 자연어 처리의 정확도는 점점 향상된다. 알고리즘의 차이보다 데이터의 차이가 정확도를 높이는 데 더 큰 기여를 할 수 있다는 의미이다. 즉, 복잡한 문제일수록 좋은 알고리즘을 찾아서 문제를 해결하기보다는, 복잡성을 인정하고 거대한 데이터의 힘을 활용해 문제를 해결하는 게 훨씬 더 합리적이다. 2009년 구글의 인공지능 연구 디렉터인 '피터 노빅'도 논문 <믿을 수 없는 데이터의 효과>에서 "많은 데이터를 가진 간단한 모델이 적은 데이터를 가진 정교한 모델보다 더 뛰어나다"라고 주장한 바 있다.


그러나 알고리즘보다 데이터의 힘을 빌리는 게 문제 해결에 훨씬 유리한 건 비단 인공지능뿐만이 아니라 인간도 마찬가지다. 인간 또한 어떠한 문제에 직면했을 때 방법론(알고리즘)에 매몰될 것이 아니라, 나와 주변의 경험(데이터)을 토대로 사고하고 행동해야 더 나은 결과를 얻을 수 있다고 생각한다. 일단 직접 뭐라도 해보는 '실행력'으로 나의 경험 자산을 쌓는 것이 지름길일 가능성이 큰 것이다. 


가까스로 끌어올린 실행력으로 만들어진 올해의 순간들. 없는 돈 끌어모아 다녀온 멜버른, 직접 운영에 참여해본 오프라인 행사.


'프리랜서로 월천 찍는 법', '이렇게 했더니 일주일만에 팔로워 1만 찍었어요' 등 하루에도 수백개의 방법론이 SNS에 쏟아지는 시대다. 조금이라도 빨리 성취를 이루고 싶은 마음에 그러한 방법론들만 찾아보고 있자면 결국 남는 건 갈팡질팡하며 더디게 움직이는 나 자신 뿐이었다. 그럴 시간에 나만의 경험 데이터를 하나라도 더 모으면 좋았을걸 싶은 깨달음을 뒤늦게 얻었다. 실제로 누구나 한 번쯤 '직접 해보니 판단도 빠르게 서고, 배우는 것도 많았다'라고 생각해본 적이 있듯이 말이다. 많은 공학자들이 수많은 데이터를 입력하여 고성능의 인공지능 모델을 만들고자 노력하듯이, 각 개개인의 인간도 다양하고 질 좋은 데이터들을 적극 확보하여 스스로를 고성능의 인격 모델로 만들고자 하는 노력이 필요하다.





현재 생성형 AI에 대한 인사이트를 공유하고, AI 툴로 디자인 작업물을 만들어보는 스터디를 운영 중입니다! 관심 있으신 분들은 아래 링크에서 같이 차근차근 공부해봐요 ☺️


https://holix.com/ch/Zmabzdao

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari