brunch

You can make anything
by writing

C.S.Lewis

by 김별 Dec 07. 2023

인공지능 AI와 함께 하는 미래 (2)

나를 알고 인공지능을 알기


지피지기면 백전백승!! 이란 말이 있다.


새로운 물결, 신문명인 인공지능에 대해서도 우리의 대처방안은 이 원칙을 따라야 할 것 같다.

먼저 인간으로서의 우리의 한계와 특징을 제대로 알아야 인간을 본뜬 인공지능도 더 이해하고 활용할 수 있을 것 같다. 그래서 나를 알고 인공지능에 대해서도 최대한 더 알아보기로 한다.


그러나 비전공자인 문과녀로서의 접근이니 알아가는 영역과 수준에도 한계는 있을 것이다.


이것은 한면 자연스럽기도 하다. 마치 우리가 자동차를 몰기 위해서 운전기능을 익히고 자동차에 대한 기본만 알면 되지 세세한 자동차 엔진과 부품 등 그 구조를 다 알 필요는 없는 것과 같다. 그리고 문맹을 벗어나서 문자의 혜택을 보자는 거지 무슨 언어학자나 번역가가 될 필요는 없는 것과도 같다.


 그러니 인공지능에 대한 기본이라도 익히는 글을 써 보려 한다. 그래도 인공지능 완전맹이 되어선 앞으로 점점 곤란해질 거 같으니.


문과녀의 이과산책에서 나는 첫 번째 글로  "과학과 종교의 대립" 을 올렸다.

https://brunch.co.kr/@c3e689f797bd432/200



그 이유는 과헉과 종교 두 양대산맥이 서로 다르다는 이유로 배척하기보다는 상호보완적 관계로 통섭하면서 가는 것이 합리적이고 이상적이다라고 생각했기 때문이다.


마찬가지로 인공지능이란 이 첨단의 어쩌면 과학기술의  끝점에서 우리는 여전히 인문학적 통찰력을 지녀야 한다고 본다. 그것이 인류가 겉잡을 수 없는 기술에 떠 밀려 매몰되지 않고 중심과 균형을 잃지 않은 채  수 있는 거라 보기 때문이다.


기술은 어디까지나 기술일 뿐이다. 그러나 항상 기술 그 너머를 볼 수 있는 것이 인문학적 통찰이라 본다.


예를 들면 이전에 구글이 지금처럼 대세가 아니었을 때 더 승승장구했던 포털 사이트는 야후였다. 그런데 지금 야후는 사라지고 구글이 전 세계를 장악하고 있다. 전문가들은 그 이유를 구글과 야후의 기술력 차이가 아니라 구글과 야후의 통찰력의 차이로 분석했다.


야후는 그들의 전문인력들이 선별한 콘텐츠들 중심으로 정보를 제공한 반면, 구글은 사람들이 검색한 내용과 조회수를 토대로 한 랭킹순위가 높은 콘텐츠 우선으로 정보를 노출시켰던 것이다.

그러니 결과적으로 사람들이 원하는 정보에 부합하는 정보를 얻을 수 있는 곳은 야후가 아닌 구글이었기에 구글이 승자로 살아남을 수밖에 없었던 것이다. 이처럼 기술의 시대에서도 단순히 기술적 측면을 넘어 인문학적 사고를 하며 나아가야 함을 보여주는 좋은 예다.


우리가 먼저 인간, 인문학을 알고 인공지능을 사용해야 하는 또 다른 이유는 앞으로 인간은 기계가 할 수 없는 보다 더 창의적인 일을 해야 하기 때문이다. 그래서 기계가 인간을 대체하면 할수록 인간 고유의 감성이 중요해지고 창의성 개발이 필요해진다.  인공지능 시대가 도래하자 세계적으로 독서 교육이 더욱 강조되는 이유이기도 하다. 우리나라 교육과정에서도 이제는 인문학을 더욱 강조하고 있다.


2020년 11월 교육부에서 발간한 <인공지능시대 교육정책방향과 핵심과제>라는 글에는 'AI가 인간을 대체하는 것보다 더 큰 관심은 인간의 고유 능력에 AI 능력이 더해진 인간+1 협업이라는 말이 나온다. 인간고유의 능력이라는 말은 AI가 할 수 없는  감성적 이해와 공감, 소통에 바탕을 둔 인간적인 사고를 말함일 것이다. 





이제 AI와 관련한 몇 가지 개념들을 정리해 본다.


빅 데이터


빅 데이터는 규모가 매우 크고 다양한 종류의 데이터를 의미한다. 이러한 데이터는 기존의 데이터 관리 도구로는 처리하기 어렵거나 불가능한 정도로 많은 양과 다양한 형태를 가지고 있다.


빅 데이터는 주로 3V라고 불리는 특성을 갖고 있는데, 이는 Volume(규모), Velocity(속도), Variety(다양성)를 의미한다.  


Volume(규모)는 매우 큰 양의 데이터를 의미하며, 예를 들어 인터넷 검색 기록, 소셜 미디어 게시물, 센서 데이터 등을 포함한다. Velocity(속도)는 데이터가 실시간으로 생성되고 전송되는 속도를 의미한다. 예를 들어 주식 거래 데이터나 인터넷 트래픽 데이터는 매우 빠른 속도로 생성되고 처리되는 예다.

Variety(다양성)는 다양한 형태와 포맷의 데이터를 의미한다. 구조화된 데이터텍스트, 이미지, 동영상같은 비구조화된 데이터를 모두 포함한다.


알고리즘


알고리즘은 일련의 절차나 규칙들의 집합으로, 주어진 문제를 해결하기 위해 컴퓨터가 수행해야 할 단계적인 작업 흐름의미한다. 인공지능에서 알고리즘은 데이터를 처리하고 분석하여 패턴을 식별하고 예측하는 작업에 사용되는 인공지능의 핵심요소다.


알고리즘은 다양한 형태와 목적으로 사용될 수 있는데 예를 들어, 머신러닝 알고리즘은 데이터를 기반으로 모델을 학습시켜 예측이나 분류 작업을 수행한다. 최적화 알고리즘은 최적의 해결책을 찾기 위해 문제를 해결하는 데 사용될 수 있다. 또한, 탐색 알고리즘은 주어진 공간에서 특정 목표를 찾기 위해 사용될 수 있다.


요즘에는 유튜브 AI가 나에게 가장 적합한 영상을 추천해 주는 것을 유튜브 알고리즘이라고 부른다. 그리고 유튜브뿐만 아니라 인터넷 쇼핑몰 같은 곳에서도 상품 추천 알고리즘을 적용하여 나에게 가장 적합한 상품을 추천해주고 있다.


 앞으로는 이런 알고리즘이 더욱 정교해질 것이라 한다. 예전에는 알고리즘이 사람이 설정해 놓은 변수와 선택지 안에서만 결정되었다면, 지금은 알고리즘 AI 스스로가 변수와 선택지를 설정, 변경, 확장하고 있기 때문이다. 즉 의사결정 절차 자체가 스스로 진화를 하기에 앞으로 우리는 더 많은 알고리즘 속에서 살게 된다고 볼 수 있다.



머신러닝


머신러닝은 이름 그대로 기계에게 학습을 시키는 기술로, 기계학습이라 번역되는기술이다. 머신러닝 기법 중에서는 인공신경망을 이용한 기법들이 많이 사용되고 있다.


 인공신경망은 인간의 신경 세포 뉴런을 모방하여 만든 것으로  인공 뉴런은 인간의 뉴런과 유사한 형태를 이루고 있다.



인공신경망




인공신경망

 

 뉴럴 네트워크(Neural Network), 인공신경망은 인간의 두뇌를 구성하는 신경세포 즉, 뉴런(Neuron)의 형태 및 동작원리를 모방하여 만든 모델이니 인공신경망을 이해하기 위해 생물학적 뉴런의 원리를 먼저 이해하고 파악하는 게 좋다.

뉴런이란 신경계를 이루는 신경세포로 신경세포체, 가지돌기, 축삭돌기와 같은 부분들로 나뉘어져 있다.

신경세포체안에 핵과 세포질이 있어 여러 생명활동이 일어나고 가지돌기에서 전달된 자극을 받아들여서 축삭돌기를 통해 다른 뉴런이나 기관으로 자극을 전달한다.


  


딥러닝     


딥러닝 역시 머신러닝과 마찬가지로 인공신경망을 활용한 알고리즘이다.     


뉴런이 감각 뉴런(입력)과 운동 뉴런(출력)이 있다면 그 중간 과정에서 생각과 판단을 담당하는 연합 뉴런(뇌 등)이 존재한다. 이처럼 인공신경망도 입력층과 출력층이 있다면 그 사이에는 연합뉴런과 같은  은닉층이라는 부분이 생각과 판단을 담당한다.


여기서 은닉층의 인공 뉴런들을 여러 개 층층이 쌓고 연결한다면 마치 우리 뇌가 더 깊이 생각하는 것처럼 훨씬 뛰어난 생각을 할 수 있게 된다. 이렇게 인공신경망에서 은닉층을 여러 개 층층이 쌓고 연결한 것을 '딥러닝'이라 한다.     


머신 러닝과 딥 러닝의 가장 큰 차이점은 사람의 개입 여부다. 


쉽게 얘기하면 머신 러닝은 데이터의 특징을 분석하는 과정에 사람이 개입하지만, 딥 러닝은 데이터를 스스로 학습해서 판단한다. 데이터를 그냥 주고, 딥 러닝 알고리즘이 스스로 분석한 후 차이를 발견해서 분류한다. 

개와 고양이의 이미지를 수많은 조각으로 잘라서 나눈 후 나중에 합산해서 개인지 고양이인지 판별을 한다.






 

AI 기능은 어디까지 가능할까?


이미 AI가 소설을 쓰고 그림을 그려서 비싸게 팔고 작곡을 하여 빌보드 차트에 오르는 뉴스가 나오고 있다. 

사람 변호사가 20~ 30분 걸리는 법률 분석을 AI  인공지능 변호사는 단 6초 안에 해 낼 수 있다.


기업을 인수합병할 때 AI 인공지능의 역할은 더욱 뛰어나다. 기업의 인수합병을 하기 위해서는 수천수만 페이지로 구성된 회사 자료를 분석해야 하는데, 머신 러닝은 문서를 통한 정보를 파악하는데 놀라운 역량을 보인다.  미국에서는 이혼을 하기 위해 소송을 했을 경우,  1년이 소요될 수 있고 3,000만 원이 들지만 인공지능 변호사는 최단 시간에 최소비용만 든다.



생성형 인공지능     


텍스트, 오디오, 이미지 등의 기존 콘텐츠를 활용하여 비슷하게 새로 만들어주는 것을 의미한다.

우리가 아는 ChatGPT도 우리가 입력해 준 메시지를 활용해, 만들 당시에 학습했던 외부 데이터를 기반으로 하여, 답변 텍스트를 새로 만들어준다는 점에서 생성형 인공지능의 종류 중 하나다.

이외에도 그림을 그려주는 인공지능이나 노래를 만들어주는 인공지능처럼 우리 주변에는 다양한 생성형 인공지능이 존재한다.     



사이버 휴먼 


 디지털 휴먼, 메타 휴먼, 사이버 휴먼 등 다양한 명칭이 있는, 실존 인물이 아닌 소프트웨어로 만든 가상 인간을 의미한다. 넓게 보면 비디오 게임의 캐릭터나 NPC 및 캐릭터형 챗봇도 이에 속한다고 볼 수 있다.


사이버 휴먼 중에는 유명 셀럽도 있다. 릴 미켈라는 2016년 로스앤젤레스의 로봇 인공지능 전문기업 제작한 가상 모델인데 브라질계 미국인으로 제작되어 나이는 19살이고 LA에 거주하고 있으며 모델 겸 뮤지션으로 인스타그램에서 활동하고 있다. 2016년 4월에 처음 선보인 이래로 유튜브와 틱 톡까지 진출해서 세계적인 셀럽으로 성장했고 특히 패션 모델로서  2019년 수익이 130억 원에 이를 정도로 웬만한 슈퍼스타 못지않게 되었다. 그녀가 구찌 옷을 입고 인스타 그램에 포스팅을 할 경우, 게시물당 약 1,000만 원을 받으니 포스팅 전체의 가치도 어마하다.


*가상모델은 컴퓨터 그래픽을 사용하여 만들어진 가상의 캐릭터다. 이러한 가상모델은 주로 디자인, 광고, 엔터테인먼트 등 다양한 분야에서 사용되는데 실제로 동작하고 인공 지능을 가지는 기계인 로봇과는다르다.



300만 명의 팔로워를 보유한 그녀의 인스타그램에서 게시물당 광고 단가는

우리 돈으로  약 1000만 원이다.


      


가상모델로 활동하는 한국의 루시




스스로 판단하고 행동하는 인공지능


자동(Automation)과 자율(Autonomous)은 유사한 듯하지 만 큰 차이가 있다.

'자동'은 인간이 사전에 입력한 프로그 램대로 작동하는 것을 말한다. 이것은 사전에 설계된 대로 반응을 하 는 것이다.


반면에 자율 시스템은  인간의 개입을 최소화해 목표를 달성할 수 있는 가상의 소프트웨어 및 하드웨어 시스템을 말한다. 자율주행 차를 생각하면 되겠다. 인간의 개입을 최 소화하기 때문에, 스마트공장에는 사람이 없고, 스마트홈에는 집주인이 없어도 주변 환경과 상호작용하며 작업을 수행하여, 로봇이 집안 청소를 하고, 난방기나 에어컨등이 알아서 작동해서 자율적으로 최적 환경을 유지하게 된다.


스마트란 말 자체가 이제는 사람의 개입이 없어도 똑똑한 기계가 다 알아서 자율적으로 행하는 것을 의미한다 보면 되겠다.


얼굴인식 기능


 2018년 4월에 중국의 5만 명의 관중이 모인 콘서트장에서 수배 중인 한 남성이  공안에 체포됐다. 콘서트장에 설치한 카메라를 통한 얼굴 인식 기술로 수배자를 찾아낸 것이다. 중국은 범인 검거, 금융 거래, 상거래, 보안, 신분 확인등을 목적으로 얼굴 인식 기능을 사용하고 있다.

범죄자를 찾는 것뿐만 아니라 경우에 따라서는 반인도 추적할 수 있다니 중국을 보면  누구나 언제 어디서나 감시당하는 빅 브라더의 시대가 오는 건 아닐까 싶다.


얼굴 인식 정보가 감시와 다른 네가티브한 목적으로도 사용될 수 있기 때문에 미국과 유럽의 많은 기업은 얼굴 인식 기술 개발을 멈췄다.


 딥 페이크(Deep Fake)


딥페이크는 인공지능을 활용해 사진이나 동영상을 조작하는 것을 말한다.  우리가 흔히 가짜 뉴스를 페이크라 하듯이 가짜 동영상이다. 딥 러닝을 활용해서 원본 이미지나 동영상 위에 다른 이미지를 중첩하거나 결합함으로써 원본 동영상과 조작해서 만들어진다.

오바마 대통령이 다른 곳에서 한 말을 그의 목소리와 결합해서 다른 context에서 내 보낼수도 있다. 이는 충분히 오해와 왜곡 전달을 할 수 있는 여지가 많아 우려되는 부분이다.  이미 리페이스 (Reface), 페이스스와프(Faceswap)와 같은 앱이 있어 쉽게 만들 수 있는 대중적인 서비스가 나와있다. 유명한 연예인의 얼굴이 음란물에 편집되어 나오기도 한다니 씁쓸하다.


이러한 가짜 영상이 특히 정치나 선거에 악영향을 미칠 우려가 크다고 본다. 가짜 동영상을 만들어 서로 상대 후보자의 명예를 훼손하는 경우가 일어날 수 있고 영상의 진위에 대한 왈가왈부 논쟁이 일어날 수 있다.






인공지능 신경망의 파라미터 수


파라미터 수는 신경망 모델 내에 있는 매개변수를 의미한다. 파라미터 수는 신경망의 구조와 크기에 따라 달라지기에 신경망의 복잡도와 모델의 용량(capacity)을 나타내는 지표로 사용된다.


2019년까지 구글, 페이스북이 사용한 신경망의 파라미터 수는 수억 개, 마이크로소프트가 사용한 신경망의 파라미터 수는 170억 개 수준이었다. 그리고 일론 머스크가 설립한 기업 오픈 AI가 'GPT- 3'에 사용한 파라미터는 1,750억 개로 알려져 있다.


네이버·LG, 파라미터 "수천억 개"규모 커질수록 정교함·성능 높아져 의료, 금융 등 고부가가치 산업 공략 가능


인간의 뇌에 시냅스가 존재하듯 AI에는 파라미터가 존재한다. 파라미터가 많을수록 초거대 AI는 더 똑똑해지고 정교해진다.


네이버와 LG의 초거대 AI 파라미터 개수는 각각 2040억· 3000억 개로, GPT-3.5의 1750억 개를 능가한다.


‘똑똑한’ 초거대 AI를 이용해 LG는 인간이 해결하기 어려운 산업 현장의 기술적 난제를 해결하고 있다. LG는 자사의 초거대 AI ‘엑사원’로 항암 백신 개발, 차세대 배터리 물질 개발 등에 활용하고 있다. ( 2023-05-18 )



https://biz.newdaily.co.kr/site/data/html/2023/05/18/2023051800073.html




인간의 뉴런을 모방해 수조 개의 파라미터를 지닌 신경망의 구축이 가능해지고 실제 이를 계산할 수 있는 슈퍼컴퓨터까지 발달하게 된다면 딥러닝은 어떤 국면을 맞이하게 될까 상상해 보게 된다. 


정말 영화에서나 보던 일들이 멀지 않아 현실로 다가오게 될지도 모른다.



브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari