brunch

인공지능은 정말 ‘스마트’ 한 걸까?

ep 4. 쉬어가는 시간 - 실험결과 .

by 빙산HZ

자, 다시 질문을 해보고 싶다.


인공지능은 정말 똑똑할까?

아니, 인공지능은 신뢰할만한가.


나 역시 2022년 말, Gen AI, 생성형 인공지능이란 주제에 관심을 갖기 시작할 무렵부터 여러 실험을 해본 적이 있다.


2023년 3월 당시 화제가 되었던 달리2를 가지고 했던 실험 결과는 아래와 같다.


다른 색깔의 상자에게 다른 위치를 부여해서 구현할 수 있는 지,

동사의 주어와 목적어를 구분 가능한지,

일반적인 개념에서 어긋나는 이미지를 생성할 수 있는 지 등

12개의 문제를 통해 성공률을 파악해보았다.


당시의 정답율은 8.33%이다.


2025년 2월, 훨씬 더 고퀄의 이미지를 제공하기 시작한 인공지능에게 물이 가득찬 컵의 이미지를 요청했다.


물도, 와인도, 우유도 실패했다.


그 이유는 뭘까?



추측해보건데 훈련 데이터에서 ’보편적인 액체 이미지는 물을 가득채우지 않은 이미지‘라는 것이 원인이 아니었을까?


물론 이런 문제가 이슈가 되면 강화훈련과 세밀조정을 통해 3개월 후에는 원하는 것과 많이 가까워진 이미지를 생성할 수 있게 되기도 했다.



개 세마리를 쫓는 고양이 두 마리 그림을 요청하니 이런 이미지가 나왔었고,

강아지 세 마리 위에 앉아 있는 두 마리 고양이 이미지를 요청하니 이런 이미지를 받았다.


2025년 7월 버전에는 물론 개선된 이미지를 받을 수 있었다.


그 외의 여러 이미지를 통해 생성형 이미지의 부족한 점, 또 개선되고 있는 부분을 확인할 수 있었다.


[발전/개선의 지속 가능성]


그렇다면 이런 발전은 지속가능한 것일까? ’


인공지능의 발전을 이야기 할 때, 자주 언급되는 두 가치 법칙이 있다.


하나는 무어의 법칙을 통해 반도체의 성능 발전에 대한 전망을 하고,


또 다른 하나는 ’스케일링 법칙‘을 통해 데이터가 많아지고 인공지능 모델이 커지면 커질 수록 향상되는 성능에 대한 현상을 바탕으로 인공지능의 미래에 대한 전망을 한다.


하지만 이런 인공지능의 성장은 무한대로 가능한 것일까?


스케일링 법칙은 중력과 같은 물리적인 법칙이 아니다. 지금까지의 현상을 통해 관찰된 결과이다.


인공지능의 성능 향상은 지속가능할까, 아니면 사춘기 청소년의 키처럼 어느 시점에는 멈출까?


현재의 AI는 인류를 좌우하는 또 다른 산업혁명의 원동력이 될 것인가,

아니면 1996년부터 2000년대 경험한 ’닷컴버블‘처럼 터지는 날이 찾아올 것인가?


차트와 경제적 수치만을 봤을 때는 언제 ‘터져도 이상하지 않을’ 상황이다.

하지만 모든 과거의 패턴의 현재에 재현 되지 않듯이 낙관론을 놓지 않고 싶은 이들에게도 그 희망의 근거가 있을 것이다.






keyword