생성 AI 관련 자동화 스크래핑을 돌리다보면 재미있는 기사들이 나올 때가 있다. 어제 날짜에는 “ChatGPT로 나를 그려줘”라는 기사가 눈에 띄었다. 그래서 내용을 읽어보니 재미있을 것 같았다.
내가 사용한 ChatGPT의 프롬프트를 통해 강화학습(RLHF)된 나의 개인화 정보가 궁금했다.
그래서 데이터로 저장된 프롬프트와 맥락정보를 근거로 나의 이미지를 보여달라고 요청을 했다.
첫 번째 이미지
내가 오타가 심하다고 생각했구나? 넌 내 키보드를 고려하지 않았던거야! 저가형 기계식이라 키압이 이상하단 말이야!
예상대로 Android가 나왔다. Android 개발자이므로 Android Framework을 구현하기 위한 프롬프트가 대부분이었다. 그리고 멀티 플랫폼으로 Flutter를 사용하므로 Flutter가 두 번째로 나왔다. 세번째가 Google Apps Script인데 그것은 업무자동화를 위한 솔루션을 개발할 때 유용하게 사용한 기록 때문이다. 문제는 그림에서 “오타”가 많은데 이것은 나님의 오타때문이 아니라 Dall-e에서 Text를 Object로 인식하고 그렸기 때문이라고 추측된다.
두 번째 이미지
색상과 구성이 마음에 든다.
첫번째 프롬프트에서 영어로 나왔기에 한글로 다시 설명해달라고 프롬프트를 했다. 그랬더니 첫번째보다 만족스러운 이미지가 생산되었다. 일단, 책상의 모습이 내 책상의 모습과 많이 유사했다. 식물과 악세사리 그리고 핸드폰과 필기구가 가득한 책상이 만족스럽다. 특히 노랑 새가 나의 감성을 자극했는데, 이것은 우연이라고 믿는다. 아니면 6번 정도의 “문조의 먹이와 건강”에 대한 데이터를 근거로 생성했을 것이다.
단지 “기술과 자동화에 열정적으로 집중하는 모습”이란 단어가 거슬리긴 했다. 그러다가 머리 속으로 “니가 열정을 알아? 뭘 안다고 쭝얼대? 너님의 수퍼 원조인 Unix Time보다 나님이 더! 먼저 생성되었어! “라는 생각이 스쳐지나가면서 “최근 고혈압 억제제로 복용하는 호르몬제의 부작용의 위험성”을 깨닫게 되었다(건강이 최고다).
인류의 컴퓨터는 인간이 달에 발을 디딘 이후, 몇 년 지난 후에 시작되었다.
세번째 이미지
보완이 필요한 것이 아니라 보안(Security)가 필요해!!
재미삼아 몇 번을 더 프롬프트 했더니 결국 “raw data”의 키워드까지 끄집어냈다. 언제나 느끼는 것이지만 “기업체”에서 기술정보를 “ChatGPT”로 활용될 경우, 어느순간 보안의 이슈가 발생될 것이다. 그런 점에서 Tech 기반의 회사(솔루션 프로바이더)들은 조만간 범용 AI에 대한 사내 규제를 반드시 해야 한다. 우리직원들이 무심코 던진 프롬프트와 “소스 스니펫”들이 글로벌하게 학습될 경우, 경제적 타격을 입게 될 것이 분명하기 때문이다.
마지막 이미지
우리집 퀄리티가 떨어질 뿐, 대략적으로 분위기가 일치한다.
마지막 이미지는 조금 충격을 받았다. 어떻게 내 헤어스타일을 알았지? 그리고 내가 평소 저런 식으로 독서환경을 만든다는 것을 어떻게 안 것일까? 라는 망상에 접하게 되었다. 어떤 논리로도 저런 이미지가 생성될 근거는 없었지만, 싱크로율이 70%이상 일치한다. 특히 드레스코드는 100% 유사하다(사실 개발자 옷이 다 그 따위이긴 하다. 프롬프트상 개발자만 사용하는 코드를 사용했으니 대충 때려 맞추었을 것이다).
궁금증
생성 AI는 툴일 뿐이다. 음모론과 샤머니즘에 심취한 사람이 아니라면 “지적생명체”로 여기는 오류를 범하지 않는다. 그런 점에서 개발자 시각으로는 다음과 같은 궁금증이 생겼다.
개인정보를 다 저장해?
스토리지가 버틸 수 있어?
스토리지 내의 데이터 저장방법(압축과 해쉬)는 어떤 것들이 있을까?
현실상 시간이 지나면 개인정보도 용량의 문제로 버려야 하지않나?
결국, 개인정보는 버리고 카타고리로 유사정보를 만들어야 할 것 같은데?
핵심은 사용자가 개인정보로 믿게 하는 logic과 패턴이 될 듯하다.
결국은 “실제데이터”는 사라지고 분석을 통한 “믿음(패턴)”을 생산하는 방법이 더 고도화 될 듯하다.