초단기 AI 자습 기록 (1)
지난 3월, 회사에서 과제가 주어졌다. 업무에 AI 활용 방법 찾기.
팀은 AI를 활용한 신규 프로젝트에 착수했고, 나는 추가 개인과제(?)로 브랜드 전략 기획 업무에 AI를 어떻게 쓸 수 있을지 알아보기로 했다. 주어진 시간은 2주 남짓.
안 그래도 필요성을 느끼고 있던 터라, 반가운 마음으로 공부(?) 시작.
자습한 내용을 간단히 정리하여 팀원들에게 공유했는데, 완전 휘발되기 전에 브런치로 살짝 옮겨본다.
(기술 발전 속도가 너무 빨라서 이미 한 달 전과 다른 내용들도 있지만, 어차피 또 바뀔테니까 그냥 업데이트.)
지난 일주일 동안, AI의 세계(늪)를 열심히 헤엄쳐 다녔습니다. 수영도 하지 못하는데 일단 뛰어들었으니, 허우적거렸다는 표현이 더 적절하겠네요.
대충 이름을 들어본 것은 많았지만, “ChatGPT와 친구들” 정도로 생각했던 AI 세계는 생각보다 복잡하고 혼잡스럽게 느껴졌습니다. 도대체 알 수 없는 기술 용어들이 범람하고, 하루가 다르게 업데이트되는 뉴스가 넘치고 있어요.
뭔지 몰라도 일단 읽고, 또 읽고, 질문을 던져보고, 답변에 답답해하고, 그것을 계속 반복하다 보니… 흐릿하지만 대충 뭔가 머릿속에 그림이 그려지는 느낌입니다. 하지만 정보의 신뢰도는 보장할 수 없으니, ‘이렇게 생각했구나?’ 정도로 봐주세요.
제 머릿속 퍼즐의 첫 조각은 ‘AI 모델’과 ‘AI 서비스’의 구분이었습니다. 눈에 보이는 것은 ‘서비스’지만, 어쨌든 기반 되는 ‘기술’을 이해해야 할 것 같은 기분이 들어서요.
사전적 정의를 찾기보다는 그냥 여러분(ChatGPT, Gemini, Copilot 등)에게 제 생각이 맞는지 물어보았습니다.
속 시원하게 딱 정리하고 싶었는데, 막상 ‘모델’과 ‘서비스’로 구분하여 정리하는 것은 그리 쉽지 않았습니다. 사실상 ‘모델’을 비교하는 것은 저의 기술적인 전문성이 부족했고, ‘서비스’를 비교하는 것은 상황과 환경에 따라 천차만별이기 때문이죠.
그래도 일단, 지난 일주일간 가장 많이 접한 모델/서비스를 간단히 정리해 보았습니다.
가장 먼저 GPT(Generative Pre-trained Transformer). 널리 알려진 ‘ChatGPT’의 기반이 되는 언어 모델로 Microsoft가 인수한 OpenAI에서 개발한 모델입니다. 현재 ‘ChatGPT 3.5’를 무료로 사용할 수 있고, 최신 버전인 GPT-4를 기반으로 한 ‘ChatGPT 4.0’은 유료로 사용할 수 있습니다. ‘ChatGPT 4.0’에서는 DALL-E를 통해 이미지도 생성할 수 있고, 문서나 이미지를 업로드해서 분석할 수도 있습니다. GPTs 오픈 후, 수많은 이들이 API 활용의 가능성을 테스트하고 있습니다.
Claude는 OpenAI 출신 창업자들이 만든 Anthropic의 모델입니다. 시간에 따라 토큰 수 제약이 있지만 3 Sonnet를 무료로 사용할 수 있습니다. Pro는 유료라고 하네요. PDF, Image 등을 업로드해서 분석, 요약 등의 작업도 가능합니다. 표현하기 어렵지만, 개인적으로 되게 마음에 들더라고요. 대충 말하자면, ‘톤앤매너’가 마음에 들어요. 회원가입 단계에서부터 다른 사이트와 조금 다른 인상을 받았습니다.
Gemini는 짱짱 Google 겁니다. Bard는 이제 없어요. 흡수한 거냐고 몇 번이나 물어봤는데, 그건 아니라고 하더라고요. 어쨌든 Gemini의 강점은 Google 생태계 자체인 듯합니다. 구글 검색 기반으로 출처를 추적할 수도 있고, YouTube 관련 질문도 진행할 수 있어서 좋았어요. 미묘하게 말투도 마음에 듭니다. (뭔가 깔끔한 스타일이랄까..) 지금 공개된 버전은 Pro이고, Ultra는 여전히 개발 중이고 일부 인원에게만 공개된 상태라고 합니다.
CLOVA X는 네이버의 ‘HyperCLOVA X’를 기반으로 한 서비스입니다. 한글을 잘하는게 강점이라고 하는데, 사실 잘 모르겠어요. 오히려 네이버 생태계가 장점이지 않을까 싶은데, 아직은 고도화되지 않은 느낌이었습니다. B2B 쪽으로도 열심히 전개하고 있어서, MS의 Copilot처럼 기업의 사무 환경에 적극적으로 적용할 계획이지 않을까 싶습니다. (일부 관련 기사를 읽고 문득 든 생각.)
다음은 Microsoft의 Copilot입니다. GPT-4를 기반으로 하므로 ‘GPT-4 무료로 쓰는 법’으로 알려져 있기도 한데요, 실제론 Bing을 통해 최신 정보를 웹에서 검색할 수도 있고, DALL-E를 통해 간단히 이미지를 생성할 수도 있고, Suno를 통해 간단히 음악을 만들 수도 있는 등 활용도가 높은 서비스입니다. Edge 브라우저를 써야 하지만(단점…), Copilot은 매우 훌륭합니다.
Perplexity의 특성은 “지식이 시작되는 곳”이라는 슬로건에 잘 녹아있어요. 질문을 하면 답변과 함께 관련 추가 질문을 추천해 주는 등 특정 토픽에 관해 넓고 깊은 지식을 추구하는 방향성이 느껴지는 서비스입니다. GPT를 기반으로 한다고 하는데 API를 단순 호출하는 방식은 아니라고 하고, 여러 다른 모델을 Fine Tuning해서 사용한다는 말도 있고 해서 정확하진 않습니다. 어쨌든 ‘AI 모델’은 아니고 다양한 기술을 통한 ‘AI 검색 서비스’라고 이해했습니다.
Poe.com(“Fast, helpful AI chat”)는 대부분의 AI 모델을 간편하게 사용할 수 있는 chat 서비스입니다. 위에서 언급한 거의 모든 모델을 사용할 수 있고, 그 밖에도 StableDiffusionXL, Playground-v2.5 등을 포함한 훨씬 많은 모델을 기반으로 한 봇을 써볼 수 있습니다. 직접 봇을 생성할 수도 있던데(GPTs와 비슷한 개념), 아직 해보진 못했습니다. 가볍게 이것저것 맛보기 좋고, GPT-4나 Claude를 우회하여 사용할 수 있어서 좋았어요.
마지막으로 “모두를 위한 AI 포털”이라는 슬로건을 쓰는 Wrtn은 Poe의 한국판이라고 소개하면 간단할 것 같은데, 솔직히 한글로 사이트가 구성되어 있다는 것 외에 특별한 장점을 느끼진 못했습니다. 이번 주에 대대적인 업데이트가 예정되어 있다고 하니 일단 지켜보려고요.
얕은 지식과 경험으로 글을 쓰자니 부끄럽지만.. 일단 해보는 수밖에 없네요. 내일부터는 활용 사례를 조금 더 다양하게 살펴보려고 합니다.
모두 파이팅!
초단기 AI 자습 기록 (2) 에서 계속...