처음 접하고 배울 때는 Tool마다 크레디트 혹은 기간을 설정하여 무료로 사용하게 해 준다. 지금 같으면 계획적으로 필요할 때 적기에 사용하려고 노력하겠지만, 당시에는 정말 신기함이 앞서 특히 이미지나 동영상을 생성하는 툴 중에서 일부는 하루에 다 소진하고 아쉬워했던 기억이 남아 있다. 다양하게 사용해 보고 정말 필요한 Tool들은 유료로 사용하라는 의미인 것은 알지만, 흥미롭고 좋은 Tool들은 하루에 크레디트를 탕진(?)해 버리고는 후회한 적이 여러 번 있다. 그 많은 Tool 들을 단순한 흥미로는 비용을 지불하고 다 사용할 수는 없는 일이다. 결국 매력을 느끼지 못하는 Tool들은 아직도 크레디트가 남아 있지만 사용하지 않는 종류도 있고, 꼭 사용하고 싶은 Tool이지만 초기에만 사용하고 중지한 Tool들도 많다.
이러한 갈증을 해소해 준 것이 OpenAI의 ChatGPT Plus이다. 동영상 생성만 빼고 웬만한 기능은 다 포괄하고 있어 내 일상의 중심에 자리 잡게 되고, 나머지 필요한 기능은 검색까지도 포함해서 경중은 다르지만 보조적 위치로 배치되어 버렸다.
사용할수록 더 어려워진다
생성 AI가 현명한 비서처럼 많은 것을 보조해 주고는 있지만, 사용하면 할수록 어려움을 느끼는 것 또한 사실이다. 갈수록 보다 높은 수준의 정보와 정리된 내용, 목적에 맞는 글이나 이미지, 동영상 등을 활용한 질 높은 결과물을 만들고 싶어 지기 때문이다. 그래서 다양한 툴을 써보게 되고, 입력 내용과 출력 내용을 비교하면서 적합한 결과를 이끌어내려고 노력한다. 특히 비용을 지불해야 하는 좋은 Tool일수록 더 신중하게 사용하려다 보니 다양한 Tool들을 선택하고 조합하는데 어려움이 뒤따르게 된다.
좋은 질문만으로는 한계가 있다
프롬프트엔지니어링(Prompt Engineering)이란 좋은 질문을 이론과 경험적으로 만들어 필요한 대답을 이끌어 내게 하는 기술이다. 기술이라기보다는 차라리 노하우라고 표현하는 것이 좋을 듯도 하다. 대형언어모델(LLM)이나 데이터셋(Dataset)의 구조, 결과를 얻어내는 프로세스 등을 이해하고 있어야 더 정확한 결과치를 얻어낼 수 있지만, 기술만이 아니고 인문적인 소양도 필요하기 때문이다. 연구 자체로는 기술이 맞는 표현이어서, 제로샷(Zero-shot)과 퓨샷(Few-shot), 단계적 추론(Chain of Thoughts), 역할부여 등 다양한 방식을 적용하여 사람이 말하고 답하는 것에 가까운 대화가 이어질 수 있게 하는 것이다. 그렇다 하더라도 결국 모아놓은 데이터베이스 범위 내에서 학습시킨 내용을 근거로 원하는 내용일 듯한 단어들을 확률로 예측하여 내놓는 것이기에 정확성에는 한계가 있다.
경험과 시행착오는 필수
검색은 있는 정보를 끌어오거나 장소로 안내해 주면 되지만, AI의 생성은 데이터셋으로 학습한 내용을 바탕으로 결과를 내놓을 수 있어서 더욱이 새롭거나 없는 것을 만들어 낼 수는 없다. 새롭거나 창의적인 것은 도움을 줄만한 보조자로서의 활용에 한정되며, 제시된 내용을 검증하고 취사선택하는데 생각보다 시간과 에너지가 많이 소요된다. 특히 내용을 검증하는데 몇 배의 시간이 더 들어가는 일도 다반사로 일어난다. 때문에 익숙하지 않거나 새로운 정보일 경우 검색보다 더 불편하게 느끼는 경우도 왕왕 있다. Tool에 대한 지식과 경험, 그리고 시행착오가 필수적인 이유이다.
ChatGPT Plus와 보조적 활용 Tool들
아직은 활용범위가 전문가 수준으로 넓지는 않아, 다양한 툴을 사용해 보다가 적합한 몇 개로 좁혀가고 있다. Text생성과 이미지 생성은 OpenAI의 ChatGPT Plus를 중심으로 두고, 구글의 Gemini(제미나이), 마이크로소프트의 BingChat(빙챗)을 필요에 따라 보완재로 활용하고 있다. Gemini도 최근에는 체계적인 답변과 요청하면 출처를 명시해 주는 경우가 많아 대체재 가능성을 염두에 두고 사용 빈도를 늘리고 있지만 정확도 면에서 한계가 있는 것 같다.
이미지의 경우 전용 Tool을 사용하다가 DALL-E 3(달리 3)가 ChatGPT Plus에 통합되면서 이미지 전용 Tool의 활용이 대폭 줄었다. 다만, 특화된 이미지 생성이나 편집과 조정 등을 위한 Upscale(고화소), Background(배경) 삭제, Cleanup(불필요한 이미지 삭제), 이미지 형태 변경 등 편집기능 Tool인 ClipDrop이나 Cutout.pro는 자주 활용하고, hama(하마), Deepimage(딥이미지) 등은 가끔 활용하는 편이다. 유튜브 썸네일을 포함하여 설명이나 홍보를 위한 자료 제작은 Canva 정도면 아직은 충분한 편이다. 미리캔버스(MiriCanvas)는 보조 Tool로 활용하는 정도다. 캐릭터를 생성하거나 로고 등 특화된 작업은 전문 툴을 사용한다.
활용이 증가하는 번역 Tool과 PDF
의외로 많이 활용하는 Tool은 DeepL과 구글 Translate로, 아무래도 AI관련 정보는 미국에서 발행되는 참고자료가 많다 보니 원본을 보거나 번역해서 사용하는 경우가 늘어나고 있다. 메일로 오는 Newsletter나 PDF파일도 번역해서 활용하면 스피드는 물론이고 이해도 면에서 크게 도움이 된다.
PDF파일을 Word 등 MS Office나 한글로 변환할 수 있는 Polaris office나 PDFgear를, Image파일 형식 변경은 Photopea나 ONline converter를 사용하는 편이다.
국내 Tool과 요약해 주는 전문 Tool들
국내 정보나 한글에 특화된 내용이 필요할 경우 뤼튼(Wrtn)이나 CLOVA X, Cue를 가끔 사용하고 있고, Upstage는 세미나를 통해서 알게 된 기술동향이나 OCR인식 기능 확인 차원에서 사용해 보는 경우가 있기는 하다. 회의 시간에 크로바 노트를 사용하면 대화 전문 기록과 요약까지 가능하여, 조금만 손을 보면 별도로 회의록 작성이 필요 없이, 종료 후 바로 참석자들과 공유할 수 있을 정도로 만족스럽다. 다만, 주어진 시간이 초과하면 비용을 지불해야 하기에 계획적 사용이 필요하다.
유튜브 동영상 요약이나 문서요약 기능 Tool은 Lilys, SummerEyes, 등이 유용하다.
traw는 편리한 Tool이었는데 ’ 24.2월 Goodnotes에 합병되면서 서비스가 종료되어 아쉽다.
나에게 있어서 생성 AI의 매력은, 과거에는 할 수 없었고 엄두가 나지 않았던 작업들을 도전할 수 있게 할 뿐만 아니라, 가능하게 한다는 점과 더 매력적인 것은 스피드이다.