brunch

You can make anything
by writing

C.S.Lewis

by 리플러스 Feb 04. 2023

AI 기반 생성 : Chat GPT 기본조사


1. Chat GPT의 연구기관, Open AI

https://openai.com/


- 2015년도에 설립된 AI에 대한 비영리 연구기관

- 2018년도에 GPT-1 모델을 기반으로 Chat GPT를 선보임

- 2020년에 업그레이드를 통해  GPT - 3 모델을 적용해 일반인들에게도 공개된 상태.

- 주요 사용처는 텍스트 기반의 질문 및 답변 / 번역 / 내용요약 / 주제기반 리포트 생성 등 여러 방향에 이용 가능

- 2022년 11월 기준, chat gpt의 개발사인 Open AI 측에 MSFT (마이크로소프트)가 10억달러 투자 계획을 밝힌 상태.

- 2023년 기준 1달 사용자가 한달만에 1천만명을 넘어설 정도로, 일일 트래픽량이 증가한 상태






2. Chat GPT의 API / 응용확장

- Chat GPT의 가능성은 단순히 문서정리용 챗봇에서 끝나지 않으며, 별도 API를 제공중.

- 기존 거대 IT 인프라를 기반으로 한 클라우드 서비스 업체들에 비해 비용이 저렴하고 연동이 쉬움.

- 현재 적용되어있는 데이터 기반은 2021년 까지의 데이터이며, 추후 데이터셋이 업데이트 될 수 있음



API 기반 주요 응용범위 소개

https://platform.openai.com/examples?category=code


개발 코드 관련


1. 자연어 입력을 통한 Open AI 연동 (질문 및 답변 / 번역 / 내용요약 / 주제기반 리포트 등)

2. 데이터 규격 텍스트를 입력해 SQL 쿼리 요청문으로 변환 (어느정도 전문지식 필요함)

3. 파이썬 개발 코드를 입력시 해당 코드를 해석하여 자연어로 변환 (개발코드의 기능을 풀어서 설명)

4. 특정 개발 코드의 연산복잡도를 계산 (백엔드 기준, 코드의 연산복잡도에 따른 효용성을 예측)

5. 특정 개발 코드를 다른 개발언어로 변환 (언어의 범위나 제한수준은 알수없음)

6. 개발 코드를 입력시 해당 코드를 해석하여 무슨 기능을 하는지 설명 (언어의 범위나 제한수준은 알수없음)

7. 파이썬 개발코드 입력시 개발 코드의 버그를 찾고 수정처리

8. 자바스크립트 개발코드에 관련된 기술적 질문 답변을 챗봇 형태로 보조가능. (위키 레벨)

9. 자바스크립트 개발코드를 파이썬으로 변환

10. 파이썬 개발코드를 입력시 각 코드의 구성에 대한 주석을 코드별로 생성

11. 자바스크립트 개발코드를 입력시 더 단순한 코드 구조로 변환처리 (수식이 길어질 경우 처리가능한지 확인불가)






3. Chat GPT의 현실적인 문제점


1) 사용 범위의 한계


대부분 자바스크립트와 파이썬 기반의 코드수정 및 개발코드 도우미 정도의 역할을 하는 상태. 특정 기능을 구현할 수 있는 개발코드를 조건을 주고 생성하는 수준은 아직 불가능함. 일부 코드가 삭제되거나, 실무에서 사용할 수 있는 수준은 아닌 것으로 판별됨. 또한 개발코드를 작성하거나, 에러를 체크하는 등의 수준이 개발 언어별로 다름.



2) 언어에 대한 한계


일부 한글번역은 가능하나, 생성속도가 영어에 비해 3~4배 이상 느려지므로. 별도의 번역도구를 이용하는 것이 더 효율적인 상황. 또한 영어를 잘 하지 못하는 사람의 경우, 특정 키워드를 알지못해 검색이 어려워지거나. 특정 '추가요구'를 하지 않는 경우 자세한 정보를 보여주지 않는 경우가 많음. 이 부분은 사용자의 숙련도나 실 사용 범위에도 연관이 있을 것으로 보임



3) 정보 범위의 한계


Chat GPT는 현재 2021년까지의 데이터셋들을 바탕으로 서비스가 이뤄지고있는 상황. 그렇기에 해당 시점 이후에 일어난 지점의 문제는 잘 이해하지 못함. 또한 교육대상의 범위가 해외 영어문서를 바탕으로 처리되어있기에 한국 에 관련된 자료나, 국내 국가기관, 공공기관 등의 자료 등에 대한 요청은 처리가 불가능함.


이미지 검색은 아예 불가능하며, 특정 정보를 '표'로 만드는 등의 기능 등도 일부 데이터셋에만 동작하는 등. 검색가능한 데이터셋의 범위가 넓지 않은것도 문제점.



4) 챗봇 등의 사용시 커스터마이징의 문제


Chat GPT는 기본적으로 자신이 알고있는 데이터셋을 기반으로 답변을 처리함. 그렇기에 추가적인 챗봇형태로 이용하기 위해서는 답변의 범위에 대한 시나리오 작성 및 해당 우선처리 확률 (%)을 지정해줘야함. 다만 이 경우 불필요한 정보에 대해 답변하거나, 서비스나 회사 입장에서 불필요한 용도로 사용될 가능성도 존재함. 높은 자유도로 인해 예외처리를 하기가 쉽지 않다는 것이 문제.







4. Chat GPT의 API 사용가격

https://openai.com/api/pricing/


 

1천토큰 사용기준 : 최소 0.5원부터 최대 24원까지



회사 기준 비즈니스에서 연산량이 높지않은 Ada 모델 기반으로 챗봇을 사용할 경우, 1천개의 토큰사용에 대해 0.5원 (0.0004 달러) 정도의 금액이 사용됨. 토큰 1개는 약 영어 문자 4개 (4바이트) / 혹은 0.75개의 단어를 뜻하므로, 텍스트가 많아질 경우 비용도 기하급수적으로 늘어나는 구조. 심지어 한글의 경우 영어보다 약 2~3배의 토큰이 필요함 (영어 : 1바이트 / 한글 : 최대 4바이트)



Ada 모델 기준, 한글입력시 (자연어 처리) 계산법

- Ada 모델 이용료가 1천 토큰당 4000바이트 기준, 0.0004 달러. 한화로는 0.1 원 (환율 1270원 기준)

- 1토큰 당 4바이트 기준, 약 0.001524 원. 1바이트 기준으로는 0.000381원.

- 한글 1천자 기준으로 환산하면 2500~3000 바이트이며, 한화로 약 1.2원.

- 하루에 한명당 500자 미만으로 / 한달간 1천건의 문의가 발생할 경우, 총 150만 바이트가 나옴.

- 1바이트 0.000381 원 기준, 150만 바이트의 요금은 571.5원


토큰 개념이라 계산하기가 좀 어렵다. 1토큰 = 4바이트 가량


이 계산법은 해당 언어를 영어로 변환해 -> 코드형태로 전송할 경우, 바이트 수가 영어로 전환되어 가격이 더 낮아질 수 있음.



결론

가장 낮은 모델을 사용시 가격이 상당히 저렴한 편. 다만 연산이 많이 필요한 모델을 사용시 가격은 50배로 뜀. 다만 일반적인 비즈니스의 경우 고급 자연어처리 모델을 사용할 필요는 없으므로, 큰 문제는 되지 않을것으로 보임.


실제 챗봇을 만드는 경우 API를 활용할 수 있는 파이썬, 자바스크립트 기반의 백엔드 개발자가 필요하며, 프론트엔드 개발자, 그리고 전문기획자도 필요할 것.




브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari