인공지능과 추천 시스템 강의 노트 - (12/16)

2023. 11. 17.

by 정채상

이번 주는 7개의 발표 거리가 있는 주. 주중에 피드백을 주고 받느라 수업에 들이는 에너지를 조금 당겨 쓴 느낌이긴 하다. 많은 것들을 배울 수 있었던 시간이었다. 부디 학생들도 그러했기를..


준비한 자료들

12주 강의 update

1*N_Fp76rKmNTTahwW8omQEw.png

지난 주 OpenAI 의 발표 이후 Meta 와 Google 의 update들.


ChatGPT 발표 이후 1년이 지났지만 구글 검색에 영향은 없음. bard 와 chatGPT 는 뜨거운 감자이지만 찻잔속의 태풍에 좀 더 가깝고, 스타업들은 영향을 받았겠지만 공룡 기업들은 영향이 없는 것으로… 개인적으로는 quality control 에 들이는 노력이 이를 견인하고 있다는 생각.


Speak by 김찬용

2달간 유료 서비스를 사용해 본 학생의 분석기. 실제로 교육 영역에 많은 지각 변동이 일어나고 있고, 말을 많이 시키고 하게 하는 제품, 서비스. OpenAI 의 whisper API 를 전략적 파트너로 쓴다고 하는 외국인이 만든 한국사용자 first 제품.


온라인 튜터링 대비 저렴한 월 2만원으로 언제나 사용 가능한 서비스라는 점에서 만족도가 있었지만, 아무래도 환경과 장비를 탈 수밖에 없고, 말을 하게 하는 서비스와 말을 못 알아 들을 때 ‘교정'이라는 이름으로 하게 하는 것에 대한 불편함이 있다는 사용자 평가.


스마트 토일렛 by 권종임

이그노벨상 수상의 프로젝트를 보험 입장에서 접근한 아슬아슬한 프로젝트. 개인정보에 더해 민감함이 더해져서 기술적 완성도를 검증하기 힘든 영역.


이미 아픈 사람들을 follow-up 하는 의학과 건강한 사람들 속에서 기존의 방법들이 발견하지 못하는 내용을 의료 기기를 예방의 차원에서 추가적인 value를 찾아 낸다는 것에 대한 난이도. 재미와 기술 자체는 그럴 수 있는 영역이겠다 싶지만, 실제 제품화를 할만한 ROI 가 나오는지에 대한 이야기.


KT 초거대 AI 믿음 by 정효진,홍준용

얼마 전에 LLM 기반으로 무언가를 만들어서 중소기업들을 위해 서비스하고 있다고 알려진 부분에 대해 KT가 보증하는 적당한 foundation model + 쓸만한 한글 되는 서비스 정도.. KT 자체가 여러 가지 onprem을 포함한 bundle 을 잘 하고 있음.


외국산 Big3 을 제외한 한국산 KT의 뒷배를 이용해서 Cloud providr로서 자리를 잡으려는 괜찮은 시도라는 긍정적인 점과 edge 없이 적당히.. 라는 관점에서 자리잡기가 어렵겠다는 걱정 정도. Gen AI 의 폭풍이 아이러니하게 Nvidia 의 폭풍 성장과 onprem 의 도약에 기여한 모습은 어색하면서도 신기하긴 함.


챗봇 “단비” 서비스의 제품분석 및 소개 by 오영택

LG 의 사내 벤쳐로 “챗봇 빌더”를 서비스하고 있는 솔루션. FAQ 를 간단히 해서 누구나 만들기 쉬운 챗봇을 만들겠다느 취지와 다르게, 엔지니어가 없으면 아예 좋지 않고, 그렇다고 딱히 만들기 쉬운 것도 아니어서 포지션이 애매함. Ifttt, google 3p action 같은 경우 모두 쉽지 않은 제품 운용 중.


이제 LLM 들이 독식을 하겠다고 했을 때 여전히 rule 을 만들어 주는 것으로 가성비를 주장하고 싶어 하나, FAQ / chatbot 시장이야 말로 돈이 되려면 아주 잘 해야 하고, 그렇지 않은 경우는 아무 거나 나오기 쉬움. 강제 피봇팅을 당하기 쉬운 BM 과 기술이라 걱정이 앞섬.


물류센터 수요예측 ML 모델 구축을 통한 판매량 예측 방안 by 권기현,김하율

B마트의 fullfillment를 ML 의 관점에서 설명을 하고, 이 중 특히 demand forecast 측면에 대해 설명함. 전문 몰의 이점으로 서비스 단의 갑작스런 이벤트들을 효율적으로 대응할 수 있지만, 그것 이외에 일반적인 접근을 하려 함.


식품의 경우 물류의 비용이 더 드는 편이라 촘촘한 예측으로 인한 비용의 절감 폭이 크고, 그래서 시간 단위로 대응을 할 수 있음. 뭔가 자그마한 개선은 눈에 띄지 않지만, 사고 날 경우 여파가 크기에 여러 regression 을 놓고 앙상블로 평균 대응. 모든 사용자가 아니라 예측하려는 그룹을 변수로 놓는 경우 독립적인 적용이 가능하고, 재고를 당겨서 품절을 대비할 수 있는 버퍼로 사용하게 될 때 좋은 결과가 나타남.


규제(은행) 에서의 ML 활용 기업신용평가 by 서덕철

다양한 형태의 기업의 신용 평가를 보수적으로 진행. 다양한 종류의 모든 기업들.. 돈을 빌려 달라고 하는 주체는 다 포함함. 일반 기업, 비일반기업 등에 대해 자금의 흐름 등을 보고 최대한 시그널을 잡으려는 용도이고, 국민건강보험이나 사업에 쓰이는 인터넷 유지비 등 모든 것들을 씀. 모든 관점을 부도를 맞는다면, 그 확률은 이라는 접근을 하는 역할.


정형화 데이터일지라도 cleansing 이 필요하고, 제 때 제대로 들어오는지 체크가 필요. 기업 별로 점수를 매기고 꾸준히 refresh 하는 게 필요한데, 이것들만 있으면 기존의 요구 사항들은 잘 해결이 가능하고, 비정형 데이터는 정제하더라도 추가적인 value를 주지 못함. 오히려 데이터의 해석 가능성을 기계적으로 도와 주는 데 이용 가능.


AI Anti Money Laundering by 오태경

일단 고객 자체가 대상인지, 송금 방법과 송금 대상, 이체 내역의 문구로 발견이 가능한 지 보수적인 대응을 하고 있는 분야임. 수상한 금융 거래를 발견하는 용도로 쓰이고 있음. 개별 은행이 중앙 기관에 보고하고, 기관은 broadcast 하는 형태의 보수적인 구조.


급한 자금 이체를 blocking 하는 형태로 되어 있어 사용자 불편의 강도가 큼. 내역 분류는 AI 기준으로 simple substring 보다는 나은 방향으로 풀어져 나가고 있음.

keyword
매거진의 이전글인공지능과 추천 시스템 강의 노트 - (11/16)