brunch

인공지능과 추천 시스템 강의 노트 - (12/16)

2025.11.22.

by 정채상

들어가며


추워진 날씨와 갑자기 다가온 연말 분위기 물씬 나는 여의도의 주말이고, 회사에서도 수업에서도 연말과 내년을 준비하느라 다들 분주한 상황이라 하겠다. 수업 시간 재료로 쓰려 했던 나눌 수 있는 기말 과제 발표들을 충분히 모으지 못한 상황에서 이야기하고 싶었던 몇몇 주제들을 모아 수업을 준비했다.

IMG_2917.jpg
IMG_2921.jpg
IMG_2920.jpg


준비한 내용들


12주) 강의 update

추천시스템 - 5장 - 추천 알고리즘 상세 ( part 4 )

week12-1.png

지난 주에 Gemini를 전면에 내세운 구글의 본격적인 반격이 시작되었고, OpenAI 는 이에 기다렸다는 듯 코덱스 맥스로 반격하고 있다. 어떤 고귀한 뜻이 있을까 모르겠지만, anti-gravity를 보면서는 한편으로는 여전한 구글의 작명 센스에는 안타까움이 많다.


먼저 similarweb 에서 발표한 GenAI + web 의 상황들에 대한 리포트를 같이 훑어 보았다. 유료는 아니지만 회원들에게 제공하는 리포트였고, 주로 AI 서비스와 검색 시장에 대한 작년 대비 변화에 대한 내용들이었다. SEO 이후 GEO 혹은 AEO 라는 이름으로 다양한 주장들과 논의들이 벌어지고 있고, 꽤 여러 전문가라 칭하고 있는 사람들이 말들을 얹고 있는 상황이지만, 좋은 스코어보드로서 similarweb 같은 데이터들이 중심을 잡아 주면 좋겠다는 생각이다. 아래는 간단 요약.

‘Chatgpt’ 가 구글에서 ‘facebook’을 제치고 제일 많이 불리는 쿼리가 되었고

deepseek strike 이후 구글의 AI mode 는 구글 검색 페이지에서의 배치 덕에 안착했다.

전체 검색의 수는 줄어들고 있고, 구글 이외의 엔진들은 훨씬 더 많이 줄어들었다.

여전히 구글 검색은 세션의 길이가 짧고, chatgpt 는 길게 물어본다. 세션 길이는 짧은 게 좋은 걸까? 긴 게 좋은 걸까 ?


다음 파트에서는 스마트팩토리라는 토픽으로 지난 봄에 써 놓았던 글들을 같이 보면서 인이지(http://ineeji.com/) 와 관련된 이야기들을 나누었다. 피지컬 AI, 제조 공정 등의 키워드가 각광받고 있는데, 실제 현장에서 어떤 문제들을 어떻게 풀고 있는지에 대한 이야기들을 주로 정리했고, 수년 전 DX 이후 AX 라는 이니셔티브가 있지만, 실제 현장에서는 아직 오래된 공정, 잃을 게 많은 서비스 등의 이유로 많은 산업에서 일어나기 혁신이 일어나기 힘든 점들에 대해서 다양한 도메인들과 상황에 따른 이야기들을 나누었다. 새로운 장비들만 놓고 문제는 풀지 못하는 사례들도 있고, 여러 의미로 onpremise 를 고수해야 하는 상황 들도 꽤 강한 제약들로 여전히 작용하고 있는데, 최근에 팔런티어라는 새로운 공룡이 들어오면서 일어나는 변화들과 그 사이에서 역할을 찾으려는 크고 작은 기업들의 노력들이 앞으로의 관전 포인트라 하겠다.


클라우드 기반 스마트팩토리 - 용어들

클라우드 기반 스마트팩토리 - 이슈들

클라우드 기반 스마트팩토리 - 사례들


week12-2.png

세번째 파트에서는 요즘 어딜 가나 듣게 되는 Agent / Agentic 이야기들을 거슬러 올라가서 LLM 이 처음 나왔을 때부터 어떻게 쓰면 좋을까 고민하던 업권의 노력들에 대해 정리를 하였다. prompt 잘 쓰기부터 fine tuning, RAG 를 이용하면서부터 생긴 정보 찾아 주기와 chain 로직을 이용한 다양한 답변 만드는 방법들에 이르기까지.. 한창 진행중인 논의들을 최근 정보들 위주로 다루었다. 여전히 변화무쌍한 상황들을 연결하는 역할을 하고 있는 MCP 까지.. 오늘은 키워드 중심으로 진행한 것이었지만 너무 간단하게 훑어서 이후에 어떤 것들을 조금 깊이 다뤄 볼까 고민이 된다.


마지막으로 추천 시스템 파트에서는 교재에서는 남아 있던 부분인 행렬 분해자연어 처리를 이용하는 방법들에 대한 예제들을 나누었다. 고전적이지만, 사용자와 아이템의 거대한 행렬을 만들고 빈 칸을 예측하며 채워 나가는 꽤나 수학적 접근이고 사용자가 ‘좋아할 만한’ 아이템들을 예측하는 것으로 문제를 정의해 나가고 있다. 메타 정보들을 사용하기도 하고, 사용자들의 리뷰들을 풀어서 입력으로 사용하기도 하는 방법들이고, LDA 와 word2vec 을 적용하는 방법들에 대한 소개들이 있었다. 사용자의 purchase list 를 attribute 로 사용해서 user-user relation을 구현하는 방법들까지 정리가 되어 있다.


교재로서 준비한 책에서 코드와 함께 다루는 내용들은 여기까지여서 더 깊은 이야기들을 마저 나누지 못하였고, 코드들은 링크들로 대체하며 조금 훑어 보긴 했다지만 아쉬운 마무리를 하게 되었는데, 조금은 고전적인 방법론들을 영감으로 각자 실무에 쓰임이 있는 내용들을 해 나갈 수 있길 약간은 무책임하지만 바래 본다.


맺으며


중간 과제와 기말 과제들은 피드백을 부지런히 주고 받고 있지만, 아직 서로 읽어 보며 발표할 수 있을 정도의 글들이 많이 모이지는 않고 있다. 중간 과제인 EDA 리포트들은 다양한 주제들에 대해 기록들이 모이고 있어서 2주 후에 같이 정리할 수 있을 거 같고, 많은 기말 과제들은 마지막 시간에 몰리게 되는 것을 피할 수 없을 거 같다. 다음 주는 개인적인 사정으로 온라인 수업을 진행해야 하겠고, 진행했던 특강 중 하나를 담아 놓을 예정이다.

keyword
매거진의 이전글인공지능과 추천 시스템 강의 노트 - (11/16)