Day 2 | 추석 생존 로그 –작업하고 복습하기

그리고 또 작업하고 복습

by 대장

� 영상과 답답함


소라2 AI 영상이 이틀 전부터 온라인을 휩쓸었다.
사람들은 혁명이라고 떠들썩한 모양이지만, 나는 아직 구경꾼일 뿐이다.
왜냐면 지금은 애플 앱스토어에서만 다운로드 받을 수 있고, 안드로이드에서는 안되니까.

빨리 웹에서도 풀리길 기다릴 뿐...


� 소리와 실험


오늘은 루프 사운드를 본격적으로 작업해보는 날.

수노는 저렴한 대신 크레딧이 빨리 줄어들어서 더 비싼 플랜이 나와야되는 거 아닌가 싶다.

크레딧 소모를 줄이기 위해 수노를 위한 프롬프트 엔지니어링을 찾아 적용해봤다.



[Intro] soft ambient wash, warm gentle pad, calm spacious background

[Verse] smooth evolving texture with subtle cyclical tones, continuous and repetitive, immersive but unobtrusive

Style: ambient, minimal, atmospheric

Mood: calm, welcoming, pleasant, soothing, immersive

Textures: warm pad, low soft drone, airy shimmer, subtle background wash

Constraints: no melody, no vocals, no percussion, avoid strong rhythm or catchy patterns, designed for seamless loop and background use


이런식으로 인트로와 벌스를 나눠 프롬프트를 작성하고, 스타일, 무드, 텍스쳐를 구분했더니 원하는 무드와 비슷하게 나왔다. 루프는 안 되지만 전체적인 퀄리티는 좋았다.


KakaoTalk_20251004_140416372.png

반대로 스테이블 오디오는 루프 사운드는 훨씬 안정적으로 만들어주지만, 전체 퀄리티가 아쉬웠다.

ui도 수노보다 덜 직관적이고, 불편한 구조. 대신 프롬프트 가이딩이 잘 되어있어서 그걸 따라했더니 수노보다는 내가 원하는 방향으로 작업이 가능했다.
그래서 스테이블에서 루프를 뽑아낸 뒤, 그 사운드를 수노로 가져가 퀄리티를 보강하는 방식의 실험을 내일 시도해보려 한다.

스테이블은 크레딧 소모가 적어 수노보다 훨씬 많이 돌려볼 수 있지만, 생성 속도가 느리다.
대신 스템용 사운드를 많이 만들어보면 어떨까 싶은데 이건 내일이나 월요일에 테스트할 예정.



� 커리어와 생존


소라2 영상과 사운드 실험은 내게 두 가지 질문을 던졌다.

“남들이 만든 AI 작업물, AI 툴을 그대로 소비만 할 것인가?”
어쨌거나 소라2를 직접 못 써보는 동안, 나는 뒤처진 느낌을 받았다.

일단 내가 할 수 있는 것들을 조금씩 해나가야지.

기술은 누구나 체험할 수 있지만, 활용은 누구나 할 수 있지만, 그를 넘어 응용의 영역으로 넘어가려면 부지런히 공부해야할 것이다.



� MLOps 복습 — Day 1


어쨌거나 요즘 하는 일들이 너무 많아서, 내가 뭘 공부했고, 어떤 작업을 했는지 기록하지 않으면 결국 머리속에 물음표만 남고 만다. 그래서 연휴동안은 이번 팀 프로젝트 기간동안 내가 했던 작업들을 복습하고 정리하기로 했다. 새로운 걸 배우는 것만큼 중요한 건, 이미 배운 걸 다시 확인하는 거니까.


� MLOps란? (Machine Learning Operations)
데이터 과학자와 엔지니어가 협업해 머신러닝 모델을 자동화·운영·관리하는 방법론을 뜻한다.
단순히 모델 성능을 높이는 게 아니라,

다시 돌렸을 때 같은 결과가 나오는 재현성

새로운 데이터가 들어와도 자동으로 학습·배포가 이어지는 자동화

이 두 가지가 핵심이라고 함.
즉, 지난 머신러닝 경진대회처럼 “모델을 잘 만드는 것”이 아니라 *“언제든 안정적으로 다시 만들고 운영할 수 있는 것”이 이번 MLOps 프로젝트의 요점인 셈.


� 내가 던진 질문들

1. “어떤 데이터를 수집하지?”
→ 지난 프로젝트에서 데이터 전처리에 너무 많은 고생과 시간을 쏟았다.
불필요한 정제 작업 때문에 정작 모델링에는 시간을 못 썼다.
그래서 이번에는 처음부터 공개 API를 사용하는 걸 원칙으로 삼았다.


KakaoTalk_20251004_143155662.png 와인 샘플 API 페이지에서 RUN 실행한 화면


2. “free wine database api? OpenFoodFacts? SampleAPIs?”

→ 실제로 라벨, 이미지, 필드가 있는지 확인해야 했다.
크롤링은 속도는 빠르지만, 법적 리스크와 품질 문제가 크다.
반면 공개 API는 안전하고 빠르며, 스냅샷 저장으로 재현성도 보장된다.

결국 SampleAPIs Wines가 가장 적합했다.
이 API는 즉시 호출 가능한 JSON을 제공하며, 데이터 구조도 단순하다.

→ 특히 라벨 이미지 필드가 있어서, 사람들이 결과 페이지에서 이미지를 함께 볼 수 있는 추천 가능.


KakaoTalk_20251004_142113150.png gpt와 이번 MLOps 프로젝트 주제 회의를 한 후, 팀 회의에 활용했었다.


� 결론

팀원들과의 회의를 통해 콘텐츠 기반 와인 추천으로 만장일치 확정.
공개 API를 활용해 전처리 부담을 최소화하고, 무료라는 점에서 모두가 동의했다.
특히 라벨 이미지가 함께 제공되는 데이터셋이라, 실제 사용자에게 “보이는 추천”을 줄 수 있다는 점이 결정적이었다.


� 복습 요약

MLOps는 모델 성능보다 재현성과 자동화가 핵심이다.

데이터 전처리 부담을 줄이는 전략은 이미 잘 처리된 데이터셋을 찾는 것.

공개 API는 합법적이고 안정적이며, 스냅샷 관리로 재현성도 보장된다.

SampleAPIs Wines는 즉시 사용 가능한 JSON 구조와 라벨 이미지 필드를 제공 → 추천 시스템 UI/UX까지 고려 가능.


KakaoTalk_20251004_194158166.jpg

#AI 부트캠프 #커널아카데미 #커널아카데미부트캠프 #커널아카데미AI부트캠프

매거진의 이전글Day 1 | 추석 생존 로그 – 시작