AI 기능 탑재

인공지능, 매력적.

by HJH

History

9.11-2025 : init 버전 개발 완료

9.14-2025 : closed alpha, 사용자 요구사항 정리

9.15-2025 : open alpha, 브런치에 첫 공개

9.16-2025 : K-AI로 이름 변경, AI 기능 탑재


K-AI로 바꾸고 AI 기능을 안 넣으면 안 되니, 급하게 NVIDIA 로컬 모델을 사용해서 크로마키 기능을 넣었다. NVIDIA에서 만든 AI 모델을 사용했기 때문에 배포에 5GB가 필요해서 내부적으로만 업데이트하고 영상으로 공유한다. 집에서 편하게 작업하다 보니 영상이 추하여 심하게 블러 처리를 했는데, NVIDIA의 뛰어난 AI 모델의 힘으로 로컬 AI로만 배경을 하얗게 빼는 것이 가능하다는 것을 보여주고 있다.(카메라 옮겼을 때 frame rate를 얼추 느낌으로 보면 아실 수 있다)

당연히 어떤 S/W 보다 빠를 수밖에 없다. GPU를 만든 회사에서 직접 하드웨어 제어 소프트웨어를 제공하고 그것을 통해서 만드니 말이다. 대기업은 자존심 혹은 브랜딩 때문에 다른 회사 제품을 사용하지 못한다. 오히려 카카오 브래인 회사를 없앤 것과 같이 인정할 건 인정하고, 뤼튼이나 카카오처럼 대놓고 사용하는 것이 낫다.


911을 출시일로 잡았는데, 첫 AI를 탑재한 오늘은 월스트리트 폭탄 테러가 발생한 날이었다.

AI를 탑재해서 하는 말이지만, 통합에 매우 많은 노력이 들어가긴 하지만. 나는 내가 만들었다고 생각하지 않는다. 적어도 스스로 모델을 기획하고 데이터를 수집하거나 빌려서 원하는 목적으로 가공하고 학습시킨 모델을 넣었을 때 비로소 AI를 한다고 말할 수 있다고 생각한다. 파인튜닝 까지는 그래도 AI를 할 수 있다는 것에 또 들어가지 않냐라는 생각이다. 나누는 기준은 간단하다. 좀 더 노력이 필요한가 아닌가에 대한 부분이다. 이 파트에 대해서는 혼자만의 생각이 아니다. 적어도 인공지능 석사 2년 과정이나 최소 3개월 이상은 인공지능만 아침부터 밤까지 진행하는 강의 + 프로젝트를 직접 해보는 과정을 거쳐야지 인공지능 same page에 있을 수 있다고 많은 사람이 말한다. 나 역시 직접 경험했지만 수많은 온라인 강의를 사서 들어도 분명 한계는 있었다. 그래서 요즘 다시 오프라인 강의 시장이 인공지능 시대에 성장한다고 한다. 직접 경험해 보면 역시 사람에게 직접 배우는 것은 뭔가 달라도 다르다. 자세히 뭐가 다른지는 언젠가 정리를 한 번 해야 할 듯하다.


이렇듯 저렇든, 뤼튼이나 카카오가 인공지능을 탑재하는 방식으로 가는 것 + 에지 컴퓨팅은 런쳐의 매우 큰 장점으로 다가갈 것이다. 이것은 전 플랫폼에 걸쳐서 있는 대기업에서 또 하지 못한다. 가령 아이폰에만 기능을 넣는 것을 못한다는 것이다. 그리고 기능을 한 번 넣으면 뺄 수 없다. 그래서 동일 기능 목표에서는 필자가 만드는 런쳐에 들어가는 AI의 속도를 따라올 수 없다는 것이다.


마이크로소프트의 윈도 개발 + NVIDIA의 GPU H/W 생태계를 등에 업고 큰소리쳐 본다.


그리고 딜리버리 히어로는 배달통 접고, 배민 인수하는 수를 뒀었는데.

필자의 경우 앱 개발하면 결국 런쳐의 기능 대부분이 아예 윈도에 포함될 거라 생각했다. 그래서 차별점을 계속해서 따져야 하는데 유저가 스스로 만드는 테마 기능은 꼭 필요한 것이다.


웹페이지 + 앱 실행으로 갔으니, 집에서 정말 편하게 쓰는 엘가토 스트림덱처럼 가는 것도 좋다고 생각한다.


이래나 저래나 공략할 시장은 많다. IT 전문가가 아닌 분인데 컴퓨터 쓰는 사람도 많아서 우선은 그쪽으로 봐볼까 한다. 그렇게 따지면 이번에 넣은 AI는 그냥 넣을 수 있다는 것의 기술적 가능성을 보여줄 뿐이지 유저에게는 아무 쓸모없는 기능이다.


결국 승패는 기술이 아닌 유저를 파악하는데 달려있다. 오늘도 네트워킹을 하며, 많은 사람에게 같은 질문을 하고 다양한 답변 데이터를 모아야겠다.


keyword