brunch

You can make anything
by writing

C.S.Lewis

by 백기락 Apr 08. 2024

생성형AI가 보편화될 때, 정작 문제가 될 부분은 ~

인공지능의 보편화를 대비하는 데 필요한 기업과 조직의 기본기

  몇 주 전부터 대대적인 정비를 시작했습니다.  여러 대의 #저장장치 - 대부분은 #외장하드 입니다 - 와 다수의 #노트북 으로 흩어져 있던 70TB 분량의 데이터를 정리하기 시작했죠. 얼추 열흘 정도 지나니까... 대출 정리가 되었습니다. 지금은 업무를 진행하면서 틈틈이 하는 정도입니다. 작업을 하면서 정말 스트레스 받았던 건 바로 #네트워크 속도와 데이터 제한때문이었습니다.  


  가끔 외부 촬영 업무를 대행하러 나갑니다. 그래도 수백 편의 영상 강좌를 찍고, 만들었던 경험이 있다 보니 웬만한 #스튜디오 급의 장비를 갖고 있습니다. 저희 회사는, 주로 출장 촬영에 맞춰져 있고, 강연회, 세미나, 행사 촬영 및 실시간 방송에 초점을 맞춥니다.  특히 실시간 방송 때 좀 어려움이 많은데요, 가장 큰 어려움은 현장의 네트워크 상태가 좋지 않아서, 화질이 떨어지거나, 끊어질 염려가 많다는거죠. 다들 #OTT 도 여러 명이 시청하는데, 왜 문제가 되냐, 고 얘기를 많이 하시죠. 우리가 용어의 개념을 잘 모르고 쓰다보니, #ADSL 이 #비대칭 이라는 걸 잊어버리곤 하죠. 즉, 다운로드 속도는 빠른데, 업로드 속도는 느리다는 사실을 잊자 보니 영화를 보는 건 쉬워도, 행사 영상을 송출하는 건 꽤 어렵다는 걸 놓치곤 합니다.


ㅁ 데이터가 늘수록 속도는 느려집니다...

  조만간, 제 생각엔 1~2년 내 #인공지능 이 어려워서 도입을 못한다, 는 분들은 없을 겁니다. 이미 #챗GPT 만 하더라도 #프롬프트엔지니어링 이라는 거창한 명칭은 붙여 놓았지만, 그냥 대화하듯이 인공지능과 소통하면서 결과물을 생성하거든요. 이 부분이 발전하면 결국 인간의 #자연어 와 유사하게 프롬프트엔지니어링이 발전할테고, 그땐 그냥 대화하라, 로 끝나게 될 겁니다.

  문제는, 인공지능을 쓴다는 것은 몇 줄 문장을 얻고자 하는 게 아니거든요. #감마 #Gamma 같은 앱이 발전하다보면 #PPT 제작이 정말 쉬워진다고 느끼겠지만, 그 안에 들어가는 내용이 풍성해지는 건 완전히 다른 문제이기 때문입니다. 결국 기업의 경쟁력을 맞추려면 인공지능 기반의 서비스나 앱에 데이터를 넣어줘야 하는데, 우리 회사에 대해 전혀 모르는 인공지능이 우리 회사 수준의 어떤 특별한 서비스를, 결과물을 내려면, 상당히 많은 데이터를 학습시켜야 합니다. 오늘은 제가 데이터를 모아야 한다, 는 이야기는 뺄께요. 모아두었다 치면, 그 데이터를 #AI 에게 전송해야 하는데, 이게 만만치 않습니다. 데이터 정리를 잘해두셔서 텍스트 기반 데이터로 학습 데이터를 준비한다면 수백 메가바이트, 수십 기가바이트 수준으로 멈출 수 있겠지만, 결국 AI의 편의성이 증대되면 그냥 데이터를 전송하면 끝날테니 데이터 정리도 과거의 일이 될 가능성이 높습니다. 문제는 그 과정에서 전송속도의 한계 때문에 모으는 데, 보내는 데 너무 오랜 시간이 걸린다는 거죠. 간단한 예로, 제가 한동안 클라우드에 영상을 저장했는데요 - 10TB까지 썼었죠 - 나중에 백업할 때 얼마나 후회했는지 모릅니다. 영상 파일을 다운로드 하는데, 클라우드에서 다운로드하는건, 영화를 시청하는 것과는 또 다르더군요. 시간이 얼마나 걸리던지... 그래서 지금은 영상을, 웬만해서는 #클라우드 에 올리지 않습니다. 너무 시간이 오래 걸려서요. 가끔 영상을 찍을 때, 찍은 파일을 달라고 하시는 분들이 있는데, 이게 비용을 따로 받는 이유가 있습니다. 그 자리에서 보내는 데 시간이 너무 오래 걸려서 그렇습니다. 차라리 수십 만원짜리 #SD 카드를 갖고 계시다가 여기에 담아 주세요, 하면 추가 비용 없이 찍어드릴 수 있을 정도입니다.


ㅁ 데이터를 보관하는 게 보통 일이 아닙니다...

  어찌어찌 해서 괜찮은 서비스를 만들었다 치죠. 그런데 그 서비스 품질이 얼마나 버텨줄까요? 3개월? 6개월? 기반을 잘 준비해둔 덕에 데이터가 잘 쌓인다면, 또 욕심이 날 겁니다. 이 최신(!) 데이터를 학습시켜서 우리 회사의 인공지능 서비스 수준을 높이자 ~ 뭐 이런 계획을 갖는다고 치죠. 자, 그러면 다시 데이터를 학습시켜야 하는데, 여기서 잊으면 안되는 것 하나. 3개월 6개월 전에 학습한 데이터는... 필요없을까요? 그게 아니죠, 그때 그 데이터에 추가된 데이터를 모아서 학습을 시켜야 합니다.  역시 데이터 정제 같은 얘긴 일단 빼구요, 6개월 동안 데이터를 보관한다? 웬만한 기업에서는, 단언컨대, 그 데이터 어디갔어? 가 될 겁니다. 파일 용량이 수십 메가 바이트 이하면, 그래도 어딘가에 저장해놓고 잊어버릴 수 있습니다만, 수십 기가바이트, 수백 기가바이트 넘어가기 시작하면, 파일이나 폴더 하나가 웬만한 디스크 하나 수준입니다. 요즘 시대에 3개월 6개월은 정~말 긴 시간이죠. 어떤 담당자한테 잘 보관하라고 했는데, 그 담당자가 갑자기 중간에 퇴사라도 한다거나, 다른 일에 투입되어서 바쁘게 지내다 보면, 그 데이터가 어디로 갔는지, 그 하드디스키가 어디로 갔는지 또 찾게 될 겁니다. 만에 하나 보관 실패로 삭제가 되었거나 저장매체가 고장이라도 난다면? 별 수 없이... 다시 모으거나, 새로 모아놓은 데이터로만 사용해야 하죠. 뭐, 업데이트할 때마다 데이터를 새로 모아서 학습시킨다면, 학습 효율성은 분명 좋아질겁니다만, 모으고 정리하는 작업이... 웬만큼 손이 가는 게 아닌지라...다 돈 들어가는 일이기도 하구요.  가끔 2년 3년 전에 같이 일했던 곳에서 연락을 해오곤 합니다. 담당자가 퇴사해서 그런데, 그때 그 파일, 그때 그 정보를 확인해 줄 수 있느냐, 구요... 프로젝트 끝나면 지우기로 한 서약서를 쓰지 않는다면 2~3년 정도는 보관해 두는지라 바로 대응을 해드립니다만, 안타까운 경우가 참 많습니다. 왜냐면 파일을 그냥 드려도, 설명을 제대로 안들은 분이 그 파일만 보고 실체에 접근하려면... 시간이 꽤 걸리는 걸 아니까요... 


  인공지능의 시대가 보편화 되어도, 데이터에 대한, 디지털에 대한 기본기가 강한 회사/조직은 다를 수 밖에 없습니다. 인공지능이 대단해보여도, 어느 순간이 되면 기본적인 것들이 될텐데, 그때 어떤 회사가 잘 써먹을까, 오래 쓸까 생각해본다면, 지금 어떤 수준, 역량, 투자가 되어 있으면 좋을지...도 알 수 있지 않을까요?


  오늘이라도, 한 번, 데이터 저장 규모가 어느 정도인지, 얼마나 여유가 있는지, 네트웍 속도는 어느 정도인지 체크해 보시고, 좀 부족하다 싶다면 약간의 비용을 들여서 늘려 놓으시면 어떨까요? 뭐든 급할 때하면... 돈도 더 들고, 시간도 더 들어가고, 더 어려워지니까요.


  #BestAICoach

  #백기락  bestaicoach@hotmail.com 

* 인공지능 생성형AI #ChatGPT 등에 대한 코칭, #멘토링 #컨설팅 을 제공합니다.

** 행사, #세미나 등을 촬영하고 녹화하고, 송출하는 출장 서비스도 하고 있습니다.

*** 인공지능 시대, #비즈니스라이팅 교육을 통해 탁월한 품질의 문서 전문가가 되어 보세요 ~

https://blog.naver.com/kirak/223406391104


작가의 이전글 [백기락의 픽업북] 비욘드 디스럽션 / 김위찬 등
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari