brunch

You can make anything
by writing

C.S.Lewis

by 진실코더 Mar 23. 2023

디지털 '기횤' 7

인공지능과 언론 이야기 #3 단문을 풀어내다

제 하루는 보통 이메일을 확인하는 걸로 시작합니다.

그리고 항상 마주하는 50개가 넘는 보도자료들이 있죠.


어떤 사람은 이 자료를 만들기 위해 많은 시간과 고뇌를 느꼈을 것이고, 누군가는 많은 시간을 공부하고 연구했을 겁니다.

하지만 솔직히 말하자면, 미안하게도 저는 모두 열어보지 못합니다.

결국 일부 보도자료는 뜯지 않은 편지처럼 휴지통으로 사라지게 됩니다.


신문사들이 지금까지 쓴 기사와 글, 수많은 산문들 중에서도 못 읽고 지나친 명작들이 많았을 것입니다.

또 제가 못 읽은 글들은 팔만대장경처럼 존재하지만, 읽지조차 못하는 난제로 남아 있을지도 모릅니다.


오늘은 지난번에 언급했던 구어체 변환 기술에 대해 이야기하고자 합니다.

앞서 언급한 보도자료와 기사의 텍스트는 대부분 구어체가 아닌 단문 형태입니다.

그 아카이브의 양도 엄청납니다.

구어체 변환 기술은 사실 24시간 유튜브 뉴스 기획에서 시작된 파생상품입니다.

방송 기사는 구어체로 쓰여서 크게 수정할 필요가 없지만, 그것만으로는 24시간을 채운다는 건 사실상 불가능하기 때문에 다른 방법을 찾아야 했습니다.

그래서 통신사와 신문 기사를 가져오기로 했는데. 문제는 다 단문이라서 모두 구어체로 바꿔야 했습니다.

이런 작업은 굉장히 힘든 반복 작업입니다.

그래서 구어체로 바꿔주는 인공지능이 필요했습니다.

다행히 코리아텍 교수팀을 만나서 잘 진행되었습니다.

3천 케이스의 학습을 시켰고, 그중 300개의 특수한 언어 학습은 저의 언어학과 출신 동기가 담당했습니다.

이렇게 만들어진 결과물은 완벽한 구어체는 아니지만, 90% 이상 사람의 손길이 필요하지 않게 정제되었습니다.


그렇다면 이 기술을 어디에 사용할까요?


24시간 방송을 위해서 기사를 단문으로 바꾸는 것뿐만 아니라, 음성 변환 기술도 필요합니다.

순차적인 방식을 사용하면 24시간 뉴스를 손쉽게 제공할 수 있게 됩니다.

그러나 더 중요한 내용은 앞서 언급한 팔만대장경 같은 아카이브입니다.

신문사가 가진 수십 년의 아카이브를 구어체로 변환할 수 있다는 것입니다.

음성 지원 기술이 있다면 어디서든 과거의 뉴스를 들을 수 있게 됩니다.

아직 이 기획을 상용화하거나 시험해 본 언론사는 없지만, 조만간 누군가가 시작할 것이라고 생각합니다.


이에 따라 다음 주제는 '인공지능 언론사'로 이야기를 이어나가려 합니다.


이를 통해 기존의 언론사들은 더 많은 콘텐츠를 생산하고, 다채로운 시각과 정보를 제공할 수 있게 될 것입니다. 인공지능을 갖게 된 미래의 언론사는 더욱 창의적이고 혁신적인 방식으로 진화할지, 아니면 인간과 경쟁을 하는 상대가 될지 지켜볼 일입니다.

작가의 이전글 디지털 '기횤' 6
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari