데이터와 알고리즘으로 작성하는 기사
# 로봇 저널리즘 - 로봇이 기사를 작성했다네?
아래와 같은 시황기사(기사원문)가 1월 21일 작성되었다. 평범한 시황 기사지만 본 기사는 이른바 로봇 저널리즘으로 대변되는 주가 관련된 데이터와 알고리즘을 통해 작성된 기사이다.
본인이 속한 서울대학교 이준환 교수님 연구팀(HCI+D Lab)과 서봉원 교수님 연구팀(HCC Lab)이 개발한 알고리즘에 의해 실시간으로 작성되었으며 현재는 장마감 시점에서만 작성되고 있지만 추후 실시간 기사도 작성될 예정이다.
로봇 저널리즘에 대해서는 의견이 분분하다. 의견이야 항상 분분하거니 그렇다 치지만 한 가지 안타까운 것은 국내에서는 유독 "저널리즘"영역에서만 그 분쟁이 일어난다는 사실. 유독 로봇 '저널리즘'이라고 불리는 이 새로운 알고리즘이 애초에 저널리즘을 대체하고자 의도는 없다. 그저 매일 같은 템플릿에 온갖 수작업으로 수치를 바꿔 끼는 그러한 비효율적인 업무를 알고리즘이라는 수단으로 자동화할 뿐이다.
# 로봇 저널리즘은 데이터 과학이다.
로봇 '저널리즘'이라고 말하는 '저널리즘'은 저널리즘이라기보다는 데이터 과학이다. 물론 지금 작성된 기사의 수준은 템플릿을 자동화하는 초기 과정에 불과하다. 하지만 그 초기 과정 동안 누적된 데이터들이 모여 의미 있는 인과 관계를 예측하고, 수많은 변수들의 상관관계를 분석할 것이다. 가령 오늘(1월 22일) 코스피 지수가 반등하였다. 이를 두고 기존의 언론은 '아시아 증시 때문에' 반등하였다고도 해석하며, '유럽 양적 완화에' 반등하였다 하기도 하고, '국제 유가 때문이라고' 하기도 한다. 이런 코스피 지수 반등(결과)에 대한 "원인"은 도대체 누가 결정하는가? 지금은 수년간 증권 관련 기사를 작성해온 기자의 연륜에서 우러나온 '감'이며, 이에 누구나 동의한다(복합적인 원인으로 발생한 결과이기에 모두 맞는 말이므로). 그러나 데이터는 이런 '감'을 '근거'로 대변한다. (할 것이다.)
# 국내 데이터 과학의 수준은 어디인가? (본인의 지극히 주관적인 사견임)
빅데이터다 데이터 과학이다 미디어에서건 페북에서건 스타트업을 하는 사람들이건 수도 없이 말한다. 국내에서 BuzzFeed가 한낱 짤방 만들어내던 회사에서 지금의 테크놀로지 회사로 과연 성장할 수 있었을까? 데이터 과학이 미래라고 생각하고, 국내 IT산업의 발전을 리드하는 넓은 안목을 지닌 기업이라면 데이터로 의미 있는 시도를 해보겠다고 보장된 것은 없지만 미래를 내다보고 인내하며 오늘도 밤새 연구실에서 코딩 중인 우수 인력들을 알아보는 안목이 필요하다.