시대가 변했다는 초상이다.
몇 년 전만 하더라도
"빅데이터 = 텍스트 분석"으로 이해하고 받아들이는 사람들이 많았다.
그만큼 텍스트 분석이 대중적으로 인기를 끌었던 것이다.
방송이나 유튜브에 등장한 전문가는 단어 몇 개로 시대를 조망하기도 했으니.
물론 그건 약간의 허수(?)라고 생각은 되지만,
어쨌든 그만큼 사람들에게 텍스트 분석은 핫한 존재였다.
우리나라만 그런 건 아니다.
실제로 빅데이터의 인기는 텍스트 분석으로 미국 대통령 선거를 예측하면서
전세계적으로 회자가 되기 시작했으니.
데이터사이언스, 데이터사이언티스트라는 용어의 시작도
이 텍스트 분석에서 기인했다해도 과언이 아니다.
텍스트 분석이라고 하면 가장 흔히 아래와 같이 '워드클라우드'를 떠올릴 것이다.
트위터(X) 등의 SNS, 블로그, 커뮤니티, 언론 기사 등에 게시된 글을 기반으로
문장에서 단어를 떼어내고, 그 단어가 등장한 빈도를 계산해서 시각화하는 것이다.
대중적인 이해 수준을 고려해서 많은 전문가들이 이 시각화 자료를 사용했지만
사실 이 자료는 분석에서 거의 사용되지 않는다. 너무 기초 수준이라..
그런 텍스트 분석의 위상이 달라지고 있다.
낮아지고 있다는 말이다.
그래도 없으면 아쉬워서
울며 겨자먹기로 전문 회사의 유료서비스를 이용하던 기업들도
이제는 하나 둘 계약 해지를 하고 있는 것 같다.
왜 그런걸까?
텍스트 분석이 맥을 못추는 현 상황을 조망하고
과연 어떻게 바라봐야 하는지 짚어보다.
지금 바로 작가의 멤버십 구독자가 되어
멤버십 특별 연재 콘텐츠를 모두 만나 보세요.
오직 멤버십 구독자만 볼 수 있는,
이 작가의 특별 연재 콘텐츠