brunch

You can make anything
by writing

C.S.Lewis

by 김가을 Apr 14. 2023

구글 스프레드 시트로 리뷰 데이터 분석하는 방법

코딩할 줄 모르는 마케터가 많은 시간 삽질하며 배운 노하우 전격 공개!

*본 칼럼은 코딩할줄 모르는 마케터분들에게 유용해요.


저는 뼛속까지 문과생입니다.

코딩과 개발자 붐이 일었을 때도 파이썬을 거들떠 보지도 않았죠.


그랬던 저에게 어느날 청천벽력 같은 소식이 찾아왔습니다. 바로 브랜드 리뷰 데이터 분석을 맡게 된 것인데요..!

그 당시 저는 그 수 많은 리뷰 데이터를 분석하려면 코딩은 필수라고 생각했거든요.


리뷰 데이터 분석을 맡았을 때, 제가 쓸 수 있는 데이터툴이라곤 구글 스프레드 시트 밖에 없었던 막막한 상황이었답니다.


마케터라면 누구나 공감하는.. 


‘꿩 대신 닭!’

‘이가 없으면 잇몸으로!’라는 마인드로 수 많은 삽질을 했습니다. 


그 결과! 구글 스프레드 시트만으로 제법 완성도 높은 리뷰 데이터 분석을 할 수 있었습니다.


코딩 없이 수 많은 리뷰 데이터들을 스프레드 시트만으로 분석할 수 있었던 노하우를 지금부터 전격 공개하겠습니다!






1단계: 데이터 추출 및 정리


가장 먼저 리뷰 데이터를 추출할 곳을 찾아야해야 합니다.

이 때, 리뷰를 남길 수 있는 사이트를 최대한 많이 찾는 것이 중요합니다.

예시로, 다음과 같이 정리해볼 수 있을 것 같아요.


리뷰 사이트를 모두 정리했다면, 이제 이 리뷰 데이터를 구글 스프레드 시트로 옮겨올 차례입니다.

오픈 마켓은 관리자 계정에서 리뷰를 엑셀로 다운 받을 수 있지만, 자사몰이나 다른 채널은 엑셀 다운로드 기능을 지원하고 있지 않습니다.


엑셀 다운로드가 안 되는 이 수 많은 리뷰 데이터를 하나씩 ‘복사+붙여넣기’ 할 수도 없고 어떻게 옮겨야 할 지 난관에 봉착하게 됩니다.


저는 첫 분석에서 미련하게도 하나씩 ‘복사+붙여넣기’ 했답니다..

하지만 두 번째 분석을 맡았을 때, 악몽 같던 복붙 노가다를 다시 겪지 않기 위해 무한 구글링을 했습니다.


그렇게 알게 된 정말정말 유용한 툴!을 추천합니다.

(리뷰 데이터 분석은 이 프로그램을 알기 전과 후로 나뉩니다.)


바로 Listly입니다.

https://www.listly.io/ko


Listly를 사용하면 코딩 없이도, 웹 크롤링이 가능합니다.

웹사이트의 수많은 데이터를 마우스 클릭 몇 번 만으로 스프레드 시트로 옮길 수 있죠.


다만, 다양한 사이트에서 크롤링을 하게 되면 열의 순서가 뒤섞여서 옮겨집니다.

이 때 우리는 데이터 분석을 위해 필요한 열을 맞추고, 필요 없는 열을 삭제하며 데이터 정리(데이터 전처리)를 해줘야 합니다.


이해를 돕기 위해 프랜차이즈 커피숍 모 지점의 네이버 리뷰와 구글 리뷰의 일부를 각각 크롤링한 뒤, 분석에 필요한 열들로만 구성하여 라벨을 붙여 깔끔하게 정리 했습니다.



2단계: 데이터 분석

본격적으로 리뷰 데이터를 분석하기에 앞서, 데이터 분석의 기준이 필요합니다.

따라서 리뷰에서 많이 언급되는 키워드를 추출하는 작업을 진행해줍니다.

이를 파이썬에서는 자연어 처리라고도 합니다.

저는 파이썬을 할 줄 모르기 때문에 우회로 한글 키워드 분석 사이트를 찾았습니다.

http://nlp.kookmin.ac.kr/cgi-bin/indexT.cgi


사이트에 리뷰를 전부 복붙하면 리뷰의 형태소를 분석해줍니다.

그 중 일부를 캡쳐했고, 실제 분석된 키워드는 화면 상의 키워드보다 훨씬 많습니다.


Term이 추출 키워드이고, Freq는 해당 키워드의 빈도를 나타냅니다.

지금은 리뷰가 많지 않아 빈도가 비슷해보이지만,

리뷰가 많을수록 눈에 띄게 높은 빈도를 보이는 키워드들을 찾을 수 있습니다.



이 높은 빈도를 보이는 키워드들을 카테고리를 설계하여 분류해주면 됩니다.

카테고리 설계는 비즈니스의 종류에 따라 완전히 달라질 수 있습니다.


아래 표는 예시입니다.



이 때 주의할 점은 한글의 문장 구조는 영어와 달리 단어가 아닌 형태소 단위라는 점입니다.

영어는  good 하나로 표현되지만 한글은 좋아요, 좋네요, 좋습니다 등 다양하게 표현될 수 있기 때문에

‘좋아’, ‘좋네’, ‘좋습’의 각각의 키워드로 분류해야 모두 카운팅됩니다.


예를 들어 ‘좋’이라는 키워드로 카운팅하면 ‘좋지 않아요.’ 도 포함되어 버리기 때문에 분류가 불명확해질 수 있다는 점을 참고해주세요.


이제 키워드 추출을 했으면,  각각의 리뷰에 추출한 키워드가 포함되었는지를 계산하는 표를 만들어 줍니다.

예시로 몇가지 키워드만 나열해서 계산해보겠습니다.



1. 키워드 카운딩에 사용한 함수

=if (isnumber(search("맛있", 해당 리뷰)),1,0)

→ 만일 해당 리뷰에 “맛있”이라는 키워드가 있으면 1을 없으면 0을 표시해라.   




2. 긍정 키워드와 부정 키워드 개수의 각각의 합을 구할 때 사용한 함수

=sum(범위)

→범위의 합을 구해라.   




3. 리뷰를 판별할 때 사용한 함수

=if(긍정 키워드 값>부정 키워드 값,"긍정", if(긍정 키워드 값<부정 키워드 값,"부정",if(긍정 키워드 값=부정 키워드 값,"중립")))

→ 만일 긍정 키워드 값이 부정 키워드 값보다 크다면 “긍정” 작다면 “부정”, 같다면 “중립”을 표시해라.




물론 키워드의 개수만으로 리뷰 데이터를 판단하기에는 한계가 있습니다.

예를 들어 ‘음식는 맛있지만, 예전보다 배송이 느려져서 아쉽네요.’ 는

긍정 키워드가 1개, 부정 키워드가 2개 있지만 부정적인 리뷰라고 보기는 애매하다는 의견도 있을테니까요.

그래도 긍정적인 리뷰와 부정적인 리뷰의 대략적인 비율을 파악할 때는 도움이 됩니다.



또한 키워드를 통해 어떤 요소가 부정적으로 평가되고 긍정적으로 평가되고 있는지를 중점으로 본다면, 

유의미한 인사이트를 얻을 수 있습니다.   


1. 긍정적인 평가 내용: 음식 맛있다.

2. 부정적인 평가 내용: 배송 느리다.


리뷰의 각 평가 내용들이 모이면 결국 내 제품/서비스에 대한 소비자의 공통적인 의견이 될테니까요.

이를 통해 작게는 우리 제품/서비스에 대해 부정적으로 평가되는 부분을 알고, 개선할 수 있습니다.

소비자들이 어떤 부분을 긍정적으로 평가하는지 찾아  마케팅에 활용할 수도 있을거고요.

더 나아가서는 데이터 기반 브랜딩의 밑거름이 되어줍니다.


이렇게 개괄적인 키워드 분석 과정을 마친 후에는 추가적으로 더 분석할 부분이 없나 살펴봅니다.

비즈니스에 따라 정말 여러 가지가 있겠지만 예시로 F&B를 들어보았습니다.   


맛있다는 키워드를 가진 리뷰에서는 어떤 메뉴가 언급되는지?

특정 메뉴에서 언급되는 공통적인 내용이 있는지?


추가 분석은 비즈니스의 특성에 맞게 진행해주시면 됩니다.


이쯤에서 한 번 프로세스 정리를 해보겠습니다.



1. 한글 키워드 사이트로 리뷰 형태소 분석 : 어떤 키워드가 많이 나오는지?

2. 형태소 분석 결과로 카테고리 설계 : 키워드별로 카테고리 묶기

3. 리뷰에 포함된 긍정/부정 키워드 개수 세기 : 긍정/부정/중립 리뷰 개수는?

4. 키워드 평가를 통해 어떤 요소가 긍정/부정적으로 평가되고 있는지 파악

5. 비즈니스 특성에 맞춰 추가 분석 진행



저는 분석의 과정에서 성급한 일반화의 오류를 경계하려고 합니다.

일부의 데이터를 보고 전체의 속성을 단정지어 판단하지 않고

해당 데이터가 정말 유의미한 모수를 지니고 있는지를  판별하는게 중요한 것 같습니다.



3단계: 데이터 시각화

우리는 데이터를 통해 누군가를 설득하고, 자신의 의견을 전달합니다.

이 과정을 효과적으로 하기 위해 데이터를 시각화하는 작업이 필요합니다.


저는 PPT의 차트 기능을 자주 활용합니다.

기본 디자인에서 색과 형태를 조금씩 수정해서 깔끔하게 보일 수 있도록 합니다.

예시로 간단하게 제작해보았습니다.

리뷰 전체에서 특정 메뉴가 언급된 비율이 23%였고,

그 중에서도 ‘요거트’가 82번, ‘얼그레이’가 20번 언급되었다는 내용을 시각화한 장표입니다.


시각화의 핵심은 복잡한 데이터를 한 눈에 이해할 수 있게 만드는 것입니다.

분석한 데이터를 통해 얻은 인사이트를 이해하기 쉽게 시각화하고 풀어 설명하는 것이

리뷰 데이터 분석의 마지막 과정입니다.






코딩 없이 리뷰 데이터를 분석하는 과정, 어떠셨나요?

저는 이렇게 구글 스프레드 시트를 통해 리뷰 데이터를 분석했고, 이 경험으로 한층 더 성장할 수 있었습니다.


사실, 처음 시도할 때는 정말 많은 시간이 들었습니다.

웹 크롤링하는 법을 몰라 리뷰를 하나 하나 복붙하기도 했었고,

키워드 추출하는 법을 몰라 스프레드 시트 내 검색 기능을 사용해서 빈도수가 높은 키워드를 하나씩 찾기도 했었죠.

정말 많은 시행 착오 끝에 방법을 모색하면서 제 나름의 효율적인 프로세스를 정립할 수 있었습니다.


사실 이보다 더 좋은 방법은 얼마든지 있다고 생각합니다.

이 방법은 정답이 아니니 참고만 해주시고,

이보다 더 멋진 자신만의 방법을 만들어서 실무에 활용하시면 좋겠습니다!


제가 코딩을 몰라도 리뷰 분석이 가능한 툴을 찾아서 활용한 것처럼,

여러분도 막히면 먼저 삽질하고 고민한 사람들의 정보를 찾는 것부터 시작하면 좋을 것 같습니다.

코딩을 모르는데 리뷰 데이터를 분석해야하는 분들에게 많은 도움이 되기를 바라며 이만 글을 마치겠습니다.



*본 칼럼은 '청년마케터의 스터디 : 마케터의 마케팅, 그리고 글쓰기 모임' 활동으로 작성되었습니다.



브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari