brunch

You can make anything
by writing

C.S.Lewis

by Moai Nov 28. 2020

연관검색어 데이터 시각화

파이썬 크롤링 후 데이터 시각화

포탈의 연관검색어는 사람들의 검색 행위를 디비에 저장한 뒤 포탈마다 고유의 알고리즘을 통해 연관된 키워드를 보여주는 기능이다. 데이터 트렌드 분석에 매우 중요하다.


연관검색어에 나온 키워드를 다시 검색하는 행위를 반복한다면 어떠한 결과가 나올지 궁금했다.

아래 그림은 냉동만두를 네이버에 검색한 뒤 시각화한 그림이다.



냉동만두를 검색하는 사람들은 깐풍만두, 탕수만두 소스, 비비고 만두를 추가적으로 검색할 확률이 높다고 예상할 수 있지 않을까?


프로그램 소스코드는 다음과 같다. 폰트파일은 나눔고딕체를 사용했다.

https://hangeul.naver.com/2017/nanum


그림으로 시각화해줄 때는 다음 그림을 사용했다.




구글, 네이버, 다음에 키워드를 검색한 뒤 연관검색어를 다시 검색해보는 프로그램을 구현해보자

재사용을 위해 모듈로 쪼개놓았다. 인자 값으로 포탈, 키워드 최대 검색 횟수를 입력받는다. 이후 검색 결과를 콘솔창에 출력한 뒤 워드클라우드 이미지 파일을 화면에 띄워준다. 소스코드는 다음과 같다.


https://gist.github.com/moaikim/2f09eb81aef433e9f46cea76cbe36a70


매거진의 이전글 Selenium 크롤링
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari