메뉴
brunch
매거진
프로그래밍
연관검색어 데이터 시각화
파이썬 크롤링 후 데이터 시각화
by
Moai
Nov 28. 2020
포탈의 연관검색어는 사람들의 검색 행위를 디비에 저장한 뒤 포탈마다 고유의 알고리즘을 통해 연관된 키워드를 보여주는 기능이다. 데이터 트렌드 분석에 매우 중요하다.
연관검색어에 나온 키워드를 다시 검색하는 행위를 반복한다면 어떠한 결과가 나올지 궁금했다.
아래 그림은 냉동만두를 네이버에 검색한 뒤 시각화한 그림이다.
냉동만두를 검색하는 사람들은 깐풍만두, 탕수만두 소스, 비비고 만두를 추가적으로 검색할 확률이 높다고 예상할 수 있지 않을까?
프로그램 소스코드는 다음과 같다. 폰트파일은 나눔고딕체를 사용했다.
https://hangeul.naver.com/2017/nanum
[네이버 한글한글 아름답게 : 나눔글꼴]
한글의 아름다움, 나눔글꼴로 나눕니다.
https://hangeul.naver.com/2017/nanum
그림으로 시각화해줄 때는 다음 그림을 사용했다.
구글, 네이버, 다음에 키워드를 검색한 뒤 연관검색어를 다시 검색해보는 프로그램을 구현해보자
재사용을 위해 모듈로 쪼개놓았다. 인자 값으로 포탈, 키워드 최대 검색 횟수를 입력받는다. 이후 검색 결과를 콘솔창에 출력한 뒤 워드클라우드 이미지 파일을 화면에 띄워준다. 소스코드는 다음과 같다.
https://gist.github.com/moaikim/2f09eb81aef433e9f46cea76cbe36a70
keyword
크롤링
키워드
시각화
6
댓글
1
댓글
1
댓글 더보기
브런치에 로그인하고 댓글을 입력해보세요!
Moai
직업
개발자
개발자, 분석가
구독자
37
구독
매거진의 이전글
Selenium 크롤링
Pandas 코로나 확진자 통계
매거진의 다음글