연관검색어 데이터 시각화
파이썬 크롤링 후 데이터 시각화
포탈의 연관검색어는 사람들의 검색 행위를 디비에 저장한 뒤 포탈마다 고유의 알고리즘을 통해 연관된 키워드를 보여주는 기능이다. 데이터 트렌드 분석에 매우 중요하다.
연관검색어에 나온 키워드를 다시 검색하는 행위를 반복한다면 어떠한 결과가 나올지 궁금했다.
아래 그림은 냉동만두를 네이버에 검색한 뒤 시각화한 그림이다.
냉동만두를 검색하는 사람들은 깐풍만두, 탕수만두 소스, 비비고 만두를 추가적으로 검색할 확률이 높다고 예상할 수 있지 않을까?
프로그램 소스코드는 다음과 같다. 폰트파일은 나눔고딕체를 사용했다.
그림으로 시각화해줄 때는 다음 그림을 사용했다.
구글, 네이버, 다음에 키워드를 검색한 뒤 연관검색어를 다시 검색해보는 프로그램을 구현해보자
재사용을 위해 모듈로 쪼개놓았다. 인자 값으로 포탈, 키워드 최대 검색 횟수를 입력받는다. 이후 검색 결과를 콘솔창에 출력한 뒤 워드클라우드 이미지 파일을 화면에 띄워준다. 소스코드는 다음과 같다.