brunch

You can make anything
by writing

C.S.Lewis

by 구재홍 Oct 02. 2023

KBL 농구 경기 데이터 자동 추출

해당 글은 2021년 4월 14일에 개인 블로그에 미리 작성된 바 있습니다.


때는 2020년, 스포츠 토토를 하기 위해 팀마다의 농구 데이터가 필요했다.

회사의 주식을 투자할 때에도 재무제표를 보듯이 농구팀의 스탯이 경기 결과에 영향을 줄 것이라고 생각해서, 프로농구의 데이터를 모두 추출하고 싶었다.


KBL의 10년치 경기 데이터를 손으로 직접 긁어오는 것은 불가능에 가까우므로...

이것 또한, 파이썬의 셀레니움(Selenium)을 활용해서 자동으로 추출할 수 있을 거라 생각했다.


프로 농구 경기의 기록들을 자동으로 추출하는 내 계획은 다음과 같았다.


1. KBL에 접속해 내가 필요한 데이터가 어디 있는지 확인한다.

KBL 페이지에 있는 경기 기록들

2. 각 데이터의 주소 규칙을 발견하고 해당 데이터를 추출하는 파이썬 함수를 만든다.

(크롬에서 개발자모드를 사용하면 그림처럼 각 데이터의 주소를 알 수 있다)

각 데이터에는 주소가 존재한다. 개발자 모드로 해당 위치를 알 수 있다.

3. 위 행동을 10년치 경기에 반영하여 반복한다.

https://youtu.be/eGhY3z6u7JA

자동으로 추출하는 모습

4. 추출한 데이터를 엑셀로 출력한다.

추출한 엑셀 파일

결론

1. 농구 토토를 하고 싶은데, 주식처럼 팀마다의 기록을 근거로 투자해보고 싶었음.

2. 프로농구 팀의 모든 경기 기록을 추출해야 함

3. 파이썬 셀레니움(Selenium)으로 10년치 경기 데이터 자동으로 추출함

4. 편하게 가공하기 위해 엑셀로 관리함 :)


관련 코드나 자세한 내용은 다음 책에서 확인하실 수 있어요.

https://www.yes24.com/Product/Goods/111379316

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari