해당 글은 2021년 4월 14일에 개인 블로그에 미리 작성된 바 있습니다.
때는 2020년, 스포츠 토토를 하기 위해 팀마다의 농구 데이터가 필요했다.
회사의 주식을 투자할 때에도 재무제표를 보듯이 농구팀의 스탯이 경기 결과에 영향을 줄 것이라고 생각해서, 프로농구의 데이터를 모두 추출하고 싶었다.
KBL의 10년치 경기 데이터를 손으로 직접 긁어오는 것은 불가능에 가까우므로...
이것 또한, 파이썬의 셀레니움(Selenium)을 활용해서 자동으로 추출할 수 있을 거라 생각했다.
프로 농구 경기의 기록들을 자동으로 추출하는 내 계획은 다음과 같았다.
1. KBL에 접속해 내가 필요한 데이터가 어디 있는지 확인한다.
2. 각 데이터의 주소 규칙을 발견하고 해당 데이터를 추출하는 파이썬 함수를 만든다.
(크롬에서 개발자모드를 사용하면 그림처럼 각 데이터의 주소를 알 수 있다)
3. 위 행동을 10년치 경기에 반영하여 반복한다.
4. 추출한 데이터를 엑셀로 출력한다.
결론
1. 농구 토토를 하고 싶은데, 주식처럼 팀마다의 기록을 근거로 투자해보고 싶었음.
2. 프로농구 팀의 모든 경기 기록을 추출해야 함
3. 파이썬 셀레니움(Selenium)으로 10년치 경기 데이터 자동으로 추출함
4. 편하게 가공하기 위해 엑셀로 관리함 :)
관련 코드나 자세한 내용은 다음 책에서 확인하실 수 있어요.