Claude Code로
로또 당첨 데이터 CSV 파일이 하나 있었다. 1회부터 879회까지, 2002년 12월부터 2019년 10월까지의 전체 기록. 회차, 추첨일, 1등 당첨자 수, 번호 1~6, 보너스 번호까지 20개 컬럼, 879행.
Claude Code에 파일을 던지고 "EDA 해줘"라고 말했다. 5분 후, 8개의 차트와 통계 검정 결과가 포함된 완전한 분석 리포트가 나왔다.
카이제곱 검정 결과, p값 = 0.898. 1번부터 45번까지 어떤 번호가 특별히 더 많이 나오거나 적게 나오지 않는다. 기대값 117.2회 근처에 모든 번호가 고르게 분포한다.
9번(90회), 22번(97회), 23번(101회)이 약간 적게 나왔고, 34번(139회)이 가장 많이 나왔지만, 통계적으로 유의미한 편차는 아니다.
시사점: "잘 나오는 번호"라는 건 착각이다.
879회 표본에서도 균등분포가 깨지지 않는다.
6개 번호의 합계는 정규분포에 가깝다 (정규성 검정 p=0.1045). 평균 138.1, 중앙값 138.0.
합계 100~180 구간이 전체의 79.6%를 차지한다.
Q-Q Plot에서도 이론적 정규분포와 거의 완벽하게 일치한다.
1~45에서 6개를 뽑으면 중심극한정리에 의해 합계는 자연스럽게 정규분포를 따른다. 그런데 많은 사람들이 합계 200 이상이나 80 이하의 "극단적" 조합을 고른다.
시사점: 당첨 확률은 같지만, 1등 당첨금을 나눠야 하는 사람 수를 줄이려면 100~180 구간의 조합이 유리할 수 있다.
- 연속번호가 아예 없는 회차: 48.4%
- 2개 연속이 포함된 회차: 46.1%
- 3개 연속: 5.0%
- 4개 연속: 0.6%
거의 절반의 회차에서 2개 연속번호가 등장한다. 번호 사이의 평균 간격은 6.6이며, 간격 분포는 지수분포에 가깝다.
시사점: 연속번호를 "절대 안 넣는다"는 전략은 오히려 48%의 패턴만 커버하는 셈이다.
가장 많이 함께 등장한 번호 쌍은 33-40 (26회). 뒤를 잇는 건 11-21, 12-24, 31-34 (각 24회).
하지만 이것도 균등분포에서 기대할 수 있는 범위다. 45개 번호에서 2개를 뽑는 조합은 990가지. 879회 × 15쌍 = 13,185개의 쌍 데이터에서 기대 빈도는 약 13.3회. 26회는 눈에 띄지만, 통계적 이상치라 부르기엔 부족하다.
시사점: "궁합 좋은 번호"도 우연의 산물이다.
전체적으로 홀수 51.2%, 짝수 48.8%. 45개 번호 중 홀수가 23개, 짝수가 22개이므로 이론적으로도 홀수가 살짝 많이 나오는 게 자연스럽다. 유의미한 편향 없음.
로또는 진짜 랜덤이다. 과거 패턴은 미래를 예측하지 못한다.
카이제곱 검정, 정규성 검정, 연속번호 분석, 동시출현 분석 — 어느 각도에서 봐도 "특별한 패턴"은 없다. 로또 번호 추천 앱이나 유료 예측 서비스가 파는 건, 본질적으로 랜덤에서 패턴을 억지로 뽑아낸 것이다.
이 프로젝트의 진짜 가치는 분석 결과가 아니라 분석에 걸린 시간에 있다.
CSV 파일 하나를 넣고, Claude Code가 pandas로 데이터를 읽고, matplotlib으로 8개 차트를 그리고, 카이제곱 검정과 정규성 검정을 수행하는 데 걸린 시간. 5분.
과거에 같은 작업을 했다면? Jupyter Notebook 열고(보통은 여기서 다 포기한다), 라이브러리 임포트하고, 데이터 클리닝하고, 차트 하나하나 세팅하고... 반나절은 잡아야 했다.
예전에는 통계 분석을 하려면 R이나 Python을 배워야 했고, 시각화를 하려면 matplotlib의 까다로운 문법과 싸워야 했다. 지금은 CSV 파일 하나와 한 줄의 명령이면 된다.
이런 도구가 있는 시대에 정말 중요한 건 코딩 실력이 아니라 "무엇을 물어볼 것인가"다. 어떤 데이터에 어떤 질문을 던질지 아는 것. 그 답이 의미하는 바를 해석할 수 있는 것. 도메인 지식과 호기심이 코드보다 중요한 시대가 온 것이다.
*이 글의 모든 분석과 차트는 Claude Code를 통해 생성되었습니다.*
*로또는 순수한 확률 게임입니다. 과거 데이터 분석은 미래 당첨을 예측할 수 없습니다.*
*이번 분석이 알려준 번호가 궁금하신 분들께는 살짝 귀뜸해 드릴께요.-그림 중 하나에 숨어있어요*