딸바보 잡부
Chapter 3. 데이터 전처리 - Part II (part I 참조)
Break #1. 통계 실습을 위한 환경 구축 - Part I
Chapter 4. 클러스터링, 장바구니
Chapter 5. 의사결정 나무 (Decision Tree), 회귀분석 (Regression), 신경망 분석 (Neural Network)
Chapter 6. 모형 평가, WoE
* 이전 글에서 환경을 구축했으니 이번엔 데이터를 가져와서 데이터베이스에 담아 놓겠습니다.
이후 모형을 살펴볼 때 두고두고 꺼내 쓸 예정입니다.
* 대신증권 Cybos를 시작하여 Cybos plus 탭을 선택하여 로그인 합니다.
* Python 을 관리자 권한으로 실행하여야 합니다.
* 데이터 구축 순서는 다음과 같습니다
1. 테이블 생성
2. 종목 목록 입수
3. 종목 데이터 입수 (1,100 영업일)
자, 그럼 이제 시작해 보겠습니다.
- 테이블을 생성하기에 앞서 PostgreSQL을 설치하면서 함께 설치된 pgAdmin III 를 실행한 후,
실습에 사용할 데이터베이스와 계정을 생성합니다.
- 위의 과정을 마치고 나면 다음 코드를 실행합니다.
* 여기까지 하고나면 데이터를 입수해서 저장할 준비가 끝난겁니다.
이제 데이터를 입수해서 저장하는 부분입니다.
- KOSPI, KOSDAQ 전 종목을 입수해서 저장하도록 하겠습니다.
프로그램을 실행할 당시의 종목수는 2,423개 입니다.
- 종목코드를 조회하면 종목코드 앞에 'A'가 붙어서 조회됩니다.
우리는 KOSPI에는 'P'를 KOSDAQ에는 'Q'를 붙여서 저장하도록 하겠습니다.
- 1,100 영업일이면 대략 4년 정도의 데이터로 샘플로 사용하기에 나름 충분하다 생각되어 이 기간으로 정했습니다. 더 필요하면 코드를 수정하여 더 추출해도 됩니다. 여기서는 삼성전자(005930)를 대상으로 추출하겠습니다.
* 타이핑 하느라 깝깝하셨죠??? 위의 스크린샷으로 올려놓은 코드를 첨부합니다.