brunch

You can make anything
by writing

C.S.Lewis

by Raphael Lee Sep 23. 2016

통계 실습을 위한 환경 구축 - Part II

딸바보 잡부

분석이란 걸 위한 통계 완전 기초

Chapter 1. 통계 기본 함수

Chapter 2. 표준화/정규화

Chapter 3. 데이터 전처리 - Part II (part I 참조)

Break #1. 통계 실습을 위한 환경 구축 - Part I

Break #2. 통계 실습을 위한 환경 구축 - Part II

Chapter 4. 클러스터링, 장바구니

Chapter 5. 의사결정 나무 (Decision Tree), 회귀분석 (Regression), 신경망 분석 (Neural Network)

Chapter 6. 모형 평가, WoE


* 이전 글에서 환경을 구축했으니 이번엔 데이터를 가져와서 데이터베이스에 담아 놓겠습니다.

  이후 모형을 살펴볼 때 두고두고 꺼내 쓸 예정입니다.

* 대신증권 Cybos를 시작하여 Cybos plus 탭을 선택하여 로그인 합니다.

* Python 을 관리자 권한으로 실행하여야 합니다.

* 데이터 구축 순서는 다음과 같습니다

  1. 테이블 생성

  2. 종목 목록 입수

  3. 종목 데이터 입수 (1,100 영업일)


자, 그럼 이제 시작해 보겠습니다.


1. 테이블 생성

  - 테이블을 생성하기에 앞서 PostgreSQL을 설치하면서 함께 설치된 pgAdmin III 를 실행한 후,

   실습에 사용할 데이터베이스와 계정을 생성합니다.

그림과 같은 창이 실행됩니다.
설치할 때 기억해 놓은 postgres 계정의 비밀번호를 입력합니다.
Login Roles를 마우스 오른쪽 버튼으로 클릭한 후 New Login Role을 선택합니다.
그림과 같이 stats를 입력합니다.
그림과 같이 비밀번호를 stats로 입력한 후 OK 버튼을 클릭합니다.
Databases를 마우스 오른쪽 버튼으로 클릭한 후 New Database를 선택합니다.
Database 이름과 소유자를 stats로 입력한 후 OK를 클릭합니다.

  - 위의 과정을 마치고 나면 다음 코드를 실행합니다.

보시고 직접 타이핑 해보시기 바랍니다. ㅋ_____ㅋ


* 여기까지 하고나면 데이터를 입수해서 저장할 준비가 끝난겁니다.

 이제 데이터를 입수해서 저장하는 부분입니다.


2. 종목 목록 입수

  - KOSPI, KOSDAQ 전 종목을 입수해서 저장하도록 하겠습니다.

   프로그램을 실행할 당시의 종목수는 2,423개 입니다.

  - 종목코드를 조회하면 종목코드 앞에 'A'가 붙어서 조회됩니다.

   우리는 KOSPI에는 'P'를 KOSDAQ에는 'Q'를 붙여서 저장하도록 하겠습니다.

이 프로그램도 직접 타이핑 하시기 바랍니다. ㅎㅎㅎ


3. 종목 데이터 입수 (1,100 영업일)

  - 1,100 영업일이면 대략 4년 정도의 데이터로 샘플로 사용하기에 나름 충분하다 생각되어 이 기간으로 정했습니다. 더 필요하면 코드를 수정하여 더 추출해도 됩니다. 여기서는 삼성전자(005930)를 대상으로 추출하겠습니다.

대신증권 Cybos로부터 종목 시세를 얻어오는 부분입니다.
수집한 시세를 데이터베이스에 적재하는 부분입니다.




* 타이핑 하느라 깝깝하셨죠??? 위의 스크린샷으로 올려놓은 코드를 첨부합니다.


매거진의 이전글 통계 실습을 위한 환경 구축 - Part I
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari