아나콘다 프로그램에서 실행하기
Anaconda 프로그램이 설치되었다면, 한번 실행 해 보자. 그럼 아래와 같은 창이 나오고, 프로그램과 함께 설치된 다른 응용프로그램의 목록이 보인다.
여기서 Jupyter Notebook 프로그램의 [Launch] 버튼을 클릭하여 실행해준다. 또는 시작메뉴에 Anacodna3폴더에서 Jupyter Notebook을 직접 실행시켜도 된다. 직접 실행할 경우 아래와 같은 창이 나온다.
실행과 동시에 Web 페이지가 하나 열리면서 아래와 같은 화면이 보일 것이다. Jupyter Notebook 프로그램이 실행되는 창이 열린 것이다. 주의해야 할 점은 웹 페이지 내에서 Jupyter Notebook을 이용해 데이터 분석을 진행할 텐데, 이때, 뒤에 켜져 있는 Anaconda 또는 jupyter Notebook프로그램을 종료하면 안된다. 웹에서 보여지는 것은 사용자가 쉽게 분석을 하기 위한 창이며, 실제로 분석이 진행되며 컴퓨터와 상호작용하는 프로그램은 따로 돌아가고 있다.
이렇게 Open 된 창은 실제 사용자 컴퓨터의 폴더와 연동되어, 사용자 컴퓨터의 폴더 목록이 보인다. 여기서 Desktop이라는 폴더로 들어가보자. 들어가면 본인이 사용하고 있는 컴퓨터의 바탕화면에 있는 파일 및 폴더들이 Jupyter Notebook 프로그램에 나와 있는 것을 볼 수 있다. 앞으로 쉽고 편하게 작업하기 위해, 바탕화면에 폴더를 만들어 작업을 진행할 것이다.
먼저 아래와 같이 우측 상단에 [New] 버튼을 클릭해, [Folder] 버튼을 눌러보자.
그럼 그림과 같이 [Untitled Folder]가 새로 생성되어, 해당 폴더로 접근할 수 있다. 그리고 바탕화면에 확인해 보면 [Untitled Folder]가 새로 생성됨을 알 수 있다. 앞으로 이 공간에서 데이터를 옮겨서 분석을 진행할 것이다.
이번엔 다시 [New] 버튼을 클릭하여, [Python 3]버튼을 클릭해보자. 그럼 새로운 웹 브라우저 창이 아래와 같이 나올 것이다. 이 창이 우리가 Python 코드를 입력하여 데이터를 분석할 스크립트이다.
상단 Jupyter Notebook 아이콘 옆 Untitled을 클릭하면 해당 스크립트의 제목을 변경할 수 있다. 그리고 아래 초록색 창은 Python Code를 입력하는 공간이다. 이 공간은 Cell이라고 부른다. Cell에서는 여러 가지 기능을 사용할 수 있는데, Python 코드를 입력할 수 도 있고, 해당 스크립트의 설명과 같은 주석(Markdown)도 작성할 수 있다.
먼저 아래 Cell을 클릭하여, 100 + 200 이라는 값을 입력해 보자. 입력 후 프로그램을 실행하려면, 상단 메뉴에 [▶Run] 버튼을 클릭하여 실행한다. 단축키는 [Shift]키를 누른 상태에서 [Enter]키를 누르면 실행된다. 실행 되면 아래와 같은 결과가 Cell아래 새로 생성된다.
Out[1] 기호와 함께, 계산의 결과가 출력된다. 여기서 In-Out 옆 괄호의 [ ] 숫자는 코드의 실행 순서를 나타낸다. 위에는 첫 번째로 실행된 코드를 의미한다. 앞서 설명했듯이, Jupyter Notebook이라는 프로그램은 Python의 인터프리터 특징을 잘 반영하여 코드 전체를 컴파일 하지 않는다. 따라서 위와 같이 코딩의 결과를 코드 입력 창 아래 Output으로부터 바로 확인할 수 있다. 지금까지 입력한 코드를 저장하려면, 상단에 Save 버튼을 클릭하여 저장할 수 있다. 기본적으로 Jupyter Notebook Script는 자동저장 기능을 가지고 있다.
Jupyter Notebook Script는 Report 형태로 표현할 때, 굉장히 유용하게 사용할 수 있다. Code입력 창을 클릭하면, 창안에 글을 타이핑할 수 있는 상태가 된다. 이를 Edit Mode라고 부른다. 이 Mode에서는 Python 코드 및 주석을 작성할 수 있다. 주석은 코드의 설명이나 분석의 설명을 Python 문법과 상관없이 작성할 수 있다. 그리고 이 Edit Mode에서 [Esc]키를 클릭해 보자. 그럼 Cell의 초록색 테두리가 파란색으로 바뀌는 것을 볼 수 있다.
이를 Command Mode라고 부른다. Command Mode에서는 Cell에 관련한 명령어를 입력 할 수 있다. Cell을 새로 생성하거나, 삭제, 복사 등이 가능하고, 주석을 작성할 수 있는 Markdown Edit Mode로 변환이 가능하다. 이 Command Mode에서 키보드 [M] 키를 눌러보자. 그러면 In[ ] 이라는 기호가 사라지는데, 여기에 글을 입력하면 Python 문법에 영향을 받지 않는 주석을 작성할 수 있다.
여기에 Enter Key를 누르면 Edit Mode로 변환되며, 글을 타이핑 할 수 있는 상태가 된다.
만약 Command Edit Mode에서 다시 Code Edit Mode로 바꾸려면 키보드 [Y] 키를 누르면 된다. 아래는 Jupyter Notebook에서 사용하는 Cell에 관한 여러 단축키들을 확인 해 볼 수 있다. 단축키를 잘 활용하면 Script를 훨씬 강력하게 사용 할 수 있다.
이제 데이터 분석을 하기 위한 Python 프로그램 설치 및 셋팅이 완료되었다. 그럼 지금부터는 데이터 분석을 시작함에 있어서, 데이터의 타입 종류와 데이터 타입 별로 Python에서 어떻게 처리해야 하는지 알아보자.
Python 온라인 수업 : https://youtu.be/droeBUvvLCI
Python 기초 온라인 전체 재생 목록 : https://youtube.com/playlist?list=PLhdHuKlSngGxL_R2g8OYFtsUKs-mMhRBs