최근 모든 프로그래밍 및 라이브러리, 프레임워크에는 공식 홈페이지 및 공식 문서들이 있습니다.
이 공식문서를 읽어가면서 개발 공부를 하는 것이 가장 좋지요...
그러나, 영어로 되어 있기도 하고, 해당 예제도 다소 부족하고, 설명도 다소 부족하고 그렇습니다.
그래서, 같이 조금씩 매일 읽어가는 시도를 해볼까 합니다.
첫 시리즈로 데이터 분석시 많이 사용하는 Pandas로 시작해보려합니다.
2022년 10월 10일 현재 최신 버전인 1.5.0 버전으로 시작하려합니다.
https://pandas.pydata.org/docs/user_guide/index.html 로
이동하면 아래와 같은 메뉴들이 나옵니다. 그 중에서 "User Guide"부터 시작하려 합니다.
The User Guide covers all of pandas by topic area. Each of the subsections introduces a topic (such as “working with missing data”), and discusses how pandas approaches the problem, with many examples throughout.
이 User Guide는 주제별로 판다스의 모든 부분들 다룹니다. 아래에 보이는 목록들이 "working with missing data (결측 데이터 다루기)"와 같은 주제들입니다. 판다스로 주제에서 다루는 문제들을 어떻게 해결하는지 많은 사례들로 설명합니다.
Users brand-new to pandas should start with 10 minutes to pandas.
판다스가 처음인 분들은 10 minutes to pandas (10분만에 해보는 판다스)부터 시작하면 됩니다.
For a high level summary of the pandas fundamentals, see Intro to data structures and Essential basic functionality.
판다스 기초에 대한 간단하게 정리하기 위해서는 Intro to data structures (데이터 구조 소개)와 Essential basic functionality (필수 기본 기능)을 참조합니다.
Further information on any specific method can be obtained in the API reference.
특정 메서드에 대한 더 자세한 정보는 API reference에서 참조할 수 있습니다.
In these guides you will see input code inside code blocks such as:
이 가이드에서는 다음과 같은 코드 블록에 입력할 소스코드를 제공합니다:
import pandas as pd pd.DataFrame({'A': [1, 2, 3]})
또는
In [1]: import pandas as pd In [2]: pd.DataFrame({'A': [1, 2, 3]})
Out[2]: A 0 1 1 2 2 3
The first block is a standard python input, while in the second the In [1]: indicates the input is inside a notebook. In Jupyter Notebooks the last line is printed and plots are shown inline.
첫번째 블록은 표준 파이썬 입력입니다. 두번째 블록에서 In [1]:는 주피터 노트북에서 입력을 의미합니다. 주피터 노트북에서 셀 안의 마지막 행이 출력이 되고 그래프 (plot)은 주피터 노트북에 출력됩니다.
예를 들어:
In [3]: a = 1 In
[4]: a Out
[4]: 1
는
a = 1 print(a)
와 같습니다.
오늘 여기까기 하겠습니다.