라이브러리(Library)라는 친구들
파이썬은 혼자가 아니다 – 라이브러리라는 친구들
처음 파이썬을 배울 때는
프린트 문을 찍고, 변수를 만들고, 반복문을 돌리는 것만으로도 재미있다.
하지만 금방 한계에 부딪힌다.
“여기서 이제 뭘 하지?”
그때 등장하는 게 바로 라이브러리다.
파이썬을 파이썬답게 만들어주는 핵심 요소.
라이브러리는 일종의 기능 모음집이다.
우리가 자주 쓰는 기능들을
이미 잘 정리해둔 파일 패키지라고 생각하면 된다.
엑셀에서 함수가 모여있는 것처럼,
파이썬에서도 분석, 수학, 시각화, 웹 크롤링 등
수많은 작업에 특화된 ‘도구 상자’가 있다.
pandas, numpy, matplotlib…
예를 들어 pandas 는 데이터를 표처럼 다루게 해준다.
엑셀의 시트처럼 행과 열로 구성된 데이터를 불러오고,
필터링하고, 정렬하고, 그룹화할 수 있다.
numpy는 숫자 계산을 고속으로 처리하는 라이브러리다.
벡터, 행렬 연산처럼 복잡한 수치 작업에 강하다.
matplotlib는 시각화를 담당한다.
선 그래프, 막대 그래프, 산점도까지
우리가 눈으로 결과를 확인할 수 있도록 도와준다.
이 모든 것들이 기본 파이썬 안에는 없다.
우리는 이 라이브러리들을 불러와(import) 써야 한다.
이 도구들을 불러오는 순간,
파이썬은 갑자기 ‘전문가 도구’로 변신한다.
파이썬은 프레임이고, 라이브러리는 콘텐츠다
라이브러리가 없으면 파이썬은 빈 종이나 다름없다.
하지만 라이브러리가 있으면
그 종이는 엑셀도 되고, 그림판도 되고, 계산기도 된다.
라이브러리란, 결국
“누군가 이미 만들어둔 코드의 집합”이다.
우리는 그 코드를 직접 짤 필요 없이
필요한 기능만 호출해서 쓰면 된다.
GPT와 함께 쓰면 더 강력하다
“pandas로 이 데이터를 정리해줘”라고 요청하면
GPT가 바로 필요한 코드와 설명을 제공한다.
이게 가능한 이유도
파이썬이 라이브러리를 중심으로 구성돼 있기 때문이다.
GPT는 수많은 라이브러리 문서를 학습해두었기 때문에
우리가 묻는 대부분의 분석 요청에
적절한 라이브러리를 골라 제시해준다.
처음부터 모든 라이브러리를 알 필요는 없다
중요한 건,
‘지금 내가 하려는 분석에 어떤 도구가 필요한가’를 판단하는 힘이다.
그리고 그 판단은 이런 질문으로부터 시작된다.
“내가 직접 분석하고 싶은 데이터는 어떤 구조인가?”
“이걸 눈으로 확인하려면 어떤 그래프가 필요할까?”
“반복해서 해야 하는 일이 있다면 자동화할 수 있을까?”
이 질문에 대한 답을 찾을 때,
GPT는 아주 똑똑한 가이드가 되어준다.
그리고 그 안에는 언제나
적절한 라이브러리가 함께 따라온다.
라이브러리를 안다는 건, 결국 ‘도움받는 법’을 아는 것이다
분석은 혼자 하는 일이 아니다.
파이썬도 마찬가지다. 누가 이미 만들어둔 걸 내 문제 해결에 쓰는 것.
그게 라이브러리다.
이 글은 책 『챗GPT로 데이터 분석 가로채기』(박경하 저)를 바탕으로 작성되었습니다.
� 책 자세히 보기: https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=345939564&start=slayer