brunch

[독서노트] 엑셀 대신 파이썬으로 업무 자동화 하기

2022년 05월 02일 발행. 5월 3-4주 독서 후 발행

서평

파이썬이란 언어를 처음 접한 건 2012년이었고, 이과생 바이오 전공자인 내가 프로그래밍을 할 수 있을까? 막연함으로 시작했었다. 당시에 바이오 분야에 Bioinformatics라는 융합 학문이 인기를 끌 시즌이었고, 많은 대학 학과에 해당 과목이 생겨나기 시작했다.


이때 파이썬을 익히고 유전체 데이터를 분석해보기도 하고, R도 배워가며 여러 가지 업무를 하다 보면서 개발자가 아닌 분석가로서 나에게 이 두 개의 프로그램과 제일의 경쟁자는 엑셀이었다. 엑셀의 수많은 함수와 데이터 분석 기능, 그래프 생성 기능 등을 구현하려면 결국 엑셀로 돌아와야 한다. 그리고 raw 데이터가 csv 포맷으로 나오니 이 데이터를 읽어 들이고 작업을 진행한 후 결과 다시 csv로 저장을 한 후 엑셀에서 다시 시각화 작업을 했으니 말이다.


비단 유전체 데이터를 분석할 때만 그런 것이 아니라 업무에서 하는 모든 정리, 보고, 시각화는 엑셀이 도맡아 한다. 좀 더 공유가 쉬운 구글 시트가 그 역할을 대신 하기도 하지만 말이다. 엑셀을 사용하면서 한 가지 아쉬운 점은 "자동화"이다. 비록 한번 만든 복잡한 함수 식을 이용해서 처리하기는 좋지만, 무언가 반복해서 해야 할 때는 일일이 내가 해야 한다. 오늘 소개할 이 책은 엑셀을 다루면서 봉착했던 자동화의 문제를 해결할 수 있는 기초가 되는 책이다.


비록 내가 만났던 문제에 대한 구체적인 해결책은 없지만 그 기본이 되어주니 활용이 가능하다. 다만 아쉬운 점이라면 파이썬 라이브러리를 이용하여 소개해주는 일반 파이썬 분석과 별반 다름이 없다는 것과 자동화 예제를 많이 다루지 않은 것~~


엑셀을 많이 사용해본 사람이라면, 고민했을 법한 문제들을 잘 다루지 않고 파이썬과 판다스를 주로 다룬 것이 아쉽다.



KakaoTalk_20220527_084337237.jpg


목차 및 요약

PART 01 파이썬 기초

PART 02 파이썬으로 엑셀하기

PART 03 파이썬으로 업무 자동화하기

CHAPTER 07 문서 업무 자동화

7.1 엑셀 업무 자동화

___openpyxl 개요

___엑셀 파일과 시트 다루기

___셀 내용 다루기

___셀 서식 다루기

[실습] 유통매장의 고객만족도 분석하기

[실습] 여러 개의 엑셀 파일을 하나로 합치기

7.2 파워포인트 업무 자동화

___python-pptx 개요

___파워포인트 파일 다루기

[실습] 행사 참가자 명찰 제작하기


엑셀을 사용하는 사람에게 제일 필요한 챕터는 이 부분이라고 생각한다. 자동화는 뒷부분에 다시 나온다.

KakaoTalk_20220527_084337237_01.jpg
KakaoTalk_20220527_084337237_02.jpg


파이썬을 많이 사용한 사람이라면 엑셀 파일을 다루는 것은 가장 기본이라, 제공 패키지를 활용하는 방법을 소개해주고 있다.

KakaoTalk_20220527_084337237_03.jpg
KakaoTalk_20220527_084337237_04.jpg


마음에 드는 부분이 바로 이런 형태의 정리이다. 엑셀에서 사용하는 함수와 파이썬에서 사용하는 코딩을 비교해가면서 정리해준다.

KakaoTalk_20220527_084337237_05.jpg


문자 추출은 파이썬이 워낙 월등하지만, 엑셀에서도 일정한 규칙이 있으면 컬럼을 구분할 수 있고, 추출할 수 있으니 이 부분의 비교는 재밌는 부분이다.

KakaoTalk_20220527_084337237_06.jpg


이 부분은 시각화를 위해 pandas, matplotlib 라이브러리를 이용하는 방법이다. 데이터 시각화는 파이썬보다 R을 먼저 사용했었기에 개인적으로 R이 편리하고, 시각화 결과도 예쁘게 나오지만 파이썬도 라이브러리를 대폭 강화하여 분석뿐 아니라 시각화도 멋지게 해낼 수 있다.

KakaoTalk_20220527_084337237_07.jpg


각 그래프를 그리는 방법과 코드 예제를 설명해준다.

KakaoTalk_20220527_084337237_08.jpg


엑셀의 모든 함수/그래프는 파이썬으로 다 할 수 있다.

KakaoTalk_20220527_084337237_09.jpg


가장 관심이 있었고 엑셀을 하면서 가장 필요했던 부분인 자동화 부분이다. 자세히 살펴보았지만 비즈니스 적인 부분에서 활용이 가능한 부분이라 고객 서비스/경영지원 등에서 활용하기 좋은 부분이다.

KakaoTalk_20220527_084337237_10.jpg


이 부분의 코드는 활용성이 크다.

KakaoTalk_20220527_084337237_11.jpg


좀 생소했던 분야~~ 파워포인트를 자동화 가능하다니~~

하지만 파워포인트의 목적은 시각화인데, 단순 데이터 처리만 가능한 부분이라 아쉬운 부분이 있다.

KakaoTalk_20220527_084337237_12.jpg


월별? 분기별? 데이터를 정리하고 청구서 발행을 하는 자동화 부분이다. 음.. 나는 이런 자동화가 필요한 게 아닌데.. 하지만 그럼에도 본 소스코드를 잘 활용하면 충분히 다른 프로젝트에 활용이 가능한 부분도 있다.

KakaoTalk_20220527_084337237_14.jpg
KakaoTalk_20220527_084337237_15.jpg
KakaoTalk_20220527_084337237_16.jpg
KakaoTalk_20220527_084337237_17.jpg


모든 파이썬 책들이 그렇듯 예제 코드가 잘 수록되어 있으니 충분히 다양하게 활용될 수 있다.



"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

keyword
매거진의 이전글[독서노트] 이토록 쓸모 있는 불안