파이썬으로 데이터 분석하기
앞서 파이썬이 왜 데이터 분석에 많이 사용되는 지 이유를 정리해 보았다. 파이썬은 프로그래밍 언어 가운데 배우기 쉽고 데이터 분석과 머신러닝 관련해 다양한 라이브러리를 지원하는 것이 최대 장점인 것 같았다.
우선 파이썬 기초 문법 가운데 가장 간단하면서도 아마도 가장 많이 사용되는 print 함수에 대해 배워보자. 지난 번 읽어본 아래 코드를 기억하는가? 아래 코드 블록을 실행하면 어떤 결과가 화면에 나올까?
처음 스팸개수가 0개이고 이를 출력하라고 했으므로 0이 화면에 출력될 것이다. 다음 스팸개수가 4개가 늘어나고 만약 스팸개수가 0보다 크다면 But I don't want ANY spam!이라는 메세지를 출력하라고 했으므로 화면에 두 번째로 이 메세지가 출력될 것이다.
이처럼 print() 함수는 () 안에 오는 문자열이나 수, 변수 혹은 조건문이나 반복문에서 실행 결과를 화면에 출력하는 역할을 한다. print 함수를 파이썬의 도움말 함수 help()에 넣어보면 다음과 같은 설명이 나온다.
내용을 살펴보면 print() 함수는 기본적으로 () 안의 값을 화면에 출력해 주는 파이썬의 내장함수로 한가지 혹은 여러 가지 값들을 출력할 수 있다. 여러가지 값을 출력하고 싶다면 값들 사이에 콤마(,)를 사용해야 하고 기본적으로 값과 값 사이는 한 칸 띄어쓰기(sep=' ')가 적용되어 출력된다.
값들 사이의 띄어쓰기를 다르게 하고 싶다면 print() 함수의 매개변수 가운데 sep의 기본값을 바꾸면 된다. sep은 seperation을 의미하는 단어로 값들 사이에 콤마(,)를 넣어 출력하고 싶다면 sep의 값을 sep=', '으로 바꾸면 된다.
파이썬은 문자열을 따옴표 혹은 쌍따옴표로 묶어 나타내는데 문자열 안의 띄어쓰기(space) 역시 하나의 문자로 인식한다. sep = ‘And’와 sep = ‘띄어쓰기+And+띄어쓰기'로 설정했을 때 결과가 달라지는 것을 볼 수 있다.
마지막으로 앞으로 파이썬으로 코딩을 하면서 많이 만나게 될 에러 유형들을 살펴보자. 어떤 내용의 에러인지 확인한다면 좀 더 수정하기 수월할 것이다. 에러 내용을 복사해 구글에서 검색해 봐도 좋다. 몇 가지 주요 에러를 소개하면 다음과 같다.
Syntax Error(구문상 오류) - 파이썬의 문법에 맞지 않는 에러
Semantic Error(의미상 오류) - 에러가 뜨진 않지만 원래 쓰고자 하는 의도와 다르게 만들어진 에러
Name Error(이름 오류) - 변수로 사용했지만 변수로 정의된 적이 없는 경우
* 참고자료
캐글 강의 https://www.kaggle.com/learn/overview
점프투파이썬 https://wikidocs.net/book/1
파이썬 초보 학습자를 위한 4시간에 배우는 파이썬 기초문법
https://joshua-mobile-choi-1756.trinket.io/python-3-4#/tasks/task-1-print-statement
How to think like a computer scientist : Learning with Python 3