brunch

You can make anything
by writing

C.S.Lewis

by 글쓰는 직딩 Dec 10. 2022

[패스트캠퍼스] 데이터분석 강의 - 새벽공부 일기 #2

2주차 - 머신 러닝 개념 + 파이썬 프로그래밍 이론 및 실습

머신 러닝의 기본 개념 익히기


국비지원교육, 데이터분석 강의의 수업을 따라가다보니 어느덧 2주차에 돌입했다. 

2주차 초반까지는 이론 설명이기 때문에 듣고 필기하고 복습하는 정도로 아직은 수업 페이스를 쫓아갈 수 있었다. 2주차 초반 이론 수업은 머신러닝의 개념을 익히는 것으로 시작됐다. 


출처 : Google Cloud Platform (https://cloud.google.com/ai-platform/docs/ml-solutions-overview)


출처 : https://wikidocs.net/31947

어렴풋이 들어만 봤던 빅데이터나 머신러닝 같은 개념들을 명확하게 정리해주는 점이 좋았다. 나 같은 비전공자에게는 여전히 어려운 개념이기는 했지만, 그래도 핵심적인 개념을 정리해주고 또 자세히 설명되어 있는 외부 자료들을 소개해줘서 복습하면서 읽어보는 것들이 개념 정립에 많은 도움이 됐다. 

머신러닝 프로젝트는 크게 보면 아래 5가지 순서를 따라 진행된다. 


데이터 분석 문제 정의

데이터 수집 및 정제

탐색적 데이터 분석

피처 엔지니어링

예측 모델 개발 및 평가


이 중에서도 수업에게 가장 중요성을 강조한 부분은 첫 단계인 문제를 정의하는 단계였다. 아무리 좋은 모델링이나 분석 기법이 있더라도 문제 정의가 잘못되면 의도하지 않은 결과, 전혀 다른 결과가 나올 수 있기 때문이다. 



본격적인 파이썬 프로그래밍 시작


2주차 후반부에는 드디어 파이썬 프로그래밍의 이론과 실습에 돌입했다. 나같은 문외한을 위해 '프로그래밍이란 무엇인가' 라는 아주 기초적인 이론부터 시작해서 파이썬에 대한 소개까지 이어진 후 본격적인 프로그래밍 실습이 시작됐다. 


파이썬 공식 홈페이지 (https://www.python.org/)

2주차 파이썬 프로그래밍은 가장 기본적인 데이터 타입에 대한 실습부터 시작됐다. 데이터 타입이란 사용자가 데이터의 사용의도를 정의한 것이다. 프로그램마다 조금씩 다르고 또 파이썬에도 다양한 종류의 데이터 타입이 있지만 수업에서는 주로 아래의 데이터 타입을 다루었다. 


int(정수)

float(실수)

str(문자열)

list(자유롭게 변경이 가능한 데이터들의 묶음)

tuple(생성 후 변경이 불가능한 데이터들의 묶음)

set(집합)

dict(key-value store 방식을 가지고 자료를 저장하는 구조)


본격적인 프로그램 실습에 들어가면서 슬슬 한 번에 이해되지 않는 부분들이 생기기 시작했다. 그래도 어렵지 않게 설명해주셔서 복습하고 직접 코드를 짜보면 쉽게 이해할 수 있었다. 3주차부터 본격적인 파이썬 프로그래밍이 시작될텐데 수업을 따라갈 수 있을까 조금은 걱정되지만 그 만큼 기대도 크다. 


#패스트캠퍼스 #내일배움카드취업 #국비지원교육 #K디지털기초역량훈련  #빅데이터분석첫걸음시작하기 #데이터분석강의 #새벽공부 #공부일기 #자기개발

매거진의 이전글 [패스트캠퍼스] 데이터분석 강의 - 새벽공부 일기 #1
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari