5. 데잇걸즈2기 수업은 이렇게

데잇걸즈2기가 준비하고 있는 수업은 이렇습니다.

데잇걸즈2기를 준비하고 있습니다.


데잇걸즈는 과학기술정보통신부와 한국정보화진흥원이 주관하는 빅데이터 분석 교육 프로그램의 브랜드입니다. 데이터 교육을 통해 IT분야에서 경쟁력있는 여성을 양성하기 위한 취지로 시작된 프로그램입니다. 데잇걸즈 2기는 '여성', '데이터', '성장' 을 주 컨셉으로 준비하고 있습니다.


데잇걸즈 수업은 이렇게 진행하고자 해요


우리가 배울 내용


데잇걸즈2기 수업에서는 아래와 같은 내용을 기반으로 수업을 진행하고, 프로젝트를 운영할 계획이에요.


1. 데이터 분석을 위한 기초 통계

-백터, 행렬

-기초통계개념 : 모집단/표본, 기술통계, 추론통계

-확률과 통계 : 확률이론, 확률분포

-추정 및 검정 : 통계학에서의 추론 및 추정, 가설, 검정/통계량

-교차분석, 상관분석, 회귀분석


2. 프로그래밍 기초

-컴퓨터 프로그래밍 기초

-데이터 포맷 이해

-Git&GitHub

-Google BigQuery를 이용한 SQL 입문

-Google Analytics와 데이터 분석 연계


3. 파이썬을 이용한 데이터 분석

-데이터 로드하기

-Pandas, plotnine, Matplotlib, Seaborn을 이용한 데이터 시각화

-Numpy를 통한 기초 수학 이해

-데이터 전처리하기

-지도학습 / 비지도학습

-텍스트 데이터 핸들링

-텍스트 데이터 벡터화

-비지도 학습을 이용한 텍스트 데이터 분석하기

-분류/회귀 실습


4. 데이터 시각화 이론 및 실습

-시각화 이론(E. Tufte, C. Ware, S. Few, L. Wilkinson)

-EDA를 위한 시각화 (J. Tukey, B. Victor)

-데이터 시각화를 위한 파이썬 프로그래밍 및 실습



우리가 진행할 방식



다양성을 고려한 조별 수업

5인 1조로 구성하며 교육기간 동안 다양한 조구성이 될 수 있도록 Assigning Students to Groups Using General and Context-Specific Criteria 논문 내용을 통해 구성할 예정이에요.

조별로 구성하게 된 이유는 서로 돕기 위해서에요. 먼저 수업을 마친 사람은 옆 자리에 있는 동료를 도와주세요. 그리고 과업을 마친 동료가 있다면 서로 축하해 주세요. 우리는 자리에 아래 처럼 생긴 손짝짝이를 준비해 둘거에요. 작은 과업을 마쳤다면 서로 축하해 주세요.


4ZcvEx5HS6Df9AX8OxE6iEkL2vCfs8EcjnC_C_HJ8ZXqFR6nyDhZ7M_C2ERzk2ckkbNFsfb3JgFYoznmp4Wx6y4gubAF6buqNzLwgceVj61JrwQN9de0sxGVlxqfozhOi86KYtoK

위 그림은 실제와 다를 수도 있겠지만 평균기억율을 보면 수업듣기가 가장 낮고 가르치기가 가장 높게 되어 있어요. 여러분이 수업에 적극적으로 참여할 수 있도록 데잇걸즈의 강사와 운영진이 도울거에요. 같은 팀원 중에 어려움을 겪는 사람이 있다면 적극적으로 도움을 주고 도움을 요청해 주세요.

참고 : https://www.fitnyc.edu/files/pdfs/CET_Pyramid.pdf



가벼운 아침회의

우리는 매일 아침 조별로 모여 앉아 10분 내외의 회의를 할거에요. 전날 배웠던 내용이나 흥미로웠던 점 그리고 진행하고 있는 프로젝트에 대해 얘기할 거에요.


하루를 돌아보는 회고

하루에 한 번 수업이 끝날 무렵 10분 내외로 회고 할거에요. 형식 없이 자유롭게 회고해도 되고 회고 방법이 필요하다면 다음 방법을 사용해 볼 수 있어요. 회고의 기법 중에는 사실, 느낌, 교훈(Fact, Feeling, Finding)을 이야기 하는 3Fs(참고: 애자일 이야기 - 뒤돌아보다) 혹은 PMI(Plus/Minus/Insight|Interest) 기법 등이 있어요. 더 나은 기법이 있다면 어떤 것을 활용해도 좋아요. 서로에게 도움을 주고 인사이트를 얻을 수 있는 시간이 되길 바랍니다.


TIL(Today I Learned)로 일일커밋 하기

그날 수업했던 내용에 대해 마크다운 문서로 정리해서 데잇걸즈 공동 저장소에 Pull Request를 보낼 거예요. 매일 수업 내용을 기록하는 게 쉬운 일은 아닐테지만 이 과정을 통해서 우리는 Git과 GitHub 사용법과 마크다운 문법에 익숙해질 거예요. 수업이 있는 날은 마크다운으로 작성한 수업 내용을 커밋하고 공동 저장소에 풀리퀘를 보내 주세요. 만약, 수업에 결석했다면 다른 동료의 커밋 내용을 보고 정리해도 괜찮아요. 매일 배운 내용을 정리하고 커밋하면서 컨트리뷰션 그래프를 채워가도록 해요. 수업이 없는 날에도 커밋을 해서 컨트리뷰션 그래프를 더 빼곡하게 채우는걸 추천해요.


수업설문

매 수업이 끝나고 그날 수업에 대한 설문 폼을 작성해 주세요. 설문은 익명으로 작성하며, 설문에 대한 내용은 수업이 종료되는 시점에서 우리가 배웠던 데이터 분석 툴로 탐색적 데이터 분석과 시각화를 통해 분석해 볼거예요. 이 외에 수업 개선을 위한 용도로만 사용되니 꼭 설문에 참여해 주세요.


프로젝트

프로젝트는 공통 프로젝트와 조별 프로젝트로 나누어 진행할 거에요. 상반기 프로젝트는 미리 정해진 프로젝트를 해보고 이를 바탕으로 하반기에 할 프로젝트를 직접 정하도록 해요.


우리가 사용할 도구

수업용 슬랙을 운영해요. 슬랙은 협업도구 중 하나로 주제별로 그룹 대화를 할 수 있는 툴입니다. 채널을 개설하고 각 채널에서 도움과 정보를 주고 받도록 해요.


구글드라이브

수업시간에 구글 드라이브를 적극 활용할 거에요. 만약 구글 계정이 없다면 생성해 주세요.


스프레드시트

우리는 구글 드라이브의 스프레드시트를 통해 엑셀 사용법도 배울거예요. 통계에 대한 기초지식을 배우고 스프레드 시트로 실습해 볼 예정이에요. 엑셀은 정말 위대해요. 엑셀로 배웠던 내용들을 나중에 파이썬을 통해 다시 공부하게 될거예요.


Colaboratory

아나콘다를 온라인에서 사용할 수 있는 도구예요. 구글 드라이브에 있기 때문에 다른 구글 문서도구처럼 사용할 수 있어요. 파이썬, 판다스, 넘파이 등이 설치되어 있기 때문에 별도의 설치 없이 사용할 수가 있어요. 또, GPU를 지원하기 때문에 무료로 GPU를 사용해 볼 수가 있어요. 하지만 인터넷에 연결되어 있을 때만 사용이 가능하다는 점과 일부 라이브러리는 지원되지 않기 때문에 우리는 각자의 노트북에 아나콘다를 설치해서 사용할 거예요.


Git & GitHub

Git은 파일의 버전을 관리해 주는 툴이에요. 우리가 Git을 배우는 이유는 기록을 좀 더 잘 남기고 이를 잘 추적하기 위함이에요. 그리고 다른 사람들과 잘 협헙하기 위해 GitHub 사용법도 익힐거에요. 버전관리 도구가 없을 때 우리는 파일을 여러 번 복사해서 `파일명_최종.txt`, `파일명_진짜_최종.txt, `파일명_진짜_최종_마지막.txt` 등의 이름을 붙여 사용했을지도 몰라요. 하지만 각 파일에서 어느 부분이 변경되었는지 비교해보기가 어려웠어요. Git은 이런 역할을 대신해 주고 GitHub을 통해 협업을 하고 소스에 대한 이력관리를 하고 소셜코딩을 할 수 있어요. 우리는 수업이 있는 날 그날 수업 내용을 정리해서 GitHub에 올릴거에요. 그리고 컨트리뷰션 그래프를 초록색으로 채울거에요.


우리는 이 과정을 통해 Git과 GitHub 사용법 그리고 프로젝트 관리방법에 대해서도 배울거에요.

[깃허브(GitHub)로 취업하기](https://sujinlee.me/professional-github)

[github-git-cheat-sheet](https://services.github.com/on-demand/downloads/github-git-cheat-sheet.pdf)


소스트리

Git을 설정하고 GitHub에 회원가입을 했다면, 소스트리를 다운로드 받아주세요. 터미널을 통해 git을 사용할 수도 있지만 소스트리를 사용하면 변경 된 이력을 확인하고 변경 내용을 비교해 보기 편리할 거예요.

[Sourcetree - Free Git GUI for Mac and Windows](https://www.sourcetreeapp.com/)

[소스트리(source tree) 를 사용하여 Git 사용하기 - 인프런](https://www.inflearn.com/course/git-%EA%B0%95%EC%A2%8C-%EC%83%9D%ED%99%9C%EC%BD%94%EB%94%A9/ )


마크다운

GitHub 에서 문서를 작성할 때는 마크다운이라는 형식을 사용해요. 프로그래밍 언어처럼 규칙을 익히고 그 규칙대로 작성해야 해요. 마크다운은 한번 익혀두면 사용할 곳이 많으니 이번 기회에 익혀보고 그날 배운 내용을 마크다운으로 작성해서 깃헙에 커밋하도록 해요. 우리는 공동 저장소를 만들어서 그 날 학습한 내용을 마크다운으로 기록할거예요.

Mastering Markdown · GitHub Guides


아나콘다

프로그래밍 언어를 배울 때 가장 어려운 과정은 환경을 설정하고 구성하는 일이에요. 여러 가지 툴을 한 꺼번에 설치하다보면 설정이 꼬이고 어디에서 부터 잘못되었는지 찾기 어려울 때가 많아요. 아나콘다는 이런 일에서 우리를 구해줄거에요. 아나콘다를 설치하는 데 어려움을 겪을 수도 있겠지만 강사와 운영진이 도와줄것이니 너무 걱정하지 마세요. 아나콘다를 사용하면 Pandas, NumPy, Scikit-learn 등의 과학계산 라이브러리를 간단하게 설치하고 사용할 수 있어요.

아나콘다 다운로드(Python 3.6 이상, 64bit 버전 설치) : https://www.anaconda.com/download/


터미널

GitBook

https://www.gitbook.com/

우리가 배운 내용을 정리해서 다른 사람들이 배울 수 있도록 튜토리얼 문서를 만들거에요. 우리는 배우는 것에서 그치지 않고 우리가 배운 내용을 정리해서 다른 사람들이 배울 수 있도록 도움을 주도록 해요.

GitBook 으로 잘 만들어진 튜토리얼로는 다음과 같은 것들이 있어요.

[장고걸스 튜토리얼](https://tutorial.djangogirls.org/ko/)

[텐서플로우 문서 한글 번역본](https://tensorflowkorea.gitbooks.io/tensorflow-kr/content/)



데잇걸즈2기 일정

서류마감 6.11(월)
서류발표 6.13(수)
면접전형 6.15(금) - 6.16(토)
교육시작 6.25(월)
컨퍼런스 10.06(토)


교육일정 : 2018.06.25 ~ 2018.10.06

매주 월,화,목,금 10:00-19:00 (6~8월)

매주 월,화,수,목,금 10:00-19:00 (9월)

10.02(화) 10:00~19:00

10.04(목) 13:00 ~ 18:00 리허설

10.06(토) 13:00 ~ 18:00 수료식, 발표회, 컨퍼런스


교육장소 : 서울창업허브(공덕역)

모집대상 : ‘데이터 분석 분야로 취업, 창업을 희망하는 여성’

선발인원 : 30명

교육비 : 전액 무료


데잇걸즈2기 지원마감은 6.11(월)입니다.

지원은 여기 http://bit.ly/dataitgirls2

데잇걸즈 페이지 http://bit.ly/데잇걸즈페이스북

매거진의 이전글4. 데잇걸즈1기 후기입니다