성균관대학교 2021-1학기 도전학기 리뷰
- AI는 weak AI와 strong AI 가 있다. 한가지 일을 사람처럼 잘하는게 weakAI이고, 현재 산업계에서 사용되는 건 weak AI가 다수다. 실행활에서 쓰는 것도 weakAI.
- 우리가 영화에서 보듯 사람처럼 행동하고 모든 걸 생각하는 건 strongAI.
- strongAI를 위해 많은 사람이 노력하나, 사실 많이 힘듦.
- 머신러닝이란 : 약인공지능을 만들기 위한 수단 (weak AI구현위해!)
- 머신러닝 : 'learning' : Tom Mitchell
: 컴퓨터 알고리즘이 경험을 통해서 자동적으로 학습하는 것
: 엄밀한 정의 : 어떤 컴퓨터 프로그램이 경험 E라는 것을 했을 때 P라는 작업을 수행할 때 측정되는 척도 P를 통해 스스로를 개선할 수 있는 것.
- 딥러닝이란 : deep nural network를 기반으로 한 학습 알고리즘. / 여러 층으로 이뤄진 process. 데이터를 받아서 프로세싱해서 마지막 단계에서 나오는 것.
머신러닝은 가장 크게 두가지로 나뉜다.
1. 지도학습 Supervied Learning
: 데이터에 입력 값과 함께 출력 값이 줘진 경우, 입력값과 출력값의 관계를 학습하는 머신러닝
: 데이터 형태 : d차원의 입력값. 그에 해당하는 출력값을 y. 전체 데이터셋 = (x,y1)
: 분류(고장이다, 아니다, 결과가 나뉘어지는 것), 회귀(결과 값이 연속된 숫자가 주어지는 것)
2. 비지도학습 Unsupervied Learning
: 데이터에 출력값 없이 입력값만
: 입력값만 이뤄진 데이터셋
: 군집화, 이상화 탐지, 다양체(고차원 manifold) 학습 등
+@
3. 준지도 학습, 반지도 학습 Semi-supervised learning
: 일부만 출력 값이 주어진 경우
+ 강화학습 (알파고) / 전이학습 / Generative Models
1. 컴퓨터 비전 : '고양이 인식', '사진 인식'
2. NLP : news의 classification 분류문제 / 지문을 주고 질문을 주면 대답 부분을 찾아내는 것 / 기계번역 등
3. 헬스케어
4. 자율주행
5. 신 물질개발
6. 금융시장 예측, 회사 예측
7. 유사 고객분석
8. 게임
: 머신러닝 기법을 작년 학회에서 학습했지만, 복습을 위해 방학때 코세라 강의와 도전학기 강의를 학습한다. NLP에 관심이 많아졌는데, 자연어처리를 위한 머신러닝 공부와 프로젝트를 진행한다. 프로젝트 같은 경우는 정보공개 청구를 통해 얻어본다. 노동, 세대론, 다양한 데이터셋을 구축한다. 특히, 세대론과 관련한 이야기나 대선후보와 관련된 분석을 진행하고 싶다.