머신 러닝에서 보는 학습의 현재, 그리고 미래
시대의 흐름에 맞는 학습 시스템 개발에 즈음해,
인간을 배우고 있는 기계 학습에 대한 고찰을 하게 된다.
많은 화제가 되고 있는 기계 학습에 대한 고찰을 해 보고,
학습 시스템을 공부하는 입장에서 시사점에 대한 의견을 제시하고자 한다.
[ 미국의, 매우 미국적인 Jeopardy! Show, since 1964 ]
2000년, 나는 좁은 군대 부속실에서
보좌관과 함께 장군님이 퇴근하시기만 기다렸다.
곧 퀴즈쇼가 시작되는 시간이었고,
두 명의 군인은 그 시간을 위해
하루 종일 영어사전을 들추며 짧은 영어를 가다듬었다.
쇼를 보면서, 두세 개 정도 맞추면 그날의 내기에서 승리할 수 있었다.
그런 기억을 가진 나에게,
IBM이 인간계에서 가장 유명한 퀴즈 쇼에 도전했다는 소식이 들려왔다.
매우 흥미로운 일이었다.
많은 도전 중에, 왜 제파디! 쇼인가?
IBM Research의 왓슨 알고리즘 담당인
크리스 웰티 (Dr. Chris Welty) 박사는 이렇게 말한 바 있다.
- 기획의도 : 컴퓨터가 사전에 기획되지 않은 질문을 풀도록 하는 것
- 배경
* Jeopardy! show는 순수한 자연어 (natural language)로 구성
* 일상 영어의 모든 면, 지역적 특성, 속어, 약칭을 숙지해야 게임을 할 수 있고, 힌트를 얻을 수 있음
* 자신감이 중요함 : 퀴즈쇼는 해답에 확신이 없으면 대답을 해서는 안 됨
* 반응성이 뛰어난 기술일수록 현실에서의 실행이 용이
* 컴퓨터의 Question and answer 기능의 실현이 걸린 최적의 도전 과제
IBM Research의 데이비드 페루치는 (David Ferruci)는
이 게임을 통해 기술을 올바를 방향으로 이끌 수 있을 것으로 분석한 바 있다.
인공지능 개척을 통해 더 넓은 분야, 넓은 시야를 확보하는 것이다.
- 최근의 연구에서 추구하는 방향성
* 정보 이해(understanding)를 넘어 -> 지식(knowledge)을 추출
* 정보의 양은 절대적으로 지식보다 훨씬 빠른 속도로 성장하고 있다
* 1년간 지식 양산 > 지난 2천년간의 인류 지식의 양 (You are being outdated)
* 기존의 인간, 컴퓨터 시스템을 넘어, 신속하게 데이터에서 지식 추출하는 시스템이 필요
- 1956년, MIT의 존 매카시 (John McCarthy), AI라는 개념 제창, LSIP 언어 개발
- 1960년대, 최초의 챗봇 ‘엘리자(ELIZA)’ 등장
: ‘나는 엘리자야. 어떤 대화를 하고 싶니?’
[ 최초의 인공지능 챗봇, 엘리자 ]
* 사용자의 대화 입력 / 기계의 대화 출력
(정신과 의사처럼 반응토록 프로그램)
나는 우울하다 -> feeling sad / 우울해서 저를 찾으셨나요?
* 한계 : 실질적 통찰력(insight) 없이 단순한 규칙에 따라 핵심 어구를 재배열
나는 죽었다 -> I am dead / 죽어서 즐거우세요?
* 패턴 매칭 (pattern matching)을 통해서 빈칸을 채우는 수준
높은 장벽의 실감 우리가 일상적으로 언어를 통해 행하는 일들을(커뮤니케이션)
기계 (컴퓨터)는 전혀 이해하지 못한다.
(인공지능은 죽음이 무엇인지 잘 모른다)
연구자들은 ‘학습 방법에 문제가 있는 것일까?’라는 의문을 품기 시작한다.
인간은 자신이 안다고 생각하는 것보다 훨씬 더 많이 알고 있다.
예를 들어 엘리베이터 위 방향 세모 버튼을 누르면 올라간다는 것을 안다.
우유는 희다.
그리고 물은 젖게 한다.
인간은 이런 것을 ‘안다’고 인식하지 못하고 있지만,
이것이 진정 중요한 능력이다.
인간의 뇌가 수집하는 상식을 (common sense),
모두 컴퓨터로 프로그래밍할 수 없다.
인간은 행복할 때 웃는다.
Cycorp의 Doug Lenat은, 지난 30여 년간
인공지능 연구를 해 왔고,
인간과 유사한 지능을 구현하기 위해 노력했다.
기계에게 인간과 같은 지능(human like intelligence)을
주기 위해, 규칙, 규칙, 규칙을 반복적으로 입력해 왔다.
그 결과물이 Cyc 프로그램이다.
이 회사의 벽면은 로직 다이어그램으로 가득 차 있다.
이를 통해 다양한 상식 질문(common sense questions)에 대답할 수 있다.
(General logical reasoning capabilities by RULES)
- 600만 개의 규칙을 입력 (코딩을 통해) -> 연역적 접근방식
- But 인간이 반드시 알아야 할 규칙 중 3%에 지나지 않음 (human common sense)
- 질문 : 통조림이 캉캉 춤을 출 수 있는가? (Can a can Can Can?)
Cyc 의 답 : No
-> 그 이유는 : 통조림은 생명이 없다
-> 최소 지능 / 운동 신경 없음
-> 결론 : 캉캉을 출 수 없다
30여 년 전에 탄생한 인공 지능 연구 관점에서는
Rule / Logic 이 최대한 많이 필요하다고 보았으나,
지금의 연구는 이것으로는
‘인간 수준의 지적 능력 구현’은 부족하다고 본다.
‘더 많은 규칙을 쌓아가는 것’ 으로는 부족하다는 것이 판명되었다.
연구자들이 아직까지 이해하지 못했던 기본 원칙이 있었다. (Basic Principles)
‘팩트’와 ‘규칙’은 단지 시작에 불과하다는 점을 이해하기 시작한 것이다.
실제로 모든 단어와 문장의 맥락을 조합해서 규칙으로 만들어 두는 것은 ‘불가능’ 하다.
- IBM에서 David Ferucci 팀은 제파디! 쇼에 도전하기로 결정
- 제파디! 쇼에서 이기려면 더욱 ‘액상적이며 유연한’ 신규 시스템이 필요
- 이 새로운 AI 시스템은, IBM 창업자 토마스 왓슨 박사의 이름을 따서 왓슨으로 명명
* 2800개의 프로세서, 6천 대 고급 가정용 컴퓨터, 냉장고 10대의 크기
* 인터넷 1000만 건 문서 확보 : 백과사전, 유의어 사전, 대본, IMDB, 뉴욕 타임스, 성경…
왓슨은 쇼에 출연하면 혼자서 문제를 풀어야 한다.
방대한 양의 Raw data를 가졌다는 것과,
정보에서 지식을 추출해 퀴즈를 푸는 것은 다른 일이다.
이에 따라 왓슨의 데이터 및 규칙 기반을 구축하기 위해
컴퓨팅 세계의 가장 강력한 방법론을 도입하게 된다.
인공지능 분야의 새로운 인사이트,
머신 러닝, 또는 기계 학습 (Machine Learning)은
휴먼 러닝과 기본적으로 유사하다.
예전에는 규칙을 모두 손으로 (코딩) 입력해 주었으나,
지금은 ‘사례’에 기반을 두고 있다.
- 기계학습의 원리 이해 :
철자 A에 대한 학습 사례 컴퓨터에 a를 설명하려면?
미국 체신성 (US postal service)에서 실제로 우편 자동화 업무를 위해 고민했던 사례
인쇄되었든 손으로 쓰였든 기계가 a를 인식할 수 있도록 하기 위해서는 어떻게 할까?
- 인간은 a를 특별한 어려움 없이 인식한다.
어떻게 생겼더라도 a라고 인식
심지어 위를 향한 갈매기 표시조차도 a라고 인식할 수 있다
- 기존의 규칙 생성 및 코딩 방식으로는,
a를 인식시키는 프로그래밍에 한계가 있다
인간은 a를 인식하기 위한 모든 경우의 규칙을 만들어 내기 어려울 수 있지만,
컴퓨터는 스스로 해 낼 수 있다는 것으로 판명되었다.
‘많은 사례를 주기만 하면 된다’
이것이 a다 (사례) + 이것이 a다 (사례) + 이것이 a다 (사례) + 이것이 a다 (사례)…
- 수백만 개의 사례에서 기계는 유사한 패턴을 찾아낼 수 있다.
일단 패턴이 인식되면, 더 이상 무언가 알려주지 않더라도
a라고 인식하게 된다.
이것이 기계학습이다.
Watson 의 프로그래밍에서 중요한 부분이다.
IBM 연구진들이 실시한 것은 제파디! 쇼에 대비해 왓슨을 학습시키는 일이었는데,
그 방법론이란 제파디! 쇼의 과거 데이터 베이스,
즉, 질문과 답을 표시한 모든 사례지를 제공하고,
기출 질문에 대해 정답과 오답을 표시해 주는 일이었다.
왓슨은 이 학습 방법을 통해, 정답을 알게 된 케이스의 경우,
스스로 답을 뒷받침하는 증거(evidence)를 찾아내게 되었다.
수많은 질문에 대해서 엔지니어들은 이러한 작업을 수행해 주었고,
올바른 답을 기계가 스스로 찾아낼 수 있도록,
평균적으로 각 증거에 대한 가중치를 부여해 주었다.
이제 퀴즈는 확률의 문제로 바뀐다.
왓슨이 전혀 새로운 문제를 접하는 경우,
이러한 패턴에서 학습한 정보에 기초,
각각의 경우에 가능한 답을 “자신있게” 말한다.
최종적으로 IBM 알고리즘 연구는 왓슨에게
정답 확률이 75%인 최상의 답을 제시하는 목록을 확보하게 해주었다.
IBM 왓슨은
1) 규칙 (Rules)
2) Raw data
3) 머신 러닝의 복합 아키텍처(Complex Architecture)
로 탄생하였고,
인간 최강의 퀴즈왕을 누르고 챔피언에 등극하였다.
왓슨은 단 하나의 모습이거나 닫힌 형태의 하드웨어가 아니다.
17개 산업 및 학문 부문에서 수많은 개발자들이 연구를 이어가고 있으며,
소프트웨어, 애플리케이션, 하드웨어, 고객 서비스의 형태로 진화해 가고 있다.
그리고 방대한 양의 데이터에 기반해,
각 영역에서 계속 학습해 나가고 있다.
데이터에 기반한, 지식의 창출이다.
미국 외 전 세계에서 공공기관뿐 아니라,
금융, 방송, 의학, 교육, 쇼핑 등 다양한 분야에서 확산 중이다.
국내에서도 SK, 신한 금융지주, 현대카드, 교원 등 다양한 기업들이
왓슨의 인공지능 기술을 도입했거나, 도입 검토 중에 있다.
왓슨이 제파디! 쇼를 우승하였지만,
진정한 승자는 그를 창조해 낸 인류이다.
누군가의 말처럼 인생은 질문과 답의 연속이다.
(Life is really about questions and answers.)
기계 학습의 기술이 새로운 질문에 대한 답을 얻도록 하는 데
도움을 줄 수 있을 것이다.
왓슨은 (기계학습은) 어떤 분야에 적용될 수 있는가?
어떤 혁신을 가져올 수 있는가?
의료, 보건, 정치, 사회, 경제… 수많은 정보를 얼마나 이해하느냐에 따라
다른 답을 얻을 수 있는 수많은 분야들이 있다.
기계가 스스로 학습하고, 분석하고, 판단하여,
인간에게 제안을 할 수 있다.
인간의 ‘의사결정’을 도울 수 있다.
왓슨은, 각 비즈니스 영역에서
고객의 니즈에 맞추어 형태를 다양화해 나갈 것이다.
그렇다면, 일과 관련하여,
우리 인간들은 성장하기 위해,
어떤 교육을 받고,
성장해야 하는가?
HRDer 들이여,
게임은 끝이 아니라, 이제 시작이다.
1) 머신 러닝은, 인간의 학습을 기초로 만들어졌다.
정작 인간의 학습 문제는 무엇인가?
2) HRD 관점에서 머신 러닝을 활용한 학습 시스템의 시사점은 무엇인가?
- Information to Knowledge
- Facts and rules
- Fluid and Flexible
- Based on examples
- 연역에서 귀납으로
- 의사결정지원