brunch

You can make anything
by writing

C.S.Lewis

by YoungHurck Cha Jan 22. 2019

케라스 딥러닝 #3 구글에서 배우는 딥러닝 활용 사례

케라스,스터디,파이썬,딥러닝,머신러닝,합정역,발표,활용사례,딥러닝책


딥러닝 활용 사례


딥러닝 스터디 3번째 시간이다.

두번째 스터디 시간까지의 내용 정리이다.

내용 정리는 두 권의 관련 책으로 정리해 본다.

세번째 시간에 공유한 발표 자료이기도 하다.


Summary


최근 스터디로 접한 내용을 3분 딥러닝으로 재 정리해 본다.

    질문

딥러닝으로 실제로 무엇을 하고 있을까? 할 수 있을까?

궁금한 사항에 대하여 관련 책을 읽고 브런치에 정리

스터디 내용

https://brunch.co.kr/@younghurckc/1310

https://brunch.co.kr/@younghurckc/1320


진짜 책 이야기


딥러닝은 이미 여러분야에서 활용되고 있다. 데이터가 지속적으로 누적되고 일정한 패턴을 보이는 형태라면 접목이 가능하다는 것이다.
다들 자신의 분야에서의 적용이 궁극적인 목표일 것이다. 특히 내가 스터디를 하는 이유이기도 하다. 적합한 아이템의 도출이다.
최소한의 프로토타입이라도 끄집어낸다면 성공이다.

구글에서 배우는 딥러닝


미래를 향해 아가는 딥러닝의 활용

069

대화로 사용하는 가정의 인공지능 비서

사람과 대화를 할 수 있다!?


자율 주행을 지탱하는 딥러닝

077

구글은 딥러닝을 활용하여 도로 주행 시물레이션을 반복합니다.


078

딥러닝으로 데이터 센터의 소비전력을 큰 폭으로 절감

 데이터 센터 안에 장착한 수천 개의 센서를 통해, 온도와 전원 공급 장치  펌프의 속도와 같은 각종 설정 정보를 수집합니다. 그리고 이들 데이터와 데이터 센터의 소비전력, 전력 사용 효율(PUE,Power Usage Effectivenesd) 사이의 관계를 뉴럴 네트워크에 학습시켰습니다.

 뉴럴 네트워크는 이러한 학습을 통해, 데이터 센터 내부와 외부의 환경에 따라 가장 높은 전력 효율을 구할 수 있는 최적의 냉각 설비 운용 시니리오를 만듭니다.

 또한, 데이터 센터 주변의 온도와 기압데이터를 학습하여, 1시간 후의 온도와 습도의 데이터를 예측하고, 그 예측에 기반을 둔 시나리오 냉각설비를 운용하도럭 했습니다. 

 그 성과는 명백했습니다. 딥러닝을 활용하여 운영한 냉각 설비의 전력 소비량이 40%나 줄었습니다. 이는 데이터 샌터의 전력 사용 효율을 나타내는 PUE로도 15% 감소에 달하는 수치입니다.


인간의 눈을 초월하여 사물을 분별하는 이미지

081

사진을 자동으로 분류하는 'Google 포토'

Google 포토는 딥러닝의 힘을 질려 사진을 자동으로 분ㄹ 할 수 있게 되었습니다.

이미지처럼 지금까지 검색이 어려웠던 데이터조차 딥러닝의 힘을 빌려 검색 대상으로 만들어 버리는 점이 구글다운 부분입니다.


083

인공지능이 평가하는 그림 그리기 시스템 'Quick, Draw'

사진처럼 같은 깔끔한 이미지 데이터가 아니라, 인간이 손으로 그린 그림도 딥러닝의 힘을 질히면 컴퓨터가 이미지 인식을 할 수 있게 만들 수 있는 것입니다.

https://quickdraw.withgoogle.com

085

컴퓨터도 꿈을 꿀 수 있는가? '딥 드림' 실험

 뉴럴 네트워크가 이미지를 인식해서, 특정한 부분에 고양이와 개 같은 이미지가 보이면  그 정보를 입력 데이터에 기록하는 것입니다

 그러면, 아무것도 없는 원본 이미지에 이상한 모양이나 동물의 얼굴 같은 것이 나타나기 시작합니다. 딥 드림은 입력된 영상을 바탕으로 새로운 이미지를 만들어가는 것입니다.

 그런데 생성된 이미지를 살펴보면, 마치 꿈속 세계 같으면서도 이상하고 기괴한 이미지가 출현됩니다. 예술이라고 부를 것인지, 악몽으로 불 것인지는 보는 사람의 기분 나름일 것입니다.

 이것은 신경망의 각 계층에서 특징을 어떻게 해석하고 있는지를 이미지로 추출한 것입니다.


086

뛰어난 예술과 음악를 만들어내능 '마젠타'

 마젠타는 딥러닝으로 음악과 예술을 만들어 낼 수 있는짛 확인하는 프로젝로, 머신러닝을 테마로 연구하능 Google Brain이 만들었습이다.

 마젠타 프로젝트에서는 딥러닝으로 만든 약  90초 피아노의 선율을 공개했습니다. 이것이 마젠타가 만든 최초의 예술작품이라는 뜻이 됩니다.

 참고로 일본에서는 이러한 움직임을 두고, 인공지능이 만든 창작물의 저작권에 대한 논의가 진행되었습니다.


087

동영상을 인식하는 기술! '독순술 전문가에게 승리하다'

 딥마인드는 동영상 데이터에서도 뛰어난 성과를 올리는데 성공했습니다. 바로 독순술입니다.

 독순술이란 말하는 사람의 입술의 움직임를 읽어서 무엇을 말하고 있는지를 인식하는 기술입니다. 이것을 컴퓨터가 딥러닝으로 배운 것입니다.

 딥마운드는 영국 BBC 방송의 여러 TV  프로그램 시리즈를 골라, 약 5,000시간의 동영상을 딥러닝으로 가르쳤습니다. 이를 통해 학습한 컴퓨터는 입술의 움직임을 읽었습니다.

 그 결과,  200개의 비디오 테스트 세트에서 약 50%의 단어를 읽어냈습니다.

 한편, 비교 대상인 사람은 좋지 않은 결과가 나왔습니다. 법정 등에서 10년 이상의 경험을 쌓은 독순물 전문가조차, 같은 테스트 세트에서 25%의 단어만 읽을 수 있었습니다.


088

문장을 이해하는 텍스트 분석

 구글은 딥러닝을 활용한 텍스트 분석의 성괴물을 검색 랭킹을 산출하는 알고리즘인 랭크브레인에서 활용하고 있습니다. 딥러닝을 사용한 알고리즘은 검색 알고리즘에서 하나의 지표(시그널)로 이미 사용되고 있습니다.


090

자동으로 이메일 답장 예문을 만드는 'Inbox'

 Inbox에는 스마트 리플라이(Smart Reply)라는 자동응답 기능이 있습니다. 이 기능은 Inboc에 도착한 메일을 열었을 때, 그 아래에 답장 예문을 Inbox가 제안해 주는 기능입니다.

 이 자동 답장 기능에는 딥러닝을 사용한 텍스트 분석 기술이 사용되고 있어서, 보낸 메일의 내용을 분석하여 적절한 답장 예문을 표시하도록 만들어져 있습니다.


091

스팸 필터의 정확도도 크게 향상

 스팸 여부를 판단하는 부분에도 딥러닝이 적용된 텍스트 분석 기능을 활용하고 있습니다.

 지메일이 수신하는 막대한 용량의 메일을 훈련 데이터로 사용하여 스팸여부를 분석한 결과, 더욱 정확한 스팸 필터를 실현한 것입니다.

 구글의 제품개발 본부장인 토쿠오 히로토 씨는 다음과 같이 그 효과를 소개했습니다.

 "지금까지의 팸 메일 필터링에는 사람이 개입해 왔습니다. 이를 뉴럴 네트워크로 머신러닝을 한 결과 지난 1~2 년 사이에 스팸 메일 99.9% 이상을 파악할 수 있게 되었습니다. 이 사례는 지메일을 사용하는 분들이라면 실감하실 것입니다. 또한, 일반 메일을 스팸 메일로 오판할 가능성은 0.05 % 이하로, 매우 낮은 수치입니다."


092

기업의 정보검색을 원활하게 하는 '구글 스프링보드'

 딥러닝을 활용한 텍스트 분석 기능이 적용된 기업용 서비스도 등장하고 있습니다. 2016년 6월에 잘표된 구글 스프링보드라는 서비스입니다.

 지메일, 캘린더, 행아웃, 드라이브, 주소록 등에 등록된 정보를 검색하여, 인공지능을 활용한 통합검색 인터페이스에 표시하는 기능을 가지고 있습니다.


093

대화만으로 컴퓨터와 의사를 소통하는 '음성 인식'

 인간이 발생한 다양한 학습용 음성 데이터와 그것을 실제로 텍스트로 만들었을 때 어떠한 문자열이 된다는 대답을 마련하여 머신러닝을 시키면 되는 것입니다.

 다양한 사람들이 발성한 음성과 답변 텍스트의 상관관계를 학습함으로써, 말하는 사람으로주처 영향를 잗지 않으면서 자유롭게 이야기한 내용을 인식할 수 있게 되었습니다.

 잡음과 음성을 구별하는 정밀도 또한 높아지면서, 딥러닝은 음성 인식의 정확도를 높이는 데 기여하고 있는 것입니다.


095

대화로 인간을 보조하는 'Google 어시스턴트'

 딥러닝 기술의 발전에 따라, 음성을 텍스츠로 변환되는 음성 인식의 정확도가 높아졌습니다.

 음성 인식의 결과로 출력된 텍스트에서 컨텍스트(문맥)를 읽은 다음, 구글에 저장된 개인 스케줄과 연락처, 위피 정조, 검색시록 등을 인공지능으로 분석하여 그 다음 동작를 결정합니다.


097

합성 음성도 피아노곡도 만들 수 있는 'WaveNet'

 웨이즈넷은 음성 데이터를 그대로 입력 데이터로 사용하여 딥러닝으로 학습합니다.  입력된 음성 데이터를 표본으로 삼아, 딥러닝이 출력한 음성데이터와 비교 학습하여 자연스러운 음성을 합성합니다.

 사토 씨는 우리에게 놀라운 이야기를 들혀주었습니다.

 '웨이브넷에 클래식 피아노 음악을 많이 들려주녀 가르쳤습니다. 그러자 웨이브넷이 기존에 없던 음악을 만들어 버렸습니다. 새로운 피아노 곡리 욍성되어 버린 것입니다.'


099

언어의 벽을 넘을 가능성이 보이기 시작한 '기계 번역'


100

뉴럴 네트워크로 진화된 Google 번역

 구글이 새로 적용한 뉴럴 네트워크를 활용한 방식(구글 뉴럴 기계 번역 : GNMT)에는 구문 단위의 구분이 없습니다. 문장 전체를 보고 어떻게 번력햐 나갈지를 결정해 나가는 것입니다.

 뉴럴 기계 번역은 개념적으로 3계층으로 구성된 신경망을 활용하고 있습니다.

 처음에는 입력받은 문장의 각 단어를 수치화하는 작업을 합니다. 단어를 머신러닝으로 벡터라는 숫자값으로 바꿉니다

 다음으로, 원래 언어에서 얻은 벡터를 뉴럴 네트워크에 입력하여 번역 대상 언어의 단어 벡터로 출력하는 작업을 합니다. 이 부분에는 딥러닝이 적용된 뉴럴 네트워크를 사용합니다.

 그리고 번역된 벡터 안에서, 정확히 첫 번째 작업을 역으로 되짚어가며 단어를 되돌려 줍니다.

 실제로 컴퓨터은, 이 데이터가 딥러닝의 훈련 데이터라는 것만 알 뿐, 사람의 언어라는 사실은 모릅니다. 이미지를 인식할 때와 마판가지로, 입력받은 데이터와 출력 데이터 사이의 관계가 더 정확해지도록 내부 설정을 조정하고 있을 뿐입니다.

 훈련 데이터로써 필요한 번력 이전의 데이터, 번역 후의 데이터에는 많은 양의 데이처를 사용하고 있습니다.

 웹에서 갈무리한 데이터 중에서, 특정 일본어 문장과 특정 영어 문장이 번역된 관계임을 기계적으로 판단한 데이터를 학습데이터로 사용하고 있습니다.


기업사례

안도 하자마, 터널 공사 시의 암반 경도를 판정하다.

.굴착 공사의 자동 최적화까지 가시권에


자동차 사진으로 모델까지 식별하는 오크넷 IBS

.연간 약 500만 대의 중고차 데이터를 활용

.핸들의 위치를 식별할 수 없어 고민하다.

.중고차 거래 활성화에 기여


드론을 항공 촬영에 활용하는 에어로센스

.적은 양의 훈련 데이터로 자동차의 대수를 감지하는 시스템을 구축

.측량 효율을 높여주는 표식을 개발하다.


음성 인식 API로 운항 정보를 24시간 제공하는 Peach 항공

.사람과 인공지능의 역할 분담


카드 부정 감지 시스템의 정밀도를 크게 향상시킨 미쓰이 스미토모 FG

.콜 센터의 모든 자리에 도입

.데이터는 답을 알려주지 않는다.


강화학습
금주 스터디를 쥰비를 통하여 강화학습이라는 항목을 뽑아본다. Q러닝, DQN이다. 아직은 개론 등에 머물러 있는 것도 사실이다. 그럼에도 조금씩 윤곽이 보인다.
차주에는 하기 두권의 책으로 접근해 볼 예정이다.
행동을 학습하는 강화학습, 상태 또한 가능 할 것이다.
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari