brunch

You can make anything
by writing

C.S.Lewis

by 전영환 Apr 14. 2019

2018 Google Research Review #1

2018년 Google Research에서 연구한 것들을 리뷰하고자 합니다. 첫 번째 글에서는 Artificial Intelligence와 관련된 내용들과 AI의 Application 및 Social Impact에 대한 부분을 다루겠습니다.



Ethical Principles and AI


우리는 지난 몇 년간, AI의 발전과 그것이 우리 제품과 사용자들의 일상에 미치는 긍정적인 영향을 확인해왔다. 우리는 AI가 세상에 좋은 영향을 주고, AI가 윤리적으로 적용되도록 하며, AI가 사회에 긍정적 영향을 주는 문제를 풀도록 하는데에 많은 관심을 가져왔다.

그 결과로 2018년에는 Google AI PrinciplesResponsible AI Practices 발간하였다. 이것들을 이용하여, Google이 개발하는 AI에 대한 평가를 할 수 있게 되었다. 이 분야가 빠르게 발전함에 따라, 이러한 기준들을 연구하는 것은 중요해지고 있다. 그 결과로 ML Fairness 혹은 model interpretability와 같은 분야도 연구가 되고 있다. 이러한 연구들은 AI로 만들어지는 제품이 덜 베타적이며, 덜 편향적이 되도록 한다. Machine Translation에서는 성 편견을 줄여주며, Vision 제품에서는 세계의 다양한 문화를 포괄적으로 이해하도록 해준다. 이러한 경험은 Fairness Module을 통해, 공유되고 있다.


Google은 기본적으로 큰 틀에서 AI 연구에 있어서의 가이드라인을 제시하였다고 생각합니다. 실제 서비스에서 적용되는 Data set은 엄청 Diverse 하며, 연구자의 의도가 담긴 방향으로 Model은 평가될 수밖에 없습니다. 이러한 Principle이 제시된다면, 해당 Principle을 바탕으로 Inclusive 한 AI 연구가 될 수 있을 것이라는 생각이 듭니다.



AI for Social Good


AI는 앞으로 사회의 다양한 분야에 많은 영향을 미칠 것이다.


첫 번째 예시로, 홍수를 예측하는 문제를 들 수 있다. 실제로 홍수가 잦은 지역에 홍수의 발생 범위 및 양에 대한 정확한 정보를 제공하여, 그들 스스로와 재산을 잘 보호할 수 있게 해 준다.

 

홍수 예측


두 번째 예시로, 지진 여진에 대한 예측을 들 수 있다. Machine Learning model을 이용한 예측은 전통적인 물리학 기반의 model에 비해, 더 정확하게 예측하는 것을 확인할 수 있다. 해당 ML model의 경우, 해석 가능하도록 연구되었다. 그렇기 때문에, 여진 현상을 새롭게 이해하고 분석할 수 있게 되었다.


그 외에도, 혹등고래 호출의 식별, 새로운 외부행성 탐지, 그리고 병든 식물의 탐지 등 다양한 과학 및 사회적 문제를 해결하는데 AI가 적용되고 있다. Google AI for Social Impact Challenge에서 다양한 사회적 문제들을 연구하여 실체화하고 있다.


병든 식물 탐지


Social Goods에 기여하기 위한 AI Application은 앞으로 더욱 많아질 것이며, 그 분야도 더 확대될 것으로 생각됩니다. 하지만 이 부분에 있어 중요한 것 중 하나는 False Alarm이 많지 않아야 한다는 부분입니다. Social Impact가 큰 분야라면, False Alarm으로 인한 Cost가 매우 클 것이라는 생각이 듭니다. 그렇기에 어느 정도 보수적으로 검증된 model에 대한 적용이 이루어져야 한다고 생각이 듭니다.


AI for Social Goods 측면에서 또 하나 고려해야 하는 상황은 공공데이터의 확대입니다. 현재 우리나라는 공공데이터가 그리 많이 않고, 해당 데이터들도 많이 쌓이고 있지 않습니다. 공공데이터가 많이 쌓이고, 이런 것들을 공개하여 함께 연구해나갈 때, 더 큰 Social Impact가 일어나지 않을까 합니다.



Assistive Technology


대부분의 우리의 연구는 ML 및 computer science를 활용하여, 사용자들이 빠르게 그들의 목표에 도달하게 한다. 이 연구들은 다양한 제품과 환경에 적용된다.


첫 번째 예시로, 구글 듀플렉스가 있다. 음성인식, text-to-speech, user understanding, natural language technology와 UI 디자인에 대한 연구가 결합되어, 가상 에이전트로 사용자를 지원하는 기능들을 제공한다.

듀플렉스는 기본적인 전화 응대, 전화 예약 등의 기능들이 가능하며, 현재 우리나라에서 서비스되고 있는 다양한 인공지능 비서의 역할을 하는 구글의 서비스이다.


그 외에도, 예측 모델을 사용하여 이메일 답변을 제안해주는 Smart Compose, 음악 검색을 빠르고 정확하게 지원하는 Sound Search, 텍스트를 구성하고 있는 요소들을 이해하여 더 효과적으로 화면에 노출시켜주는 Smart Linkify 등이 있다.


Smart Linkify


AI 기술이 적용됨으로써, 서비스에 대한 사용자의 편의성이 높아지고, 그들이 더 높은 질의 삶을 영위할 수 있게 된다는 것입니다. 단계적으로 스며들고 있는 이러한 AI 기술들은 점차적으로 사람들의 행동 습관도 바꾸고 있습니다. (이전보다 음성 인식 스피커를 많이 쓰고 있는 요즘) 그렇기에 사람들이 불편함을 느끼고 있는 생활의 모습을 발견하고, 어떠한 Assitant가 필요한지 고민하는 것이 서비스를 연구하는 데 있어서, Data Scientist의 중요한 역할이 아닐까 합니다.



Natural Language Understanding


Google은 꾸준히 Natural Language Understanding에 대한 기초적인 연구를 많이 진행하였다. 2017 Transformer를 parallel-in-time version으로 발전시킨 2018 Universal Transformer를 개발하였다. 이는 언어 추론 등의 과제에서 강점을 보였다.


또한 bidirectional 하고 unsupervised language representaion을 할 수 있고, plain text만으로도 학습이 가능한 BERT를 개발하였다.


Benchmark test for NLU models


현재 그리고 당분간 이 쪽 분야에서는 BERT가 state-of-the-art를 차지할 것 같습니다. (물론 다양한 task가 있고, 해당 task별로 적절한 model은 다릅니다.) Unlabeled data로 미리 학습하고, Transfer learning을 하는 특징으로 인해 data label이 부족한 상황에서 사용할 수 있다는 부분이 강점인 것 같습니다. 또한 새로운 task에 적용하기 위해, 새로운 network가 필요한 것이 아니라 약간의 fine tuning으로 적용 가능하다는 것이 엄청난 강점이 될 것 같습니다. 이 분야를 연구하시는 분들은 원문도 읽어보시고, 다양한 Domain의 data에 적용해보시면 좋을 것 같습니다. 그냥 NLU 도메인의 흐름으로 해당 model을 기억만 하고 있어도 좋을 것 같습니다.




2018년 Google Research에 대한 Review는 3개의 글로 구성될 예정입니다. 두번째 Review에도 많은 관심 부탁드립니다. Data X Technology 매거진의 글은 매주 일요일에 발행됩니다.


이 글은 아래의 원문을 번역/의역 및 요약하였습니다. 중간중간 파란색으로 표시된 글씨는 번역자의 견해입니다.


https://ai.googleblog.com/2019/01/looking-back-at-googles-research.html


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari