brunch

You can make anything
by writing

C.S.Lewis

by clara Feb 16. 2021

인공지능으로 신소재를 개발할 수 있다?


인간은 진화론에 따라 생존과 직결된 문제를 먼저 학습해 왔습니다. 예를 들어 고양이와 호랑이를 구분하는 과정은 A도망칠지 B머무를지 선택에 따라 생존 여부가 달라지기 때문에 반드시 먼저 해결해야 하는 문제에 속했죠. 즉 인간은 경험을 통해 패턴을 학습하며 생존율을 높여온 셈입니다. 어려운 수학식이나 방대한 정보 습득은 반드시 학습할 필요가 없었습니다.


인공지능이 등장하면서 기계는 인간만이 가능했던 ‘학습’이란 능력을 갖게 되었습니다. 나아가 인간이 우선순위, 종류, 난이도에 따라 문제를 학습하는 방식은 기계에도 동일하게 적용되고 있습니다. 인공지능(Artificial Intelligence)이란 ‘인간의 지능을 컴퓨터로 구현하는 기술’을 말합니다. 기계의 학습 능력을 통해 인류는 천문학적인 계산 비용과 시간을 절감할 수 있게 되었죠. 과연 인공지능은 어떤 원리를 갖고 있으며, 소재(Materials) 연구에는 어떻게 적용되고 있을까요?



인공지능 – 학습방식에 따른 분류


인공지능 방식은 크게 흔히 지도학습, 비지도학습, 강화학습으로 나뉩니다. 지도학습이란 말 그대로사람이 기계에게 문제와 정답을 모두 주고 학습시키는 방법을 말합니다. 지도학습 문제는 크게 분석(Classification)과 회귀(Regression)로 나뉩니다. 분석은 데이터를 정해진 카테고리(라벨)에 따라 분류하는 반면, 회귀는 데이터들의 특징을 바탕으로 패턴과 경향을 분석하죠. 이러한 지도학습 방식은 기계가 보유하고 있는 축적/수집된 데이터가 많거나, 기계가 문제와 정답을 학습한 시간이 많아질수록 오답률이 낮아집니다.


반대로 비지도학습이란 기계가 정답이 주어지지 않은 데이터를 스스로 학습하는 방식으로, 클러스터링(Clustering) 문제가 여기에 속합니다. 예를 들면 비슷한 고객들을 몇 가지 집단으로 나눠서 개별 마케팅을 진행하는 경우 '비슷함'만 정의해 준 뒤 컴퓨터에게 알아서 고객을 나누게 하는 방식이 있습니다. 이렇게 하면 기계는 A라는 고객에게 시청패턴이 ‘비슷한’ 다른 고객들이 즐겨보는 콘텐츠를 추천하는 서비스를 제공할 수 있게 됩니다.


앞서 말한 두가지 방식이 기계가 수동적으로 학습하는 방식이라면, 강화학습은 반대로 기계가 능동적으로 학습하는 방식을 말합니다. 쉽게 말해 주어진 환경에서 기계가 문제를 해결하면 상을 받는(보상) 원리라고 볼 수 있죠. 퀘스트, 미션 등을 해결하면 아이템을 주는 게임이나, 바둑 인공지능 알파고(AlphaGo)가 대표적인 강화학습 사례입니다. 강화학습은 행동심리학에서 영감을 얻었기 때문에 인간의 학습 방식과 가장 비슷하다고 알려져 있기도 합니다.


심화된 인공지능, 딥러닝의 등장


최근에는 인간의 뉴런을 표방한 인공신경망(ANN, Artificial Neural Network) 학습 방식이 큰 관심을 끌고 있습니다. 인간이 뉴런의 전기 신호로 정보를 전달한다면, 기계들은 퍼셉트론을 통해 신호를 보내죠. 이러한 인공신경망 개념은 1940년부터 이미 존재했지만 당시 하드웨어로는 그 정도의 데이터 연산이 불가능했습니다. 1990년대 초반까지도 C++로 인공신경망 코딩을 하면 간단한 프로그램에도 일주일 이상 시간이 필요할 정도였다죠.


2000년대 전후 GPU(Graphical User Interface) 기술이 등장하면서 인공신경망 학습 방식은 큰 전환점을 맞이했습니다. GPU는 3차원 그래픽 계산에 최적화되어 있어 미분/벡터/행렬 계산에 우수한 수행 능력을 보여주었는데요. 이러한 기술 혁신을 기반으로 제프리 힌턴(Geoffrey Everest Hinton) 캐나다 토론토대 교수는 2006년 RBM(Restricted Boltzmann machine)을 활용한 연구를 발표했습니다. 약 30년간 ‘인간을 닮지 않았다’고 평가받던 인공신경망의 문제를 해결하면서 세계는 본격적인 딥러닝(Deep Running) 시대를 맞이하게 됩니다.



딥러닝 방식은 크게 CNN, RNN, GAN 등 세가지로 나뉩니다. 먼저 CNN(Convolution Neural Networks, 합성곱 신경망) 방식은 추출과 분류 기능이 뛰어나 문장분류, 얼굴인식 등에 사용됩니다. 예를 들어 어떠한 이미지가 주어졌을 때 이것이 새인지 아닌지 결정할 수 있는 모델을 만들고 싶을 때는 새의 특정 부분들(부리, 날개)를 결정 단서로 활용할 수 있습니다. CNN을 사용하면 새의 특정 부분만 잘라서 효율적으로 보여주므로 새의 전체 사진을 확인하지 않아도 파악할 수 있습니다.


반면 RNN(Recurrent Neural Network, 순환신경망)은 기존의 뉴럴 네트워크와 달리 기억을 갖고 있습니다. 즉, 새로운 입력이 들어올 때마다 네트워크가 남아 있던 자신의 기억을 조금씩 수정할 수 있습니다. 따라서 최종입력을 처리하고 난 후 네트워크의 기억은 그동안의 시퀀스 전체를 요약할 수 있는 정보가 됩니다. RNN은 반복적인 학습에 특화되어 있으며, 현재 네이버, 구글 등의 차세대 음성인식/번역 기능에 사용되고 있습니다.


마지막으로 GAN(Generative Adversarial Network, 생성적 적대 신경망)은 2014년에 이안 굿 펠로우(Ian. j. Good fellow)에 의해 발표된 방식입니다. 이 방식은 위조화폐 제작자와 경찰 등 완전히 다른 두개의 모델이 서로의 데이터를 학습하는 시스템에 의해 구현됩니다. 우버 출신 소프트웨어 엔지니어인 필립 왕(Phillip Wang)은 GAN을 홍보하기 위해 인간같이 생겼지만 실제로는 존재하지 않는 사람의 얼굴을 만들어내는 사이트 thispersondoesnotexist.com을 선보이기도 했습니다.


인공지능, 소재 연구에도 활용


신경망 방식을 활용한 연구들은 소재 분야에도 빠르게 적용되고 있습니다. 예를 들어 기존의 촉매 연구는 재료 후보, 화학반응 결과, 경로 등 변수가 너무나 다양해 실제로 모든 경우의 실험을 시행하는 것이 매우 힘들었는데요. 촉매 개발/연구에 인공신경망 방식을 도입하게 되면서 인류는 전혀 학습된 적이 없는 내용도 예측할 수 있게 됐습니다. 지난 2015년 미국 버지니아 공대가 발표한 이산화탄소 환원용 합금 촉매 개발 사례가 대표적인 사례죠.


강도 등의 소재의 다양한 특성을 평가하는데도 사용될 수 있습니다. 미국의 텍사스 휴스턴 대학팀은 2015년 초고강도 신소재를 얻는 실험에 기계학습을 적용했습니다. 연구팀은 약 2,500여개의 재료를 샘플링해 학습모델을 개발해, 약 12만개의 화학 결합물에 적용했죠. 그 결과 일정 기준을 충족하여 테스트해야 하는 재료만을 선정했고, 결론적으로는 단 두 종류의 카바이드(carbide) 재료를 찾는데 성공했습니다. 이러한 연구 사례 역시 실제 시험만으로는 결과를 모두 확인하는 것조차 불가능했을 것입니다.



세계 소재-인공지능 연구 동향



기존의 계산과학은 소재의 조성과 원자 구조를 양자역학, 고전역학, 통계역학을 통해 물성을 예측했습니다. 반면 인공지능은 소재 데이터베이스에서 정보와 물성 간의 상관관계를 찾아내 소재의 새로운 물성을 예측하죠. 계산과학에 비하면 획기적인 발전이지만 여전히 시행착오에 기반해 원하는 물성이 나올 때까지 소재를 바꿔가며 활용하는 수준에 머물고 있습니다.


최근에는 단순한 정보 수집에 그치지 않고, 데이터베이스 내에 존재하지 않는 물질의 물성을 먼저 예측해 결론적으로는 연구자들이 원하는 소재를 찾아주는 ‘역방향’ 소재설계가 등장해 각광받고 있습니다. 미국의 Citrine Materials-Data Analytics가 대표적인 역방향 소재설계 플랫폼입니다.


국가 차원에서는 미국이 가장 앞서 인공지능을 소재 연구에 도입했습니다. 2011년 오바마 정부는 계산과학을 중심의 소재개발 프로젝트 ‘MGI(소재 게놈 이니셔티브, Materials Genome Initiative)를 추진 방침을 공표했습니다다. 현재 미국은 MGI 프로젝트를 기반으로 국방, 항공, 교통, 이동통신, 나노기술, 바이오기술 등 다양한 산업 분야에 필요한 재료를 개발인 것으로 알려져 있죠. MGI 프로젝트의 핵심은 방대한 연구 데이터 등을 모아 합금, 복합, 나노 구조 재료 등 소재 디자인 과정의 시행착오를 줄여 나가는 것입니다.



한편 일본은 2015년 NIMS(물질재료연구기구)를 중심으로 MI2I(「Materials research by Information Integration」Initiative) 사업을 시작하고 추진중입니다. 특히 일본 주요 화학 기업인 DIC와 JSR 등은 MI2I 사업을 계기로 이미 디스플레이용 재료 개발에 인공지능 기술을 활용하고 있습니다. 지난해 6월에는 미츠비시 머티리얼 주식회사(MMC)와 정보통합재료개발센터 설립에 관한 MOU를 체결하고 2025년까지 비철 금속, 박막 재료, 무기 유기 복합 재료 등을 대상으로 하는 시스템을 구축할 방침입니다.


독일 연방교육연구부(BMBF) 역시 2015년부터 재료의 연구개발 및 제품공정의 전 과정을 지원하기 위한 프로그램 ‘재료에서 혁신으로(Vom Material zur Innovation)’를 추진중입니다. 독일의 경우 재료기술의 개발주기가 최소 10년인데다 연구결과가 제조의 혁신에 연계되는 시간을 고려해 장기적 인 관점으로 정책 과제를 추진하고 있죠. 이러한 노력을 통해 유사한 재료 그룹의 활용가능성을 제고할 것으로 보입니다.


특히 지난 2018년 독일의 Fritz-Haber 연구소 소속 연구팀은 (이미지 분석 및 구분에 특화된) CNN 방식으로 소재의 회절패턴과 결정구조 사이의 상관관계를 구분하는데 성공하면서 소재 인공지능 연구 발전에 기여하는데 성공했습니다. 연구팀이 개발한 알고리즘은 결함이 많은 소재에도 적용이 가능할 것으로 보여 활용도가 매우 클 것으로 보입니다. 향후 독일은 새로운 첨단기술 전략(New High-tech Strategy)의 일환으로 2025년까지 연간 1억 유로를 투자할 예정입니다.


국내 소재-인공지능 지원사업(데이터 분야) 현황


소재 분야 연구를 혁신하기 위해서는 알고리즘 학습 방식만큼 다양한 양질의 소재정보를 수집하는 것이 중요한데요. 이를 위해서는 소재 관련 플랫폼을 설계하고 나아가 운용 기술을 지속적으로 개발할 필요가 있습니다. 또한 데이터 소유자에게 공유에 따른 혜택을 부여하는 등의 다양한 제도적 지원도 마련되어야겠죠. 최근 소재 데이터의 중요성에 비해 상대적으로 취약했던 인프라 문제가 대두되면서 관련 국가/기관 단위로 다양한 사업들이 진행되고 있습니다.


과학기술정보통신부는 2015년 미래창조과학부(현 과학기술정보통신부)는 ‘창의소재 디스커버리 사업’ 시행안을 발표했습니다. 작년 일본 수출 규제 조치 이후 소개 개발 중요성이 부각되면서 당초 일몰 년도보다 사업기간이 연장되기도 했습니다다. 지난해 10월에는 제5차 소재/부품/장비(소부장) 경쟁력 강화위원회를 열고 ‘데이터 기반 소재 연구 혁신 허브 구축활용 방안’을 추진하겠다고 발표하고 국가적 지원을 지속할 방침입니다.


기관들의 활약도 눈에 띕니다. 한국과학기술연구원(KIST)은 현재 데이터 기반의 연구개발에 R&D 빅데이터 등을 이용할 수 있는 인프라 사업을 진행중입니다. 특히 특성분석센터 및 나노입자 설계 플랫폼을 중심으로 ‘KiRI Note’을 구축하는데 성공하면서 실험연구 과정 데이터를 간편하게 보관할 수 있게 되었습니다. 한국화학연구원(KRICT)은 연구데이터를 수집하고 활용할 수 있는 화학데이터 플랫폼 구축 사업을 시작해 작년부터 기관에서 수행중인 ‘유기태양 전지 연구’ 데이터를 수집하는 등 자체 DB를 구축하고 있습니다.


대기업의 경우 LG 화학, 삼성 SDI 등이 리튬 이차전지 전극 소재 및 전해질 첨가제 등 일부 공정 과정에 자체 DB를 활용하고 있는 것으로 알려져 있습니다. 특히 LG의 경우 최근 친환경 촉매, 차세대 소재 등 화학소재 개발을 두고 캐나다의 토론토대학교, 맥마스터 대학교, 프랑스 에너지 석유회사 ‘토탈(Total)’과 AI 기반 소재 개발 컨소시엄(A3MD, The Alliance for Al-Accelerated Materials Discovery)를 결성해 공동연구를 추진하는 등 소재 DB 구축에 적극적인 행보를 보이고 있죠.


한국은 선진국들보다 관련 사업을 늦게 시작해 소재 산업에서 즉시 활용 가능한 데이터의 확보는 아직 어려운 상황입니다. 하지만 소재 연구에 인공지능이 적용되기 시작하는 시점에 양질의 데이터베이스를 독자적으로 구축하는데 성공한다면, 해당 팀(국가)이 향후의 소재 연구를 선점하게 될 것입니다. 한국은 산업 구조 특성상 플라스틱 복합수지, 코팅소재, 점·접착소재 등의 배합소재 제품 개발과정에 인공지능을 적용하는 것이 유리할 것으로 전망됩니다.


근대 화학이 발전하기 시작한 200년 동안 인류는 유기 분자 합성을 통해 다양한 의약품 및 합성 섬유를 개발해 왔습니다. 과학자들은 각자의 연구는 기억할 수 있었지만, 서로가 지닌 방대한 데이터(정보)를 모두 파악하는 것은 어려웠는데요. 소재 연구개발에 인공지능이 성공적으로 접목된다면 실험의 시행 착오를 줄이는 동시에 최소한의 실험으로 원하는 물성을 가진 소재를 개발할 수 있게 될 것입니다.


구독자 12
매거진의 이전글 배터리, 충전 가능한 세상을 열다
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari