AI로봇실험실에 대하여
AI와 로봇이 스스로 소재를 개발한다고?
제가 처음 이 연구를 보았을 때, 충격 그 자체였습니다. 저는 응용화학과를 졸업을 하였고, 화학실험을 굉장히 많이 접하는 과였기에 사람이 직접 실험을 설계하고, 사람이 직접 실험을 수행을 하였습니다. 이런 방식으로 회사나 학교, 연구소에서도 진행이 되고 있다는 것은 모두가 잘 알고 있는 사실일겁니다. 근데, AI가 실험을 설계하고 로봇이 실험을 한다니... 이게 가능이나 한 것일까요? 모두들 AI와 로봇이 소재에 대해서 뭘 안다고 스스로 개발한다고, 무슨 뚱딴지 같은 소리냐고 할 것이지만, 이 뚱딴지 같다고 하는 소리가 실제로 전세계적으로 진행되고 있다는 것입니다. 아래에 영상을 보면 아마 직관적으로 이해하기 쉽습니다.
https://www.youtube.com/watch?v=WBwZp5Bg2L8
위의 연구는 수소 발생 반응 (Hydrogen Evolution Reaction)을 최대로 하는 촉매의 최적의 조건을 찾고자하였습니다. 영상을 보면 촉매의 최적 조건을 찾기 위해 로봇이 꽤나 정교하게 바이알을 옮기고, 용액을 주입 받고 하는 것을 볼 수 있습니다. 현재의 기술력으로는 사람이 하던 실험 과정들을 로봇이 어느정도 가능하다는 것을 알 수 있는데요. 저희는 이렇게 로봇이 실험을 수행하고 AI가 실험을 설계하는 이 시스템을
AI로봇실험실
이라고 부릅니다.
그럼 이제, AI로봇실험실이 어떤 시스템으로 구성이 되어 소재 개발을 하는지에 대해서 알아야합니다. 그 설명은 아래의 그림을 보시면 됩니다.
AI로봇실험실은 크게 하드웨어와 소프트웨어로 구성이 됩니다. 하드웨어는 로봇팔처럼 실제로 실험을 수행하는 역할입니다. 또한, 소프트웨어는 실험을 설계하고, 설계한 실험 과정대로 하드웨어에 연결해주는 역할을 수행합니다. 이렇게 하드웨어와 소프트웨어가 위의 그림처럼 closed-loop system (한국말로는 폐루프 시스템이라고는 하는데... 어감이 좀 이상하다)을 토대로 소재 개발을 진행합니다. 초기에 연구자가 공정 변수들의 범위를 정해주면, 로봇이 직접 실험을 하여 촉매의 성능 측정을 하고, AI는 정해진 범위 안에서 촉매의 성능을 최대화하는 최적의 조건을 찾기 위해 실험 설계를 진행합니다. control software는 AI가 설계한 실험 공정대로 로봇에게 할당을 해줍니다. 이러한 과정은 최대 성능이 나올때까지 계속 반복합니다.
말이 좀 어렵지만, 간단하게 말씀드리면 AI로봇실험실은
(인간의 개입 없이) AI가 실험을 설계하고, 로봇이 실험을 수행하며,
내가 원하는 소재를 찾을 때 까지 해당 과정을 계속~ 반복한다.
라고 보시면 됩니다. 마치 자율주행 자동차처럼 목적지만 설정해주면 AI와 로봇이 실험 설계와 실험 수행을 반복하면서 인간의 개입 없이 알아서 찾아가는 시스템인 것입니다.
그럼 과연, AI로봇실험실이 실제로 소재개발을 잘 수행할 수 있을까요? 기존의 연구자들을 설득하기 위해서는 해당 물음에 대한 답을 해야하겠죠?
실제로 위의 논문에서 한 공정변수당 10칸 정도로 나눴서 공정변수를 변화할 수 있도록 하였습니다. 예를 들어, 용액의 부피를 바꿀 수 있는 범위가 0mL~5mL라면 0, 0.5, 1.0, 1.5, 2.0, 2.5, 3.0, 3.5, 4.0, 4.5, 5.0mL 이런식으로 바꿀 수 있게 한겁니다. 그렇게 10개의 공정변수를 AI가 바꿔가며 최적의 조건을 찾으려했는데, 이를 모두 실험한다고 가정하면 경우의 수는 10의 10 제곱일 겁니다. 이 모든 실험을 다 할 수는 없습니다. 이 실험을 모두 다하려면 로봇으로 진행해도 6,151,457일이 걸린다고 논문에서 제시하고 있습니다. 약 16,853년 정도 걸리니 얼마나 오래걸리는지 알 수 있습니다.
이렇게 오래 걸리는 실험들 중, 분명 불필요한 실험들도 있을 겁니다. 그래서 해당 연구에서 AI와 로봇을 기반으로 실험을 진행하니, 688번만에 최적의 조건을 찾을 수 있었고 8일 정도만에 찾았다고 보고하였습니다. 실험횟수를 굉장히 적게 들였음에도 시간적으로도 굉장히 빠르게 소재를 찾을 수 있었고, 시료를 적게 사용함으로써 공정 비용 관점에서도 효율적인 방법이라는 것을 해당 연구를 통해서 알 수 있습니다.
실제로 AI로봇실험실은 정말 다양한 연구분야에 적용되고 있고, 유명한 저널에 계속해서 보고가 되고 있습니다. 그만큼 AI로봇실험실의 시스템을 어느정도 구축할 수 있다면, 다양한 연구 분야에 적용되어 소재 개발이 더 가속화될 것으로 보여집니다.
그럼 이러한 AI로봇실험실이 대한민국 R&D에 굳이 왜 필요할까요?
저는 다른 어느 나라들보다 대한민국에서 꼭 필요한 시스템이라고 생각이 됩니다.
우리나라는 지형적, 국가적 시스템 특성 상 가공 및 제조업 같은 산업이 많이 발달되어있어 응용분야 연구는 활발하지만, 기초 연구에 대한 투자가 매우 부족합니다. 따라서 소재 개발 쪽에 대한 기반 기술이 매우 부족하여 정량적으로, 그리고 지속적으로 많은 금액을 투자 해야하는데, 기존의 소재 개발 방법으로는 인력 및 연구비가 천문학적으로 많이 들 수 밖에 없습니다.
실제로 우리나라의 2022년 예산을 보면, 단 5%만 과학기술 R&D에 투자합니다. 저는 대한민국 예산 중 과학기술 R&D에 상대적으로 굉장히 적은 금액을 쓴다고 생각합니다. 또한, 이 과학기술 R&D라는 것은 과학기술 모든 분야에 해당하므로, 소재개발에 투자되는 돈은 훨씬 적습니다. 모든 과학기술들은 기초과학을 기반으로 진행되는데, 참으로 안타까운 현실입니다...
(나중에 대한민국의 R&D 투자에 대한 안일함에 대해서 한 번 포스팅 해보겠습니다)
또한, 천조국이라고 불리우는 미국의 연구소들과 우리나라에서 가장 기술력이 앞선다는 KIST와 비교를 해보았습니다. 실제로 가장 예산이 적은 Brookhaven NLL도 KIST에 비해 2배가 넘는 금액을 운용하고 있습니다. 심지어 LLNL (Lawrence Livermore National Lab)에 경우는 KIST에 10배에 해당하는 금액을 운용하고 있습니다. 물론, R&D의 질이 돈과 인과관계가 있다고는 생각하지 않습니다. 저 역시 대한민국 R&D에 종사하면서, 대한민국 R&D 종사자분들께서 열약한 R&D 환경에서도 좋은 연구결과들을 내시는 것을 보면 존경스럽습니다. 하지만 R&D의 질과 돈은 상관관계는 어느정도 있다고 생각합니다. (이 글을 보시는 R&D 종사자 분들이 계신다면, 댓글 부탁드립니다)
우리나라의 인구절벽 문제는 사회적으로도 아주 심각합니다. 이미 2020년도에 인구 첫 감소가 시작되었고, 앞으로 인구 감소는 가속화될 것으로 전문가들은 전망하고 있습니다. 절대적인 인구 감소로 인하여 급감하는 대학원 진학률 뿐만 아니라 대한민국의 R&D 종사자들에 대한 소극적인 처우 개선, 불안정한 미래 등등에 의하여 의대, 치대, 약대 등 전문직으로 20-30대가 대거 몰리면서 이학, 공학계열 대학원 진학률 또한 급감하고 있습니다. 그나마 과학기술이 먹여살렸던 대한민국이 과학기술의 인재 유출로 인하여 위기를 맞고 있다고 생각합니다.
위의 2가지만 보더라도
대한민국은 재원과 인력을 아끼면서 소재를 개발할 수 있는
매우 효율적인 방법을 필연적으로 선택해야합니다.
따라서 실험횟수와 실험시간 측면에서 소재 개발을 빠른 시간안에 효율적인 방법으로 연구할 수 있는 시스템 구축이 굉장히 중요하고, 저는 AI로봇실험실이 이에 대한 해답이 될 것이라고 생각합니다.
그럼 과연 AI로봇실험실이 어떤 미래를 우리에게 보여줄까요?
위의 연구에서도 제시한것 처럼, 소재는 산업에서 쓰이는 분야, 사용자의 요구사항마다 원하는 소재의 물성이 다를 것입니다. 어떤 사람은 촉매의 성능이 100을 바랄 것이고, 어떤 사람은 촉매의 성능이 80정도여도 안정성이 100인 촉매를 원하기도 합니다. 또한, 고분자를 생성할 때 어떤 현장에서는 열적 안정성을 중시하기도 하고, 어떤 현장에서는 열적 안정성보다는 가격을 중시할 수 있습니다. 이런식으로 사용자들이 원하는 물성에 맞추기 위해서 불필요한 실험들을 많이 하다보면, 이는 cost가 너무 크다고 볼 수 있습니다. AI로봇실험실은 원하는 물성을 찾기 위해 실험횟수를 적게하면서 빠르게 소재를 개발할 수 있습니다.
머신러닝 및 딥러닝의 발전에 따라 산업과 생활 속에 적용되면서 빅데이터에 대한 관심이 크게 증가하였습니다. 어떤 분야던 빅데이터를 구축한 후, 그 속에서 새롭고 효용성 있는 가치를 도출하는 것이 굉장히 중요하다고 볼 수 있습니다. 이에 따라 재료과학 분야에서도 빅데이터 규모의 데이터베이스가 구축이 되어있다 data-driven 실험 설계가 가능하고, 실제로 소재 개발을 가속화 할 수 있습니다.
하지만, 다른 분야에 비해 현재 재료과학 분야에서는 빅데이터 규모의 구축된 소재 정보 관련 데이터베이스가 거의 없습니다. 실제 실험에 관련된 소재 정보들이 구축된 경우는 아직 존재하지 않고, 이 마저도 계산과학 기반의 데이터베이스는 존재하지만, 아직 계산과학과 실험과의 괴리감이 존재하기 때문에 계산과학 기반으로 구축된 데이터베이스에서 실험을 설계하더라도 좋은 결과가 잘 나오지 않습니다.
결국, 실제 실험실 환경에서 일관되게 소재 관련 데이터를 양산을 해야하는데, 빅데이터 규모의 소재 데이터를 양산을 연구자가 직접하기에는 굉장히 많은 시간을 요구하게 됩니다. 따라서 실험을 빠른 시간안에 할수 있는 시스템이 필요하며, AI로봇실험실에서는 소재 데이터 양산이 가능합니다.
특정 물성을 찾기 위해 실험을 진행하고, 진행한 소재 공정 및 결과 데이터를 데이터베이스에 구축한다면, 소재 연구자들은 빅데이터를 기반으로 여러가지 머신러닝 및 딥러닝 모델을 설계하여 부가적인 소재 개발을 진행할 수 있게 됩니다.
저는 대학원을 진학할 때,
"내가 개발한 기술이 대한민국을 한 단계 올려줄 수 있는 발판이 되었으면 한다."
라는 생각을 가지고 입학을 하였습니다. 다들 비웃을 수도 있지만, 저는 정말로 대한민국이 부국강병 했으면 합니다. 그렇기 때문에 더 현실적으로, 더 비판적으로 대한민국을 바라보고 있습니다.
그런 관점에서, AI로봇실험실은 대한민국에 정말 필요한 R&D 기술이라고 생각합니다. 아직 한창 연구가 더 진행되어야하는 분야고, 여러가지를 같이 공부하다보니 힘에 많이 부치기도 합니다. 그럼에도 이렇게 힘들고 바쁜 와중에 제가 AI로봇실험실에 대해서 이야기 하는 이유는, 일반 사람들 사이에서 AI로봇실험실에 대해 "안줏거리" 로 오르내렸으면 좋겠습니다.
저는 과학계가 부흥하려면 과학계에 몸 담고 있지 않은 사람들과 많은 접촉을 해야한다고 생각합니다. 단순히 과학하는 사람들끼리 성벽을 세우고 자신들만의 리그를 하는 것이 아니라, 사람들과 수 많은 접촉을 통해 어려운 과학을 우리 생활에서 맴돌게 하는 이야깃거리로 만들어야 한다고 생각합니다.
그렇기 때문에 제가 오늘 이 게시글을 적었고, 앞으로도 적을 예정입니다.