자연과학은 자연 현상을 연구하는 학문이며 특히 자연의 법칙에 관한 일정한 이론체계를 연구하는 학문입니다. 자연과학은 크게 수학, 물리, 화학, 생명과학, 지구과학 5가지 학문으로 나눌 수 있습니다. 이 5가지 각 학문들은 학교의 시간표처럼 각각 독립되어 혼자만의 세계를 펼쳐나가는 것처럼 보입니다. 따라서 “저는 화학이 싫어서 수학과를 택했어요.” 라고 하기도 하고 반대로 “물리나 수학처럼 복잡한 계산이 싫어요. 차라리 지구과학을 택할래요.”라며 선택과목을 고르는 학생들도 종종 있습니다.
그런데 우리가 살고 있는 자연에서 일어나는 현상은 매우 다양합니다. 눈에 보이거나 보이지 않는 움직임이나 움직임에 관여하는 힘, 에너지 등도 있고 물질의 성질과 변환도 자연현상의 일부입니다. 생명과 관계되는 다양한 현상, 성질, 눈에 보이지 않는 미생물 등에 관해 연구를 할 수도 있고, 우리가 살아가고 있는 환경, 지구, 우주 등에 관해 연구할 수도 있죠. 자연 현상을 연구하다 보면 규칙이나 패턴이 발견되는데 이 때는 수학이라는 도구가 사용됩니다.
따라서 한걸음 물러나 살펴보면 어느 것 하나 독립적으로 설명할 수 있는 학문은 없습니다. 화학 현상에 대해 설명을 하려면 물리적인 지식이 반드시 필요하고, 생명체 세포 내의 화학적 반응을 살펴보려면 생명과학과 화학이 모두 필요합니다. 천체의 운동은 물리적 지식이 없이는 설명이 불가능하고, 지구 상에서 살아가는 생명체를 이해하기 위해서는 기후와 환경, 지질학을 포함한 지구과학에 대한 이해도 반드시 필요합니다. 게다가 수학은 이 모든 현상을 표현하고 기록하는 하나의 언어이자 다양한 수학적 지식으로 문제를 해결하는 커다란 도구 상자입니다. 즉 자연과학은 독자적인 부분이 있지만 늘 다른 분야와 함께 어우러져 융합하고, 소통하는 학문입니다.
반도체에 활용되는 자연과학 분야들
예를 들어 전자제품을 만들 때 매우 중요한 역할을 하고 있는 반도체에 대해서 생각해봅시다. 반도체는 전자 제품에 사용되므로 물리학의 전자기학과는 뗄 수 없는 관계입니다. 반면 반도체의 소재와 특성을 이해하기 위해서는 화학 지식이 필요합니다. 반도체 설계에는 회로 이론이 필요한데 여기에는 수학의 미분 방정식이 사용됩니다. 특히 회로 이론 중 신호 해석 분야에서는 수학의 푸리에 급수가 핵심 역할을 하기도 합니다. 또한 반도체를 만드는데 다양한 광물질이 사용됩니다. 희토류라고 불리는 원소 금속들은 안정적이고 화학적인 성질이 가공에 적합하기 때문에 반도체 산업에 중요한 원자재로 이용되고 있습니다. 그러나 채굴과 정제, 가공 과정에서 환경을 많이 오염시키고 비용도 많이 들며 매장량도 제한적이고 편중되어 있기 때문에 대체를 위한 신소재 개발에 대한 연구도 진행 중입니다. 즉 반도체는 다양한 학문에 연계되어있는 분야입니다. 즉 자연과학의 어떠한 전공을 해도 반도체와 관련된 연구 분야를 찾을 수 있습니다.
자연 과학 분야 중에서 수학은 인공 신경망을 비롯한 인공지능의 시작부터 함께 해왔습니다. 수학을 제외한 다른 자연과학 분야에서는 최근 가상 실험, 예측, 데이터 분석 등에서 인공지능을 활용하고 있습니다. 물리학에서는 인공지능을 활용해 이론 물리학의 난제들을 해결하고 있는데, 2020년 오키나와 과학기술 대학원(OIST)은 국제 학술지 PRB(Physical Review B)에 머신러닝을 활용해 난제 중의 하나였던 자석의 스핀 현상 분석을 머신러닝을 통해 해결한 논문을 발표했습니다. 예전에는 자연 상태의 광물인 파이로클로르가 주변 온도에 따라 달라지는 스핀 현상을 관찰한 후 상태 다이어그램을 사람이 직접 작성해왔습니다. 그런데 이 작업은 제작에만 약 6년의 시간이 소요되는 매우 고된 작업입니다. 그러나 OIST는 뮌헨 대학의 머신러닝 모델을 활용해서 다이어그램 작성을 불과 몇 주만에 완료했습니다.
화학 분야에서도 인공지능을 활용해 실험을 가상으로 진행하고 결과를 예측하는 사례가 늘어나고 있습니다. 2021년 2월 한국 화학연구원 연구팀은 머신러닝 알고리즘을 이용해 온실가스를 에틸렌으로 바꾸는 연구를 가상으로 진행한 결과 이전보다 수율을 10% 이상 높였다고 밝혔습니다. 실험자료 250개를 수집한 후 1000도가 넘는 고온, 가스 속도, 압력, 반응기 구조를 미세하게 변경하며 컴퓨터로 1만 번 이상 가상 실험을 수행했습니다. 그 결과를 인공 꿀벌 알고리즘(ABC)에 적용시켜 기존보다 높은 수율을 얻을 수 있었습니다.
ChemAI에서 사용하는 인공지능 알고리즘. (이미지 출처 : ChemAI)
한국 화학 연구원은 지난 2021년 8월 화학 분야에 특화된 인공지능 온라인 플랫폼 ChemAI를 구축했습니다. ChemAI는 인공지능을 활용하고 싶지만 화학 물질의 구조 처리를 위한 코딩이나 인공지능 모델의 구축이 어려운 화학자들이 쉽게 인공지능 알고리즘을 사용할 수 있도록 설계된 플랫폼입니다. 이 시스템에는 16가지의 알고리즘이 있는데 실험하려는 화학 데이터의 특성에 따라 인공지능이 적절한 알고리즘을 추천해줍니다. 화학 데이터들의 상호 관계를 알고리즘에 학습시킨 후 합성하려는 가상의 물질의 특성을 실제 실험이 없이 예측을 할 수 있습니다.
2019년에는 서울시립대 최진희 교수가 화학 물질의 흡입 독성 평가에 인공지능을 활용해 동물 실험을 최소화하는 실험 방법을 발표했습니다. 최진희 교수는 독성 데이터베이스의 자료와 미국 환경 보호국의 ‘톡스 캐스트'를 딥러닝에 적용해 동물 실험을 최소화하는 흡입 독성 평가 방법을 발표했습니다. 연구팀은 유해성이 있는 654개를 선별하고 독성 발현 경로와 관련한 25개의 독성 데이터를 딥러닝에 적용해 독성 예측 모델을 만든 결과 10여 개의 흡입독성 유발 물질을 선별하는 데 성공했습니다. 비록 실제 독성을 유발하는지 동물 실험을 통해 최종 검증을 해야 하지만 최종 검증에 이르기까지 거쳐야 했던 많은 단계의 동물 실험을 줄이면서 동물 윤리, 시간, 경제적 비용의 효율화에 큰 역할을 했다는 평가를 받고 있습니다.
생명과학에서는 분석 기술이 발달하면서 데이터의 양이 빠른 속도로 증가하고 있습니다. 그만큼 빠른 분석을 하기 위한 새로운 방법들이 개발되고 있는데, KAIST 초세대 협업 연구실 공동연구팀은 2019년 인공지능 딥러닝 기술을 이용해 효소의 기능을 신속하고 정확하게 예측할 수 있는 컴퓨터 방법론 DeepEC를 개발했습니다. 세포의 생화학적인 반응을 촉진하는 단백질인 효소 기능을 파악한다는 것은 세포의 대사 과정을 이해하는 것으로 연결됩니다. 따라서 효소를 이해하고 반응을 예측하는 것은 생명 과학, 의학 등에서 매우 중요한 과정입니다. DeepEC 알고리즘을 통해 효소 단백질 서열의 EC 번호(Enzyme commission number, 효소 번호)를 분석하여 특정 효소가 어떠한 생화학적 반응을 일으키는지 빠르고 정확하게 예측할 수 있습니다.
핑크바이너 박사팀의 뉴런 세포가 예측된 형광 레이블과 중첩된 사진 (이미지 출처 : gladstone.org)
딥러닝의 이미지 인식 기능도 생명과학에서 활용되고 있습니다. 생명과학자들은 많은 연구를 현미경을 관찰하면서 진행하고 있지만 생물학의 표본들은 대부분 물로 이루어져 있기 때문에 필요한 요소를 찾는데 어려움을 많이 겪었습니다. 인간의 눈으로 발견하기 어려운 특성을 관찰하기 위해 세표에 형광 표지를 덧붙이는 방법을 개발했지만 연구하려는 세포를 죽이기 위한 시간이 걸리는 단점이 존재했습니다. 그러나 미국 샌프란시스코의 글래드스톤 생의학 연구소의 핑크바이너 박사는 2018년 딥러닝을 활용해 세포 이미지에서 특징을 찾고 예측하는 방법을 개발했습니다. 인간이 일반적으로 80% 정도의 죽은 세포를 식별해내는 반면 핑크바이너 박사의 알고리즘은 98%의 정확도를 보였습니다. 2021년 6월 포스텍과 한국 재료 연구원은 공동 연구를 통해 주사 전자 현미경의 시스템에 인공지능을 도입하여 이미지를 판별하고 향상하는 기술을 개발하기도 했습니다.
지구과학 분야에서도 딥러닝을 활용하여 지질, 천문 분야의 연구를 진행하고 있습니다. 구글과 하버드 대학 연구팀이 지난 2019년 여진의 발생 위치를 인공지능으로 예측하는 기술을 발표했습니다. 지진이 발생하고 나면 여진이 뒤따르는데 응급 구조대와 비상 통신국 등을 세울 때 여진이 발생하면 큰 어려움이 따릅니다. 연구팀은 13만 건의 지진 데이터를 수집한 뒤 본진이 발생한 구역을 격자무늬로 가상공간으로 나누어 여진 발생의 패턴을 학습시켰습니다. 그 결과 기존의 여진 예측 프로그램보다 높은 예측도를 기록했습니다. 비록 예측률이 아직은 낮은 단계이기 때문에 실용화하긴 어렵지만 지구과학의 인공지능 예측 사례라고 할 수 있습니다.
인공지능은 천문 데이터를 분석해 행성을 발견하기도 합니다. (이미지 출처 : 셔터 스톡)
인공지능은 천문학에도 유용하게 활용됩니다. 폭스뉴스는 지난 2020년 9월, 영국의 워랜대학교 연구진들은 NASA의 오래된 데이터를 인공지능으로 학습한 결과 50개의 외계행성을 추가로 발견했다고 발표했습니다. 이전에도 NASA에서는 데이터를 활용한 연구를 많이 진행했지만 데이터가 워낙 방대하기 때문에 다 살펴보지 못하거나 누락한 경우도 있었습니다. 천체 데이터에 인공지능을 도입하는 시도가 아직은 걸음마 단계이기 때문에 앞으로 알고리즘이 개선되면서 더 많은 성과가 나타날 것으로 기대하고 있습니다.