brunch

You can make anything
by writing

C.S.Lewis

by 권석준 Seok Joon Kwon Dec 03. 2024

블랙홀의 그림자

과학 연구가 발전하는 과정: 의심과 확인의 필요성

만약 사실로 드러난다면 흠좀무스러운 일이 천문학계에서 생기고 있습니다. 그것은 2022년, 인류가 최초*로 촬영(?)하는 데 성공한 우리 은하 중심의 블랙홀 이미지 (더 정확히는 Sagittarius A* 블랙홀의 shadow 이미지)가 이미지 처리 과정에서 왜곡된, 그래서 실제와는 거리가 먼, 이미지일 수 있다는 이야기입니다. 물론 이 과정은 우리가 전형적으로 과학의 연구 과정에서 볼 수 있는 새로운 사실/관측 보고-반박-재반박-현 체계로의 편입/퇴출의 과정에 해당하는 것이기에, 이 사안에만 딱히 더 특별한 일도 아닙니다.

(*사실 최초로 촬영에 성공한 블랙홀 shadow는 우리 은하 중심의 블랙홀은 아니고 2019년에 촬영에 성공한 M87 은하 중심에 있는 블랙홀 shadow입니다.) 


물론 정말 블랙홀 이미징 과정에서 편향된 AI 알고리듬의 영향으로 이미징이 왜곡되었다고 해서 그것이 블랙홀이 존재하지 않는다는 증거가 되는 것은 아닙니다. 이미 블랙홀은 있을 수밖에 없다는 다양한 증거는 차고 넘치니까요. 그러나 아마도 어쩌면 21세기 들어 인류 최대의 과학 업적 중 하나로 기록될 수 있는 이 거대한 글로벌 스케일의 이미징 작업이 알고 보니 학습 알고리듬의 편향으로 생긴 억지에 가까운 것이었다고 판명되면 정말 허무할 것 같습니다.


사실 AI 알고리듬 중에서 확산(diffusion) 방식에 의해 생성되는 최근의 이미징 알고리듬은 단순히 이미지 처리나 분석을 넘어, 새로운 정보를 꽤 높은 확률로 자연스럽게(?) 만들어내기 때문에 달리 같은 앱에서 빠르게 이미지를 만들어내는 엔진 역할을 합니다. 물론 높은 확률이라고 해서 그것이 생성된 이미지의 정확도를 모두 보장해 주는 것은 아닙니다. 다만 일상생활에서 그저 소비하기 위한 용도의 이미지라면 정확도 등은 별로 문제 될 것이 없으니 그저 자연스럽게 보이기만 하면 될 것입니다.


그렇지만 과학에서 활용되는 이미지는 전혀 다릅니다. 인간이 아무리 다양한 방법으로 실험 데이터를 얻는다고 해도, seeing is believing이라고, 사실 이미지만큼 가장 강력한 인상과 확신을 주는 데이터는 찾기 어렵습니다. 아주 작은 스케일에서는 전자현미경이나 원자현미경이 그런 역할을 하고, 아주 큰 스케일에서는 천체망원경이 그런 역할을 하죠. 블랙홀을 직접 촬영하는 것은 어렵지만, 블랙홀 사건의 지평선 근처에서 새어 나오는 빛을 만약 제대로 이미징 할 수 있다면 그것은 과학의 승리라고 해도 과언이 아닐 것이며, 그래서 몇 년 전 지구 전체 스케일의 전파망원경 네트워크 (Event Horizon Telescope Collaboration (EHTC))를 연결하여 데이터를 해석하고 다시 재구축하여 얻어낸 블랙홀 이미징 성과는 21세기 과학 최대의 사건 중 하나라고 여겨질 정도였던 것입니다. (아마도 힉스 보존 존재의 실험적 확정, 중력파의 관측이 이런 대열에 합류..)


그렇지만 일본 국립천문대 소속 마코토 미요시 박사 등이 수행한 최근의 연구**에서는 이러한 이미징 재구축 과정이 상당 부분 artifact, 그러니까 의도적인 조작은 아니었겠지만, 어쨌든 처음부터 결함이 있었던 방법으로 만들어진 결과물이었을 확률이 높다는 주장을 했습니다. 

(**An independent hybrid imaging of Sgr A* from the data in EHT 2017 observations

https://academic.oup.com/mnras/article/534/4/3237/7660988... )


일본의 천문학자들이 이런 주장을 한 것은 단순히 이미징 알고리듬에 편향이 있다는 것을 넘어, 애초부터 EHTC에서 얻어진 이미지의 원본 해상도가 블랙홀 shadow image와 비슷하다는 것에 핵심적 근거를 두고 있습니다. 이는 마치 이렇게 비유할 수 있을 것입니다. 우리가 현미경으로 100 나노미터짜리 어떤 대상을 관찰하고 싶다고 합시다. 그렇지만 광학현미경에서 쓸 수 있는 최소 파장은 대략 360 nm 이므로, 최대 해상력은 대략 120 나노에 불과합니다. 따라서 이 광학현미경으로는 100 나노미터짜리 대상을 제대로 구분할 수 없을 것입니다. 이런 비유를 생각할 수도 있습니다. 이번에는 120 마이크로미터짜리 대상을 광학현미경으로 관측한다고 생각해 봅시다. 그렇다면 이론적 해상도는 120 나노이니까 충분히 관측 가능할지도 모른다고 생각할 것입니다. 그렇지만 문제는 관찰을 넘어, 이미징을 하려면 결국 이미지를 픽셀로 변환하는 digitalization 과정이 필요하다는 것입니다. 예를 들어 가로세로 대략 100-by-100 pixel로 이미지를 얻었다면 한 픽셀 사이즈는 1200 나노미터가 됩니다. 따라서 100 나노미터짜리 대상은 이미 1200 나노미터의 케이지 안에 갇혀 뭉개지고 알아볼 수 없게 됩니다. 그냥 그 픽셀 전체의 평균 RGB 값으로 환산되어 버리기 때문입니다. 


미요시 박사가 논문에서 주장하면서 지적한 EHTC의 이미징 오류에 대한 내용도 이와 크게 다르지 않습니다. 예를 들어 


The imaging using sparse u-v data requires detailed scrutiny of the PSF. The estimated shadow diameter is equal to the spacing between the main beam and the first sidelobe of the PSF, which immediately suggests a potential problem in the deconvolution of the PSF. 


라고 언급한 부분이 그렇습니다. 어쨌든 연구를 이끈 미요시 박사는 EHTC 팀의 이미징에 PSF(point-spread function) 처리 등의 오류가 있다는 것을 지적하는 것을 넘어, 다시 자신들이 개선시킨 이미징 알고리듬으로 관측 데이터를 재조합하여 이미지를 제시했고, 이 새로운 이미지는 기존의 이미지보다 더 노이즈 비중이 작은 것으로 드러났습니다 (첨부 이미지 참조). 흥미롭게도 미요시 박사팀이 재구축한 이미지는 EHTC 팀의 그 유명한 블랙홀 shadow 이미지와는 달리 그냥 평범해 보이는(?) 구상성단 같은 이미지 같습니다. 내부에 전혀 shadow 같은 이미지 형상이 보이지 않기 때문이죠. 이들이 재구축한 이미지가 사실에 가깝다면, 블랙홀 shadow는 아직 우리가 제대로 관측한 적이 없다는 이야기가 됩니다.


미요시 박사팀이 2024년에 보고한 논문에서 재구축한 궁수자리 (Sagittarius A*) 블랙홀의 shadow 이미지


물론 이들의 연구에 대해 EHTC의 반응이 없는 것은 아닙니다.***

***https://eventhorizontelescope.org/.../response...


EHTC가 미요시 박사팀의 지적에 대해 보인 공식 반응은 미요시 박사팀이 사용한 이미지 재구축 방법론 (예를 들어 이미지 형태의 bias를 주어 ring 구조로 재구축되게 유도한 방법) 자체에도 문제가 많으며 (왜냐하면 EHTC는 그러한 방법론을 쓰지 않았기 때문), 미요시 박사팀이 충분히 많은 데이터를 분석하지 않았고, 미요시 박사팀이 핵심 근거로 활용한 PSF를 EHTC는 사용하지 않았다는 것 등이었습니다. 일견 조목조목 반박을 잘하고 있는 것으로 보이지만, 여전히 블랙홀 shadow 이미지에 정말 artifact가 없는 것일까 하는 의심을 해소시켜 줄 정도로 속 시원한 반응은 아니다는 생각을 지우기는 어려워 보입니다.


물론 EHTC 팀이 활용한 이미징 방법은 언제든 재현 가능하도록 웹에 공개되어 있고, 전파현미경에서 얻은 관측 raw data도 잔뜩 공개되어 있으므로 누구든 이러한 반박-재반박 과정을 자신의 랩에서 재현해 볼 수 있습니다.(물론 충분히 강력한 컴퓨터가 있다는 가정 하에..) 다만 천체물리학의 특성상, 쓸 수 있는 데이터셋이 제한적이고, 이미지나 신호의 재구축 과정에서 정말 말도 못 할 정도로 너무 수학적인 방법론이 동원되기 때문에 이런 재현을 해볼 수 있는 랩은 그렇게 많지는 않을 것입니다.


말이 나왔으니 하는 말이지만, 천체물리학뿐만 아니라, 사실 나노 스케일에서 신소재를 연구하는 수많은 연구 그룹도 이러한 실수를 알게 모르게 많이 저지릅니다. 가장 많이 하는 실수는 이미징 소프트웨어의 노이즈 threshold를 그냥 무지성으로 그대로 받아들여서 쓰는 것인데, 최근의 소프트웨어들은 2020년대 이후 AI기능이 덧붙여져서 노이즈가 잘 처리된 후 보기 좋은(?) 형태로 가공된 이미지가 나오기도 합니다. 그렇지만 그렇게 보기 좋은 이미지가 되는 과정에서 오히려 핵심적인 디테일들이 사라지기도 하고, 혹은 핵심적인 문제가 가려지기도 합니다. 악마.... 아 이게 아니고 진실은 디테일에 있기 때문이죠. 즉, 소프트웨어에 과도하게 의존할 경우, 연구자가 사실 의도하지는 않았더라도 이미지 일부분은 이미지가 조작되고 있는 셈입니다. 연구자도 모르게 말입니다. 이러한 문제가 이미징에만 있는 것도 아닙니다. 제가 제 연구 분야에서 가장 많은 문제를 발견하는 영역은 저차원 반도체 물질에 대한 기초 물리학 연구 등에서 자주 활용되는 SERS(surface enhanced Raman spectroscopy) 같은 표면스펙트로스코피 영역인데, 굉장히 (사실 거의 대부분이라고 해도 과언이 아닐) 많은 연구자들이 이 스펙트로스코피 데이터를 그냥 무지성으로 그대로 씁니다. 신호를 조금이라도 처리하려는 연구자들마저도 수학적 기반, 통계적 근거가 매우 약한 방법론으로 노이즈를 필터링하는데, 그 덕분에 예를 들어 어떤 라만분광신호의 enhacement factor를 측정하는 과정에서는 그 숫자가 10^4에서 10^10으로 널뛰기를 하는 경우가 허다합니다. 그래서 저는 SERS 페이퍼에서 EF가 10^N이라고 하는 경우, 이 N에 대한 통계적 유의성을 제대로 분석하지 않은 연구는 그 내용을 반도 믿지 않습니다. 


아마 EHTC 그룹에서도 외부에서 지속적으로 제기되는 이미징 처리 과정의 오류 가능성 지적을 그냥 넘겨버릴 수는 없을 것입니다. 이와 비슷하게 중력파 관측 그룹인 LIGO에서도 중력파 핵심 시그널이었던 간섭 신호 데이터를 처리하는 과정에서 다양한 신호 처리 알고리듬의 오류 혹은 왜곡 가능성이 지적된 반박 논문들이 나왔었는데, 상당수는 재반박이 가능했지만 여전히 raw data를 처리하는 핵심 알고리즘이 완벽한 것은 아니기 때문에, 그러한 반박을 거쳐 더 정확한 연구 결과를 얻는 성과를 얻기도 합니다. EHTC 그룹도 LIGO 그룹의 사례를 잘 참고하여 외부에서 제기되는 문제를 그냥 넘기지 말고 제대로 조사하고 오류 가능성을 최소화하는 방향으로 이 문제를 해결해야 한다고 생각합니다. 무엇보다도 블랙홀 shadow 이미지를 최초로 확보하고 학계에 보고한 당사자로서, 이러한 연구가 진실에 가깝다는 것을 재확인해줘야 하는 의무가 있으니까요.


가끔 외계 행성 관측 데이터를 얻었다면서 최신 논문 성과를 소개하는 대중 미디어에서 그 행성의 형상을 자세하게 묘사한 이미지를 같이 게재하는 경우가 있습니다. 그런데 사실 생각해 보면 이는 말이 되지 않습니다. 외계 행성은 지구로부터 최소 수십, 수백 광년 떨어진 거리에 있는 작은 행성일 뿐인데, 항성 이미지도 확보하기 어려운 상황에서 광량이 훨씬 부족한 행성 이미지 확보는 더더욱 어려울 테니까 말입니다. 이런 식으로 보도되는 외계 행성의 이미지는 사실 일종의 artistic image일 뿐이지만, 이는 자칫 잘못하면 artifact image 가 되어 사람들에게 혼란을 줄 수 있습니다. 특히 우주를 좋아하는 학생들, 어린아이들은 착각에 빠질 수 있습니다. 그래서 어디까지가 진짜 데이터이고, 어디서부터가 가공된 데이터인지, 그리고 어디부터가 상상의 영역인지를 명확하게 구분하는 것은 정말 중요합니다.


예전에 S모사의 스마트폰이 엄청난 줌 기능을 탑재한 나머지, 무려 달 표면 사진을 촬영할 수 있다고 홍보한 적이 있는데, 그것은 사실 실제로 고해상도 월면 사진을 정말 강력한 광학 줌으로 촬영할 수 있는 성능보다는, 그럴듯한 월면 이미지를 사용자가 줌을 최대로 당겨 촬영한 이미지에 AI를 활용하여 적절하게 합성해 준 이미지였던 것을 기억할 것입니다. AI, 특히 확산 방식 등에 기반을 둔 생성형 AI가 이제는 일상생활은 물론, 전문적 연구의 영역에서도 활발하게 활용되면서, 연구자들이 raw data, re-constructed data, re-visualized data 등을 명확하게 구분해야 하는 일은 더 많아질 것입니다. 이미지나 신호 처리 방법론은 지극히 수학적 방법론에 입각한 연산과 각종 필터 혹은 커널이 동원되는 알고리즘의 조합이므로, 이러한 훈련을 제대로 받지 않은 연구자들은 자기도 모르게 AI가 알아서 전처리한 데이터를 진짜 데이터라고 착각할 수 있고, AI가 재조합해 준 이미지를 실제 이미지에 가깝다고 선입견을 가질 수 있습니다. 인간이 받아들이는 외부 정보의 90%는 시각에 기반을 두고 있으므로, 시각적으로 그럴듯해 보이고, 자신이 생각하던 이미지와 비슷해 보이고, 남들이 그렇다고 주장하는 이미지와 비슷해 보이는 AI 처리된 이미지일수록 연구자의 마음에는 더욱 확정적인 편견을 심어줄 수 있고, 이는 그 자체로 편향의 판단 근거가 될 수 있습니다. 이는 아무리 냉철한 마인드를 가지고 있고 회의주의자라 자처하는 연구자들도 예외는 아닙니다.


앞으로의 연구에서는 AI를 활용한 다양한 데이터 처리가 이루어질 것이고, 이는 이미 비가역적인 과정에 와 있다고 생각합니다. 즉, AI가 없던 시절로 되돌아가기는 불가능하다는 뜻입니다. AI가 연구의 성과 확산, 그리고 미지의 데이터에 대한 처리 도구로서 훌륭하게 활용되는 것은 권장할만하고, 또 그러한 활용을 원천적으로 막을 수도 없겠지만, 중간중간 회의주의자로서의 브레이크를 충분히 걸면서, 편향을 최대한 방지하고, artifact과 analysis를 구분하고, artistic visualization과 image-reconstruction을 구분하는 것은 더욱 중요해질 것입니다. 앞으로 우리가 이러한 일을 할 수 있는 전문가를 계속 양성할 수 있으려면, 이들에게 AI보다 수학과 이론적 방법론을 먼저 가르쳐야 하고, AI 없이도 일단 필수적인 작업을 할 수 있는 훈련을 시켜야 할 것입니다. 확산 모형에 기반한 AI 이미징 생성을 이용하기 전에, 확산 모델의 수학적 의미를 먼저 이해해야 하고, AI가 제공하는 필터를 이용하기 전에, 필터 역할을 할 수 있는 kernel matrix의 연산 방법론을 먼저 이해할 수 있어야 할 것입니다.


수치해석이나 데이터과학 과목에서 제가 학생들에게, 특히 대학원생들에게 자주 강조하는 것이 있습니다. 어떤 문제를 수치해석 방법론이나 시뮬레이션, 그리고 최근 들어서 AI 등 (PINN 등)으로 풀려고 경우, 특정 방법론 하나에만 매몰되지 말고, 반드시 그 결과를 비교할 수 있는 독립된 방법론이나 이론적 모델, 혹은 analytic solution이나, extreme solution, asymptote 등과 비교할 수 있는 작업을 하라고 말입니다. 시뮬레이션 방법론에도 여러 스케일과 접근 방법이 있으며, 같은 문제도 여러 방식으로 풀 수 있습니다. 제대로 풀었다면 그러한 답들은 다른 방법론에서 얻은 답과 어느 정도 수렴하는 경향을 보여야 할 것이고, 오차가 날 수 있다고 해도, 그 오차는 통계적으로 허용 가능한 오차 범위 이내에 있어야 할 것입니다. 이러한 크로스체킹 과정 없이 자신이 자주 애용하는 방법론 하나에만 얽매이거나, 지나치게 의존한다면 어느 시점에서는 필히 편향에 빠질 수밖에 없고, 따라서 오류를 발견하기 어려운 상황이 됩니다. 그렇게 얻은 오류 가득한 결과물을 자기만 알고 있으면 상관없겠지만, 그것을 커뮤니티에 공유하거나 출판하게 되면, 그 연구를 참고하는 다른 연구자들에게도 안 좋은 영향을 미칠 수 있다는 것은 장차 과학의 진보에 장애가 되는 문제가 될 것입니다.


어쨌든 EHTC의 블랙홀 shadow imaging 성과는 분명 21세기 최대의 과학적 성과 중 하나이자, 인류 문명이 진보하고 있다는 핵심 증거 중 하나이기도 하므로, 이 성과가 갖는 의미는 잘 공유되어야 할 것입니다. 그리고 이 성과가 과학 커뮤니티 내외부에서 다양한 비판과 검증을 거치는 과정, 그리고 반박과 재반박이 이루어지는 과정에 동원되는 방법론 하나하나 역시 인류가 가진 과학이라는 가장 강력한 진보 무기의 핵심이므로, 이러한 과학적 성과가 갖는 의미를 우리 사회가 잘 관찰하고 따라갈 필요가 있습니다. 이는 이공계 전공을 하려는 학생들에게도 굉장히 좋은 연구 사례이기도 할 것입니다. 


과학 연구에 있어 그것이 크든 작든, 비싸든 안 비싸든, 좋은 저널에 나오든, 안 나오든, 몇 년을 투입한 연구든, 아무런 제지나 브레이크 없이, 그저 인기와 유행에 민감하게 한 방향으로만 뻗어나간다면 그것은 더 이상 좋은 과학이 될 수 없습니다. 늘 강조하는 것이지만 과학은 최신 지식 체계의 총합이기 전에, 그러한 상태로 가기 위한 회의적이고 객관적인 방법론이자 사고방식이라는 것을 우리는 잊지 말아야 할 것입니다. 과학이 그러한 특성을 잃어버린다면 그저 위키피디아의 재료, AI의 학습 재료가 되어주는 대상으로 전락해 버릴 것입니다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari