brunch

바이오파운드리, 실험실을 넘어 시스템으로 가다

바이오파운드리 최신 논문 리뷰

by BUNNY SCIENTIST

이 글은 biofoundry 분야의 최신 논문을 리뷰한 글이다

Kim, Haseong, et al. "Abstraction hierarchy to define biofoundry workflows and operations for interoperable synthetic biology research and applications." Nature Communications 16.1 (2025): 6056.


캡처.PNG

요즘 생명과학 연구는 손으로만 하기에는 너무 복잡하고 방대해졌다.

예전에는 (물론 지금도) 연구실에서 연구원이 하나하나 실험을 세팅하고, 데이터를 수집하고, 결과를 해석했다. 그런데 지금은 로봇이 실험을 하고, 인공지능이 데이터를 분석한다.


이렇게 자동화된 실험 공간을 Biofoundry(바이오파운드리)라고 부른다.
말 그대로 ‘생물(Bio) + 공장(Foundry)’이다.
DNA를 합성하고, 단백질을 설계하고, 새로운 생명체를 만들기까지 전 과정을 기계와 소프트웨어가 수행한다.


하지만 여기에는 문제가 하나 있다.
각 연구실마다 사용하는 장비도 다르고, 실험 방식도 다르고, 용어도 다르다.
어떤 연구실에서는 같은 실험을 "워크플로우"라고 부르고, 어떤 곳은 "프로토콜"이라 부른다.
심지어 기계가 실험을 수행할 때는 사람이 생각하는 ‘상식’이 통하지 않는다.
"적당히 섞는다" 같은 애매한 말은 로봇이 이해할 수 없다.

그래서 이 논문은 말한다.



"우리 실험을 좀 더 체계적으로 쪼개서,
누구나 같은 언어로 공유할 수 있게 하자."



실험을 쪼개는 4단계 구조

이 논문에서 제안하는 방식은, 모든 실험을 4단계로 나누어 추상화(abstraction)하는 것이다.
추상화라는 말이 어렵게 들릴 수 있는데, 쉽게 말하면 ‘복잡한 걸 단계별로 나눠서 정리한다’는 뜻이다.

캡처.PNG figure 1.level 0-3


1. Project (프로젝트)

어떤 목표를 달성할 건지를 정의한다.
예: "플라스틱을 분해하는 박테리아를 만든다."


2. Service / Capability (서비스 / 기능)

목표를 이루기 위해 어떤 기능이 필요한지 정한다.
예: "DNA 조립", "AI로 단백질 설계", "세포 배양"


3. Workflow (워크플로우)

그 기능을 어떻게 실행할지 단계별 절차를 짠다.
예: "DNA를 합성한다 → 플라스미드에 넣는다 → 세포에 주입한다"


4. Unit Operation (유닛 오퍼레이션)

실험의 최소 단위, 기계나 소프트웨어가 실제로 하는 일.
예: "파이펫팅", "온도 조절", "시퀀싱"

이렇게 단계별로 쪼개면, 연구원이 모든 걸 다 알지 않아도 된다.
기계와 소프트웨어가 각 단계의 ‘역할’만 이해하면 된다.



예전에는 (사실 지금도) 숙련된 연구자가 감으로 실험을 했기 때문에, 같은 실험이라도 사람에 따라 결과가 달랐다. 하지만 바이오파운드리는 반복 가능성(reproducibility)이 중요하다.

같은 워크플로우라면, 어느 나라, 어떤 기계에서도 같은 결과가 나와야 한다.



추상화를 위한 과정을 보다보니..개발 세계에서 말하는 DDD(Domain-Driven Design)이라는 개념이 생각났다.

도메인(업무 영역)을 깊이 이해하고, 그에 맞는 설계를 하자는 접근이다.
그 핵심에는 유비쿼터스 언어(Ubiquitous Language)라는 개념이 있다.

이게 뭐냐면,모든 팀 구성원(개발자, 기획자, 디자이너, 사용자 등)이 같은 단어로 같은 개념을 말할 수 있도록 용어를 통일하는 것이다.

예를 들어, 누군가 “고객 등록”이라고 말했을 때
누군가는 “폼 제출”, 다른 사람은 “회원 가입”이라고 해석하면 개발도 꼬이고, 소통도 꼬인다.

이 논문이 말하는 워크플로우와 유닛 오퍼레이션 정의도 사실상 같은 맥락이다.

어떤 실험 단계를 “DNA Extraction”이라고 부를지, 어디까지를 “Cell Culture”라고 할지

그 명칭과 의미를 통일하지 않으면, 같은 시스템이라도 서로 호환되지 않는다.

생명과학 실험도 도메인 언어를 명확하게 정해야 자동화가 되고 시스템 간 연동이 되고, AI가 이해할 수 있게 된다.

바이오파운드리에서의 추상화 계층은 소프트웨어의 도메인 모델링과 흡사하고,

표준화된 워크플로우 명칭은 유비쿼터스 언어 역할을 한다.




실험은 같아도, 장비는 다르다 – 유연성이 필요한 이유


모든 실험을 워크플로우랑 유닛 오퍼레이션으로 쪼갰다고 해도,
현실은 그렇게 단순하지 않다.

실험 목적도 다르고, 사용하는 장비도 다르고, 실험자마다 익숙한 방식도 다르다.
예를 들어, ‘액체 배지에서 세포 배양하기’라는 워크플로우는
누구는 DNA를 증폭하는 용도로 쓰고,
누구는 세포 안에서 효소 반응을 보기 위한 조건으로 쓴다.

또 어떤 연구실은 DNA 추출을 몇 개 단계로 나눠서 하지만,
어떤 곳은 기계 하나로 한 번에 해버리기도 한다.
그래서 기존 워크플로우나 유닛 오퍼레이션만으로는 모든 경우를 다 담기 어렵다.


그래서 이 논문은 하나의 고정된 방법 보다,
다양한 실험 목적과 장비를 유연하게 담아낼 수 있는 구조가 필요하다고 말한다.


표준 언어와 데이터 구조의 중요성

실험 방식이 달라도, 데이터를 교환하려면 표준 언어가 있어야 한다.
그래서 등장하는 게 SBOL (Synthetic Biology Open Language)과 LabOp (Laboratory Operation Ontology).

이런 언어는 실험의 설계, 수행, 데이터 분석 전 과정을 컴퓨터가 이해할 수 있는 방식으로 표현할 수 있게 돕는다.그래야 연구실끼리 실험을 공유하고, 자동화 소프트웨어도 그 실험을 따라할 수 있다.


데이터를 쌓고 돌리는 도구 – LIMS, ELN, AI

바이오파운드리는 데이터가 핵심이다.
기계가 실험을 수행하면서 나오는 모든 로그, 조건, 결과가 데이터로 남는다.
이걸 모아서 분석하고, 다시 실험을 설계하는 데 써야 진짜 자동화라고 할 수 있다.

그래서 필요한 게 아래와 같은 툴이다.

LIMS (Lab Information Management System)

ELN (Electronic Lab Notebook)

게다가 요즘은 Jupyter Notebook, VS Code, RStudio(Quarto) 같은 도구들을
그냥 코딩툴로 쓰는 게 아니라, ELN처럼 실험기록 + 실행코드 + 데이터 분석까지 한 번에 처리할 수 있게 활용한다. 여기에 AI까지 붙으면?

실험 설계 자동화

장비 상태 예측

에러 예측 및 최적화

같은 일도 가능해진다.


클라우드냐, 로컬이냐 ?

클라우드는 편하지만,
보안이 중요한 연구실에서는 내부 저장소만 써야 할 때도 많다.
반대로, 연구가 길어지고 데이터가 많아지면 클라우드 비용도 무시 못 한다.

그래서 결국 중요한 건,

클라우드와 로컬을 적절히 섞는 하이브리드 전략이다.


실험 전체를 코드처럼 다룬다는 것은,

논문에서는 한 예로,
‘DNA 조립 서비스’의 전체 워크플로우를 마크다운(Markdown)으로 기록하는 방식을 소개한다.
각 단계별로 장비, 시약, 입력/출력, 샘플ID까지 다 명시돼 있다.

이런 기록은 그냥 '메모'가 아니라,완전히 재현 가능한 디지털 실험 설계서다.
누가 보더라도, 어떤 장비로도, 다시 실행할 수 있게 만들자는 것이다.


이 논문에서는 Edinburgh Genome Foundry, SYNBIOCHEM, TeselaGen 같은 사례를 적용 사례로 언급한다.이런 곳들은 이미 자동화와 표준화에 앞서가고 있다.


예를 들어 Edinburgh Genome Foundry는 다음을 갖췄다.

실험 설계 소프트웨어

자동화 장비

데이터 분석 플랫폼

이 모든 걸 하나의 시스템으로 연결해서,
마치 공장에서 자동차 조립하듯이 실험을 조립 한다.



바이오파운드리에서 나오는 데이터는 어마무시하게 크다.
이 데이터들은 모두 기록되고, 분석되고, 다시 다음 실험에 쓰인다.
이 논문은 특히 FAIR 원칙을 강조한다:

Findable (찾을 수 있어야 하고)

Accessible (접근할 수 있어야 하고)

Interoperable (서로 호환돼야 하고)

Reusable (재사용 가능해야 한다)

이 데이터들이 쌓이면, 언젠가는 AI가 실험을 스스로 설계하는 시대가 올지도 모른다.


이 논문은 결국 이런 말을 하고 있다.

“생물 실험은 이제 더 이상 개인의 기술에 의존하는 시대가 아니다.
누구나, 어디서나, 같은 시스템으로, 같은 결과를 만들 수 있어야 한다.”


나도 연구자로서 이런 시스템을 설계하고 싶은 마음이 크다.

연구실 안에서도 각자 다른 언어로 실험을 설명하고 데이터가 저장이 되지 않는 불편함을 계속해서 겪다보니 더더욱 이런 표준화되고 추상화된 시스템이 필요하다고 느꼈다.


실험을 ‘손으로 하는 일’에서 ‘시스템을 만드는 일’로 바꾸는 것.
이게 진짜 합성생물학의 미래라고 생각한다



참고: https://www.nature.com/articles/s41467-025-61263-6


keyword
작가의 이전글프랑스 바이오파운드리 동향