AI 신약 개발의 미래
지난 9월 30일, 뉴욕타임즈는 Top A.I. Researchers Leave OpenAI, Google and Meta for New Start-Up라는 기사를 실었다. OpenAI·구글·메타에서 활동하던 핵심 연구자들이 Periodic Labs라는 새 스타트업에 합류했다는 내용이다. 기사에서 인상적이었던 두 문장은 이 논지의 핵심을 잘 요약한다.
But Mr. Fedus and Dr. Cubuk believe that no matter how many textbooks and academic papers these systems analyze, they cannot master the art of scientific discovery. To reach that, they say, A.I. technologies must also learn from physical experiments in the real world.
요약하면: 방대한 문헌·데이터만으로는 과학적 발견의 본질을 온전히 이해할 수 없고, 물리적 실험으로부터 학습하는 능력이 필요하다는 주장이다. 특정 이론·모델이 실험적 검증과 결합되지 않으면, 모델이 제안하는 발견은 실제 조건에서 실패하거나 비실용적일 가능성이 크다.
내 배경은 유기화학이다. 수십 년 간 실험실에서 얻은 직관과 실패의 경험은 중요한 교훈을 준다. 실험은 반복 불가능성, 실험자 편차, 조건 민감성(온도·습도·용매·시약의 등급), 스케일업 시 변화 등 복합적인 노이즈를 갖는다. 이 때문에 실험 데이터는 논문에서 보는 텍스트와 달리 구조화되지 않고, 대부분의 경우 메타 데이터가 부족하다. AI가 실험에서 배우기 위해서는 이 노이즈와 불완전성을 설계 단계에서 명시적으로 다뤄야 한다.
AI–실험 통합의 핵심 기술적 이슈
- 데이터 품질과 메타데이터 표준화
- 문제: 실험 노트의 기록은 보통 텍스트, 이미지(반응물/결과 사진), 장비 로그 등 이질적 포맷으로 존재한다. 뿐만 아니라 실험 온도, 교반 속도, 시약 출처, 배치 정보 같은 메타 데이터가 빠지거나 연결이 견고하지 않은 경우가 많다.
- 해결 방향: FAIR 원칙(Findable, Accessible, Interoperable, Reusable)을 실험 데이터에 적용하고, ontologies(예: RXNO 반응명, ChEBI 등)를 사용해 표준화한다. 실험 자동화 플랫폼은 필수 메타데이터를 강제 입력하도록 UI/API를 설계해야 한다
- 실험 자동화 하드웨어와 인터페이스(API)
- 문제: 로봇 플랫폼과 분석장비(LC-MS, NMR, HPLC 등)는 제조사별로 인터페이스가 다르고 데이터 형식도 제각각이다.
- 해결 방향: 공통 제어 레이어(예: Autoprotocol, SiLA 2)와 표준화된 데이터 스트림(예: JSON schema for experimental results)을 도입해 소프트웨어 스택에서 장비 추상화를 제공한다.
- 실험설계(Design of Experiments, DoE)와 최적화 알고리즘
- 문제: 실험 자원이 제한적일 때 효율적으로 탐색해야 한다. 단순 그리드 탐색은 비효율적이며 실험 잡음 때문에 잘못된 결론에 이를 수 있다.
- 해결 방향: 베이지안 최적화(Bayesian Optimization), active learning, multi-fidelity optimization(시뮬레이션·빠른 스크리닝·정밀측정 혼합) 등을 적용한다. 불확실성(uncertainty) 추정이 가능한 surrogate 모델(예: Gaussian Process, Bayesian Neural Networks)을 사용하면 획득함수(acquisition function)에 기반한 실험 선택이 가능하다
- 시뮬레이션-실험 통합(디지털 트윈)
- 문제: 전 영역을 실험으로만 다루기엔 시간·비용 제약이 크다.
- 해결 방향: 고신뢰도의 시뮬레이션(양자화학 계산, 분자동역학 등)과 실험 데이터를 결합한 multi-fidelity 모델을 구축한다. 시뮬레이션 결과를 선행 필터로 사용하고, 불확실성이 높은 후보만 물리 실험에 할당하는 전략이 비용 대비 효율적이다.
- 피드백 루프(실시간 학습)과 보상 설계
- 문제: 실험이 수행되는 속도에 맞춰 모델을 재훈련하는 것이 어렵다. 또한, 모델이 '유효한 과학적 증거'를 학습하도록 신호(보상)를 설계해야 한다.
- 해결 방향: 온라인 학습 또는 continual learning 구조를 도입하고, 여기서 보상 함수는 단순 수율뿐 아니라 selectivity, 재현성, 스케일업 가능성, 비용 등 다차원 지표를 포함해야 한다.
구체적 아키텍처 제안(높은 수준)
- 데이터 레이어: 실험 로그, 장비 로그, 분석 스펙트럼, 이미지, 시약, 배치 등의 메타 데이터를 수집하고 ETL로 정규화 → 중앙 데이터 포맷(JSON/Parquet)으로 저장. 메타데이터 스키마는 화학 반응·생물학 실험용 공개 스킴을 확장.
- 모델 레이어:
- Feature engineering: 분자 표현(MP, SMILES, graph embeddings), 반응 조건 토큰화, 환경 메타데이터 인코딩 등
- Surrogate models: multi-fidelity GP + Bayesian NN ensemble(불확실성 추정).
- Acquisition policy: Bayesian optimization with constrained acquisition (안전성·자원 제약 고려).
- Orchestration 레이어: 실험 예약·장비 제어·로봇 집행 → 실험 완료 후 데이터 자동 수집·검증 → 모델 업데이트(온라인/배치) → 다음 실험 제안.
- Evaluation: 오프라인 시뮬레이션(가상 실험), 성공률·ROI·재현성 지표 추적.
실제 적용 시 고려해야 할 현실적 문제
- 레이블 편향(label bias): 성공 사례만 보고 학습하면 모델이 실제 실패 영역을 과소평가한다. 실패 데이터(negative results)를 적극적으로 기록·활용해야 한다.
- 재현성 문제: 자동화가 아닌 수작업으로 축적된 과거 데이터는 재현성 낮음 → 전처리·신뢰도 스코어 부여 필요.
- 비용·윤리·규제: 자동화 실험은 고비용 장비와 화학물질 관리, 안전 규정 준수가 필수다. AI의 실험 제안은 안전성 체크(예: 위험 반응, 폭발성 물질) 필터를 통과해야 한다.
- 지식 이전(transfer learning): 한 실험 플랫폼에서 학습한 모델을 다른 실험실로 이전할 때는 장비·프로토콜 차이를 보정하는 도메인 적응(domain adaptation)이 필요하다.
왜 지금이 중요한가
자동화 장비와 계산 자원의 가격이 하락하고 ML 알고리즘의 불확실성 처리 능력이 향상되면서 '실험-알고리즘' 통합이 현실화될 수 있는 환경이 현실적으로 다가오고 있다. 초기 선도 기업들이 많은 시행착오를 경험하면서 시스템·데이터 표준화, 안전 거버넌스, 비용 대비 효율성을 증명하면 업계 전반으로 확산될 것이다. 다만, 성공은 알고리즘 성능뿐 아니라 데이터 인프라, 하드웨어 표준화, 규제·안전성 확보, 그리고 실험 현장과의 긴밀한 협업에 달려 있다.
결론
Periodic Labs 같은 팀들이 제기한 문제의식은 단순한 유행어가 아니다. 과학적 발견을 위한 AI의 다음 단계는 '더 많은 데이터'가 아니라 '더 나은 실험 통합'이다. 이를 위해서는 소프트웨어·모델·하드웨어·실험 문화가 함께 진화해야 한다.