AI 신약개발 공부 이 논문 3개로 시작하세요 - 생성형 AI 도입부터 단백질 서열 3차원 구조 예측까지
AI 신약개발은 눈부시게 발전하는 분야입니다. 매일 같이 쏟아지는 AI 논문의 홍수 속에서, 시작점을 찾는 데 어려움을 겪고 계신 학생 및 연구원분들에게 도움이 되고자, 핵심적인 인사이트와 기초를 제공하는 세 가지 중요 논문을 선별했습니다. 이 논문은 최첨단 기술을 다루진 않지만, AI 신약개발 연구의 기본을 이해하고 그 후 최신 연구로 나아가는 데 있어 탁월한 출발점이 될 수 있다고 생각합니다. 이 논문들을 통해 AI 신약개발 분야가 얼마나 빠르게 발전하고 있는지 명확하게 이해하고, 더 깊이 있는 학습으로 나아갈 수 있는 토대가 되길 기대합니다.
AI 신약개발의 시작을 알리는 논문
논문 요약 : 생성형 AI를 이용해 AI 신약개발 연구의 포문을 열다
논문 자료 : Automatic Chemical Design Using a Data-Driven Continuous Representation of Molecules
2018년에 발표된 이 혁신적인 논문은 Variational Autoencoder (VAE)를 활용하여 분자 생성의 새로운 지평을 열었습니다. 연구진은 이 논문을 통해 딥러닝 모델이 화학적으로 유효한 분자를 생성할 수 있다는 사실을 세계 최초로 입증했습니다.
분자는 원자로 구성되며, 이 원자들은 화학 결합으로 연결되어 있습니다. 그러나 원자들의 무수한 배열 중 극히 일부만이 화학적으로 의미가 있으며, 이 연구는 딥러닝 모델이 이러한 배열의 규칙을 학습할 수 있음을 증명했습니다.
더 나아가, 이 연구는 Gaussian Process를 사용하여 잠재 공간(latent space)을 조절함으로써, 원하는 물성을 갖는 분자들을 생성하는 데 성공했습니다. 이것은 신약개발에서 특정 약리학적 물성을 만족하는 분자를 생성할 수 있다는 가능성을 열어줍니다. 아래 그림은 이 방법을 통해 생성된 분자들의 예시입니다.
이 논문 발표 이후, 생성형 AI를 이용한 다양한 연구들이 출판 되며 분자 생성 모델의 시발점이 되었습니다. AI 신약개발 분야에서 생성형 AI의 출발점에 대해 궁금해하시는 분들에게 꼭 추천하는 바입니다.
AI 신약개발의 현실 가능성을 알린 논문
논문 요약 : AI 를 이용해 46일만에 전임상 후보물질을 도출해내다.
논문 자료 : Deep learning enables rapid identification of potent DDR1 kinase inhibitors
다른 과학적 연구 분야와 마찬가지로, 벤치마크 테스트를 넘어 실제 실험을 통해 AI 신약개발 모델의 성능을 입증하는 것은 매우 어려운 일입니다. 이런 맥락에서, AI를 이용하여 단 46일 만에 전임상 후보물질 수준의 물질을 도출한 논문은 특히 주목할 만합니다. 이 논문은 실제 신약개발에 AI가 어떻게 적용될 수 있는지 보여주는 훌륭한 예시입니다.
논문의 저자들은 강화학습 기술을 활용하여 DDR1 kinase 저해제를 설계했습니다. 이들은 설계한 분자들을 합성하고, biochemical assay와 cell-based assay를 통해 약물의 활성을 검증했으며, 쥐를 사용한 pharmacokinetics 테스트를 진행했습니다. 아래 그림은 이 46일 동안의 타임라인입니다.
그러나 연구에서 사용된 생성형 AI가 테스트한 모든 물성을 고려하지 않았다는 점, 그리고 생성한 분자들이 기존에 보고된 약물과 구조적으로 매우 유사하다는 점은 연구의 한계로 지적되어야 합니다. 또한, 모든 신약개발 과제가 AI를 통해 이처럼 빠르게 진행되는 것은 아니라는 점도 유념해야 합니다.
AI 신약개발을 넘어서 과학계의 난제를 풀어낸 논문
논문 요약 : AI로 단백질 서열 3차원 구조 예측이 가능해지다.
논문 자료 : Highly accurate protein structure prediction with AlphaFold
단백질 서열로부터의 3차원 구조 예측은 과학계의 오랜 난제 중 하나였습니다. DeepMind의 AI, AlphaFold에 의해 기념비적인 진전이 이루어졌습니다. 이 논문은 설명이 필요 없을 만큼 유명하며, 단백질 구조생물학 분야에 혁신적인 변화를 가져왔습니다.
AlphaFold 모델의 구조는 간단히 아래와 같이 요약됩니다. 먼저, MSA(Multiple Sequence Alignment)를 통해 아미노산 서열의 공진화 정보를 추출합니다. 이어서, Transformer 기반의 딥러닝 모델을 사용하여 아미노산 쌍 간의 상호작용 정보를 추출합니다. 마지막 단계에서는 residue들 사이의 구조적 배치(거리 및 각도)를 예측하고 예측된 정보로 부터 단백질의 3D 구조를 재구성합니다.
이 모델을 완전히 이해하려면 딥러닝에 대한 깊은 지식과 기초 구조생물학에 대한 이해가 필요합니다. 이 논문을 완전히 파악할 수 있다면, 당신은 딥러닝 + 구조생물학 분야에서 고수라고 할 수 있습니다.
마무리
지금까지 AI 신약개발 공부를 위한 대표 논문 자료들을 살펴보았습니다. AI가 가속화하는 신약개발의 미래, 정말 기대되지 않으신가요? 이번 시간엔 학술 논문 자료를 통해 AI 기술 발전을 알아봤다면, 다음 시간엔 제약 분야에 AI가 어떻게 사용 되고 있는지 알아보도록 하겠습니다. 제약 업계에 부는 AI 바람에 대해서 알고 싶으시다면 다음 포스팅을 참고하세요