

분자 모델링 분야에서 molecular docking은 두 분자의 상호작용을 분석하여 안정적인 결합 구조를 예측하는 것을 목표로 합니다. 신약 개발에서는 주로 화합물과 표적 단백질의 결합 구조를 예측하기 위해 사용되며, 이때 화합물을 ligand, 표적 단백질을 receptor라고 표현합니다. 성공적인 docking을 수행하기 위해서는 단백질 구조의 선택, binding site 정의, 그리고 환경 설정에 대한 철저한 고려가 필요합니다.
Docking 프로그램의 환경 설정을 설명해 드리기에 앞서, docking의 구성 요소를 간단히 소개하겠습니다.

결합 친화도를 계산하기 위해 사용되는 수학적 모델입니다. 생성된 receptor-ligand 결합 구조의 상대적 안정성을 점수로 평가합니다. 물리 기반 scoring function은 force field를 사용하여 분자 간의 상호작용을 계산하며, hydrogen bond, 전기적 상호작용(electrostatic), 반데르발스 힘(van der Waals), 엔트로피(entropy) 등을 고려합니다.
경험적(empirical) scoring function은 알려져 있는 protein-ligand 결합 구조와 binding affinity 데이터를 기반으로 학습된 모델로, 계산 속도가 빠르다는 장점이 있으나 학습 범위를 벗어나는 경우에는 정확도가 떨어질 수 있는 한계가 있습니다. Consensus scoring function은 서로 다른 scoring function에서 얻어진 점수를 종합하여 평가하는 방식이며, 연관성이 높은 scoring function들을 함께 사용할 경우 변별력이 낮아질 수 있으므로 주의가 필요합니다.
Docking의 환경 설정은 위에서 설명한 세 가지 구성 요소와 밀접하게 관련되어 있습니다. 환경 설정에 따라 예측의 정확성과 소요 시간이 달라지기 때문에, 효율적인 연구 수행을 위해서는 사용하는 프로그램의 특성을 충분히 이해하고 적절히 활용하려는 노력이 필요합니다. 옵션의 종류와 설정 가능한 범위는 사용하는 프로그램에 따라 달라질 수 있습니다.
일반적으로 docking 프로그램들은 다양한 결합 구조를 탐색한 후 약 10개 정도의 binding pose와 해당 score 값을 제공합니다. 이러한 수는 대부분의 경우 충분하지만, ligand가 매우 유연하거나 flexible docking을 적용해 다양한 conformation이 가능한 경우에는 더 많은 pose를 검토할 필요가 있습니다.
프로그램에 따라 다양한 scoring function과 최적화 알고리즘이 제공됩니다. 각 scoring function과 최적화 알고리즘의 특성을 잘 이해하고 목적에 맞게 적절히 활용한다면, 더 나은 예측 결과를 얻을 수 있습니다.
일반적으로 물리 기반 scoring function은 구조 예측에 강점을 보이는 경향이 있습니다. 반면, 최근 활발히 연구되고 있는 deep learning 기반 모델들은 x-ray 구조 데이터를 바탕으로 활성을 예측하도록 학습되었기 때문에, 활성 예측에 더 강점을 보이는 경향이 있습니다. Hyper Lab의 Hyper Binding은 물리 기반 접근과 딥러닝 기반 접근을 융합한 알고리즘을 적용하여, 활성 예측과 구조 예측 모두에서 최상위 수준의 성능을 보여주고 있습니다.
Receptor 구조의 유연성이 높은 경우, docking 과정에서 이를 적절히 반영하는 것이 중요합니다. 결합하는 ligand에 따라 receptor의 골격 구조에 큰 변화가 생기는 경우에는 두 개 이상의 단백질 구조를 사용하는 것을 고려할 수 있습니다. 또한, binding site를 구성하는 residue 중 일부가 ligand에 따라 다양한 구조를 가질 수 있다면, docking 과정에서 해당 residue의 구조 변화까지 함께 탐색하는 방법을 적용할 수 있습니다.
Flexible residue를 추가할 경우 탐색 범위가 크게 확장됩니다. 이로 인해 계산 시간이 상당히 증가할 수 있으며, 경우에 따라서는 오히려 예측 정확성이 낮아질 우려도 있습니다. 따라서 flexible residue를 포함한 전략이 실제로 효과적인지 여부는 사전에 적절한 테스트를 통해 검토할 필요가 있습니다.
이제 단백질-약물 결합 구조 예측을 위한 docking 환경 설정이 마무리되었습니다. Docking의 예측 결과는 단순히 수치만을 받아들이기보다는, 분석을 통해 비판적으로 해석하고 활용하는 것이 바람직합니다. 다음 글에서는 docking의 한계를 짚어보고, 이를 어떻게 합리적으로 활용할 수 있을지에 대해 살펴보겠습니다.