AI 신약 개발에서 단백질 유연성이 중요한 이유


AI 신약 개발이란?
제약· 바이오산업에서 기존의 신약 개발은 연구 개발 기간이 오래 걸리고, 천문학적인 비용이 들어가곤 합니다. 식약처 정보를 기준으로 신약을 개발하는 데만 1~2조원의 예산과 10~15년이라는 긴 시간이 소요된다고 합니다. 이러한 한계점을 극복하기 위해 ‘AI 신약 개발’이 등장하게 됐습니다. 현재 AI는 제약뿐만 아니라 정말 다양한 산업에 적용되고 있습니다. AI 신약 개발은 기존 임상 데이터에 AI 기술이 결합하여 신약을 개발하는 것을 의미합니다. 앞으로 신약 개발이라는 산업에 AI가 큰 역할을 수행할 것으로 예측하고 있습니다.

AI 신약 개발 - 단백질 유연성의 중요성
AI 신약 개발 또한 수많은 단계와 과정을 거쳐야 합니다. 약물을 어떻게 디자인할 것인지부터 시작해 표적 파악, 의미 있는 표적과 우수한 화합물을 파악하여 약 후보를 선정하고 사전 임상 시험을 거쳐야 합니다. AI 신약 개발 과정 속에서 모든 과정이 중요하겠지만, 오늘은 ‘단백질의 유연성’에 대해 이야기해보려 합니다. AI 신약 개발을 하는 데 있어서 단백질의 유연성이 왜 중요한지, 그리고 언제 사용해야 하는지에 대해 간략하게 설명해드리겠습니다.
단백질의 유연성이란?
구조 기반 신약 개발(SBDD)의 초기 가상탐색에서 리셉터(receptor)로 사용되는 단백질은 보통 고정된 구조를 사용하게 됩니다. 이전 글(단백질 구조 선정 방법)에서 소개한 방식을 통하여 하나의 대표 구조 또는 다양한 약물의 결합 구조를 재현 할 수 있는 몇 가지의 단백질 구조를 리셉터로 선정하여 가상탐색을 진행하게 됩니다. 하지만 화합물-단백질 결합 구조가 잘 알려지지 않았거나, 적은 수의 결합 구조를 가지고 있는 경우에는 어려움이 따를 수 있습니다. 또한, 단백질은 생체 내에서 고정되어 있는 구조가 아니라 유연하게 움직인다는 점을 고려하면, 신약 개발 연구에서도 단백질의 유연성을 반영하는 것은 매우 중요한 일입니다.
단백질의 유연성 고려가 필요한 이유

위의 그림은 단백질의 유연성에 따라 다양한 단백질 구조를 가질 수 있다는 것을 간단히 보여주는 예시입니다. 유동적인 단백질은 안정한 에너지 상태를 여러 개 가질 수 있으며, 실험적으로 얻어낸 구조는 그중 하나에 해당합니다. 따라서, 신약 개발 연구에서 단백질의 유연성을 고려하여 다양한 구조들을 검토해야, 적합한 결합 약물을 찾을 가능성 높일 수 있습니다. 아래의 그림은 다양한 구조를 검토했을 때와 그렇지 않았을 때 탐색할 수 있는 약물의 범위를 보여 줍니다.

단백질의 유연성을 고려한 많은 수의 리셉터를 활용하여 가상탐색을 진행한다면 적합한 화합물을 찾을 가능성을 높여주지만, 시간과 비용을 고려한다면 이 또한 적합한 방법은 아닐 것입니다. 탐색할 약물의 수도 많은데, 그에 따라 단백질의 갯수까지 많아진다면 컴퓨터를 사용한 가상탐색일 지라도 그 시간과 비용은 만만치 않을 것입니다.
단백질의 유연성을 고려한 방식들
신약 개발 연구에서 단백질의 유연성을 고려하기 위해 다양한 방법들이 개발 및 활용되고 있습니다. 몇 가지 예를 들어보면, 적합한 약물-단백질 결합 구조를 탐색하기 위한 도킹(docking) 방식에서 단백질의 유연성을 고려할 수 있습니다. 또한, 컴퓨터 시뮬레이션을 활용하여 다양하고 변화가 큰 단백질의 구조를 만들어 내어 리셉터로 사용하거나, 분자 도킹 이후 시뮬레이션을 통해 적합한 약물-단백질의 결합 구조를 찾는 등의 방법이 있습니다.

간략히 위의 방식들에 대해 설명하면, 단백질의 결합 위치에서 잔기들의 유연성을 고려하는 소프트 도킹(soft docking), 선택적 도킹(selective docking), 다양한 단백질 구조를 생성하여 여러 가지 구조를 사용하는 방식(ensemble docking), 그리고 단백질과 화합물을 결합하여 안정화하는 방식(on-the-fly docking) 등이 있습니다.
위에서 이야기하는 방식들에 대해서는 다가오는 포스팅에서 좀 더 자세히 다루어 보기로 하겠습니다.
단백질의 유연성, 언제 활용해야 할까?
실제 신약 개발 연구에서 어떨 때 단백질의 유연성을 고려한 리셉터 선정을 해야 하는지에 대해 이야기해 보겠습니다.
1. 결정 구조의 해상도가 안 좋은 경우
먼저, 사용하려는 결정 구조의 해상도(resolution)가 좋지 않은 경우입니다. 앞서 언급했듯, 단백질은 여러 개의 안정된 구조 중 하나의 형태가 실험적으로 결정되니다. 하지만 해당 구조의 신뢰도를 나타내는 해상도가 낮다면, 가상 탐색에 사용하는 데 문제가 발생할 수 있습니다. 예를 들어, 약물-단백질 결합 구조에서 원자 간 충돌이 있거나, 약물 결합 위치에서 단백질 잔기가 뒤틀려 있는 경우 등, 다양한 상황이 존재할 수 있습니다. 이러한 부정확한 정보를 기반으로 가상 탐색을 진행할 경우, 적합한 약물 탐색에 실패할 가능성이 높아집니다.
따라서, 신뢰할 수 있는 안정적인 구조를 갖춘 후에 가상 탐색을 사용해야 할 것입니다. 이때 활용할 수 있는 한 가지 방법이 '분자 동역학 시뮬레이션'입니다. 해상도는 낮지만 실험을 통해 알려진 단백질-약물 결합 결합 구조를 입력값으로 사용해 시물레이션을 수행하면, 물리적으로 안정적인 구조를 생성할 수 있습니다. 이를 통해 원자 간의 충돌이나 단백질 잔기의 뒤틀림 등을 해결할 수 있으며. 물리적으로 타당한 범위 내의 구조를 갖추게 될 것입니다.

2. 알파폴드 구조를 사용하는 경우
또 다른 경우로는 알파폴드(AlphaFold) 구조를 사용할 때입니다. 신약 개발 연구에서는 단백질의 결정 구조가 알려지지 않은 단백질을 다루는 경우가 많습니다. 이때, 해당 단백질에 활성을 보이는 약물이나 결합이 예상되는 잔기 정보를 이미 알고 있다면, 새로운 약물을 탐색하거나 기존 약물을 최적화하는 데 유리합니다. 실험을 통해 바로 검증이 가능하기 때문입니다. 그러나 많은 시간과 비용이 들기 때문에, 상대적으로 저렴하고 빠른 컴퓨터 기반 연구를 먼저 수행하는 것입니다. 이처럼 단백질의 결정 구조 없이 구조 기반 신약 개발(SBDD) 연구를 진행할 경우, 가장 정확한 예측 구조로 알려진 알파폴드 구조가 대표적으로 활용됩니다.
하지만 알파폴드 구조는 대부분 화합물이 결합되어 있지 않은 apo 구조이기 때문에, 가상탐색 및 구조 기반 신약 개발 연구에 활용하려면 단백질-화합물 결합 구조를 별도로 준비해야 합니다. 단백질의 유연성을 고려하면, 화합물이 결합한 구조가 존재할 수 있다는 사실은 이미 실험적으로 검증되어 있습니다. 이를 바탕으로 단백질-화합물 결합 구조를 생성할 수 있습니다.
먼저 알파폴드 구조를 입력 구조로 하여 분자 동역학 시뮬레이션을 수행합니다. 실험적으로 화합물이 결합하는 단백질 잔기를 알고 있으므로, 해당 결합 부위의 변화를 관찰하고 그중 적합한 단백질 구조를 선택할 수 있습니다. 이후 실험을 통해 규명된 단백질 잔기가 위치한 결합 부위에 약물을 결합시킨 뒤, 다시 한 번 시뮬레이션을 수행하여 구조를 안정화합니다. 이 과정을 통해 가상 탐색에 사용할 수 있는 단백질-화합물 결합 구조를 얻을 수 있습니다.
이외에도 다양하게 신약 개발 연구에서 단백질의 유연성이 중요시 되는 경우가 있으며, 다가오는 포스팅에서 다양한 방법들과 함께 소개해 드리도록 하겠습니다.
마치며
단백질 유연성을 고려해 구조를 안정화 할 수 있는 컴퓨터 시뮬레이션 활용 방법도 매우 다양하지만, 이 또한 시간과 비용이 발생하는 문제를 안고 있습니다. 적합한 단백질의 접힘 구조를 얻기 위해서는 긴 시간의 시뮬레이션 수행 또는 enhanced sampling 등을 고려한 시뮬레이션 방식의 도입이 필요할 수 있습니다. 이러한 방법들에 대해서는 다음 포스팅에서 하나씩 다뤄보겠습니다.