디지털 라이브러리[ 검색결과 ]
신약 후보 물질의 ADMET 속성 예측을 위한 사전학습 모델 기반의 일반화 성능 향상 기법
http://doi.org/10.5626/JOK.2025.52.7.601
신약 개발 과정에서 ADMET(흡수, 분포, 대사, 배설, 독성) 속성의 정확한 예측은 임상 시험 실패율을 낮추고 개발 비용을 절감하는 데 중요한 역할을 한다. 본 연구에서는 그래프 트랜스포머 기반의 분자 임베딩과 사전 학습된 UniMol 모델 기반의 임베딩을 결합하여 신약 후보 물질의 ADMET 예측 성능을 높이는 방법을 제안한다. 제안된 모델은 분자의 그래프 구조에서 결합 유형 정보를 반영하여 보다 화학적으로 정교한 표현을 생성하며, UniMol의 사전 학습된 3D 임베딩을 활용하여 분자의 공간적 특성을 효과적으로 학습한다. 이를 통해 데이터 부족 문제를 보완하고, 모델의 일반화 성능을 향상시킬 수 있도록 설계하였다. 본 연구에서는 총 10개의 ADMET 속성을 대상으로 예측 실험을 수행하였다. 실험 결과, 제안된 모델은 기존 방법들보다 우수한 예측 성능을 보였으며, 원자의 결합 정보와 3D 구조를 효과적으로 통합함으로써 ADMET 속성 예측의 정확도를 향상시킬 수 있음을 확인하였다.
돌연변이 단백질에 대한 사전 학습 대규모 언어 모델 기반 약물-표적 결합 친화도 예측
http://doi.org/10.5626/JOK.2025.52.6.539
신약 개발은 높은 비용과 긴 시간이 소요되며, 특히 단백질 돌연변이가 약물-표적 결합 친화도에 미치는 영향을 정량적으로 예측하는 것은 중요한 과제이다. 기존 연구에서는 아미노산 서열 처리를 위해 LSTM과 트랜스포머 모델이 활용되었으나, LSTM은 장기 의존성 문제, 트랜스포머는 높은 연산 비용의 한계를 가진다. 반면, 사전 학습된 거대 언어 모델(pLLM)은 긴 시퀀스 처리에 강점을 가지지만, 프롬프트 기반 접근만으로는 정확한 결합 친화도 예측이 어렵다. 본 연구에서는 pLLM을 활용하여 단백질 구조 데이터를 임베딩 벡터로 변환하고, 별도의 머신러닝 모델로 결합 친화도를 예측하는 방법을 제안한다. 실험 결과, 제안된 방법은 기존 LSTM 및 프롬프트 접근법보다 우수한 성능을 보였으며, 돌연변이 특이적 예측에서도 낮은 RMSE와 높은 PCC를 기록하였다. 또한, pLLM 모델의 양자화에 따른 성능 분석을 통해 낮은 연산 비용으로도 충분한 성능을 발휘할 수 있음을 확인하였다.
질병 연관 유전자 발굴을 위한 이종적인 어텐티브 그래프 합성곱 신경망
http://doi.org/10.5626/JOK.2025.52.2.161
유전자-질환 연관성 예측은 질병 메커니즘 이해 및 유전자 타겟 발굴에 필수적이나, 실험실 환경에서의 검증 방식은 시간과 비용이 많이 든다. 딥러닝, 특히 그래프 신경망이 이 문제 해결에 큰 가능성을 보여주었으나, 기존 모델들은 유전자, 질병 등 생물학적 개념들 사이 이종성을 모델 의사결정에 반영하지 못 하거나, 이종성 정보를 인간이 직접 정의해야 했다. 이러한 문제를 해결하기 위해 본 연구는 이종적인 어텐티브 그래프 합성곱 신경망 (HAGCN)을 제안한다. HAGCN은 유전자, 질병 등 이종적 개념들의 연관관계 그래프를 입력 데이터로 사용한다. 본 연구는 입력 데이터 구축을 위해 Gene Ontology, Disease Ontology, Human Phenotype Ontology, TBGA 와 같이 큐레이션 된 데이터베이스들로부터 연관관계정보를 얻었다. HAGCN은 어텐션 메커니즘을 사용해 메타-패스 없이 생물학적 개념들 연관관계의 이종성 정보를 학습한다. HAGCN은 유전자-질환 연관성 예측에서 AUROC 최고 성능을 달성했으며, 다른 지표에서도 비교모델 대비 경쟁력을 보였다. 본 연구는 HAGCN을 통해 질병 연관 유전자 발견을 가속화 하고, 계산 신약 개발 분야 발전에 기여하는 것을 그 목표로 한다.
New Transformer Model to Generate Molecules for Drug Discovery
Yu-Bin Hong, Kyungjun Lee, DongNyenog Heo, Heeyoul Choi
http://doi.org/10.5626/JOK.2023.50.11.976
다양한 생성모델 기반의 신약 후보 생성 방법 중, 회귀적 신경망 (RNNs) 기반의 모델이 최고 성능을 보여왔다. RNN의 장기 의존성 문제를 해결하기 위해 Transformer 기반의 모델이 제안되어왔으나, RNN 기반 모델에 비해서 낮은 성능을 보였는데, Transformer 모델의 과적합 문제가 그 원인일 수 있다. 해당문제를 완화하도록, 본 논문에서는, 큰 decoder 모델을 간단한 순방향 신경망으로 변환하는 모델을 제안한다. 실험결과, 제안된 모델이 기존 최고 성능 모델을 주요 지표들에서 앞서며, 다른 지표에서도 유사한 성능을 보이는 것을 확인했다. 또한, 제안하는 모델을 SARs-CoV-2 (COVID-19) 바이러스에 대항할 수 있는 신약 후보 생성에 적용하였고, 그렇게 생성된 신약 후보군들이 현재 시장에서 사용되는 약들인 Paxlovid, Molnupiravir, Remdesivir들 보다 더 효과적인 실험결과를 확인하였다.