디지털 라이브러리[ 검색결과 ]
신약 후보 물질의 ADMET 속성 예측을 위한 사전학습 모델 기반의 일반화 성능 향상 기법
http://doi.org/10.5626/JOK.2025.52.7.601
신약 개발 과정에서 ADMET(흡수, 분포, 대사, 배설, 독성) 속성의 정확한 예측은 임상 시험 실패율을 낮추고 개발 비용을 절감하는 데 중요한 역할을 한다. 본 연구에서는 그래프 트랜스포머 기반의 분자 임베딩과 사전 학습된 UniMol 모델 기반의 임베딩을 결합하여 신약 후보 물질의 ADMET 예측 성능을 높이는 방법을 제안한다. 제안된 모델은 분자의 그래프 구조에서 결합 유형 정보를 반영하여 보다 화학적으로 정교한 표현을 생성하며, UniMol의 사전 학습된 3D 임베딩을 활용하여 분자의 공간적 특성을 효과적으로 학습한다. 이를 통해 데이터 부족 문제를 보완하고, 모델의 일반화 성능을 향상시킬 수 있도록 설계하였다. 본 연구에서는 총 10개의 ADMET 속성을 대상으로 예측 실험을 수행하였다. 실험 결과, 제안된 모델은 기존 방법들보다 우수한 예측 성능을 보였으며, 원자의 결합 정보와 3D 구조를 효과적으로 통합함으로써 ADMET 속성 예측의 정확도를 향상시킬 수 있음을 확인하였다.
질병 연관 유전자 발굴을 위한 이종적인 어텐티브 그래프 합성곱 신경망
http://doi.org/10.5626/JOK.2025.52.2.161
유전자-질환 연관성 예측은 질병 메커니즘 이해 및 유전자 타겟 발굴에 필수적이나, 실험실 환경에서의 검증 방식은 시간과 비용이 많이 든다. 딥러닝, 특히 그래프 신경망이 이 문제 해결에 큰 가능성을 보여주었으나, 기존 모델들은 유전자, 질병 등 생물학적 개념들 사이 이종성을 모델 의사결정에 반영하지 못 하거나, 이종성 정보를 인간이 직접 정의해야 했다. 이러한 문제를 해결하기 위해 본 연구는 이종적인 어텐티브 그래프 합성곱 신경망 (HAGCN)을 제안한다. HAGCN은 유전자, 질병 등 이종적 개념들의 연관관계 그래프를 입력 데이터로 사용한다. 본 연구는 입력 데이터 구축을 위해 Gene Ontology, Disease Ontology, Human Phenotype Ontology, TBGA 와 같이 큐레이션 된 데이터베이스들로부터 연관관계정보를 얻었다. HAGCN은 어텐션 메커니즘을 사용해 메타-패스 없이 생물학적 개념들 연관관계의 이종성 정보를 학습한다. HAGCN은 유전자-질환 연관성 예측에서 AUROC 최고 성능을 달성했으며, 다른 지표에서도 비교모델 대비 경쟁력을 보였다. 본 연구는 HAGCN을 통해 질병 연관 유전자 발견을 가속화 하고, 계산 신약 개발 분야 발전에 기여하는 것을 그 목표로 한다.
딥러닝을 이용한 약물 화학 구조 예측
http://doi.org/10.5626/JOK.2021.48.2.234
신약 개발에 필요한 시간과 비용을 줄이기 위해서 많은 컴퓨터 기반 방법들이 연구되고 있다. 특히 최근 딥러닝 기법의 발전과 함께 후보 화합물의 화학식을 생성하기 위한 여러 가지 생성 모델(Generative model) 및 조건에 맞는 화학식을 생성하기 위한 강화학습 모델(Reinforcement learning model) 이 많이 연구되고 있다. 본 논문에서는 화합물과 단백질 간의 예측된 결합 친화력 정보를 이용한 강화학습 모델을 제시한다. 구체적으로, 본 논문에서 사용하고 있는 생성 모델은 Stack-RNN이며, 생성된 화학식이 특정한 화학적 특성을 가짐과 동시에 특정한 단백질과 높은 결합 친화력을 가지도록 Stack-RNN을 에이전트로 이용함으로써 강화학습을 구현한다. 본 논문에서는 소라페닙(Sorafenib), 수니티닙(Sunitinib), 다사티닙(Dasatinib)의 3가지 항암제들이 가지는 표적 단백질 정보를 이용하여 해당 항암제와 유사한 화합물의 화학식을 생성해 보았다.
딥러닝을 이용한 화합물-단백질 상호작용 예측
http://doi.org/10.5626/JOK.2019.46.10.1054
화합물과 단백질 간의 상호작용을 특성화하는 것은 약물 개발 및 탐색을 위해 중요한 과정이다. 상호작용을 파악하기 위해 단백질과 화합물의 구조 데이터를 이용하지만 그 구조가 알려져 있지 않은 경우도 많으며, 많은 계산 양으로 인해 예측의 속도와 정확도도 떨어질 수 있다는 한계가 있다. 본 논문에서는 기계번역에서 사용되는 sequence-to-sequence 알고리즘과 입력벡터를 효과적으로 축소시키기 위한 오토 인코더를 결합한 모델인 S2SAE (Sequence-To-Sequence Auto-Encoder)를 이용하여 화합물-단백질 상호작용을 예측하였다. 본 논문에서 제안한 방법은 기존의 복합체를 나타내는 표현들보다 적은 수의 특징들을 이용하여 상호작용을 예측할 수 있으며, 기존의 방법보다 높은 예측 정확도를 보여주었다.