디지털 라이브러리[ 검색결과 ]
신약 후보 물질의 ADMET 속성 예측을 위한 사전학습 모델 기반의 일반화 성능 향상 기법
http://doi.org/10.5626/JOK.2025.52.7.601
신약 개발 과정에서 ADMET(흡수, 분포, 대사, 배설, 독성) 속성의 정확한 예측은 임상 시험 실패율을 낮추고 개발 비용을 절감하는 데 중요한 역할을 한다. 본 연구에서는 그래프 트랜스포머 기반의 분자 임베딩과 사전 학습된 UniMol 모델 기반의 임베딩을 결합하여 신약 후보 물질의 ADMET 예측 성능을 높이는 방법을 제안한다. 제안된 모델은 분자의 그래프 구조에서 결합 유형 정보를 반영하여 보다 화학적으로 정교한 표현을 생성하며, UniMol의 사전 학습된 3D 임베딩을 활용하여 분자의 공간적 특성을 효과적으로 학습한다. 이를 통해 데이터 부족 문제를 보완하고, 모델의 일반화 성능을 향상시킬 수 있도록 설계하였다. 본 연구에서는 총 10개의 ADMET 속성을 대상으로 예측 실험을 수행하였다. 실험 결과, 제안된 모델은 기존 방법들보다 우수한 예측 성능을 보였으며, 원자의 결합 정보와 3D 구조를 효과적으로 통합함으로써 ADMET 속성 예측의 정확도를 향상시킬 수 있음을 확인하였다.
멀티모달 그래프-SMILES 표현을 통한 거대 언어 모델에서의 분자 이해 향상
http://doi.org/10.5626/JOK.2025.52.5.379
최근 거대 언어 모델의 발전은 다양한 과업에서 뛰어난 성과를 보이며, 특히 멀티모달로 확장하는 연구도 활발히 진행되고 있다. 특히 BLIP-2는 Q-Former를 통해 이미지와 문자를 효율적으로 정렬하여 성능을 높였으며, 멀티모달 데이터로 사전 학습되어 고정된 이미지 인코더가 이를 지원한다. 이러한 발전에 영감을 받아 MolCA 모델은 분자 분야에 BLIP-2를 확장하여 성능을 높였지만, 그래프 인코더는 단일모달 데이터로 사전 학습되어 모델 학습 중 갱신이 필요한 한계가 있다. 따라서 본 논문에서는 이를 멀티모달 데이터로 사전 학습된 그래프 인코더로 대체하고 고정하는 방안을 제시한다. 실험 결과, 멀티모달 데이터로 사전 학습된 그래프 인코더를 사용할 때 성능이 대체로 향상되었으며, 단일모달 데이터로 사전 학습된 그래프 인코더는 갱신할 때 성능이 높은 것에 비해 멀티모달 데이터로 사전 학습된 그래프 인코더는 갱신하지 않을 때 모든 지표에서 성능이 더 좋은 것을 확인할 수 있었다.
그래프 동형 모델을 이용한 탈수소화 엔탈피 예측
http://doi.org/10.5626/JOK.2024.51.5.406
본 논문은 분자의 구조 정보를 이용하는 기존의 물성 예측 접근에 그래프 합성곱 신경망 모델을 병합하여 분자 임베딩을 생성, 이상적인 액상유기수소운반체 선정에 중요한 역할을 하는 탈수소화 엔탈피를 예측하는 연구를 소개한다. 제안하는 방법은 그래프 합성곱 모델 중 가장 좋은 표현력을 가진 것으로 알려진 그래프 동형 모델(Graph Isomorphism Network)을 사용했으며, 해당 모델을 통해 개별 분자를 구성하는 원자 정보를 바탕으로 분자 임베딩을 생성했을 때, 기존의 물리화학(chemical physics) 이론에 기반한 알고리즘에 비해 탈수소화 엔탈피를 예측하는데 더 적합한 임베딩을 생성할 수 있음을 관찰하였다. 또한 생략 연결 (skip connection)을 사용하여 깊은 그래프 합성곱 층을 구성할 수 있으며, 작은 배치 사이즈로 모델을 학습할 때 모델의 성능이 증가하는 경향성을 관찰한 내용을 보고한다.
분자 그래프 분류에서의 설명 가능한 인공지능
http://doi.org/10.5626/JOK.2024.51.2.157
인공지능의 발전과 함께 설명 가능한 인공지능의 필요성이 점점 커지고 있다. 최근에는 그래프 신경망 기반의 설명 가능한 인공지능 연구도 활발히 진행되고 있으나, 주로 일반적인 그래프에 초점을 두고 있다. 분자 그래프의 화학적 특성에 의존하는 특징 때문에, 현존하는 기법이 분자 그래프에서도 설명력을 제공할 수 있는지 파악하는 연구의 필요성을 강조한다. 본 논문에서는 분자 그래프에 기존의 기술을 적용하고, 이를 정량적 및 정성적으로 평가하여 설명력을 확인하였다. 더불어 중요한 특성의 비율을 통일한 후의 결과도 검토하여, 설명 가능한 인공지능의 평가 지표 중 하나인 희소성의 중요성을 강조하였다.
New Transformer Model to Generate Molecules for Drug Discovery
Yu-Bin Hong, Kyungjun Lee, DongNyenog Heo, Heeyoul Choi
http://doi.org/10.5626/JOK.2023.50.11.976
다양한 생성모델 기반의 신약 후보 생성 방법 중, 회귀적 신경망 (RNNs) 기반의 모델이 최고 성능을 보여왔다. RNN의 장기 의존성 문제를 해결하기 위해 Transformer 기반의 모델이 제안되어왔으나, RNN 기반 모델에 비해서 낮은 성능을 보였는데, Transformer 모델의 과적합 문제가 그 원인일 수 있다. 해당문제를 완화하도록, 본 논문에서는, 큰 decoder 모델을 간단한 순방향 신경망으로 변환하는 모델을 제안한다. 실험결과, 제안된 모델이 기존 최고 성능 모델을 주요 지표들에서 앞서며, 다른 지표에서도 유사한 성능을 보이는 것을 확인했다. 또한, 제안하는 모델을 SARs-CoV-2 (COVID-19) 바이러스에 대항할 수 있는 신약 후보 생성에 적용하였고, 그렇게 생성된 신약 후보군들이 현재 시장에서 사용되는 약들인 Paxlovid, Molnupiravir, Remdesivir들 보다 더 효과적인 실험결과를 확인하였다.
푸리에 변환과 Dense-SIFT를 이용한 비디오 기반 Face Spoofing 검출
얼굴 인식기반의 사용자 보안 시스템은 접근이 허가된 사용자의 사진이나 비디오를 이용한 공격에 취약하다는 단점을 가지고 있다. 본 연구에서는 인증되지 않은 사용자가 비디오를 이용하여 시스템에 접근할 경우 해당 공격 시도를 검출하기 위한 위변조(Spoof) 검출 방법을 제안한다. 제안하는 방법은 연속된 3개의 Frame에서 푸리에 변환과 Dense-SIFT 구분자를 사용하여 400개의 실제 및 위변조 비디오 영상을 대상으로 실험한 결과 99%의 검출 정확도를 보였다.