돌연변이 단백질에 대한 사전 학습 대규모 언어 모델 기반 약물-표적 결합 친화도 예측 


52권  6호, pp. 539-547, 6월  2025
10.5626/JOK.2025.52.6.539


PDF

  요약

신약 개발은 높은 비용과 긴 시간이 소요되며, 특히 단백질 돌연변이가 약물-표적 결합 친화도에 미치는 영향을 정량적으로 예측하는 것은 중요한 과제이다. 기존 연구에서는 아미노산 서열 처리를 위해 LSTM과 트랜스포머 모델이 활용되었으나, LSTM은 장기 의존성 문제, 트랜스포머는 높은 연산 비용의 한계를 가진다. 반면, 사전 학습된 거대 언어 모델(pLLM)은 긴 시퀀스 처리에 강점을 가지지만, 프롬프트 기반 접근만으로는 정확한 결합 친화도 예측이 어렵다. 본 연구에서는 pLLM을 활용하여 단백질 구조 데이터를 임베딩 벡터로 변환하고, 별도의 머신러닝 모델로 결합 친화도를 예측하는 방법을 제안한다. 실험 결과, 제안된 방법은 기존 LSTM 및 프롬프트 접근법보다 우수한 성능을 보였으며, 돌연변이 특이적 예측에서도 낮은 RMSE와 높은 PCC를 기록하였다. 또한, pLLM 모델의 양자화에 따른 성능 분석을 통해 낮은 연산 비용으로도 충분한 성능을 발휘할 수 있음을 확인하였다.


  통계
2022년 11월부터 누적 집계
동일한 세션일 때 여러 번 접속해도 한 번만 카운트됩니다. 그래프 위에 마우스를 올리면 자세한 수치를 확인하실 수 있습니다.


  논문 참조

[IEEE Style]

T. Song, J. H. Kim, H. J. Park, J. Choi, "Pretrained Large Language Model-based Drug-Target Binding Affinity Prediction for Mutated Proteins," Journal of KIISE, JOK, vol. 52, no. 6, pp. 539-547, 2025. DOI: 10.5626/JOK.2025.52.6.539.


[ACM Style]

Taeung Song, Jin Hyuk Kim, Hyeon Jun Park, and Jonghwan Choi. 2025. Pretrained Large Language Model-based Drug-Target Binding Affinity Prediction for Mutated Proteins. Journal of KIISE, JOK, 52, 6, (2025), 539-547. DOI: 10.5626/JOK.2025.52.6.539.


[KCI Style]

송태웅, 김진혁, 박현준, 최종환, "돌연변이 단백질에 대한 사전 학습 대규모 언어 모델 기반 약물-표적 결합 친화도 예측," 한국정보과학회 논문지, 제52권, 제6호, 539~547쪽, 2025. DOI: 10.5626/JOK.2025.52.6.539.


[Endnote/Zotero/Mendeley (RIS)]  Download


[BibTeX]  Download



Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr