검색 : [ author: 최종환 ] (3)

돌연변이 단백질에 대한 사전 학습 대규모 언어 모델 기반 약물-표적 결합 친화도 예측

송태웅, 김진혁, 박현준, 최종환

http://doi.org/10.5626/JOK.2025.52.6.539

신약 개발은 높은 비용과 긴 시간이 소요되며, 특히 단백질 돌연변이가 약물-표적 결합 친화도에 미치는 영향을 정량적으로 예측하는 것은 중요한 과제이다. 기존 연구에서는 아미노산 서열 처리를 위해 LSTM과 트랜스포머 모델이 활용되었으나, LSTM은 장기 의존성 문제, 트랜스포머는 높은 연산 비용의 한계를 가진다. 반면, 사전 학습된 거대 언어 모델(pLLM)은 긴 시퀀스 처리에 강점을 가지지만, 프롬프트 기반 접근만으로는 정확한 결합 친화도 예측이 어렵다. 본 연구에서는 pLLM을 활용하여 단백질 구조 데이터를 임베딩 벡터로 변환하고, 별도의 머신러닝 모델로 결합 친화도를 예측하는 방법을 제안한다. 실험 결과, 제안된 방법은 기존 LSTM 및 프롬프트 접근법보다 우수한 성능을 보였으며, 돌연변이 특이적 예측에서도 낮은 RMSE와 높은 PCC를 기록하였다. 또한, pLLM 모델의 양자화에 따른 성능 분석을 통해 낮은 연산 비용으로도 충분한 성능을 발휘할 수 있음을 확인하였다.

AttDRP: 주의집중 메커니즘 기반의 항암제 약물 반응성 예측 모델

최종환, 서상민, 박상현

http://doi.org/10.5626/JOK.2021.48.6.713

암환자 중 일부는 항암제에 대한 약물 저항성을 보여 약물을 이용한 항암치료를 어렵게 만든다. 약물 저항성은 암세포의 유전체 이상에 기인하는 것으로 밝혀져, 암세포주 및 항암제에 대한 약물 반응성 데이터를 분석하는 연구가 활발히 이루어지고 있다. 기존 연구들은 기계학습을 이용하여 약물 민감성 또는 저항성을 예측하는 모델을 여럿 제안하였으나, 항암제와 유전자의 관계를 학습하는 모델의 부재로 인하여 예측 정확도 향상을 위한 여지가 남아있었다. 본 논문에서는 주의집중 메커니즘을 활용하여 항암제 관련 유전자들을 식별하고, 그러한 유전자들 정보에 기반하여 항암제 반응성을 예측하는 AttDRP를 제안한다. 제안하는 모델은 CCLE 데이터에서 기존 모델들보다 높은 예측 정확도를 보여주었고, AttDRP이 학습한 주의집중 스코어가 항암제의 분자구조 분석에 효과적으로 활용될 수 있음을 확인하였다.

페이지랭크를 이용한 암환자의 이질적인 예후 유전자 식별 및 예후 예측

최종환, 안재균

http://doi.org/10.5626/JOK.2018.45.1.61

암환자의 예후 예측에 기여하는 유전자를 찾는 것은 환자에게 보다 적합한 치료를 제공하기 위한 도전 과제 중 하나이다. 예후 유전자를 찾기 위해 유전자 발현 데이터를 이용한 분류 모델 개발 연구가 많이 이루어지고 있다. 하지만 암의 이질성으로 인해 예후 예측의 정확도 향상에 한계가 있다는 문제가 있다. 본 논문에서는 유방암을 비롯한 6개의 암에 대한 암환자의 마이크로어레이 데이터와 생물학적 네트워크 데이터를 이용하여 페이지랭크 알고리즘을 통해 예후 유전자들을 식별하고, K-Nearest Neighbor 알고리즘을 사용하여 암 환자의 예후를 예측하는 모델을 제안한다. 그리고 페이지랭크를 사용하기 전에 K-Means 클러스터링으로 유전자 발현 패턴이 비슷한 샘플들을 나누어 이질성을 극복하고자 한다. 본 논문에서 제안한 방법은 기존의 유전자 바이오마커를 찾는 알고리즘보다 높은 예측 정확도를 보여주었으며, GO 검증을 통해 클러스터에 특이적인 생물학적 기능을 확인하였다.


Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr