멀티모달 그래프-SMILES 표현을 통한 거대 언어 모델에서의 분자 이해 향상 


52권  5호, pp. 379-384, 5월  2025
10.5626/JOK.2025.52.5.379


PDF

  요약

최근 거대 언어 모델의 발전은 다양한 과업에서 뛰어난 성과를 보이며, 특히 멀티모달로 확장하는 연구도 활발히 진행되고 있다. 특히 BLIP-2는 Q-Former를 통해 이미지와 문자를 효율적으로 정렬하여 성능을 높였으며, 멀티모달 데이터로 사전 학습되어 고정된 이미지 인코더가 이를 지원한다. 이러한 발전에 영감을 받아 MolCA 모델은 분자 분야에 BLIP-2를 확장하여 성능을 높였지만, 그래프 인코더는 단일모달 데이터로 사전 학습되어 모델 학습 중 갱신이 필요한 한계가 있다. 따라서 본 논문에서는 이를 멀티모달 데이터로 사전 학습된 그래프 인코더로 대체하고 고정하는 방안을 제시한다. 실험 결과, 멀티모달 데이터로 사전 학습된 그래프 인코더를 사용할 때 성능이 대체로 향상되었으며, 단일모달 데이터로 사전 학습된 그래프 인코더는 갱신할 때 성능이 높은 것에 비해 멀티모달 데이터로 사전 학습된 그래프 인코더는 갱신하지 않을 때 모든 지표에서 성능이 더 좋은 것을 확인할 수 있었다.


  통계
2022년 11월부터 누적 집계
동일한 세션일 때 여러 번 접속해도 한 번만 카운트됩니다. 그래프 위에 마우스를 올리면 자세한 수치를 확인하실 수 있습니다.


  논문 참조

[IEEE Style]

, "Enhancing Molecular Understanding in LLMs through Multimodal Graph-SMILES Representations," Journal of KIISE, JOK, vol. 52, no. 5, pp. 379-384, 2025. DOI: 10.5626/JOK.2025.52.5.379.


[ACM Style]

. 2025. Enhancing Molecular Understanding in LLMs through Multimodal Graph-SMILES Representations. Journal of KIISE, JOK, 52, 5, (2025), 379-384. DOI: 10.5626/JOK.2025.52.5.379.


[KCI Style]

조우성, 강민준, 이재구, "멀티모달 그래프-SMILES 표현을 통한 거대 언어 모델에서의 분자 이해 향상," 한국정보과학회 논문지, 제52권, 제5호, 379~384쪽, 2025. DOI: 10.5626/JOK.2025.52.5.379.


[Endnote/Zotero/Mendeley (RIS)]  Download


[BibTeX]  Download



Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr