디지털 라이브러리[ 검색결과 ]
단일 분자화합물의 폐 발암성 예측을 위한 그래프 신경망 접근법
http://doi.org/10.5626/JOK.2025.52.6.482
암은 전 세계적으로 매년 수백만 명의 사망자를 초래하는 주요 질환 중 하나로, 특히 폐암은 2022년 한국에서 암 중 가장 높은 사망률을 기록했다. 이에 따라 폐암을 유발하는 화합물에 대한 연구가 필수적이며, 본 연구는 기존 기계학습 및 딥러닝 방법의 한계를 극복하고, 그래프 신경망을 활용하여 폐암 유발 가능성을 예측하는 새로운 접근방식을 제안하고 평가했다. 화합물 발암성 데이터베이스인 CPDB, CCRIS, IRIS, T3DB의 SMILES(Simplified Molecular Input Line Entry System) 정보를 기반으로 분자의 구조와 화학적 성질을 그래프 데이터로 변환해 학습했으며, 제안된 모델은 다른 모델 대비 우수한 예측 성능을 보였다. 이는 폐암 예측에 효과적인 도구로서 그래프 신경망의 잠재력을 입증하며, 향후 암 연구와 치료 개발에 중요한 기여를 할 수 있음을 시사한다.
이종 그래프 간의 융합 모듈을 활용한 목적 지향 대화 응답 시스템
http://doi.org/10.5626/JOK.2024.51.10.882
목적 지향 대화 시스템(Task-Oriented Dialogue System)은 특정 업무를 달성하기 위해 시스 템이 대화를 통해 사용자에게 도움을 주는 것을 목적으로 하는 자연어 처리의 분야이다. 최근에는 목적 지 향 대화 시스템의 성능 향상을 위해 트랜스포머(Transformer) 기반의 사전 학습 언어 모델이 널리 활용 되고 있다. 본 논문에서는 보다 전문적인 응답을 생성하기 위해서 사전 학습 언어 모델에 외부지식을 통합 하여, 트랜스포머 기반의 언어 모델에 그래프 어텐션 네트워크를 사용하여 지식 그래프 형태의 데이터를 추가적으로 융합하는 시스템을 제안한다. 또한 두 개 이상의 그래프에 대해 연구를 확장하여 이종 그래프 의 정보를 사용한 대화 응답 생성을 실험했다. 본 논문에서는 제안 시스템을 검증하기 위해 2,076개 대화 와 226,823개의 음악 도메인 그래프 트리플로 이루어진 음악 도메인 기반의 대화 데이터를 구축하고 공개 했다. 실험으로 살펴본 최종 제안 모델의 성능은 KoBART 모델을 미세조정(Fine-tuning)한 응답 생성 방 식에 비해 ROUGE-1 13.83%p, ROUGE-2 8.26%p, ROUGE-L 13.5%p의 성능 향상을 보였다.
날씨 특성을 고려한 그래프 임베딩 기반 관심 장소 추천
http://doi.org/10.5626/JOK.2022.49.3.221
관심 장소 추천은 위치 기반 서비스들이 빠르게 증가하면서 사용자들에게 그들의 위치와 관련된 적절한 정보를 제공하고자 활발히 연구되고 있는 분야이다. 최근 TransRec과 같이 그래프 임베딩을 사용한 번역 기반 추천 시스템이 큰 관심을 받고 있다. 본 논문은 TransRec이 사용자와 장소 사이의 복잡한 관계를 표현하기 어렵고, 관계 임베딩이 날씨 특성을 고려하지 않고 고정되어 있다는 단점을 발견하였다. TransRec의 단점을 극복하고자, 날씨를 고려한 그래프 임베딩 기반 관심 장소 추천 기법 WAPTRec을 제안한다. WAPTRec은 범주 투영 행렬과 어텐션 메커니즘을 사용하여 동일한 장소 임베딩을 사용자마다 다르게 표현할 수 있다. 또한, 사용자의 과거 이동 기록과 장소의 범주, 그리고 날씨 특성을 활용하여 더 높은 추천 정확도를 제공한다. 공개 데이터 셋을 이용한 실험을 통해 WAPTRec이 기존의 번역 기반 추천 방법들보다 뛰어남을 보인다.
트랜스포머 기반 한국어 텍스트 요약 모델의 순차적 문맥 학습 영향성 분석
http://doi.org/10.5626/JOK.2021.48.10.1097
텍스트 요약 기술은 전체 텍스트 내용이 가지는 의미를 유지하면서도 텍스트의 길이를 줄여, 정보 과적재 문제를 해결하고 독자의 빠른 정보 소비를 돕는다. 이를 위해 트랜스포머 기반의 영어 텍스트 요약 모델에 대한 연구가 활발히 진행되고 있다. 최근에는 RNN 기반의 인코더를 추가하여 고정된 어순을 갖는 영어의 특성을 반영한 추상 텍스트 요약 모델이 제안되기도 했다. 본 논문은 영어보다 자유로운 어순을 갖는 한국어에 대해 RNN 기반의 인코더를 이용하여, 텍스트 추상 요약 모델에 순차적 문맥 학습이 어떠한 영향을 미치는지 연구하였다. 직접 수집한 한국어 기사에 대해 트랜스포머 기반 모델과 기존 트랜스포머에 RNN 기반 인코더를 추가한 모델을 학습하여 제목 생성 및 기사 내용 요약 성능을 분석하였다. 실험 결과, RNN 기반의 인코더를 추가한 모델이 더 높은 성능을 보였으며, 한국어 텍스트의 추상 요약 수행 시, 순차적인 문맥 학습이 필요함을 확인하였다.
EFA-DTI: Edge Feature Attention을 활용한 약물-표적 상호작용 예측
에르햄바야르 자담바, 김수헌, 이현수, 김화종
http://doi.org/10.5626/JOK.2021.48.7.825
신약개발은 의약 화학, 시스템 및 구조 생물학, 더 나아가 인공지능에 이르기까지 다양한 학문을 필요로 하기 때문에 난이도가 높은 분야라고 할 수 있다. 특히, 약물-표적 상호작용(DTI) 예측은 방대한 양의 화합물로부터 질병을 치료할 수 있는 후보 물질을 도출해내는 과정으로, 신약 개발 과정에 있어 핵심 요소다. 최근에는 컴퓨터 성능이 비약적으로 발전함에 따라, DTI 예측에 소요되는 여러 측면의 비용을 줄이고자 인공지능 신경망을 활용하는 연구가 활발히 진행되고 있다. 따라서, 본 논문에서는 Edge Feature Attention을 적용한 Graph Net Embedding 및 Fingerprint를 활용한 약물 표현 생성과 ProtTrans를 활용한 단백질 표현 생성을 통해 약물과 표적 단백질 간의 상호작용 수치를 예측하는 모델을 제안한다. 해당 모델은 기존의 DTI 연구에서 가장 좋은 성능을 보였던 DeepDTA, GraphDTA보다 높은 성능을 달성하였으며, 이에 대한 실험 및 결과를 기술하였다.
Explanation segments 기반 설명 가능한 지식 완성 모델
http://doi.org/10.5626/JOK.2021.48.6.680
최근 딥러닝을 활용하여 불완전한 지식 그래프를 대상으로 새로운 링크를 예측하는 연구가 많이 진행되고 있지만, 딥러닝을 활용한 링크 예측은 추론 결과에 대한 설명이 불가능하다는 한계점이 있다. 따라서 본 논문에서는 링크 예측 후, 추론 결과를 뒷받침하는 증거로서 설명 가능한 추론 경로를 제공하여 지식 완성의 효용성이 높은 모델을 제안한다. 이를 위해 우선 지식 그래프의 주어를 시작으로 목적어로 도달하는 또 다른 경로를 Path Ranking Algorithm 활용하여 생성하며, 이를 explanation segment라 정의하였다. 이 후 생성된 explanation segment를 CNN과 양방향 LSTM을 결합한 방식을 적용하여 임베딩 한다. 마지막으로 임베딩 된 explanation segment들과 추론할 후보 술어와의 의미적 유사성 계산을 기반으로 한 어텐션 메커니즘을 적용하여, 링크 예측 모델을 학습하였다. 모델 학습 후 링크 예측 설명에 적합한 explanation segment를 어텐션 점수에 기반으로 선정하여 제공한다. 제안하는 방법의 성능을 측정하기 위해 링크 예측 비교 실험 및 링크 예측 결과에 대한 설명으로 적합한 explanation segment의 비율을 측정하는 정확성 검증 실험을 진행하였다. 실험 데이터는 벤치마크 데이터인 NELL-995, FB15K-237, Countries를 대상으로 진행하였으며, 정확성 검증 실험에서 평균 89%. 44%, 97% 정확성을 보였고, 기존 연구와 비교했을 때, NELL-995는 평균 35%p, FB15K-237은 평균 21%p 높은 성능을 보였다.
문장 랭킹 스코어와 그래프 기법을 사용한 질의 기반 생성 요약 모델
http://doi.org/10.5626/JOK.2020.47.12.1172
기본적인 생성 요약 모델은 문서 내 모든 중요 내용을 포함하는 짧은 요약문을 생성하는 것을 목표로 한다. 반면, 질의(Query) 기반 생성 요약 모델의 경우 문서 내에서 질의와 관련된 정보를 요약해야 한다. 기존의 질의 기반 요약 모델은 문서 내 단어들과 질의문 간의 어텐션(Attention) 메커니즘을 통해 단어의 가중치를 계산하고 이를 기반으로 문장의 중요도를 계산한다. 이러한 방식은 문서의 전체적인 문맥정보를 반영하기 어렵다는 단점이 있다. 본 논문에서는 이러한 문제를 문장 랭킹 스코어와 문장 단위 그래프 구조를 만들어 문장의 중요도뿐만 아니라 문맥 정보를 반영하여 생성 요약의 성능을 향상시킬 수 있는 새로운 생성 요약 기법을 제안한다. 실험으로 살펴본 최종 제안 모델의 성능은 같은 데이터를 사용하는 선행 모델 대비 ROUGE-1 1.44%p, ROUGE-L 0.52%p의 향상된 성능을 보인다.