디지털 라이브러리[ 검색결과 ]
의료 과학 연구를 위한 설명가능 그래프 인공 신경망
http://doi.org/10.5626/JOK.2022.49.11.999
설명가능 인공지능(Explainable AI, XAI)은 알고리즘의 예측 결과를 사용자 관점에서 이해할 수 있도록 설명력을 제공하는 기술이다. 의료 분야는 인공지능의 의사결정에 대한 신뢰도가 보장되어야 하므로, 의사 결정의 도출 과정을 설명하는 XAI의 활용이 필수적이다. 하지만 대부분의 XAI 기술은 이미지나 텍스트 데이터를 대상으로 개발되었기 때문에 다양한 상호작용을 기반으로 하는 그래프 구조의 의료 데이터에 그대로 적용하기에는 한계가 존재한다. 따라서 데이터의 복잡한 관계성을 효과적으로 파악할 수 있는 그래프 인공 신경망(Graph Neural Network, GNN) 기반의 XAI 연구가 요구되고 있다. 본 논문에서는 GNN 기반 XAI 기술의 적용 방식과 알고리즘에 따른 분류 체계를 제안하고, 의료 분야의 네 가지 세부 영역에서 XAI를 활용한 연구 동향과 사례를 소개한다. 마지막으로 생명 의료 분야에 적용된 XAI 연구의 한계점과 향후 발전 방향을 제시한다.
추가 정보를 고려한 상품 리뷰 요약 기법
http://doi.org/10.5626/JOK.2020.47.2.180
문서 요약은 주어진 문서로부터 특정 사용자나 작업에 적합한 형태로 축약한 문서를 생성하는 것을 의미한다. 인터넷 사용이 증가함에 따라, 텍스트를 포함한 다양한 데이터들이 폭발적으로 증가하고 있고, 문서 요약 기술이 지니는 가치는 증대되고 있다. 최신 딥러닝 기반 모델들이 좋은 요약 성능을 보이지만, 학습 데이터들의 양과 질에 따라 성능이 좌우되는 문제점이 있다. 예를 들어, 온라인 쇼핑몰의 상품리뷰 데이터의 경우, 오탈자와 비문법적인 텍스트 특징 때문에 기존 모델로 좋은 요약을 생성하기 힘들다. 이러한 문제를 해결하려고 온라인 쇼핑몰과 포탈 서비스가 많은 노력을 하고 있다. 따라서 본 연구에서는 리뷰 학습 데이터의 양과 질이 열악하더라도 적절한 문서 요약을 생성하기 위해, 주어진 상품 리뷰의 추가 정보를 이용해서 상품 리뷰 요약을 생성하는 모델을 제안한다. 더불어, 실험을 통해 제안한 기법의 문서 요약이 기존 기법보다 요약의 관련성과 가독성 측면에서 향상되었음을 보였다.
인공 신경망과 웨이블릿 변환을 이용한 주가 지수 예측
http://doi.org/10.5626/JOK.2019.46.12.1249
기계학습 기술과 인공신경망 기술의 발전과 함께 주식시장의 흐름을 예측하려는 연구가 다양하게 시도되어 왔다. 특히 영상, 음성 처리를 위한 인공신경망 기술들이 주식시장 예측에 도입되어 예측의 정확도를 향상시키고 있다. 본 논문에서는 KOSPI의 지수변화와 방향성을 예측하기 위해 추출한 기술적 지표를 웨이블릿 변환을 이용하여 고주파수부분과 저주파수부분으로 나누어 인공신경망에서 각각 독립적으로 학습하고 예측한 다음, 고주파수부분과 저주파수부분을 합하여 지수와 방향성을 최종 예측하였다. 인공신경망으로 합성곱신경망, Dual Path Network 그리고 LSTM을 사용하여 인공신경망 간의 성능비교와 웨이블릿 변환의 효용성을 분석하였다. 지수예측에서는 합성곱신경망이 MAPE 0.51%, 등락예측에서는 LSTM이 정확도 81.7%로 최적의 결과를 보였고, 웨이블릿 변환으로 향상된 성능은 지수 예측의 경우 평균 38%, 등락 예측의 경우 평균 25%를 얻어 웨이블릿 변환의 효용성을 확인하였다.
단어 특징의 의미적 보강을 이용한 트위터 뉴스 분류 기법
http://doi.org/10.5626/JOK.2018.45.10.1045
최근 많은 사람들이 트위터를 뉴스 플랫폼으로 활용하면서 많은 뉴스 기사가 끊임없이 생성되고, 기사와 관련된 다양한 정보와 의견들이 빠르게 확산되고 있다. 그러나 트위터 뉴스는 동시다발적으로 포스팅되기 때문에 사용자가 원하는 주제의 기사를 선별하여 보기가 어렵다는 문제가 있다. 이를 위해, 트위터 뉴스를 주제별로 분류하기 위한 기계 학습과 딥러닝 기반의 다양한 연구들이 진행되었다. 하지만 통상적인 기계 학습 기법은 트위터 뉴스를 임베딩하는 과정에서 데이터 희소성이나 시맨틱 갭의 문제가 발생할 수 있으며, 딥러닝 기법은 많은 양의 데이터를 필요로 한다. 이러한 단점을 개선하기 위해, 본 논문에서는 적은 양의 데이터로도 데이터 희소성과 시맨틱 갭 문제를 해결할 수 있는 방법으로, 단어 특징의 의미적 보강을 이용한 트위터 뉴스 분류 기법을 제안한다. 구체적으로 먼저, 벡터 공간 모델을 이용하여 수집된 트위터 뉴스 데이터의 특징을 추출하고, DBpedia Spotlight를 통해 DBpedia의 자원과 온톨로지 정보를 반영하여 추출된 특징을 보강한다. 보강된 특징 단어 집합을 이용하여 다양한 기계 학습 기법 기반의 주제별 분류모델을 구성하고, 다양한 실험을 통해 제안하는 모델이 기존의 기법들보다 더 효과적임을 보인다.