디지털 라이브러리[ 검색결과 ]
노출 편향 문제에 효과적인 대화 단위 RNN-CNN 기반의 화행 분석 시스템
http://doi.org/10.5626/JOK.2018.45.9.911
화행(Speech-Act)이란 화자의 발화를 통해 나타나는 화자의 의도를 말하며 화행 분석(Speech-Act Analysis)이란 주어진 발화에 대해 화행을 결정하는 것을 말한다. 최근에는 말뭉치를 이용한 기계 학습 기반의 연구가 많이 이루어지고 있고 본 논문에서는 다음과 같은 두 가지를 연구 목표로 한다. 첫 번째, 대화에서의 발화는 연속적이며 서로 유기적으로 관련되어 있고 현재 발화의 화행은 바로 이전 발화의 화행에 많은 영향을 받는다. 두 번째, 기존의 연구는 화행 분석 모델에서 이전 발화의 화행 결과를 사용할 때 노출 편향 문제(Exposure Bias Problem)를 다루지 않았다. 따라서 본 논문에서는 대화단위의 화행 분석 모델인 RNN-CNN을 제안하고, 노출 편향 문제에 대한 실험을 추가로 진행한다. 최종적으로 제안하는 모델은 oracle 조건에서 86.87%의 성능을 얻었고, greedy 조건에서는 0.6%p 낮은 86.27%의 성능을 얻었다.
위키피디아 기반의 효과적인 개체 링킹을 위한 NIL 개체 인식과 개체 연결 중의성 해소 방법
http://doi.org/10.5626/JOK.2017.44.8.813
개체 링킹은 입력된 질의에 존재하는 개체를 표현한 개체 표현(entity mention)을 지식베이스에 존재하는 개체와 연결하여 의미를 파악하는 연구이다. 개체 링킹에 관한 연구는 지식 베이스 구축 문제, 다중 표현 문제, 개체 연결 중의성 문제, NIL 개체 인식 문제가 존재한다. 본 연구에서는 지식 베이스 구축 문제와 다중 표현 문제를 해결하기 위해 위키피디아를 기반으로 개체 이름 사전을 구축한다, 또한, 문맥 유사도, 의미적 관련성, 단서 단어 점수, 개체 표현의 개체명 타입 유사도, 개체 이름 매칭 점수, 개체인기도 점수 자질들을 기반으로 SVM(support vector machine)을 학습하여, NIL 개체를 인식하는 문제와 개체 연결 중의성을 해소하는 방법을 제안한다. 구축한 지식 베이스를 기반으로 제안한 두 방법을 순차적으로 적용하였을 때 좋은 개체 링킹 성능을 얻었다. 개체 링킹 시스템의 성능은 NIL 개체 인식 성능이 83.66%, 중의성 해소 성능이 90.81%의 F1 점수를 보였다.