디지털 라이브러리[ 검색결과 ]
순차 모형과 언어 자질 벡터를 이용한 한국어 토론 데이터의 선형 논증 구조 분석
http://doi.org/10.5626/JOK.2018.45.12.1292
토론 데이터의 논증 구조 분석을 위한 기존의 연구는 문서를 이루는 문장들 간의 담화 관계와 핵성에 기반한 트리 구조 형태의 논증 구조를 제안한 것이 대부분이다. 이 때 상대적 관계들을 조합하여 한 편의 문서에 대응하는 논증 구조를 구성하는 과정에서 관계 간의 불일치가 발생할 위험이 있다. 본 연구에서는 문서가 다루는 주제 자체와 문장 간의 관계를 상정하고 이를 논증상의 기능에 따라 유형화한 논증 구조 프레임을 제안한다. 또한 각 문장에 해당하는 논증 유형을 문서 단위로 순차 모형에 적용시켜, 논증 구조의 자동 분석 과정에서 문서 내 맥락 정보를 이용할 수 있도록 한다. 형태소의 bag-of-words와 단어 임베딩, 언어 자질을 각각 이용하여 문장들을 벡터화하고, 이에 순차 모델링을 비롯한 기계학습 방식을 적용하여 논증 유형의 예측 결과를 관찰하였다. 이 때 언어 자질을 이용하여 벡터화한 문장들에 순차모형을 적용한 경우 F1-score가 0.68로 가장 높게 나타났다.
한국어 수업 대화의 화행 분석과 화행 자동분류를 위한 언어학적 기반연구
http://doi.org/10.5626/JOK.2018.45.8.807
화행이란 의사소통 과정에서 발화자가 가지는 발화 의도를 말한다. 성공적인 의사소통을 위해서는 발화자의 화행을 정확하게 파악하는 것이 매우 중요하다. 본 논문에서는 한국어 대화체 문장의 화행자동분류를 위해, 화행을 결정짓는 요인이 무엇인지 언어학적으로 분석하고자 하였다. 한국어 수업 대화를 분석하여 화행 분류 체계를 자체 정립하였고, 언어학적 근거를 바탕으로 13개의 화행 분류 자질을 제안하였다. 또한, 제안하는 화행 분류 자질을 검증하고자 웨카(Weka)를 이용하여 정확률 실험을 진행하였다. 본 연구에서 제안한 다양한 언어학적 자질을 이용하여 발화의 화행을 자동분류한 경우 70.03%의 정확률을 보였다. 이는 유니그램과 바이그램만으로 화행을 자동분류한 베이스라인에 비해 약 30%p의 정확률이 향상된 결과이다.