디지털 라이브러리[ 검색결과 ]
트랜스포머 기반 한국어 텍스트 요약 모델의 순차적 문맥 학습 영향성 분석
http://doi.org/10.5626/JOK.2021.48.10.1097
텍스트 요약 기술은 전체 텍스트 내용이 가지는 의미를 유지하면서도 텍스트의 길이를 줄여, 정보 과적재 문제를 해결하고 독자의 빠른 정보 소비를 돕는다. 이를 위해 트랜스포머 기반의 영어 텍스트 요약 모델에 대한 연구가 활발히 진행되고 있다. 최근에는 RNN 기반의 인코더를 추가하여 고정된 어순을 갖는 영어의 특성을 반영한 추상 텍스트 요약 모델이 제안되기도 했다. 본 논문은 영어보다 자유로운 어순을 갖는 한국어에 대해 RNN 기반의 인코더를 이용하여, 텍스트 추상 요약 모델에 순차적 문맥 학습이 어떠한 영향을 미치는지 연구하였다. 직접 수집한 한국어 기사에 대해 트랜스포머 기반 모델과 기존 트랜스포머에 RNN 기반 인코더를 추가한 모델을 학습하여 제목 생성 및 기사 내용 요약 성능을 분석하였다. 실험 결과, RNN 기반의 인코더를 추가한 모델이 더 높은 성능을 보였으며, 한국어 텍스트의 추상 요약 수행 시, 순차적인 문맥 학습이 필요함을 확인하였다.
데이터 분포의 균형화를 이용한 한국어 텍스트의 차원적 감성 분석
http://doi.org/10.5626/JOK.2021.48.7.790
텍스트 혹은 발화의 감정을 연속적인 수치로 회귀하는 차원적 감성 분석 연구는 데이터의 부족으로 인해 감정을 범주로 분류하는 범주적 감성 분석 연구에 비해 많은 연구가 이루어지지 못하였다. 최근 한국정보화진흥원의 AI Hub를 통해 공개된 ‘멀티모달 영상 데이터’는 한국어의 차원적 감성 분석 연구에 활용할 수 있는 공공 데이터이다. 본 연구에서는 자연어 처리에서 전형적으로 쓰여 온 딥 러닝 모델인 중 하나인 CNN을 이용해 한국어의 차원적 감성 분석을 시도하였다. 또한 데이터의 분포를 균형적으로 조정함으로써 모델의 성능이 향상되는지 검증하였다. 실험 결과 모델들은 기존의 영어 연구와 비슷한 성능을 보여 한국어 텍스트의 차원적 감성 분석 연구에서 ‘멀티모달 영상 데이터’가 효용성을 지님을 알 수 있었다. 또한 데이터를 균형화함으로써 더 적은 학습 데이터를 이용해 학습한 모델이 더 좋은 성능을 보일 수 있음을 확인하였다.