디지털 라이브러리[ 검색결과 ]
감정 역학과 멀티모달 정보 기반의 영화 요약
http://doi.org/10.5626/JOK.2022.49.9.735
자동 영화 요약은 영화의 중요한 장면을 담은 짧은 동영상을 만드는 것을 목적으로 하는 연구 주제이다. 본 연구는 자동 영화 요약을 위해 영화의 3가지 주요 요소인 인물, 줄거리, 동영상 정보를 종합적으로 고려한 요약 모델을 제안한다. 영화 줄거리 상의 주요 사건을 정확하게 식별하기 위해, 각본의 대사 정보와 주인공의 감정 변화 정보를 학습 자질로 사용하고 영화 각본과 동영상 정보를 결합하는 트랜스포머 기반 아키텍처를 제안한다. 실험을 통해 제안 방법이 영화의 주요 사건을 식별하는 정확도를 높이는데 유용하며 결과적으로 영화 요약의 품질이 향상되는 것을 보인다.
다중 인코더 구조를 활용한 기계번역 품질 예측
http://doi.org/10.5626/JOK.2022.49.7.521
기계번역 품질 예측은 기계가 번역 문장의 품질을 주어진 정답 번역 문장이 없이 예측하는 것을 말한다. 최근에 품질 예측 분야의 연구 동향은 다량의 병렬 말뭉치로 학습된 트랜스포머 인코더 기반의 사전학습 모델을 이용하여 전이 학습을 적용한다. 본 논문에서는 품질 예측과 같은 교차 언어 태스크에서 단일 인코더 구조가 가지는 한계를 극복하기 위해 인코더에서 각 언어에 대한 단일 언어 표현을 개별적으로 학습하고 상호 참조망에서 교차 언어 표현을 학습하는 이중 인코더 구조를 제시한다. 이중 인코더 구조가 단일 인코더 구조보다 품질 예측 태스크에서 구조적으로 유리함을 입증하고, 나아가 이중 인코더 모델에 사전학습된 언어 모델을 적용하여 품질 예측 태스크에서 이중 인코더 모델의 성능과 안정성을 높인다. WMT20 품질 예측 영어-독일어 쌍에 대해서 실험을 진행했다. 사전학습 모델로서 영어 Bidirectional Encoder Representations from Transformers (BERT) 언어 모델과 독일어 BERT 언어 모델이 각각의 인코더에 적용되었고 가장 뛰어난 성능을 보여주었다.
엔그램 사용량 조절을 통한 딥러닝 기반 Chit-chat 대화시스템의 상투적 응답 생성 제어
http://doi.org/10.5626/JOK.2022.49.1.60
Chit-chat 대화시스템은 컴퓨터와 사용자 간의 자유로운 대화를 위한 시스템으로, 다양하고 흥미로운 응답을 생성하는 것을 목표로 한다. 그러나 maximum likelihood 기반의 일반적인 학습 방식에서 모델이 짧고, 별다른 의미를 내포하지 않는 상투적인(generic) 응답을 과하게 생성하여 시스템에 대한 사용자의 흥미를 떨어뜨리는 문제가 꾸준히 보고되어 왔다. 이에 최근 unlikelihood training을 통하여 고빈도로 등장하는 단어의 과다한 사용에 페널티를 줌으로써 다양한 응답을 생성하는 학습 방법이 제안되었으나, 이는 각 단어의 사용량에 따라 페널티를 줄 뿐 각 단어가 어떠한 맥락으로 사용되었는지는 고려하지 못하는 한계를 가진다. 이에 본 연구에서는 고빈도로 등장하는 엔그램(n-gram) 사용량을 조절하는 방식을 제안하였다. 제안된 방식은 엔그램 단위로 주변 맥락에 대한 정보를 이용함으로써 응답의 상투적인 정도에 따른 페널티를 보다 섬세하게 줄 수 있다는 이점을 가진다.
심층학습 기반의 Predictor-Estimator 모델을 이용한 영어-한국어 기계번역 품질 예측
http://doi.org/10.5626/JOK.2018.45.6.545
기계번역 품질 예측은 정답번역문의 참고 없이 기계번역문장의 번역품질을 예측하는 것을 말하며, 최근 들어 기계번역분야에서 중요성이 강조되고 있다. 현재까지 영어-유럽어를 대상으로 기계번역 품질 예측 연구들이 진행되어 왔으며, 영어-한국어에 대해 기계번역 품질 예측을 시도한 사례가 없었다. 본 논문에서는 영어-한국어 기계번역 품질 예측을 위한 학습 데이터를 구축하고, 심층학습 기반의 모델을 적용하여 영어-한국어에 대한 기계번역 품질 예측을 수행한다. 학습 데이터 생성을 위해서는 기계번역문장에 기반한 새로운 정답번역문을 만드는 과정이 필요하며, 본 논문에서는 자유로운 어순과 다양한 형태가 가능한 한국어 문장의 특징을 고려하는 새로운 정답번역문을 만들기 위한 가이드라인을 제시한다. 또한 학습 데이터가 편향되는 문제를 완화하여 학습 데이터를 구축한다. 본 연구에서 구축한 학습데이터와 심층학습 기반의 모델을 이용한 실험 결과, 영어-한국어 기계번역 품질 예측이 잘 수행됨을 확인하였다.