디지털 라이브러리[ 검색결과 ]
BERT 임베딩과 선택적 OOV 복사 방법을 사용한 문서요약
http://doi.org/10.5626/JOK.2020.47.1.36
문서 자동 요약은 주어진 문서로부터 주요 내용을 추출하거나 생성하는 방식으로 짧게 줄이는 작업이다. 생성 요약은 미리 생성된 워드 임베딩 정보를 사용한다. 하지만, 전문 용어와 같이 저빈도 핵심 어휘는 임베딩 사전에서 누락되는 문제가 발생한다. 문서 자동 요약에서 미등록 어휘의 출현은 요약 성능을 저하시킨다. 본 논문은 Selectively Pointing OOV(Out of Vocabulary) 모델에 BERT(Bidirectional Encoder Representations from Transformers) 형태소 임베딩, Masked OOV, 형태소-to-문장 변환기를 적용하여 미등록 어휘에 대한 선택적 복사 및 요약 성능을 높였다. 기존 연구와 달리 정확한 포인팅 정보와 선택적 복사 지시 정보를 명시적으로 제공하는 선택적 OOV 포인팅 복사 방법과 함께 BERT 임베딩과 OOV 랜덤 마스킹, 형태소-문장 변환기를 추가하였다. 제안한 OOV 모델을 통해서 자동 생성 요약을 수행한 결과 단어 재현 기반의 ROUGE-1이 54.97 나타났으며, 또한 어순 기반의 ROUGE-L이 39.23으로 향상되었다.
시각 장애인의 입력 편의성 향상을 위한 손가락 터치 기반의 한글 입력 인터페이스
스마트폰 환경에서 천지인, 나랏글, qwerty 등과 같은 가상 키보드들은 문자 입력 버튼의 위치가 고정되어 있으며 기본적으로 문자 버튼의 위치를 인식하는 시각 정보를 기반으로 문자를 입력하는 방식을 취하고 있다. 이처럼 입력할 문자의 위치가 고정되어 있는 버튼 입력 방식은 시각 장애인들이 사용하기에 매우 불편하다. 본 연구는 고정된 위치의 버튼을 기반으로 하는 한글 입력 방식의 불편한 점을 개선하기 위해, 버튼 위치의 시각 인지가 필요하지 않은 손가락 터치 기반의 한글 입력 방식을 제안한다. 자음과 모음의 손가락 터치 동작은 학습 편의성을 위해 한글 자모의 형태와 사용 빈도수, 손가락의 우선 순위 등을 고려하여 설계하였다. 최초 입력시에는 사용자가 직접 기준 위치를 정함으로써 다른 기기의 터치 화면에서도 동일한 인터페이스를 사용할 수 있는 장점이 있다. 이 방법은 고유의 손가락 터치 동작들을 각각의 한글 자음과 모음에 할당함으로써 기존의 버튼 터치 방식에서 이웃 버튼을 잘못 입력하는 오류가 발생하지 않기 때문에 의도치 않았던 문자가 잘못 입력되는 오류가 감소되는 장점이 있다.