디지털 라이브러리[ 검색결과 ]
생성 기반 챗봇에서의 다양한 페르소나 반영 방법
http://doi.org/10.5626/JOK.2021.48.2.160
챗봇은 대화형 인터페이스를 통해 사용자와 상호작용하는 시스템을 말한다. 최근 생성 기반 챗봇 연구가 활발해지면서 개인 특성에 따라 다양한 답변을 하는 챗봇 연구 또한 많아지고 있다. 대표적으로 챗봇에 개인 특성을 반영한 페르소나 챗봇이 있다. 페르소나 챗봇은 개인 특성을 의미하는 페르소나를 반영한 챗봇을 말하며 다양한 서비스에 브랜드 인격을 반영하려는 움직임과 맞물려 크게 주목을 받고 있다. 따라서, 본 논문은 Dual WGAN 생성 기반 챗봇 모델에 페르소나를 세밀하게 반영하는 문장 페르소나 인코더와 테이블 페르소나 인코더를 이용하여 지정한 페르소나에 적합한 응답을 생성할 수 있는 챗봇 모델을 제안한다. 또한, 정량평가와 정성평가를 이용한 모듈별 비교실험과 실험 예제를 통해 제안 모델의 성능을 입증했다.
소량의 대화 말뭉치에서 학습 가능한 효과적인 생성 기반 챗봇 모델
http://doi.org/10.5626/JOK.2019.46.3.246
잘 알려진 검색 기반 챗봇 모델과 다르게 생성 기반 챗봇 모델은 사전에 정의된 응답에 의존하지 않고 학습된 신경망 모델을 사용하여 새로운 응답을 생성한다. 하지만 생성 기반 챗봇 모델은 발화-응답 쌍의 형태를 가진 대용량의 대화 말뭉치가 필요하다. 학습 말뭉치가 충분하지 않은 경우 구문론적 오류가 발생한다. 본 논문은 이 문제를 해결하기 위해 인코딩-디코딩 단위를 형태소와 음절이 복합적으로 사용된 시퀀스-투-시퀀스 신경망 기반의 챗봇을 제안한다. 또한 대용량의 비 대화 말뭉치를 이용하여 사전 학습하고 소량의 대화 말뭉치를 이용하여 재학습하는 2단계 학습 방법을 제안한다. 소량의 대화 말뭉치(47,089개의 발화-응답 쌍 학습 데이터와 3,000개의 발화-응답 쌍 평가 데이터)를 사용한 실험에서 제안한 인코딩-디코딩 단위는 미등록어 문제를 감소시키는데 도움을 주었고, 2단계 학습 방법은 BLEU와 ROUGE와 같은 성능 향상에 도움을 주었다.