검색 : [ author: 이승현 ] (1)

텍스트 증강 기법과 전이학습을 활용한 의도 분류 방법 제안

이희원, 박성호, 이채원, 이승현, 이강배

http://doi.org/10.5626/JOK.2024.51.2.141

의도 분류는 목적지향 챗봇의 첫 번째 단계로 성능 향상을 위한 중요한 문제이지만 목적지향형 챗봇은 특정 도메인에 대한 데이터 부족 문제가 존재한다. 본 연구는 텍스트 증강 기법과 전이학습을 활용하여 데이터 부족 문제를 해결하고자 한다. 기존에 전이학습 및 텍스트 증강 기법을 활용한 연구는 존재하나 다양한 도메인에 적용 가능한 연구는 찾아보기 어려웠다. 본 연구는 다양한 도메인에 적용 가능한 텍스트 증강 기법 및 전이학습 방법을 제안한다. 실험을 위해 8개의 도메인에서 실제 발화 의도의 비율에 맞추어 데이터를 10,000개, 20,000개, 30,000개 미만으로 구축하였다. 실험 결과 도메인에 따라 차이는 존재 하였지만 8개의 도메인 모두 본 연구에서 제시한 방법이 우수함을 확인하였다. 학습 데이터의 크기가 작은 순서로 8개의 도메인에 대한 정확도는 평균적으로 10%, 3.4%, 1.9% 향상되었으며 F1-Score는 평균 30%, 12%, 7.5% 향상됨을 확인하였다.


Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr