형태소 수준의 BERT 임베딩을 통한 한국어 상호참조해결 


50권  6호, pp. 495-502, 6월  2023
10.5626/JOK.2023.50.6.495


PDF

  요약

상호참조해결은 주어진 문서에서 상호참조해결 대상이 되는 멘션(mention)을 식별하고, 동일한 개체(entity)를 의미하는 멘션들을 찾아 그룹화하는 자연어처리 태스크이다. 최근 한국어 상호참조해결은 End-to-End 방식으로 주로 연구가 되고 있으며, 이를 위해 모든 스팬을 잠재적인 멘션으로 간주해야 되기 때문에 메모리 사용량과 시간 복잡도가 상승하는 문제가 있다. 본 논문에서는 서브 토큰을 다시 단어단위로 매핑하여 상호참조해결을 수행하는 워드 레벨 상호참조해결 모델을 한국어에 적용하였으며, 한국어 특성을 반영하기 위해 워드 레벨 상호참조해결 모델의 토큰 표현을 CorefBERT를 통해 계산한 후 개체명 자질과 의존 구문 분석 자질을 추가하였다. 실험 결과, ETRI 질의응답 도메인 평가 셋에서 F1 70.68%로, 기존 End-to-End 방식의 상호참조해결 모델 대비 1.67% 성능 향상을 보이면서 메모리 사용량은 2.4배 좋아졌고, 속도는 1.82배 빨라졌다.


  통계
2022년 11월부터 누적 집계
동일한 세션일 때 여러 번 접속해도 한 번만 카운트됩니다. 그래프 위에 마우스를 올리면 자세한 수치를 확인하실 수 있습니다.


  논문 참조

[IEEE Style]

K. Jo, Y. Choi, C. Lee, J. Ryu, J. Lim, "Korean Coreference Resolution through BERT Embedding at the Morpheme Level," Journal of KIISE, JOK, vol. 50, no. 6, pp. 495-502, 2023. DOI: 10.5626/JOK.2023.50.6.495.


[ACM Style]

Kyeongbin Jo, Yohan Choi, Changki Lee, Jihee Ryu, and Joonho Lim. 2023. Korean Coreference Resolution through BERT Embedding at the Morpheme Level. Journal of KIISE, JOK, 50, 6, (2023), 495-502. DOI: 10.5626/JOK.2023.50.6.495.


[KCI Style]

조경빈, 최요한, 이창기, 류지희, 임준호, "형태소 수준의 BERT 임베딩을 통한 한국어 상호참조해결," 한국정보과학회 논문지, 제50권, 제6호, 495~502쪽, 2023. DOI: 10.5626/JOK.2023.50.6.495.


[Endnote/Zotero/Mendeley (RIS)]  Download


[BibTeX]  Download



Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr