대체 토큰 감지 모델을 통한 대체어 추출 


50권  4호, pp. 321-328, 4월  2023
10.5626/JOK.2023.50.4.321


PDF

  요약

대체어란 한 문장에서 특정 단어를 대신하여 사용해도 문장의 의미를 훼손하지 않는 단어이며, 이를 추출하는 기술은 데이터 증강 등 다양한 자연어처리 문제에 활용할 수 있다. 기존 대체어 추출 방법은 문맥에 부자연스러운 대체어를 추출할 수 있다는 문제가 있다. 이를 해결하기 위해 본 논문에서는 말뭉치에서 목표 단어가 포함된 문장을 샘플링하여 사전학습 BERT 기반 대체어 후보 생성 모델에 입력하고, 대체 토큰 감지 모델로 부적합한 대체어를 제외하여 대체어를 추출하는 방법을 제안한다. 국립국어원 문어 말뭉치 및 ㈜낱말 기본유의어 사전을 통해 검증한 결과, 본 제안 방법은 기존 방법에 비해 더 정확한 대체어를 추출한다. 또한 부적합한 대체어를 제외하는 모델로 사료될 수 있는 문법성 판단 모델보다 본 연구에서 제안한 대체 토큰 감지 모델의 대체어 추출 성능이 더 뛰어난 것을 확인하였다.


  통계
2022년 11월부터 누적 집계
동일한 세션일 때 여러 번 접속해도 한 번만 카운트됩니다. 그래프 위에 마우스를 올리면 자세한 수치를 확인하실 수 있습니다.


  논문 참조

[IEEE Style]

S. Ji and S. Lee, "Lexical Substitution Using a Replaced Token Detection Model," Journal of KIISE, JOK, vol. 50, no. 4, pp. 321-328, 2023. DOI: 10.5626/JOK.2023.50.4.321.


[ACM Style]

Seunghyun Ji and Soowon Lee. 2023. Lexical Substitution Using a Replaced Token Detection Model. Journal of KIISE, JOK, 50, 4, (2023), 321-328. DOI: 10.5626/JOK.2023.50.4.321.


[KCI Style]

지승현, 이수원, "대체 토큰 감지 모델을 통한 대체어 추출," 한국정보과학회 논문지, 제50권, 제4호, 321~328쪽, 2023. DOI: 10.5626/JOK.2023.50.4.321.


[Endnote/Zotero/Mendeley (RIS)]  Download


[BibTeX]  Download



Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr