어절 N-gram을 이용한 문맥의존 철자오류 교정 


41권  12호, pp. 1081-1089, 12월  2014


PDF

  요약

문맥의존 철자오류의 교정 방법은 크게 규칙을 이용한 방법과 통계 정보에 기반을 둔 방법으로 나뉘며, 이중 통계적 오류 교정 방법을 중심으로 연구가 진행되었다. 통계적 오류 방법은 문맥의존 철자오류 문제를 어의 중의성 해소 문제로 간주한 방법으로서, 교정 대상 어휘와 대치 후보 어휘로 이루어진 교정 어휘 쌍을 문맥에 따라 분류하는 방법이다. 본 논문에서는 본 연구진의 기존 연구 결과인 교정어휘 쌍을 이용한 확률 모델의 성능 향상을 위해 어절 n-gram 모델을 기존 모델에 결합하는 방법을 제안한다. 본 논문에서 제안하는 결합 모델은 각 모델을 통해 계산된 문장의 확률을 보간(interpolation)하는 방법과 각각의 모델을 차례대로 적용하는 방법이다. 본 논문에서 제안한 두 가지 결합 모델 모두 기존 모델이나 어절 n-gram만 이용한 모델보다 높은 정확도와 재현율을 보인다.


  통계
2022년 11월부터 누적 집계
동일한 세션일 때 여러 번 접속해도 한 번만 카운트됩니다. 그래프 위에 마우스를 올리면 자세한 수치를 확인하실 수 있습니다.


  논문 참조

[IEEE Style]

M. Kim, H. Kwon, S. Choi, "Context-sensitive Spelling Error Correction using Eojeol N-gram," Journal of KIISE, JOK, vol. 41, no. 12, pp. 1081-1089, 2014. DOI: .


[ACM Style]

Minho Kim, Hyuk-Chul Kwon, and Sungki Choi. 2014. Context-sensitive Spelling Error Correction using Eojeol N-gram. Journal of KIISE, JOK, 41, 12, (2014), 1081-1089. DOI: .


[KCI Style]

김민호, 권혁철, 최성기, "어절 N-gram을 이용한 문맥의존 철자오류 교정," 한국정보과학회 논문지, 제41권, 제12호, 1081~1089쪽, 2014. DOI: .


[Endnote/Zotero/Mendeley (RIS)]  Download


[BibTeX]  Download



Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr