욕설문장 분류의 불균형 데이터 해결을 위한 전이학습 방법 


44권  12호, pp. 1275-1281, 12월  2017
10.5626/JOK.2017.44.12.1275


PDF

  요약

욕설문장을 지도학습 접근법으로 분류하기 위해서 욕설인지 아닌지 판별된 학습 문장이 필요하다. 문자수준의 컨볼루션 신경망이 각 문자에 대해 강건성을 가지기 때문에 욕설분류에 적합하지만, 학습에 많은 데이터가 필요하다는 단점이 있다. 본 논문에서는 이를 해결하기 위해 임의로 생성한 욕설/비욕설 문장 쌍을 컨볼루션 신경망을 기반으로 하는 분류기에 학습시켜 컨볼루션 신경망의 필터가 욕설의 특징을 분류하도록 조정한 후, 실제 훈련문장을 학습시킬 때 필터를 재사용하는 전이학습방법을 제안한다. 이로써 데이터 부족과 클래스 불균형으로 인한 영향이 감소하여 분류 성능이 향상될 것이다. 실험 및 평가는 총 3가지 데이터에 대해 수행되었으며, 문자수준 컨볼루션 신경망을 활용한 분류기는 모든 데이터에서 전이학습을 적용했을 때 더 높은 F1 점수를 획득하였다.


  통계
2022년 11월부터 누적 집계
동일한 세션일 때 여러 번 접속해도 한 번만 카운트됩니다. 그래프 위에 마우스를 올리면 자세한 수치를 확인하실 수 있습니다.


  논문 참조

[IEEE Style]

S. Seo and S. Cho, "A Transfer Learning Method for Solving Imbalance Data of Abusive Sentence Classification," Journal of KIISE, JOK, vol. 44, no. 12, pp. 1275-1281, 2017. DOI: 10.5626/JOK.2017.44.12.1275.


[ACM Style]

Suin Seo and Sung-Bae Cho. 2017. A Transfer Learning Method for Solving Imbalance Data of Abusive Sentence Classification. Journal of KIISE, JOK, 44, 12, (2017), 1275-1281. DOI: 10.5626/JOK.2017.44.12.1275.


[KCI Style]

서수인, 조성배, "욕설문장 분류의 불균형 데이터 해결을 위한 전이학습 방법," 한국정보과학회 논문지, 제44권, 제12호, 1275~1281쪽, 2017. DOI: 10.5626/JOK.2017.44.12.1275.


[Endnote/Zotero/Mendeley (RIS)]  Download


[BibTeX]  Download



Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr