단어 특징의 의미적 보강을 이용한 트위터 뉴스 분류 기법 


45권  10호, pp. 1045-1055, 10월  2018
10.5626/JOK.2018.45.10.1045


PDF

  요약

최근 많은 사람들이 트위터를 뉴스 플랫폼으로 활용하면서 많은 뉴스 기사가 끊임없이 생성되고, 기사와 관련된 다양한 정보와 의견들이 빠르게 확산되고 있다. 그러나 트위터 뉴스는 동시다발적으로 포스팅되기 때문에 사용자가 원하는 주제의 기사를 선별하여 보기가 어렵다는 문제가 있다. 이를 위해, 트위터 뉴스를 주제별로 분류하기 위한 기계 학습과 딥러닝 기반의 다양한 연구들이 진행되었다. 하지만 통상적인 기계 학습 기법은 트위터 뉴스를 임베딩하는 과정에서 데이터 희소성이나 시맨틱 갭의 문제가 발생할 수 있으며, 딥러닝 기법은 많은 양의 데이터를 필요로 한다. 이러한 단점을 개선하기 위해, 본 논문에서는 적은 양의 데이터로도 데이터 희소성과 시맨틱 갭 문제를 해결할 수 있는 방법으로, 단어 특징의 의미적 보강을 이용한 트위터 뉴스 분류 기법을 제안한다. 구체적으로 먼저, 벡터 공간 모델을 이용하여 수집된 트위터 뉴스 데이터의 특징을 추출하고, DBpedia Spotlight를 통해 DBpedia의 자원과 온톨로지 정보를 반영하여 추출된 특징을 보강한다. 보강된 특징 단어 집합을 이용하여 다양한 기계 학습 기법 기반의 주제별 분류모델을 구성하고, 다양한 실험을 통해 제안하는 모델이 기존의 기법들보다 더 효과적임을 보인다.


  통계
2022년 11월부터 누적 집계
동일한 세션일 때 여러 번 접속해도 한 번만 카운트됩니다. 그래프 위에 마우스를 올리면 자세한 수치를 확인하실 수 있습니다.


  논문 참조

[IEEE Style]

S. Ji, J. Moon, H. Kim, E. Hwang, "A Twitter News-Classification Scheme Using Semantic Enrichment of Word Features," Journal of KIISE, JOK, vol. 45, no. 10, pp. 1045-1055, 2018. DOI: 10.5626/JOK.2018.45.10.1045.


[ACM Style]

Seonmi Ji, Jihoon Moon, Hyeonwoo Kim, and Eenjun Hwang. 2018. A Twitter News-Classification Scheme Using Semantic Enrichment of Word Features. Journal of KIISE, JOK, 45, 10, (2018), 1045-1055. DOI: 10.5626/JOK.2018.45.10.1045.


[KCI Style]

지선미, 문지훈, 김현우, 황인준, "단어 특징의 의미적 보강을 이용한 트위터 뉴스 분류 기법," 한국정보과학회 논문지, 제45권, 제10호, 1045~1055쪽, 2018. DOI: 10.5626/JOK.2018.45.10.1045.


[Endnote/Zotero/Mendeley (RIS)]  Download


[BibTeX]  Download



Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr