LSI를 이용한 차원 축소 클러스터 기반 키워드 연관망 자동 구축 기법 


44권  11호, pp. 1236-1243, 11월  2017
10.5626/JOK.2017.44.11.1236


PDF

  요약

본 논문은 기존의 TextRank 알고리즘에 상호정보량 척도를 결합하여 군집 기반에서 키워드 추출하는 LSI-based ClusterTextRank 기법과 추출된 키워드를 Latent Semantic Indexing(LSI)을 이용한 연관망 구축 기법을 제안한다. 제안 기법은 문서집합을 단어-문서 행렬로 표현하고, 이를 LSI를 이용하여 저차원의 개념 공간으로 차원을 축소한다. 그 다음 k-means 군집화 알고리즘을 이용하여 여러 군집으로 나누고, 각 군집에 포함된 단어들을 최대신장트리 그래프로 표현한 후 이에 근거한 군집 정보량을 고려하여 키워드를 추출한다. 그리고나서 추출된 키워드들 간에 유사도를 LSI 기법을 통해 구한 단어-개념 행렬을 이용하여 계산한 후, 이를 키워드 연관망으로 활용한다. 제안 기법의 성능을 평가하기 위해 여행 관련 블로그 데이터를 이용하였으며, 제안 기법이 기존 TextRank 알고리즘보다 키워드 추출의 정확도가 약 14% 가량 개선됨을 보인다.


  통계
2022년 11월부터 누적 집계
동일한 세션일 때 여러 번 접속해도 한 번만 카운트됩니다. 그래프 위에 마우스를 올리면 자세한 수치를 확인하실 수 있습니다.


  논문 참조

[IEEE Style]

H. Yoo, H. Kim, J. Chang, "Automatic Construction of Reduced Dimensional Cluster-based Keyword Association Networks using LSI," Journal of KIISE, JOK, vol. 44, no. 11, pp. 1236-1243, 2017. DOI: 10.5626/JOK.2017.44.11.1236.


[ACM Style]

Han-mook Yoo, Han-joon Kim, and Jae-young Chang. 2017. Automatic Construction of Reduced Dimensional Cluster-based Keyword Association Networks using LSI. Journal of KIISE, JOK, 44, 11, (2017), 1236-1243. DOI: 10.5626/JOK.2017.44.11.1236.


[KCI Style]

유한묵, 김한준, 장재영, "LSI를 이용한 차원 축소 클러스터 기반 키워드 연관망 자동 구축 기법," 한국정보과학회 논문지, 제44권, 제11호, 1236~1243쪽, 2017. DOI: 10.5626/JOK.2017.44.11.1236.


[Endnote/Zotero/Mendeley (RIS)]  Download


[BibTeX]  Download



Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr