고차원 데이터에서 무감독 이상치 탐지를 위한 차원 축소 방법 


49권  7호, pp. 537-543, 7월  2022
10.5626/JOK.2022.49.7.537


PDF

  요약

많은 이상치 탐지 방법들 중에서 트리 기반 방법인 Isolation Forest는 이상치 탐지 성능이 높은 것으로 알려져 있으나, 텍스트 데이터와 같은 고차원 데이터에서는 데이터의 희소성과 노드 분할을 위해 선택할 수 있는 총 속성 수의 제한으로 인해 적용하는데 한계를 가진다. 본 논문에서는 고차원 데이터에서 이상치 탐지를 위한 차원 축소 방법을 제안한다. 첨도를 최대화하는 선형 변환에 의한 차원 축소를 수행하고, 변환된 공간에서 Isolation Forest에 의한 이상치 탐지 모델을 적용한다. 일변량 확률 분포에서 이상치가 존재할 가능성을 나타내는 값으로 해석할 수 있는 첨도가 높은 특징들의 부분집합을 입력 특징으로 사용하고 출력 노드에서 첨도를 최대화하는 목적 함수를 사용하는 단층 신경망을 이용하여 선형변환을 구하는 방법을 사용하였다. 텍스트 데이터를 이용한 실험결과, 제안된 차원 축소 방법으로 변환한 공간에서 모델링한 Isolation Forest가 더 높은 탐지 성능을 보여주었다.


  통계
2022년 11월부터 누적 집계
동일한 세션일 때 여러 번 접속해도 한 번만 카운트됩니다. 그래프 위에 마우스를 올리면 자세한 수치를 확인하실 수 있습니다.


  논문 참조

[IEEE Style]

C. H. Park, "A Dimension Reduction Method for Unsupervised Outlier Detection in High Dimensional Data," Journal of KIISE, JOK, vol. 49, no. 7, pp. 537-543, 2022. DOI: 10.5626/JOK.2022.49.7.537.


[ACM Style]

Cheong Hee Park. 2022. A Dimension Reduction Method for Unsupervised Outlier Detection in High Dimensional Data. Journal of KIISE, JOK, 49, 7, (2022), 537-543. DOI: 10.5626/JOK.2022.49.7.537.


[KCI Style]

박정희, "고차원 데이터에서 무감독 이상치 탐지를 위한 차원 축소 방법," 한국정보과학회 논문지, 제49권, 제7호, 537~543쪽, 2022. DOI: 10.5626/JOK.2022.49.7.537.


[Endnote/Zotero/Mendeley (RIS)]  Download


[BibTeX]  Download



Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr