학습 데이터 선별을 위한 오토인코더 기반 학습 개선도 측정 방안 


48권  2호, pp. 195-200, 2월  2021
10.5626/JOK.2021.48.2.195


PDF

  요약

머신러닝 알고리즘은 최근의 우수한 성능에도 불구하고 개발과 사용을 어렵게 하는 단점이 있다. 이는 머신러닝 알고리즘의 최적 모델 개발과 배포까지의 반복적인 과정이 높은 시간 비용을 요구하기 때문이다. 이에 본 논문에서는 이러한 시간 부하를 줄이기 위한 방안으로, 전체 학습 데이터셋 중 일부 데이터를 선별하여 빠르게 학습하면서도 근사 솔루션을 제공할 수 있는 방법에 관하여 논한다. 먼저 학습데이터는 오토인코더에 기반하여 저차원 잠재공간의 특징 벡터로 맵핑된다. 그리고 맵핑된 각 샘플의 위치를 기반으로, 상대적으로 학습하기는 어렵지만 학습 개선도가 높은 샘플은 높은 가중치를 부여받는다. 최종적으로 가중치를 기반으로 한 중요도 샘플링을 수행하여 데이터를 선별하고 이를 학습에 활용한다. 실험결과, 제안하는 방법이 무작위 샘플링에 비해 더 높은 학습 성과를 달성하는 샘플을 선정할 수 있음을 보일 수 있었다.


  통계
2022년 11월부터 누적 집계
동일한 세션일 때 여러 번 접속해도 한 번만 카운트됩니다. 그래프 위에 마우스를 올리면 자세한 수치를 확인하실 수 있습니다.


  논문 참조

[IEEE Style]

Y. Jeong, M. Hwang, W. Sung, "Autoencoder-based Learning Contribution Measurement Method for Training Data Selection," Journal of KIISE, JOK, vol. 48, no. 2, pp. 195-200, 2021. DOI: 10.5626/JOK.2021.48.2.195.


[ACM Style]

Yuna Jeong, Myunggwon Hwang, and Wonkyung Sung. 2021. Autoencoder-based Learning Contribution Measurement Method for Training Data Selection. Journal of KIISE, JOK, 48, 2, (2021), 195-200. DOI: 10.5626/JOK.2021.48.2.195.


[KCI Style]

정유나, 황명권, 성원경, "학습 데이터 선별을 위한 오토인코더 기반 학습 개선도 측정 방안," 한국정보과학회 논문지, 제48권, 제2호, 195~200쪽, 2021. DOI: 10.5626/JOK.2021.48.2.195.


[Endnote/Zotero/Mendeley (RIS)]  Download


[BibTeX]  Download



Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr