디지털 라이브러리[ 검색결과 ]
텍스트 마이닝과 차원 축소 기법을 적용한 향상된 컨피규레이션 버그 리포트 예측
http://doi.org/10.5626/JOK.2021.48.1.35
소프트웨어 실패의 주요 원인들 중 하나로 컨피규레이션 버그가 있다. 소프트웨어 조직들은 이슈 트래킹 시스템을 통해 버그 리포트들을 수집하고 관리하는데, 버그 할당자는 해당 버그가 컨피규레이션 버그인지 식별하는데 시간을 소비할 수 있다. 컨피규레이션 버그를 예측하는 방법을 통해 버그 할당자의 의사 결정에 도움을 줘 노력을 줄일 수 있다. 본 논문에서는 텍스트 마이닝 기법과 차원 축소 기법을 이용하여 향상된 분류 모델을 제안한다. 본 논문은 6개의 오픈 소스 소프트웨어 프로젝트로부터 4,457개의 버그 리포트를 추출하고 컨피규레이션 버그 리포트를 분류하는 모델을 학습하고 예측 성능을 평가한다. 가장 좋은 성능을 보이는 방법은 Bag of Words로 피쳐를 추출하고 선형판별분석(LDA: Linear Discriminant Analysis)를 이용하여 피쳐의 차원을 축소 후 SMOTEENN 샘플링 기법을 이용하여 k-Nearest Neighbors 모델을 사용한다. 이에 대한 AUC 값은 0.9812이고 MCC가 0.942이다. 이는 Xia et al.의 방법보다 더 좋은 성능을 보이며, 이전 연구에서의 클래스 불균형 문제를 해결한다. 이러한 향상된 컨피규레이션 버그 리포트 예측을 통해, 이를 버그 할당자의 의사 결정에 필요한 정보를 줄 수 있거나 시간을 단축시킬 수 있다.
스트리밍 데이터에 대한 최소제곱오차해를 통한 점층적 선형 판별 분석 기법
http://doi.org/10.5626/JOK.2018.45.1.69
시간에 따라 순차적으로 들어오는 스트리밍 데이터에서는 전체 데이터 셋을 한꺼번에 모두 이용하는 배치 학습에 기반한 차원축소 기법을 적용하기 어렵다. 따라서 스트리밍 데이터에 적용하기 위한 점층적 차원 감소 방법이 연구되어왔다. 이 논문에서는 최소제곱오차해를 통한 점층적 선형 판별 분석법을 제안한다. 제안 방법은 분산행렬을 직접 구하지 않고 새로 들어오는 샘플의 정보를 이용하여 차원 축소를 위한 사영 방향을 점층적으로 업데이트한다. 실험 결과는 이전에 제안된 점층적 차원축소 알고리즘과 비교하여 이 논문에서 제안한 방법이 더 효과적인 방법임을 입증한다.
Application of an Adaptive Incremental Classifier for Streaming Data
시간이 흐름에 따라 데이터 분포가 변하거나 관심 개념이 달라질 수 있는 스트리밍 데이터 분석에서 개념 변화에 적응해 나갈 수 있는 능력은 점층적 학습 과정에서 매우 중요하다. 이 논문에서는 개념 변화를 가진 스트리밍 데이터에서 적응적 점층적 분류기를 위한 일반화된 프레임워크를 제안한다. 분류기에 의해 예측되는 신뢰도 벡터와 클래스 라벨 벡터 사이의 거리를 이용하여 분류기 성능 패턴을 나타내는 분포를 구성하고 컨셉 변화에 대한 가설 검정을 수행한다. 추정되는 p-값을 이용하여 오래된 데이터에 대한 가중치를 자동으로 조정하여 분류기 업데이트에 이용한다. 제안된 방법을 두 가지 타입의 선형 판별 분류기에 적용한다. 컨셉 변화를 가진 스트리밍 데이터에 대한 실험 결과는 제안하는 적응적 점층적 학습방법이 점층적 분류기의 예측 정확도를 크게 향상시킴을 입증한다.