디지털 라이브러리[ 검색결과 ]
텍스트 마이닝과 차원 축소 기법을 적용한 향상된 컨피규레이션 버그 리포트 예측
http://doi.org/10.5626/JOK.2021.48.1.35
소프트웨어 실패의 주요 원인들 중 하나로 컨피규레이션 버그가 있다. 소프트웨어 조직들은 이슈 트래킹 시스템을 통해 버그 리포트들을 수집하고 관리하는데, 버그 할당자는 해당 버그가 컨피규레이션 버그인지 식별하는데 시간을 소비할 수 있다. 컨피규레이션 버그를 예측하는 방법을 통해 버그 할당자의 의사 결정에 도움을 줘 노력을 줄일 수 있다. 본 논문에서는 텍스트 마이닝 기법과 차원 축소 기법을 이용하여 향상된 분류 모델을 제안한다. 본 논문은 6개의 오픈 소스 소프트웨어 프로젝트로부터 4,457개의 버그 리포트를 추출하고 컨피규레이션 버그 리포트를 분류하는 모델을 학습하고 예측 성능을 평가한다. 가장 좋은 성능을 보이는 방법은 Bag of Words로 피쳐를 추출하고 선형판별분석(LDA: Linear Discriminant Analysis)를 이용하여 피쳐의 차원을 축소 후 SMOTEENN 샘플링 기법을 이용하여 k-Nearest Neighbors 모델을 사용한다. 이에 대한 AUC 값은 0.9812이고 MCC가 0.942이다. 이는 Xia et al.의 방법보다 더 좋은 성능을 보이며, 이전 연구에서의 클래스 불균형 문제를 해결한다. 이러한 향상된 컨피규레이션 버그 리포트 예측을 통해, 이를 버그 할당자의 의사 결정에 필요한 정보를 줄 수 있거나 시간을 단축시킬 수 있다.
LSTRf 기반의 학습 데이터 선정 방안
http://doi.org/10.5626/JOK.2020.47.12.1192
본 연구는 자동적이고 지능적인 AI 개발에 요구되는 human-in-the-loop (HITL) 과정의 단축을 위한 것으로, 학습에 긍정적 영향을 미치는 데이터 선정 방법을 다룬다. 이를 위해 학습 데이터의 유사성을 중심으로 2차원 분포를 형성하고, 일정한 비율로 격자를 형성한다. 각 격자 내에서 동일한 클래스 데이터의 분포 일관성을 기준으로 데이터를 선정하기 위하여 LSTRf 기법을 응용하여 적용한다. 이를 통해 선정된 데이터는 CNN 기반의 분류기를 통해 학습하고 그 성능을 평가한다. CIFAR-10을 활용하여 실험하였으며, 격자의 크기, 1회 연산에서의 선택되는 데이터 수를 다양화하여 학습에 미치는 효과를 평가하였다. 선정된 학습 데이터는 임의로 선정한 동일한 크기의 데이터와 비교하였다. 그 결과 격자의 크기가 작을수록(0.008과 0.005 크기) 학습에 긍정적으로 영향을 미치는 것을 확인하였고, 1회 연산에서 선정된 개수가 많을수록 전체적으로 우수해짐을 확인할 수 있었다.
스마트 환경에서 행위 인식을 위한 센서 선정 기법
스마트 폰의 출현에 이어 최근 웨어러블 기기와 IoT 개념의 등장으로 언제 어디서든 여러 다양한 객체들 간의 상호작용이 가능하게 되었다. 그 중 홈 네트워크를 이용한 스마트 홈 서비스를 위해서는 수많은 센서들이 필요하다. 이러한 스마트 환경에서의 센서 데이터를 이용하여 거주자의 행위를 인식하는 연구가 활발히 진행되고 있다. 각종 센서 데이터 마이닝 기법을 통한 행위 인식 및 패턴 분석을 위해 많은 센서가 사용되지만, IoT 스마트 홈 서비스를 위해 수많은 센서들이 설치되어야 한다면 비용의 문제와 에너지 소모의 문제를 야기할 것이다. 본 논문에서는 스마트 환경에서 주성분 분석과 클러스터링 기법을 활용하여 적은 수의 센서를 선정하는 방식을 제안하며, 이에 따른 거주자 행위 인식률의 개선 효과를 보인다.