디지털 라이브러리[ 검색결과 ]
Ansible 프로젝트를 위한 교차 프로젝트 결함 예측
http://doi.org/10.5626/JOK.2024.51.3.229
코드형 인프라 (Infrastructure-as-Code, IaC)는 인프라의 생성, 배포 등과 같은 전체적인 관리를 코드를 통해 자동화하는 활동을 가리킨다. IaC는 그 효율성 덕분에 많은 기업들에서 사용되고 있고, 이에 IaC 도구 중 하나인 Ansible에서의 내부 결함 예측 기법이 많이 제안되었다. 최근, Ansible의 교차프로젝트 결함 예측의 적용 가능성에 대한 연구가 제안되었다. 이에 본 연구에서는 Ansible의 교차 프로젝트 결함 예측 기법을 적용한 후 그 성능을 분석하였다. 실험 결과, F1 기준 교차 프로젝트 결함 예측의 성능이 0.3∼0.5로 측정되었으며, 내부 프로젝트 결함 예측 기법을 대신해서 사용할 수 있을 것으로 나타났다. 따라서 이를 이용하여 Ansible의 소프트웨어 품질 보증 활동에 기여할 수 있을 것으로 기대한다.
다중 기계학습 방법을 이용한 한국어 커뮤니티 기반 질의-응답 시스템
커뮤니티 기반 질의 응답 시스템은 사용자 질의에 대한 정답을 인터넷 커뮤니티에 사용자들이 게시했던 문서 중에서 선택하여 제공하는 시스템이다. 기존 방법들은 질의 분석의 성능 향상을 위하여 목적 영역에 적합한 규칙을 구축하거나 일부 처리 과정에 기계 학습을 적용하였다. 하지만 기존 방법들은 적용 영역을 확장하거나 수정하는 경우 많은 비용이 소요되며 경우에 따라서는 시스템이 특정 영역에 과적합되는 경우가 발생한다. 본 논문에서는 커뮤니티 기반 질의-응답 시스템의 효과적인 처리를 위해서 시스템의 각 과정에 적합한 기계 학습 방법을 적용하여 전체 과정을 자동화하는 다중 기계학습 방법을 제안한다. 제안 시스템은 사용자 질의를 분석하는 부분과 정답 문서를 선택하는 부분으로 나눌 수 있다. 질의 분석 과정은 질의의 초점 구문을 분석하는 질의 핵심부 추출기와 질의의 주제를 분류하는 질의 유형 분류기로 구성하였으며, 전자는 조건부 무작위장을 사용하고 후자는 지지 벡터 기계를 사용한다. 정답 문서 선택에서는 유사도 측정에서 사용하는 가중치를 인공 신경망으로 학습한다. 또한 인터넷에 커뮤니티에 게시된 데이터는 형태소 분석 결과를 신뢰할 수 없는 경우가 많이 발생한다. 따라서 음절 자질을 사용하여 질의를 분석 단계에서 형태소 분석의 영향을 최소화하는 방법을 제안한다. 제안하는 시스템은 Mean Average Precision 기준으로 0.765, R-Precision 기준으로 0.872의 성능을 보여 기존 시스템보다 성능이 우수하다.