검색 : [ keyword: 예측 ] (83)

회귀 분석을 이용한 고복잡도 소프트웨어의 테스터빌리티 예측 모형 구축

최현재, 채흥석

http://doi.org/10.5626/JOK.2023.50.2.162

테스터빌리티는 소프트웨어가 주어진 테스트 컨텍스트에서 테스트를 지원하는 정도를 말한다. 테스터빌리티를 조기에 예측하면 개발자가 소프트웨어 품질을 보장하기 위해 많은 노력을 수행해야하는 소프트웨어 구성 요소를 조기에 식별하고, 테스트 활동을 계획하고, 시험 노력을 줄이기 위한 리팩터링 필요성을 인식하는 데 도움이 될 수 있다. 소프트웨어 메트릭과 코드 커버리지를 이용하여 회귀 분석을 수행해 테스터빌리티를 예측하는 연구들이 수행되었다. 기존 연구들은 단순한 소프트웨어 구조의 비중이 큰 학습 데이터를 사용하였다. 그러나 단순한 구조의 비중이 큰, 불균형 데이터로 학습한 예측 모형은 고복잡도 소프트웨어의 테스터빌리티 예측 정확도가 낮을 수 있다. 본 연구는 고복잡도 소프트웨어를 고려한 예측모형 구축을 위해 산업 도메인 표준의 메트릭 허용 기준을 기반으로 생성한 학습 데이터를 사용하였다. 3가지 회귀 분석을 사용하여 테스터빌리티 예측 모형을 구축한 결과 약 4.4%의 분기 커버리지 오차와 0.86의 결정계수를 가지는 예측 모형을 구축하였다.

클라우드 컴퓨팅 환경에서의 자원 효율적 가상머신 배치를 위한 더브테일 사용량 예측 모델

강형빈, 유현진, 김정빈, 정희석, 신재혁, 노서영

http://doi.org/10.5626/JOK.2023.50.12.1041

기존의 IT 서비스들이 클라우드로 이주함에 따라, 클라우드 컴퓨팅 환경에서의 자원 효율적 운영은 중요한 문제로 대두되고 있다. 이에 데이터 센터의 추가적인 설비 없이 자원의 효율을 증가시킬 수 있는 가상머신 배치(Virtual Machine Placement)에 관한 연구가 진행되어왔다. 본 논문에서는 가상머신을 배치하기 적합한 호스트(Host)를 선정하여 배치하는 방법으로 사용량 예측 모델을 사용할 것을 제안한다. 기존의 사용량 예측 모델의 단점을 개선한 더브테일 사용량 예측 모델은 호스트에 실행되는 가상머신의 CPU, 디스크, 메모리 사용량 등의 지표들을 측정하고, 시계열 데이터로 변환해 딥러닝 모델을 사용해 특징을 추출한다. 이를 가상머신 배치에 활용함으로써 호스트의 자원을 효율적으로 사용하고, 가상머신을 적절하게 로드 밸런싱 할 수 있다.

버그 심각도 예측에 버그 리포트의 다중 토픽 분석 및 CNN 알고리즘 적용

김언태, 양근석, 정인홍

http://doi.org/10.5626/JOK.2023.50.11.954

소프트웨어 개발에 있어 버그는 자주 발생한다. 버그의 심각도에 따라 심각하지 않은 오류와 심각한 오류로 분류할 수 있다. 그러나 버그의 심각도는 버그 리포트 작성자가 주관적인 판단으로 선택할 수 있어 심각도 판단에 오류가 발생할 수 있다. 이를 해결하기 위해 본 논문에서는 토픽별 심각 및 심각하지 않은 특징 추출을 적용하여 버그의 심각도를 예측한다. 먼저, 버그 리포트의 속성을 이용하여, Global 토픽, Product 토픽, Component 토픽 및 Priority 토픽을 구축하고, 각 토픽에 Severe, Non-Severe 기반으로 버그 리포트를 추출한다. Global 토픽에서 Severe, Non-Severe에 대해 심각성에 대한 특징을 추출한다. Product 토픽, Component 토픽, Priority 토픽도 동일하게 심각성 특징을 추출한다. 추출한 특징을 결합하여 CNN 알고리즘에 입력으로 넣고 모델을 학습한다. 제안한 모델의 효율성을 평가하기 위해 Eclipse, Mozilla, Apache, KDE 오픈 소스 프로젝트에서 제안한 모델과 베이스라인을 비교하였다. 제안한 모델이 더 좋은 성능을 보였다. 자세히는 Eclipse 97%, Mozilla 96%, Apache 95%, KDE 99%의 성능을 보였으며 베이스라인 대비 평균 약 24.59%의 성능 향상을 보였다. 추가적으로 통계적 검증에서도 유의미한 차이를 보였다.

능동 학습 기반 교차 프로젝트 결함 예측 시스템에 대한 개선 연구

양태연, 오학주

http://doi.org/10.5626/JOK.2023.50.11.931

본 연구는 교차 프로젝트 결함 예측을 위한 능동 학습 기반 시스템에 대한 실용적 개선 방법을 제안한다. 교차 프로젝트 결함 예측의 성능을 실용적으로 높이기 위해 능동 학습을 적용하는 연구가 시도된 바 있다. 그러나 능동 학습 대상 선정과 결함 예측에 수제 특징을 입력으로 사용하는 전통적 기계학습 모델을 사용했기 때문에 특징 추출에 많은 비용이 들고 성능 한계가 있었으며, 입력 프로젝트의 선택에 따른 성능 편차 문제가 남아있었다. 본 연구에서는 다음의 방법을 제안한다. 첫째, 모델 구축 비용을 낮추고 예측 성능을 높이기 위해 소스 코드를 입력으로 사용할 수 있는 딥러닝 모델을 사용한다. 둘째, 딥러닝 모델로 능동 학습 대상을 선정하기 위한 방법으로 베이지안 합성곱 신경망을 적용한다. 셋째, 다중 프로젝트들로부터 학습 데이터 세트를 자동 추출하는 방법을 적용한다. 본 연구를 7개 오픈 소스 프로젝트들에 적용한 결과, 기존 연구 대비 평균 13.58% 개선된 예측 성능을 확인하였다.

기계학습을 활용한 화합물의 약인성 간 손상 예측 방법 연구

이소연, 유선용

http://doi.org/10.5626/JOK.2023.50.9.777

약인성 간 손상은 임상시험용 의약품이 시장에 유통되는 것을 막는 요인 중 하나이다. 따라서 사전에 화합물의 약인성 간 손상 위험 평가가 필요하다. 안전성을 평가하기 위해 생체 내 (in vivo) 및 시험관 내 시험 방법(in vitro)이 사용되지만 이들은 시간과 비용이 많이 든다. 본 연구에서는 위의 문제를 극복하고자 random forest, light gradient boosting machine, logistic regression 모델을 제안한다. 모델은 입력으로 화합물의 분자 구조와 물리화학적 특징을 사용하고 출력으로 약인성 간 손상을 예측한다. 최적의 모델은 평가 지표에서 전반적으로 좋은 성능을 보인 random forest였다. 본 연구에서 제안된 모델은 신약 후보물질의 잠재적인 간 손상을 미리 파악함으로써 신약 개발 과정에 도움을 줄 수 있을 것으로 기대된다.

순환신경망 기반의 사용자 의도 예측 모델

방성혁, 배석현, 박현규, 전명중, 김제민, 박영택

http://doi.org/10.5626/JOK.2018.45.4.360

기계 학습 모델 구축을 통한 인간의 의도 예측은 기존에도 제공되어 왔으나, 특정 행위가 발생하는 시점으로부터 먼 과거의 정보를 반영한 의도 예측이 어렵다는 단점이 존재했다. 이 문제점의 극복을 위해, 본 논문에서는 순환 신경망(RNN – Recurrent Neural Network) 기반의 행위 의도 예측 모델 학습 기법을 제안한다. 순환 신경망 모델은 시계열(Time-Series) 데이터의 패턴을 분석하여 과거의 시점이 반영된 예측 결과를 생성한다. 본 논문이 제안하는 순환 신경망 기반의 의도 예측 모델은 시간, 공간, 행위, 물체, 의도로 구성된 생활 데이터 시퀀스를 바탕으로 사용자의 의도를 예측할 수 있도록 학습된다. 순환 신경망의 각 노드는 의도 예측 모델이 먼 과거의 데이터 시퀀스를 고려하여 의도를 예측 할 수 있도록 LSTM(Long-Short Term Memory) Cell로 구성하였다. 순환 신경망 기반의 의도 예측 모델의 성능 평가를 위해, 본 논문에서는 행위 의도에 대한 가중치 그래프 기반 데이터 생성기를 구축하여 실제 실내에서 발생하는 인간 활동에 가까운 데이터를 자동으로 생성하여 실험에 사용했다. 총 23,000개의 데이터가 의도 모델 학습과 검증에 사용되었으며, 학습된 모델의 의도 예측 정확도 측정 실험을 한 결과로 평균 90.52%의 예측 정확도를 보였다.

모바일 결제 시스템의 수요 예측을 위한 신경망에서 특징 선별 기법

김호준, 조윤석, 김경미

http://doi.org/10.5626/JOK.2018.45.4.370

본 논문에서는 모바일 결제시스템의 서비스 수요예측을 위한 방법론으로서 신경망 기반의 시계열예측 기법을 제시한다. 예측에 필요한 특징 선별과정과 시계열 데이터의 예측과정을 위하여 2단계 신경망 모델을 제안하며 그 동작 특성과 알고리즘에 관해 기술한다. 특징 데이터의 표현을 위하여 3종류의 퍼지 멤버쉽함수를 적용하며, 하이퍼박스 기반의 신경망 모델을 사용하여 특징의 연관도 요소를 평가하는 방법을 제시한다. 제안된 특징 선별 기법은 예측 시스템의 계산량을 감소시키며, 학습데이터 집합에서 왜곡된 특징 데이터를 제거할 수 있게 한다. 실제 스마트캠퍼스 시스템에서 취득한 2년간의 데이터를 사용하여 실험을 수행하고 그 결과를 통하여 제안된 기법의 유용성을 평가한다.

페이지랭크를 이용한 암환자의 이질적인 예후 유전자 식별 및 예후 예측

최종환, 안재균

http://doi.org/10.5626/JOK.2018.45.1.61

암환자의 예후 예측에 기여하는 유전자를 찾는 것은 환자에게 보다 적합한 치료를 제공하기 위한 도전 과제 중 하나이다. 예후 유전자를 찾기 위해 유전자 발현 데이터를 이용한 분류 모델 개발 연구가 많이 이루어지고 있다. 하지만 암의 이질성으로 인해 예후 예측의 정확도 향상에 한계가 있다는 문제가 있다. 본 논문에서는 유방암을 비롯한 6개의 암에 대한 암환자의 마이크로어레이 데이터와 생물학적 네트워크 데이터를 이용하여 페이지랭크 알고리즘을 통해 예후 유전자들을 식별하고, K-Nearest Neighbor 알고리즘을 사용하여 암 환자의 예후를 예측하는 모델을 제안한다. 그리고 페이지랭크를 사용하기 전에 K-Means 클러스터링으로 유전자 발현 패턴이 비슷한 샘플들을 나누어 이질성을 극복하고자 한다. 본 논문에서 제안한 방법은 기존의 유전자 바이오마커를 찾는 알고리즘보다 높은 예측 정확도를 보여주었으며, GO 검증을 통해 클러스터에 특이적인 생물학적 기능을 확인하였다.

소셜 데이터 기반 실시간 식자재 물가 예측 모형

김재우, 차미영, 이종건

http://doi.org/10.5626/JOK.2017.44.12.1258

신속하고 정확한 시장의 물가 파악은 소비자 개인을 넘어 정부와 관련 기업의 주요 관심 사항이다. 그러나 국가 단위의 물가 데이터 취합은 적지 않은 시간과 비용이 필요하다. 특히 통계 데이터 관련 인프라가 미약한 개발도상국의 경우 물가 지표 파악은 일 혹은 주 단위로 지연되어 국가의 정책 결정에 필요한 주요한 데이터의 부재가 있을 뿐만 아니라 투자 잠재성을 저하시킨다. 이러한 배경에서 이 연구는 온라인 소셜 네트워크 빅데이터를 활용한 실시간 물가 예측(Nowcast) 모델을 제시한다. 제안하는 모델은 트위터와 같은 온라인 빅데이터를 수집 및 분석함으로써 주요 소비재 시장물가를 실시간으로 단기 예측하는 알고리즘으로, 실제 15개월간 인도네시아를 대상으로 주요 식자재의 일별 물가 추이 예측에서 높은 정확도를 보임을 검증하였다. 해당 모델은 다양한 언어와 상품군으로 확장 가능하며, 기존 경제 통계를 보조함으로써 시장동향의 파악으로 정부와 기업의 전략 수립에 기여할 것으로 기대된다.

모듈형 베이지안 네트워크 기반 대중 감성 예측 시스템

최슬기, 조성배

http://doi.org/10.5626/JOK.2017.44.11.1149

최근 통신 기술의 발달로 공간 내 환경 자극을 나타내는 다양한 센서 데이터 수집이 가능해졌다. 베이지안 네트워크는 추론 근거를 확률적으로 고려함으로써 센서 데이터의 불확실하고 불완전한 특성을 보완할 수 있다. 본 논문은 환경 자극의 심리적 영향력을 고려하여 설계된 모듈형 베이지안 네트워크기반 대중 감성 예측 시스템을 제안한다. 또한 단일 베이지안 네트워크를 모듈화하여 공간 내 환경 자극변동의 유연한 대응 및 효율적 추론을 수행하였다. 시스템의 성능 검증을 위해 유치원 공간에서 수집된 조도, 음량, 온도, 습도, 색 온도, 음향, 향기, 대중 감성 데이터를 기반으로 대중 감성을 예측하였다. 실험결과, 제안하는 방법의 예측 정확도는 85%로 여타 분류 기법보다 높은 성능을 나타내었다. 정량적, 정성적 분석을 통해 대중 감성 예측을 위한 확률 기반 방법론의 가능성 및 한계를 분석하였다.


Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr