디지털 라이브러리[ 검색결과 ]
소프트웨어 결함 예측의 조선해양/해상운송 산업 적용 사례 연구
http://doi.org/10.5626/JOK.2020.47.8.769
소프트웨어 결함 예측(Software Defect Prediction)은 최신의 다양한 기계학습 (Machine Learning) 기법을 적용하여 과거의 소프트웨어 결함 및 업데이트 정보를 학습한 모델을 기반으로 새로 개발된 소프트웨어 결함을 사전에 예측하는 연구이다. 이를 통해 실제 산업에서 소프트웨어 품질보증(SQA) 자원을 효과적으로 운영/배치하기 위한 가이드로 활용할 수 있다. 최근 산업 적용 사례들이 일부 학계에 보고되고 있지만, 특성이 서로 다른 다양한 도메인 적용과 이를 적용하면서 얻은 통찰을 실제에 반영하는 연구가 보다 활발하게 필요한 상황이다. 본 논문에서는 최근 고효율 친환경 선박, 커넥티드 선박, 스마트 선박, 무인 선박, 자율운항 선박 등 미래 운송 수단으로의 변화에 직면해 있는 조선해양/해상운송 산업에 소프트웨어 결함 예측의 적용 가능성을 제시한다. 해당 도메인에서 수집된 실제 데이터를 활용하여 실험을 수행한 결과 0.91 Accuracy와 0.831 F-measure의 높은 결함 예측 성능을 보여 가능성을 확인하였고, 기존 사례가 없는 해당 산업으로의 적용 방안을 제시하여 SQA 자원 배치를 효과적으로 지원하는 도구가 될 것으로 기대 된다.
경로 임베딩 기반 지식 그래프 완성 방식
http://doi.org/10.5626/JOK.2020.47.8.722
지식 그래프는 질의응답 또는 추천시스템과 같은 지능형 시스템을 구성하는데 많이 사용된다. 그러나 지식 그래프에는 대부분의 엔티티들 사이에 관계 링크가 누락되어 있는 문제가 존재한다. 이런 문제를 해결하기 위해 본 논문에서 BLSTM(Bidirectional LSTM) 및 CNN(Convolutional Neural Network)을 결합한 새로운 지식 그래프 완성 방법을 제안한다. 우선, 후보 관계와 두개의 대상 엔티티가 주어지면 BLSTM 및 Convolution 연산을 사용하여 엔티티들을 연결하는 경로들을 저차원 공간으로 임베딩한다. 그리고 어텐션(attention) 모델을 통해 두 개의 엔티티를 표현하는 여러 경로들을 하나의 벡터로 만든다. 벡터와 추론할 후보 관계 사이의 연관성을 통해 후보 관계가 엔티티들과 연결될 수 있는지에 대한 가능성을 예측한다. 제안하는 방법은 CNN을 이용해서 주어진 엔티티들의 관계를 추론하기에 가장 중요한 지역특징(local feature)을 엔티티 사이에 있는 경로에서 추출하고 BLSTM을 이용해서 추출한 지역특징의 순서 관계에 대해 학습한다. 이를 통해 저차원 경로 특징을 효과적으로 학습 하는 것이 가능했으며, 학습된 특징들을 이용해 엔티티 사이의 관계를 예측하였다. 여러 지식 그래프를 대상으로 링크 예측(link prediction) 실험을 진행했으며, 제안하는 방법이 최신 연구 결과보다 높은 성능을 보였다.
다중 클래스 멤버쉽 처리를 위한 Bi-LSTM 기반 지식 그래프 완성 기법
http://doi.org/10.5626/JOK.2020.47.6.559
실세계의 지식을 구조화된 방식으로 표현한 지식 그래프는 웹 검색, 추천 시스템과 같이 다양한 분야에서 활용되고 있지만, 엔티티 또는 엔티티 사이의 링크가 누락되는 문제가 존재한다. 이러한 문제해결을 위해 임베딩 기법을 사용하거나 딥러닝을 활용한 다양한 연구들이 진행되었으며, 특히 CNN과 Bidirectional-LSTM을 결합한 최신 연구가 기존 연구들과 비교하여 높은 성능을 나타냈다. 그러나 하나의 엔티티에 대하여 여러 개의 클래스 타입이 정의된 경우 학습 데이터의 양이 기하급수적으로 증대되어 학습시간이 증가하는 문제와 엔티티의 클래스 타입 정보가 정의되지 않으면 학습 데이터 생성이 불가능하다는 한계점이 존재한다. 따라서 본 논문에서는 엔티티의 클래스 타입 수에 상관없이 학습 데이터 생성과 모델에서 학습 및 추론이 가능하도록 미리 학습된 지식 그래프 임베딩 벡터를 사용하는 방법과 vector addition 개념을 활용한 다중 클래스 멤버쉽 처리 방법을 제안한다. 본 논문에서 제안하는 방법의 성능을 평가하기 위해 데이터셋 NELL-995 와 FB15K-237을 대상으로 기존 지식 완성 연구들과 비교 실험을 진행하였으며 MAP이 1.6%p, MRR이 1.5%p 더 높은 성능을 보였다.
도심지 교통흐름 및 미세먼지 예측을 위한 딥러닝 LSTM 프레임워크
http://doi.org/10.5626/JOK.2020.47.3.292
정확하고 시기 적절한 예측은 스마트시티의 성공적인 추진을 위한 중요한 단계이다. 매일 수집되는 교통 데이터의 급격한 성장으로, 도심지에서 단기 교통 예측을 위한 최근 연구는 장단기메모리 LSTM(Long-Short Term Memory) 기반의 딥러닝으로 집중되고 있다. 하지만 단기 (5분) LSTM 모델은 실시간 비선형 교통흐름 예측에는 한계가 있다. 더욱이, 교통 데이터에 기반한 미세먼지 예측은 또한 매우 시급한 연구 분야이다. 따라서 본 논문에서는, 중기/장기 예측을 지원하기 위한 멀티 층 LSTM 프레임워크를 설계하였다. 또한 교통데이터 기반 미세먼지 흐름을 예측하기위한 컨볼루션 ConvLSTM(Convolutional LSTM) 모델을 개발하였다. 교통흐름 예측을 위하여 대전시 중심도로의 차량검지기 VDS (Vehicle Detection System) 데이터를 활용하였다. 실험 결과 본 논문에서 제안한 모델은 우수한 예측 성능을 보여주었다.
표층 중립화 기반의 언어 스타일 전이
http://doi.org/10.5626/JOK.2020.47.2.162
감정과 같은 자연어 문장의 스타일을 전이하기 위해 해결할 문제는 문장의 스타일을 없애는 중립화와 중립화된 문장에 스타일을 입히는 작업이다. 기존 연구에서는 적대적 학습을 통해서 잠재 공간에서 중립화를 수행했다. 하지만 이런 방식은 원래의 내용을 유지하면서 스타일을 전이하는 것에 어려움을 겪는다. 본 논문에서는 잠재 공간에서가 아닌 표층 수준에서 스타일을 띄는 단어를 지우는 것으로 중립화를 수행하고 지운 단어들을 적절히 전이된 단어로 예측해 복구하는 2단계 언어 스타일 전이 방법을 제안한다. 이를 위해서 자기주의 기반 분류기의 히트맵과 단어 예측기를 활용한다. 제안 모델을 평가하기 위해서 Yelp와 Amazon 리뷰 데이터셋, 그리고 Caption 데이터셋을 활용해 스타일 전이 실험을 수행했다. 자동 평가와 사람 평가 결과, 제안 모델이 여러 측면에서 비교 모델보다 높은 성능을 보였다.
잠재디리슐레할당 기반 군집화를 통한 유사 범죄코드 발굴과 범죄예측
http://doi.org/10.5626/JOK.2020.47.1.45
범죄데이터를 활용한 범죄예측에 대한 연구가 선진국의 대도시를 대상으로 활발히 진행되고 있다. 이러한 범죄예측 연구는 실제로 예측 치안(Predictive Policing)에서 활용되어 범죄 사건을 예측하여 해당 예측을 기반으로 치안계획을 수립방법론들이 실제 성공적으로 적용되고 있다. 범죄데이터를 용이하게 관리하기 위하여 범죄의 종류를 구분해야 될 필요가 있고, 해외 기관들은 범죄종류별 코드를 부여하여 효율적으로 데이터를 관리하고 있다. 본 연구에서는 범죄데이터를 분류하는 범죄코드간 유사성을 기계학습 알고리즘으로 측정하여 발생되지 않은 범죄의 코드를 예측하는 모델을 제안한다. 기존의 범죄율이나 사건의 장소, 시간을 예측하는 예측방법론 외에도 범죄코드 예측은 범죄의 종류를 예측하는 측면에서 중요성이 부각된다. 범죄의 종류의 예측이 가능하여야 경찰행정을 효율적으로 계획 배치할 수 있기 때문이다. 본 연구에서 제안하는 알고리즘을 기반으로 실증 데이터를 이용하여 모델의 우수성을 검증하였다.
모바일 게이머의 인지심리속성 추출 및 구매예측 성능개선
http://doi.org/10.5626/JOK.2019.46.9.892
게이머의 게임 내 구매는 게임회사의 매출과 직결되는 중요한 요소 중 하나이다. 평균적으로 95%의 게이머는 게임 내 구매를 하지 않으며, 극소수의 게이머가 게임회사 매출의 대부분을 책임지고 있다. 이러한 까닭에 게임 기업들은 이러한 소수의 구매 게이머들을 유지시키고 증대시킬 필요가 있다. 본 논문에서는 모바일 알피지 게임 ‘소울게이지’의 로그데이터를 사용하여 게이머의 인지심리를 추정할 수 있는 7가지 인지심리속성(경쟁성, 도전성, 충성도, 사회성, 활동성, 효율성, 성실성)을 정의하고 추출하였다. 또한, 결제금액을 기준으로 분류된 게이머들을 7가지 인지심리속성을 이용하여 분석하였고, 그 결과 인지심리속성과 결제금액과의 연관성이 있음을 보였다. 추가적으로, 7가지 인지심리속성을 이용하여 게이머의 구매를 비교적 높은 정확도로 예측하였다. 이러한 결과는 게임 로그로부터 게이머를 인지심리 기반하에 분석할 수 있고 게임 내 구매를 비교적 높은 성능으로 예측할 수 있음을 의미한다.
순환신경망을 이용한 태양광 발전량 예측 모델 설계
http://doi.org/10.5626/JOK.2019.46.6.506
스마트그리드는 태양광 발전을 포함한 신·재생에너지의 발전량을 예측하고 이를 기반으로 효율적인 전력 생산과 소비를 가능하게 한다. 기존 태양광 발전량 예측 연구들은 시계열에 뛰어난 순환신경망 기법들을 적용 및 비교한 연구가 거의 없다. 또한 학습에 사용되는 과거 데이터의 길이에 대한 고려가 없어 모델의 예측 성능이 떨어졌다. 본 연구에서는 임베디드 변수 선택 기법을 이용하여 태양광 발전에 영향을 미치는 요인을 찾아내고, 시계열 순환신경망 기법들(RNN, LSTM. GRU)에 다양한 과거 데이터 길이를 넣는 실험을 진행하였다. 이 과정에서 가장 뛰어난 성능을 보이는 예측 요인들을 찾고 예측 모델을 설계하였다. 설계한 태양광 발전량 예측 모델은 다른 변수 설정을 사용할 때와 비교하여 더욱 뛰어난 예측 성능을 보이는 것을 확인하였다. 또한 기존 연구들과의 비교를 통하여 본 연구에서 개발한 태양광 발전량 예측 결과가 더 뛰어난 성능을 보이는 것을 확인하였다.
온라인 게임에서 사용자의 이탈 예측 및 이탈 사유 분석
http://doi.org/10.5626/JOK.2018.45.11.1124
온라인 롤플레잉 게임(MMORPG) 내 사용자들은 다양한 소셜 활동 성향을 보이며, 일부 사용자의 경우 혼자 게임을 즐기는 성향을 나타내기도 한다. 본 논문에서는 사용자가 소속된 길드의 특성을 소셜 활동 및 소속감 정도에 따라 분류하고, 분류된 각 그룹의 이탈율 및 이탈원인을 분석한다. 또한 소셜활동 성향으로 분류된 각 사용자 그룹을 대상으로 게임 참여도 변동 추이를 측정하여 이탈을 예측하는 프레임워크를 제안한다. 비슷한 성향으로 분류된 각 그룹의 사용자는 이탈 직전에 유사한 행동 패턴을 보일 수 있으므로, 이를 기준으로 이탈 사용자와 비이탈 사용자의 패턴을 분류할 수 있다. 엔씨소프트의 대표 MMORPG인 아이온 데이터를 대상으로 본 모델을 테스트하였으며, 평균 약 75%의 정밀도를 보여주었다.
복부 CT 영상에서 다중 아틀라스 기반 형상 및 밝기값 정보를 사용한 신실질 자동 분할
http://doi.org/10.5626/JOK.2018.45.9.937
부분신장절제술 후 절제술을 수행한 반대쪽 신장의 보상성 비대를 예측하기 위해 신실질을 분할하는 것이 필요하다. 본 논문에서는 복부 CT 영상에서 다중 아틀라스 기반 형상 및 밝기값 정보를 사용한 신실질 자동 분할 방법을 제안한다. 첫째, 볼륨 기반 유사 정합 및 밝기값 기반 유사도 측정을 통해 유사 아틀라스를 선정한다. 둘째, 볼륨 기반 유사 정합 및 아틀라스 기반 어파인 정합의 단계적 정합 및 밝기값 기반 제한된 지역적 가중투표를 통해 신실질을 분할한다. 셋째, 밝기값의 분포가 훈련 영상과 달라 분할이 제대로 되지 않는 데이터에 대해 가우시안 혼합 모델 기반 다중 임계치 기법을 통한 피질 분할 및 형상확률맵을 이용한 수질 분할 방법을 선택적으로 수행한다. 제안방법을 통한 분할 결과와 수동 분할 결과 간 다이스 유사계수는 91.34%로, 다중 투표 기법을 통한 분할 및 지역적 가중투표를 통한 분할 방법대비 다이스 유사계수가 각각 18.19%, 1.35% 향상되었다.