검색 : [ keyword: MAC ] (115)

데이터-기반 소프트웨어 신뢰도 예측을 이용한 소프트웨어 신뢰도 모델 선택

이낙원, 류덕산, 조일훈, 송재근, 백종문

http://doi.org/10.5626/JOK.2022.49.6.443

다양한 유형의 실패 데이터에 대해서 모두 최적의 성능을 보이는 모델은 없다는 문제를 해결하기 위해서 모델 선택 방법과 데이터-기반 신뢰도 예측 방법이 제안되었다. 그러나 모델 선택 방법은 여전히 모든 유형의 실패 데이터에 대해서 최적의 모델을 선택할 수는 없으며 데이터-기반 방법은 예측 결과로부터 얻을 수 있는 신뢰도 관련 척도가 한정적인 문제가 있다. 본 연구의 목표는 신뢰도를 정확하게 예측하면서도 다양한 신뢰도 관련 척도를 얻는 것이다. 이를 위해 데이터-기반 신뢰도 예측 결과를 이용하여 모델을 선택하는 기법을 제안한다. 이 기법은 과거 실패 데이터로부터 모델 선택 방법과 데이터-기반 방법 중 어떤 방법을 사용할지 선정한다. 데이터-기반 방법을 선정하면 데이터-기반 방법으로 예측한 값으로 증강된 데이터를 만들고 가장 적합한 신뢰도 모델을 선택한다. 제안 기법의 예측 성능을 평가한 결과 예측 오차의 중위 값이 비교대상 기법들 중 가장 정확한 기법에 비해 21% 작은 것을 확인했다.

웨어러블 기기를 이용한 음주운전 감지 시스템

이승화, 유준

http://doi.org/10.5626/JOK.2022.49.5.397

음주 운전은 교통사고에 따른 인명피해를 불러일으킬 수 있다. 음주운전의 위험성이 충분히 각인되고 있음에도 불구하고 음주상태에서는 저하된 판단력으로 인하여 음주운전 교통사고는 매년 다수 발생하고 있다. 본 논문에서는 웨어러블 기기를 이용한 음주운전 감지시스템을 제안한다. 먼저 웨어러블 디바이스인 스마트워치의 범용적인 센서만을 이용하여 데이터를 수집한 후 스마트폰을 통해 서버에 전송하여 머신러닝을 수행하여 음주여부를 판단한다. 이후 차량 내 비콘을 이용한 운전자 감지 알고리즘에 의해 사용자에게 경보를 줌으로써 음주운전을 방지한다. 본 연구에서는 음주 운전을 방지할 수 있도록 하는 시스템을 스마트워치, 스마트폰과 서버에 실제 구현하고 실용화할 수 있는 앱을 개발하였다. 실험 결과 음주운전 판단 정확도는 약 92%, 운전자 감지 알고리즘은 약 99%의 결과를 나타냈다.

머신러닝을 이용한 내장형 소프트웨어의 동시성 오류 탐지 방안 설계 및 구현

이동언, 김지원, 진정훈, 조규태

http://doi.org/10.5626/JOK.2022.49.5.327

내장형 소프트웨어(embedded software)는 범용 소프트웨어와는 다르게 특정 목적에 맞게 하드웨어를 최적화하여 설계하기 때문에 제한된 환경에서의 목표하는 성능을 만족시키는 것이 중요하다. 오늘날 내장형 소프트웨어는 규모와 복잡도가 과거에 비해 크게 증가하고 있다. 규모와 복잡도가 커짐에 따라 소프트웨어에 발생하는 오류의 형태도 다양해지는데 그 중 복잡해진 소프트웨어 모듈 사이에서 발생가능한 동시성 오류(concurrency error)에 대한 이슈가 많다. 이러한 내장형 소프트웨어의 동시성 오류를 검출하기 위해 기존에는 사용자의 수동 입력에 의존하였으나, 본 논문에서는 SVM과 딥러닝을 활용한 머신러닝 기반의 동시성 오류 탐지 도구(MCED)를 제안한다.

비디오 질의응답 정확도 향상을 위해 신뢰성 기반 다중 선택 학습을 활용한 앙상블 모델에 관한 연구

박규민, 김아영, 박성배

http://doi.org/10.5626/JOK.2022.49.4.284

비디오 질의응답은 비디오와 질의를 입력으로 받아서 적절한 응답을 도출하는 문제로, 대표적인 멀티모달 문제 중 하나이다. 비디오 질의응답 모델은 질의에 적절한 응답을 도출하기 위해서 멀티모달 정보뿐만 아니라 시계열 정보를 처리할 수 있는 능력이 필요하다. 그래서 모든 질의에 강건하게 응답하는 단일 모델을 설계하는 것은 어려운 문제이다. 성능 향상을 위해 기존의 여러 모델들을 결합하는 방법이 있다. 하지만 기존의 여러 모델들을 결합하는 방법은 모델마다 비디오를 표현하는 관점이 다르기에 성능을 개선하기 위해서는 각 모델의 관점을 반영할 수 있는 앙상블 모델과 학습 기법이 필요하다. 본 논문에서는 비디오 질의응답 성능을 높이기 위하여 신뢰성 기반 다중 선택 학습(CMCL) 기반의 앙상블 모델을 제안한다. DramaQA 데이터셋으로 실험한 결과, 기존의 두 질의응답 모델에 CMCL을 적용한 모델이 단일 모델들보다 더 높은 성능을 보여주었으며 앙상블 방법들이 모델에 미치는 영향을 분석하였다.

사전 학습된 Encoder-Decoder 모델 기반 질의응답 쌍 생성을 통한 기계 독해 학습 데이터 증강 기법

신현호, 최성필

http://doi.org/10.5626/JOK.2022.49.2.166

기계 독해 연구는 문서에서 질문에 대한 정답을 찾는 것으로 대규모 데이터가 필요하지만 개인 연구자나 소규모 연구 기관이 구축하는 것은 한계가 있다. 이에 본 논문은 사전 학습 언어모델을 활용한 기계 독해 데이터 증강 기법을 제안한다. 기계 독해 데이터 증강 기법은 질의응답 쌍 생성 모델과 데이터 검증 모델로 구성된다. 질의응답 쌍 생성 모델은 정답 추출 모델과 질문 생성 모델로 구성되며, 두 모델 모두 BART 모델을 미세 조정하여 구축하였다. 데이터 검증 모델은 증강 데이터의 신뢰성을 높이기 위해 별도로 추가하였으며, 증강 데이터의 활용 여부를 결정한다. 검증 모델은 ELECTRA 모델을 기계 독해 모델로 미세 조정하여 사용하였다. 증강 기법을 통한 모델 성능 개선을 확인하기 위해 KorQuAD v1.0 데이터에 증강 기법을 적용하였다. 실험 결과 기존 모델 대비 EM Score의 경우 최대 7.2 상승하였고 F1 Score는 최대 5.7 상승하는 유의미한 결과를 도출하였다.

격자 탐색을 통한 확장 학습 블룸 필터의 거짓 양성 비율 개선

양수현, 김형주

http://doi.org/10.5626/JOK.2022.49.1.78

블룸 필터는 집합을 표현하는 자료구조로 데이터의 포함 여부에 대해서 반환하는 역할을 수행한다. 단, 공간을 적게 사용하는 대가로 거짓 양성을 반환하는 경우가 존재한다. 학습 블룸 필터는 기존의 블룸 필터에 추가적으로 기계학습 모델을 전처리 과정에 사용하여 거짓 양성 비율을 개선하는 방법이다. 즉, 학습 블룸 필터는 기계학습 모델로 일부의 데이터를 저장하고, 모델이 저장하지 못하는 데이터는 보조 필터에 저장한다. 보조 필터는 블룸 필터를 그대로 사용하는 방법도 존재하지만, 본 논문에서의 보조 필터는 블룸 필터와 학습 해시 함수를 같이 사용하는 학습 블룸 필터에 대해서 살펴보고 이를 확장 학습 블룸 필터라고 부른다. 학습 해시 함수는 전처리 과정에서 사용하던 기계학습 모델의 출력값을 해시 함수로 사용하는 방법이다. 본 논문에서는 격자 탐색을 통해서 확장 학습 블룸 필터의 거짓 양성 비율을 개선하는 방법을 제안한다. 이는 학습 해시 함수의 비율을 나타내는 초매게변수의 값을 늘려나가며 가장 낮은 거짓 양성 비율을 가지는 확장 학습 블룸 필터를 탐색하는 방법이다. 결과적으로, 100,000개 이상의 데이터를 저장해야하는 실험 환경에서는 격자 탐색을 통해서 선택된 확장 학습 블룸 필터가 기존의 학습 블룸 필터 보다 20% 개선된 거짓 양성 비율을 가질 수 있음을 실험적으로 보인다. 추가적으로, 학습 해시 함수에 사용되는 인공신경망 모델의 출력값이 32비트 부동소수점인 경우에 거짓 음성 오류 문제가 발생할 수 있음을 보이고, 이를 64비트 부동소수점으로 변경하면 해결됨을 보인다. 마지막으로, 10,000개의 데이터를 질의하는 실험 환경에서 인공신경망 모델의 구조를 조정하여 20KB의 공간을 절약하고 동일한 거짓 양성 비율을 갖는 확장 학습 블룸 필터를 만들 수 있음을 보인다. 단, 20KB의 공간을 절약하는 대가로 질의 시간이 2% 늘어난 것을 실험적으로 보인다.

기계 독해 성능 개선을 위한 데이터 증강 기법

이선경, 최은성, 정선호, 이종욱

http://doi.org/10.5626/JOK.2021.48.12.1298

기계 독해(Machine Reading Comprehension)란 컴퓨터가 주어진 텍스트의 의미를 이해 및 이를 평가하는 방법으로, 자연어 이해를 위한 중요한 기술 중 하나이다. 주어진 글에 대해서 질의가 주어졌을 때, 이에 대한 올바른 응답을 찾는 질의-응답이 가장 대표적인 기계 독해 과제이다. 기계 독해 기술은 최근 심층 인공신경망 기반의 자연어 처리 기술의 발달에 따라 획기적인 성능 개선을 보였다. 그럼에도 불구하고, 주어진 데이터가 희소할 때 성능 개선에 어려움이 있을 수 있다. 이를 해결하기 위해 본 논문에서는 단어 단위 및 문장 단위의 텍스트 편집을 통한 데이터 증강 기법을 활용하여 기존 모델의 변경을 최소화하며 성능 개선을 하고자 한다. 즉, 본 연구에서는 영어 질의응답 데이터에서 가장 널리 활용되고 있는 사전 학습된 언어 모델 기반의 기계 독해 모델에 데이터 증강 기법을 적용하여 기존 모델 대비성능이 향상되는 것을 확인하였다.

설명 가능한 KOSPI 증감 예측 딥러닝 모델을 위한 Layer-wise Relevance Propagation (LRP) 기반 기술적 지표 및 거시경제 지표 영향 분석

이재응, 한지형

http://doi.org/10.5626/JOK.2021.48.12.1289

주식 예측 분야에서 인공지능은 정확도를 향상시키는 방향의 연구가 주를 이룬다. 하지만 금융분야에서는 모델의 성능뿐만 아니라 의사결정에 대한 신뢰성과 투명성, 공평성이 보장되어야 한다. 이에 본 논문에서는 주식 예측에 많이 사용되는 거시경제 지표와 기술적 지표를 입력 변수로 선정해 모델을 학습시키고 이 모델의 설명가능성을 줄 수 있는 LRP 기법을 제안한다. 또한 사용자 입장에서 직관적으로 모델 결과를 활용할 수 있도록 KOSPI 주가 종가의 전날 대비 증감으로 문제 정의를 간소화하였다. 적용시킨 LRP를 통해 나온 분석의 결과가 실제 유의미한 결과인 것을 보이기 위해 비교 실험을 진행하였다. 실험 결과 LRP를 통해 선정한 변수들로 데이터를 학습한 모델이 기존의 모델보다 성능이 우수함을 보였다. 또한, 각 변수들이 예측값에 긍정적 영향을 주는 경향성에 대해 분석하여 LRP의 분석 결과가 유의미함을 보였다.

고유명사 기호화를 통한 신경망기반 한영 번역

김명진, 남준영, 정희석, 최희열

http://doi.org/10.5626/JOK.2021.48.10.1084

신경 기계 번역 분야는 딥러닝의 발전과 함께 성능이 발전하고 있지만, 이름, 신조어, 특정 그룹 내에서만 통용되는 단어 등과 같이 고유명사들이 들어간 문장의 번역이 정확하지 않은 경우들이 있다. 본 논문은 고유명사가 들어간 문장의 번역 성능 개선을 위해 최근 제안된 번역 모델인 Transformer Model에 추가적으로 한영 고유명사 사전과 고유명사 기호화 방식을 사용한다. 제안된 방식은 학습에 사용되는 문장의 단어들 중 일부를 고유명사 사전을 이용하여 기호화하고, 기호화된 단어들을 포함한 문장들로 번역 모델을 학습시킨다. 새로운 문장 번역시에도 고유명사 사전을 이용하여 기호화하고 번역후 복호화 하는 방식으로 번역을 완성한다. 제안된 방식의 성능을 검증하기 위해 고유명사 기호화를 사용하지 않은 모델과 함께 비교 실험하였고, BLEU 점수를 통해 수치적으로 개선되는 경우들도 확인했으며, 몇가지 번역 사례들도 상용서비스 결과들과 함께 제시했다.

시계열 access log data를 이용한 IT 인프라 이상징후 감지 앙상블 모델

김정원, 최호진

http://doi.org/10.5626/JOK.2021.48.9.1035

대규모 IT 서비스를 운영하는 곳에서 단지 하나의 시스템을 관리하는 경우는 매우 드물다. 물론 관제를 전담하는 조직이 있다면 서비스의 이상유무에 대해 모니터링이 가능하겠지만, 관제 담당자는 각 서비스의 업무 지식과 도메인에 대해 잘 알지 못하기 때문에, 특정 서비스의 비정상 여부를 판단하기 어려운 것이 사실이다. 따라서 각 서비스마다의 특성을 분석하고 패턴을 학습하여 이상여부를 판단하는 탐지 모델의 needs가 나날이 증가하고 있다. 본 연구에서는 웹서버의 access log에 기록되어 있는 시계열 데이터를 이용하여, 기존 스펙트럼 잔차 방식의 모델이 실시간으로 이상징후를 탐지할 수 있을지에 대해 살펴보고, 실시간 탐지가 어려운 문제를 해결하기 위해 다항회귀모델과 앙상블한 모델을 제시함으로써, 장애상황이 발생하기 전에 빠른 대처를 할 수 있도록 모델을 구현하였다. 그 결과 시스템 장애가 발생하기 전에 이상징후를 감지하여 선제대응을 할 수 있음을 확인할 수 있었다.


Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr