검색 : [ author: Jaehee Jung ] (3)

차량 애드혹 네트워크에서 오동작 유형 분류를 위한 효과적인 임베딩 방법

김민규, 정재희

http://doi.org/10.5626/JOK.2024.51.11.970

차량들 간의 데이터를 송수신 할 수 있도록 하는 네트워크 기술인 VANET에는 차량, 인프라, 보행자 사이의 통신을 기반으로 차량 외부 정보와 내부 정보를 교환 할 수 있는 통신 기술인 V2X가 있다. 그러나 네트워크에서 결함 및 공격 정보를 포함한 데이터를 방송함으로 인해 치명적인 문제를 일으킬 수 있어 MBD(Misbehavior Detection) 시스템은 VANET에서 필수적인 기술이다. 최근에는 기계학습을 활용한 MBD 연구가 활발하지만, VANET에서의 오동작 유형들의 패턴이 정상 유형과 유사하여, 이를 일괄적으로 학습하여 완벽하게 분류하는 것에는 한계가 존재한다. 기존 연구에서 공격과 결함에 따른 분류 체계를 계층적으로 정의하여 오동작을 분류하는 방식을 제안하고 있다. 본 연구에서는 정확도가 높은 오동작 분류 모델 제안을 위해 계층적 분류 체계를 구축하기 위한 임베딩 표현 방법을 제안한다. 오동작 유형 분류를 사전 학습한 LSTM 모델을 통해 다변량 시계열 데이터에 대한 임베딩 벡터를 추출하여 오동작 유형의 핵심데이터를 압축하고, 계층적 군집화를 사용하여 다양한 공격 유형을 큰 그룹으로 나누는 방식을 제안하였다.

VAE 기반 데이터 증강과 CNN을 적용한 ECG 부정맥 분류 모델

곽진희, 정재희

http://doi.org/10.5626/JOK.2023.50.11.947

ECG 데이터는 비교적 쉽게 얻을 수 있고, 부정맥의 진단에 결정적인 역할을 하기 때문에 심장 질환의 예방 목적 연구에 자주 사용된다. MIT-BIH 부정맥 데이터셋은 심장병의 원인 중 하나인 부정맥 분석 연구에 많이 사용되지만, 발병률에 차이가 존재하므로 부정맥 클래스 불균형 문제를 지니고 있다. 부정맥의 클래스 간 불균형은 부정맥 분류 성능에 영향을 주기 때문에, 본 논문에서는 부정맥 클래스의 불균형 문제를 해결하고자 증강된 데이터를 이용하여 서로 다른 4가지 분류 방법을 제시하였다. 증강에 따른 분류 성능 평가를 위하여 VAE 이외의 다른 증강 방법과 비교하였으며, 분류 모델에 따라 CNN과 CNN-LSTM도 비교 분석하였다. 결론적으로 VAE 증강을 적용하여 균형 데이터를 학습 후 CNN을 이용하여 부정맥 데이터를 분류한 결과, 98.9%의 정확도를 달성하였으며, 최신 연구 결과와 비교하면 제안한 모델이 민감도에서 다른 부정맥 분류 모델에 비해 효과적임을 확인하였다.

CBCA 준거 분류에서의 BERT 기반 모델 성능 비교

신준호, 신정수, 조은경, 윤여훈, 정재희

http://doi.org/10.5626/JOK.2022.49.9.727

아동 성범죄의 경우 피해자의 진술은 사건의 유, 무죄를 판별함에 있어서 매우 중요하게 작용하기 때문에, 대검찰청에서는 피해자 진술 분석 기법인 Criteria-Based Content Analysis (CBCA)에 따라, 진술 내용을 총 19개의 준거로 분류하여 진술 전체의 신빙성을 판단한다. 그러나 이는 진술분석관의 주관적 의견에 따라 준거 분류가 상이할 수 있다. 따라서 본 논문에서는 BERT와 RoBERTa를 사용하여 객관적 분류 모델을 제시하기 위하여 크게 두가지 분류 방식을 적용하여 비교 분석하였다. 두 가지 방법은 전체 준거를 동시에 분류하는 방식과 4개의 그룹으로 나누어 1차 분류 후 해당 그룹 내에서 어떠한 준거인지 2차 분류하는 방식으로 구성하였다. 진술 문장을 CBCA의 중복 분류되는 준거를 제외한 16개 준거로 분류하고, 여러 사전 학습 모델을 사용한 비교 분석을 수행하였다. 분류 결과, 전자의 분류 방식이 총 16개의 준거 중 13개의 준거에서 후자의 분류 방식보다 성능이 높았으며, 학습 데이터의 수가 상대적으로 부족한 3개의 준거에서 후자의 방식이 효과적임을 확인하였다. 또한 RoBERTa 기반 모델이 16개의 준거 중 15개의 준거에서 BERT 기반 모델보다 성능이 높았으며, 나머지 1개의 준거에서는 한국어 대화형 구어체만으로 사전학습한 BERT 모델만이 유일하게 분류하였다. 이는 대화형 구어체 데이터로 사전 학습된 모델이 아동의 진술 문장을 분류함에 있어서 효과적임을 알 수 있다.


Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr