디지털 라이브러리[ 검색결과 ]
미시간 스타일 심층 학습 분류기 시스템 기반 적응적 데이터베이스 침입 탐지
http://doi.org/10.5626/JOK.2023.50.10.891
역할 기반 접근 제어(RBAC) 환경에서 데이터베이스 침입 탐지는 쿼리 트랜잭션에 대한 역할 분류기를 설계하고, 예측된 역할이 실제 수행된 역할과 다를 때 침입으로 판단함으로써 실현될 수 있다. 최근의 쿼리-역할 분류기 설계 방법들은 딥러닝 모델을 활용하였지만, 변화하는 패턴에 대해 높은 정확도와 불완전한 적응성을 동시에 달성하는 것이 어려웠다. 이러한 문제를 해결하기 위해, 본 연구에서는 미시간 스타일 심층 학습 분류기 시스템(MDLCS)을 제안한다. 이 방법은 입력 공간을 패턴별로 분할하고 최적의 분류기를 할당하는 분할-정복 전략을 적용하며, 미시간 스타일 학습 분류기 시스템의 진화 연산 원리와 딥러닝 분류기를 결합하여 실시간으로 변화하는 패턴에 적응하고 탐지 성능을 향상시킨다. 제안된 MDLCS 방법은 이상 징후 탐지, 서명 기반 탐지, 행동 기반 탐지 등 기존 침입 탐지 방법들과 비교하여 강한 적응성과 견고함을 제공한다. MDLCS는 TPC-E 스키마를 따르는 상업 데이터베이스에서 평가되었고, 순차적으로 새로운 패턴이 발생하는 실제 환경 조건에서 기존 방법 대비 26.81%p 개선된 탐지 성능을 달성하였다.
제어 흐름 기반 그래프 트랜스포머를 이용한 악성코드 공격의 기능적 특징 학습
http://doi.org/10.5626/JOK.2023.50.8.633
악성분류 분류에서 미탐 사례를 최소화하기 위해 연산 블락과 메모리 레지스터 주소 간의 제어 흐름 같은 프로그램의 국소적 특징을 포착하는 것이 중요하다. 그러나 악성코드의 기능적 특징을 고려하지 않고 분류기의 손실 함수를 최적화하는 기존의 방법은, 유사하지만 새로운 공격 경로를 활용하는 공격과 길고 복잡한 제어 흐름 그래프로 인해 재현율에 한계가 있다. 본 논문에서는 API호출, 루트킷 DLL설치, 특정 가상메모리의 접근을 포함하는 기능적 특징을 학습하는 것으로 재현율을 개선하기 위해 제어흐름 그래프를 명시적으로 샘플링하고 임베딩하는 방법을 제안한다. 제어 흐름 그래프로부터 악성코드의 기능적 패턴을 모델링하기 위해 악성코드의 제어 흐름으로부터 공격 경로를 샘플링한 뒤 트랜스포머 기반의 그래프 임베딩 함수를 이용하여 악성코드 종류를 분류한다. 제안하는 방법을 입증하기 위해 실제 윈도우 악성코드로 구성된 마이크로소프트 챌린지 데이터셋을 사용하였다. 악성코드의 제어 흐름을 명시적으로 학습함으로써 최고 의 재현율 97.89%를 확보하였고, 최신 및 가장 진보된 방법의 분류 정확도(97.89%)에 대비하여 크게 개선된 정확도(99.45%)를 달성하였다.
노년층 우울감 예측을 위한 시맨틱 네트워크기반 도메인 지식과 그래프 컨볼루션 결합
http://doi.org/10.5626/JOK.2023.50.3.243
노년층의 우울감은 매해 3억명의 환자와 80만명의 자살자가 발생하는 전세계적인 문제로, 이동성과 밀접한 연관이 있는 생활패턴으로부터 조기 탐지하는 것이 중요하다. 센싱정보 기반의 그래프 컨볼루션 신경망이 유망하기는 하나, 복잡한 센싱정보 시퀀스로부터 표현되는 고수준 행동을 표현하는 것이 필요하다. 본 논문에서는 추가적인 전문가 지식을 활용하여 노년층의 일상생활을 구조화하는 시맨틱 네트워크를 구축하고, 저수준 센싱 로그 그래프와 상호 보완적으로 이용하기 위한 그래프 컨볼루션 모델을 제안한다. 제안하는 방법은 ㈜DNX가 제공한 69명의 독거노인에 대한 800시간의 실제 데이터로 교차실험한 결과, 최신의 딥러닝 모형 대비 최고의 우울감 예측 성능을 달성하였다. 특히 기존 모델 대비 28.86%의 성능 개선을 보임으로써 시맨틱 네트워크로의 추론과 그래프 컨볼루션 모델의 타당성을 검증하였다.
회전 기계 고장 진단을 위한 적대적 순환 일관성 유지 학습기반 교차 도메인 적응 방법
http://doi.org/10.5626/JOK.2022.49.7.530
다양한 산업분야에서 데이터 기반의 고장 진단 모델에 대한 연구가 활발히 이루어지고 있다. 그러나 산업 장비의 경우 다양한 운행 조건이 발생하고, 이에 따른 충분한 훈련 데이터 확보가 어렵다는 문제가 있다. 이러한 문제를 해결하기 위해 교차-도메인 적응 기법을 활용할 수 있다. 본 연구에서는 회전체 진동 데이터를 사용하여 학습되지 않은 새로운 환경 데이터에 대해서도 고장 분류 일관성을 유지할 수 있는 적대적 일관성 유지 변환 학습 방법을 제안한다. 일관성 유지 학습을 통해 생성된 데이터는 새로운 운행 조건 데이터 분포와 이미 알고 있는 데이터 분포 간의 연속적인 불변 잠재 공간을 생성하고, 고장분류 특징 정보를 공유하는 적대적 학습 네트워크를 통해 고장 분류 성능을 유지하도록 학습한다. 따라서 제안된 방법은 도메인 데이터 간의 불일치를 최소화할 수 있는 잠재적 공간을 넓힘으로써 보다 안정적이고 일반적인 분류 성능을 확보할 수 있다. 제안한 모델의 실험결과는 약 88%내외의 성능 평가가 이루어졌으며, 기존 교차-도메인 적응 학습 기법들과 비교하여, 약 5~10%의 성능향상을 보였다. 이러한 연구결과로 실제 산업현장에서 겪는 장비 고장 진단 문제의 효과적인 해결방안이 될 것으로 기대된다.
상측두구의 동적 뇌 연결성 학습 기반 자폐 진단 시스템
http://doi.org/10.5626/JOK.2022.49.5.354
시각 피질 영역과 연결된 상측두구의 기형이 자폐증의 주요한 원인이라는 가설을 고려하여, 신경생물학적 증거를 보강하기 위해 두 영역 간의 뇌 기능 연결성을 이용할 수 있는 모델이 필요하다. 본 논문에서는 뇌 영상 이미지 내부의 동적 연결성을 관측치에 근거하여 선택 및 추출할 수 있는 자가집중 메커니즘과 컨볼루션 순환신경망의 조합을 제안한다. 신경망 내부에서 손실되는 동적 연결성을 보존하기 위한 계층 간 연결을 포함하는 구조와 자가 집중 메커니즘을 통해 연결성으로부터 자폐 특성을 선택 추출하는 두 가지 방법을 결합함으로써 일반화 성능을 고려하면서 두 영역의 동적 연결성 보존하는 기능을 제안한다. 제안하는 방법은 10겹 교차검증으로 평가하고, 기존 최고 자폐 진단 성능을 달성한 앙상블 신경망대비 4.90% 성능 향상을 달성한다. 추가로 신경망의 활성화 영역과 신경망 내부 임베딩 벡터 가중치를 시각화함으로써 제안하는 방법의 자폐 진단 및 뇌 영상 모델링 분야 타당성을 검증한다.
시맨틱 네트워크 구조를 기반으로 한 라이프로그로부터 페트리넷을 이용한 패턴추출
http://doi.org/10.5626/JOK.2020.47.6.553
최근 다양한 스마트 기기의 확산으로 여러 종류의 센서를 통해 사용자의 라이프로그 데이터가 자동으로 저장되고 있다. 그러나 스마트 기기로부터 수집된 라이프로그는 서로 다른 센서로부터 이질적인 정보를 자동으로 기록한다. 또한 사용자의 생활 패턴이 라이프로그의 서로 다른 판정 주기에 의해 결정되기 때문에 단순한 규칙 기반 시스템으로 정의하기 어렵다. 따라서 라이프로그로부터 유용한 생활 패턴을 추출하여 사용자에게 제공하기 위해서는 수많은 동적 요소들의 관계를 표현해야한다. 본 논문에서는 시맨틱 네트워크구조로 표현된 라이프로그로부터 페트리넷을 이용하여 사용자 생활 패턴을 자동으로 추출하는 방법을 제안한다. 제안하는 생활 패턴 추출 방법은 이질적으로 수집된 사용자 라이프로그의 의미관계를 나타내기 위해 의미구조를 정의하고 시맨틱 네트워크로 구조화한다. 또한 페트리넷 그래프를 이용하여 시간흐름에 따라 불규칙적으로 변화하는 라이프로그를 의학적 진단 항목을 기반으로 자동으로 판단하여 개인의 수면, 식사 생활패턴을 추출한다. 페트리넷은 스마트 기기 센서 데이터의 불확실성을 줄이고 생활 패턴의 다양성을 증가시킨다. 제안하는 방법의 유용성을 확인하기 위해 안드로이드 앱으로 수집한 65명의 라이프로그 데이터를 사용하여 실험을 진행하고 사용자의 수면, 식사 패턴에 따른 페트리넷의 패턴추출 정확도를 확인한다.
성별의 알고리즘 편향성 감소를 위한 오토인코더 기반 딥러닝 모델
http://doi.org/10.5626/JOK.2019.46.8.721
알고리즘 편향성은 알고리즘 설계과정에서 트레이닝 데이터에서의 편견이나 모델과 데이터의 특성 사이의 조합에 의해 모델에 반영되는 편향을 의미한다. 최근에는 이러한 편향성이 딥러닝 모델에서 나타날 뿐만 아니라 증폭된다는 연구가 진행되면서 편향성 제거에 관한 문제가 제기되고 있다. 본 논문에서는 성별에 의한 알고리즘 편향성을 편향-분산 딜레마의 관점에서 분석하며 편향성의 원인을 규명하였고 이를 해결하기 위해 심층 오토인코더 기반 잠재공간 일치모델을 제안한다. 우리는 딥러닝에서의 알고리즘 편향성은 모델 내부의 특징 추출부분에서 보호특징별 잠재 공간이 다르다는 것을 실험으로 보여주었다. 본 논문에서 제안하는 모델은 성별특징이 다른 데이터를 동일한 잠재공간으로 전사시킴으로써 추출된 특징의 차이를 줄여 저편향성을 달성하였다. 우리는 정량적 평가지표로 Equality of Odds와 Equality of Opportunity를 사용하여 기존모델에 비해 편향성이 낮음을 입증하고 ROC 곡선으로 통해 성별사이의 예측결과의 편차가 줄어들었음을 확인하였다.
욕설문장 분류의 불균형 데이터 해결을 위한 전이학습 방법
http://doi.org/10.5626/JOK.2017.44.12.1275
욕설문장을 지도학습 접근법으로 분류하기 위해서 욕설인지 아닌지 판별된 학습 문장이 필요하다. 문자수준의 컨볼루션 신경망이 각 문자에 대해 강건성을 가지기 때문에 욕설분류에 적합하지만, 학습에 많은 데이터가 필요하다는 단점이 있다. 본 논문에서는 이를 해결하기 위해 임의로 생성한 욕설/비욕설 문장 쌍을 컨볼루션 신경망을 기반으로 하는 분류기에 학습시켜 컨볼루션 신경망의 필터가 욕설의 특징을 분류하도록 조정한 후, 실제 훈련문장을 학습시킬 때 필터를 재사용하는 전이학습방법을 제안한다. 이로써 데이터 부족과 클래스 불균형으로 인한 영향이 감소하여 분류 성능이 향상될 것이다. 실험 및 평가는 총 3가지 데이터에 대해 수행되었으며, 문자수준 컨볼루션 신경망을 활용한 분류기는 모든 데이터에서 전이학습을 적용했을 때 더 높은 F1 점수를 획득하였다.
모듈형 베이지안 네트워크 기반 대중 감성 예측 시스템
http://doi.org/10.5626/JOK.2017.44.11.1149
최근 통신 기술의 발달로 공간 내 환경 자극을 나타내는 다양한 센서 데이터 수집이 가능해졌다. 베이지안 네트워크는 추론 근거를 확률적으로 고려함으로써 센서 데이터의 불확실하고 불완전한 특성을 보완할 수 있다. 본 논문은 환경 자극의 심리적 영향력을 고려하여 설계된 모듈형 베이지안 네트워크기반 대중 감성 예측 시스템을 제안한다. 또한 단일 베이지안 네트워크를 모듈화하여 공간 내 환경 자극변동의 유연한 대응 및 효율적 추론을 수행하였다. 시스템의 성능 검증을 위해 유치원 공간에서 수집된 조도, 음량, 온도, 습도, 색 온도, 음향, 향기, 대중 감성 데이터를 기반으로 대중 감성을 예측하였다. 실험결과, 제안하는 방법의 예측 정확도는 85%로 여타 분류 기법보다 높은 성능을 나타내었다. 정량적, 정성적 분석을 통해 대중 감성 예측을 위한 확률 기반 방법론의 가능성 및 한계를 분석하였다.
은행 텔레마케팅 예측을 위한 레이블 전파와 협동 학습의 결합 방법
http://doi.org/10.5626/JOK.2017.44.7.686
텔레마케팅은 지식정보화 사회가 되면서 기업 마케팅 활동의 중심축으로 발전하였다. 최근 금융데이터에 기계학습을 적용하는 연구가 활발하게 진행되고 있으며 좋은 성과를 내고 있다. 하지만 지도학습법이 대부분이어서 많은 양의 클래스가 있는 데이터가 필요하다. 본 논문에서는 텔레마케팅의 목표 고객을 선정하는데 클래스가 없는 금융 데이터에 자동으로 클래스를 부여하는 방법을 제안한다. 준지도 학습법 중 레이블 전파와 의사결정나무 기반의 협동 학습으로 클래스가 없는 데이터를 레이블링한다. 신뢰도가 낮은 데이터를 제거한 후 두 방법이 같은 클래스로 예측한 데이터만 추출한다. 이를 학습 데이터에 추가한 후 의사결정나무를 학습하여 테스트 데이터로 평가한다. 제안하는 방법의 유용성을 입증하기 위해 실제 포르투갈은행의 텔레마케팅 데이터를 이용하여 실험을 수행하였다. 비교 실험 결과, 정확도가 83.39%로 1.82% 향상되고, 정밀도가 19.37%로 2.67% 향상되었으며, t-검증을 통해 유의미한 성능 향상이 있음을 입증하였다.