검색 : [ author: Seok-Jun Bu ] (6)

멀티모달 오토인코더 앙상블 기반의 URL 문자열 및 HTML 그래프를 활용한 피싱 웹페이지 탐지

윤준호, 최석훈, 김혜정, 부석준

http://doi.org/10.5626/JOK.2025.52.6.461

인터넷의 발전으로 인해 피싱 공격에 노출되는 사용자가 증가하고 있으며, 이를 예방하기 위한 효과적인 탐지 방법이 필수적이다. 기존의 피싱 탐지 방법은 주로 URL의 문자 시퀀스를 분석하는 데 중점을 두었으나, 피싱 URL은 정상 URL과 유사한 패턴을 모방하고 그 수명이 짧아 탐지의 정확도에 한계가 있음이 알려졌다. 이러한 문제를 해결하기 위해 본 논문에서는 URL문자열과 HTML 그래프 데이터를 동시에 활용하는 멀티모달 앙상블 기반의 피싱 웹페이지 탐지 방법을 제안한다. 이 방법은 URL 데이터를 문자 단위로 분해하여 컨볼루션 오토인코더로 처리하고, HTML 의 DOM 구조를 그래프 형태로 변환한 후 그래프 컨볼루션 오토인코더를 통해 분석하여 트랜스포머 레이어를 통해 피싱 여부를 판단한다. 본 연구에서 제안한 모델은 기존 모델 대비 F1 Score 최대 18.91%p의 탐지 성능 개선을 달성했다. 또한, 케이스 분석을 통해 URL과 HTML 간의 상호관계성을 보인다.

미시간 스타일 심층 학습 분류기 시스템 기반 적응적 데이터베이스 침입 탐지

부석준, 조성배

http://doi.org/10.5626/JOK.2023.50.10.891

역할 기반 접근 제어(RBAC) 환경에서 데이터베이스 침입 탐지는 쿼리 트랜잭션에 대한 역할 분류기를 설계하고, 예측된 역할이 실제 수행된 역할과 다를 때 침입으로 판단함으로써 실현될 수 있다. 최근의 쿼리-역할 분류기 설계 방법들은 딥러닝 모델을 활용하였지만, 변화하는 패턴에 대해 높은 정확도와 불완전한 적응성을 동시에 달성하는 것이 어려웠다. 이러한 문제를 해결하기 위해, 본 연구에서는 미시간 스타일 심층 학습 분류기 시스템(MDLCS)을 제안한다. 이 방법은 입력 공간을 패턴별로 분할하고 최적의 분류기를 할당하는 분할-정복 전략을 적용하며, 미시간 스타일 학습 분류기 시스템의 진화 연산 원리와 딥러닝 분류기를 결합하여 실시간으로 변화하는 패턴에 적응하고 탐지 성능을 향상시킨다. 제안된 MDLCS 방법은 이상 징후 탐지, 서명 기반 탐지, 행동 기반 탐지 등 기존 침입 탐지 방법들과 비교하여 강한 적응성과 견고함을 제공한다. MDLCS는 TPC-E 스키마를 따르는 상업 데이터베이스에서 평가되었고, 순차적으로 새로운 패턴이 발생하는 실제 환경 조건에서 기존 방법 대비 26.81%p 개선된 탐지 성능을 달성하였다.

제어 흐름 기반 그래프 트랜스포머를 이용한 악성코드 공격의 기능적 특징 학습

부석준, 조성배

http://doi.org/10.5626/JOK.2023.50.8.633

악성분류 분류에서 미탐 사례를 최소화하기 위해 연산 블락과 메모리 레지스터 주소 간의 제어 흐름 같은 프로그램의 국소적 특징을 포착하는 것이 중요하다. 그러나 악성코드의 기능적 특징을 고려하지 않고 분류기의 손실 함수를 최적화하는 기존의 방법은, 유사하지만 새로운 공격 경로를 활용하는 공격과 길고 복잡한 제어 흐름 그래프로 인해 재현율에 한계가 있다. 본 논문에서는 API호출, 루트킷 DLL설치, 특정 가상메모리의 접근을 포함하는 기능적 특징을 학습하는 것으로 재현율을 개선하기 위해 제어흐름 그래프를 명시적으로 샘플링하고 임베딩하는 방법을 제안한다. 제어 흐름 그래프로부터 악성코드의 기능적 패턴을 모델링하기 위해 악성코드의 제어 흐름으로부터 공격 경로를 샘플링한 뒤 트랜스포머 기반의 그래프 임베딩 함수를 이용하여 악성코드 종류를 분류한다. 제안하는 방법을 입증하기 위해 실제 윈도우 악성코드로 구성된 마이크로소프트 챌린지 데이터셋을 사용하였다. 악성코드의 제어 흐름을 명시적으로 학습함으로써 최고 의 재현율 97.89%를 확보하였고, 최신 및 가장 진보된 방법의 분류 정확도(97.89%)에 대비하여 크게 개선된 정확도(99.45%)를 달성하였다.

노년층 우울감 예측을 위한 시맨틱 네트워크기반 도메인 지식과 그래프 컨볼루션 결합

부석준, 박경원, 조성배

http://doi.org/10.5626/JOK.2023.50.3.243

노년층의 우울감은 매해 3억명의 환자와 80만명의 자살자가 발생하는 전세계적인 문제로, 이동성과 밀접한 연관이 있는 생활패턴으로부터 조기 탐지하는 것이 중요하다. 센싱정보 기반의 그래프 컨볼루션 신경망이 유망하기는 하나, 복잡한 센싱정보 시퀀스로부터 표현되는 고수준 행동을 표현하는 것이 필요하다. 본 논문에서는 추가적인 전문가 지식을 활용하여 노년층의 일상생활을 구조화하는 시맨틱 네트워크를 구축하고, 저수준 센싱 로그 그래프와 상호 보완적으로 이용하기 위한 그래프 컨볼루션 모델을 제안한다. 제안하는 방법은 ㈜DNX가 제공한 69명의 독거노인에 대한 800시간의 실제 데이터로 교차실험한 결과, 최신의 딥러닝 모형 대비 최고의 우울감 예측 성능을 달성하였다. 특히 기존 모델 대비 28.86%의 성능 개선을 보임으로써 시맨틱 네트워크로의 추론과 그래프 컨볼루션 모델의 타당성을 검증하였다.

상측두구의 동적 뇌 연결성 학습 기반 자폐 진단 시스템

박경원, 부석준, 조성배

http://doi.org/10.5626/JOK.2022.49.5.354

시각 피질 영역과 연결된 상측두구의 기형이 자폐증의 주요한 원인이라는 가설을 고려하여, 신경생물학적 증거를 보강하기 위해 두 영역 간의 뇌 기능 연결성을 이용할 수 있는 모델이 필요하다. 본 논문에서는 뇌 영상 이미지 내부의 동적 연결성을 관측치에 근거하여 선택 및 추출할 수 있는 자가집중 메커니즘과 컨볼루션 순환신경망의 조합을 제안한다. 신경망 내부에서 손실되는 동적 연결성을 보존하기 위한 계층 간 연결을 포함하는 구조와 자가 집중 메커니즘을 통해 연결성으로부터 자폐 특성을 선택 추출하는 두 가지 방법을 결합함으로써 일반화 성능을 고려하면서 두 영역의 동적 연결성 보존하는 기능을 제안한다. 제안하는 방법은 10겹 교차검증으로 평가하고, 기존 최고 자폐 진단 성능을 달성한 앙상블 신경망대비 4.90% 성능 향상을 달성한다. 추가로 신경망의 활성화 영역과 신경망 내부 임베딩 벡터 가중치를 시각화함으로써 제안하는 방법의 자폐 진단 및 뇌 영상 모델링 분야 타당성을 검증한다.

피싱 URL 분류를 위한 컨볼루션-순환 트리플렛 신경망 기반 웹주소 특징공간의 학습

부석준, 김혜정

http://doi.org/10.5626/JOK.2021.48.2.147

폭발적으로 성장하는 소셜 미디어 서비스 등으로 인해 개인간의 연결이 강화된 환경에서는 URL을 통해 전파되는 피싱 URL의 자동화된 분류가 필수적이다. URL을 구성하는 문자와 단어수준의 특징을 모델링하기 위한 컨볼루션-순환신경망 기반의 피싱 URL 분류용 딥러닝 모형은 정확도의 측면에서 최고의 성능을 달성하였으나, 피싱 URL 데이터의 클래스 불균형으로 인한 샘플링 단계에서의 문제와 특징공간 구축시의 문제가 알려졌다. 본 논문에서는 URL 도메인에서의 클래스 불균형 이슈를 딥러닝 기반의 URL 특징공간 생성 태스크의 측면에서 지적하고 URL간의 유사도를 직접 학습할 수 있는 개선된 트리플렛 신경망 구조를 제안하였다. 제안하는 방법은 실제 웹으로부터 수집된 60,000건의 URL 데이터셋에 대해 검증되었고 최신의 딥러닝 기반 방법 대비 최고의 성능을 달성하였다. 개선된 트리플렛 신경망은 시간해상도 별 10겹 교차검증으로 평가되었고, 기존 딥러닝 알고리즘 대비 재현율 측면 45%의 향상을 보임으로써 피싱 URL 분류 분야에서의 표현형 학습 접근의 타당성을 검증하였다.


Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr