디지털 라이브러리[ 검색결과 ]
검색 : [ author: Seok-Hun Choi ] (1)
멀티모달 오토인코더 앙상블 기반의 URL 문자열 및 HTML 그래프를 활용한 피싱 웹페이지 탐지
http://doi.org/10.5626/JOK.2025.52.6.461
인터넷의 발전으로 인해 피싱 공격에 노출되는 사용자가 증가하고 있으며, 이를 예방하기 위한 효과적인 탐지 방법이 필수적이다. 기존의 피싱 탐지 방법은 주로 URL의 문자 시퀀스를 분석하는 데 중점을 두었으나, 피싱 URL은 정상 URL과 유사한 패턴을 모방하고 그 수명이 짧아 탐지의 정확도에 한계가 있음이 알려졌다. 이러한 문제를 해결하기 위해 본 논문에서는 URL문자열과 HTML 그래프 데이터를 동시에 활용하는 멀티모달 앙상블 기반의 피싱 웹페이지 탐지 방법을 제안한다. 이 방법은 URL 데이터를 문자 단위로 분해하여 컨볼루션 오토인코더로 처리하고, HTML 의 DOM 구조를 그래프 형태로 변환한 후 그래프 컨볼루션 오토인코더를 통해 분석하여 트랜스포머 레이어를 통해 피싱 여부를 판단한다. 본 연구에서 제안한 모델은 기존 모델 대비 F1 Score 최대 18.91%p의 탐지 성능 개선을 달성했다. 또한, 케이스 분석을 통해 URL과 HTML 간의 상호관계성을 보인다.