디지털 라이브러리[ 검색결과 ]
검색 : [ author: Yong-Yeon Kim ] (1)
계층적인 잠재 표현 기반의 사이버 범죄 신조어 자동 탐지 프레임워크
http://doi.org/10.5626/JOK.2023.50.12.1121
사이버 범죄자들은 의사소통을 위해 기존 단어에 범죄 의미를 추가하거나 유사한 단어로 대체하여 은어를 끊임없이 생산해 사용한다. 이에 대응하기 위해서는 지속적인 모니터링과 수작업이 필요하며 딥러닝을 이용할 경우 레이블 된 많은 양의 학습데이터가 필요하다. 그러나, 사람이 직접 레이블링 하는 것은 시간과 비용이 많이 소요되고 사이버 범죄 특성상 은밀하게 진행되기 때문에 많은 양의 학습데이터를 수집하는 것은 한계 있다. 본 논문에서는 한계를 해결하기 위해 오토인코더를 기반으로 프레임워크를 개발하고 계층적인 잠재 벡터 유사도 비교를 통해 문맥적 사이버 범죄 은어와 신조어를 효과적으로 탐지하는 방안을 제안한다. 사이버 범죄 게시글 데이터셋을 사용하여 실험한 결과, 해당 프레임워크는 유사도 임계값 0.5에서 최대 99.1%의 정확도를 보였다.