검색 : [ author: 이다영 ] (3)

메신저 사용자 검증을 위한 그래프 기반 채팅 메시지 분석 모델 제안

이다영, 조환규

http://doi.org/10.5626/JOK.2022.49.9.696

메신저를 통한 범죄와 사고가 증가하고 있어 메신저 사용자 검증의 필요성이 대두되고 있다. 본 연구에서는 전통적인 저자 검증 문제를 채팅 텍스트에 적용해 두 개의 그래프 기반 메신저 사용자 검증 모델을 제안했다. 그래프 랜덤워크 모델은 이전 채팅 메시지로 n-gram 전이 그래프를 구축하고, 작성자를 알 수 없는 메시지로 전이 그래프를 순회한 특성을 학습해서 사용자를 검증한다. 실험결과 10,000개의 채팅 대화에서 정확도 86%의 성능을 보였다. 그래프 볼륨 모델은 시간의 흐름에 따라 전이 그래프의 규모가 증가하는 특성을 이용해 사용자를 검증했고, 1,000개의 채팅 대화에서 정확도 87%의 성능을 낼 수 있었다. 전송 시각을 기준으로 채팅 메시지의 밀도를 계산했을 때, 두 그래프 모델 모두 채팅 밀도가 15 이상일 때 80% 이상의 정확도를 보장할 수 있었다.

채팅 대화의 구문적 특성을 이용한 크로스-텍스팅 방지 시스템

이다영, 조환규

http://doi.org/10.5626/JOK.2021.48.6.639

크로스-텍스팅(cross-texting)은 실수로 의도하지 않은 상대방에게 메시지를 잘못 전송하는 것을 말한다. 다수의 상대방과 동시에 대화할 때 빈번하게 발생하는 문제로, 메신저에서는 주로 발송 취소라는 기능을 제공하지만 이는 사후 해결책에 해당하며, 사용자가 사전에 실수를 방지하기는 어렵다. 본 논문에서는 채팅 문장의 형식적 특징을 분석하여 크로스-텍스팅을 탐지하는 모델을 제안했다. 채팅 문장에서 높임법, 표층적 완성도 자질을 추출해 특정 사용자의 이전 대화를 모델링하고, 현재 주어진 문장이 사용자 대화 모델에 부합하는지 여부로 크로스-텍스팅을 탐지한다. 이와 같은 방법은 사용자의 채팅 태도의 일관성을 모델링함으로써 의미 분석을 하지 않고 형식적 자질만으로 문제를 해결한데 의의가 있다. 본 논문에서 구현한 시스템으로 실제 메신저 대화 말뭉치를 이용해 자동으로 생성한 데이터에서 85.5% 정확도로 크로스-텍스팅을 탐지할 수 있음을 확인하였다.

문서 요약 및 비교분석을 위한 주제어 네트워크 가시화

김경림, 이다영, 조환규

http://doi.org/

문자 정보는 인터넷 공간에 통용되는 정보의 대다수를 차지하고 있다. 따라서 대용량의 문서의 의미를 빠르게 특히 자동적으로 파악하는 일은 빅 데이터 시대의 중요한 연구 주제중 하나이다. 이 분야의 대표적인 연구 중 하나는 문서의 의미를 요약해주는 주요 주제어의 자동 추출 및 분석이다. 그러나 단순히 추출된 개별 주제어들의 집합만으로 문서의 의미구조를 나타내기에는 부족함이 있다. 본 논문에서는 추출된 주제어들의 연관관계를 그래프로 표현하여 대상 문서의 의미구조를 보다 다양하게 표시하고 추상화할 수 있는 주제어 가시화 방법을 개발하였다. 먼저 각 주제어들 간의 연관관계를 추출하기 위해 주제어별 지배구간 모델과 단어거리 모델을 제안하였다. 이렇게 추출한 주제어 연결성과 그를 형상화한 그래프는 문서의 의미구조를 보다 함축적으로 담고 있으므로 문서의 빠른 내용파악과 요약이 가능하며 이 가시화 그래프를 비교함으로서 문서의 의미적 유사도 비교도 가능하다. 실험을 통하여 문서의 의미파악과 비교에 본 주제어 가시화 그래프는 일반적인 요약문이나 단순 주제어 리스트보다 더 유용함을 보였다.


Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr