검색 : [ author: Hwan-Gue Cho ] (7)

메신저 사용자 검증을 위한 그래프 기반 채팅 메시지 분석 모델 제안

이다영, 조환규

http://doi.org/10.5626/JOK.2022.49.9.696

메신저를 통한 범죄와 사고가 증가하고 있어 메신저 사용자 검증의 필요성이 대두되고 있다. 본 연구에서는 전통적인 저자 검증 문제를 채팅 텍스트에 적용해 두 개의 그래프 기반 메신저 사용자 검증 모델을 제안했다. 그래프 랜덤워크 모델은 이전 채팅 메시지로 n-gram 전이 그래프를 구축하고, 작성자를 알 수 없는 메시지로 전이 그래프를 순회한 특성을 학습해서 사용자를 검증한다. 실험결과 10,000개의 채팅 대화에서 정확도 86%의 성능을 보였다. 그래프 볼륨 모델은 시간의 흐름에 따라 전이 그래프의 규모가 증가하는 특성을 이용해 사용자를 검증했고, 1,000개의 채팅 대화에서 정확도 87%의 성능을 낼 수 있었다. 전송 시각을 기준으로 채팅 메시지의 밀도를 계산했을 때, 두 그래프 모델 모두 채팅 밀도가 15 이상일 때 80% 이상의 정확도를 보장할 수 있었다.

채팅 대화의 구문적 특성을 이용한 크로스-텍스팅 방지 시스템

이다영, 조환규

http://doi.org/10.5626/JOK.2021.48.6.639

크로스-텍스팅(cross-texting)은 실수로 의도하지 않은 상대방에게 메시지를 잘못 전송하는 것을 말한다. 다수의 상대방과 동시에 대화할 때 빈번하게 발생하는 문제로, 메신저에서는 주로 발송 취소라는 기능을 제공하지만 이는 사후 해결책에 해당하며, 사용자가 사전에 실수를 방지하기는 어렵다. 본 논문에서는 채팅 문장의 형식적 특징을 분석하여 크로스-텍스팅을 탐지하는 모델을 제안했다. 채팅 문장에서 높임법, 표층적 완성도 자질을 추출해 특정 사용자의 이전 대화를 모델링하고, 현재 주어진 문장이 사용자 대화 모델에 부합하는지 여부로 크로스-텍스팅을 탐지한다. 이와 같은 방법은 사용자의 채팅 태도의 일관성을 모델링함으로써 의미 분석을 하지 않고 형식적 자질만으로 문제를 해결한데 의의가 있다. 본 논문에서 구현한 시스템으로 실제 메신저 대화 말뭉치를 이용해 자동으로 생성한 데이터에서 85.5% 정확도로 크로스-텍스팅을 탐지할 수 있음을 확인하였다.

순환신경망을 이용한 태양광 발전량 예측 모델 설계

김한호, 탁해성, 조환규

http://doi.org/10.5626/JOK.2019.46.6.506

스마트그리드는 태양광 발전을 포함한 신·재생에너지의 발전량을 예측하고 이를 기반으로 효율적인 전력 생산과 소비를 가능하게 한다. 기존 태양광 발전량 예측 연구들은 시계열에 뛰어난 순환신경망 기법들을 적용 및 비교한 연구가 거의 없다. 또한 학습에 사용되는 과거 데이터의 길이에 대한 고려가 없어 모델의 예측 성능이 떨어졌다. 본 연구에서는 임베디드 변수 선택 기법을 이용하여 태양광 발전에 영향을 미치는 요인을 찾아내고, 시계열 순환신경망 기법들(RNN, LSTM. GRU)에 다양한 과거 데이터 길이를 넣는 실험을 진행하였다. 이 과정에서 가장 뛰어난 성능을 보이는 예측 요인들을 찾고 예측 모델을 설계하였다. 설계한 태양광 발전량 예측 모델은 다른 변수 설정을 사용할 때와 비교하여 더욱 뛰어난 예측 성능을 보이는 것을 확인하였다. 또한 기존 연구들과의 비교를 통하여 본 연구에서 개발한 태양광 발전량 예측 결과가 더 뛰어난 성능을 보이는 것을 확인하였다.

문서 요약 및 비교분석을 위한 주제어 네트워크 가시화

김경림, 이다영, 조환규

http://doi.org/

문자 정보는 인터넷 공간에 통용되는 정보의 대다수를 차지하고 있다. 따라서 대용량의 문서의 의미를 빠르게 특히 자동적으로 파악하는 일은 빅 데이터 시대의 중요한 연구 주제중 하나이다. 이 분야의 대표적인 연구 중 하나는 문서의 의미를 요약해주는 주요 주제어의 자동 추출 및 분석이다. 그러나 단순히 추출된 개별 주제어들의 집합만으로 문서의 의미구조를 나타내기에는 부족함이 있다. 본 논문에서는 추출된 주제어들의 연관관계를 그래프로 표현하여 대상 문서의 의미구조를 보다 다양하게 표시하고 추상화할 수 있는 주제어 가시화 방법을 개발하였다. 먼저 각 주제어들 간의 연관관계를 추출하기 위해 주제어별 지배구간 모델과 단어거리 모델을 제안하였다. 이렇게 추출한 주제어 연결성과 그를 형상화한 그래프는 문서의 의미구조를 보다 함축적으로 담고 있으므로 문서의 빠른 내용파악과 요약이 가능하며 이 가시화 그래프를 비교함으로서 문서의 의미적 유사도 비교도 가능하다. 실험을 통하여 문서의 의미파악과 비교에 본 주제어 가시화 그래프는 일반적인 요약문이나 단순 주제어 리스트보다 더 유용함을 보였다.

이동 객체의 부분 유사궤적 탐색을 활용한 교차로 검출 기법

박보국, 박진관, 김태용, 조환규

http://doi.org/

대부분의 차량에서 GPS 기반의 내비게이션을 사용함에 따라, 도로 지도를 자동적으로 생성하는 것은 중요한 연구 문제이다. 본 논문에서는 지도 정보 없이 GPS 궤적을 이용한 교차로 검출 기법을 제안한다. 이 기법은 궤적이 교차로에서 여러 갈래로 나누어지는 것을 이용한다. 이전의 교차로 검출 연구에서는 정차 빈도나 회전방향을 이용하였다. 그러나 제안하는 교차로 검출 기법은 이러한 복잡한 정보를 이용하지 않는다. 이 기법은 주어진 궤적에 대한 부분 궤적 매칭 결과를 이용하여 교차로에 진입한 궤적들이 서로 다른 도로로 나뉘어 이동하는 것을 이용한다. 강남구에서 수집된 실제 차량 궤적 1266개를 대상으로 실험하였다. 실험 결과 제안한 기법은 일반적인 십자 모양의 교차로에서 좋은 성능을 보였다. 제안시스템은 선정한 교차로에 대해 재현율 75%, 민감도 78%의 성능을 보였다. 더 많은 궤적을 이용하면 더 신뢰할 수 있는 검출 결과를 낼 수 있을 것으로 예상된다.

대용량 GPS 궤적 데이터를 위한 효율적인 클러스터링

김태용, 박보국, 박진관, 조환규

http://doi.org/

도로지도 생성은 인공위성 촬영이나 현장실사를 기반으로 한다. 그리하여 도로지도를 생성하고 수정하는데 많은 시간과 비용이 든다. 이러한 이유로 차량 GPS 데이터를 이용해 도로지도를 생성하는 연구가 활발히 진행되고 있다. 도로지도 생성 연구에서 가장 중요한 문제는 주도로와 같은 대표궤적을 추출하는 것이다. 대표궤적 추출을 수행할 때에는 시작과 끝이 비슷한 궤적데이터들의 집합을 전제로 하여 궤적을 추출한다. 따라서 대표궤적을 추출하기에 앞서 전처리 과정으로 궤적 클러스터링 작업이 필요하다. 본 논문에서는 이러한 문제를 해결하기 위해 하나의 영역을 일정한 격자로 분할하고, Sweep Line 알고리즘을 응용해 유사궤적들을 탐색한다. 마지막으로 프레쉐거리를 이용하여 궤적 간 유사도를 계산하였다. 실제로 서울의 강남구 지역에 있는 500대의 차량 GPS 궤적을 가지고 클러스터링 작업을 수행하였다. 또한, 실험을 통하여 격자분할 접근방식의 빠른 수행시간과 안정성을 보였다.

계산속도 및 정확도의 적응적 제어가 가능한 다단계 문서 비교 시스템

서종규, 탁해성, 조환규

http://doi.org/

유사한 문서를 비교하는 방법으로는 지문법과 서열 정렬법이 널리 알려져 있다. 지문법은 계산속도가 빠른 대신 정확도가 떨어지며, 서열정렬법은 계산속도가 느린 대신 정확도가 높다. 다단계 정렬은 두 방법의 비중을 조절하여 문서 유사도를 비교할 수 있는 새로운 방법의 문서 유사도 측정 방법으로, 각 방법의 장점을 얻으면서 동시에 단점을 보완하도록 고안되었다. 특히 두 비교 방법의 비중을 “블록크기”라는 단일 변수를 이용하여 조절할 수 있도록 한 것이 제안 시스템의 핵심이다. 다단계 정렬은 문서를 일정한 길이의 블록으로 나누어 지문을 추출하고 블록간의 유사도를 계산한 다음 그 결과를 서열정렬법으로 다시 한 번 탐색하는 과정을 거친다. 이때 문서가 분할되는 과정에서 유사구간이 두 개 이상의 블록으로 나누어지는 현상이 발생하기도 한다. 이 논문에서는 다단계 정렬방법에 대해 설명하고, 유사도 비교 성능개선을 위한 단편화 제거 기법과 휴리스틱 비교법에 대해 설명하고 실험적으로 그 결과를 보인다.


Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr