검색 : [ keyword: 유사도 ] (35)

한국어 버그리포트에서 번역을 활용한 정보검색기반 버그 추적

김미수

http://doi.org/10.5626/JOK.2024.51.9.827

정보검색기반 버그 추적 기술은 버그리포트를 쿼리로 사용하여 결함이 있는 소스 파일을 자동 으로 찾아주는 기술로, 개발자들이 버그 위치를 찾는데 소모되는 시간을 크게 단축시킬 수 있다. 이 기술 의 핵심은 버그리포트와 소스 파일 텍스트 간 유사도를 계산하는 것이다. 그러나 한국어로 작성된 버그리 포트의 경우, 영어를 기반으로 하는 소스 코드와의 단어 매칭이 어렵기 때문에, 텍스트 유사도가 효과적이 지 않을 수 있다. 본 연구에서는 국내 개발자들이 이 기술을 효과적으로 사용할 수 있도록, 번역을 활용한 한국어 버그리포트를 위한 정보검색기반 버그 추적 기술을 제안한다. 이를 위해 다양한 번역기 결과를 종 합적으로 활용하는 soft voting 방식을 적용한다. 제안 기법의 성능 검증을 위해, 269개의 한국어 버그리 포트를 수집하고, 세 종류의 번역기와 두 종류의 순위 모델을 통해 실험을 수행했다. 그 결과, 제안 기법이 기존 버그리포트 대비 결함 추적 성능을 44% 개선시킴을 확인했다.

계층적인 잠재 표현 기반의 사이버 범죄 신조어 자동 탐지 프레임워크

김용연, 온병원

http://doi.org/10.5626/JOK.2023.50.12.1121

사이버 범죄자들은 의사소통을 위해 기존 단어에 범죄 의미를 추가하거나 유사한 단어로 대체하여 은어를 끊임없이 생산해 사용한다. 이에 대응하기 위해서는 지속적인 모니터링과 수작업이 필요하며 딥러닝을 이용할 경우 레이블 된 많은 양의 학습데이터가 필요하다. 그러나, 사람이 직접 레이블링 하는 것은 시간과 비용이 많이 소요되고 사이버 범죄 특성상 은밀하게 진행되기 때문에 많은 양의 학습데이터를 수집하는 것은 한계 있다. 본 논문에서는 한계를 해결하기 위해 오토인코더를 기반으로 프레임워크를 개발하고 계층적인 잠재 벡터 유사도 비교를 통해 문맥적 사이버 범죄 은어와 신조어를 효과적으로 탐지하는 방안을 제안한다. 사이버 범죄 게시글 데이터셋을 사용하여 실험한 결과, 해당 프레임워크는 유사도 임계값 0.5에서 최대 99.1%의 정확도를 보였다.

이진 분류기를 이용한 안면 인식 스마트 도어의 생체인증 성능개선

김태성, 은창수, 박종원

http://doi.org/10.5626/JOK.2023.50.7.598

안면 인식 기반의 스마트 도어는 카메라를 이용하여 영상을 수집하고, 추출된 안면을 인식하여 방문자의 등록 여부를 판단하는 생체인증 시스템이다. 최근 1인 가구 수의 증가에 따라 출입 편의에 대한 요구가 증가하고 있다. 이에 따라 안면 인식 기법을 이용한 스마트 도어에 관한 연구가 활발하다. 안면 인식 기반의 스마트 도어는 딥러닝 기법을 이용하여 방문자의 안면을 인식한다. 그리고 방문자의 얼굴과 등록자의 얼굴의 차이를 엔코딩을 거쳐 거리로 환산한다. 두 안면의 거리가 임계값 보다 작으면 동일 인물로 판단하여 문을 열어주게 된다. 안면 유사도 임계값은 지역, 인종, 의복 문화에 따라 차이를 가지는데 임계값의 설정에 따라 생체인증 성능이 달라진다. 기존의 연구에서는 등록 여부의 판단 기준이 되는 안면 유사도 임계값을 0.4의 상수를 사용하였다. 본 논문에서는 안면 유사도 임계값을 다섯 가지 이진 분류기를 이용하여 산출하여 생체인증 성능을 비교하였다. LFW 데이터세트를 이용하여 실험한 결과 상수를 사용하였을 때 보다 평균 EER 16.59%가 개선되었다.

PCC 기반 기상 변수 유사도를 고려한 제로 샷 태양광 발전율 예측 기법

김동준, 박성우, 문재욱, 황인준

http://doi.org/10.5626/JOK.2023.50.7.581

화력 발전은 저렴한 단가로 인해 국내외에서 큰 비중을 차지하는 발전 방식이다. 그러나 보건 및 환경 문제를 야기하는 다량의 유해 물질들을 배출한다는 단점 때문에 이를 대체할 발전원으로 신재생 에너지가 주목 받고 있다. 태양광 발전은 유지보수가 용이하다는 등의 장점들 때문에 신재생 에너지 중에서 가장 많은 관심을 받고 있다. 변동성이 강한 태양광 발전의 불확실성을 개선하고 안정적으로 전력을 공급하기 위한 다양한 태양광 발전량 예측 연구가 진행되고 있지만, 기존 연구들은 충분한 양의 과거 발전량 데이터가 존재할 때에만 수행이 가능하다는 한계점이 존재한다. 이에 본 논문은 과거 데이터가 부족한 콜드스타트 문제를 해결하기 위해 기상 유사도를 활용하여 유사한 지역의 과거 데이터를 활용하는 제로샷 학습 기반의 태양광 발전 효율 예측 기법을 제안한다. 성능 비교 결과, 제안 기법이 그러지 않은 경우보다 좋은 성능을 보였고, 그중에서도 한시간 기준 제안 기법이 가장 우수한 예측 성능을 보였다.

최적 속성 할당을 이용한 효율적인 다중 속성 유사 레코드 검색 기법

김예진, 김종익

http://doi.org/10.5626/JOK.2019.46.2.193

본 논문은 다중 속성 데이터로 구성된 레코드에 대한 유사 검색 문제를 다룬다. 데이터들 간의 유사도 측정에 사용되는 기존의 유사도 측정 함수들은 레코드의 각 속성들에 대한 유사성을 측정할 수 없으므로 정확한 결과를 얻기 어렵다. 이러한 문제점을 해결하기 위하여 본 논문은 레코드의 속성들에 대한 유사성을 고려하여 레코드 간의 유사성을 측정하는 레코드 유사도를 제안한다. 또한 주어진 레코드 유사도 임계값에 대한 질의의 후보를 효과적으로 생성하는 필터링 기법을 제안하며, 후보가 질의에 대한 답이 될 수 있는 지를 확인하는 효율적인 검증 기법을 제안한다. 그리고 실험을 통하여 제안하는 기법들이 정확하고 효율적으로 유사한 레코드들을 검색하는 것을 보인다.

집합 기반 유사 시퀀스 매칭의 성능 향상을 위한 최적화 방법

임효상, 이주원

http://doi.org/10.5626/JOK.2018.45.4.403

집합 유사 시퀀스 매칭 방법은 교집합 기반의 유사도를 이용하여 질의 집합 시퀀스와 유사한 데이터 집합 시퀀스를 찾는다. 그러나 수많은 집합 간의 교집합 크기를 계산하는데 수행 시간이 오래 걸리는 성능상의 문제가 있다. 본 논문의 저자들은 간단한 집합 인덱스 구조를 사용한 성능 향상 방법을 제시한 바 있다. 본 논문은 불필요한 연산을 제외하는 프루닝(pruning) 기반 최적화 방법을 제시함으로써, 기존 방법보다 효율적으로 집합 기반 유사 시퀀스 매칭을 수행할 수 있는 방법에 대해 제안한다. 성능 평가 결과, 제안하는 방법이 기존 방법에 비해 약 20% 정도의 수행 시간 감소가 있음을 보인다.

외국인 학습자를 위한 문맥 기반 실시간 국어 문장 교정

박영근, 김재민, 이성동, 이현아

http://doi.org/10.5626/JOK.2017.44.10.1087

외국인 유학생과 국내 체류 외국인 등 한국어를 학습하고자 하는 외국인이 지속적으로 증가함에 따라 외국인 한국어 학습자의 교육에 대한 관심이 높아지고 있다. 기존 맞춤법 검사기는 한국인의 사용에 중점을 두고 있어 외국인 한국어 학습자가 사용하기에는 다소 부적절하다. 본 논문에서는 한국어의 문맥 특성과 외국인의 작문 특성을 반영한 한국어 교정 방식을 제안한다. 제안하는 방식에서는 국어 문서에서 자주 사용되는 표현을 추천 교정으로 제시하기 위해 말뭉치를 활용한다. 말뭉치에서 추출된 어절 바이그램에 대한 음절 역색인을 사용하여 입력된 작문에 대한 교정 후보 집합을 얻고, 외국인의 작문 특성을 반영하는 편집거리 계산 방법을 사용하여 순위화된 추천 교정을 제시한다. 구현된 시스템에서는 사용성 향상을 위해 키보드 후킹에 기반한 사용자인터페이스를 제공하여 다른 응용프로그램에서의 입력과 동시에 문장 교정 결과를 얻을 수 있다. 외국인의 작문 환경에 대한 평가에서는 타 시스템에 비해 검출률을 약 45% 향상시켜, 제안된 시스템을 사용하는 경우 외국인 사용자가 스스로 작문 오류를 판단하고 수정할 수 있어 한국어 학습에 많은 도움이 될 것으로 기대된다.

서로 다른 버전의 동일 오픈소스 함수 간 효율적인 유사도 분석 기법

김영철, 조은선

http://doi.org/10.5626/JOK.2017.44.10.1019

바이너리 유사도 분석은 취약점 분석, 악성코드 분석, 표절 탐지 등에서 사용되고 있는데, 분석대상 함수가 알려진 안전한 함수와 동일하다는 것을 증명해주면 바이너리 코드의 악성행위 분석, 취약점분석 등의 효율성을 높이는 데에 도움이 될 수 있다. 하지만 기존에는 동일 함수의 서로 다른 버전에 대한 유사도 분석에 대해서 별도로 이루어진 연구가 거의 없었다. 본 논문에서는 바이너리로부터 추출 가능한 함수 정보들을 바탕으로 다양한 방법을 통해 함수 단위의 유사도를 분석하고 적은 시간으로 효율적으로 분석할 수 있는 방안을 모색한다. 특히 OpenSSL 라이브러리의 서로 다른 버전을 대상으로 분석을 수행하여 버전이 다른 경우에도 유사한 함수를 탐지하는 것을 확인한다.

계산 속도와 왜곡 강인성을 동시 고려한 이미지 품질 평가

김석원, 홍성우, 진정찬, 김영진

http://doi.org/10.5626/JOK.2017.44.9.992

이미지 품질을 정확히 평가하기 위해 이미지 평가 도구는 인간 시각 시스템을 반영해야 한다. 즉, 이미지의 구조, 색, 명암 비 등 여러 가지 요소들을 고려하여 평가해야 한다. 또한 스마트 폰과 같은 모바일 임베디드 기기의 폭넓은 사용에 따라 빠른 수행 속도를 갖는 것이 중요하다. 본 논문에서는 인간시각 만족과 빠른 계산속도 달성을 동시에 얻기 위하여 색 유사도, 변화율 유사도, 위상 유사도를 상승적으로 결합하였고 최적화된 이미지 풀링 및 양자화 기반으로 설계하였다. 제안하는 기법은 기존에 존재하는 13개의 기법과 비교하였고 네 가지 검증 도구를 사용하여 성능을 검증하였다. 실험 결과 세 검증 도구에서 가장 우수한 성능을 보였고 한 검증 도구에서 기존 최고 기법인 VSI에 이어 두 번째로 좋은 성능을 보였으며 실행 속도는 VSI에 대해 평균 약 20% 개선된 결과를 얻었다. 또한 기존의 기법들 보다 더 인간시각 시스템과 제안 기법의 품질 평가 값의 연관성이 크게 존재함을 확인하였다.

서비스 매쉬업 개발자를 위한 유사도 기반 서비스 추천 방법

김현승, 고인영

http://doi.org/10.5626/JOK.2017.44.9.908

웹 서비스 기술이 각광받고 그 사용이 확대됨에 따라, 복잡하고 동적인 서비스 환경에서 사용자에게 적절한 서비스를 추천하는 방법에 대한 연구가 활발히 진행되고 있다. 또한 효과적인 서비스 매쉬업 개발을 위해 서비스를 추천하는 방법이 제안되었으나, 기존의 매쉬업 단위 서비스 추천 방식은 여러 매쉬업 개발자의 성향을 분석하여 그에 맞는 서비스를 추천하지는 못하였다. 이에 본 논문에서는 매쉬업 개발자들이 만든 서비스 매쉬업의 집합들과 추천 대상 개발자의 매쉬업 집합 사이의 유사도를 측정하고 유사한 매쉬업 집합들로부터 서비스를 추천하는 방법을 제안한다. 그리고 ProgrammableWeb에서 수집된 매쉬업 데이터로 실험한 결과를 비교 분석하여 본 연구의 방법이 사용자 기반 협업 필터링 알고리즘보다 높은 정확도와 재현율을 보임을 확인하였다.


Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr