디지털 라이브러리[ 검색결과 ]
공유계층을 이용한 형태소 분석과 개체명 인식 통합 모델
http://doi.org/10.5626/JOK.2021.48.2.167
한국어 형태소 분석은 형태소 분석, 품사 태깅 과정으로 나뉜다. 형태소 분석 과정에서 형태소와 품사 후보 쌍을 추출하고, 품사 태깅 과정에서는 추출된 후보 중 문맥에 알맞은 형태소와 품사를 결정한다. 개체명 인식은 문장 내에서 인명, 지명, 기관명, 날짜, 시간 등과 같이 고유한 의미를 갖는 단어를 찾아 개체명을 부착하는 기술이다. 개체명 인식과 형태소 분석 연구는 주로 독립적으로 수행되며, 많은 개체명 인식 연구에서 품사 정보를 사용한다. 이 과정에서 형태소 분석의 오류가 개체명 인식에 치명적인 오류로 전파된다. 본 논문에서는 오류 전파를 최소화하기 위해 통합 모델을 제안한다. 형태소 분석기의 오류를 줄이기 위해 순차적 레이블 부착 문제에 효과적인 레이블 주의 집중 네트워크를 활용한다. 실험 결과, 개체명 인식과 형태소 분석의 단일 모델보다 통합 모델의 성능이 더 높음을 보였다. 또한 기존의 통합모델 보다 레이블 주의 집중 네트워크를 적용한 제안 모델이 더 높은 성능을 보였다.
LEXAI : 설명 가능한 인공지능을 이용한 법률 문서 유사도 분석 서비스
http://doi.org/10.5626/JOK.2020.47.11.1061
최근 딥러닝 학습의 성능이 향상됨에 따라, 전문적인 분야에서 이 방법을 사용하려는 연구가 다양해지고 있다. 유사한 논리적 의미를 가진 법률 문서의 검색은 법률 분야에서 매우 중요한 부분이지만, 관련 분야의 전문적인 지식을 요구하기 때문에 전문가 시스템을 사용한 서비스에서 벗어나기 어려운 실정이다. 또한, 전문가 시스템을 구성하는 데는 전문 인력의 비용이 과다하게 발생하므로 자동화된 유사 법률 문서 검색환경을 구축하기에 어려운 점이 있다. 기존의 유사 문서 검색 서비스가 전문가 시스템과 통계적 시스템에 기반하는 환경을 제공하는데 비하여, 제안하는 방법은 분류 작업을 위한 뉴럴 네트워크를 학습하고 이를 사용하는 방법을 채택하였다. 우리는 설명 가능한 뉴럴 네트워크를 이용하여 의미적 유사도가 높은 법률 문서간의 검색을 제공하는 데이터베이스 시스템 구조를 제안하였다. 이러한 제안 기법의 특징은 유사 문서들 간의 의미적 관련성에 대한 시각적 유사도 평가 방법을 마련하고 이를 검증하는 성과를 보여준다.
공유 메모리를 이용한 유저모드 폴링 기반 바이너리 호환 가상 머신 간 통신 기법
http://doi.org/10.5626/JOK.2020.47.11.1015
가상 머신의 호스트 및 타 가상 머신 간 데이터 교환에서 호환성을 위해 보편적으로 TCP/IP 프로토콜을 사용하나 성능상의 비효율성이 발생한다. 가상 머신 간 공유 메모리를 이용하여 통신할 경우 더 효율적인 데이터 전송이 가능하지만, 기존 TCP/IP 기반 프로그램을 재프로그램 혹은 재컴파일해야 하는 단점이 있다. 이를 해결하기 위한 가상 머신 간 공유 메모리 기반 바이너리 호환 통신 방법들이 연구되었으나 제거되지 못한 오버헤드가 존재한다. 이 논문은 현재의 가상 머신 간 공유 메모리 기반 바이너리 호환 통신 방법들의 오버헤드를 제거하는 기법을 제안한다. 제안한 구조에서는 기존 네트워크 스택을 TCP/IP 라이브러리의 함수 후킹으로 우회하였으며, 연결 별 전송 큐 및 유저모드 폴링 기법의 도입으로 커널모드 스위칭 오버헤드를 제거하였다. 결과에 따르면, 제시한 기법을 사용할 경우 기존 가상 네트워크 방식 대비 평균 레이턴시는 96.06% 감소, 평균 처리량은 222.24%가 증가하였다.
협대역 네트워크를 통한 실시간 영상 전송 시스템
노현민, 이승환, 최증원, 김동현, 김경우, 고윤수, 신상헌, 김형준, 송황준
http://doi.org/10.5626/JOK.2020.47.9.885
본 논문은 불안정한 협대역 네트워크에서 높은 품질의 영상을 실시간 전송하기 위한 시스템을 제안한다. 제안한 시스템은 협대역에서 안정적인 데이터 전송을 제공하기 위해 순방향 오류정정 코드인 랩터 코드를 적용하였다. 랩터 코드의 매개변수(소스 심볼 크기, 소스 심볼 수, 코드율)를 네트워크 상황 및 송/수신 버퍼 상태에 따라 적응적으로 제어함으로써, 불안정한 협대역 네트워크에서도 높은 품질의 스트리밍 서비스를 제공한다. 제안하는 시스템은 실제 안드로이드 단말을 통해 실제 구현되었으며, 제안한 시스템은 불안정환 협대역 환경에서 높은 품질의 스트리밍 서비스를 제공하는 것을 검증하였다.
뉴럴 네트워크 기반의 다중 오믹스 통합 유방암 서브타입 분류
http://doi.org/10.5626/JOK.2020.47.9.835
유방암은 다양한 생물학적 요소로 구성된 복잡한 질병으로, 여러 분자적 서브 타입을 유발한다. 정확한 서브 타입 예측은 암의 예후에 중대한 영향을 가지며, 서브 타입별 치료법 제공을 통한 환자의 생존율 향상에 중요하나, 생물학적 이질성으로 인해 쉽지 않다. 최근, 유전체 및 후성 유전체 데이터를 처리하기 위해 머신러닝 모델들이 유방암 분류에 적용되었으며, 특히 다중 오믹스를 활용한 연구들이 제시되었다. 하지만, 높은 차원과 복잡성으로 인해 특징 분석 및 분류 정확성에 한계를 갖는다. 본 논문에서는 뉴럴 네트워크를 기반으로 다중 오믹스 통합 데이터를 활용한 유방암 서브 타입 분류 모델을 제시한다. 유전자 발현, DNA 메틸레이션, 그리고 miRNA 오믹스를 통합한 데이터로 분류 모델을 구축하였으며, 성능 비교 결과, 평균 90.45%의 정확도로 기존 연구보다 높은 성능을 보였다. 제안된 모델을 통해 정확한 유방암 환자의 서브 타입 예측을 기반으로 환자의 예후 향상에 도움을 줄 것으로 기대된다.
지역 차분 프라이버시 기반 허브 그룹화를 이용한 비동률성 네트워크 배포
http://doi.org/10.5626/JOK.2020.47.6.603
무선 인터넷의 발전과 스마트폰의 대중화에 따라 많은 사람들이 온라인을 통해 사람들과의 관계를 맺는 소셜 네트워크 서비스를 사용하고 있다. 소셜 네트워크 서비스에서 발생하는 개인 데이터는 높은 가치를 지니고 있지만 동시에 민감한 개인정보를 담고 있어 프라이버시 침해가 발생할 가능성이 있다. 개인정보침해를 방지함과 동시에 소셜 네트워크 상의 데이터를 분석하기 위하여 기존 연구는 원본 네트워크 데이터와 유사한 가상 데이터를 생성하거나, 사용자 정보를 익명화하여 배포하는 기법을 제시하였다. 그러나 기존 기법들은 소셜 네트워크 상의 사용자들이 맺는 관계에 의해 형성되는 그래프의 특성을 고려하지 않아 프라이버시와 데이터 유용성 모두에서 약점을 지니고 있다. 본 논문에서는 소셜 네트워크의 그래프 상의 특성을 반영함과 동시에 신뢰할 수 있는 써드파티가 아닌 데이터를 제공하는 개인 수준에서 직접 데이터 보호 기법을 적용하여 제공하는, 프라이버시가 보호된 소셜 네트워크 데이터 배포 기법을 제안한다. 우리는 실제 네트워크 데이터를 사용한 실험을 통하여 제안 기법이 기존의 차분 프라이버시를 적용한 기법들보다 성능이 향상됨을 보였다.
시맨틱 네트워크 구조를 기반으로 한 라이프로그로부터 페트리넷을 이용한 패턴추출
http://doi.org/10.5626/JOK.2020.47.6.553
최근 다양한 스마트 기기의 확산으로 여러 종류의 센서를 통해 사용자의 라이프로그 데이터가 자동으로 저장되고 있다. 그러나 스마트 기기로부터 수집된 라이프로그는 서로 다른 센서로부터 이질적인 정보를 자동으로 기록한다. 또한 사용자의 생활 패턴이 라이프로그의 서로 다른 판정 주기에 의해 결정되기 때문에 단순한 규칙 기반 시스템으로 정의하기 어렵다. 따라서 라이프로그로부터 유용한 생활 패턴을 추출하여 사용자에게 제공하기 위해서는 수많은 동적 요소들의 관계를 표현해야한다. 본 논문에서는 시맨틱 네트워크구조로 표현된 라이프로그로부터 페트리넷을 이용하여 사용자 생활 패턴을 자동으로 추출하는 방법을 제안한다. 제안하는 생활 패턴 추출 방법은 이질적으로 수집된 사용자 라이프로그의 의미관계를 나타내기 위해 의미구조를 정의하고 시맨틱 네트워크로 구조화한다. 또한 페트리넷 그래프를 이용하여 시간흐름에 따라 불규칙적으로 변화하는 라이프로그를 의학적 진단 항목을 기반으로 자동으로 판단하여 개인의 수면, 식사 생활패턴을 추출한다. 페트리넷은 스마트 기기 센서 데이터의 불확실성을 줄이고 생활 패턴의 다양성을 증가시킨다. 제안하는 방법의 유용성을 확인하기 위해 안드로이드 앱으로 수집한 65명의 라이프로그 데이터를 사용하여 실험을 진행하고 사용자의 수면, 식사 패턴에 따른 페트리넷의 패턴추출 정확도를 확인한다.
SDN-based Task Allocation for IoT-Fog Network
Dzaky Zakiyal Fawwaz, Sang-Hwa Chung
http://doi.org/10.5626/JOK.2020.47.5.535
사물인터넷은 작업을 실행하기 위한 자원 할당을 요구한다. 우리는 클라우드에 비해 더 낮은 지연시간과 대역폭 등의 장점을 가지는 분산된 자원을 제공하는 포그 컴퓨팅을 활용할 수 있다. 다음으로, 다수의 포그 노드들 사이에서 어떻게 태스크를 할당할지 고려할 필요가 있다. 네트워크에서는 지속적으로 유입되는 IoT 태스크들 뿐 아니라 동적인 네트워크 상황이 있기 때문에, 소프트웨어 정의 네트워크를 활용하는 동적 태스크 할당 기법을 소개한다. 이는 네트워크와 포그 노드 통계를 고려하여 유입되는 각 태스크를 처리한다. 처리해야할 포그 노드와 가용 경로는 다양하기 때문에, 태스크 할당 기법은 포그 노드와 그 경로에 대한 최적의 쌍을 선택해야 한다. 우리는 이러한 문제를 네트워크 그래프에서 다수의 출발지와 단일 목적지 사이의 최단경로를 찾는 것으로 정의하고, 포그 노드와 링크의 결합에 대한 활용 비용으로 수식화하였으며, 문제를 해결하기 위한 다대일 최단경로 알고리즘을 제안한다. 실험 결과는 제안 기법이 기존에 비해 더욱 뛰어남을 보였다. 모든 실험 토폴로지에서 제안 기법은 평균적으로 더 높은 초당 태스크 수, 낮은 지연시간과 낮은 포그 노드/링크 활용도를 보였으며, 각 37 태스크, 676ms, 65%/24% 활용도로 측정되었다.
고속 이산 코사인 변환을 이용한 새로운 경량 및 효율적인 콘볼루션 신경망
http://doi.org/10.5626/JOK.2020.47.3.276
최근 개발된 경량화된 뉴럴 네트워크는 적은 개수의 모델 가중치 개수 및 낮은 연산량으로도 어느정도 높은 정확도를 유지한다. 그럼에도 불구하고, 기존 컨볼루션 뉴럴 네트워크들은 공통적으로 Pointwise Convolution (1×1 Convolution)에서 많은 가중치 개수를 가지며, 상당한 계산량을 유발한다. 본 논문은 최초로 Pointwise Convolution을 1차원 고속 이산 코사인 변환(FDCT)으로 대체하여 획기적으로 학습 가중치 값 개수를 줄였고 연산속도를 높였다. 본 논문은 구체적으로 두가지 측면, 즉 1) Block 단위에서의 DCT 적용 및 2) CNN 모델의 계층적 위치에 따른 DCT 적용을 통해 경량화를 제안한다. 실험결과, CIFAR100 이미지분류 데이터셋에 대해서 기존 MobileNet v1 모델 대비 학습 가중치 값 개수를 79.1% 줄이고 연산량을 48.3% 줄이면서 top-1 정확도는 0.8% 상승한 결과를 보였다.
추가 정보를 고려한 상품 리뷰 요약 기법
http://doi.org/10.5626/JOK.2020.47.2.180
문서 요약은 주어진 문서로부터 특정 사용자나 작업에 적합한 형태로 축약한 문서를 생성하는 것을 의미한다. 인터넷 사용이 증가함에 따라, 텍스트를 포함한 다양한 데이터들이 폭발적으로 증가하고 있고, 문서 요약 기술이 지니는 가치는 증대되고 있다. 최신 딥러닝 기반 모델들이 좋은 요약 성능을 보이지만, 학습 데이터들의 양과 질에 따라 성능이 좌우되는 문제점이 있다. 예를 들어, 온라인 쇼핑몰의 상품리뷰 데이터의 경우, 오탈자와 비문법적인 텍스트 특징 때문에 기존 모델로 좋은 요약을 생성하기 힘들다. 이러한 문제를 해결하려고 온라인 쇼핑몰과 포탈 서비스가 많은 노력을 하고 있다. 따라서 본 연구에서는 리뷰 학습 데이터의 양과 질이 열악하더라도 적절한 문서 요약을 생성하기 위해, 주어진 상품 리뷰의 추가 정보를 이용해서 상품 리뷰 요약을 생성하는 모델을 제안한다. 더불어, 실험을 통해 제안한 기법의 문서 요약이 기존 기법보다 요약의 관련성과 가독성 측면에서 향상되었음을 보였다.