디지털 라이브러리[ 검색결과 ]
3차원 얼굴 모델링을 위한 검색기반 헤어 모델 증강
http://doi.org/10.5626/JOK.2019.46.5.405
주어진 영상으로부터의 3차원 얼굴 모델링은 얼굴 분석, 애니메이션, 생체 인식 등의 많은 컴퓨터비전 및 그래픽스 응용분야에서 중요한 역할을 하고 있다. 그 중에서도 헤어 영역은 얼굴에 비해 모양의 다양성과 모델의 복잡도가 현저히 높다. 기존의 연구는 주로 얼굴 영역에 한정한 3차원 얼굴 모델링을 중심으로 이루어졌지만 헤어 모델링은 중요하게 다루지 않고 있는 경우가 많다. 본 논문에서는 심층인 공신경망의 일종인 FCN (fully connected network)을 이용하여 인물 영상에서 헤어 부분을 영역화하고, 영역화 결과와 가장 유사한 3D 헤어 모델을 데이터베이스에서 검색하여 3차원 얼굴 모델에 증강함으로써 완전한 얼굴 모델링을 수행하는 방법을 제안한다. 이는 FCN을 이용하여 다양한 인물 영상에 대하여 네트워크 학습을 수행하는 과정과 3D 헤어 데이터베이스의 구축 과정을 포함한다. 실험 결과 적절한 수준의 헤어 모델이 3차원 얼굴 모델링 결과물에 증강됨을 확인하였다.
자연어를 활용한 SQL문 생성을 위한 합성곱 신경망 기반 칼럼 예측 모델
http://doi.org/10.5626/JOK.2019.46.2.202
관계형 데이터베이스 시스템을 이용하여 대규모의 데이터를 검색하기 위해서는 테이블 스키마 및 SQL문을 이해해야 하는 필요성이 있다. 이를 해결하기 위해 자연어가 입력으로 주어질 때, 이에 대응하는 SQL문을 생성하는 연구가 최근 진행되고 있다. 기존 연구에서 가장 어려운 부분은 SQL문의 조건에 해당되는 칼럼을 효과적으로 예측하는 부분이며, 예측해야 하는 칼럼의 개수가 여러 개일 때 정확도가 크게 떨어지는 문제점이 있다. 본 논문에서는 칼럼 어텐션 메카니즘을 이용하여, 자연어 데이터의 숨겨진 표현을 효과적으로 추출하는 합성곱 신경망 모델을 제안한다. 본 연구의 제안 방법은 기존 방법 대비 약 6%이상 정확도가 향상되는 것을 확인할 수 있었다.
비 휘발성 메모리 기반 로그 구조 버퍼의 설계 및 구현
http://doi.org/10.5626/JOK.2018.45.11.1117
PCM, STT-MRAM과 같은 차세대 비 휘발성 메모리(NVM) 기술은 낮은 지연시간, 높은 대역폭, 비 휘발성 및 높은 용량을 제공한다. 이러한 NVM은 고성능 컴퓨팅을 위해 컴퓨터 시스템 및 데이터베이스 분야에서 널리 사용 및 연구되고 있다. 예를 들어, 최근 연구자들은 NVM을 파일시스템의 저널링 버퍼 및 데이터베이스의 로깅을 위해 사용하며 이에 따른 최적화 연구들을 많이 진행하고 있다. 기존연구들을 보완하는 연구로 본 논문에서는 응용의 원자성 페이지(page) 업데이트에 대해 초점을 맞춘다. 예를 들어, 데이터베이스 시스템과 같은 데이터 관리 응용에서는 여러 페이지들을 원자적으로 업데이트하기 위해, 임시 버퍼를 두고 중복적인 쓰기 연산을 수행함으로써 그 페이지들의 원자성을 보장한다. 하지만, 이러한 중복적인 쓰기 연산은 성능을 크게 감소시킬 수 있다. 따라서 본 논문에서는 일관성을 보장하면서 성능을 향상시키기 위해, 하나의 로그 구조 버퍼 관리자(Log-structured buffer manager(LSBM))를 소개한다. LSBM은 원자적 업데이트를 위해 로그 기반으로 페이지를 NVM에 업데이트하고 버퍼링 기능을 제공한다. 또한 해당 버퍼에 중복 페이지가 있을 경우, 이전 버전의 페이지를 제거하여 최신의 페이지만 반영하도록 함으로써 입출력과 쓰기량을 최소화시킨다. 실험결과는 LSBM이 응용의 성능을 개선시키고 총 쓰기량을 감소시킴을 보여준다.
인-메모리 키-값 데이터베이스를 위한 비 휘발성 메모리 기반 영속적 로그 버퍼 기법
http://doi.org/10.5626/JOK.2018.45.11.1193
Redis는 인-메모리 키-값 데이터베이스로, 실시간 데이터 처리 및 저장이 필요한 서비스에서 많이 사용되고 있다. 하지만 DRAM의 특징인 휘발성으로 인하여, 시스템이 비정상적으로 종료되면 Redis에 저장된 데이터들이 손실되는 문제가 발생한다. 이를 방지하기 위해 Redis는 로그를 디스크에 저장하고, 로그를 이용하여 데이터를 복구함으로써 데이터 손실을 방지한다. 요청된 명령을 로그 형태로 디스크에 저장하는 방식인 AOF 복구 메커니즘은 1초마다 주기적으로 로그를 기록하는 everysec 정책과 명령이 요청될 때마다 로그를 기록하는 always 정책으로 동작한다. everysec 정책은 Redis의 성능을 저하시키지 않지만, 시스템이 1초내에 비정상적으로 종료되면 데이터 손실이 발생할 수 있다. 반면 always 정책은 데이터 손실은 발생하지 않지만, 명령이 요청될 때마다, 디스크 연산을 수행하기 때문에 성능 저하의 원인이 된다. 본 논문에서는 everysec 정책에서 아직 디스크에 동기화되지 않고 AOF 버퍼에 저장되어 있는 AOF 로그들을 비 휘발성 메모리에 저장함으로써, 데이터 손실이 발생하는 단점을 극복하고 always 정책에 비해 약 100배 더 향상된 성능을 가진 시스템 모델을 제시한다.
NP-HTM: 다중 코어 인메모리 데이터베이스에서 하드웨어 트랜잭셔널 메모리 분할 기법
http://doi.org/10.5626/JOK.2018.45.6.582
약 트랜잭셔널 메모리는 전통적인 병렬 프로그래밍 기법인 Lock을 대체하여 동시성 제어 패러다임을 크게 바꾸었다. 특히 HTM(Hardware Transactional Memory)은 하드웨어에 의해 지원되는 가장 뛰어난 기법이다. 그러나 기존 HTM 기법은 HTM 의 자원 제약성을 극복하지 못하는 문제점이 존재한다, 이러한 문제점을 해결하기 위해, 본 논문에서는 다중 코어 인 메모리 데이터베이스에서 대형 트랙잰션을 처리하기 위한 HTM 기반 트랜잭션 분할 기법을 제안한다. 첫째, 제안하는 기법은 트랜잭션이 자원 제약성 때문에 실패하면, 트랜잭션을 중첩 파티션 불럭으로 분할한다. 둘째, 제안하는 기법은 워크로드 특성을 반영하여 파티션 불럭의 최적의 길이를 계산하는 적응적 트랜잭션 분할 알고리즘을 사용한다. 마지막으로, STAMP 벤치마크를 사용한 실험적 성능 분석을 통해, 제안하는 기법이 기존의 트랜잭션 분할 기법인 Part-HTM에 비해 약 70%의 성능 향상을 보인다.
클라우드 데이터베이스에서의 꼬리응답시간 감소를 위한 가비지 컬렉션 동기화 기법
http://doi.org/10.5626/JOK.2017.44.8.767
클라우드 데이터베이스와 같은 분산 시스템 환경에서는 균일한 서비스 품질을 보장하기 위해 꼬리 응답시간을 짧게 유지하는 것이 중요하다. 본 논문에서는 카산드라 데이터베이스를 대상으로, 긴 꼬리 응답시간에 해당하는 지연이 메모리 공간 부족으로 인해 발생한다는 것을 보이며, 이러한 지연이 메모리 공간 확보를 위해 버퍼에 저장된 데이터를 저장장치에 완전히 내려쓸 때까지 카산드라가 사용자의 요청을 받지 않기 때문임을 밝힌다. 버퍼에 저장된 데이터를 내려쓰는데 걸리는 시간은 저장장치 성능에 따라 결정되므로 SSD의 가바지 컬렉션으로 인한 성능 저하가 꼬리 응답시간을 더 길게 만들고 있음을 관찰하였다. 우리는 자바가상기계에서의 가비지 컬렉션과 SSD에서의 가비지 컬렉션을 함께 수행하여 SSD의 가비지 컬렉션 비용을 숨기는, SyncGC 기법을 제안한다. 실험 결과, SyncGC 기법을 통해 꼬리 응답시간인 99.9th와 99.99th-percentile을 각각 31%, 36% 줄일 수 있었다.
아웃소싱 데이터베이스에서 집계 질의를 위한 효율적인 인증 기법
http://doi.org/10.5626/JOK.2017.44.7.703
아웃소싱 데이터베이스란 데이터 관리 및 질의 처리 등의 계산량이 많은 작업을 제 3자 서버에 위탁하는 것이다. 이를 통해 데이터 소유자는 비싼 인프라를 구축하지 않고 빅데이터를 관리할 수 있으며 여러 사용자로부터 받는 질의들을 빠르게 처리할 수 있다. 하지만 보안 위협이 항상 존재하는 네트워크의 특성상 제 3자 서버를 완전히 신뢰하기 어렵고, 그 서버가 처리한 결과도 신뢰하기 어렵다. 이처럼 신뢰할 수 없는 서버가 처리한 질의 결과가 정확한지 확인하는 것을 질의 인증이라고 하며 구간 질의, kNN 질의, 함수 질의 등 다양한 질의에 대한 인증 기법들이 연구되었다. 하지만 빅데이터 분석에 있어 활용도가 높은 집계 질의에 대한 깊이 있는 질의 인증 연구는 이루어지지 않았으며 기존 연구는 고차원이 거나 서로 다른 값이 많은 데이터에 대해 비효율적이다. 본 연구에서는 집계 질의 인증을 위한 자료구조를 제안하고 이를 활용한 효율적인 증거 생성 방법과 증명 방법을 제안한다. 그리고 데이터의 상이 값 수, 레코드 개수, 차원 크기 등을 변경하며 진행한 실험 결과를 통해 제안한 기법의 성능이 우수함을 보였다.
2-계층 그리드 블록을 이용한 효과적인 맵리듀스 기반 스카이라인 질의 처리 기법
http://doi.org/10.5626/JOK.2017.44.6.613
스카이라인 질의는 사용자들의 다양한 기준을 만족하는 데이터를 찾기 때문에 의사 결정 문제 등에서 폭넓게 사용되고 있다. 최근의 스카이라인 질의는 대용량 데이터베이스 처리를 위해 맵리듀스 프레임워크를 사용하는 연구들이 많이 진행되었으며 특히 맵리듀스에 기존의 색인 구조를 적용하는 방식으로 연구가 활발히 진행되고 있다. 스카이라인의 특징 중 하나는 원점에서 가까운 데이터일수록 더 많은 영역을 지배한다는 점이다. 하지만 기존의 색인 구조는 이와 같은 스카이라인의 특징을 반영하지 못하는 단점이 있었다. 본 논문에서는 그리드의 셀들을 스카이라인의 특징을 고려하여 묶는 그리드 블록 구조와 원점과 가까운 데이터가 없을 때도 사용 가능한 2계층 그리드 블록 구조, 그리고 2계층 그리드 블록 구조를 사용한 효율적인 스카이라인 질의 기법을 제안하였다.
데이터 접근 패턴 은닉을 지원하는 암호화 인덱스 기반 kNN 질의처리 알고리즘
데이터베이스 아웃소싱 환경에서, 클라우드는 인증된 사용자에게 아웃소싱된 데이터베이스를 기반으로 질의 서비스를 제공한다. 그러나 금융, 의료 정보와 같은 민감한 데이터는 클라우드에 아웃소싱 되기 전에 암호화되어야 한다. 한편, kNN 질의는 다양한 분야에서 폭넓게 사용되는 대표적인 질의 타입이며, kNN 질의 결과는 사용자의 관심사 및 선호도와 밀접하게 연관된다. 따라서 데이터 보호와 질의 보호를 동시에 고려하는 kNN 질의 처리 알고리즘에 대한 연구가 진행되어 왔다. 그러나 기존 연구는 높은 연산 비용이 요구되거나, 탐색한 인덱스의 노드 및 반환된 질의 결과가 드러나기 때문에 데이터 접근 패턴이 노출되는 문제점이 존재한다. 이러한 문제를 해결하기 위해 본 논문에서는 암호화 데이터베이스 상에서의 kNN 질의처리 알고리즘을 제안한다. 제안하는 알고리즘은 데이터 보호 및 질의 보호를 지원한다. 또한, 제안하는 알고리즘은 데이터 접근 패턴을 보호하는 동시에 효율적인 질의처리를 지원한다. 이를 위해, 데이터 접근 패턴 노출 없이 데이터 필터링을 지원하는 암호화 인덱스 탐색 기법을 제안한다. 성능 분석을 통해, 제안하는 알고리즘이 기존 기법에 비해 질의처리 시간 측면에서 우수한 성능을 보임을 검증한다.
YCSB를 사용한 PostgreSQL과 MongoDB 성능 비교 분석
빅데이터와 함께 등장한 NoSQL은 기존 관계형 데이터베이스로는 해결하기 힘든 문제를 새로운 아키텍처와 데이터 모델로 해결하고자 한다. 관계형 데이터베이스와는 달리 NoSQL 데이터베이스는 기능과 아키텍처 그리고 한계점이 제품마다 다르기 때문에 NoSQL 데이터베이스를 선택하기 위해서는 많은 고려사항이 필요하다. 이렇게 데이터베이스의 선택의 폭이 넓어진 만큼 선택의 어려움은 더욱 증가했다고 볼 수 있다. 또한 NoSQL 데이터베이스의 발전은 기존의 관계형 데이터베이스의 기능을 확장하는 데도 기여했다. 본 논문에서는 NoSQL 데이터베이스를 보다 정확히 이해하기 위해 관계형 데이터베이스와 비교분석하고 오픈 소스 관계형 데이터베이스인 PostgreSQL의 최신 NoSQL 관련 기능에 대해 알아본다. 또한 NoSQL 데이터베이스 벤치마크(YCSB)를 사용해 NoSQL과 PostgreSQL의 성능을 비교하고 앞으로의 발전 방향에 대해서 논한다.