디지털 라이브러리[ 검색결과 ]
개체명 사실 판별을 통한 기계 요약의 사실 불일치 해소
http://doi.org/10.5626/JOK.2022.49.3.231
기계 요약의 사실 불일치 문제란 요약 모델이 생성한 요약문이 원문과 사실이 일치하지 않는 문제다. 사실 불일치는 개체명에서 주로 발생하므로 기존 연구들은 요약문의 잘못된 개체명을 교정하여 사실적 불일치를 해결하였다. 하지만, 명시적인 개체명 사실 불일치 판별 없이 모든 개체명을 순차적으로 교정하거나 모두 마스킹하여 교정을 시도하였다. 모든 개체명을 교정하는 연구는 원문과 일치하는 개체명도 교정을 시도하는 문제점과 마스킹되어 사실 정보임에도 불구하고 정보를 손실시키는 문제가 발생한다. 본 논문에서는 기존 연구들의 단점을 해결하기 위해 개체명 사실 여부를 판별한 뒤 사실 불일치 개체명에 대해서만 교정을 하는 방법을 제안한다. 이를 통해 사실 불일치 개체명이 발생시키는 오류를 방지할 수 있으며, 반대로 사실 일치 개체명에 대한 정보를 최대한 활용할 수 있다. 실험을 통해 제안한 방법이 기존연구들보다 요약문의 사실 불일치를 잘 해소함을 보였다.
압축 기반 파일 시스템 데이터 일관성 유지 기법
http://doi.org/10.5626/JOK.2019.46.9.885
데이터 일관성 메커니즘은 시스템 오류 및 정전으로 인해 데이터가 손상되지 않도록 방지하기 위한 파일 시스템의 중요한 컴포넌트이다. 그러나, Ext4 파일 시스템의 기본 저널 모드는 성능상의 이유로 일반 데이터를 제외한 메타 데이터에 대한 일관성만을 보장한다. 즉, 기본 저널 모드는 파일 시스템의 전체 데이터에 대한 일관성을 완벽하게 보장하지 않는다. 이에, 본 논문에서는 파일 시스템의 데이터 일관성을 완벽하게 보장하면서 Ext4의 기본 저널 모드에 비해 향상되거나 유사한 성능을 제공하는 새로운 데이터 일관성 유지 기법을 제안한다. 제안 기법은 압축을 통해서 저널 영역에 요청되는 쓰기 요청의 양을 감소시키고 fsync() 시스템 콜 호출 횟수를 반으로 감소시킨다. 제안 기법을 평가하기 위해, 우리는 jbd2의 일부 코드를 수정하였으며, SSD와 HDD 환경에서 제안 기법의 성능을 Ext4의 두가지 저널 모드와 비교하였다. 실험 결과, 제안 기법이 기본 저널 모드 대비 최대 8.3배 시스템의 성능을 향상시킨다는 사실을 확인하였다.
비 휘발성 메모리 기반 로그 구조 버퍼의 설계 및 구현
http://doi.org/10.5626/JOK.2018.45.11.1117
PCM, STT-MRAM과 같은 차세대 비 휘발성 메모리(NVM) 기술은 낮은 지연시간, 높은 대역폭, 비 휘발성 및 높은 용량을 제공한다. 이러한 NVM은 고성능 컴퓨팅을 위해 컴퓨터 시스템 및 데이터베이스 분야에서 널리 사용 및 연구되고 있다. 예를 들어, 최근 연구자들은 NVM을 파일시스템의 저널링 버퍼 및 데이터베이스의 로깅을 위해 사용하며 이에 따른 최적화 연구들을 많이 진행하고 있다. 기존연구들을 보완하는 연구로 본 논문에서는 응용의 원자성 페이지(page) 업데이트에 대해 초점을 맞춘다. 예를 들어, 데이터베이스 시스템과 같은 데이터 관리 응용에서는 여러 페이지들을 원자적으로 업데이트하기 위해, 임시 버퍼를 두고 중복적인 쓰기 연산을 수행함으로써 그 페이지들의 원자성을 보장한다. 하지만, 이러한 중복적인 쓰기 연산은 성능을 크게 감소시킬 수 있다. 따라서 본 논문에서는 일관성을 보장하면서 성능을 향상시키기 위해, 하나의 로그 구조 버퍼 관리자(Log-structured buffer manager(LSBM))를 소개한다. LSBM은 원자적 업데이트를 위해 로그 기반으로 페이지를 NVM에 업데이트하고 버퍼링 기능을 제공한다. 또한 해당 버퍼에 중복 페이지가 있을 경우, 이전 버전의 페이지를 제거하여 최신의 페이지만 반영하도록 함으로써 입출력과 쓰기량을 최소화시킨다. 실험결과는 LSBM이 응용의 성능을 개선시키고 총 쓰기량을 감소시킴을 보여준다.
스토리지 클래스 메모리를 위한 롤백-복구 방식의 데이터 일관성 유지 기법
스토리지 클래스 메모리(SCM)는 메모리와 스토리지의 장점을 동시에 가지고 있기 때문에 기존의 스토리지를 대체할 차세대 스토리지로 주목 받고 있다. 하지만 현재까지 제안된 SCM 전용 파일시스템은 데이터 일관성을 충분히 보장하지 않거나 혹은 보장될 경우, 과도한 일관성 유지 비용을 발생시키는 문제점을 지니고 있다. 본 논문에서는 보편적으로 사용하는 WAL(Write Ahead Logging) 방식의 일관성 유지 기법 대신 롤백-복구 방식을 이용하여, 블록내의 변경되는 데이터의 비율에 따라 로그 데이터 기록방식을 변경하는 데이터 일관성 유지 기법을 제안한다. 본 기법은 데이터 일관성 손실 없이 로그 데이터의 크기를 줄여 데이터 쓰기 및 동기화 비용을 최소화시킬 수 있다. 제안한 기법을 평가하기 위해 리눅스 3.10.2 상에 구현하여 성능을 측정한 결과, 다른 일관성 유지기법에 비해 평균적으로 9배 정도의 데이터 쓰기 성능이 향상됨을 볼 수 있었다.