검색 : [ keyword: Tree ] (31)

S 여대 교내식당 식사 인원 예측; COVID-19 팬데믹 기간을 포함한 장기 데이터 활용

백채은, 권예슬, 오장민

http://doi.org/10.5626/JOK.2024.51.7.634

집단 급식에서 정확한 식사 인원 예측은 효율적인 운영, 잔반최소화, 그리고 사용자 만족도 향상을 위해 중요하다. 특히 대학교 교내식당은 다양한 환경 요소와 COVID-19 팬데믹으로 인한 수업 방식의 변화 로 예측이 더욱 어려워졌다. 이를 해결하기 위해, 본 연구는 COVID-19 팬데믹 기간과 대학 식당 환경에 특화 된 데이터를 활용하여 다양한 5가지의 모델을 학습하고 성능을 비교했다. 안정적인 예측을 위해 가장 성능이 좋은 앙상블 트리 기반 모델 3가지인 RandomForest, LightGBM, XGBoost의 예측값을 평균 내어 Mean Absolut Error (MAE) 30.96이라는 최종 결과를 만들었다. 주어진 최종 모델을 활용하여 정기적으로 예측 결 과를 교내식당에 제공함으로써 운영 현장에 실질적인 지원을 제공할 수 있다. 본 연구 결과는 COVID-19 팬데 믹을 포함한 비정상적 상황에서도 정확한 식사 인원 예측이 가능한 효과적인 방법론을 제시한다.

MemTable의 부분 비우기를 사용한 LSM 트리의 성능 개선

전형준, 구헤라, 문성호, 남범석

http://doi.org/10.5626/JOK.2023.50.1.87

NoSQL의 종류 중 하나인 키-값 저장소에서는 색인 자료 구조로 로그 기반 병합 트리(이하 LSM 트리)가 널리 사용된다. LSM 트리는 대체로 빠른 쓰기 성능을 보이나, 쓰기 증폭과 쓰기 멈춤 문제로 인해 최대한의 성능을 내는 것이 쉽지 않다. 본 논문에서는 최근 데이터 센터의 주 메모리의 크기가 증가하는 추세인 점을 고려하여, 기존 LSM 트리의 메모리 자료 구조인 MemTable의 크기를 확장하여 설계한 Extended MemTable을 소개한다. Extended MemTable은 키-값을 삽입할 때, 키 값의 범위에 따른 구획을 이용하여 컴팩션 연산이 효율적으로 작동할 수 있도록 비우기(Flush) 연산을 수행한다. 실험 결과 본 논문의 디자인은 쓰기 처리량을 기존 RocksDB에 비해 최대 2배, 읽기 처리량은 기존 RocksDB 대비 최대 4배 개선하였으며, 쓰기 증폭 현상은 최대 3.7배 줄어들어 쓰기 증폭과 쓰기 멈춤 문제를 크게 개선하였음을 확인할 수 있다.

그래프와 트리 구조를 활용한 한국어 문장제 수학 문제 풀이의 성능개선 연구

배광호, 여상엽, 정유철

http://doi.org/10.5626/JOK.2022.49.11.972

선행 연구에서 영어 문장제 수학 문제를 해결하려 한 다양한 시도가 있었다. 많은 연구에서 Sequence-to-Sequence(이하 Seq2seq) 패러다임을 넘어선 트리, 그래프 등의 구조를 도입하여 개선된 성능을 달성할 수 있었다. 하지만 한국어 문장제 수학 문제 풀이 연구에서는 트리(Tree)나 그래프(Graph)등으로 제안된 구조를 활용한 모델 사례가 없다. 이에 본 논문에서는 한국어 사전학습 언어모델을 사용하여 트리 구조를 활용하는 모델, 트리와 그래프 구조를 함께 활용하는 모델에 대한 한국어 문장제 수학 문제풀이 능력의 가능성을 검토해보고자 한다. 테스트 결과 그래프와 트리 구조를 도입함으로써 Seq2seq 구조의 모델 대비 약 20%의 정확도 향상을 보였고, 나아가 한국어 사전학습 언어모델을 사용한 것이 사용하지 않은 것 대비 4.66~5.96%의 정확도 향상을 보였다.

블록체인 기반의 지리 공간 포인트 데이터 인덱싱을 위한 공간 LSM 트리

서민준, 권태현, 정성원

http://doi.org/10.5626/JOK.2022.49.10.898

블록체인 기술은 IoT, 헬스케어 등 다양한 분야에서 높은 활용도로 주목받으며, 분산 데이터베이스에 대한 대안으로도 활용되고 있다. 블록체인에 대한 높은 활용성에도 불구하고, 블록체인 기반의 지리 공간 데이터를 효율적으로 인덱싱하는 기법은 지금까지 많은 연구가 진행되지 않았다. 이에 본 논문에서는 블록체인의 쓰기-집중적인(write-intensive) 특성을 반영하여 지리 공간 포인트 데이터의 블록을 블록체인에 삽입 시 I/O 비용을 감소시키는 공간 LSM 트리 인덱싱 기법을 제안한다. 제안 기법은 실시간으로 대량의 업데이트가 발생하는 블록체인 상에서 지리 공간 데이터를 Geohash를 통해 선형화하고, 데이터간의 공간적 인접성을 고려하여 데이터 삽입 및 범위 질의 처리 시 I/O 비용을 최소화한다. 또한, 지리 공간 포인트 데이터 범위 질의 처리 시 공간 LSM 트리에 대한 불필요한 탐색을 줄이기 위한 공간 필터를 제안한다.

Graph2Tree 모델을 이용한 한국어 수학 문장제 문제 풀이

김동근, 이나연, 심현우, 구명완

http://doi.org/10.5626/JOK.2022.49.10.807

본 논문은 8개 유형으로 이루어진 한국어 수학 문장제 문제 데이터셋을 자체적으로 구축하여 이를 기반으로 기존에 제시되지 않았던 Graph2Tree 모델 기반 한국어 수학 문장제 문제 자동 풀이 모델인 Ko-Graph2Tree 모델을 제시한다. 최근 공개된 Graph2Tree 모델은 영어 수학 문장제 문제 자동 풀이에 기존의 자연어 처리 모델들보다 뛰어난 성능을 보인 모델이다. 해당 모델은 문제 텍스트 내의 숫자 간 관계성 및 순서, 즉 수학적 관계를 반영한 두 가지의 그래프를 풀이 생성에 사용함으로써 기존의 트리 기반 모델들보다 향상된 성능을 보인다. 자체 제작한 한국어 수학 문장제 문제 데이터셋으로 학습시킨 후 성능을 측정한 결과, 시퀀스 투 시퀀스 구조의 트랜스포머 모델은 정확도가 42.3%, 본 논문이 제시한 Ko-Graph2Tree 모델은 정확도가 68.3%로 26.0%p 더 높은 성능을 보였다.

기계독해 기반 부분 트리 연결 방법을 적용한 한국어 의존 파싱

민진우, 나승훈, 신종훈, 김영길, 김강일

http://doi.org/10.5626/JOK.2022.49.8.617

한국어 의존 파싱은 전이 기반 방식과 그래프 기반 방식의 두 갈래로 연구되어 왔다. 그 중 그래프 기반 의존 파싱은 입력 문장을 인코딩한 후 지배소, 의존소에 대한 MLP를 적용하여 각각의 표상을 얻고 Biaffine 어텐션을 통해 모든 단어 쌍에 대한 그래프 점수를 얻어 이를 통해 트리를 생성하는 Biaffine 어텐션 모델이 대표적이다. Biaffine 어텐션 모델에서 문장 내의 각 단어들은 구문 트리 내의 부분 트리의 역할을 하지만 두 단어간의 의존성만을 판단하기 때문에 부분 트리의 정보를 효율적으로 활용할 수 없다는 단점이 존재한다. 본 연구에서는 이러한 단점을 해결하기 위해 제안된 Span-Span(부분 트리-부분 트리)로의 부분 트리 정보를 직접 모델링하는 기계 독해 기반 의존 파싱 모델을 한국어 구문 분석 데이터 셋에 적용하여 기존 Biaffine 어텐션 방식의 의존 파싱 모델 대비 향상된 결과를 얻었다.

NVMe-oF를 활용한 LSM 트리 컴팩션 오프로딩

문성호, 구헤라, 전형준, 남범석

http://doi.org/10.5626/JOK.2022.49.7.569

NVMe-over-Fabrics(NVMe-oF)는 NVMe 명령을 통한 원격 NVMe SSD로의 빠른 접근을 가능하게 하여 분리형 저장장치(Storage)의 구성 방법으로 주목받고 있다. 본 논문은 NVMe-oF를 활용하여 분리형 저장장치 환경에 최적화된 LSM-트리 기반 키-값 저장소인 RocksDB-oF를 제안한다. RocksDB-oF는 NVMe-oF의 특성을 고려해 컴퓨팅 노드에서 저장장치 노드로 컴팩션을 오프로드 함으로써 컴팩션에 의한 쓰기 멈춤(Write Stall)을 완화했다. 또한, 저장장치 성능 개발 도구(SPDK)를 이용한 파일시스템은 동시에 같은 NVMe SSD에 접근하는 두 노드의 파일시스템 일관성 문제를 효과적으로 해결하였다. NVMe-oF를 활용해 분리형 저장장치 환경을 구성한 실험에서 RocksDB-oF는 기존 RocksDB 보다 높은 쓰기 처리량을 보여주었다.

그래프 신경망을 이용한 삭제 기반 한국어 문장 축약

이경호, 박요한, 이공주

http://doi.org/10.5626/JOK.2022.49.1.32

문장 축약은 주어진 문장의 요지를 담은 짧고 간결한 글을 생성하는 것으로 주로 삭제 기반의 축약 연구가 많이 진행되었다. 삭제 기반의 축약은 문장에서 덜 중요한 부분을 제거하여 문장을 축약하는 것이다. 본 연구에서는 딥러닝 모델을 이용하여 삭제 기반의 한국어 문장 축약 모델을 구축한다. 각각의 단어가 삭제될 것인지 축약에 포함될 것인지 이진 분류하는 기본 모델을 구축하고 여기에 LSTM과 어텐션 레이어를 추가한 모델을 설계한다. 그래프 신경망은 그래프 구조에 딥러닝 방법을 적용한 모델로 본 연구에서는 문장의 구문 구조를 축약에 사용할 수 있도록 그래프 신경망을 도입하였다. 그래프 신경망 중 대표적인 모델인 그래프 합성곱 신경망을 이용하여 의존 트리를 인코딩하고, 인코딩된 트리의 각 노드를 문장 축약 모델의 입력으로 사용한다. 일반적인 그래프 합성곱 신경망은 무방향 그래프만을 다루기 때문에 문장 축약에서 의존 트리의 부모, 자식 노드를 구분하기 위하여 유향그래프 합성곱 신경망을 제안한다. 실험 결과 기본 모델에 그래프 신경망을 적용했을 때 문장 축약의 정확도가 향상되었다. 또한 부모, 자식 노드를 구분할 수 있는 유향그래프 합성곱 신경망이 그렇지 못한 그래프 합성곱 신경망에 비해 높은 F1 점수를 얻었다. 실험을 통해 의존 구문 트리 구조를 명시적으로 반영하였을 때, 문장 축약에 더 좋은 성능을 발휘할 수 있음을 확인하였다.

RocksDB의 컬럼 패밀리 간 성능간섭 현상 분석

이호영, 이민호, 엄영익

http://doi.org/10.5626/JOK.2021.48.7.835

대표적인 LSM-tree 기반 키-밸류 스토어인 RocksDB는 클라이언트가 데이터의 특성에 따라 키-밸류들을 분류할 수 있도록 컬럼 패밀리 기능을 제공한다. 각 컬럼 패밀리는 독립적인 쓰기 버퍼를 가지고 분류된 키-밸류들을 관리하지만 데이터 일관성을 위해 WAL 파일은 공유한다. 하지만, 이러한 WAL 파일을 공유하는 구조는 컬럼 패밀리 간의 성능간섭을 유발하여 RocksDB의 쓰기 성능을 저하시킬 수 있다. 본 논문에서는 컬럼 패밀리 간 성능간섭으로 인한 RocksDB의 성능 저하 원인을 분석한다. 이를 위해 WAL 파일의 크기와 컬럼 패밀리의 수에 따른 RocksDB의 쓰기 성능을 측정하고 그 결과를 분석하였다. 실험 결과를 보면 RocksDB에서 구성된 컬럼 패밀리의 수와 WAL 파일의 크기에 따라 쓰기 성능이 최대 57.08%까지 감소하는 것을 확인할 수 있다.

실시간 전역조명을 위한 프리미티브와 복셀 기반의 하이브리드 추적 기법

석예찬, 이성길

http://doi.org/10.5626/JOK.2021.48.7.748

희소옥트리 기반의 복셀콘추적 렌더링 알고리즘은 전역 조명에 필요한 정보를 볼륨에 저장하고, 복셀콘추적을 통해 간접 확산과 반사 효과를 효율적으로 계산할 수 있다. 그러나 거울 정반사와 같이 고해상도가 필요한 경우에 복셀콘추적은 현격한 메모리와 연산을 필요로 한다. 본 연구는 희소옥트리의 잎노드에서 프리미티브가 밀집되지 않은 경우는 프리미티브 목록을 사용하고, 밀집된 경우는 추가 복셀화를 수행하는 하이브리드 옥트리와 콘추적과 광선추적을 노드 형태에 따라 적응적으로 수행하는 하이브리드 추적 기법을 제안한다. 본 기법은 고품질 간접조명을 복셀콘추적보다 빠르게 실시간에 수행할 수 있다.


Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr