검색 : [ author: 이지현 ] (3)

음성인식 모델 및 언어 모델 기반의 음성 전사 코퍼스 오류 자동 검출 방법

이정필, 이지현, 최예린, 장재후, 구명완

http://doi.org/10.5626/JOK.2024.51.4.362

본 연구에서는 CTC 기반 음성인식 모델과 언어 모델의 지식을 결합하여 한국어 음성 코퍼스에서 전사 오류를 자동 검출하는 machine-in-the-loop 방법을 제안한다. 음성인식 모델의 문자오류율(CER)과 언어 모델의 혼잡도(PPL)를 활용한 세 단계 절차를 통해 전사 오류 후보군을 찾아내고, 검출된 후보의 텍스트 레이블을 검수하는 방식으로 오류 검출의 성능을 실험적으로 확인하였다. 이 연구는 한국어 음성인식 코퍼스 KsponSpeech를 대상으로 진행하였으며, 테스트셋의 문자오류율이 검수 전 9.44%에서 8.9%로 개선되었다. 이는 테스트셋 중 약 11%의 데이터만 검수하더라도 성능 향상을 보여주며, 전체 검수에 비해 효율적인 방법임을 입증한다. 이를 통해 음성 데이터의 검수 비용을 줄일 수 있는 효율적인 machine-in-the-loop 오류 검출의 가능성을 확인하였다.

확장형 실시간 데이터 파이프라인 시스템 아키텍처 설계

신호승, 강성원, 이지현

http://doi.org/

빅데이터 시스템은 대규모 로그 데이터를 수집하는 용도로 광범위하게 사용되고 있기 때문에 높은 성능을 갖는 것이 매우 중요하지만, 현재의 Hadoop 기반의 빅데이터 시스템은 중복 처리로 인하여 낮은 성능을 갖는 아키텍처적인 문제를 가지고 있다. 본 논문은 아키텍처 설계 개선을 통하여 Hadoop 기반 시스템의 낮은 성능 문제를 해결한다. 새로운 제안 아키텍처는 기존 아키텍처의 배치(Batch) 기반의 데이터 수집 방식을 개별처리 방식과 혼합한 수집 방법을 사용하고, 수집하는 데이터를 In-Memory 상에서 직접 분석하여 중복 처리를 배제하여 높은 성능을 제공하게 한다. 또한 제안 아키텍처는 기존 Hadoop 기반 아키텍처의 장점인 시스템 확장성을 가진다. 본 논문은 제안 아키텍처가 테스트 베드 환경에서 기존 아키텍처보다 데이터의 분석 처리 속도가 30%~35% 빠르고 확장성도 가진다는 것을 확인하였다.

문제틀과 아키텍처 패턴의 매칭을 이용한 소프트웨어 아키텍처 설계 방법

김정민, 강성원, 이지현

http://doi.org/

패턴은 소프트웨어 개발에서 얻은 경험을 구조화한 것으로 문제해결에 이용되는 반면, 문제틀은 소프트웨어 문제를 분석하는 방법이다. 문제틀은 해법이라기 보다는 문제 도메인에 중점을 두고 있기 때문에 문제를 이해하는데 유용하다. 문제틀과 소프트웨어 아키텍처를 연결하는 기존 연구들은 주어진 문제를 이해하는데 치중하여 문제틀을 이용할 뿐 문제틀과 품질속성 모두를 고려하면서 아키텍처 패턴을 도출하고 있지 않다. 본 논문에서는 문제틀과 아키텍처 패턴의 매칭을 통한 소프트웨어 패턴 기반 아키텍처 설계 방법을 제안한다. 먼저, 문제틀 방법에 따라 문제 모델을 개발한 후 기능 및 품질속성 관점에서 문제모델을 아키텍처 패턴 후보와 매칭한다. 논문은 기능 매칭을 위해서는 문제틀 다이어그램을 이용한 아키텍처 패턴의 문제 모델을, 품질속성을 고려하기 위해서는 새로운 분석 템플릿을 사용하여 아키텍처를 설계하는 방법을 제안한다. 또한, 사례연구를 통해 제안한 방법이 올바른 아키텍처 패턴을 결정하는 체계적인 프로세스이며 잘 정제된 소프트웨어 아키텍처 설계를 위한 기초가 됨을 보인다.


Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr