검색 : [ author: Gyung-Ok Lee ] (5)

Equi-LR 아이템을 이용한 Earley 구문분석기

이경옥

http://doi.org/10.5626/JOK.2024.51.8.685

Earley 구문분석기는 LR 구문분석기와 달리 모호한 문법을 포함한 일반 문법에 대한 구문분 석이 가능하기에 자연어 처리나 영상처리 등의 분야에 널리 사용되고 있지만 Earley 구문분석기는 LR 구 문분석기에 비해 시간과 공간에 대한 비용이 높다는 단점이 있다. 본 논문에서는 Earley 구문분석기의 아이템 형태를 변경하여 복잡도를 줄이는 Equi-Earley 구문분석기 를 제안한다. Earley 구문분석기는 LR 아이템 형태로 구성된 것에 반해 Equi-Earley 구문분석기는 Equi-LR 아이템 형태로 구성되고, Equi-LR 아이템은 LR 아이템을 사용하는 경우보다 상태 내의 아이템 개수를 감소시킨다. Earley 구문분석기는 구문분석 시간에 아이템을 생성하기에 Equi-Earley 구문분석기 의 아이템 개수의 감소는 시간과 공간 면에서 효율적인 구문분석기를 생성하게 한다.

Equi-LR 오토마타

이경옥

http://doi.org/10.5626/JOK.2021.48.3.352

LR 구문분석은 대표적인 상향식 구문분석방법이며, LR 오토마타를 이용하여 구문분석을 수행한다. 본 논문에서는 보편적으로 사용되어 왔던 LR 오토마타의 LR 아이템에 대한 동치 클래스를 정의하고, 이를 사용한 Equi-LR 오토마타의 생성 방법을 제시한다. Equi-LR 오토마타의 상태는 새롭게 정의된 동치클래스를 아이템으로 사용하여 구성되기에, 보편적으로 사용되었던 기존 LR 오토마타에 비해서 Equi-LR 오토마타의 생성 시간이 줄어든다. 본 논문에서는 Equi-LR 오토마타와 기존 보편적 LR 오토마타의 생성시간 복잡도를 정형적으로 비교 분석한 결과를 제시한다. 또한 Equi-LR 오토마타를 이용하면 기존 보편적인 LR 오토마타상에서의 LR 파서 크기의 복잡도보다 더 엄격한 복잡도를 제시할 수 있음을 보인다.

확률파싱오토마타 모델

이경옥

http://doi.org/

확률문법은 자연어처리에서 사용되며, 확률문법에 대한 구문분석의 결과인 파스는 문법의 확률을 그대로 보존해야 한다. 대표적인 구문분석방법인 LL 파싱과 LR 파싱의 확률파싱 가능성을 살펴볼 때 LL 파싱은 문법의 확률정보를 그대로 유지하는 반면에 LR 파싱은 그렇지 않다. 확률문법과 확률파싱오토마톤과의 관계에 관한 기존 연구로 확률보존조건을 충족하는 오토마톤의 특성에 관한 연구는 진행된 바 있다. 그렇지만, 현재로서는 확률보존조건을 충족하는 오토마톤 생성모델에 관해서는 알려진 바가 없다. 본 논문에서는 단일상태파싱오토마타에 기반한 확률파싱오토마타 모델을 제안한다. 제안 모델로부터 생성되는 오토마톤은 확률보존조건을 보장하기에 별도의 확률파싱 가능 여부를 테스팅하는 단계가 불필요하고, 별도의 확률 함수를 정의하지 않아도 된다. 또한 매개인자를 적절하게 선택하여 효율적인 오토마톤의 생성이 가능하다.

LR 문법에 대한 단일상태파싱오토마톤의 적용

이경옥

http://doi.org/

단일상태파싱오토마톤은 구문 분석할 때 행동의 결정이 현재 상태로만 가능하다는 특징이 있고, LR오토마톤과 비교하여 상태수가 적고 구문 분석 시간이 단축된다는 장점이 있다. 한편 단일 상태파싱오토마톤은 적용 가능한 문법 클래스가 LR문법보다 작다는 단점이 있다. 본 논문에서는 단일상태파싱오토마톤을 LR문법 클래스에 적용 가능하도록 확장하는 방법을 제시한다. 기존 방법에서는 파싱오토마톤 생성 과정에서 싸이클릭 상태가 생성되는 경우에 대한 처리 방법을 제시하지 못하였다. 본 논문은 싸이클릭상태에 대한 입력스트링에 따른 동적 처리 작업을 제시하여, 싸이클릭 상태에 대한 문제를 해결한다. 본 논문에서 확장한 방법은 모든 LR 문법에 대해 단일상태파싱오토마톤을 생성할 수 있게 한다.

확장된 PLR(1) 문법에 대한 단일 틈 파싱

이경옥

http://doi.org/

틈(Gap) 파싱은 완전하지 않고 틈이 있는 입력 스트링에 대한 구문 분석을 수행한다. 이런 틈 파싱에 관한 기존 연구로서 임의의 문법에 대한 단일 틈 파싱 알고리즘과 LL(1) 문법에 대한 단일 틈 파싱 알고리즘이 제안되었으며, 이들의 시간복잡도는 각각 O(n³)와 O(n²)이다.
본 논문에서는 확장된 PLR(1) 문법에 대한 단일 틈 파싱 알고리즘을 제안한다. 확장된 PLR(1) 문법은 LR(1) 문법의 부분 클래스이지만 LL(1) 문법보다는 휠씬 넒은 범위의 문법 클래스이다. 이 문법 클래스에 대한 단일 틈 파싱 알고리즘이 LL(1) 문법에 대한 기존에 알려진 단일 틈 파싱 알고리즘의 복잡도와 동일한 O(n²)임을 보인다.


Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr