近年,音声を聞きながらそれを同時進行的に理解するシステムの 実現が試みられている.そのようなシステムを実現するには, 実時間で,かつ,漸進的に入力文を構文解析する必要がある. そのための手法として,これまでに 文脈自由文法に基づく漸進的構文解析手法が提案されているが, 実時間性については不十分であることが指摘されている.
そこで本発表では,有限状態変換器(finite state transducer: FST)を用いた 漸進的構文解析手法を提案する.FSTは入力系列を別の系列へと 変換する装置であり,処理が高速であることが知られている. 本手法では,文脈自由文法をもとに,単語系列を構文情報に 逐次変換するFSTを構成する. FSTは状態遷移ネットワークとして表現できるが, まず,文法規則に対応するネットワークを構成し, それらのネットワークの弧を別のネットワークで置き換えていくことで, 文を解析するFSTを構成する. 実現可能な規模でより多くの文を解析できるFSTを構成するため, コーパスから獲得した統計情報をもとに,使用頻度が高い弧を優先的に置き換える. 最終的に得られるFSTはもとの文脈自由文法を近似したものであり, それだけでは十分な構文解析が行えない場合があるため, FSTで処理できない部分については文脈自由文法ベースの漸進的解析を行う. 本手法は構文解析の大部分をFSTを用いて行うため,処理の高速化が可能である. ATR音声言語データベースを用いた解析実験を行い,本手法の有効性を確認した.