氏名 : 高木 亮 (280167156)
所属 : 稲垣研究室
題目 : 語彙情報と時間情報を用いた同時通訳コーパスの対訳対応づけ手法
概要 :
同時通訳システムを実現する上で,
実際の同時通訳者の振舞を分析することは効果的な方法の一つである.
名古屋大学統合音響情報研究拠点(CIAIR)では、
音声情報処理技術の高度化を目指した多様な言語データの整備の一環として,
同時通訳音声データベースを作成している.
通訳者音声を詳細に分析するには,
講演者の発話とその通訳者の発話が
比較的小さな単位で対応づけされていることが望ましい.
しかし,コーパスの規模が大きくなればそれを人手で行うのは容易ではない.
本発表では,同時通訳コーパスの対訳対応づけ手法について述べる.
本手法では,独話講演音声とその同時通訳音声の文字化データを対象とする.
データは,200ms以上のポーズで単位分割され,
すべての発話単位に対して,開始時刻,終了時刻が付与されている.
本手法では,対訳語の一致による語彙情報,
通訳者の発話開始タイミングに関する時間情報,
講演者と通訳者の発話の長さに関する情報,
を用いて対応づけを行う.
また,
同時通訳コーパスに対する対訳対応づけの評価方法について
検討するとともに,
本手法に基づいて対訳対応づけ実験を行い,
本手法の有効性を評価した.
目次に戻る