近年,人との自然な雑談を目指した非タスク指向型対話システム(雑談対話シス テム)が注目されている.雑談対話では,幅広い話題の対話が想定されるため,対話 システムは多種多様な話題に対する発話を行う必要がある.そのため,Twitterなど のウェブ上から発話文を大量に取得することで,発話データベースの網羅性を上げる 手法が提案されている.しかし,これらの手法の問題点として,取得するウェブドメ インで言及されにくい話題に関しては,ごく少数の発話文しか取得することができな いことが挙げられる.そこで,本発表ではデータベースに登録されている既存の発話 文から,数が少ない話題に対する発話文を自動生成する手法について検討する.
アイディアは単純で,類似した意味の話題語を含む発話文において,単語の置換 を行うことで新たな発話文を生成する.実験の結果,僅か6個の発話文しか取得でき ない話題に関して,平均で145個の発話文を生成できることを示す.
しかし,置換を行うことで,発話文として意味が通らなくなってしまう「無効な」 発話文が生成されることがある.このような置換により無効となってしまう発話文の 除去方法についても検討を行う.