我々は,類似度に基づいて発話単位の予測を行う手法を提案する.音声対話では,背景知識,文脈,対象範囲の限定により,発話を予測することが考えられる.n-gramのような線形予測では,文字単位あるいは単語単位による予測となるが,発話単位の予測を行う手法が望まれる場面も多い.そこで,我々は低頻度に基づく類似度を利用して学習データから類似度の高い文をみつけ,その次に発話された文を予測文とする.類似度はTF·AoI(Term Frequency ×Amount of Information)の重み付けに基づいて計算される.一致率を類似度と考え比較実験を行った結果,提案手法が候補選択において5ポイントの向上が確認された.
展开▼