要解决的问题:当混合多个语料库以学习语言模型时,在混合之前给语料库的单词串特性打好分数。
解决方案:必要词选择部分103从语料库-A保持部分101中选择必要的词,并且词ID赋予部分105向其赋予语料库A的特征词ID并将其保存在混合语料库保持部分107中。主体B保持部102,必要单词选择部104以及单词ID赋予部106也同样地动作。类别ID赋予部108对保存在混合语料库保持部107中的单词赋予类别ID。语言模型学习部109根据混合语料库保持部107的内容推定语言模型,并存储在单词语言模型中。保存部分110,类语言模型保存部分111和平滑信息保存部分112。
版权所有:(C)2005,JPO&NCIPI