首页> 外国专利> CORPUS PROCESSOR FOR GENERATING STATISTICAL LANGUAGE MODEL, AND METHOD AND PROGRAM THEREOF

CORPUS PROCESSOR FOR GENERATING STATISTICAL LANGUAGE MODEL, AND METHOD AND PROGRAM THEREOF

机译:用于生成统计语言模型的语料库处理器及其方法和程序

摘要

PPROBLEM TO BE SOLVED: To prevent secret information included in a database or existent corpus from leaking out. PSOLUTION: A text analysis part 102 outputs a morpheme analytic result of a text. A storage part 104 stores a mask rule in which information for masking a person's name is described. A secret information mask part 103 masks the morpheme analytic result according to the mask rule. Consequently, no secret information is included in the morpheme analytic result from the secret information mask part 103. A corpus totaling part 105 totals morpheme analytic results to generate a corpus excluding the secret information. According to the corpus, a statistical language model is generated. Accordingly, no secret information leaks out in speech recognition processing using the statistical language model. PCOPYRIGHT: (C)2003,JPO
机译:

要解决的问题:防止数据库中包含的机密信息或现有的主体泄漏出去。

解决方案:文本分析部分102输出文本的词素分析结果。存储部分104存储屏蔽规则,其中描述了用于屏蔽人名的信息。秘密信息掩蔽部分103根据掩蔽规则掩盖语素分析结果。因此,在来自秘密信息掩盖部分103的语素分析结果中不包括秘密信息。语料合计部分105对语素分析结果求和以生成排除秘密信息的语料。根据语料,生成统计语言模型。因此,在使用统计语言模型的语音识别处理中没有秘密信息泄漏。

版权:(C)2003,日本特许厅

著录项

  • 公开/公告号JP2003202893A

    专利类型

  • 公开/公告日2003-07-18

    原文格式PDF

  • 申请/专利权人 TOSHIBA CORP;

    申请/专利号JP20010401616

  • 发明设计人 NAGAE HISAYOSHI;

    申请日2001-12-28

  • 分类号G10L15/18;G06F17/28;G10L15/06;

  • 国家 JP

  • 入库时间 2022-08-22 00:19:05

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号