首页> 中国专利> 一种用于维吾尔语语音识别的识别单元的选择方法及系统

一种用于维吾尔语语音识别的识别单元的选择方法及系统

摘要

本发明实施例涉及一种用于维吾尔语语音识别的词典单元的选择方法及系统。方法包括:为待识别的语音收集/准备相应的文本语料;从文本语料中抽取不同的词语;将所述不同词语输入形态分析器,分析成功时获得相应的词语的分解结果,分析失败时对所述词语进行基于削尾算法的词语分解,从而获得分解结果,以及根据所述分解结果,得到每个词语对应的词干以及附加成分;将所述文本语料中的词语映射为所述词干和附加成分,抽取高频词干和附加成分作为词典单元。本发明实施例根据维吾尔语形态变化的规则,将维吾尔语词语分解为词干和附加成分,然后选择词干和附件成分作为识别单元,从而缓解了识别系统集外词过多的问题,提高了系统的识别率。

著录项

  • 公开/公告号CN103065632B

    专利类型发明专利

  • 公开/公告日2014-10-08

    原文格式PDF

  • 申请/专利号CN201210560599.5

  • 发明设计人 潘接林;李鑫;颜永红;

    申请日2012-12-21

  • 分类号G10L15/26(20060101);G10L15/28(20130101);

  • 代理机构11309 北京亿腾知识产权代理事务所;

  • 代理人陈霁

  • 地址 100190 北京市海淀区北四环西路21号

  • 入库时间 2022-08-23 09:20:56

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2014-10-08

    授权

    授权

  • 2013-05-29

    实质审查的生效 IPC(主分类):G10L 15/28 申请日:20121221

    实质审查的生效

  • 2013-04-24

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号