首页> 中国专利> 标点符号识别模型构建方法和装置

标点符号识别模型构建方法和装置

摘要

本申请公开了标点符号识别模型构建方法、装置及设备。其中,所述方法包括:获取第一文本集和第一语音数据集,及第二语音数据与第二文本之间的对应关系集;根据第一文本集,学习得到所述模型包括的文本处理模块的网络参数;根据第一语音数据集,学习得到所述模型包括的语音处理模块的第一网络参数;根据对应关系集,对基于第一网络参数的语音处理模块进行训练,得到语音处理模块的第二网络参数。采用这种处理方式,使得模型在通用领域具有较为一致的识别准确率,同时还从覆盖较少领域的少量平行数据中更好地学习语音处理模块,引入了声学信息后就可以更好地利用说话人本身的用意,得到更符合口语的标点符号。

著录项

  • 公开/公告号CN114049885B

    专利类型发明专利

  • 公开/公告日2022-04-22

    原文格式PDF

  • 申请/专利权人 阿里巴巴达摩院(杭州)科技有限公司;

    申请/专利号CN202210030614.9

  • 发明设计人 陈梦喆;陈谦;

    申请日2022-01-12

  • 分类号G10L15/06;G10L15/02;G10L15/22;G10L15/26;G06V30/10;

  • 代理机构北京润泽恒知识产权代理有限公司;

  • 代理人郝玉娥

  • 地址 311121 浙江省杭州市余杭区五常街道文一西路969号3幢5层516室

  • 入库时间 2022-08-23 13:30:39

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-02-15

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号