首页> 中国专利> 主题段落划分方法、装置、电子设备及存储介质

主题段落划分方法、装置、电子设备及存储介质

摘要

本发明提供一种主题段落划分方法、装置、电子设备及存储介质,首先获取目标文本;目标文本基于对目标音频进行转写得到,目标文本携带有目标音频中的音频片段标识,音频片段标识包括说话人标识、听众标识以及静音标识;然后基于音频片段标识,对目标文本进行语句划分及标点标注,得到待划分文本;最后确定待划分文本中各语句的向量表征,基于待划分文本中各语句的向量表征和/或音频片段标识,对待划分文本进行主题段落划分。引入了目标音频中的音频片段标识,结合该音频片段标识得到待划分文本,并对待划分文本进行主题段落划分,可以充分利用目标音频中包含的信息,降低目标文本的可信度对划分结果的影响,使得主题段落的划分结果更加准确。

著录项

  • 公开/公告号CN114254587A

    专利类型发明专利

  • 公开/公告日2022-03-29

    原文格式PDF

  • 申请/专利权人 科大讯飞股份有限公司;

    申请/专利号CN202111538297.3

  • 发明设计人 顾成敏;代旭东;李宝善;陈志刚;

    申请日2021-12-15

  • 分类号G06F40/117(20200101);G10L15/04(20130101);G10L15/16(20060101);G10L15/26(20060101);

  • 代理机构11002 北京路浩知识产权代理有限公司;

  • 代理人李文清

  • 地址 230088 安徽省合肥市高新开发区望江西路666号

  • 入库时间 2023-06-19 14:42:14

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-03-29

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号