首页> 中国专利> 识别文档章节标题的方法及装置、电子设备、存储介质

识别文档章节标题的方法及装置、电子设备、存储介质

摘要

本申请涉及文本处理技术领域,公开一种识别文档章节标题的方法,包括:确定文档中的至少一个段落;获取各段落的格式特征、段落向量和正则匹配特征;所述正则匹配特征用于表征各段落对预设字符的正则匹配结果;根据各段落的格式特征、段落向量和正则匹配特征分别识别各段落在文档中是否为章节标题。这种方式不需要用户人工判断文档中的各段落是否为章节标题,不但提高了识别文档中的段落是否为章节标题的效率,还便于自动根据确定为章节标题的段落自动生成目录。本申请还公开一种识别文档章节标题的装置、电子设备、存储介质。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-04-12

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号