首页> 中国专利> 用于识别文本类型的方法、装置和设备

用于识别文本类型的方法、装置和设备

摘要

本申请公开了用于识别文本类型的方法、装置和设备。所述方法的一具体实施方式包括:对预先获取的文本进行预处理得到所述文本的关键词集合;计算所述关键词集合中的每个关键词在所述文本中的出现概率值;对于所述关键词集合中的每个关键词,将该关键词和与该关键词对应的出现概率值导入预先建立的文档主题生成模型,确定所述文档主题生成模型中预先设置的各个主题在所述文本的出现概率值;根据所述各个主题在所述文本中的出现概率值,识别所述文本所属的类型。该实施方式提高了识别文本类型的准确率。

著录项

  • 公开/公告号CN107797982B

    专利类型发明专利

  • 公开/公告日2021-05-07

    原文格式PDF

  • 申请/专利权人 百度在线网络技术(北京)有限公司;

    申请/专利号CN201610798213.2

  • 申请日2016-08-31

  • 分类号G06F40/216(20200101);G06F40/284(20200101);G06F16/35(20190101);

  • 代理机构11204 北京英赛嘉华知识产权代理有限责任公司;

  • 代理人王达佐;马晓亚

  • 地址 100085 北京市海淀区上地十街10号百度大厦三层

  • 入库时间 2022-08-23 11:45:50

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号