首页> 中国专利> 基于机器学习的政务文本分类、热点问题挖掘方法及系统

基于机器学习的政务文本分类、热点问题挖掘方法及系统

摘要

本发明公开了一种基于机器学习的政务文本分类、热点问题挖掘方法及系统,所述分类方法包括:获取多条训练政务文本数据及相应标签,并构建编码字典;基于编码字典得到所述多条训练政务文本数据的向量表示;对标签数据进行编码,得到各标签的向量表示;根据文本数据及相应标签的向量表示,采用机器学习模型训练政务文本分类模型;所述政务文本分类模型用于政务文本分类。本发明通过政务文本构建字典,基于该字典进行文本编码和向量表示,可以提高政务文本分类的准确度。在分类的基础上,对每一类中的问题进行聚类,并且通过相似度计算出来的问题类别数,可以进一步提高政务文本聚类的效果。

著录项

  • 公开/公告号CN112000801A

    专利类型发明专利

  • 公开/公告日2020-11-27

    原文格式PDF

  • 申请/专利权人 山东师范大学;

    申请/专利号CN202010658709.6

  • 申请日2020-07-09

  • 分类号G06F16/35(20190101);G06N3/04(20060101);

  • 代理机构37221 济南圣达知识产权代理有限公司;

  • 代理人闫伟姣

  • 地址 250014 山东省济南市历下区文化东路88号

  • 入库时间 2023-06-19 09:01:25

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号