首页> 中文期刊> 《渔业信息与战略》 >基于朴素贝叶斯算法的水产类专利文本分类

基于朴素贝叶斯算法的水产类专利文本分类

         

摘要

本文选取公开日从1992年1月1日到2011年12月31日的水产类的9 894条失效专利作为数据挖掘的文本.从中选出56条专利,利用分词器对其摘要进行分词,并通过卡方检验的方法过滤掉与分类相关度比较小的词,形成词组矩阵.然后采用朴素贝叶斯的方法对这些矩阵进行训练并设计程序.使用训练过后的程序对失效专利进行分类测试,合格后再对所有的专利的摘要文本进行分类,并对分类结果进行了分析和验证.验证的结果表明该程序对文本进行分类的准确率达到了85%,达到了比较好的可信度,可以用它对文本分类.如此我们就可以把失效的水产类专利文本按照设定的类别进行归类,了解一个时间段它们的分布情况,为以后做决策提供参考.

著录项

  • 来源
    《渔业信息与战略》 |2014年第1期|54-59|共6页
  • 作者

    范秀梅; 张胜茂; 岳冬冬;

  • 作者单位

    中国水产科学研究院东海水产研究所,中国水产科学研究院渔业资源遥感信息技术重点开放实验室,上海 200090;

    中国水产科学研究院东海水产研究所,中国水产科学研究院渔业资源遥感信息技术重点开放实验室,上海 200090;

    中国水产科学研究院东海水产研究所,中国水产科学研究院渔业资源遥感信息技术重点开放实验室,上海 200090;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 应用统计数学;
  • 关键词

    朴素贝叶斯; 文本分类; 卡方检验;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号