首页> 中文学位 >中文专利自动分类特征选择与特征加权方法研究
【6h】

中文专利自动分类特征选择与特征加权方法研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.3 论文研究内容

1.4 论文结构

第二章 专利的相关理论与文本分类技术

2.1 专利的相关理论

2.2 文本分类体系结构

2.3 中文文本分类的关键技术

2.4 本章小结

第三章 特征选择算法与特征加权算法的改进研究

3.1 常用特征选择算法

3.2 中文专利自动分类中信息增益特征选择算法的局限性

3.3 改进的适用于中文专利自动分类的特征选择算法

3.4 特征权重评估

3.5 中文专利自动分类中TF-IDF特征加权算法的局限性

3.6 改进的适用于中文专利自动分类的特征加权算法

3.7 改进的中文专利自动分类方法

3.8 本章小结

第四章 中文专利自动分类实验与结果分析

4.1 原型系统

4.2 实验介绍

4.3实验结果

4.4 实验分析

4.5 本章小结

第五章 总结与展望

5.1 论文总结

5.2 研究展望

致谢

参考文献

附录A

硕士期间研究成果

展开▼

摘要

面对海量专利数据的分类,传统的手工分类方式已经无法满足人们的需求,因此如何实现专利快速有效的自动分类,成为专利分析处理工作的关键问题。在现有的专利自动分类技术的基础上,本文就中文专利自动分类中特征选择算法以及特征加权算法两个方面的问题开展研究。
  在对中文专利文本进行特征选择时,本文提出在信息增益算法的基础上,引入词频加权因子以突出词频因素对于特征选择的作用;引入类间分散度加权因子以强调类间分布因素对于特征选择的影响,引入调节因子以降低处理不均衡专利数据集时不出现的特征词的负面影响。在计算特征权重时,本文结合专利文本的结构特点,提出引入类间分散度加权因子与位置加权因子,引入类间分散度加权因子可以突出分布类别少、出现频率高的特征词的权重;引入位置加权因子,可以突出专利的法律特性和技术特性以及组成专利各元素内容的差异性。最后通过对比试验证明,本文提出的改进方法是有效的。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号