文本特征选择算法MI的改进

方志龙

首页> 中文期刊> 《计算机与现代化》 >文本特征选择算法MI的改进

文本特征选择算法MI的改进

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Feature extraction is a crucial part in text mining. After word splitting, the docs of the train set form the original feature space, but the dimension of the space is usually very large, it reaches hundreds of thousands of demensions. After feature extraction, not only the dimension of the space decreases sharply, but also, the impact of the noise is reduced. Finally, speed and precision of the classifier are both increased. This paper improves the original mutual information method, and proves it' s vilid in the experiment.%特征选择在文本挖掘技术中是一个关键部分.训练集中的文本逐个经过分词后,可形成文本分类系统的全特征空间,一般情况下,这个空间的维数都会较大,可达到几十万维.经过特征选择之后,在降低噪声的同时,特征空间的维数得以压缩,最终能提高分类算法的速度和分类精度.本文从传统的Ml(Mutual Infomation)出发,并对它进行改造,最后通过实验验证改进算法的有效性.

著录项

来源
《计算机与现代化》 |2011年第7期|172-175|共4页
作者
方志龙;
展开▼
作者单位

华南师范大学计算机学院;

广东;

广州;

510631;

展开▼
原文格式 PDF
正文语种 chi
中图分类程序设计、软件工程;
关键词
特征选择; MI; IG; 标准差;

相似文献

中文文献
外文文献
专利

1. 基于词频信息的改进信息增益文本特征选择算法 [J] . 石慧 ,贾代平 ,苗培 . 计算机应用 . 2014,第011期
2. 一种改进的集中度和分散度文本特征选择算法 [J] . 沈友文 ,赵新建 ,徐俊 . 计算机应用与软件 . 2011,第009期
3. 一种改进的集中度和分散度文本特征选择算法 [J] . 沈友文 ,赵新建 ,徐俊 . 计算机应用与软件 . 2011,第009期
4. 一种改进的文本特征选择算法 [J] . 朱颢东 ,蔡乐才 ,刘忠英 . 现代电子技术 . 2008,第008期
5. 混合CHI和MI的改进文本特征选择方法 [J] . 王振 ,邱晓晖 . 计算机技术与发展 . 2018,第004期
6. 基于改进TFIDF的文本特征选择算法 [C] . 杨成成 ,贺兴时 . 2008年全国模式识别学术会议 . 2008
7. 基于模糊熵与粒子群优化的短文本特征选择算法研究 [A] . 柴芳 . 2019

文本特征选择算法MI的改进

摘要

著录项

相似文献

相关主题

期刊订阅