基于权重的Apriori算法在文本统计特征提取方法中的应用

李昌兵; 庞崇鹏; 李美平

首页> 中文期刊>现代图书情报技术 >基于权重的Apriori算法在文本统计特征提取方法中的应用

基于权重的Apriori算法在文本统计特征提取方法中的应用

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

[目的]解决在海量客户评论信息中抽取产品特征时噪声大的问题.[方法]运用TF-IDF和方差选择的统计方法在众多初步提取出来的特征中进行选择,设置阈值后将各自提取出来的特征取交进行过滤,得到产品特征集合,根据基于矩阵和权重改进的Apriori算法产生频繁项集,设定不同阈值得到最优特征集合,实现对用户评论中产品特征的自动提取.[结果]以手机评论文本为例,从中抽取手机类的产品特征,根据人工标注的183个特征和算法识别出来的特征,查准率P为72.44％,查全率R为77.59％,综合值F为74.93％.[局限]查准率偏低,存在人工标注特征错误的情况.[结论]实验结果表明,在用统计方法和改进后的Apriori算法进行特征提取时可以提高各性能指标.

著录项

来源
《现代图书情报技术》|2017年第9期|83-89|共7页
作者
李昌兵; 庞崇鹏; 李美平;
展开▼
作者单位

重庆邮电大学经济管理学院重庆400065;

重庆邮电大学经济管理学院重庆400065;

重庆邮电大学经济管理学院重庆400065;

展开▼
原文格式 PDF
正文语种 chi
中图分类情报学;
关键词
特征提取; Apriori算法; TF-IDF; 方差选择;
入库时间 2023-07-25 13:46:09

相似文献

中文文献
外文文献
专利

1. 基于全信息自然语言理解的文本过滤技术在教育出版中的应用——数字教材转换电子课件的智能提取方法 [J] . 韩钦 . 中国高新科技 . 2020,第024期
2. 基于互信息的特征提取方法在中文法律案情文本分类中的改进及应用 [J] . 李文 ,王炜立 ,洪胜华 . 科技广场 . 2006,第011期
3. 文本分类中基于熵的词权重计算方法研究 [J] . 陈科文 ,张祖平 ,龙军 . 计算机科学与探索 . 2016,第009期
4. 文本分类中基于改进的词语权重算法的研究 [J] . 侯艳钗 ,沈西挺 . 微计算机信息 . 2011,第006期
5. 基于WEB数据挖掘中的文本聚类权重对偶性研究 [J] . 杨军 . 福建电脑 . 2010,第008期
6. 基于统计特征词的模糊文本自动分类模型 [C] . 陆蓓 ,王小华 ,张国煊 . 第七届联合国际计算机会议 . 2000
7. 在情感分类中基于标签相关性权重筛选机制的文本增强方法 [A] . 石丽明 . 2020

基于权重的Apriori算法在文本统计特征提取方法中的应用

摘要

著录项

相似文献

相关主题

期刊订阅