首页> 中文期刊>现代图书情报技术 >基于权重的Apriori算法在文本统计特征提取方法中的应用

基于权重的Apriori算法在文本统计特征提取方法中的应用

     

摘要

[目的]解决在海量客户评论信息中抽取产品特征时噪声大的问题.[方法]运用TF-IDF和方差选择的统计方法在众多初步提取出来的特征中进行选择,设置阈值后将各自提取出来的特征取交进行过滤,得到产品特征集合,根据基于矩阵和权重改进的Apriori算法产生频繁项集,设定不同阈值得到最优特征集合,实现对用户评论中产品特征的自动提取.[结果]以手机评论文本为例,从中抽取手机类的产品特征,根据人工标注的183个特征和算法识别出来的特征,查准率P为72.44%,查全率R为77.59%,综合值F为74.93%.[局限]查准率偏低,存在人工标注特征错误的情况.[结论]实验结果表明,在用统计方法和改进后的Apriori算法进行特征提取时可以提高各性能指标.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号