首页> 中文学位 >基于中文微博的产品评价分类及推荐算法研究
【6h】

基于中文微博的产品评价分类及推荐算法研究

代理获取

目录

声明

摘要

1 绪论

1.1 研究背景

1.2 研究现状

1.2.1 情感分析相关概念及任务

1.2.2 微博情感分析的发展现状

1.3 本文的主要工作

1.4 本文的组织结构

2 机器学习相关技术

2.1 性能评价方法

2.2 支持向量机算法

2.3 半监督学习方法

3 基于中文微博的情感评价单元构建方法研究

3.1 文本预处理

3.2 微博产品情感评价词典的构建

3.2.1 情感评价词语候选集构建

3.2.2 情感评价词语筛选

3.2.3 情感评价词典实验研究

3.3 副词词典的构建

3.4 产品评价对象词典构建

3.4.1 评价对象

3.4.2 产品评价对象筛选

3.5 情感评价单元构建

3.5.1 相关研究

3.5.2 算法流程

3.5.3 实验研究

4 基于半监督学习的微博产品评价分类算法研究

4.1 微博产品评价分类流程

4.2 情感评价单元特征提取

4.3 直推式支持向量机算法

4.4 基于图局部与全局一致性的分类算法研究

4.4.1 局部与全局一致性算法

4.4.2 LP-SVM分类算法

4.4.3 标准数据集实验

4.5 微博产品评价的半监督分类算法

4.5.1 算法流程

4.5.2 算法实验

5 基于评价分类的产品推荐算法研究

5.1 微博影响力

5.1.1 影响因素

5.1.2 数据标准化

5.2 推荐衡量指标

5.2.1 微博产品评价值

5.2.2 产品评价类别分布值

5.3 微博产品推荐算法流程

5.4 实证研究

5.4.1 实验样本集

5.4.2 评价分类

5.4.3 推荐指标计算

5.4.4 产品推荐结果

结论

参考文献

攻读硕士学位期间发表学术论文情况

致谢

展开▼

摘要

微博是近年新兴的网络媒体传播平台,它具有内容简短、传播速度快、用户众多等特点,而对于微博文本的情感分析是近年来数据挖掘的热点之一,具有重要意义和价值。用户在实施网上购物等行为时,都希望从微博上获取关注产品的评价信息。本文针对中文微博产品评价信息挖掘中存在的文本格式不规范、网络用语大量使用、成分省略等文本特点,及标记数据稀缺、手工标注困难等分类问题开展了如下几项研究工作。
  针对中文微博的文本特点,提出了一种情感评价单元构建方法。该方法分别构建了情感评价词、副词和评价对象词典,并制定了相应的成分补充和单元构建规则,不仅保证了提取信息的全面性和准确性,还在精简词集、提高效率方面做出了尝试。实验表明,该方法的准确性比基于句法路径的相关方法更高。
  针对微博文本的分类问题,提出了一种基于图半监督学习的分类算法LP-SVM。该算法将标签扩散过程与支持向量机相结合,不仅实现了少量标记样本的分类,而且避免了图半监督学习不产生分类器,对于新数据只能重新训练的问题。结合该算法对微博产品的情感评价单元进行特征提取和半监督分类。实验表明,该算法的表现优于传统及直推式的支持向量机算法。
  结合实际应用,提出了一种基于评价分类的微博产品推荐算法。该算法利用产品评价分类的结果,并结合微博的文本特征,制定了微博产品推荐指标及其计算方法。实验最终得到的微博产品推荐方案与相关网站用户评价结果基本一致,充分验证了该算法的准确性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号