首页> 中文学位 >融合文本内容与情境信息的协同过滤推荐方法研究
【6h】

融合文本内容与情境信息的协同过滤推荐方法研究

代理获取

目录

声明

致谢

摘要

第1章 绪论

1.1 研究背景

1.2 国内外研究现状

1.2.1 协同过滤及其数据稀疏性问题

1.2.2 在线评论的动态性问题

1.2.3 基于评论文本的推荐系统

1.2.4 基于签到数据的推荐系统

1.3 研究内容与研究目标

1.3.1 研究内容

1.3.2 研究目标

1.4 研究方法与技术路线

1.4.1 研究方法

1.4.2 技术路线

1.5 论文结构

第2章 协同过滤数据源的特性分析

2.1 协同过滤及评分的稀疏性分析

2.1.1 基于评分矩阵的协同过滤方法

2.1.2 评分的稀疏性分析

2.2 评分的动态性分析

2.3 评论文本的特征层情感分析

2.3.1 产品特征的抽取

2.3.2 情感的判定

2.4 签到数据的情境特性分析

2.5 本章小结

第3章 高卷入度产品在线评论的动态性研究

3.1 高卷入度产品的定义

3.2 高卷入度产品评论动态性假设的提出

3.3 高卷入度产品评论数据的收集和处理

3.4 高卷入度产品数值评分的动态性研究

3.4.1 评分动态性的直观展示

3.4.2 评分动态性的分析模型及结果

3.4.3 评分动态性结果的稳健性检验

3.4.4 评分动态性的成因分析

3.5 高卷入度产品评论文本的动态性研究

3.5.1 评论文本动态性的分析模型及结果

3.5.2 评论文本动态性结果的稳健性检验

3.5.3 评论文本动态性的成因分析

3.6 本章小结

第4章 基于评论文本的高卷入度产品协同推荐方法研究

4.1 基于评论文本的高卷入度产品推荐框架

4.2 基于评论文本的物品相似度的计算与评分填补

4.2.1 物品-主题评分矩阵的构建

4.2.2 物品相似度的计算

4.2.3 评分填补策略

4.3 基于填充矩阵的协同过滤推荐方法

4.3.1 与基于近邻的方法的融合

4.3.2 与矩阵分解方法的融合

4.4 实验研究

4.4.1 数据集和预处理

4.4.2 对照算法与评价指标

4.4.3 实验结果及分析

4.5 本章小结

第5章 情境感知的地理位置服务协同推荐方法研究

5.1 情境感知的地理位置服务推荐框架

5.2 情境感知的地点相似度的计算

5.2.1 空间接近度的计算

5.2.2 时间感知的地点相似度的计算

5.3 实验研究

5.3.1 数据集和预处理

5.3.2 对照算法与评价指标

5.3.3 实验结果及分析

5.4 本章小结

第6章 总结与展望

6.1 研究总结

6.2 研究启示

6.3 研究展望

参考文献

攻读博士期间的学术活动及成果情况

展开▼

摘要

推荐系统是解决电子商务平台信息过载问题的主要手段之一,相关研究表明,精准的个性化推荐能够提高消费者对电子商务平台的满意度、促进捆绑销售、提高产品的销量,进而增加商家和电子商务平台的经济效益。协同过滤方法是目前应用最为广泛的推荐技术,具有简单、合理、高效、稳定的优点。传统的协同过滤方法多依赖用户评分,然而评分数据自身存在一些缺陷,主要包括评分的稀疏性、动态性和缺乏情境信息,从而导致协同过滤方法面临许多挑战。
  对于两类产品(或服务),基于评分数据的协同过滤方法所面临的挑战尤其严重。第一类是传统电子商务环境下的高卷入度产品推荐,高卷入度产品通常是指具有高价值的耐用品。对于这类产品,首先,用户的购买记录较少,因而评分存在更加严重的稀疏性问题;另外,关于这类产品评分的动态性,目前没有相关研究给出明确的结论。第二类是移动商务环境下的地理位置服务推荐,这类推荐的特点是需要将情境信息考虑在内,而评分难以满足这一需求。为此,本文尝试引入评论文本和签到数据两类用户生成内容弥补评分数据的缺陷,改进传统的协同过滤方法。具体的研究内容和贡献主要包括:
  (1)运用实证研究的方法,从时间和序列两个维度明确了高卷入度产品在线评论的动态性,填补了相关研究的空白。本文从数值评分和评论文本两个层面研究高卷入度产品在线评论的动态性:对于评分的动态性,首先从时间和序列两个维度给出动态性的直观展示,初步确定动态性的存在;然后,通过有序对数单位模型建模评分与时间和序列两个变量之间的关系,根据模型确定时间和序列两种动态性的存在和表现形式;最后,基于自选择理论和动机理论,对两种动态性的成因进行分析和解释。另外,在评论文本层面,首先通过情感分析的方法挖掘评论文本中所蕴含的用户特征层的情感;然后,与评分的动态性相似,从时间和序列两个角度对用户情感的动态性进行实证分析,并对分析结果给出理论解释。
  (2)针对高卷入度产品推荐,设计基于评论文本的混合协同过滤推荐模型,解决了评分的稀疏性和动态性问题。为了克服高卷入度产品的评分稀疏性问题,采用主题建模、情感分析等文本挖掘方法深入挖掘评论文本中的产品主题、特征和用户情感等信息,以推测用户的未知评分。与以往的基于评论文本的推荐方法多使用评论文本的整体情感不同,本文尝试将用户特征层的情感用于虚拟评分预测,通过把用户特征层的情感转化为物品-主题评分矩阵,将评论文本与协同过滤方法融合起来。并且,在设计推荐方法时,重点考虑了在线评论的动态性问题,给出了相应的解决方案。通过在高卷入度产品数据集上的实验证明,本文所提出的方法能够有效地提高推荐的准确度。
  (3)针对移动环境下的地理位置服务推荐,将签到数据的时间效应和空间效应有机地融合到协同过滤方法之中,设计了情境感知的推荐模型,满足了该类推荐对情境条件的约束。具体来说,本文从时间和空间两个方面改进了地点相似度的计算方法。时间方面,通过时间分割法将时间因素引入到用户-地点签到矩阵中,并根据用户签到在时间上的连续性和不一致性计算了不同时间段之间的相似度,用以弥补由于时间分割所导致的稀疏性问题。空间方面,提出了空间接近度的概念,根据用户的签到历史找到其活跃区域,然后,在考虑用户的活跃区域以及用户在不同活跃区域的签到比例的条件下,给出了计算空间接近度的公式。实验证明,与同类推荐方法相比,本文的方法取得更好的推荐效果。
  通过研究,在理论上,深化了对评论文本和签到数据两类用户生成内容的特性和变化规律的认识,同时有效地解决了传统的协同过滤所面临的评分稀疏性、动态性和情境信息缺乏的挑战,为个性化推荐的研究提供了新思路;在实践上,针对两类不同产品所设计的推荐框架可以为相关企业设计推荐系统提供参考。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号