首页> 中文学位 >数据挖掘在淘宝客户评价方面的研究与应用
【6h】

数据挖掘在淘宝客户评价方面的研究与应用

代理获取

目录

声明

摘要

第一章 绪论

1.1 研究背景及意义

1.2 国内外发展现状

1.3 本文主要工作

第二章 数据挖掘概述

2.1 数据挖掘的概述

2.2 数据挖掘的技术

2.2.1 分类挖掘技术

2.2.2 聚类挖掘技术

2.3 数据挖掘的逻辑模型

2.4 数据挖掘的应用及发展趋势

2.4.1 数据挖掘在电子商务中的应用

2.4.2 数据挖掘在教育系统中的应用

2.4.3 数据挖掘在其他领域的应用

2.4.4 数据挖掘技术的发展趋势

2.5 数据挖掘技术在电子商务中的应用

第三章 淘宝网信誉分析

3.1 电子商务和网店

3.2 淘宝网的模式分析

3.2.1 在线沟通工具

3.2.2 在线支付手段

3.3 客户满意度

3.4 淘宝网的信誉评价体系

3.4.1 店铺动态评分

3.4.2 信用评价

第四章 文本分析及产品特征提取

4.1 文本分析

4.1.1 文本采集—网络爬虫

4.1.2 文本表示方法

4.1.3 文本分类算法

4.2 分词与词性标注

4.2.1 分词

4.2.2 词性标注

4.3 特征提取与极性判断

4.3.1 基于关联规则的产品特征提取

4.3.2 评语极性判断

第五章 系统设计与搭建

5.1 系统设计思路与目标

5.2 系统具体实现

5.2.1 数据准备

5.2.2 旗舰店信用提取

5.2.3 客户评价提取

5.2.4 文本分析

5.2.5 分析结果展示

5.2.6 旗舰店信用对比

第六章 总结与展望

6.1 总结

6.2 展望

参考文献

致谢

附录

展开▼

摘要

数据挖掘(Data Mining,简称DM)主要是将众多的、冗杂的、存储在数据库中的数据转化成对人们有使用意义的信息的一系列过程。这些潜藏在数据中的信息大多是不可预测的。DM的聚类算法、分类算法、关联规则等算法在各个领域得到广泛应用,例如本文所提到的在电子商务、教育系统、医学领域中的应用。近些年,将DM技术应用到电子商务领域是倍受大家关注的一个研究方向。这也是本文选取数据挖掘在淘宝客户评价方面的研究与应用为题的原因。课题中主要运用到数据挖掘技术中的关联规则挖掘找出淘宝客户评价中描述产品属性的特征词。
  本文首先分析淘宝网信誉评价体系特点,了解其评价指标以及每个指标具有的实时性和评分标准,以及店铺综合评分的评判指标和评分计算方法。随后从淘宝网用户具体评价入手,利用ICTCLAS汉语分词系统对SQLServer数据库中的用户评价进行逐句分词处理。随即,运用关联规则挖掘算法找出客户评价中描述产品特性的词汇,并提取出与该产品特性词汇相关联的观点词以及观点词的极性。最后,统计出客户对产品以及与产品相关的服务的满意度,为管理者和经营者提供真实可靠的宝贵信息。客户在评价中提到的描述产品特性的高频词汇可视为客户比较在乎的产品属性,对于经销商来说极具有参考价值。同时这也描述产品特性的词汇也是潜在客户比较关注的方面,可以提高客户购买效率也防止电子商务平台的营销欺骗。
  在本文的最后一章,我们依据以上几章的理论基础和实际考察。选取Visual Studio(简称VS)作为开发环境,C#语言作为开发语言,在winForm中建造UI界面,对于用户来说具有较强的可用性,系统操作简单,且方便易懂。在系统实现的整个过程中,全方位考虑系统的可用性,整个系统分为五个模块:旗舰店信誉提取、客户评价提取、评价文本分析、分析结果展示和旗舰店信用对比。文本分析模块将分类算法与关联规则算法相结合,找出最优分词和词性标注算法,提高系统的准确率。分析结果展示又分为两个模块,来提高软件的可靠性。
  在本文最后,文本做出总结并对数据挖掘技术和电子商务的发展做出展望。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号