首页> 中文学位 >基于Bagging的集成聚类方法在民航常旅客分群中的应用
【6h】

基于Bagging的集成聚类方法在民航常旅客分群中的应用

代理获取

目录

文摘

英文文摘

声明

第1章 绪论

1.1 基于客户细分理论的常旅客分群

1.2 数据挖掘在民航常旅客分群的应用现状

1.3 本文的研究内容

1.4 本文的组织结构

第2章 聚类算法

2.1 数据挖掘简介

2.2 聚类算法

2.2.1基于层次的方法

2.2.2基于划分的方法

2.2.3基于密度的方法

2.2.4基于网格的方法

2.2.5基于模型的方法

第3章 基于Bagging的聚类集成算法

3.1 聚类集成

3.1.1聚类集成基本知识

3.1.2集成聚类成员的产生

3.1.3共识函数

3.2 Bagging方法

3.3 基于Bagging的聚类集成算法

第4章 基于R软件的常旅客数据的预处理

4.1 R语言简介

4.2 数据的基本信息

4.3 常旅客数据的预处理

4.3.1异常值检测和数据合并

4.3.2数据抽样

4.3.3基于PCA的数据降维

第5章 基于Bagging集成聚类在常旅客分群中的应用

5.1 基于K-Means的聚类

5.1.1基于K-Means的聚类数的确定

5.1.2基于K-Means的聚类

5.2 基于Bagging的K-Means集成聚类

5.3 基于Bagging的cmeans集成聚类

5.3.1初始聚类

5.3.2聚类结果修正

5.4 聚类类别特征

第6章 基于聚类结果的预测和全文总结

6.1 基于支持向量机的预测

6.1.1支持向量机和预测强度

6.1.2基于SVM的预测

6.1.3三种聚类方法的预测强度

6.2 结论和展望

6.2.1全文总结

6.2.2未来工作展望

参考文献

附录:本文的主要R程序

致 谢

展开▼

摘要

在任何行业,日益激烈的竞争使企业认识到客户是他们真正的资产,营销的主要工作也是围绕保留现有客户和发展新客户展开,营销方式也表现为差异化营销和一对一营销,最终实现客户满意度和公司获利的双赢。
   民航企业不仅要与国内外的民航公司进行竞争,还要面对来自铁路(尤其是高铁)、公路、水运的挑战。保留旅客和发展新旅客的一个关键问题就是如何划分旅客群,找出各个旅客群的特征,从而可以提供差异化服务。本文使用的数据是基于常旅客行为的数据。
   本文首先在常旅客数据预处理方面也做了探讨,包括异常值处理、相关性分析、探索性分析、数据抽样和基于主成分分的数据降维。
   客户细分常用聚类方法实现,其中K-Means算法在实践中最为常见,在处理大规模数据方面有突出的优势,但是K-Means方法的结果具有任意性,这给类别的确定带来了困扰。本文主要内容是基于Bagging的集成聚类算法在常旅客分群中的应用,集成聚类算法中的聚类算法分别使用了K-Means和cmeans两种算法,这两种集成聚类方法在抽样次数B在20至50之间已经能够分别取得一致的聚类结果。
   本文建立了三个聚类模型,分别使用了K-Means算法、基于Bagging的K-Means算法和基于Bagging的cmeans算法,根据SSW(Sum of Squares Within theClusters,类内方差平方和)和SSB(Sum of Squares Between the Clusters,类间方差平方和)指标得出基于Bagging的cmeans集成聚类算法的结果最优。最后对最优结果的每一类别特征进行分析,并用聚类结果作为训练集,使用SVM方法对未参加的数据进行预测,并通过包含聚类和分类预测思想的预测强度指标衡量聚类和分类预测结果的“好坏”。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号