首页> 中文学位 >面向运营商IPTV数据集的用户报障行为预测研究
【6h】

面向运营商IPTV数据集的用户报障行为预测研究

代理获取

目录

第一个书签之前

展开▼

摘要

从交互式网络电视(IPTV)长远商业发展来看,保证良好的用户体验质量是运营商吸引用户群体,增加收益的关键所在,也是行业竞争的关键所在。本论文基于运营商IPTV机顶盒采集到的状态数据和用户的报障数据,对获得的两个数据集进行数据清洗和匹配,从中选择合适的关键绩效指标(KPI)特征。接着,针对获得的KPI数据集在分析、处理上的困难,本文从两个方面对现有的机器学习模型和算法进行了改进,建立了用户报障行为预测模型,可以有效提升预测性能。 一方面,为了从原始特征中挑选出最有效的特征子集,达到去除冗余信息、降低模型复杂度的目的,本论文提出了一种利用PCA主成分矩阵进行特征选择的算法。具体而言,除了考虑每个原始特征对整个主成分的贡献度之外,也考虑到对应的主成分所占的贡献率和原始特征自身的信息增益对特征筛选的贡献,提出一种计算特征贡献度的新算法。实验结果表明,所提出的利用PCA主成分矩阵进行特征选择的算法可以进一步降低特征之间的相关性,增加后续预测算法的精度。 另一方面,针对数据集建立模型的困难,本论文首先提出了改进的SMOTE算法来对少数类样本进行过采样。接着,提出利用基于K-means++算法的欠采样算法去除多数类中的冗余信息,并选择决策树作为基分类器,从而建立面向运营商IPTV数据集的用户报障预测模型。实验结果表明,改进的SMOTE算法与相比于传统Borderline-SMOTE数据生成算法可以有效改善IPTV报障预测模型的预测准确率;此外,基于K-means++算法的欠采样算法与传统的随机欠采样算法相比,能够更好地去除冗余信息,提升用户报障行为预测性能。

著录项

  • 作者

    刘榕华;

  • 作者单位

    南京邮电大学;

  • 授予单位 南京邮电大学;
  • 学科 信号与信息处理
  • 授予学位 硕士
  • 导师姓名 魏昕;
  • 年度 2018
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类
  • 关键词

    运营商; IPTV; 数据集; 行为;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号