首页> 中文学位 >基于用户行为的流媒体服务质量优化方法
【6h】

基于用户行为的流媒体服务质量优化方法

代理获取

目录

第一个书签之前

展开▼

摘要

随着高清、3D等技术的成熟与普及,以互联网电视为代表的流媒体业务成为互联网流量的主要组成部分。互联网电视作为“互联网+”时代重要的流媒体应用,由于内容丰富和使用方便,受到了广大用户的喜爱。与此同时,有限的网络传输资源难以满足海量互联网电视的收视需要,导致网络拥塞、丢包延迟,严重影响了互联网电视的用户体验。为减轻互联网数据传输压力,提高互联网电视系统的服务质量和用户体验,本文从分析互联网电视用户行为入手,研究了互联网电视内容流行度变化规律,构建了高精度的内容流行度预测模型,设计了适应多种流行度演化趋势的缓存调度算法,实现了具备交互处理能力的互联网用户行为分析平台。论文的主要工作和创新点如下: (1)针对现有预测模型训练时间长、样本数量多、对突发热点节目流行度预测效果差等问题,提出了一种基于收视行为的互联网电视节目流行度预测模型。论文采用行为动力学分类方法将节目流行度演化过程分为内源临界、内源亚临界、外源临界和外源亚临界4种类型,采用双种群粒子优化的最小二乘支持向量机构建节目流行度预测模型。本文测量分析了某互联网电视平台280万用户的60亿条收视行为数据,实验结果表明,与现有其他方法相比,本文所提模型预测准确度可提升17%以上,并能有效缩短预测周期。 (2)针对不同互联网电视平台节目流行度演化趋势差异巨大,现有预测模型存在不能跨平台使用的问题,提出了基于趋势侦测的互联网流行度预测方法。首先,采用动态时间弯曲距离计算出节目流行度时间序列之间的相似性,并使用随机森林回归算法为K-Medoids聚类后的互联网电视节目构建流行度预测模型;然后,使用梯度提升决策树识别新发布的节目。最后,基于最大熵原理,结合每种趋势预测值和分类概率得到节目流行度预测值。实验结果表明,与传统的单一预测模型相比,论文的方法可以根据不同地区用户收视行为特点动态调整,预测准确度提高了20%。 (3)针对互联网电视平台为提高热点节目命中率而过度消耗存储空间的问题,提出一种基于流行度预测的节目缓存调度算法PPRA。首先,使用随机森林算法构建节目流行度预测模型,并针对所选特征存在的“维数灾难”问题,利用主成分分析法实施特征降维处理。然后,基于节目流行度预测数据调度缓存中的节目。最后,以某广电运营商130万用户120天的收视数据对PPRA算法进行实验。实验结果表明相同缓存命中率情况下PPRA算法仅需LRU、LFU算法30%的存储空间,显著降低平台的建设成本。 (4)基于上述方法,论文设计与实现了互联网电视用户行为分析系统,构建了一个由嵌入在机顶盒中的代理程序和捕获服务器集群组成的行为事件捕获子系统。另外,开发了一套兼容非结构化数据源的分布式事务管理功能的SQL-on-Hadoop引擎。实验结果表明在1600万用户的商业互联网电视平台上采用32个节点的集群环境,每天可以处理10.2TB的用户行为数据,处理速度比基于Hadoop/Hive的同类系统快近40倍。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号