基于Hive数据仓库的在线阅读用户建模与聚类方法

程美玲; 黎素珍

首页> 中文期刊>电脑知识与技术 >基于Hive数据仓库的在线阅读用户建模与聚类方法

基于Hive数据仓库的在线阅读用户建模与聚类方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

The rapid development of mobile Internet brought huge user behavior logs to online reading system. In the face of in-creasingly large terabytes even petabytes user log data, we design a user model and user clustering solution based on hive ware-house. This method can accurately depict the various dimensions and scales of user preferences, building dynamic user require-ment model based on user reading behavior and apply clustering algorihtm to divide user into groups to provide service for per-sonalized Web application, such as recommendation, search, advertisement delivery. Test results show that this method can take advantage of the storage and computing power of hadoop cluster, thus has a good performance and speed of execution.%移动互联网的高速发展为在线阅读系统带来了海量的用户行为日志.针对日益巨大的TB甚至PB级用户行为日志数据,该文设计一种基于Hive数据仓库的用户模型及用户聚类方案.该方法能够准确的基于用户的阅读行为刻画用户的多维度、多尺度偏好特征,构建动态用户需求模型,并基于用户特征进行聚类,划分用户集,为个性化推荐、搜索或者广告投放等Web个性化应用提供服务.实验结果表明,该方法可以发挥集群存储和运算的优势,具有良好的性能和执行速度.

著录项

来源
《电脑知识与技术》|2015年第32期|45-48|共4页
作者
程美玲; 黎素珍;
展开▼
作者单位

公安部第三研究所信息网络安全公安部重点实验室,上海201204;

公安部第三研究所信息网络安全公安部重点实验室,上海201204;

展开▼
原文格式 PDF
正文语种 chi
中图分类程序设计、软件工程;
关键词
Hive; 数据仓库; 在线阅读; 用户模型; 用户聚类;
入库时间 2023-07-24 16:17:45

相似文献

中文文献
外文文献
专利

1. 基于WLAN大数据和Hive数据仓库的高校人流溯源系统设计与实现 [J] . 徐悦伟 ,夏凌云 . 微型电脑应用 . 2021,第011期
2. 基于Hive的高可用双引擎数据仓库 [J] . 李翀 ,张彤彤 ,杜伟静 . 计算机系统应用 . 2019,第009期
3. 基于Hive数据仓库的物流大数据平台的研究与设计 [J] . 张锐 . 电子设计工程 . 2017,第009期
4. 基于Hive和Impala的物流运力供应链数据仓库研究 [J] . 任春华 ,廖雪花 ,唐思娩 . 物流技术 . 2016,第001期
5. 基于统计方法的Hive数据仓库查询优化实现 [J] . 王有为 ,王伟平 ,孟丹 . 计算机研究与发展 . 2015,第006期
6. 基于序列聚类方法的用户检索式重构转移模式分析 [C] . Song Xiaoxuan ,宋筱璇 ,Liu Chang . 2016年中国科技信息资源管理与服务年会（COINFO2016） . 2016
7. 基于Hive的购销数据仓库系统的设计与实现 [A] . 李英楠 . 2020

基于Hive数据仓库的在线阅读用户建模与聚类方法

摘要

著录项

相似文献

相关主题

期刊订阅