您现在的位置: 首页> 研究主题> 用户聚类

用户聚类

用户聚类的相关文献在2003年到2022年内共计203篇,主要集中在自动化技术、计算机技术、信息与知识传播、无线电电子学、电信技术 等领域,其中期刊论文121篇、会议论文8篇、专利文献109181篇;相关期刊75种,包括情报学报、现代图书情报技术、数字技术与应用等; 相关会议8种,包括信息系统协会中国分会第六届学术年会、第四届全国知识组织与知识链接学术交流会、信息系统协会中国分会第四届学术年会等;用户聚类的相关文献由529位作者贡献,包括李鹏、孙宇军、李秋硕等。

用户聚类—发文量

期刊论文>

论文:121 占比:0.11%

会议论文>

论文:8 占比:0.01%

专利文献>

论文:109181 占比:99.88%

总计:109310篇

用户聚类—发文趋势图

用户聚类

-研究学者

  • 李鹏
  • 孙宇军
  • 李秋硕
  • 钱斌
  • 刘楠
  • 刘欣
  • 张涛
  • 熊回香
  • 蒋武轩
  • 于洪达
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 陈奉贤
    • 摘要: 高性能集群的作业调度通常使用作业调度系统来实现,准确填写作业运行时间能在很大程度上提升作业调度效率。现有的研究通常使用机器学习的预测方式,在预测精度和实用性上还存在一定的提升空间。为了进一步提高集群作业运行时间预测的准确率,考虑先对集群作业日志进行聚类,将作业类别信息添加到作业特征中,再使用基于注意力机制的NR-Transformer网络对作业日志数据建模和预测。在数据处理上,根据与预测目标的相关性、特征的完整性和数据的有效性,从历史日志数据集中筛选出7维特征,并按作业运行时间的长度将其划分为多个作业集,再对各作业集分别进行训练和预测。实验结果表明,相比于传统机器学习和BP神经网络,时序神经网络结构有更好的预测性能,其中NR-Transformer在各作业集上都有较好的性能。
    • 詹彬; 吴晓鸰; 凌捷
    • 摘要: 由于用户的评分数据过于稀疏,使得现有的一些基于矩阵分解的用户评分预测算法计算出的用户评分预测偏差过大,预测准确率无法进一步提升。在这个问题上,最常使用的解决办法是加入用户的社交网络数据,这些方法利用用户之间的社交信息来关联用户,根据用户好友的数据来增加用户的预测准确率。大多数情况下用户的社交网络数据不是很容易获得。在没有使用用户社交网络数据的基础上,针对推荐系统的用户评分预测中常用的概率矩阵分解模型准确性的问题,提出利用融合标签和用户聚类类别信息对原有的概率矩阵分解模型添加约束,进而减小预测结果的误差。仿真结果表明,增加用户聚类与电影标签数据能有效减小算法预测误差。
    • 何羽丰; 徐建民; 张彬
    • 摘要: 针对微博推荐系统中存在的新用户冷启动和数据稀疏性问题,提出一种微博推荐模型.该模型通过重要用户聚类和普通用户分类构建完整用户类,基于类兴趣表征普通用户兴趣,利用Bandits算法为完整用户类中的普通用户产生微博推荐列表,根据普通用户对推荐列表的反馈更新其所属完整用户类的历史数据,合理应对新用户冷启动,降低了数据稀疏度,实现了较为准确的微博推荐,为微博推荐模型的构建提供了新的思路.实验结果表明,该模型能够推荐给用户感兴趣的博文,推荐效果较现有随机探索类算法、置信区间类算法和概率匹配类算法分别最低提高5.62%、5.43%和33.37%.
    • 姜崇; 王晓光; 简华
    • 摘要: 从群体角度精确计算分析不同用户群体感知价值的阈值区间,有助于识别用户群体的差异性,提升付费阅读服务水平,扩大数字收益。本文结合阅读付费意愿影响因素,采用K-means算法对付费阅读用户聚类获取用户群体,并对聚类后的用户群体数据进行M5模型树建模,确定不同用户群体感知价值的阈值区间及数据验证。研究发现,不同阅读用户群体感知价值具有明显差异性。总体上阅读群体的感知价值阈值存在0.722和0.396两个特殊界限将不同比率区间进行界定,根据不同阅读群体适用的感知价值比率阈值区间可将群体定义为发展型、成熟型和激进型三种。其中成熟型阅读群体与发展型阅读群体的阈值区间存在交集,但激进型阅读群体的适用阈值范围会超越0.722的界限而形成一个特殊群体。本文的创新在于结合阅读付费意愿影响因素,对感知价值进行量化定义并采用定量研究方法测量不同用户群体感知价值的阈值区间,是对付费用户群体行为的深入探索。
    • 刘国丽; 廉孟杰; 于丽梅; 徐洪楠
    • 摘要: 针对目前协同过滤推荐算法存在的数据稀疏性和冷启动等问题,对融合专家信任的协同过滤推荐算法进行了研究和改进.改进算法结合DBSCAN初始聚类中心优化的思想,将用户划分到不同的社区簇中.考虑到用户活跃度偏差对相似度计算的影响,加入用户活跃度惩罚权重对相似度进行了改进.在选取了专家用户后,考虑到专家评估过的不同项目的专家信任度值不是一成不变的,引入项目平衡因子来处理项目之间的差异,使专家对其评价过的每个项目都有独立的专家信任度值.MovieLens数据集上的实验结果显示,该算法可有效缓解数据稀疏性及冷启动问题,提高了推荐精度.
    • 章剑光; 刘理峰; 林海峰; 张永建
    • 摘要: 准确地预测用户中长期用电量对电力系统优化与调度具有重要意义.为此,提出一种根据用电曲线空间相似性划分用电用户类别,进而利用深度网络预测单类用户中长期用电量的方法,用以提升预测精度.首先,计算用电数据间的动态时间规整距离,基于规整距离利用层次聚类法绘制层次聚类树对用户分类.然后,通过离差标准化约束分类后每类用户数据的取值范围,进而通过深度神经网络建立单类用户的中长期用电量预测模型.最后,通过实例分析了传统方法与所提方法的用户聚类效果,并对比单类用户的总体、个体用电量预测结果,证明了所提依据空间形状相似度指标可较准确地划分用户类别,提升了中长期用电量的预测精度.
    • 席运江; 邓雨珊; 廖晓; 谢正霞
    • 摘要: [目的/意义]微博传播效果评价,可以帮助企业更准确地了解其品牌、事件、舆情等在社交平台的传播情况.但由于受到水军、虚假粉丝等不良影响,微博的真实传播效果难以被衡量.[方法/过程]本文基于微博用户的互动行为,在交互强度的基础上提出了用户交互影响度算法,并引入话题传播深度、广度、速率、效率及用户传播贡献度的概念,从而较为完整地对企业微博的传播效果进行评价.[结果/结论]仿真模拟发现交互影响度算法与真实情况吻合较好,可有效消除虚假交互数据的影响."华为手机"官方微博的实例验证结果表明,上述方法可从多个维度对传播效果进行深入分析,分析框架合理有效,分析结果也可为企业的品牌传播、社会化营销等提供改进意见.
    • 张兰云; 蒋宏宇; 赵韦鑫; 张红英; 吴亚东
    • 摘要: 移动运营商搭建的基站能够记录智能终端的活动,蕴涵着用户的移动行为以及基站的语义信息.针对城市中基站语义以及活动模式难以获取的问题,提出一种基于用户轨迹的基站语义及城市活动模式可视分析方法.该方法首先根据终端用户的轨迹构建基站序列,接着采用文本分析中的词嵌入技术对基站语义信息进行提取,对城市中的手机用户进行聚类以发现其移动模式.为了帮助用户对结果进行探索和分析,设计了基于用户轨迹以及基站语义的城市活动模式可视分析系统,能够根据用户的轨迹特征、基站的地域特征、用户访问基站的时空特征,对手机用户的行为以及城市的活动模式进行发现和解释.基于真实数据的实验结果表明,在系统用户的迭代交互中该方法能够帮助系统用户有效地结合基站轨迹及其基站语义信息,对城市居民行为模式以及城市整体的活动模式进行探索.
    • 肖娜
    • 摘要: 结合三德宜SDE家居品牌策划项目案例,阐述一种基于细分生活场景的用户聚类方法与实践.研究者针对小户型客厅生活场景,通过调查问卷与用户访谈等研究方法,了解年轻人居家生活方式的变化,分析用户行为特征,并从中洞察和挖掘出用户需求.最终根据用户行为聚类,得到用户行为偏向,形成用户模型.最后得出了小户型客厅多样共处场景中4个类型的用户模型.基于场景特殊性的用户聚类方法,是一种回归到用户真实生活场景中,有效理解用户行为、挖掘用户需求的用户研究方法.
    • 李言; 陈远平
    • 摘要: 【应用背景】科研信息门户作为科研工作者获取资源服务的入口,已经成为了科研人员、管理决策者、学生等多种用户的工作台,在科研活动、科研管理、教育培训、科学传播等多个业务领域发挥着重要作用。【目的】针对科研信息门户中存在的信息资源配置不合理问题,设计出适用于科研信息门户的推荐算法来提高信息资源的推送效率,对于科研工作者是十分有意义的。【方法】本文提出了一个混合的推荐算法,对于首次使用系统的新用户,可以基于用户属性,通过K-means聚类后找到相邻用户来计算预测评分,对于存在行为数据的用户,先通过计算用户与资源的相似度来解决隐式反馈缺少负反馈的问题,再使用矩阵分解的方法计算预测评分。最后将两种算法的预测评分进行线性组合得到最终预测评分,该算法既利用了群体智慧也体现了个性化。【结果】通过在真实的科研信息门户网站上进行代码埋点来采集用户行为数据,完成对比试验,证明提出的推荐方法能在解决冷启动问题的同时保证较高的推荐准确率。
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号