用户聚类
用户聚类的相关文献在2003年到2022年内共计203篇,主要集中在自动化技术、计算机技术、信息与知识传播、无线电电子学、电信技术
等领域,其中期刊论文121篇、会议论文8篇、专利文献109181篇;相关期刊75种,包括情报学报、现代图书情报技术、数字技术与应用等;
相关会议8种,包括信息系统协会中国分会第六届学术年会、第四届全国知识组织与知识链接学术交流会、信息系统协会中国分会第四届学术年会等;用户聚类的相关文献由529位作者贡献,包括李鹏、孙宇军、李秋硕等。
用户聚类—发文量
专利文献>
论文:109181篇
占比:99.88%
总计:109310篇
用户聚类
-研究学者
- 李鹏
- 孙宇军
- 李秋硕
- 钱斌
- 刘楠
- 刘欣
- 张涛
- 熊回香
- 蒋武轩
- 于洪达
- 关东东
- 冯硕
- 刘嘉唯
- 刘敏娴
- 刘文文
- 刘璟
- 刘胜宗
- 华先胜
- 单路宝
- 叶佳鑫1
- 吉利川
- 吴健
- 吴大庆
- 吴朝晖
- 周永芹
- 唐文斌
- 唐锐
- 夏书银
- 孙康高
- 孙维思
- 孟祥旭
- 尤肖虎
- 尹建伟
- 崔婷婷
- 崔志明
- 廖志芳
- 张俊豪
- 张士豪
- 张文东
- 张柳
- 张校慧
- 张海平
- 张路
- 张驰
- 彭道万
- 彭飞
- 易轶虎
- 李怀松
- 李慧宇
- 李承宸
-
-
陈奉贤
-
-
摘要:
高性能集群的作业调度通常使用作业调度系统来实现,准确填写作业运行时间能在很大程度上提升作业调度效率。现有的研究通常使用机器学习的预测方式,在预测精度和实用性上还存在一定的提升空间。为了进一步提高集群作业运行时间预测的准确率,考虑先对集群作业日志进行聚类,将作业类别信息添加到作业特征中,再使用基于注意力机制的NR-Transformer网络对作业日志数据建模和预测。在数据处理上,根据与预测目标的相关性、特征的完整性和数据的有效性,从历史日志数据集中筛选出7维特征,并按作业运行时间的长度将其划分为多个作业集,再对各作业集分别进行训练和预测。实验结果表明,相比于传统机器学习和BP神经网络,时序神经网络结构有更好的预测性能,其中NR-Transformer在各作业集上都有较好的性能。
-
-
詹彬;
吴晓鸰;
凌捷
-
-
摘要:
由于用户的评分数据过于稀疏,使得现有的一些基于矩阵分解的用户评分预测算法计算出的用户评分预测偏差过大,预测准确率无法进一步提升。在这个问题上,最常使用的解决办法是加入用户的社交网络数据,这些方法利用用户之间的社交信息来关联用户,根据用户好友的数据来增加用户的预测准确率。大多数情况下用户的社交网络数据不是很容易获得。在没有使用用户社交网络数据的基础上,针对推荐系统的用户评分预测中常用的概率矩阵分解模型准确性的问题,提出利用融合标签和用户聚类类别信息对原有的概率矩阵分解模型添加约束,进而减小预测结果的误差。仿真结果表明,增加用户聚类与电影标签数据能有效减小算法预测误差。
-
-
何羽丰;
徐建民;
张彬
-
-
摘要:
针对微博推荐系统中存在的新用户冷启动和数据稀疏性问题,提出一种微博推荐模型.该模型通过重要用户聚类和普通用户分类构建完整用户类,基于类兴趣表征普通用户兴趣,利用Bandits算法为完整用户类中的普通用户产生微博推荐列表,根据普通用户对推荐列表的反馈更新其所属完整用户类的历史数据,合理应对新用户冷启动,降低了数据稀疏度,实现了较为准确的微博推荐,为微博推荐模型的构建提供了新的思路.实验结果表明,该模型能够推荐给用户感兴趣的博文,推荐效果较现有随机探索类算法、置信区间类算法和概率匹配类算法分别最低提高5.62%、5.43%和33.37%.
-
-
姜崇;
王晓光;
简华
-
-
摘要:
从群体角度精确计算分析不同用户群体感知价值的阈值区间,有助于识别用户群体的差异性,提升付费阅读服务水平,扩大数字收益。本文结合阅读付费意愿影响因素,采用K-means算法对付费阅读用户聚类获取用户群体,并对聚类后的用户群体数据进行M5模型树建模,确定不同用户群体感知价值的阈值区间及数据验证。研究发现,不同阅读用户群体感知价值具有明显差异性。总体上阅读群体的感知价值阈值存在0.722和0.396两个特殊界限将不同比率区间进行界定,根据不同阅读群体适用的感知价值比率阈值区间可将群体定义为发展型、成熟型和激进型三种。其中成熟型阅读群体与发展型阅读群体的阈值区间存在交集,但激进型阅读群体的适用阈值范围会超越0.722的界限而形成一个特殊群体。本文的创新在于结合阅读付费意愿影响因素,对感知价值进行量化定义并采用定量研究方法测量不同用户群体感知价值的阈值区间,是对付费用户群体行为的深入探索。
-
-
刘国丽;
廉孟杰;
于丽梅;
徐洪楠
-
-
摘要:
针对目前协同过滤推荐算法存在的数据稀疏性和冷启动等问题,对融合专家信任的协同过滤推荐算法进行了研究和改进.改进算法结合DBSCAN初始聚类中心优化的思想,将用户划分到不同的社区簇中.考虑到用户活跃度偏差对相似度计算的影响,加入用户活跃度惩罚权重对相似度进行了改进.在选取了专家用户后,考虑到专家评估过的不同项目的专家信任度值不是一成不变的,引入项目平衡因子来处理项目之间的差异,使专家对其评价过的每个项目都有独立的专家信任度值.MovieLens数据集上的实验结果显示,该算法可有效缓解数据稀疏性及冷启动问题,提高了推荐精度.
-
-
章剑光;
刘理峰;
林海峰;
张永建
-
-
摘要:
准确地预测用户中长期用电量对电力系统优化与调度具有重要意义.为此,提出一种根据用电曲线空间相似性划分用电用户类别,进而利用深度网络预测单类用户中长期用电量的方法,用以提升预测精度.首先,计算用电数据间的动态时间规整距离,基于规整距离利用层次聚类法绘制层次聚类树对用户分类.然后,通过离差标准化约束分类后每类用户数据的取值范围,进而通过深度神经网络建立单类用户的中长期用电量预测模型.最后,通过实例分析了传统方法与所提方法的用户聚类效果,并对比单类用户的总体、个体用电量预测结果,证明了所提依据空间形状相似度指标可较准确地划分用户类别,提升了中长期用电量的预测精度.
-
-
席运江;
邓雨珊;
廖晓;
谢正霞
-
-
摘要:
[目的/意义]微博传播效果评价,可以帮助企业更准确地了解其品牌、事件、舆情等在社交平台的传播情况.但由于受到水军、虚假粉丝等不良影响,微博的真实传播效果难以被衡量.[方法/过程]本文基于微博用户的互动行为,在交互强度的基础上提出了用户交互影响度算法,并引入话题传播深度、广度、速率、效率及用户传播贡献度的概念,从而较为完整地对企业微博的传播效果进行评价.[结果/结论]仿真模拟发现交互影响度算法与真实情况吻合较好,可有效消除虚假交互数据的影响."华为手机"官方微博的实例验证结果表明,上述方法可从多个维度对传播效果进行深入分析,分析框架合理有效,分析结果也可为企业的品牌传播、社会化营销等提供改进意见.
-
-
张兰云;
蒋宏宇;
赵韦鑫;
张红英;
吴亚东
-
-
摘要:
移动运营商搭建的基站能够记录智能终端的活动,蕴涵着用户的移动行为以及基站的语义信息.针对城市中基站语义以及活动模式难以获取的问题,提出一种基于用户轨迹的基站语义及城市活动模式可视分析方法.该方法首先根据终端用户的轨迹构建基站序列,接着采用文本分析中的词嵌入技术对基站语义信息进行提取,对城市中的手机用户进行聚类以发现其移动模式.为了帮助用户对结果进行探索和分析,设计了基于用户轨迹以及基站语义的城市活动模式可视分析系统,能够根据用户的轨迹特征、基站的地域特征、用户访问基站的时空特征,对手机用户的行为以及城市的活动模式进行发现和解释.基于真实数据的实验结果表明,在系统用户的迭代交互中该方法能够帮助系统用户有效地结合基站轨迹及其基站语义信息,对城市居民行为模式以及城市整体的活动模式进行探索.
-
-
肖娜
-
-
摘要:
结合三德宜SDE家居品牌策划项目案例,阐述一种基于细分生活场景的用户聚类方法与实践.研究者针对小户型客厅生活场景,通过调查问卷与用户访谈等研究方法,了解年轻人居家生活方式的变化,分析用户行为特征,并从中洞察和挖掘出用户需求.最终根据用户行为聚类,得到用户行为偏向,形成用户模型.最后得出了小户型客厅多样共处场景中4个类型的用户模型.基于场景特殊性的用户聚类方法,是一种回归到用户真实生活场景中,有效理解用户行为、挖掘用户需求的用户研究方法.
-
-
李言;
陈远平
-
-
摘要:
【应用背景】科研信息门户作为科研工作者获取资源服务的入口,已经成为了科研人员、管理决策者、学生等多种用户的工作台,在科研活动、科研管理、教育培训、科学传播等多个业务领域发挥着重要作用。【目的】针对科研信息门户中存在的信息资源配置不合理问题,设计出适用于科研信息门户的推荐算法来提高信息资源的推送效率,对于科研工作者是十分有意义的。【方法】本文提出了一个混合的推荐算法,对于首次使用系统的新用户,可以基于用户属性,通过K-means聚类后找到相邻用户来计算预测评分,对于存在行为数据的用户,先通过计算用户与资源的相似度来解决隐式反馈缺少负反馈的问题,再使用矩阵分解的方法计算预测评分。最后将两种算法的预测评分进行线性组合得到最终预测评分,该算法既利用了群体智慧也体现了个性化。【结果】通过在真实的科研信息门户网站上进行代码埋点来采集用户行为数据,完成对比试验,证明提出的推荐方法能在解决冷启动问题的同时保证较高的推荐准确率。
-
-
-
张颖;
艾时钟;
温浩宇
- 《信息系统协会中国分会第六届学术年会》
| 2015年
-
摘要:
本文利用BBS论坛中帖子的回复信息构建用户相互回复网络,研究其拓扑结构和性质,发现各个版块网络的特点,并且基于用户基本操作行为对用户进行聚类,得到具有不同行为模式的用户.然后利用相似度和关联强度模型对用户进行交互特性分析,挖掘用户之间的关联,从而得到论坛中的用户行为特征.得到的结果与实际认知情况相符合.这种研究方法可以应用于其他的网络社区和社交平台,对于优化网站的管理、提供更好的信息服务有重要意义.
-
-
-
ZHU Maoran;
朱茂然;
YIN Pei;
尹裴;
LI Lei;
李磊
- 《信息系统协会中国分会第四届学术年会》
| 2011年
-
摘要:
随着互联网的发展和网络信息量的急剧膨胀,搜索引擎逐渐成为人们搜索资源的重要途径,如何准确便捷地响应用户需要以及如何满足用户个性化需求、提高响应需求的精准性成为框计算发展的重心.本论文研究了框计算技术实现和应用现状,在此基础上提出框计算精准性提高的两大重要途径;通过研究Web日志挖掘和聚类算法,提出了一种基于浏览行为的用户分类方法;结合框计算精准性制约因素和提出的用户分类方法,构建框计算改进模型.
-
-
-
潘宇;
林鸿飞;
杨志豪
- 《第三届学术计算语言学研讨会》
| 2006年
-
摘要:
推荐系统是利用用户的一些历史个性偏好信息实现个性化服务的系统,它已经成为电子商务领域中的重要技术之一.协同过滤是推荐系统中采用最为广泛和成功的推荐技术,但随着电子商务系统用户数目和商品数目的增加,在整个用户空间上搜索目标用户的最近邻居的耗时也急剧增加,导致系统性能下降.本文提出了一种基于用户项目类偏好值矩阵聚类的合作推荐方法,解决了"冷开始"问题,并且由于只在目标用户所属类别中搜索其最近邻居,减少了搜索空间,有效地提高推荐系统的实时响应速度.
-
-
-
-
-
-
-
-
-
- 国网河北省电力有限公司营销服务中心
- 国家电网有限公司
- 公开公告日期:2022-06-24
-
摘要:
本发明提供了一种基于均值漂移聚类的低压台区用户用电数据聚类方法,属于用电数据无监督的数据聚类技术领域,包括:给定m维空间的用电数据集X∈Rm×n,计算用户用电数据xi(i=1,2,…,n)的密度估计函数;根据函数的极值定理,局部密度极大值点位于密度函数的梯度零值点中,对上式求导,得到梯度函数,从而找到用电数据密度的极大值点;考虑用电数据中的噪声数据的影响,引入高斯核函数,实现用户用电数据的高维可分,提高分类的鲁棒性。本发明提供的一种基于均值漂移聚类的低压台区用户用电数据聚类方法,在低压台区用电信息采集场景中,用户类型多样,用电场景、用电行为复杂,有效改善用电数据分析的质量基础。
-
-
-
-
-
-