您现在的位置: 首页> 研究主题> 数据稀疏

数据稀疏

数据稀疏的相关文献在2002年到2022年内共计220篇,主要集中在自动化技术、计算机技术、信息与知识传播、无线电电子学、电信技术 等领域,其中期刊论文155篇、会议论文14篇、专利文献551260篇;相关期刊83种,包括人天科学研究、电脑知识与技术、计算机工程等; 相关会议13种,包括第十七届中国Rough集与软计算学术会议、第十一届中国Web智能学术研讨会、第十一届中国粒计算研讨会及第五届三支决策学术会议联合会议 (CRSSC-CWI-CGrC-3WD 2017)、第五届全国青年计算语言学研讨会(YWCL 2010)、第六届全国信息检索学术会议等;数据稀疏的相关文献由599位作者贡献,包括肖云鹏、刘宴兵、吴华瑞等。

数据稀疏—发文量

期刊论文>

论文:155 占比:0.03%

会议论文>

论文:14 占比:0.00%

专利文献>

论文:551260 占比:99.97%

总计:551429篇

数据稀疏—发文趋势图

数据稀疏

-研究学者

  • 肖云鹏
  • 刘宴兵
  • 吴华瑞
  • 孙华超
  • 孙想
  • 张克毅
  • 缪祎晟
  • 顾静秋
  • 俞能海
  • 周理含
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

期刊

    • 李广丽; 卓建武; 许广鑫; 李传秀; 吴光庭; 张红斌
    • 摘要: 传统推荐模型存在数据稀疏、鲁棒性较低问题,且未能有效挖掘异构特征间的深层语义。为解决以上问题,提出相关性视觉对抗贝叶斯个性化排序(correlation visual adversarial Bayesian personalized ranking,CVABPR)推荐模型。首先,基于MovieLens数据集中的电影标题,在互联网电影资料库(Internet movie database,IMDB)爬取对应电影海报图像,构建全新多模态数据集MovieLens–100k–WMI和MovieLens–1M–WMI。其次,基于SENet模型提取一组具有互补性的异构特征,准确描述电影海报图像。然后,改进聚类典型相关性分析模型,深入挖掘异构SENet特征间的聚类典型相关性特征;基于该相关性特征优化视觉贝叶斯个性化排序模型,精准刻画待推荐电影。最后,在推荐模型中加入扰动因子,通过对抗学习来增强推荐模型鲁棒性,使推荐更稳定,生成高质量推荐结果。为验证CVABPR模型,在多模态数据集上完成实验,结果表明:CVABPR模型在这两个数据集上都有效,在MovieLens–100k–WMI数据集上,其推荐的平均精度均值(mean average precision,MAP)较最强基线提升3.802%;在MovieLens–1M–WMI数据集上,其推荐的MAP指标较最强基线提升4.609%。CVABPR模型优于主流基线。消融分析实验表明:相比聚类典型相关性,对抗学习在推荐中发挥更重要的作用。此外,在数据稀疏度更高的MovieLens–1M–WMI数据集上,CVABPR模型能获得更大幅度性能提升,数据稀疏问题得到有效缓解且异构特征间的深层语义也得以充分利用,CVABPR模型已具备较强鲁棒性。
    • 孙海瑞; 朵琳
    • 摘要: 针对Web服务质量预测精度受数据稀疏与噪声数据的影响问题,提出了一种基于随机森林与用户兴趣概念格的Web服务质量预测方法。首先利用历史数据的均值、方差以及用户与服务的经纬度特征构建随机森林分类模型;其次基于同一分类结果构造用户兴趣概念格划分相似邻居,并采用一种改进的相似度计算方法分别计算直接相似邻居和间接相似邻居的相似度;最后采用改进的协同过滤算法进行服务质量预测。在真实的数据集上进行实验,实验证明该方法有效缓解了噪声数据对预测结果的影响,并在较高的数据稀疏度下具有更好的预测准确度。
    • 安敬民; 李冠宇; 蒋伟; 孙云浩
    • 摘要: 随着基于位置的社交网络(Location-Based Social Networks,LBSNs)与兴趣点(Point of Interest,POI)推荐的有效组合,近年来已涌现出大量的相关研究,这些方法主要可分为将地理、社会、类别、文本以及时间等上下文信息进行建模并融合,进而克服数据稀疏问题并提升兴趣点推荐的性能.但已有的兴趣点推荐方法认为不同上下文间相互独立,在对不同上下文建模并融合的过程中忽略了其内在联系,导致上下文信息未得到充分利用.另外,在将上下文模型融合到用户自身偏好模型时,未考虑上下文信息对用户历史签到记录的不同影响.为应对上述挑战,本文合理地重构了上下文信息模型并有效地融合到用户偏好模型中,且提出了一种基于用户活动轨迹和个性化区域划分的兴趣点推荐方法.该方法根据用户的活动轨迹刻画出其日常活动区域,并探索了不同用户间的地理距离分布以及活动轨迹的相似度以建模社会关系对用户签到的影响.进一步地,结合用户活动轨迹区域内的POI的地理信息,使用带有自适应带宽的核密度估计方法评估POI间的地理相关性,以建模POI地理信息对用户签到的影响.最后,将用户社会关系模型和POI地理信息模型与用户自身偏好模型融合,使用改进的加权矩阵分解技术求解用户的个性化POI推荐.本文分别采用经典的和当前流行的相关研究作为基准,在Gowalla和Foursquare数据集上进行对比,实验结果表明本文方法具有更好的POI推荐效果,说明了本文提出的模型在融合策略和克服数据稀疏性方面更具优势.
    • 邹伟静; 庞天杰
    • 摘要: 由于大数据的数据量大和数据价值密度低的特性,用于解决信息过载的协同过滤推荐算法存在数据稀疏性问题,进而引发推荐效果不佳的结果,基于该问题提出了一种面向用户及评分信息的混合数据聚类推荐算法HDCRA(hybrid data clustering recommendation algorithm).针对既有评分数据和属性数据的用户混合数据,对用户进行相似度的计算并对用户进行聚类,使得在各个聚类簇中用户在各个维度上都比较相似,最后在聚类簇中为目标用户找到邻居,并对目标用户进行协同过滤推荐.实验结果证明,该算法有效缓解了数据稀疏的问题,而且在推荐质量的提高上有一定效果.
    • 钟俊伟; 张立臣
    • 摘要: 针对目前跨域协同过滤算法仅通过评分矩阵相似性进行信息提取推荐,并未利用数据中含有的更多信息,从而导致推荐结果不理想的情况。提出一种融合多信息的改进跨域协同过滤算法。算法通过改进传统跨域协同过滤中的信息提取方式,融入了数据源中的时间与类型信息,提高了信息提取的精度与推荐的准确性。通过在MovieLens数据集与豆瓣数据集上进行对比实验,结果表明,跨域推荐算法能够在多域间进行信息传递,融入了多信息的跨域推荐算法能更为有效地提升推荐的准确性。
    • 刘华玲; 郭渊; 马俊
    • 摘要: 推荐算法通过历史数据发现用户的兴趣偏好,在数据资源中寻找用户的偏好信息,并对用户进行推荐。目前,推荐系统中的协同过滤算法在各领域应用广泛,由于数据稀疏性和冷启动,使得推荐质量有所下降,为提升推荐精度,有学者从相似度方向进行研究。总结了推荐系统中最广泛使用的协同过滤算法,以及推荐系统中常用的传统相似度算法;对比分析了基于Pearson相关系数的相似度、余弦相似度、修正的余弦相似度等的适用场景;从冷启动和数据稀疏等方面分析了相似度的研究现状,研究表明通过混合相似度计算用户相似性,提高了推荐质量。最后,总结了相关文献在改进后存在推荐效率低、复杂度增高的问题,在提高推荐精度和推荐效率方面对相似度改进进行了展望。
    • 段琼; 虞慧群; 范贵生
    • 摘要: 目前协同过滤算法在推荐系统中的应用比较广泛,但由于数据的稀疏性,传统的协同过滤算法往往存在推荐准确性不高的问题。本文通过引入用户的社交信任网络挖掘用户的信任信息来缓解此问题。此外,考虑到热门项目在评分相似度计算时的贡献权重,在传统的评分相似计算公式中考虑了用户共同评分项占比带来的影响。在此基础上,提出了一种融合商品流行度与信任度的混合推荐算法(TPRA)。在Epinions数据集上的实验结果表明:该算法相较于对照算法在平均绝对误差(MAE)、均方根误差(RMSE)两个指标上至少降低了约3%。
    • 何羽丰; 徐建民; 张彬
    • 摘要: 针对微博推荐系统中存在的新用户冷启动和数据稀疏性问题,提出一种微博推荐模型.该模型通过重要用户聚类和普通用户分类构建完整用户类,基于类兴趣表征普通用户兴趣,利用Bandits算法为完整用户类中的普通用户产生微博推荐列表,根据普通用户对推荐列表的反馈更新其所属完整用户类的历史数据,合理应对新用户冷启动,降低了数据稀疏度,实现了较为准确的微博推荐,为微博推荐模型的构建提供了新的思路.实验结果表明,该模型能够推荐给用户感兴趣的博文,推荐效果较现有随机探索类算法、置信区间类算法和概率匹配类算法分别最低提高5.62%、5.43%和33.37%.
    • 李征; 黄雪原; 袁科
    • 摘要: 兴趣点推荐是基于位置社交网络中的研究热点之一。首先对从Web of Science收集的兴趣点推荐研究文献进行了分析;然后分析了影响兴趣点推荐的多种因素,并在分析传统兴趣点推荐方法基础上重点从用户历史签到信息建模和用户社交生成信息提取两个方面对基于深度学习的兴趣点推荐方法进行了分析;最后,对未来可能提高兴趣点推荐效果的研究方向进行了展望。
    • 艾山·吾买尔; 斯拉吉艾合麦提·如则麦麦提; 西热艾力·海热拉; 刘文其; 吐尔根·依布拉音; 汪烈军; 瓦依提·阿不力孜
    • 摘要: 近年来,基于神经网络的机器翻译成为机器翻译领域的主流方法,但是在低资源翻译领域中仍存在平行语料不足和数据稀疏的挑战.针对维-汉平行语料不足和维吾尔语形态复杂所导致的数据稀疏问题,从维吾尔语的音节特点出发,将单词切分成音节,同时融入BME(Begin,Middle,End)标记思想,提出一种基于带标记音节的神经网络机器翻译方法.与使用单词粒度和BPE粒度的两类神经网络机器翻译方法对比,该方法在维-汉机器翻译任务中分别提升7.39与3.04个BLEU值,在汉-维机器翻译任务中分别提升5.82与3.09个BLEU值,可见在平行语料不足的条件下,该方法有效地提升了维-汉机器翻译的质量.
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号