基于Web内容的用户兴趣挖掘技术研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

本文着重从以下几方面进行了研究： (1)关键字提取技术。基于复杂网络理论中的小世界网络模型，提出一种新的关键字提取方法。主要引入小世界网络模型理论中的平均最短路径长度变化量和簇系数变化量来刻画分词的重要性，进而通过适当计算获得文本中的关键字。 (2)文本相似性度量。本文提出的一种新的基于语义的文本相似性度量方法，该方法利用了《知网》的词语语义相似度计算工具。首先计算不同文本中关键字之间的语义相似度，然后进行统计得到文本相似度。该方法有效地结合语义知识，减少了同义词对计算结果的干扰并降低特征项数，为后续的文本聚类奠定良好的基础。 (3)文本聚类技术。基于复杂网络理论中的社团结构发现方法提出一种无监督的文本聚类算法。通过计算每一对文本的相似度，我们构造了一个文本相似关系图，然后使用新的图聚类算法-Newman算法有效地识别文本簇。 (4)兴趣表示和提取。本文提出基于加权特征向量的用户兴趣表示和提取方法。特征向量的元素采用关键字表示。通过统计关键字在文本簇中出现的情况，得到关键字的权值，从而有效地分析出用户兴趣。为了测试兴趣挖掘方法的效果，我们设计和实现了一个兴趣挖掘实验系统，该系统实现了关键字提取、聚类分析以及兴趣提取的算法。核心算法的实验结果表明相关算法是有效的。

著录项

作者
周雅夫;
展开▼
作者单位

西安邮电学院;

展开▼
授予单位西安邮电学院;
学科计算机应用技术
授予学位硕士
导师姓名马力;
年度 2008
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP393.01;
关键词
网络理论; 小世界网络; 语义; 关键字提取;

相似文献

中文文献
外文文献
专利

1. 基于Web浏览内容和行为相结合的用户兴趣挖掘 [J] . 赵银春 ,付关友 ,朱征宇 . 计算机工程 . 2005,第012期
2. 基于Web挖掘与相关反馈的多层次用户兴趣挖掘算法 [J] . 李村合 ,杨献峰 ,张培颖 . 网络新媒体技术 . 2007,第009期
3. 基于Web挖掘的用户兴趣建模方法的研究 [J] . 浦慧忠 . 智能计算机与应用 . 2014,第005期
4. 基于Web挖掘的用户兴趣建模方法的研究 [J] . 浦慧忠 . 智能计算机与应用 . 2014,第005期
5. 基于Web挖掘的用户兴趣建模方法的研究 [J] . 浦慧忠 . 软件 . 2014,第007期
6. 基于Web文本挖掘的聚类技术研究 [C] . 李凯 ,孙大鹏 ,穆筝 . 辽宁省通信学会2011年通信网络与信息技术年会 . 2011
7. 基于Web的内容挖掘技术研究 [A] . 刘洋 . 2003

基于Web内容的用户兴趣挖掘技术研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅