网络挖掘
网络挖掘的相关文献在1999年到2022年内共计96篇,主要集中在自动化技术、计算机技术、信息与知识传播、科学、科学研究
等领域,其中期刊论文67篇、会议论文11篇、专利文献354008篇;相关期刊51种,包括中共杭州市委党校学报、哈尔滨工业大学学报(社会科学版)、汕头大学学报(人文社会科学版)等;
相关会议10种,包括第十二届全国青年管理科学与系统科学学术会议、第七届(2012)中国管理学年会——新经济环境下中国管理变革与范式探索、第二十三届全国计算机信息管理学术研讨会等;网络挖掘的相关文献由217位作者贡献,包括于升峰、刘挺、李生等。
网络挖掘—发文量
专利文献>
论文:354008篇
占比:99.98%
总计:354086篇
网络挖掘
-研究学者
- 于升峰
- 刘挺
- 李生
- Carol Foley
- Dominic Field
- Emmanuel Huet
- 何建军
- 关盛勇
- 周明
- 宋航成
- 张和先
- 张玉峰
- 张荣显
- 徐宗本
- 曹文鸳
- 李玉堂
- 李福现
- 杨娟
- 杨树森
- 杨煜乾
- 武文斌
- 王志娟
- 王楠斌
- 王西亚
- 田晓慧
- 秦刚
- 蒋嶷川
- 谢壹
- 赵霞
- 陈婷
- 陈昭娣
- 高宇
- 高松峰
- Fuxian Li
- Tang Xijin
- Zhao Yongliang
- Zhijuan Wang
- 丁科家
- 万幼川
- 于洋
- 于鷃
- 何丕廉
- 何超
- 何靖
- 侯佳
- 冯小萍
- 刘东升
- 刘丽珍
- 刘兴波
- 刘功申
-
-
刘滨
-
-
摘要:
尊敬的读者朋友,您好!在作者和编辑老师的共同努力下,本专栏又和您见面了!文献大数据分析和重叠社区发现是大数据与社会计算领域的研究热点,也是本期关注的两个主题。文献大数据分析的研究目的之一,就是帮助广大研究人员快速进入目标领域,敏捷追踪其中的方向、方法和工具等,从而有效降低研究成本,缩短成果周期;重叠社区发现是复杂网络挖掘领域的基础性工作,成果应用于社交网络、通讯网络、蛋白质相互作用网络、代谢路径网络、交通网络等各种网络的数据分析中,可服务于人力资源管理、新药研制、交通规划、传染病防治、舆情控制等领域。
-
-
谢漓媛;
苏洁
-
-
摘要:
文章选取贵州省博物馆,采用网络文本分析法,探究贵州省博物馆游客文化感知的内涵、方式以及形成,有利于贵州省博物馆整体水平的提升,进而促使贵州省形成良好的文化形象。
-
-
王井
-
-
摘要:
本文采用大数据技术辅助网络数据挖掘及内容分析法,分析境内外(中国内地、港澳台、海外)对共享经济的相关报道.通过挖掘并对比各地共享经济服务的关注焦点和治理问题,以了解共享经济在运用过程中涉及的公共服务与管理的现状及相关问题,从而力图为共享经济发展中的公共服务与治理问题提供可操作性策略,为公共服务在政府治理及提升公信力方面提供科学参考依据.研究发现:整体报道量趋势显示,标准化共享经济的准公共属性与商业属性带来的冲突与矛盾逐步显现,相应法律规范等制度供给的不足是制约共享经济以及相应公共服务与治理发展的重要因素,故完善相应政策,构建“依法管理、协同治理”的监管格局是有效促进其发展的重要策略与方法.
-
-
-
刘大伟;
杨文峰;
王海洋;
刘玮
-
-
摘要:
对于很多网络数据挖掘的应用,如链路预测、朋友推荐、社区发现和网络演化等,理解网络链路的生成模式是重要的基础性工作.随着复杂网络研究的发展,越来越多的网络应用可以抽象为有向网络的形式,但现有的研究大多关注于无向网络的范围,有向网络的生成机制亟待深入研究.通过分析有向网络的局部结构,基于微观组织模式,提出一种有向复杂网络生成模型的建立方法:局部相关位置方法.同时提出一种对应的链路预测算法来检验生成模型.在各种真实有向网络数据集中的实验结果证明了网络生成模型的有效性.
-
-
汤振华
-
-
摘要:
随着我国互联网的不断发展,互联网媒体的传播力和影响力也不断增强.浙江广电舆情大数据系统利用网络挖掘技术,将对互联网海量信息和行业专业数据进行实时的采集,通过自然语言处理、敏感词过滤、智能聚类分类、主题检测、专题聚焦等大数据分析技术,实现互联网新闻线索汇聚,实时掌握并跟踪热点舆情,反馈广电节目传播情况,促进节目优化,并为决策层全面掌握网络舆情动态提供依据.
-
-
-
王志娟;
李福现
-
-
摘要:
跨语言命名实体对于机器翻译、跨语言信息抽取都具有重要意义,从命名实体的音译、基于平行/可比语料库的跨语言命名实体对齐、基于网络挖掘的跨语言命名实体对翻译抽取3个方面对跨语言命名实体翻译对抽取的研究现状进行了总结.音译是跨语言命名实体翻译对抽取的重点内容之一,基于深度学习的音译模型将是今后的研究重点.目前,跨语言平行/可比语料库的获取和标注直接影响基于语料库的跨语言命名实体对齐的深入研究.基于信息检索和维基百科的跨语言命名实体翻译对抽取研究将是跨语言命名实体翻译对抽取研究的趋势.%Cross-language named entity translation pairs are very important for machine translation,cross-language information retrial and so on.We made a survey on cross-language named entity translation pair extraction in three aspects.Firstly,transliteration is vital for cross-language named entity translation pair extraction.Rules,machine learning and deep learning are used in many languages named entity translation.The performance of transliteration model based on deep learning is excellent and it will be the key method in future studies.Secondly,named entity alignment based on parallel/comparable corpus is a useful method to get cross-language named entity translation pairs.The constructing and annotation of cross-language corpus are bottle necks for research on named entity alignment based on parallel/comparable corpus.Thirdly,cross-language named entity translation pairs can be extracted by Web mining.Cross-language named entity extraction based on cross-language information retail and knowledge base such as Wikipedia will be the trend in the future.
-
-
柏挺;
朱海云;
龚宏伟;
程凌
-
-
摘要:
目的:研究朴素贝叶斯和贝叶斯网络算法在中文文档分类中的应用价值,从而提高机器学习算法在远程医疗中的作用.方法:通过对于上述两种算法在中文语料库的分类测试,按照不同的分类标准(F1-测量,精度和召回率分析)实现综合比较.结果及结论:基于六个类别10629个网络文本文件的实验结果,精度可以达到96%.实验结果同时显示贝叶斯网络的性能总优于朴素贝叶斯方法.%Objective: The massive data increase of telemedicine applications everyday prompts the research on the efficient text categorization tools, especially while Internet contributes immensely to information explosion. Efficient classifier is essential to make the text categorization more accurate. Methods: Text classification practice is as per the practising language, e.g., Chinese in telemedicine applications taking place for Chinese patients. The objective of this study is to evaluate two vital methods in machine learning, namely the naive Bayes approach and the Bayesian network, to process Chinese text analysis and categorize the sources into correct partitions. Result&Conclution:This paper presents an empirical comparison mainly of these two classifiers, naive Bayes and Bayesian network methods, evaluated on a Chinese web text document corpus due to the fact that there is no widely recognized Chinese medical text corpus. In the feature selection stage, chi-squared method outperforms document frequency and mutual information methods. The classification results are further analyzed based on different perspectives, i.e., F1-measure, precision, and recal rate. In the case of 10629 web text documents in six categories, the precision can reach 96%. It also shows that the performance of Bayesian network is always superior to naive Bayes method. The relations among evaluation factors, the total features and cross validation folds are also presented.
-
-
-
-
-
-
Zhao Yongliang;
赵永亮;
Tang Xijin
- 《第十二届全国青年管理科学与系统科学学术会议》
| 2013年
-
摘要:
互联网的快速发展使得网络成为数据的海洋,为了从网络中发现有用的信息,网络挖掘技术应运而生.本文利用爬虫程序从天涯论坛每日定时抓取数据,并存储到数据库和文件系统中;然后基于2012年全年的"天涯杂谈"板块的数据,研究用户的行为规律.数据分析结果表明节假日及周末用户的网上活动减少,用户的行为符合日常作息规律,有明显的日历效应;数据拟合发现点击量的分布可以用泊松分布与幂律分布的混合分布描述,而回复量的分布符合幂律分布.
-
-
- 《2008年全国理论计算机科学学术年会》
| 2008年
-
摘要:
随着计算机和互联网的迅猛发展,面向互联网的社会网络挖掘和分析成为一个新的课题。从互联网挖掘的社会网络往往规模巨大,这对网络分析算法的性能提出了更高的要求.介数值作为图的重要结构性质,广泛应用于基于图的聚类、分类算法,如何降低其计算的复杂性是急需解决的问题。目前,常用的方法是利用对最短路径长度的近似来降低网络分析算法的复杂性,但已有的近似方法没有考虑现实大规模网络的复杂网络特性,对最短路径长度的近似方法也不能直接用于介数值的近似.本文提出了一种新的介数近似计算方法,其基本思想是结合复杂网络的结构特性,利用通过网络中枢节点的路径来近似最短路径,以近似的最短路径求得介数的近似值.这为图的结构性质的近似估算提供了一种新颖的思路.通过与传统的介数计算方法和近似方法进行实验比较,验证了本文的算法能够大幅降低计算复杂性,并保持较高的近似有效性,并通过对实验数据的分析得到了若干有益的结论,为进一步的研究工作奠定了基础.
-
-
郎君;
秦兵;
刘挺;
李生
- 《第三届学术计算语言学研讨会》
| 2006年
-
摘要:
人名性别识别能应用在自然语言处理和信息检索中.本文尝试了中国人名性别自动识别的两种方法.一种方法是采用贝叶斯方法对比了三种人名用字模型,对10万人名的实验结果表明,人名尾字对性别识别具有更好的应用能力,开放测试准确率为82.95%.另一种方法依赖人名上下文,从Hownet和网络挖掘分别抽取男、女性别指示词,采用在百度检索人名的结果中对性别指示词计数来获得对应的性别.对81个人名的测试,准确率达到96.3%.结果显示Hownet的性别指示词具有较好的通用性,网络挖掘的性别指示词具有较好的领域适应性.
-
-
于升峰;
李晶
- 《第十九届全国计算机信息管理学术研讨会》
| 2005年
-
摘要:
随着科技信息服务业的快速发展,科技信息类网站大量涌现,科技类网上数据库剧增,如何高效、准确地从这些海量数据中提取有用的信息成为科技信息服务业亟待解决的问题.为此,本文介绍了网络数据挖掘的原理、分类、方法和步骤,并结合青岛科技信息服务平台(青岛科技港)大型网络项目的建设,给出了具体应用的实例.
-
-
赵云龙;
李艳兵
- 《第七届(2012)中国管理学年会——新经济环境下中国管理变革与范式探索》
| 2012年
-
摘要:
随着社交网络媒体的大众化,如何提供个性化服务逐渐成为社交网络商务智能等领域的研究热点,而社交网络中用户关系强度是个性化社交服务的重要依据之一,如好友推荐,因此,社交网络中关系强度的衡量和计算显得尤为重要。目前计算用户关系强度主要依靠用户的网络交互数据,没有考虑用户人格特质的影响。心理学研究表明人格特征是影响用户关系强度的关键因素之一。本文基于社会心理学中人格特质等基本原理,建立客观化网络行为特征与人格特征之间的关系计算模型,即人格预测模型,实现社交网络用户人格特质的预测,并将其应用到关系强度计算这一领域。结合交互熟悉性计算,本文提出一种集成人格与交互双因素的社交关系强度计算方法,并进行人人网社交关系实验,验证了该方法的合理性和有效性。
-
-
赵云龙;
李艳兵
- 《第七届(2012)中国管理学年会——新经济环境下中国管理变革与范式探索》
| 2012年
-
摘要:
随着社交网络媒体的大众化,如何提供个性化服务逐渐成为社交网络商务智能等领域的研究热点,而社交网络中用户关系强度是个性化社交服务的重要依据之一,如好友推荐,因此,社交网络中关系强度的衡量和计算显得尤为重要。目前计算用户关系强度主要依靠用户的网络交互数据,没有考虑用户人格特质的影响。心理学研究表明人格特征是影响用户关系强度的关键因素之一。本文基于社会心理学中人格特质等基本原理,建立客观化网络行为特征与人格特征之间的关系计算模型,即人格预测模型,实现社交网络用户人格特质的预测,并将其应用到关系强度计算这一领域。结合交互熟悉性计算,本文提出一种集成人格与交互双因素的社交关系强度计算方法,并进行人人网社交关系实验,验证了该方法的合理性和有效性。
-
-
赵云龙;
李艳兵
- 《第七届(2012)中国管理学年会——新经济环境下中国管理变革与范式探索》
| 2012年
-
摘要:
随着社交网络媒体的大众化,如何提供个性化服务逐渐成为社交网络商务智能等领域的研究热点,而社交网络中用户关系强度是个性化社交服务的重要依据之一,如好友推荐,因此,社交网络中关系强度的衡量和计算显得尤为重要。目前计算用户关系强度主要依靠用户的网络交互数据,没有考虑用户人格特质的影响。心理学研究表明人格特征是影响用户关系强度的关键因素之一。本文基于社会心理学中人格特质等基本原理,建立客观化网络行为特征与人格特征之间的关系计算模型,即人格预测模型,实现社交网络用户人格特质的预测,并将其应用到关系强度计算这一领域。结合交互熟悉性计算,本文提出一种集成人格与交互双因素的社交关系强度计算方法,并进行人人网社交关系实验,验证了该方法的合理性和有效性。
-
-
-
-
-
-
-
-
-
- 清华大学
- 公开公告日期:2001-11-07
-
摘要:
本发明属于软件工程领域,包括:建立本地构件目录信息库;创建智能代理接受并分析用户请求,根据用户请求从构件目录信息库中检索可用构件的位置及描述信息;然后启动智能代理程序查询构件目录信息库和构件库,获取所需构件;对这些构件进行选择、取舍、组装,形成完成用户计算要求的程序。本发明可以在分布式网络中实现按需计算,根据用户的要求,从网络构件库中发现组装满足用户需求的程序,并链接执行,完成用户要求的处理功能。
-
-