Web挖掘
Web挖掘的相关文献在2000年到2022年内共计1020篇,主要集中在自动化技术、计算机技术、信息与知识传播、贸易经济
等领域,其中期刊论文956篇、会议论文58篇、专利文献37965篇;相关期刊386种,包括商场现代化、电脑知识与技术、福建电脑等;
相关会议48种,包括2012年第三届北京高校网络图书馆国际学术研讨会、第三届国际信息技术与管理科学学术研讨会、2011年信息技术、服务科学与工程管理国际学术会议等;Web挖掘的相关文献由1632位作者贡献,包括杨炳儒、吴瑞、彭宏等。
Web挖掘—发文量
专利文献>
论文:37965篇
占比:97.40%
总计:38979篇
Web挖掘
-研究学者
- 杨炳儒
- 吴瑞
- 彭宏
- 郑启伦
- 李颖基
- 耿增民
- 胡学钢
- 宋中山
- 何典
- 张涛
- 方元康
- 邵良杉
- 周毅灵
- 夏启寿
- 崔琳
- 杨丽
- 杨沛
- 王健
- 申瑞民
- 贾宇波
- 郭伟刚
- 于戈
- 于满泉
- 倪应华
- 向恒勇
- 周志华
- 宁彬
- 左万利
- 张帆
- 张敏
- 张春明
- 张鹏祥
- 易高翔
- 曾炜
- 李伟
- 李其芳
- 李卓玲
- 李明
- 李晓明
- 杜芳芳
- 杨兴峰
- 杨定中
- 杨静
- 段隆振
- 汪恒
- 浦慧忠
- 涂承胜
- 温蕴
- 潘金贵
- 王余旺
-
-
翁彬月;
秦永彬;
黄瑞章;
任丽娜;
田悦霖
-
-
摘要:
目前主流的网页抽取方法存在两大问题:提取信息类型单一,难以获取多种类新闻信息;多依赖HTML标签,难以扩展至不同来源。为此提出一种基于多维度文本特征的新闻网页信息提取方法,利用新闻文本的写作特点划分出写作、语义和位置特征,通过多通道卷积神经网络融合为多维度文本特征,用于提取多种类新闻网页信息;仅需少量数据集训练,就可提取新来源的新闻网页信息。实验结果表明,该方法在性能上高于当前最优方法。
-
-
刘斌;
高尚兵;
吴庆国
-
-
摘要:
随着网络用户的增多和网络行为的多样性,高校网络浏览记录快速增长到Tb级,传统的数据统计已经无法满足使用.通过Excel进行统计,会出现无法打开或失去响应等问题,因此众多学校投入到网络信息管理系统的开发.本文通过Pandas对Excel中的高校网络WEB日志数据进行统计和分析、生成统计图等方式使得管理员可以直观了解到网络浏览情况.系统前端采用了CSS架构用于优化界面,选择Mysql数据库进行数据存储,使用Django框架进行系统搭建,实现前后端的连接和用户管理.在系统的使用过程中,通过生成的统计图,管理员可以直观了解到用户在各个时间段的浏览情况和用户的浏览网站类别倾向,从而对实现网络舆情的监督.
-
-
张琳;
于欣越
-
-
摘要:
针对当前网络信息的发展需求呈现爆炸式增长,对网络搜索引擎提出了更高要求.采用理论结合实践的方法,首先Web信息检索挖掘技术做了简要概念,其次对基于Web挖掘的网络搜索引擎技术的应用进行了分析,提出了一种给予Web挖掘的个性化搜索引擎,并对各系统模块的功能及实现方式进行研究,分析结果表明,此种系统具有很强的检索灵活性,而且还能实现个性化查询结果,能够满足信息时代,信息数据挖掘和检索的需求,值得大范围推广应用.
-
-
郭艳
-
-
摘要:
在互联网+背景下,传统的教学模式已经不能满足日益智能化的学习需求,所以提出基于Web挖掘的网络教学平台,并对其进行设计,首先采用Web挖掘技术设计网络教学平台系统,其次构建主要功能模块,然后基于Web挖掘技术建立数据库,最后采用聚类分析法实现基于Web挖掘的网络教学平台的完整设计.接下来设计对比实验进行验证,结果基于W e b挖掘的网络教学平台的用户访问成功率达到了几乎100%,高于传统平台,所以该平台设计是成功的,而且可以提高教学质量.
-
-
王宏;
夏禹;
常静静
-
-
摘要:
政府采购过程中产生的大量招投标数据,基本都以Web文本的形式向公众呈现,难以获取结构化数据,严重制约着公众对政府采购过程的知情、分析和监督。本文提出一种基于Web挖掘的政府采购数据的工程化采集方案,构建了一套面向政府采购公开数据的结构化数据形成体系。首先,通过对招投标信息来源和结构的分析,设计基于Scrapy爬虫框架的工程化数据抓取平台;其次,结合基于规则和基于统计两种抽取方式,设计专用信息抽取器;最后,根据领域特点建立阶段性数据清洗中心,分层过滤数据,最终输出可用于分析和挖掘的结构化数据。系统实验结果证明了该方案的可行性和优越性,为政府采购信息公开发挥监督和引导职能提供了有力的技术支撑。
-
-
王宏;
夏禹;
常静静
-
-
摘要:
政府采购过程中产生的大量招投标数据,基本都以Web文本的形式向公众呈现,难以获取结构化数据,严重制约着公众对政府采购过程的知情、分析和监督.本文提出一种基于Web挖掘的政府采购数据的工程化采集方案,构建了一套面向政府采购公开数据的结构化数据形成体系.首先,通过对招投标信息来源和结构的分析,设计基于Scrapy爬虫框架的工程化数据抓取平台;其次,结合基于规则和基于统计两种抽取方式,设计专用信息抽取器;最后,根据领域特点建立阶段性数据清洗中心,分层过滤数据,最终输出可用于分析和挖掘的结构化数据.系统实验结果证明了该方案的可行性和优越性,为政府采购信息公开发挥监督和引导职能提供了有力的技术支撑.
-
-
-
-
徐里萍;
侯玲;
张建欣;
赵丽
-
-
摘要:
针对于互联网商品信息数据量庞大的问题,提出一种基于改进型轻量级语义特征提取的web商品信息挖掘方法.首先,通过分析网站链接的层级关系,采用层次访问的方式抓取电子商店的网站URL.其次,采用改进型轻量级语义特征提取方法对元素进行聚类以实现电子商店页面内商品记录的提取.最后,利用产品属性格式和产品记录结构的常识信息进行正则匹配,实现商品属性的提取.实验采用该方法提取来自不同国家的两个电子商店网站不同产品的属性,实验结果表明,提出的方法较好地兼顾了信息提取的完整性和准确性,商品信息的平均提取准确率可高达98.39%.
-