互联网上的网页智能获取与应用研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

互联网上的信息资源浩如烟海,信息丰富自然给人类带来莫大的益处,但如何在纷繁复杂的信息海洋中寻找相关主题的竞争情报信息变得越来越困难.该文就如何从互联网上过滤出用户感兴趣的网页做了研究.该文首先在第一、二章里介绍了互联网竞争情报收集和处理系统——ClSnet的整体结构和用到的主要技术,它是一个面向政府机关和企事业单位用户,对互联网上发布的信息进行搜集、监测和处理的工具.然后在第三章针对网页规则生成的不足之处,利用语义知识库知网以及传统的自然语言理解技术给出了高效的解决方法.同时,对知网的语义信息抽取进行了探讨,并对如何利用知网进行动词名词之间的搭配做了一些研究.最后在第四章里给出了网页评价和去冗余实验的结果.第五章对以后的研究和工作做出了展望.该文的主要工作有:1.描述了互联网竞争情报收集和处理系统ClSnet的整体结构和主要技术.2.针对计算机辅助生成网页规则的低效,利用语义知识库知网以及传统的自然语言理解技术,提出了一个对网页表单打分的算法,实现了自动生成网页规则.3.提出了一个利用知网对动词名词进行搭配的算法,并实现了这个算法,给出了搭配结果实验.4.实现了互联网竞争情报系统CISnet中的高效网页下载.5.实现了互联网竞争情报系统CISnet中的网页评价和去冗余,并给出了实验结果.该文从语言学角度研究了汉语中动词和名词之间的最频繁的两种语义关系—施事与受事关系的搭配,对语义知识库知网的语义信息抽取研究提供了参考价值.该文还将知网的语义信息应用在互联网信息采集中,使其支持用户用自然语言查询,自动生成网页搜索结果,极大的提高了规则抽取的效率,而且保持很高的准确率,为以后的信息智能采集系统提供了有意义的参考.

著录项

作者
李新娟;
展开▼
作者单位

中国科学技术大学;

展开▼
授予单位中国科学技术大学;
学科计算机软件
授予学位硕士
导师姓名刘贵全,蔡庆生;
年度 2004
页码
总页数
原文格式 PDF
正文语种中文
中图分类计算机网络;
关键词
互联网; 信息获取系统; 网页规则生成; 网页下载; 知网; 自然语言理解;

相似文献

中文文献
外文文献
专利

1. 快速准确获取因特网上的教育信息资源——互联网上搜索技巧 [J] . 冯家俊 ,陆逊 . 江苏教育 . 2002,第07B期
2. 互联网上免费化学化工信息资源的获取 [J] . 朱长菊 ,易必武 . 吉首大学学报（自然科学版） . 2011,第002期
3. 互联网上科技报告资源的分布与获取 [J] . 李伟华 ,王通 ,顾英 . 中国科技资源导刊 . 2009,第006期
4. 互联网上国内外内分泌学资源的获取 [J] . 刘延 ,孙玮 ,张向阳 . 医学信息学杂志 . 2009,第007期
5. 互联网上国内外现代皮肤病学资源的获取技术 [J] . 刘延 ,陈玲 ,王学娟 . 中国美容医学 . 2008,第009期
6. 互联网上国内外现代皮肤病学信息资源的获取技术 [C] . 佥涛 . 中国医院协会医院情报图书管理专业委员会2011年学术会议 . 2011
7. 互联网信息智能搜索与获取方法研究 [A] . 朱明 . 2001

互联网上的网页智能获取与应用研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅