基于WEB页面的关键词与关键概念提取技术

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

该论文详细介绍了一种基于Web页面的关键词与关键概念提取技术及其实验系统的设计与实现,并对该技术在搜索引擎中的应用进行了探讨.论文的核心内容包含以下三部分:首先,关键词提取系统介绍.围绕着Web页面的特殊性开始,依据Web页面不同于一般文本的特殊性,介绍了一种基于Web页面的关键词提取技术.该技术的实现充分利用了Web页面中的各种标记.然后,关键概念提取系统介绍.语言是一种不断发展的文化,新概念层出不穷,同时还存在很多人名、地名、机构名等专有名词.这些概念的存在影响了关键词的提取质量.从常用的N元语法入手,分析该方法存在的问题—N元截断效应,提出了一种基于上下文和互信息的关键概念提取方法.该方法的实现克服了N元算法的截断效应,实现了可变长的概念提取方法.同时,该文又结合规则选词的方法,对提取结果进行了优化,取得较好的实验效果.最后,论文对该技术在搜索引擎中的应用在理论进行了简单的探讨.通过对搜索引擎中

著录项

作者
王明燕;
展开▼
作者单位

北京工业大学;

展开▼
授予单位北京工业大学;
学科计算机软件与理论
授予学位硕士
导师姓名陈信祥;
年度 2003
页码
总页数
原文格式 PDF
正文语种中文
中图分类程序设计、软件工程;
关键词
关键词; 关键概念; 搜索引擎; Web页面;

相似文献

中文文献
外文文献
专利

1. 基于概念扩展的关键词检索技术 [J] . 张云涛 ,龚玲 ,王永成 . 广西师范大学学报（自然科学版） . 2003,第001期
2. 基于远程学习的关键词提取技术研究 [J] . 曹聪慧 ,兰强 ,侯群 . 电脑与电信 . 2021,第008期
3. 基于大数据技术的网络热搜关键词提取算法 [J] . 王珊珊 ,梁同乐 . 电子测试 . 2021,第010期
4. 基于领域类别信息的关键词提取技术 [J] . 王艳 . 大众标准化 . 2021,第018期
5. 基于CiteSpace的国内外关键词提取技术研究态势分析 [J] . 王霄汉 . 电子技术与软件工程 . 2021,第021期
6. 基于概念扩展的关键词检索技术 [C] . 张云涛 ,龚玲 ,王永成 . 第七届中国人工智能联合学术会议 . 2003
7. 基于语义距离的Web页面关键词研究 [A] . 石爱萍 . 2011

基于WEB页面的关键词与关键概念提取技术

目录

摘要

著录项

相似文献

相关主题

期刊订阅