首页> 中文学位 >基于语义距离的Web页面关键词研究
【6h】

基于语义距离的Web页面关键词研究

代理获取

目录

文摘

英文文摘

声明

第一章 绪 论

第二章 关键词及关键词获取技术

第三章 语义距离

第四章 基于语义距离的关键词获取

第五章 基于语义距离的关键词获取系统的实现

总结与展望

参考文献

致 谢

攻读硕士学位期间发表的论文

展开▼

摘要

随着信息技术的飞速发展和网络的普及,Web上的信息急速膨胀。如何有效地寻找并处理信息成为一项重要的研究课题。而关键词作为文档的一份简洁摘要,可以为组织、管理、检索文档提供解决方法,因此被广泛应用于信息检索和数字图书馆中。 然而,Web上的大部分文档都是没有分配关键词的。考虑到手工分配关键词的耗时性,准确简便的关键词自动获取方法成为需要。本文针对这一实际展开研究,具体的研究是建立在词汇间语义关联的基础上,通过语义距离的计算,实现了一种非监督的关键词获取方法,可以方便快捷地处理大量文本,自动获取相应的关键词。 本文在研究的过程中,围绕英文新闻报道的获取示例展开陈述,构建了一个基于语义距离的关键词获取系统。在具体实现中分两步,一是词汇间语义距离的计算,通过在给定的文本语义背景和词义本身两种方式来衡量词之间的语义关联度。二是语义聚类的思想,在词之间语义关联的基础上通过聚类实现文本内容的划分,再对各类别进行语义概括,最终生成文本的关键词。本文以英文的新闻报道作为测试语料,展示该方法的获取流程,并给出相应的实验数据。实验表明,作为一种非监督的方法,基于语义距离的关键词获取模型简单、易实现,可以方便有效地获取关键词。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号