基于语义的网页自动摘要系统设计与实现

代理获取

页面导航

目录
摘要
著录项
引文网络
相似文献
相关主题

摘要

随着网络技术的快速发展，互联网已经成为人们获取信息资源的重要工具。网页常常是信息的载体，然而，网页中常夹杂着与正文不相关的“噪音”信息。如果能够通过网页分析技术快速提取出网页内容，将会大大提高人们获取有效信息的效率。因此，网页分析系统的研究有很大的应用价值。
　　本文的目标是基于传统的自动分析方法，设计并开发出一个基于语义的网页分析系统。围绕这个目标，本文的主要工作包括以下几个方面:
　　(1)总结了自动分析技术的研究现状和主要方法，在此基础上提出了一种基于语义的网页分析方法，融合基于统计主题和基于语义知识库的两种语义模型，分别从文本的结构和内容上来提取。
　　(2)利用矩阵的奇异值分解技术构建了基于统计语义模型，利用《同义词词林》构建了基于语义知识库的语义模型，并将这两种模型进行了融合，构建了一种新的语义融合模型。
　　(3)利用构建的融合模型，设计并实现了基于语义的网页分析系统。该系统主要由网页预处理模块、中文分词模块、词语和句子过滤模块、语义建模模块组成，其中，语义建模模块是本系统的核心部分。
　　(4)对系统进行了测试和评价，实验结果表明，相比于传统的基于句子特征统计的方法，通过对准确率、召回率和综合度量这三个内部评测指标的比较分析，该方法提取出的内容质量较高，具有一定的实用价值。

著录项

作者
刘亮;
展开▼
作者单位

东南大学;

展开▼
授予单位东南大学;
学科软件工程
授予学位硕士
导师姓名吴国新,易黎;
年度 2013
页码
总页数
原文格式 PDF
正文语种中文
中图分类程序语言、算法语言;
关键词
语义模型; 矩阵奇异值分解; 向量空间模型; 网页分析;

相似文献

中文文献
外文文献
专利

1. 一种基于潜语义分析的中文网页自动摘要方法 [J] . 叶昭晖 ,杨高峰 ,杨岳湘 . 广西大学学报（自然科学版） . 2012,第002期
2. 基于潜语义分析的中文网页自动摘要方法 [J] . 叶昭晖 ,杨高峰 ,杨岳湘 . 网管员世界 . 2011,第020期
3. 基于统计的维吾尔文网页自动摘要提取研究 [J] . 阿热帕提·尕依提 ,维尼拉·木沙江 . 电脑知识与技术 . 2011,第001期
4. 基于手机终端的网页自动摘要系统的设计 [J] . 魏宁 . 黑龙江科技信息 . 2011,第021期
5. 基于主题划分的网页自动摘要 [J] . 陈志敏 ,沈洁 ,林颖 . 计算机应用 . 2006,第003期
6. 基于潜在语义差异的医学网页分类 [C] . 米晓芳 ,秦洋 ,王立宏 . 2007年北京地区高校研究生学术交流会 . 2008
7. 基于不同特征权重的中文网页自动摘要 [A] . 林一旻 . 2006

基于语义的网页自动摘要系统设计与实现

目录

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅