一种面向盲人的门户网站导航结构提取方法的研究与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

在信息爆炸的时代，门户网站作为互联网信息的主要载体，它们的资讯也日益丰富。当前主流的门户网站频道与栏目众多，层次关系复杂，对于盲人用户而言，理解这些页面的内容是一个巨大的挑战。
　　当前主流门户网站中，大多数网页含有起导航作用的链接，即导航链接。把这些导航链接提取出来并重构成代表当前站点内容结构关系的树状导航结构，能辅助盲人用户浏览网站，这是本文工作的出发点。
　　现有的门户网站中，一部分页面的导航链接数量较多，例如某频道的首页，该类页面起着导航的作用，可称为导航页面。该类页面有一个很明显的特征，即导航链接的位置与内容长期不变，而其他部分的内容变化则相对频繁。也就是说，这些导航链接存在于该页面不同时期版本的模板内容之中。
　　基于以上观察，本文提出一种基于网页模板检测与提取的算法，用于提取网页中的候选导航链接。由于当前页面的各时刻快照模板中往往包含上级层次的导航链接，而它们一般不能作为当前层次的导航链接，本文提出分层提取的策略，以减少上级层次模板里的导航链接对本层导航链接提取的影响。此外，本文通过机器学习分类的方法识别出导航页面以及候选链接中的导航链接，以完成整体的流程。
　　算法分析与实验结果表明，分层的提取策略能显著提高导航链接抽取的准确率。结合分类器技术以识别导航链接和导航页面，导航结构提取的效果良好。

著录项

作者
林立;
展开▼
作者单位

浙江大学;

浙江大学计算机科学与技术学院;

展开▼
授予单位浙江大学;浙江大学计算机科学与技术学院;
学科计算机软件与理论
授予学位硕士
导师姓名卜佳俊,王灿;
年度 2010
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP393.09;TP311.13;
关键词
门户网站; 数据抽取; 导航链接; 网页模板检测; 分类器;

相似文献

中文文献
外文文献
专利

1. 基于用户聚类分析的网站导航结构智能优化研究与实现 [J] . 郑玲霞 ,李大学 . 重庆邮电大学学报（自然科学版） . 2005,第006期
2. 一种面向对缝测量的双线结构光光条中心提取方法 [J] . 丁祖娇 ,李泷杲 ,翟建军 . 航空制造技术 . 2017,第008期
3. 面向新闻文本的特征提取方法研究与实现 [J] . 李志强 ,王玉玫 . 信息技术 . 2022,第1期
4. 中美政府门户网站导航系统的比较与启示 [J] . 李忱博 . 情报科学 . 2007,第z1期
5. 风景这边独好——IT门户网站导航 [J] . Sean . 家用电脑世界 . 2000,第011期
6. 一种PE文件特征提取方法研究与实现 [C] . Wang Zhongke ,王忠珂 ,Ma Zhaofeng . 第十届中国通信学会学术年会 . 2014
7. 面向盲人的图片自动描述系统的研究与实现 [A] . 汪兆鹏 . 2011

一种面向盲人的门户网站导航结构提取方法的研究与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅