首页> 中文期刊>信息技术与信息化 >基于CSS选择器的HTML信息抽取研究

基于CSS选择器的HTML信息抽取研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

基于网页结构特征的信息抽取是现阶段最为常用的抽取手段.为了将待抽取的信息从DOM树中准确地抽取出来,需要对欲抽取的信息进行准确地定位.本文提出了一种新的定位方法,在HTML DOM树的基础上,借助于CSS选择器,抽取所需要的信息.

著录项

来源
《信息技术与信息化》|2015年第3期|100-102|共3页
作者
刘全志; 于治楼;
展开▼
作者单位

山东师范大学济南250014;

浪潮集团有限公司济南250101;

展开▼
原文格式 PDF
正文语种 chi
中图分类
关键词
DOM树; HTML信息抽取; CSS选择器;
入库时间 2022-08-18 05:34:06

相似文献

中文文献
外文文献
专利

1. 基于JerichoHTMLParser的html信息抽取 [J] . 王鸿伟 . 赤峰学院学报（自然科学版） . 2010,第010期
2. 基于HtmlParser抽取动态异构Web信息的研究与实现 [J] . 桂林斌 . 计算机与数字工程 . 2009,第007期
3. 基于HTML或MXL描述的Web页信息抽取技术研究 [J] . 谢维成 ,吕先竞 ,宋玉忠 . 情报科学 . 2005,第9期
4. 基于HTML Parser的BBS信息抽取系统的设计与实现 [J] . 蒋琴琴 ,宫哲 ,辛阳 . 自动化技术与应用 . 2012,第001期
5. 基于HTMLParser视频信息抽取系统的设计与实现 [J] . 史诚 . 科技传播 . 2011,第022期
6. 基于htmlparser的搜索引擎信息抽取系统设计与实现 [C] . 孟红 ,钟华 . 第六届全国信息检索学术会议 . 2010
7. 基于CSS选择器的Web信息抽取的研究与实现 [A] . 冯亚维 . 2015

获取原文

客服邮箱：kefu@zhangqiaokeyan.com

京公网安备：11010802029741号 ICP备案号：京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有

客服微信
服务号