嵌套数据记录列表页的Web信息抽取

李贵; 张琪; 郑新录; 韩子扬; 李征宇

首页> 中文期刊>郑州大学学报（理学版） >嵌套数据记录列表页的Web信息抽取

嵌套数据记录列表页的Web信息抽取

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

On the basis of the existing algorithms of the nested data, the data mining algorithm was joined. According to the tag trees of constructed nested list pages, all data regions were found and unified handled. Then a global pattern was produced after all the subtrees were matched based on partial tree aligning algorithm. And all the data records were extracted. Compared with the original algorithm, the efficiency was improved by using the new method, and it ensured the accuracy.%在已有嵌套数据挖掘算法的基础上,加人了数据区域挖掘算法,根据构造出的嵌套数据列表页的标签树,找出所有的数据区域,再对数据区域进行统一处理,对所有子树应用部分树对齐算法进行匹配,生成全局模式,进而抽取出所有数据记录.与原算法相比,改进后的算法在确保准确性的基础上,有效地提高了原算法在处理多数据区域时的效率.

著录项

来源
《郑州大学学报（理学版）》|2011年第2期|20-23|共4页
作者
李贵; 张琪; 郑新录; 韩子扬; 李征宇;
展开▼
作者单位

沈阳建筑大学,计算机应用技术系,辽宁,沈阳,110168;

沈阳建筑大学,计算机应用技术系,辽宁,沈阳,110168;

沈阳建筑大学,计算机应用技术系,辽宁,沈阳,110168;

沈阳建筑大学,计算机应用技术系,辽宁,沈阳,110168;

沈阳建筑大学,计算机应用技术系,辽宁,沈阳,110168;

展开▼
原文格式 PDF
正文语种 chi
中图分类算法理论;
关键词
嵌套数据; 列表页; 标签树; 数据区域; 全局模式;

相似文献

中文文献
外文文献
专利

1. 高速大容量数据记录仪的无效块信息列表动态刷新算法设计 [J] . 张志伟 ,靳鸿 ,李祖博 . 电子器件 . 2017,第002期
2. 高速连续数据记录系统中双页缓存的设计和实现 [J] . 蒋昌龙 ,马骋 ,张绪纲 . 微电子学与计算机 . 2002,第9期
3. 版式设计对新媒体情景中高效信息传达影响的探讨--内容列表页的版式设计对用户获取信息效率的影响 [J] . 王昭 . 设计 . 2015,第015期
4. B2C电子商务网站商品列表页可用性的眼动探究 [J] . 孙成林 . 电子测试 . 2013,第016期
5. 使用NI VI Logger与Compact FieldPoint轻松实现远程数据记录NI VI Logger与Compact FieldPoint分布式I／O实现恶劣工业环境中的远程数据记录 [J] . . 国外电子测量技术 . 2003,第4期
6. 平坦数据记录列表页的Web信息抽取 [C] . 李贵 ,商鹏程 ,郑新录 . 2010国际信息技术与应用论坛 . 2010
7. 页岩气解析过程中组分及同位素分馏特征研究——以渝东南地区胜页1井和隆页1井为例 [A] . 沈博健 . 2018

嵌套数据记录列表页的Web信息抽取

摘要

著录项

相似文献

相关主题

期刊订阅