基于编辑距离的Web数据挖掘

黄亮; 赵泽茂; 梁兴开

首页> 中文期刊>计算机应用 >基于编辑距离的Web数据挖掘

基于编辑距离的Web数据挖掘

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Div+ CSS流行于Web页面的布局,在这种布局下,网页中很多数据记录以重复结构的形式聚集在一个层级.为了更好地从网页中挖掘数据,提出了一种新的Web数据挖掘算法,把树编辑距离转化为字符串编辑距离的计算,改进字符串编辑距离算法,利用字符串编辑距离评价树的相似度,进而找到网页中的重复模式,提取数据.通过针对不同重复模式特征的网页的实验说明,基于编辑距离的Web数据挖掘算法不仅能提取具有根节点及上面几层相同的网页的数据,对具有底层节点相同的网页也是有效的.

著录项

来源
《计算机应用》|2012年第6期|1662-1665|共4页
作者
黄亮; 赵泽茂; 梁兴开;
展开▼
作者单位

杭州电子科技大学通信工程学院,杭州310018;

杭州电子科技大学通信工程学院,杭州310018;

杭州电子科技大学通信工程学院,杭州310018;

展开▼
原文格式 PDF
正文语种 chi
中图分类 TP393.09;
关键词
Web数据挖掘; 编辑距离; 字符串编辑距离; 树编辑距离;
入库时间 2022-08-18 04:56:49

相似文献

中文文献
外文文献
专利

1. 编辑距离的Web数据挖掘问题研究 [J] . 陈熙 . 中国电子商务 . 2014,第006期
2. 基于编辑距离的中文地址与邮政编码匹配方法研究与应用 [J] . 金榕榕 ,尹晖 . 测绘与空间地理信息 . 2021,第006期
3. 基于编辑距离的汉语中介语语音计算分类 [J] . 于爽 ,冉启斌 ,史晴琳 . 现代语文 . 2020,第011期
4. 基于编辑距离的汉语中介语语音计算分类 [J] . 于爽 ,冉启斌 ,史晴琳 . 现代语文（语言研究） . 2020,第011期
5. 基于变迁图编辑距离的流程相似性算法 [J] . 段瑞 ,方欢 ,方贤文 . 计算机应用研究 . 2020,第004期
6. 一种基于树编辑距离的Web表格信息抽取方法 [C] . 刘颖 ,胡学钢 ,吴共庆 . 第七届仪表、自动化与先进集成技术大会暨第六届测控技术与仪器仪表学术大会 . 2012
7. 基于编辑距离的图搜索问题研究 [A] . 王忠庆 . 2021

基于编辑距离的Web数据挖掘

摘要

著录项

相似文献

相关主题

期刊订阅