基于WEB网页文本信息抽取研究与实现

首页> 外文期刊>Hans Journal of Data Mining >基于WEB网页文本信息抽取研究与实现

【24h】

基于WEB网页文本信息抽取研究与实现

机译：基于WEB网页文本信息抽取研究与实现

获取原文

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

本文以传统的信息抽取理论和方法为基础，实现了一种基于XML特征的网页文本抽取方法。研究了一般网页的特征，实现了一种基于XML标签特征的网页提取方法，对网页进行HTML页面标准化，将其转成XML语言，并且根据XML语言的特点，对其内部语言进行转化，从GB转为UTF，并对其进行标准化，然后通过熟悉XML标签的各种特性，对网页文本根据标签进行抽取。

机译：本文以传统的信息抽取理论和方法为基础，实现了一种基于XML特征的网页文本抽取方法。研究了一般网页的特征，实现了一种基于XML标签特征的网页提取方法，对网页进行HTML页面标准化，将其转成XML语言，并且根据XML语言的特点，对其内部语言进行转化，从GB转为UTF，并对其进行标准化，然后通过熟悉XML标签的各种特性，对网页文本根据标签进行抽取。

著录项

来源
《Hans Journal of Data Mining》 |2015年第5期|共6页
作者

展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种
中图分类计算技术、计算机技术;
关键词
入库时间 2022-08-18 15:31:02

相似文献

外文文献
中文文献
专利

1. 基于领域模式的Web数据抽取与集成系统研究与实现 [J] . Computer Science and Application . 2016,第6期

机译：基于领域模式的Web数据抽取与集成系统研究与实现
2. 面向HDL描述基于程序切片的自动电路抽取技术研究与实现 [J] . TunLi, YangGuo, Si-KunLi 计算机科学技术学报：英文版 . 2004,第C00期

机译：面向HDL描述基于程序切片的自动电路抽取技术研究与实现
3. 基于认知型行为分析的驾驶规则抽取 [J] . 赵宇橙, 梁军, 陈龙, 中南大学学报（英文版） . 2020,第001期

机译：基于认知型行为分析的驾驶规则抽取
4. 一种基于启发式群聚算法的机器人全局任务调度策略研究与实现A Heuristic Clustering Algorithm Based on Dynamical Scheduling Strategy for the Global Task Control of Robot） [C] . Chinese Control Conference vol.2; 20040810-13; Wuxi(CN) . 2004

机译：一种基于启发式群聚算法的机器人全局任务调度策略研究与实现A Heuristic Clustering Algorithm Based on Dynamical Scheduling Strategy for the Global Task Control of Robot）
5. Tactile Sensing, Information, and Feedback via Wave Propagation =基于波传播的触觉传感，信息，和反馈 [D] . Shao, Yitian. 2020

机译：Tactile Sensing, Information, and Feedback via Wave Propagation =基于波传播的触觉传感，信息，和反馈
6. 健康适能评定量表的常模构建：基于对中国5782名城市老年人调查 [O] . 黄晨 (Chen HUANG), *, 刘倩 (Qian LIU), 2021

机译：健康适能评定量表的常模构建：基于对中国5782名城市老年人调查
7. 基于GIS的农村宅基地建库研究与实现 [O] . 桂梅刘 2019

机译：基于GIS的农村宅基地建库研究与实现

基于WEB网页文本信息抽取研究与实现

摘要

著录项

相似文献

相关主题

期刊订阅