要解决的问题:实现一种结构化文档转换设备,通过该结构化文档转换设备,可以提高结构化文档的文档处理效率,而不会丢失可用于结构化文档转换的文档信息(文本)。解决方案:结构化文档转换装置包括:结构分析部32,其分析结构化文档的结构以准备树结构,该树结构包括指定元素的每个节点和文本的父子关系的层次信息;以及树结构转换部分36通过基于树结构提取文本节点来减少结构化文档的层次结构数量。
版权:(C)2005,JPO&NCIPI
公开/公告号JP2004280576A
专利类型
公开/公告日2004-10-07
原文格式PDF
申请/专利权人 SEIKO EPSON CORP;
申请/专利号JP20030072369
发明设计人 NIWA TAKAMASA;
申请日2003-03-17
分类号G06F17/21;G06F12/00;
国家 JP
入库时间 2022-08-21 23:30:09