首页> 外国专利> XML database mixed structural-textual classification system

XML database mixed structural-textual classification system

机译:XML数据库混合结构文本分类系统

摘要

One aspect of the present invention is a system for classifying element nodes in a subtree-structured XML database. The XQE structural-textual classification system is sensitive to both the textual resemblance between document elements as well as the structural resemblance between document elements. The XQE structural-textual classification system might use the XQE parent-child index described in Lindblad II-A for the purpose of forming vectors of “terms” which encode both the structural and the textual content of XML elements. The element vectors are processed by a classifier to create class prototype vectors which can be used to classify elements as they are added to the database.
机译:本发明的一个方面是一种用于对子树结构的XML数据库中的元素节点进行分类的系统。 XQE结构文本分类系统对文档元素之间的文本相似性以及文档元素之间的结构相似性都敏感。 XQE结构文本分类系统可以使用Lindblad II-A中描述的XQE父子索引来形成“术语”向量。对XML元素的结构和文本内容进行编码。元素向量由分类器处理,以创建类原型向量,可在将元素添加到数据库时对它们进行分类。

著录项

  • 公开/公告号US2004103091A1

    专利类型

  • 公开/公告日2004-05-27

    原文格式PDF

  • 申请/专利权人 CERISENT CORPORATION;

    申请/专利号US20030461935

  • 发明设计人 PAUL PEDERSEN;CHRISTOPHER LINDBLAD;

    申请日2003-06-13

  • 分类号G06F17/30;

  • 国家 US

  • 入库时间 2022-08-21 23:19:58

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号