首页> 外文会议>Advanced Workshop on Content Computing >Categorizing XML Documents Based on Page Styles
【24h】

Categorizing XML Documents Based on Page Styles

机译:根据页面样式对XML文档进行分类

获取原文

摘要

The self-describing feature of XML offers both challenges and opportunities in information retrieval, document management, and data mining. To process and manage XML documents effectively on XML data server, database, Electronic Document Management System(EDMS) and search engine, we have to develop a new technique for categorizing large XML documents automatically. In this paper, we propose a new methodology for categorizing XML documents based on page style by taking account of meanings of the elements and nested structures of XML. Accurate categorization of XML documents by page styles provides an important basis for a variety of applications of managing and processing XML. Experiments with Yahoo! pages show that our methodology provides almost 100% accuracy in categorizing XML documents by page styles.
机译:XML的自我描述特征提供信息检索,文档管理和数据挖掘中的挑战和机遇。 要在XML数据服务器,数据库,电子文档管理系统(EDMS)和搜索引擎上有效地处理和管理XML文档,我们必须开发一种自动对大型XML文档进行分类的新技术。 在本文中,我们提出了一种新的方法,用于通过考虑XML元素和嵌套结构的含义来基于页面样式对XML文档进行分类。 通过Page Styes准确分类XML文档为管理和处理XML的各种应用提供了重要依据。 雅虎的实验! 页面表明,我们的方法通过Page Styes对XML文档进行分类,提供了几乎100%的准确性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号