...
首页> 外文期刊>電子情報通信学会論文誌 >データ処理性能を改善するXML文書のコンパクト化法の開発
【24h】

データ処理性能を改善するXML文書のコンパクト化法の開発

机译:开发XML文档压缩方法以提高数据处理性能

获取原文
获取原文并翻译 | 示例

摘要

XML(Extensible Markup Language)は,国際標準の電子データ表現形式であり,柔軟で拡張性が高いが,反面,そのデータ処理は主記憶メモリを大量に消費し,負荷が重い.大容量のXML文書のデータ処理で,この課題を解決するため,本論文では,レコード構成のXML文書に対して形式変換によってデータ処理性能を改善する方法「XML CSV圧縮」を提案する.この方法は,データ処理に先立って,XML文書中でアクセス面から冗長な複数の要素をCSV(Comma Separated Values)形式でまとめる.本方法を評価した結果,CSV形式でまとめて削減した要素割合にほぼ比例して,メモリ消費量や展開時間を改善できることを確認した.本方法はXML文書の可逆変換であり,種々のプログラミング言語で実行できるように,XSLT(Extensible Style-sheet Language Transformations)で実行するソフトウェアを作成した.本方法では,レコード中でCSV形式にまとめる要素を指定する仕様を作成する必要があり,この作成作業に最も手間がかかる.そこで,この仕様をGUIで簡単に作成できる支援ツールを作成した.これらの開発により,本方法において,階層構造が複雑な文書や,多数の要素をもつ文書でも,実用的に扱えるようになった.
机译:XML(可扩展标记语言)是一种国际标准的电子数据表示格式,具有很高的灵活性和高度可扩展性,但是另一方面,其数据处理消耗大量的主内存并负担很重。为了解决大容量XML文档数据处理中的这一问题,本文提出了一种“ XML CSV压缩”方法,该方法通过记录结构化XML文档的格式转换来提高数据处理性能。在这种方法中,在处理数据之前,将XML文档中访问侧多余的多个元素以CSV(逗号分隔值)格式放在一起。作为对该方法进行评估的结果,证实了可以与CSV格式中共同减少的元素的比例几乎成比例地改善存储器消耗和显影时间。此方法是XML文档的可逆转换,并且我们创建了可以在XSLT(可扩展样式表语言转换)中执行的软件,以便可以在各种编程语言中执行该软件。在这种方法中,有必要创建一个规范,该规范指定记录中要以CSV格式分组的元素,并且此创建工作需要最多的工作。因此,我们创建了一个支持工具,可以使用GUI轻松创建此规范。随着这些发展,这种方法使得实际上可以处理具有复杂的层次结构的文档和具有许多元素的文档。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号