...
首页> 外文期刊>電子情報通信学会論文誌, D. 情報·システム >データ処理性能を改善するXML文書のコンパクト化法の開
【24h】

データ処理性能を改善するXML文書のコンパクト化法の開

机译:打开一种压缩XML文档的方法,以提高数据处理性能

获取原文
获取原文并翻译 | 示例
           

摘要

XML(Extensible Markup Language)は,国際標準の電子データ表現形式であり,柔軟で拡張性が高いが,反面,そのデータ処理は主記憶メモリを大量に消費し,負荷が重い.大容量のXML文書のデータ処理で,この課題を解決するため,本論文では,レコード構成のXML文書に対して形式変換によってデータ処理性能を改善する方法「XML CSV圧縮」を提案する.この方法は,データ処理に先立って,XML文書中でアクセス面から冗長な複数の要素をCSV(Comma Separated Values)形式でまとめる.本方法を評価した結果,CSV形式でまとめて削減した要素割合にほぼ比例して,メモリ消費量や展開時間を改善できることを確認した.本方法はXML文書の可逆変換であり,種々のプログラミング言語で実行できるように,XSLT(Extensible Style-sheet Language Transformations)で実行するソフトウェアを作成した.本方法では,レコード中でCSV形式にまとめる要素を指定する仕様を作成する必要があり,この作成作業に最も手間がかかる.そこで,この仕様をGUIで簡単に作成できる支援ツールを作成した.これらの開発により,本方法において,階層構造が複雑な文書や,多数の要素をもつ文書でも,実用的に扱えるようになった.
机译:XML(可扩展标记语言)是一种国际标准的电子数据表示格式,具有灵活性和高度可扩展性,但是另一方面,其数据处理消耗大量的主存储内存,并且很繁重。为了解决大容量XML文档数据处理中的这一问题,本文提出了“ XML CSV压缩”,这是一种通过对具有记录结构的XML文档进行格式转换来提高数据处理性能的方法。在这种方法中,在进行数据处理之前,将XML文档中在访问方面冗余的多个元素组合为CSV(逗号分隔值)格式。作为对该方法进行评估的结果,证实了可以与CSV格式中共同减少的元素的比例几乎成比例地改善存储器消耗和扩展时间。该方法是XML文档的可逆转换,并且我们已经创建了使用XSLT(可扩展样式表语言转换)执行该软件的软件,以便可以以各种编程语言执行该方法。在这种方法中,有必要创建一个规范,该规范指定记录中要以CSV格式汇总的元素,而此创建工作最麻烦。因此,我们创建了一个支持工具,使您可以使用GUI轻松创建此规范。通过这些发展,该方法使得实际上可以处理具有复杂层次结构的文档和具有许多元素的文档。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号