首页> 外文期刊>人工知能学会論文誌 >事例に基づくHTML文書からXML文書への半自動変換 - シリーズ型HTML文書における類似性の利用
【24h】

事例に基づくHTML文書からXML文書への半自動変換 - シリーズ型HTML文書における類似性の利用

机译:将基于案例的HTML文档半自动转换为XML文档-使用系列HTML文档中的相似之处

获取原文
获取原文并翻译 | 示例
       

摘要

本論文で提案する変換法では,まずシリーズ中の一つのHTML 文書を人手でXML 文書に変換する.次に,この2 つの文書を変換事例としてシステムに与え,シリーズの残りのHTML 文書を事例に従って自動変換するものである.システムを実装し,評価実験の結果,現実のWebサイトから収集した5 個のシリーズ,80 件のHTML 文書に対して,本提案手法は約80%を越える高い変換精度を持つことが確認した.筆者らの知る限りにおいて,現実のWeb サイト上のHTML 文書のシリーズ性に着目した研究は,これまでに全く無く,本研究が最初の試みと考えられる.本論文の構成は以下の通りである.まず2 章でHTMLとXML について概説し,3 章で事例に基づく変換法の概要を述べる.4 章から6 章で変換法の詳細を述べ,7 章で実験的評価を行う.8 章で関連研究を述べる.9 章は結論と今後の課題である.
机译:在本文提出的转换方法中,该系列中的一个HTML文档被手动转换为XML文档。接下来,将这两个文档作为转换示例提供给系统,然后根据示例自动转换系列中的其余HTML文档。作为实施该系统后的评估实验的结果,证实了该方法对于从实际网站收集的5系列和80个HTML文档具有较高的转换精度,大约超过80%。据作者所知,从未进行过针对实际网站上的HTML文档系列的研究,并且该研究被认为是首次尝试。本文的结构如下。首先,第2章概述HTML和XML,第3章概述基于案例的转换方法。转换方法的详细信息在第4章至第6章中进行了说明,在第7章中进行了实验评估。相关研究在第8章中进行了描述。第9章是结论和今后的工作。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号