首页> 外文会议>e-Science, 2009. e-Science '09 >CHIC - Converting Hamburgers into Cows
【24h】

CHIC - Converting Hamburgers into Cows

机译:CHIC-将汉堡包变成奶牛

获取原文

摘要

We have developed a methodology and workflow (CHIC) for the automatic semantification and structuring of legacy textual scientific documents. CHIC imports common document formats (PDF, DOCX and (X)HTML) and uses a number of toolkits to extract components and convert them into SciXML. This is sectioned into text-rich and data-rich streams and stand-off annotation (SAF) is created for each. Embedded domain specific objects can be converted into XML (Chemical Markup Language). The different workflow streams can then be recombined and typically converted into RDF (Resource Description Format).
机译:我们已经开发出一种方法和工作流程(CHIC),用于自动对遗留的文本科学文献进行语义化和结构化。 CHIC导入常见的文档格式(PDF,DOCX和(X)HTML),并使用许多工具包提取组件并将其转换为SciXML。将其分为文本丰富的流和数据丰富的流,并为每个流创建隔离注释(SAF)。嵌入式领域特定的对象可以转换为XML(化学标记语言)。然后可以将不同的工作流重新组合,并通常转换为RDF(资源描述格式)。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号