首页> 外文会议>International Conference on e-Science >CHIC - Converting Hamburgers Into Cows
【24h】

CHIC - Converting Hamburgers Into Cows

机译:别致 - 将汉堡转换成奶牛

获取原文

摘要

We have developed a methodology and workflow (GHIC) for the automatic semantification and structuring of legacy textual scientific documents. CHIC imports common document formats (PDF, DOCX and (X) HTML) and uses a number of toolkits to extract components and convert them into SciXML. This is sectioned into text-rich and data-rich streams and stand-off annotation (SAF) is created for each. Embedded domain specific objects can be converted into XML (Chemical Markup Language). The different workflow streams can then be recombined and typically converted into RDF (Resource Description Format).
机译:我们已经开发了一种方法和工作流程(GHIC),用于自动学习和遗留文本科学文件的结构化。 CHIC导入公共文档格式(PDF,DOCX和(X)HTML)并使用许多工具包来提取组件并将其转换为SCIXML。这将分为富含文本和富有的数据流和脱离注释(SAF)。嵌入式域特定对象可以转换为XML(化学标记语言)。然后可以重组不同的工作流程流并通常被转换为RDF(资源描述格式)。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号