首页> 美国卫生研究院文献>Scientific Data >Cross-Linguistic Data Formats advancing data sharing and re-use in comparative linguistics
【2h】

Cross-Linguistic Data Formats advancing data sharing and re-use in comparative linguistics

机译:跨语言数据格式促进比较语言学中的数据共享和重用

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

The amount of available digital data for the languages of the world is constantly increasing. Unfortunately, most of the digital data are provided in a large variety of formats and therefore not amenable for comparison and re-use. The Cross-Linguistic Data Formats initiative proposes new standards for two basic types of data in historical and typological language comparison (word lists, structural datasets) and a framework to incorporate more data types (e.g. parallel texts, and dictionaries). The new specification for cross-linguistic data formats comes along with a software package for validation and manipulation, a basic ontology which links to more general frameworks, and usage examples of best practices.
机译:世界语言可用的数字数据量在不断增加。不幸的是,大多数数字数据是以各种各样的格式提供的,因此不适合进行比较和重复使用。跨语言数据格式倡议为历史和类型语言比较中的两种基本数据类型(单词列表,结构数据集)提出了新标准,并提出了合并更多数据类型的框架(例如,平行文本和字典)。跨语言数据格式的新规范随附用于验证和操作的软件包,链接到更多通用框架的基本本体以及最佳实践的使用示例。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利