首页> 外文会议>人文科学とコンピュータシンポジウム(じんもんこん2018)論文集 >日本語文献史料の構造化記述のための軽量マークァップ言語の開発
【24h】

日本語文献史料の構造化記述のための軽量マークァップ言語の開発

机译:开发用于日本文学的结构化描述的轻量标记语言

获取原文
获取原文并翻译 | 示例

摘要

歴史文献史料を構造化されたデータとして扱うためには,何らかの機械処理可能なマークアップ言語を用いて翻刻文を記述することが望ましい.加えて人文学研究者やクラウドソーシング参加者が利 用するためには,そのような言語は簡潔かつ可読性の高い文法で記述される必要がある.そこで,古文書や古記録,古典籍といった日本語文献史料を記述するための軽量マークァップ言語を開発した.この言語の文法を形式文法のひとつである解析表現文法によって定義し,また縦書き入力やシンタックスハイライトに対応したオンラインエディタを開発した.このような入力負荷の低いマークアップ 言語が普及することで,クラウドソーシングによる史料翻刻や,文献史料のデータベース化が効率的に進むことが期待される.%In order to process historical documents as semi-structured data, it is desirable that the transcriptions of those documents are encoded with some sort of machine-readable markup languages. In addition, for the use by humanities scholars and crowdsourcing project participants, such a language needs to have concise and readable grammars. Koji is a light-weight markup language that we have developed for the encoding of pre-modern Japanese documents. It has a simple and readable syntax prescribed with Parsing Expression Grammars (PEG), a type of analytical formal grammars. We also developed a web-based editor for Koji that supports syntax highlighting, snippet insertion, and so on.
机译:为了将历史文档视为结构化数据,需要使用某种机器可处理的标记语言来描述音译,此外,它还被人文研究人员和众包参与者使用。为此,需要以一种简单易懂的语法来编写这种语言,因此我们开发了一种轻量级的标记语言,用于编写历史文档,例如旧文档,旧记录和古典书籍。我们通过一种形式语法(解析表达式语法)定义了该语言的语法,并开发了一种支持垂直书写和语法突出显示的在线编辑器。为了将历史文档处理为半结构化数据,希望对这些文档的转录进行编码。此外,为了供人文学者和众包项目参与者使用,这种语言需要具有简洁易读的语法.Koji是我们为编码以下语言而开发的轻量级标记语言。日语的前现代文档。它具有解析形式语法(PEGs)所规定的简单易读的语法。我们还为Koji开发了基于网络的编辑器,支持语法突出显示,摘要插入等等。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号