首页> 外文会议>Workshop on processing historical language 2017 >The Making of the Royal Society Corpus
【24h】

The Making of the Royal Society Corpus

机译:皇家学会语料库的建立

获取原文
获取原文并翻译 | 示例

摘要

The Royal Society Corpus is a corpus of Early and Late modern English built in an agile process covering publications of the Royal Society of London from 1665 to 1869 (Kermes et al., 2016) with a size of approximately 30 million words. In this paper we will provide details on two aspects of the building process namely the mining of patterns for OCR correction and the improvement and evaluation of part-of-speech tagging.
机译:皇家学会语料库是一种早期和晚期现代英语语料库,以敏捷的方式构建,涵盖了1665至1869年伦敦皇家学会的出版物(Kermes等,2016),大小约为3,000万字。在本文中,我们将提供有关构建过程两个方面的详细信息,即用于OCR校正的模式挖掘以及词性标记的改进和评估。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号