【24h】

Author Gender Metadata Augmentation of HathiTrust Digital Library

机译:HathiTrust数字图书馆的作者性别元数据增强

获取原文
获取原文并翻译 | 示例

摘要

Bibliographic metadata is essential for digital libraryrnresource description. Especially as the size and number ofrnbibliographic entities grows, high-quality metadata enablesrnricher forms of digital library access, search, and use.rnMetadata records can be enriched through automatedrntechniques. For example, a digital humanities scholar mightrnuse the gender of a set of authors during their literaturernanalysis. In this study, we undertook to enrich the metadatarndescription of a large-scale digital library, the HathiTrustrn(HT) digital library, specifically by determining the genderrnof authors of the public domain portion of the collection.rnThe results are stored to a separate Solr index accessiblernthrough the HathiTrust Research Center services. Thisrnstudy, which successfully resolved in 78.9% of the casesrnthe gender of authors in the HT public domain corpus,rnsuggests future research directions in capturing andrnrepresenting the provenance of the contributing sources tornenhance trust, and in machine learning to resolve thernremaining names.
机译:书目元数据对于数字图书馆资源的描述至关重要。尤其是随着书目实体的规模和数量的增长,高质量的元数据可以使数字图书馆的访问,搜索和使用形式更加丰富。元数据记录可以通过自动化技术来丰富。例如,一位数字人文科学学者可能会在文献分析过程中使用一组作者的性别。在这项研究中,我们致力于丰富大型数字图书馆HathiTrustrn(HT)数字图书馆的元数据描述,特别是通过确定馆藏公共领域部分的社会性别作者来实现。结果存储在单独的Solr索引中通过HathiTrust研究中心服务可访问。这项研究成功地解决了HT公共领域语料库中作者性别的78.9%的案件,建议了未来的研究方向,以捕获和表示贡献信任来源的来源,并在机器学习中解决剩余的名称。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号