首页> 外文期刊>Bulletin des Bibliotheques de France >La gestion informatisee de corpus bibliographiques: adaptation des normes et formats documentaires
【24h】

La gestion informatisee de corpus bibliographiques: adaptation des normes et formats documentaires

机译:书目语料库的计算机化管理:标准和文献格式的改编

获取原文
获取原文并翻译 | 示例
           

摘要

L'utilisation d'un corpus documentaire par des chercheurs a des fins d'edition de references bibliographiques et d'analyse bibliometrique de leur domaine de recherche doit donc etre precedee d'une phase de normalisation de la structure des notices; d'une phase de normalisation du contenu des champs; d'une phase de dedoublonnage des notices. A chaque etape du traitement s'operent des choix qui peuvent etre fondes sur des normes documentaires. Nous nous proposons ici de passer en revue les diverses normes existantes et d'en etudier leur adaptation a la gestion informatisee d'un corpus, alimente et consulte par les chercheurs eux-memes. Seront exposees les solutions retenues dans le cadre de l'elaboration d'une base documentaire sur le stress professionnel a l'INRS (Institut national de recherche et de securite). Nous avons interroge huit BDD sur cederom. Trois proviennent du domaine biomedical: Medline et Biosis (Etats-Unis), EMBase (Pays-Bas). Trois autres sont specialisees en securite et hygiene au travail: IOSHTIC (Etats-Unis), Cisilo (Suisse), INRS-B (France). Une BDD est specialisee en psychologie, PsycLIT (Etats-Unis), et une autre est pluridisciplinaire, Pascal (France). Les equations de recherche ont ete adaptees a chacune des bases interrogees, en raison de la diversite de leurs langages d'indexation respectifs. Au total, 27 000 notices bibliographiques ont ainsi ete rassemblees. Nous avons developpe une application specifique, denommee WebStress, qui permet le reformatage des donnees et le dedoublonnage des notices, d'une part; l'exploration hypertextuelle de la base documentaire dans une interface Web, d'autre part (30). NORMALISATION DE LA STRUCTURE DES NOTICES Chaque base dispose d'une structure specifique, constituee d'un nombre variable de champs. Ainsi, sur les huit BDD interrogees, nous avons recense un total de 197 champs, ce qui fait une moyenne de 24 champs par base.
机译:因此,研究人员在使用文献语料库以编辑书目参考文献和对其研究领域进行文献计量分析之前,必须先进行记录结构标准化阶段;领域内容标准化的阶段;重复数据删除阶段。在处理的每个阶段,都可以基于文档标准进行选择。我们建议在这里审查各种现有标准,并研究它们对语料库计算机化管理的适应性,这些标准由研究人员自己提供和咨询。将介绍在国家研究与安全研究所(INRS)建立基于职业压力的文献基础的框架内采用的解决方案。我们在CD-ROM上查询了八个BDD。三个来自生物医学领域:Medline和Biosis(美国),EMBase(荷兰)。另外三个专门从事职业安全和卫生方面的工作:IOSHTIC(美国),Cisilo(瑞士),INRS-B(法国)。一个数据库是心理学专业数据库PsycLIT(美国),另一个是多学科数据库Pascal(法国)。由于各自的索引语言的多样性,搜索方程式适用于所查询的每个数据库。因此,总共收集了27,000个书目记录。我们已经开发了一个名为WebStress的特定应用程序,该应用程序一方面可以重新格式化数据并删除记录的重复数据,另一方面,它还可以使数据重新格式化。另一方面,在Web界面中对文档库的超文本浏览(30)。标准化通知结构每个数据库都有特定的结构,由可变数量的字段组成。因此,在所质疑的八个数据库中,我们总共确定了197个字段,平均每个碱基有24个字段。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号