首页> 中文学位 >高校机构名称归一化研究
【6h】

高校机构名称归一化研究

代理获取

目录

第一章 引言

1.1 研究背景和意义

1.2国内外研究综述

1.3研究内容

1.4研究方法

1.5创新之处

第二章 构建机构名称特征词表

2.1机构名称的命名规则

2.2构建特征词表

2.3机构名称识别

第三章 机构名称归一化研究

3.1概述

3.2聚类中心的生成

3.3围绕聚类中心抱团

3.4建立机构规范名-别名映射表

3.5相似度算法的选择

3.6建设原则

第四章 实验分析

4.1数据来源及实验环境

4.2机构数据预处理

4.3提取目标数据

4.4机构名称归一

4.5实验结果分析

第五章 应用场景

第六章 总结

参考文献

致谢

个人简况及联系方式

声明

展开▼

摘要

机构名称归一是将机构全部名称形式以及属性信息有序汇集起来、梳理机构组织构造的一种方法,可有效解决信息检索、计量评价等科研活动中机构名称著录混乱、层级结构模糊的瓶颈问题。新兴机构的泛起,传统机构的淘汰、更名、拆分、重组与归并,使同一机构存在一个乃至多个曾用名、相似名称,加之机构全称、机构简称以及不规范的机构名称书写形式等交替使用,导致现有机构名称识别度降低、从属机构和相关机构的组织结构模糊,为机构名称为联接点的信息检索、统计分析、计量评价等活动造成严重困扰,继而影响检索效率及统计分析、计量评价的可信度。本文以我国高校机构为研究对象,对机构的名称从词性统计与构词方式两方面进行分析总结命名规则,根据命名规则构建机构特征词表,并基于学术论文数据库中作者所在机构数据,探索机构名称识别、机构名称归一。在此基础上将同一实体的不同演化名称进行归一,最后通过检全率和检准率对实验结果进行分析,为建立机构规范名-别名映射表提供依据。为解决机构名称著录混乱、关联关系模糊等问题寻求一条行之有效的解决途径。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号