首页> 中国专利> 基于中医古籍文献的中医命名实体识别方法及识别系统

基于中医古籍文献的中医命名实体识别方法及识别系统

摘要

本发明提供了一种基于中医古籍文献的中医命名实体识别方法及系统,用以解决中医命名实体的识别问题。所述方法在获取中医古籍文献语料的基础上进行数据清理,再进行语言模型预训练;通过对语料进行序列标注,形成后续模型的训练集;基于序列标注的模型训练集,将语言模型作为编码层,将神经网络结构作为解码层,训练序列标注模型,从而基于序列标注模型进行中医命名实体识别。本发明结合现有的语言训练模型,如Google提出的语言模型预训练方法bert,基于小样本训练集节省了人工标注的成本,提高了识别效果及准确率,易操作,实现对中医古籍文献,尤其是中医古籍医案的有效和全面利用,为中医领域研究打下了良好的基础。

著录项

  • 公开/公告号CN110134953B

    专利类型发明专利

  • 公开/公告日2020-12-18

    原文格式PDF

  • 申请/专利权人 北京科技大学;

    申请/专利号CN201910367376.9

  • 申请日2019-05-05

  • 分类号G06F40/295(20200101);G06F16/951(20190101);

  • 代理机构11237 北京市广友专利事务所有限责任公司;

  • 代理人张仲波

  • 地址 100083 北京市海淀区学院路30号

  • 入库时间 2022-08-23 11:25:43

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号