首页> 中国专利> 基于预训练语言模型的古今汉语自然语言处理方法

基于预训练语言模型的古今汉语自然语言处理方法

摘要

本发明公开了一种基于预训练语言模型的古今汉语自然语言处理方法,包括:将中文语料(文言文或白话文)输入到预训练语言模型;根据语料类型分别进行不同的预训练任务,以捕获多层级语义信息,获取文本表示;将生成的语料表示输入卷积层,得到更多可学习的表示;通过开关机制切换路径,根据语料类型选择通过句子级聚合或更新门以进一步优化表示;输出最终的中文语料表示。本发明能够充分利用文言文和白话文的特点执行不同的预训练任务,并且可以通过开关机制灵活调整模型结构,以根据语料类型采取不同方法优化语料表示,有效地捕获古今汉语的语料特征,在文言文和白话文的多项自然语言处理任务中实现了更高的准确率和召回率,具有良好的实用性。

著录项

  • 公开/公告号CN113657119A

    专利类型发明专利

  • 公开/公告日2021-11-16

    原文格式PDF

  • 申请/专利权人 天津大学;

    申请/专利号CN202110957080.X

  • 发明设计人 王鑫;季紫荆;

    申请日2021-08-19

  • 分类号G06F40/30(20200101);G06F40/216(20200101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构12201 天津市北洋有限责任专利代理事务所;

  • 代理人李丽萍

  • 地址 300072 天津市南开区卫津路92号

  • 入库时间 2023-06-19 13:16:59

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号