首页> 中国专利> 基于预训练语言模型的古今汉语自然语言处理方法

基于预训练语言模型的古今汉语自然语言处理方法

页面导航

摘要
著录项
相似文献

摘要

本发明公开了一种基于预训练语言模型的古今汉语自然语言处理方法，包括：将中文语料(文言文或白话文)输入到预训练语言模型；根据语料类型分别进行不同的预训练任务，以捕获多层级语义信息，获取文本表示；将生成的语料表示输入卷积层，得到更多可学习的表示；通过开关机制切换路径，根据语料类型选择通过句子级聚合或更新门以进一步优化表示；输出最终的中文语料表示。本发明能够充分利用文言文和白话文的特点执行不同的预训练任务，并且可以通过开关机制灵活调整模型结构，以根据语料类型采取不同方法优化语料表示，有效地捕获古今汉语的语料特征，在文言文和白话文的多项自然语言处理任务中实现了更高的准确率和召回率，具有良好的实用性。

著录项

公开/公告号CN113657119A

专利类型发明专利
公开/公告日2021-11-16

原文格式PDF
申请/专利权人天津大学;
展开▼

申请/专利号CN202110957080.X
发明设计人王鑫;季紫荆;
展开▼

申请日2021-08-19
分类号G06F40/30(20200101);G06F40/216(20200101);G06N3/04(20060101);G06N3/08(20060101);
代理机构12201 天津市北洋有限责任专利代理事务所;
代理人李丽萍
地址 300072 天津市南开区卫津路92号
入库时间 2023-06-19 13:16:59

相似文献

专利
中文文献
外文文献

1. 基于预训练语言模型的古今汉语自然语言处理方法 [P] . 中国专利： CN113657119A . 2021-11-16
2. 基于人工智能的预训练语言模型的处理方法、装置及设备 [P] . 中国专利： CN113688245A . 2021-11-23
3. Labeled Knowledge Graph Based Priming Of A Natural Language Model Providing User Access To Programmatic Functionality Through Natural Language Input [P] . US2022036001A1 . 2022-02-03

机译：基于自然语言模型的基于自然语言模型的基于知识图的基于启动，通过自然语言输入提供用户访问程序化功能
4. Labeled knowledge graph based priming of a natural language model providing user access to programmatic functionality through natural language input [P] . US11151320B1 . 2021-10-19

机译：基于自然语言模型的基于自然语言模型的基于知识图的基于启动，通过自然语言输入提供用户访问程序化功能
5. Labeled Knowledge Graph Based Priming Of A Natural Language Model Providing User Access To Programmatic Functionality Through Natural Language Input [P] . US2021326532A1 . 2021-10-21

机译：基于自然语言模型的基于自然语言模型的基于知识图的基于启动，通过自然语言输入提供用户访问程序化功能