首页> 中国专利> 基于改进seq2seq模型的多源多标签文本分类方法及其系统

基于改进seq2seq模型的多源多标签文本分类方法及其系统

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明属于自然语言处理文本分类技术领域，具体提供了一种基于改进seq2seq模型的多源多标签文本分类方法及其系统，该方法包括如下步骤：数据输入及预处理、词嵌入、编码、编码拼接、解码、模型优化以及预测输出。本发明方法具有如下有益效果：采用seq2seq深度学习框架，构建多个编码器，结合注意力机制用于文本分类任务，最大限度地利用了多来源语料信息，提高了多标签分类准确性；在解码步骤的误差反馈过程中，针对多标签文本的特性，加入干预机制规避了标签排序带来的影响，更多切合多标签分类问题的本质；编码器采用循环神经网络，可以有效的按照时间步进行学习；解码层采用单向循环神经网络，并添加了注意力机制，突出了学习重点。

著录项

公开/公告号CN109299273B

专利类型发明专利
公开/公告日2020-06-23

原文格式PDF
申请/专利权人广州语义科技有限公司;
展开▼

申请/专利号CN201811302126.9
发明设计人谢松县;高辉;陈仲生;彭立宏;曾道建;桂林;封黎;李磊;
展开▼

申请日2018-11-02
分类号G06F16/35(20190101);G06F40/289(20200101);G06N3/04(20060101);G06N3/08(20060101);
代理机构43225 长沙国科天河知识产权代理有限公司;
代理人邱轶
地址 510623 广东省广州市天河区珠江东路32号利通广场规划设计楼32层全层单元(自编楼层34层全层单元)的E37房
入库时间 2022-08-23 11:02:52

法律信息

法律状态公告日

法律状态信息

法律状态
2020-06-23

授权

授权
2019-03-01

实质审查的生效 IPC(主分类):G06F16/35 申请日:20181102

实质审查的生效
2019-02-01

公开

公开

相似文献

专利
中文文献
外文文献

1. 基于改进seq2seq模型的多源多标签文本分类方法及其系统 [P] . 中国专利： CN109299273B . 2020.06.23
2. 基于改进seq2seq模型的多源多标签文本分类方法及其系统 [P] . 中国专利： CN109299273A . 2019-02-01
3. The system and method based on computer for the development of monolingual documents systems based computer to translate text input in language source for a foreign language and to desInvolvement of documents mono and multilingual translation method based on the computer to translate the text in the language source for a language estrageira method based on computer for developmentThe documents mono and multilingual translation and domain model tripartite [P] . BR9307175A . 1999-03-30

机译：用于开发单语文档的基于计算机的系统和方法基于计算机的系统，用于翻译外语源中的文本输入，并且基于计算机的单，多语翻译方法涉及用于翻译语言源中的文本的计算机。一种基于计算机的语言开发方法用于文档开发单，多语言翻译和领域模型三方
4. SEMANTIC REPRESENTATION MODEL-BASED TEXT CLASSIFICATION METHOD AND APPARATUS, AND COMPUTER DEVICE [P] . WO2021051503A1 . 2021-03-25

机译：基于语义表示模型的文本分类方法和装置，以及计算机设备
5. TEXT DATA CLASSIFICATION METHOD AND APPARATUS BASED ON NEURAL NETWORK MODEL, AND STORAGE MEDIUM [P] . WO2021051518A1 . 2021-03-25

机译：基于神经网络模型的文本数据分类方法和装置和存储介质