首页> 中国专利> 一种用于情报快速整编的中文文本分类方法

一种用于情报快速整编的中文文本分类方法

页面导航

摘要
著录项
相似文献

摘要

本发明公开了一种用于情报快速整编的中文文本分类方法，包括将每个字符和输入词转换为向量，对于具有多重感觉的字符和单词，通过共同学习词语和感觉来获得多重感觉嵌入；利用三个LSTM单元来融合多种字符意义、多种单词意义以及字符级和单词级特征，获得双向隐藏向量序列，并馈送到字符级注意模块产生句子级特征向量，将最终表示传输到完全连接层中以计算每种类型的置信度得分；以交叉熵损失为目标函数，迭代优化模型中的参数直至收敛；生成用户情报产品。在三个中文文本分类基准数据集上，本发明取得了超越基线的优异分类准确率，有效解决了中文分词的歧义性带来的负面影响，运行简单高效，模型复杂性远低于BERT类模型。

著录项

公开/公告号CN112948588B

专利类型发明专利
公开/公告日2021-07-30

原文格式PDF
申请/专利权人中国人民解放军国防科技大学;
展开▼

申请/专利号CN202110509222.6
发明设计人郭爱博;赵翔;庞宁;谭真;王吉;李硕豪;张军;
展开▼

申请日2021-05-11
分类号G06F16/35(20190101);G06N3/04(20060101);G06N3/08(20060101);
代理机构43236 长沙大珂知识产权代理事务所(普通合伙);
代理人伍志祥
地址 410073 湖南省长沙市开福区德雅路109号
入库时间 2022-08-23 12:12:54

相似文献

专利
中文文献
外文文献

1. 一种用于情报快速整编的中文文本分类方法 [P] . 中国专利： CN112948588B . 2021.07.30
2. 一种基于中文文本分类的情报快速整编方法 [P] . 中国专利： CN113177120A . 2021-07-27
3. Similarity index: a rapid classification method for multivariate data arrays [P] . 美国专利： US7983874B2 . 2011-07-19

机译：相似指数：一种用于多元数据数组的快速分类方法
4. Similarity index: a rapid classification method for multivariate data arrays [P] . 美国专利： US2009306932A1 . 2009-12-10

机译：相似指数：一种用于多元数据数组的快速分类方法
5. Method for rapid detection and identification of one or more target microorganisms living in a sample; a device for rapid detection and identification of one or more target microorganisms living in a.Oyster; and test kit for rapid detection and identification of one or more target microorganisms living in a sample for use in the method. [P] . BR112014017336A8 . 2017-06-13

机译：快速检测和鉴定样品中一种或多种目标微生物的方法;一种用于快速检测和鉴定牡蛎中生活的一种或多种目标微生物的设备;用于快速检测和鉴定样品中生活的一种或多种目标微生物的检测试剂盒，用于该方法。