首页> 中国专利> 一种基于相似度模型和FastText的多标签文本分类方法

一种基于相似度模型和FastText的多标签文本分类方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种基于相似度模型和FastText的多标签文本分类方法。适用于普遍的有监督文本标签预测问题。这种改进的文本标签预测算法主要是基于已经构建好的文本标签数据，结合了文本相似思想。对历史文本数据进行处理，首先使用隐马尔科夫链文本分词算法得到分完词的文本，再通过文本相似度算法提取文本相似项，查询历史数据得到文本标签，然后对分完词的文本进行FastText训练，得到最终文本标签的方法。本发明方法可有效获取一种准确度最高的文本标签并进行推荐，使文本多标签的预测更加准确，并增加了历史文本标签的使用价值。

著录项

公开/公告号CN108897815A

专利类型发明专利
公开/公告日2018-11-27

原文格式PDF
申请/专利权人淮阴工学院;
展开▼

申请/专利号CN201810635615.X
发明设计人周泓;王奔;朱全银;冯万利;李翔;范家宽;朱勐;
展开▼

申请日2018-06-20
分类号
代理机构南京苏高专利商标事务所(普通合伙);
代理人梁耀文
地址 223003 江苏省淮安市经济技术开发区枚乘东路1号
入库时间 2023-06-19 07:24:48

法律信息

法律状态公告日

法律状态信息

法律状态
2018-12-21

实质审查的生效 IPC(主分类):G06F17/30 申请日:20180620

实质审查的生效
2018-11-27

公开

公开

相似文献

专利
中文文献
外文文献

1. 一种基于相似度模型和FastText的多标签文本分类方法 [P] . 中国专利： CN108897815B . 2021.07.16
2. 一种基于图模型的深度学习多标签文本分类方法 [P] . 中国专利： CN113806547A . 2021-12-17
3. The system and method based on computer for the development of monolingual documents systems based computer to translate text input in language source for a foreign language and to desInvolvement of documents mono and multilingual translation method based on the computer to translate the text in the language source for a language estrageira method based on computer for developmentThe documents mono and multilingual translation and domain model tripartite [P] . BR9307175A . 1999-03-30

机译：用于开发单语文档的基于计算机的系统和方法基于计算机的系统，用于翻译外语源中的文本输入，并且基于计算机的单，多语翻译方法涉及用于翻译语言源中的文本的计算机。一种基于计算机的语言开发方法用于文档开发单，多语言翻译和领域模型三方
4. SEMANTIC REPRESENTATION MODEL-BASED TEXT CLASSIFICATION METHOD AND APPARATUS, AND COMPUTER DEVICE [P] . WO2021051503A1 . 2021-03-25

机译：基于语义表示模型的文本分类方法和装置，以及计算机设备
5. TEXT DATA CLASSIFICATION METHOD AND APPARATUS BASED ON NEURAL NETWORK MODEL, AND STORAGE MEDIUM [P] . WO2021051518A1 . 2021-03-25

机译：基于神经网络模型的文本数据分类方法和装置和存储介质