首页> 中国专利> 一种基于众包反馈和主动学习的文本分类模型优化方法

一种基于众包反馈和主动学习的文本分类模型优化方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种基于众包反馈和主动学习的文本分类模型优化方法，包括：选取文本数据集，将文本数据集分为初始训练集和剩余数据集；从文本数据集中获得词；构建文本数据集的特征集，向量化文本数据集；在分类模型上引入主动学习，预测已向量化的文本数据集的情感极性，结合众包反馈信息优化模型获得文本分类结果。本发明利用众包收集人工标注理由，获取更多用户信息，挖掘人的主观感受，并以更改权重的方式将众包反馈信息融入模型中，优化文本分类模型，从而提升模型分类性能。本发明还引入主动学习算法，挑选最有价值的标注样本交由众包平台进行标注，从而降低标注成本，在有限的预算下，提高标注准确率，解决缺少含标签数据的文本分类任务的难题。

著录项

公开/公告号CN107169001A

专利类型发明专利
公开/公告日2017-09-15

原文格式PDF
申请/专利权人华东师范大学;
展开▼

申请/专利号CN201710205306.4
发明设计人杨静;陈博闻;江雨;
展开▼

申请日2017-03-31
分类号G06F17/30(20060101);
代理机构31257 上海麦其知识产权代理事务所(普通合伙);
代理人董红曼
地址 200062 上海市普陀区中山北路3663号
入库时间 2023-06-19 03:21:52

法律信息

法律状态公告日

法律状态信息

法律状态
2017-10-17

实质审查的生效 IPC(主分类):G06F17/30 申请日:20170331

实质审查的生效
2017-09-15

公开

公开

相似文献

专利
中文文献
外文文献

1. 一种基于众包反馈和主动学习的文本分类模型优化方法 [P] . 中国专利： CN107169001A . 2017-09-15
2. 一种基于主动学习的众包机制辅助排序方法和系统 [P] . 中国专利： CN109902756A . 2019-06-18
3. METHOD FOR RESTRICTING THE SEARCH AREA OF A MODEL-BASED ONLINE OPTIMIZATION METHOD FOR PREDICTING A STATE VARIABLE OF A VEHICLE [P] . 欧洲知识产权局专利： EP3072769A3 . 2017-04-12

机译：一种基于模型的在线优化方法来限制车辆的状态变量，该方法用于预测车辆的状态变量
4. METHOD FOR RESTRICTING THE SEARCH AREA OF A MODEL-BASED ONLINE OPTIMIZATION METHOD FOR PREDICTING A STATE VARIABLE OF A VEHICLE [P] . 欧洲知识产权局专利： EP3072769A2 . 2016-09-28

机译：一种基于模型的在线优化方法来限制车辆的状态变量，该方法用于预测车辆的状态变量
5. Device for reducing phantom pain during amputate, has computing device for controlling model of amputee member based on movement of member, and feedback device for producing feedback based on computed movements of model [P] . 德国专利： DE102010006301A1 . 2011-04-21

机译：用于减少截肢过程中幻影疼痛的装置，具有用于基于被截肢者的运动来控制截肢者模型的计算装置，以及用于基于所计算出的模型的运动来产生反馈的反馈装置