首页> 中国专利> 一种考虑语义背景的短文本分类器构造方法

一种考虑语义背景的短文本分类器构造方法

摘要

本发明公开一种考虑语义背景的短文本分类器构造方法。包括:收集短文本样本集,记录每个样本集所来自的社区主题,人工对样本集中的每个短文本样本给定标签,短文本样本集与对应的标签集构成了训练集。利用短文本集对一个两层的长短时记忆(Long‑short term memory,LSTM)编解码重构网络进行训练,训练好的网络可以对输入的任一一个短文本进行编码,得到输入短文本的特征向量。求取来自相同或者类似社区主题的短文本的特征向量均值,每个特征向量均值看作是对应的社区主题的短文本的语义背景向量。每个短文本减去所对应的语义背景向量,得到新的短文本样本集。利用新的短文本集与其标签来训练一个短文本分类器,本发明可以应用在短文本分类的相关业务中。

著录项

  • 公开/公告号CN108804622B

    专利类型发明专利

  • 公开/公告日2021-09-03

    原文格式PDF

  • 申请/专利权人 天津探数科技有限公司;

    申请/专利号CN201810547970.1

  • 发明设计人 王俊芳;

    申请日2018-08-20

  • 分类号G06F16/35(20190101);

  • 代理机构12201 天津市北洋有限责任专利代理事务所;

  • 代理人刘子文

  • 地址 300192 天津市南开区科研西路8号科苑大厦一楼南开科技企业服务中心

  • 入库时间 2022-08-23 12:25:32

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号