首页> 中国专利> 一种基于深度学习的用户主题向量化表示方法和系统

一种基于深度学习的用户主题向量化表示方法和系统

摘要

本发明公开了基于深度学习的用户主题向量化表示方法和系统,能通过用户发表的文本内容,表征出用户的发文习惯及发文主题的特征,并最终合并表示为特定长度的向量。其技术方案为:步骤1:采集信息源的原始数据;步骤2:对采集到的原始数据进行包括分词在内的预处理,然后进行步骤3至步骤4、以及步骤5至步骤7的并列处理;步骤3:将分词后的数据文本按用户分组;步骤4:通过Skip‑Gram算法计算用户特征向量;步骤5:使用文本聚类算法将文本主题进行分类;步骤6:将分词后的数据文本按照主题类型进行分组;步骤7:通过Skip‑Gram算法计算主题特征向量;步骤8:基于计算出的用户特征向量和主题特征向量以及所选择的加权系数,生成用户主题特征向量。

著录项

  • 公开/公告号CN111310453A

    专利类型发明专利

  • 公开/公告日2020-06-19

    原文格式PDF

  • 申请/专利权人 上海金融期货信息技术有限公司;

    申请/专利号CN201911071836.X

  • 发明设计人 王晨宇;苗仲辰;林越峰;高剑;

    申请日2019-11-05

  • 分类号

  • 代理机构上海专利商标事务所有限公司;

  • 代理人施浩

  • 地址 200122 上海市浦东新区世纪大道1600号3楼

  • 入库时间 2023-12-17 10:12:19

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-07-14

    实质审查的生效 IPC(主分类):G06F40/284 申请日:20191105

    实质审查的生效

  • 2020-06-19

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号