首页> 中国专利> 用于稿件处理的词向量搭建方法和稿件处理方法和装置

用于稿件处理的词向量搭建方法和稿件处理方法和装置

摘要

本公开涉及一种用于稿件处理的词向量搭建方法和稿件处理方法和装置,包括:由资讯数据库中获取词向量模型搭建所需要的标签栏目。并由资讯数据库中所存储的各稿件中提取出预设个数的分词及各分词的向量值。对于各标签栏目,均对应匹配分词和向量值,构成包含标签栏目、分词和向量值的数据集合。基于所构成的数据集合,搭建得到词向量模型。其中,词向量模型为由多个数据集合形成的矩阵。本公开使用基于支持向量机原理的模型进行设计,通过映射特征过程的调参处理,来满足实际的业务需求。利用单篇文章的特征值和整体模型的特征值,辅助一些特定算法,就可以实现签发栏目推荐等功能。

著录项

  • 公开/公告号CN114662471A

    专利类型发明专利

  • 公开/公告日2022-06-24

    原文格式PDF

  • 申请/专利权人 中国经济信息社有限公司;

    申请/专利号CN202210298544.5

  • 发明设计人 晋东毅;

    申请日2022-03-25

  • 分类号G06F40/216;G06F40/289;

  • 代理机构北京市鼎立东审知识产权代理有限公司;

  • 代理人朱慧娟;李芙蓉

  • 地址 100052 北京市西城区宣武门西大街57号

  • 入库时间 2023-06-19 15:44:42

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-06-24

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号