首页> 中国专利> 文本表示方法、词表示方法、相应装置、介质及设备

文本表示方法、词表示方法、相应装置、介质及设备

摘要

本公开涉及一种文本表示方法、词表示方法、相应装置、介质及设备,该文本表示方法包括:获取文本并对文本进行分词,获得词序列;生成文本的文本向量,并对文本向量进行至少一轮迭代,每轮迭代包含多次子迭代;在每轮迭代的第i次子迭代中,基于长度为k的滑动窗口,在将词序列上的上一次子迭代的滑动窗口向后滑动后,将当前滑动窗口中的k个词的真实词向量以及上一次子迭代优化后的文本向量进行加权组合,将加权组合后的向量作为当前滑动窗口外的下一个词的预测词向量;根据下一个词的预测词向量和真实词向量,优化文本向量;在完成该至少一轮迭代后,得到用于表示文本的最终文本向量。本公开能够准确得到文本的向量表示。

著录项

  • 公开/公告号CN115392234A

    专利类型发明专利

  • 公开/公告日2022-11-25

    原文格式PDF

  • 申请/专利权人 东软集团股份有限公司;

    申请/专利号CN202210923883.8

  • 申请日2022-08-02

  • 分类号G06F40/284;G06F40/289;G06F16/35;

  • 代理机构北京英创嘉友知识产权代理事务所(普通合伙);

  • 代理人王修雨

  • 地址 110179 辽宁省沈阳市浑南新区新秀街2号

  • 入库时间 2023-06-19 17:43:36

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-11-25

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号