首页> 中国专利> 多层级主题向量空间的构建方法、装置、设备和存储介质

多层级主题向量空间的构建方法、装置、设备和存储介质

摘要

本发明涉及一种多层级主题向量空间的构建方法、装置、设备和存储介质。该构建方法包括从语料库中提取全局词共现矩阵;对全局词共现矩阵进行建模,并生成不同层级的主题库,根据不同层级的主题库分别生成不同层级的主题相关矩阵;对于每一层级的所述主题相关矩阵,构建主题向量空间。因此,本申请能够将主题表示成任意维度的主题向量,避免了LDA等算法的向量大小只能是字典维度的缺陷;同时,基于对噪声词的建模,能够减弱噪声词对聚类的影响。

著录项

  • 公开/公告号CN110889293B

    专利类型发明专利

  • 公开/公告日2020-11-27

    原文格式PDF

  • 申请/专利权人 浙江大搜车软件技术有限公司;

    申请/专利号CN201911242995.1

  • 发明设计人 吴欣辉;

    申请日2019-12-06

  • 分类号G06F40/30(20200101);G06F40/284(20200101);G06F16/35(20190101);

  • 代理机构33250 杭州华进联浙知识产权代理有限公司;

  • 代理人金无量

  • 地址 310000 浙江省杭州市余杭区五常街道五常大道165号2幢911室

  • 入库时间 2022-08-23 11:23:24

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号