首页> 中国专利> 一种基于多重CCA算法的柬汉双语词向量模型构建方法

一种基于多重CCA算法的柬汉双语词向量模型构建方法

摘要

本发明涉及一种基于多重CCA算法的柬汉双语词向量模型构建方法,属于自然语言处理技术领域。本发明首先获取英语、柬语、汉语词向量;其次分别将英语、汉语词向量投影至同一特征空间,将英语、柬语词向量投影至同一特征空间,从而得到各自对应的投影转换矩阵;然后以英语作为多语言向量公共空间,分别将柬语和汉语投影到英语词向量空间中,并根据典型相关分析算法,分析计算投影转换矩阵之间的相关关系,得到多语词向量;多语词向量中便包含有柬汉双语词向量,进而可获得柬汉双语词向量模型。本发明有效的解决了无法直接构建柬汉双语词向量模型的问题,并且通过该方法获得的柬汉双语词向量质量较高,准确率方面有很大的提升。

著录项

  • 公开/公告号CN109582951A

    专利类型发明专利

  • 公开/公告日2019-04-05

    原文格式PDF

  • 申请/专利权人 昆明理工大学;

    申请/专利号CN201811222172.8

  • 申请日2018-10-19

  • 分类号

  • 代理机构

  • 代理人

  • 地址 650093 云南省昆明市五华区学府路253号

  • 入库时间 2024-02-19 09:13:30

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-04-30

    实质审查的生效 IPC(主分类):G06F17/27 申请日:20181019

    实质审查的生效

  • 2019-04-05

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号