首页> 中文期刊>中文信息学报 >一种多基元联合训练的藏文词向量表示方法

一种多基元联合训练的藏文词向量表示方法

     

摘要

词向量表示是机器学习的基础性工作,其目标是以优化的向量表示词,以便计算机能更好地理解自然语言.随着神经网络技术的发展,词向量在自然语言处理领域发挥着重要作用.藏文词向量表示技术的研究对藏文特征分析以及用深度学习技术处理藏文具有重要意义.该文提出了一种构件、字和词多基元联合训练的藏文词向量表示方法,设计了多基元联合训练藏文词向量的模型TCCWE,并采用内部评测中的词相似度/相关性评价方式验证了其有效性.实验表明,该文提出的藏文词向量表示方法有效,其性能在TWordSim215上提高了3.35%,在TWordRel215上提高了4.36%.

著录项

  • 来源
    《中文信息学报》|2020年第5期|44-49|共6页
  • 作者单位

    青海师范大学计算机学院 青海西宁810016;

    西南民族大学计算机科学与技术学院 四川成都610041;

    青海省藏文信息处理与机器翻译重点实验室 青海西宁810008;

    藏文信息处理教育部重点实验室 青海西宁810008;

    青海师范大学计算机学院 青海西宁810016;

    西南民族大学计算机科学与技术学院 四川成都610041;

    青海省藏文信息处理与机器翻译重点实验室 青海西宁810008;

    藏文信息处理教育部重点实验室 青海西宁810008;

    清华大学计算机科学与技术系 北京100084;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 信息处理(信息加工);
  • 关键词

    自然语言处理; 藏文; 神经网络; 词向量表示;

  • 入库时间 2023-07-25 19:42:55

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号