首页> 中国专利> 一种引入分层形声特征的中文词向量表示学习方法

一种引入分层形声特征的中文词向量表示学习方法

页面导航

摘要
著录项
相似文献

摘要

本发明公开了一种基于分层形声特征增强的中文词向量表示技术。采用分层形声特征增强的中文词向量表示方法，可以较大地提升中文词向量的效果。本发明包括如下步骤：1)首先运用爬虫工具抓取中文词语的相关形态和发音信息；2)通过对形态和发音信息的分层组合，构成形态特征和声音特征，构建词语的特征表示；3)通过注意力机制对输入部分的形声特征进行权重调节；4)采用解耦预测和混合预测联合的训练方式来训练词向量的表示。和现有技术相比，本发明结合了中文词语多层次的形态和发音信息，并采用解耦预测和混合预测联合的方式，系统地进行词向量的训练，形成独具一格的中文词向量表示技术，创造性地提升了中文词向量的效果。

著录项

公开/公告号CN110427608B

专利类型发明专利
公开/公告日2021-06-08

原文格式PDF
申请/专利权人浙江大学;
展开▼

申请/专利号CN201910549589.3
发明设计人张寅;毛晨炀;庄越挺;
展开▼

申请日2019-06-24
分类号G06F40/295(20200101);G06F40/30(20200101);G06F40/216(20200101);G06F16/33(20190101);G06F16/951(20190101);G06N3/08(20060101);
代理机构33200 杭州求是专利事务所有限公司;
代理人傅朝栋;张法高
地址 310058 浙江省杭州市西湖区余杭塘路866号
入库时间 2022-08-23 11:55:31

相似文献

专利
中文文献
外文文献

1. 一种引入分层形声特征的中文词向量表示学习方法 [P] . 中国专利： CN110427608B . 2021.06.08
2. 一种引入分层形声特征的中文词向量表示学习方法 [P] . 中国专利： CN110427608A . 2019-11-08
3. CHINESE LANGUAGE LEARNING DEVICE, CHINESE LANGUAGE LEARNING METHOD, PROGRAM, AND RECORDING MEDIUM [P] . 日本专利： JP2011209730A . 2011-10-20

机译：中文语言学习装置，中文语言学习方法，程序和记录介质
4. CHINESE CHARACTER EXPLANATION METHOD AND A TEACHING MATERIAL, CAPABLE OF SUPPLYING A LEARNING METHOD ACCORDING TO AN ORIGIN AND A CHANGE OF CHINESE CHARACTER [P] . 韩国专利： KR20090111996A . 2009-10-28

机译：中文字符说明方法和教学材料，可根据原产地和中文字符的变化提供学习方法
5. A Self-directed Studying Method and the Device of It to Learn Foreign Language by the Game That Relays the End Spelling of the Word with Integrating the Merits of the Particularly Designed Cards into the Characters of Studying Machines [P] . 韩国专利： KR101332149B1 . 2013-11-21

机译：通过将单词的末尾拼写与特别设计的卡片的优点整合到学习机特征中的游戏，实现一种自主学习方法和一种学习外语的设备