声明
摘要
表格索引
插图索引
算法索引
第一章 绪论
1.1 研究问题概述
1.2 研究背景及现状
1.3 研究内容
1.4 本文的结构
第二章 分布式词向量表示方法
2.1 分布式语义表示
2.2 基于矩阵分解的分布式词向量技术
2.2.1 基于矩阵分解表示技术步骤
2.2.2 显式正定点互信息矩阵表示
2.2.3 分布式表示的奇异值分解
2.2.4 Global Vectors表示方法
2.3 基于神经网络的词向量表示技术
2.3.1 神经网络语言模型
2.3.2 语言模型
2.3.4 神经网络语言模型
2.3.5 CBOW和Skip-Gram模型
2.4 中文词向量表示技术
2.4.1 基于位置的消歧方法
2.4.2 基于聚类的表示方法
2.4.3 非参数化聚类方法
2.5 本章小结
第三章 中文字词联合学习
3.1 获取中文字词的翻译
3.2 基于字词对齐模型的相似度计算
3.2.1 预训练英文词向量
3.2.2 字语义合并
3.2.3 计算字词相似度和消歧
3.3 字词联合训练的字词向量模型
3.3.1 SCWE模型
3.3.2 基于相似度的字词联合学习方法
3.4 模型复杂度分析
3.5 本章小结
第四章 实验分析
4.1 词向量实验设置
4.1.1 英文词向量的训练
4.1.2 中文词向量的训练
4.2 语义相关性实验
4.2.1 语料库大小的影响
4.2.2 近邻词汇分析
4.3 文本分类
4.3.1 实验数据介绍
4.3.2 分类算法和评价标准
4.4 汉字消歧
4.4.1 汉字消歧的量化实验
4.4.2 字向量在二维平面的显示
4.5 参数分析
4.5.2 组合词判定阈值λ
4.5.3 汉字多义合并阈值δ
4.6 本章小结
5.1 总结
5.2 展望
参考文献
致谢
在读期间发表的学术论文与取得的研究成果
中国科学技术大学;