聚类算法在结构化语言模型中的应用

邱忆; 黄世泽

首页> 中文期刊> 《电信技术研究》 >聚类算法在结构化语言模型中的应用

聚类算法在结构化语言模型中的应用

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

团队文献服务 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

逐步把握文章的语义对于自然语言处理来说是一项很大的挑战。在自然语言处理中，数据的稀疏性是一个让许多学者都感到头疼的问题。当一个词语的词频小到不能进行可靠的极大似然估计的时候，机器就不能准确的把握这个词的含义了。一个词的含义可以通过计算该词的相似词含义的加权得出。所以，词与词之间的相似度对于解决词语稀疏性问题将会有所帮助，本文所研究的词语相似度计算也是基于这一点进行的。实验证明，该算法在算法复杂度和聚类效果上比传统的基于贪婪原则的统计聚类算法都有明显的改进。在本文中，首先介绍国内外关于相似度计算的几种成熟的算法。然后，把问题层层细分到几个模块分别予以讨论，并采用基于上下丈环境的相似度算法。本系统的功能是对语料库进行统计学习，掌握其中词汇的上下丈分布特征，形成上下文信息集；对这些上下丈信息计算互信息值作为权重，通过计算两个词语的上下文环境的相符程度得到它们之间的相似度。最后，讲解一下系统的实现和性能评价，即交叉熵的计算。

著录项

来源
《电信技术研究》 |2008年第3期|26-34|共9页
作者
邱忆; 黄世泽;
展开▼
作者单位

无;

展开▼
原文格式 PDF
正文语种 CHI
中图分类语音识别与设备 ;
关键词
相似度 ; 数据稀疏性 ; 互信息 ; 上下文信息 ; 交叉熵 ;

相似文献

中文文献
外文文献
专利

1. 基于相似度的词聚类算法和可变长语言模型 [J] . 袁里驰 . 小型微型计算机系统 . 2009 ,第005期
2. 一种新颖的词聚类算法和可变长统计语言模型 [J] . 陈浪舟 ,黄泰翼 . 计算机学报 . 1999 ,第009期
3. 语义分析和结构化语言模型 [J] . 李明琴 ,李涓子 ,王作英 . 软件学报 . 2005 ,第009期
4. 英语课本中真实语言模型和人工语言模型的结合 [J] . 张晨 ,董辉 . 黑龙江教育学院学报 . 2014 ,第006期
5. 联合结构化图学习与l1范数谱嵌入的鲁棒聚类算法 [J] . 汤立伟 ,张家珲 ,彭勇 . 计算机应用研究 . 2021 ,第004期
6. 基于相似度的词聚类算法和可变长语言模型 [C] . 袁里驰 . 第二届全国智能信息处理学术会议 . 2009
7. 基于结构化图学习的谱嵌入聚类算法研究与应用 [A] . 林郭权 . 2021

聚类算法在结构化语言模型中的应用

摘要

著录项

相似文献

相关主题

期刊订阅