首页> 中文会议>中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会 >一种新颖的词聚类算法

一种新颖的词聚类算法

页面导航

摘要
著录项
相似文献
相关主题

摘要

基于类的统计语言模型是解决统计模型数据稀疏问题的重要方法.传统的统计方法基于贪婪原则,常以语料的似然函数或困惑度(perplexity)作为评价标准.这种传统的聚类方法的主要缺点是聚类速度慢,初值对结果影响大,易陷入局部最优.本文提出了一种新颖的词相似度定义,在词相似度的基础上,还首次给出了词集合相似度的定义.基于相似度,提出了一种自下而上的分层聚类算法,这种方法不但能改善聚类效果,而且可根据不同的模型选择不同的相似度定义,因而提高聚类的使用效果.实验证明,该算法在计算复杂度和聚类效果上比传统的基于贪婪原则的统计聚类算法都有明显的改进.

著录项

来源
《中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会》|2004年|522-525|共4页
会议地点成都
作者
袁里驰; 钟义信;
展开▼
作者单位

中国自动化学会;

中国仪器仪表学会;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类程序语言、算法语言;
关键词
词相似度; 词聚类; 统计语言模型; 数据稀疏; 分层聚类算法;
入库时间 2022-08-17 10:59:16

相似文献

中文文献
外文文献
专利

1. 一种新颖的词聚类算法 [J] . 袁里驰 ,钟义信 . 四川大学学报（自然科学版） . 2004,第0z1期
2. 一种新颖的词聚类算法和可变长统计语言模型 [J] . 陈浪舟 ,黄泰翼 . 计算机学报 . 1999,第009期
3. 基于连续词包模型的一种改进的文本主题聚类算法 [J] . 秦泽浩 . 电脑知识与技术 . 2018,第017期
4. 一种基于关键词的微博话题聚类算法 [J] . 林丹 ,刘建明 ,谷志瑜 . 计算机应用与软件 . 2018,第001期
5. 一种基于词共现的文档聚类算法 [J] . 常鹏 ,冯楠 ,马辉 . 计算机工程 . 2012,第002期
6. 一种基于词间相似性的词聚类算法 [C] . 陈浪舟 . 第五届中国人工智能联合学术会议 . 1998
7. 基于关键词提取的专利新颖性分析技术研究 [A] . 晁珍珍 . 2020

一种新颖的词聚类算法

摘要

著录项

相似文献

相关主题

期刊订阅