首页> 中文会议>第四届全国信息检索与内容安全学术会议 >基于协同聚类的两阶段文本聚类方法研究

基于协同聚类的两阶段文本聚类方法研究

页面导航

摘要
著录项
相似文献
相关主题

摘要

作为一种自然语言处理应用,文本聚类具有高维和语义相关的特点,属于无监督的学习方法.但由于缺乏类别信息,成功应用于文本分类的有监督的特征选择方法很难直接应用于文本聚类.为了将语义信息用于文本聚类和有效地进行特征选择,本文提出了一种基于协同聚类的两阶段文本聚类方法.该方法分别对文档和特征进行聚类从而得到特征与主题之间的语义关联关系,然后利用此关系来相互调整彼此的聚类结果;聚类分两阶段进行,第一阶段对训练集进行协同聚类,第二阶段利用第一阶段的聚类结果进行有监督的特征选择,然后以所选特征对测试集进行协同聚类.实验结果表明,利用特征与主题之间的语义关联关系能有效地提高聚类效果.同时,通过两阶段聚类方式不仅能有效地进行特征选择,而且聚类效果得到很大提高.本文最后还利用特征之间的语义关联关系在进行特征选择之后进行特征扩展,使聚类效果得到了进一步的提高.

著录项

来源
《第四届全国信息检索与内容安全学术会议》|2008年|620-629|共10页
会议地点北京
作者

展开▼
作者单位

中国中文信息学会;

清华大学;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类文字信息处理;
关键词
文本聚类; 协同聚类; 特征选择; 特征扩展; 自然语言处理;
入库时间 2022-08-17 11:09:00

相似文献

中文文献
外文文献
专利

1. 基于K均值和aiNet的两阶段文本聚类算法 [J] . 向永生 ,刘燕婷 ,徐家宁 . 微计算机信息 . 2009,第030期
2. 一种基于DASOM的两阶段中文文本聚类方法 [J] . 朱红灿 ,唐毅 . 情报杂志 . 2007,第009期
3. 基于文本聚类的档案数据全自动分类方法研究 [J] . 于红 . 电子测试 . 2021,第014期
4. 基于文本聚类的主题发现方法研究综述 [J] . 李璐萍 ,赵小兵 . 情报探索 . 2020,第011期
5. 基于句法结构分析的中文文本聚类方法研究 [J] . 尹积栋 ,谢茶花 ,彭崧 . 计算机与数字工程 . 2018,第005期
6. 基于两阶段聚类的无功电压控制在线自动分区方法研究 [C] . 梁才浩 ,段献忠 . 2003年全国高等学校电力系统及其自动化专业第十九届学术年会 . 2003
7. 基于SOM的两阶段中文文本聚类算法的研究 [A] . 朱红灿 . 2005

基于协同聚类的两阶段文本聚类方法研究

摘要

著录项

相似文献

相关主题

期刊订阅