文档分类和聚类方法及其在信息检索中应用的研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

本文对文档分类和聚类方法及其在信息检索中的应用进行了深入研究,主要包括以下几个方面的内容:通过对当前分类方法的分析,提出了基于统计的文档层次分类方法.针对当前文档聚类方法存在的问题,本文提出了基于频繁特征项集文档聚类的FTSC方法和FTSHC方法.对预处理后的文档,通过Apriori算法找出文档频繁特征项集合,依据其子集中频繁特征词语对相关文档进行聚类.为了适应信息检索的需要,针对动态文档库,提出了基于Pat树全文索引的动态文档聚类方法,利用压缩的Pat树建立全文索引的模型,以提高索引的效率.针对信息检索和网页文档聚类,提出了基于超链接信息的Web文档自动聚类模型.利用结构挖掘技术获得主题领域的多个权威网页作为初始聚类中心,通过去除超链接信息中的噪声和多余链接得到网站的简明拓扑结构,并结合内容挖掘,动态调整聚类中心,最终将网页聚成各主题下的不同子类别.

著录项

作者
郑小慎;
展开▼
作者单位

天津大学;

展开▼
授予单位天津大学;
学科计算机应用技术
授予学位博士
导师姓名何丕廉;
年度 2004
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字信息处理;
关键词
文档分类; 文档聚类; 信息检索; 层次分类; 超链接信息;

相似文献

中文文献
外文文献
专利

1. PCCS部分聚类分类：一种快速的Web文档聚类方法 [J] . 王爱华 ,张铭 ,杨冬青 . 计算机研究与发展 . 2001,第004期
2. 树聚类方法在文档图像检索中的应用 [J] . 刘劼 . 科技资讯 . 2009,第015期
3. 分类目录思想在信息检索中的应用--"先控"智能信息检索系统 [J] . 乔鸿 ,余锦凤 . 现代图书情报技术 . 2004,第011期
4. 超长离散信号聚类方法研究及其在潮型分类中的应用 [J] . 张立振 ,玄春艳 ,曹露洁 . 海洋科学进展 . 2013,第003期
5. 不同聚类方法在品种资源分类中应用的研究 [J] . 陆根尧 . 浙江万里学院学报 . 1990,第001期
6. 基于最大生成树的文档聚类及其在个性化信息检索中的应用 [C] . 康海燕 ,北京理工大学计算机系 ,王克俭 . 2005年中国模糊逻辑与计算智能联合学术会议 . 2005
7. 利用文档分类结构的信息检索技术 [A] . 徐生良 . 2010

文档分类和聚类方法及其在信息检索中应用的研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅