首页> 中文学位 >面向文本分类的k近邻查询方法研究
【6h】

面向文本分类的k近邻查询方法研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

1 绪论

1.1 研究的背景和意义

1.2 研究现状

1.3 论文主要研究内容和章节内容安排

2 相关的研究工作

2.1 文本分类技术

2.2 移动对象的反向最近邻和反向k最近邻技术

2.3 本章小结

3 kNN算法应用分析

3.1 kNN文本分类算法

3.2 影响kNN分类算法的因素

3.3 kNN分类算法的优缺点

3.4 kNN边界问题解决方案

3.5 改进的kNN文本分类算法

3.6 实验测试及结果分析

3.7 本章小结

4 移动对象RkNN连续监测

4.1 反向k最近邻查询分类及存在的主要问题

4.2 反向k最近邻的模型框架

4.3 反向k最近邻连续监测算法

4.4 本章小结

5 结论和展望

5.1 论文的主要研究内容和创新之处

5.2 工作展望

攻读硕士学位期间发表的论文和参加的科研项目

致谢

参考文献

展开▼

摘要

随着互联网上信息量的爆炸式增长和空间信息科学的发展,在很多应用中都需要求给定对象的kNN和RkNN,如在文本分类、智能导航、现代通讯、交通控制、气象预报等各个领域都有着广泛的需求。
  kNN查询在文本分类研究等领域有十分重要的应用。kNN问题不仅研究得较早,而且对于它们的商业应用已经相当的广泛和成熟。目前比较常用的文本分类技术主要有:向量空间模型、k最近邻法、神经网络、支持向量机和贝叶斯算法等。而kNN算法是一种有效地文本分类算法。针对传统kNN算法存在计算量过大的缺点,论文引入了生成代表样本集的方法,对原始训练集进行裁剪并予以取代,从而减少了分类系统的计算量,有效地提高了系统的效率。
  近年来,移动设备和无线网络的广泛应用带来了基于位置服务应用(LBS)的快速发展,RkNN查询在LBS中扮演了极为重要的角色。然而现有的RkNN算法一般都是近似的解法或者仅仅适用于某种特定的情况,因此在一定程度上存在以下的不足和缺陷:仅适用于二维空间数据的求解;对k的值有限制;支持静态数据而不支持数据库的动态更新,尤其移动对象数据库;仅能得到近似不能得到精确的结果。为解决这些问题,本文给出了一种能够有效解决多维移动对象RkNN查询的新算法——基于半空间修剪的移动对象RkNN连续监测算法。该算法为每一查询点目标分配一个安全矩形区域,对原有的半空间修剪策略进行改进,使其性能优化,并采用过滤、提炼这两个处理步骤来获取查询点的反向k最近邻,实现了对查询点的RkNN连续监测。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号