首页> 中文学位 >基于GA-KNN分类模型在船期数据分析中的研究与应用
【6h】

基于GA-KNN分类模型在船期数据分析中的研究与应用

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.3 本文主要工作

1.4 本文结构安排

第二章 文本分类技术的研究

2.1引言

2.2文本分类的原理

2.3文本分类的特征提取

2.4 常用的文本分类的技术

第三章 船期领域中的文本向量空间模型

3.1文本向量空间模型概述

3.2船期领域文本向量空间模型

第四章 船期领域的网页文本检索模型

4.1船期领域的网页文本检索概述

4.2虚拟专业搜索引擎

4.3基于GA-KNN的文本分类

第五章 船期信息获取

5.1基于DOM的船期数据

5.2 HtmlAbilityPack

5.3船期数据获取

第六章 总结与展望

6.1本文总结

6.2下一步工作

致谢

参考文献

展开▼

摘要

当下,互联网蓬勃发展,信息化不断推进,网络上充斥着各种文本信息。尤其是在航运领域中,各种船期信息每天都快速增长着,但是这些数据目前却保持着一种“无明”状态:标准涣散,条块割据,处理缓慢,目标缺失,然而基于船期数据领域的自然语言处理技术(包括文本信息表示技术、同义词问题处理、特征词选择方法、文本检索技术、文本分类技术、Web信息提取技术等)的研究仍不多见。
  本文针对以上问题,建立了船期领域中的文本向量空间模型,构建了一个船期领域的虚拟专业搜索引擎,再与GA-KNN分类模型相结合将初始的网页集进行分类,已得到船期数据信息的网页集,最后再基于DOM的Web提取技术,采集网页中的船期数据信息。主要内容为:
  1.基于传统的文本向量空间模型基础上,主要研究和分析了特定领域(船期信息领域)下的特征词选择、同义词聚合的改进和应用以及向量空间维度的问题,提出了船期领域中的文本向量空间模型。
  2.为了获得承载船期数据信息的网页集,作为最初论文研究对象,构造了一个虚拟的专业搜索引擎。
  3.以KNN方法为基础,结合遗传算法,提出GA-KNN分类模型对船期文本进行文本分类。即提出一种变换的KNN分类方法,对网页集进行文本分类;同时,为了降低分类计算复杂度,提高分类准确率,结合GA进行特征选择。
  4.运用基于DOM的Web信息提取技术,提取结构化的船期数据,以便下一步的工作开展。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号