基于语句特征提取的文本分类方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着网络信息的迅猛发展，信息处理已经成为人们获取有用信息不可缺少的工具，文本自动分类系统是信息处理的重要研究方向。它是指在给定的分类体系下，根据文本的内容自动判别文本类别的过程。本文对文本分类中所涉及的关键技术，包括向量空间模型、特征提取、机器学习方法，进行了研究和探讨。当前的分类系统一般以孤立的词为特征单位，对孤立的词进行抽样、特征提取、获得权重，不进行语义的处理。这是由于进行语义处理需要大量的规则库和推理机，其实现方式复杂。针对这种情形，本文提出了一种将向量空间模型和语义相结合的方式，获取特征权重，进行训练文本训练，获得分类机的模式。阐述了模型的文本分类系统的结构，并给出了评估方法和实验结果，对比了各种分类方式下的效果。本文分以下几部分内容：一：本文在第一章讲述了分本分类系统当前背景情况，文本分类的几个基本步骤和常用方法。第二章讲述了统计学习的理论，从理论上进行了探讨。第三章介绍了向量空间模型和几种特征方法的获取，最后提出了新的特征获取方法。二：第四章讲述分类学习算法，以及针对本文提出的特征获取方法的分类学习方法。并且阐述了中文分类的评比标准。第五章介绍了针对本文提出的新方法建立模型的步骤和过程。三：第六章对实验结论进行阐述，并讲述了本文方法优点和缺点，以及未来研究可以做出的改进。

著录项

作者
刘建;
展开▼
作者单位

南京邮电大学;

南京邮电学院;

展开▼
授予单位南京邮电大学;南京邮电学院;
学科计算机软件与理论
授予学位硕士
导师姓名郑彦;
年度 2005
页码
总页数
原文格式 PDF
正文语种中文
中图分类自动推理、机器学习;
关键词
向量空间模型; 特征单元; 分类机; 训练文本; 测试文本; 语句特征提取; 文本分类方法;

相似文献

中文文献
外文文献
专利

1. 基于小波分析的特征提取文本分类方法研究 [J] . 朱晋 ,怀丽波 ,崔荣一 . 中文信息学报 . 2018,第011期
2. 基于跨语言文本分类的跨语言特征提取方法研究 [J] . 高影繁 ,王惠临 ,徐红姣 . 情报学报 . 2011,第012期
3. 中文文本分类中基于词性的特征提取方法研究 [J] . 胡燕 ,吴虎子 ,钟珞 . 武汉理工大学学报 . 2007,第4期
4. 面向文本分类的深度置信网络特征提取方法研究 [J] . 易军凯 ,王超 ,李辉 . 北京化工大学学报（自然科学版） . 2018,第003期
5. 数字图书馆文本分类特征提取方法研究与改进 [J] . 鲍凌云 . 农业图书情报学刊 . 2014,第007期
6. 基于词性特征提取的藏文文本分类方法研究 [C] . 贾会强 ,刘晓丽 ,于洪志 . 2011年中国计算机学会服务计算学术会议(CCF NCSC2011) . 2011
7. 文本分类中特征提取和特征加权方法研究 [A] . 蒋健 . 2010

基于语句特征提取的文本分类方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅