声明
第1章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.3 研究内容
3. 基于进化模糊规则的Web新闻内容分类
1.4 论文组织结构
第2章 相关理论与模型框架
2.1 Web新闻文本内容识别提取
2.1.1 新闻的要素和特点
2.1.2 Web新闻的结构特点
2.2 Web新闻图片和视频字幕中的文本提取
2.2.1 Web新闻图片中的文本特征
2.2.2 二值化处理
2.2.3 边缘检测
2.3 BP神经网络理论
2.4 新闻分类
2.5 进化模糊规则
2.6 模型框架
2.7 本章小结
第3章 Web新闻内容的识别提取
3.1 基于Web新闻文本识别提取方法
3.1.1 网页类型区分
3.1.2 网页的解析
3.1.3 新闻主题内容抽取
3.1.4 算法实现
3.2 基于Web新闻图片内容的识别提取
3.2.1 方法概述
3.2.2 图片中文字定位的特点分析
3.2.3 研究近况
3.2.4 初步定位区域的获得和它的二值化与灰度投影
3.2.5 频谱分析
3.2.6 构建BP神经网络分类器
3.3 实验结果与分析
3.3.1 实验阈值的选取
3.3.2 Web新闻图片和视频帧中的文字定位效果评估
3.3.3 自然场景中文本定位效果的评估
3.4 本章小结
第4章 进化模糊分类器的构建
4.1 基于模糊规则的分类器
4.2 模糊集和数据集
4.3 模糊推理机制
4.4 eClass0分类器
4.4.1 模糊分类器的改进
4.5 本章小结
第5章 基于进化模糊规则的Web新闻内容分类
5.1 方法概述
5.1.1 传统分类方法
5.1.2 特征选取与权重计算
5.1.3 权重计算
5.2 文本预处理
5.2.1 分词处理
5.2.2 滤除停用词
5.3 术语过滤
5.4 进化模糊规则的文本分类
5.4.1 进化模糊规则的创建与更新
5.4.2 规则改变举例
5.5 实验及分析
5.5.1 数据集
5.5.2 术语过滤和阈值修剪
5.5.3 实验性能比较
5.6 本章总结
第6章 总结与展望
6.1 课题总结
6.2 课题展望
参考文献
攻读学位期间的研究成果
河南科技大学;