文摘
英文文摘
声明
第1章前言
1.1研究背景
1.2研究方法
1.3主要的研究内容
1.4论文的组织结构
第2章文本自动分类技术概述
2.1 文本自动分类及其一般过程
2.2文本特征表示
2.3文本自动分类的算法
第3章WEB文档的预处理
3.1 Web文栏预处理的过程
3.2 Web文档的基本结构
3.3 Web文栏消除噪音
3.4停用词(Stop word)过滤
3.5中文文本分词
第4章学前教育Web文档的特征选择与权重计算
4.1学前教育Web资源的特点
4.2学前教育Web资源的分类体系
4.3 Web文档特征提取的原则
4.4 Web文档的特征项选择
4.5 Web文档的特征项权重计算
4.6基于HTML标记优化特征提取
4.6.1基于HTML标记优化特征权重的计算
4.6.2超链接的特征提取
第5章特征评估函数的实验
5.1学前教育Web文栏的采集
5.2评估指标
5.3特征评估函数的实验
5.4基于HTML优化特征权重的实验
第6章结论
6.1论文总结
6.2后续的研究工作
参考文献
致谢