文摘
英文文摘
声明
第1章引言
1.1中文信息处理研究概况
1.2中文信息处理的难点
1.3目前中文信息处理技术发展的态势
1.4本文研究工作的主要内容及贡献
1.4.1主要内容
1.4.2贡献
1.5本文的组织结构
第2章中文信息处理基础
2.1中文信息处理基本概念
2.2字典组织构造
2.2.1概念概述
2.2.2词典的逻辑结构分析
2.2.3变量解释
2.3语料库介绍
2.3.1新华字典
2.3.2同义词词林扩展版
2.3.3人民日报标注语料
2.3.4句法树库
2.3.5中文文本分类语料库(复旦)
2.3.6单文档自动文摘语料库
2.3.6知网
2.4分词
2.4.1分词的研究概况
2.4.2分词方法的基本策略
2.4.3本文采用的算法及实现
2.5词性标注
2.5.1词性标注的研究概况
2.5.2词性标注的基本策略
2.5.3本文采用的算法及实现
2.6句法分析
2.6.1句法分析的研究概况
2.6.2句法分析的基本策略
2.6.3本文采用的算法及实现
2.7语义分析
2.7.1语义分析的研究概况
2.7.2语义分析模型
2.7.3潜在语义分析
2.8文本表示
2.8.1向量空间模型
2.8.2权值计算方法
2.8.3特征选择
2.8.4本文采用的算法及实现
2.9平滑算法
2.9.1平滑算法概述
2.9.2典型平滑算法分析
第3章中文信息分类
3.1国内外相关研究现状
3.2基本策略
3.2.1 Rocchio算法
3.2.2贝叶斯分类
3.2.3 k-近邻算法
3.2.4支持向量机
3.2.5决策树分类
3.2.6神经网络分类
3.3本文采用的算法及实现
3.3.1预处理
3.3.2算法描述
3.3.3性能分析
第4章中文信息聚类
4.1国内外相关研究现状
4.2基本策略
4.2.1基于层次的算法
4.2.2基于平面分割的算法
4.2.3基于密度的算法
4.2.4基于规则的模型的算法
4.2.5基于网格和子空间的算法
4.2.6遗传聚类算法
4.3本文采用的算法及实现
4.3.1基本思路
4.3.2算法描述
4.3.3性能分析
第5章自动文摘
5.1国内外相关研究现状
5.2基本策略
5.2.1基于统计的自动文摘
5.2.2基于理解的自动文摘
5.3本文采用的算法及实现
5.3.1基本思路
5.3.2算法描述
5.3.3性能分析
第6章中文信息检索
6.1国内外相关研究现状
6.2信息检索模型
6.2.1检索模型的定义
6.2.2布尔逻辑检索模型
6.2.3向量空间检索模型
6.2.4概率检索模型
6.3本文采用的算法及实现
6.3.1基本思想
6.3.2算法描述
6.3.3性能分析
第7章总结和展望
7.1本文取得的成果
7.2进一步的工作
参考文献
附录
致谢