声明
摘要
第一章 绪论
1.1 背景、目的和意义
1.2 国内外研究现状
1.2.1 文本计算及文本相似性研究现状
1.2.2 功率谱的研究历史与现状
1.3 论文的主要工作、创新点
1.3.1 本文的主要工作
1.3.2 本文的创新点
1.4 论文的组织结构
第二章 文本相似性判别
2.1 文本预处理
2.1.1 去停用词
2.1.2 分词
2.2 多特征值提取
2.2.1 TF特征
2.2.2 DF特征
2.2.3 TF-IDF特征
2.2.4 信息熵
2.2.5 词频分布熵
2.2.6 文本分布熵
2.2.7 Pearson相关函数
2.2.8 词条分布权值
2.3 常见的文本相似性计算方法
第三章 基于脉冲信号函数的文本建模
3.1 二维特征集合的建立
3.2 设置文本脉冲信号函数
3.3 脉冲信号函数的应用
3.4 本章小结
第四章 基于文本模型的功率谱估计
4.1 经典功率谱估计法及实验分析
4.1.1 相关法与其功率谱图
4.1.2 周期图法与其功率谱图
4.1.3 周期图法的改进与其功率谱图
4.2 现代功率谱估计及实验分析
4.2.1 L-D算法与其功率谱图
4.2.2 Burg算法及功率谱图
4.3 AR模型的阶数选择
4.4 本章小结
第五章 基于功率谱估计的文本相似性计算
5.1 基于功率谱估计方法的文本相似性判别系统的组成模块
5.2 基于功率谱估计的文本相似性的研究
5.2.1 功率谱匹配依据
5.2.2 功率谱匹配算法描述
5.2.3 功率谱匹配算法的伪代码
5.2.4 实验结果与分析
5.3 长短文本匹配算法
5.3.1 长短文本匹配算法分析
5.3.2 文本匹配情况
5.3.3 长短文本匹配算法伪代码
5.3.4 实验结果及分析
5.4 本章小结
第六章 性能测试与分析
6.1 系统开发运行环境
6.2 实验数据及数据存储
6.3 基于功率谱匹配算法的实验分析
6.4 与传统方法的性能对比
6.5 本章小结
第七章 总结与展望
7.1 全文总结
7.2 论文不足之处
7.3 进一步研究设想
7.4 心得体会
参考文献
致谢
附录