声明
摘要
图目录
表目录
主要符号表
1 绪论
1.1研究背景与意义
1.1.1研究背景
1.1.2研究意义
1.2国内外研究进展
1.2.1 文本表示方法研究现状
1.2.2文本特征词选择方法研究现状
1.2.3主题发现方法研究现状
1.2.4政策文本数据挖掘研究现状
1.2.5已有研究工作中的不足
1.3研究内容和结构
1.3.1研究内容
1.3.2论文结构
1.4本章小结
2基于条件共现度矩阵的文本表示方法
2.1 问题提出
2.2条件共现度矩阵文本表示方法
2.2.1共现矩阵与共现度
2.2.2条件共现度矩阵
2.2.3模型优势分析
2.3数值实验
2.3.1 实验设置和结果评估标准
2.3.2实验结果与分析
2.3.3 灵敏度分析
2.4本章小结
3基于条件共现度词网络的特征词排序方法
3.1 问题提出
3.2相关工作
3.2.1 Jensen-Shannon散度
3.2.2流形排序
3.3算法构建
3.3.1特征词初始重要性排序
3.3.2条件共现度词网络构建
3.3.3基于流形排序的特征词二次排序
3.3.4算法总结
3.4数值实验
3.4.1 实验数据
3.4.2评价标准和对比方法
3.4.3实验结果与分析
3.5本章小结
4基于条件共现度的文本主题发现方法
4.1 问题提出
4.2算法构建
4.2.1文档语义结构拆分
4.2.2子文档特征词扩充及重构
4.2.3 主题建模
4.2.4子文档合并
4.2.5 算法总结
4.3数值实验
4.3.1 实验设置与结果评估方法
4.3.2文本分类实验与结果分析
4.3.3主题发现实验与结果分析
4.4本章小结
5政策文本内容特征抽取及社会变迁研究
5.1 问题提出
5.2整体研究框架
5.3研究方法
5.3.1文本预处理方法
5.3.2频繁词、关键词、热词以及新词的抽取方法
5.3.3特征词时间序列聚类方法
5.3.4时序文档的聚类方法
5.3.5主题演化方法
5.4研究结果及分析
5.4.1频繁词、关键词、热词以及新词的发现结果及分析
5.4.2社会活力曲线
5.4.3 时序政策文本阶段划分结果及分析
5.4.4政策特征词时间序列聚类结果及分析
5.4.5政策文本主题演化结果与分析
5.5本章小结
6结论与展望
6.1 结论
6.2创新点
6.3展望
参考文献
攻读博士学位期间科研项目及科研成果
致谢
作者简介