摘要
第一章 绪论
1.1 课题研究的背景
1.2 国内外研究现状
1.3 本文的研究内容和论文结构
1.3.1 本文研究的内容
1.3.2 本文结构安排
第二章 基于规则方法研究
2.1 基于规则相关技术
2.1.1 正则表达式
2.1.2 Trie树
2.2 构成时态关键词的元素
2.2.1 时态粒度刻画
2.2.2 时态关键词组合
2.3 时态关键词规则树
2.3.1 Trie树的插入与构建操作
2.3.2 时态关键词规则树的遍历识别
2.4 基于时态关键词规则树的识别算珐
2.5 本章小结
第三章 基于机器学习方法研究
3.1 基于机器学习方法的相关技术
3.1.1 中文分词简介
3.1.2 短语结构树简介
3.1.3 特征选择
3.1.4 谱聚类算法简介
3.2 基于短语划分的聚类识别算法模型
3.3 文本短语划分
3.3.1 短语结构树的元素表
3.3.2 短语结构树等价子树集合
3.3.3 短语划分
3.4 短语向量化表示
3.4.1 特征生成与特征选取
3.4.2 短语的时间特征表示
3.4.3 短语的向量化表示
3.5 基于谱聚类的识别
3.5.1 谱聚类的计算优化
3.5.2 基于谱聚类的识别算法
3.6 本章小结
第四章 实验结果与分析
4.1 实验语料简介
4.2 测评标准
4.3 实验结果
4.3.1 基于短语划分的聚类识别的实验结果
4.3.2 基于时态关键词规则树算法的实验结果
4.4 实验结果对比
4.5 实验总结
第五章 总结与展望
5.1 总结
5.2 展望
参考文献
攻读学位期间发表的论文
声明
致谢