摘要
图目录
表目录
第1章 绪论
1.1 研究背景
1.2 研究内容及意义
1.3 本文的主要工作综述
1.4 本文的组织结构
1.5 本章小结
第2章 理论基础和相关技术
2.1 主题模型(Topic Model)
2.1.1 潜在语义分析(LSA)
2.1.2 概率潜在语义分析(PLSA)
2.1.3 潜在狄利克雷分配模型(LDA)
2.2 多视图学习
2.3 聚类分析
2.3.1 K-means聚类
2.3.2 谱聚类(Spectral Clustering)
2.4 本章小结
第3章 多视图专利聚类
3.1 专利数据分析
3.2 多视图构建
3.2.1 相同作者关系
3.2.2 基于树距离的IPC分类相似性
3.2.3 文档相似度
3.3 多视图融合及算法与实现
3.4 本章小结
第4章 基于概率潜在语义分析的技术演化追踪
4.1 自适应宽度滑动窗口法
4.1.1 朴素滑动窗口法
4.1.2 窗口大小的选择
4.2 增量式概率潜在语义分析
4.3 检测新兴技术与热门词汇
4.3.1 新兴技术检测
4.3.2 热门词汇分析
4.4 本章小结
第5章 实验结果和分析
5.1 实验数据集
5.1.1 实验软硬件环境
5.2 算法评价标准
5.2.1 准确率(AC)
5.2.2 共同信息(MI)
5.3 实验结果及分析
5.3.1 多视图专利聚类实验
5.3.2 多视图融合参数的选择
5.3.3 新兴技术检测
5.4 本章小结
第6章 总结与展望
6.1 总结
6.2 展望
参考文献
攻读硕士学位期间主要的研究成果
致谢
浙江大学;