声明
第一章 绪论
1.1 课题来源及研究的目的和意义
1.2 国内外在该方向的研究现状及分析
1.2.1 TFIDF的发展现状
1.2.2 文本分析的发展现状
1.3 本章小结
第二章 传统TFIDF算法介绍与改进
2.1传统的TFIDF算法
2.2 TFIDF的不足之处
2.3 对传统的TFIDF算法进行改进
2.4 本章小结
第三章 算法在文本分析中的应用
3.1 相关理论研究
3.1.1 对中文分词的研究
3.1.2 算法在Hadoop中运算的可行性
3.2 将算法应用于文本分析
3.2.1 爬虫的构建
3.2.2 文本预处理和分词
3.2.3 在MapReduce中实现改进的TFIDF算法
3.2.4 文本分析结果
3.3 本章小结
第四章 实验结果与分析
4.1 与TFIDF算法比较
4.1.1 评价指标
4.1.2 试验结果分析
4.2 与主题词挖掘算法比较
4.2.1 成对比较法
4.2.2 试验结果分析
4.3 本章小结
第五章 结论与未来展望
5.1 结论
5.2 未来展望
致谢
参考文献