声明
1 绪论
1.1 选题的背景和研究意义
1.2 国内外研究现状
1.2.1 国外研究现状
1.2.2 国内研究现状
1.3 本文的主要内容
1.4 本文的组织结构
2 垃圾弹幕过滤问题定义与分析
2.1 垃圾弹幕过滤问题定义
2.2 文本分类算法
2.2.1 k近邻
2.2.2 支持向量机
2.2.3 朴素贝叶斯
2.2.4 决策树算法
2.3 弹幕文本特征分析
2.4 本章小结
3 基于贝叶斯的垃圾弹幕过滤算法
3.1 文本预处理
3.1.1 去除文本标记
3.1.2 中文分词
3.1.3 去除停用词
3.2 基于贝叶斯算法的垃圾弹幕过滤模型构建
3.2.1 文本表示
3.2.2 特征选取
3.2.3 利用后验概率分类
3.2.4 用户等级辅助分类
3.2.5 弹幕连续相似性优化
3.3 算法流程说明
3.4 本章小结
4 实验设计
4.1 数据采集
4.1.1 协议说明
4.1.2 弹幕爬虫设计
4.2 算法应用
4.2.1 文本预处理实现
4.2.2 缓存实现
4.2.3 应用程序展示
4.3 算法测试与分析
4.3.1 评价指标
4.3.2 实验结果
4.4 本章小结
5 总结与展望
5.1 全文总结
5.2 未来展望
致谢
参考文献
硕士期间参与的项目