首页> 中文学位 >基于论坛网页的信息抽取与情感分析研究
【6h】

基于论坛网页的信息抽取与情感分析研究

代理获取

目录

声明

第1章 绪论

1.1 课题背景及意义

1.2 研究现状

1.2.1 Web信息抽取研究现状

1.2.2 情感分析研究现状

1.3 论文主要研究内容

1.4 论文章节安排

第2章 相关理论与技术

2.1 Web信息抽取相关概念

2.1.1 HTML与DOM

2.1.2 Web信息抽取流程

2.2 Web信息抽取技术研究

2.2.1 基于包装器的Web信息抽取

2.2.2 基于视觉分块的Web信息抽取

2.2.3 基于DOM树的Web信息抽取

2.3 深度学习相关技术

2.3.1 词向量

2.3.2 循环神经网络

2.4 情感分析方法

2.4.1 基于情感词典的情感分析

2.4.2 基于机器学习的情感分析

2.4.3 基于深度学习的情感分析

2.5 本章总结

第3章 论坛网页的预处理及页面分块

3.1 网页获取及预处理

3.1.1 网页的获取

3.1.2 网页的清洗

3.2 Web页面分块

3.2.1 HTML的结构分析

3.2.2 HTML的table分析

3.2.3 HTML的div分析

3.2.4 基于HTML标签的页面分块算法

3.3 实验数据集

3.3.1 Web信息抽取实验数据集

3.3.2 情感分析实验数据集

3.4 本章小结

第4章 基于网页分块与DOM树的Web信息抽取

4.1 基于DOM子树的相似度算法提取Web 信息

4.1.1 楼层标准值

4.1.2 基于子树自由匹配的相似度度量

4.1.3 评论信息抽取

4.2 基于网页分块与深度加权DOM子树的相似度算法提取Web信息

4.2.1 网页正文块的识别

4.2.2 基于深度加权的DOM子树相似度度量

4.2.3 基于网页分块与深度加权DOM子树的Web信息抽取

4.3 基于DOM树的叶节点路径提取Web信息

4.3.1 树路径与树路径相似度

4.3.2 基于叶节点路径的Web信息抽取

4.4 实验结果与分析

4.4.1 评价指标

4.4.2 实验结果与分析

4.5 本章小结

第5章 基于多种Attention机制的情感分析

5.1 模型流程

5.1.1 文本预处理

5.1.2 文本向量化表示

5.2 基于BiGRU的情感分类

5.2.1 GRU网络模型

5.2.2 基于BiGRU的的情感分类模型

5.3 基于多种Attention机制的BiGRU情感分类

5.3.1 Attention模型原理

5.3.2 引入多种Attention机制的BiGRU分类模型

5.4 实验结果与分析

5.4.1 评价指标

5.4.2 实验结果与分析

5.5 本章小结

第6章 总结和展望

6.1 总结

6.2 展望

参考文献

发表论文和参加科研情况说明

发表学术论文

致谢

展开▼

著录项

  • 作者

    班鑫;

  • 作者单位

    天津大学;

  • 授予单位 天津大学;
  • 学科 控制科学与工程
  • 授予学位 硕士
  • 导师姓名 薛俊韬;
  • 年度 2019
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 R74G44;
  • 关键词

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号