首页> 中文学位 >网络论坛舆情信息的收集与管理技术研究
【6h】

网络论坛舆情信息的收集与管理技术研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

1.1课题研究背景与意义

1.2研究现状

1.3本文主要完成的工作

1.4 本文的组织结构

第二章 相关概念以及体系结构

2.1 BBS概述

2.2网络爬虫概述

2.3 信息抽取技术

2.4 中文分词和索引概述

2.5 J2EE平台概述

2.6 Spring概述

2.7 DWR概述

2.8系统结构设计

2.9 小结

第三章 系统详细设计

3.1网络爬虫设计

3.2 信息提取设计

3.3. 网页内容存储

3.4 Spring和DWR整合

3.5 小结

第四章实验结果与分析

4.1 系统开发环境以及配置

4.2实验过程

4 .3本章小结

第五章 总结与展望

参考文献

致谢

个人简历、在学期间发表的学术论文与研究成果

展开▼

摘要

随着互联网的发展使得网络舆情成为研究热点,各地网民规模继续稳步增长,作为舆情信息来源之一的论坛/BBS用户规模日益庞大,因此对论坛做好舆情监测,是网络舆情监测工作的重要部分。网络舆情监测主要包括“网络舆情采集”和“网络舆情分析”,舆情信息采集是舆情分析的基础,因此对舆情信息采集的研究具有重要意义。
  本文首先论述了相关概念和技术,然后针对BBS的结构给出了提高信息获取,处理和存储管理效率的办法,最后在实验数据中给出相关处理的结果以及在Spring+DWR框架下实现舆情信息显示和热点信息查询等。
  论文主要完成了以下几个方面的工作:
  1)舆情信息获取技术方面,本文研究了BBS结构特征,深入分析了Heritrix的功能结构和实现原理,针对BBS结构利用扩展的Heritrix提取器设计了BBS舆情信息获取方案。
  2)舆情信息处理技术方面,研究利用Htmlparser实现信息提取,深入分析了Htmlparser的功能结构和实现原理,设计信息提取方案。
  3)数据库存储技术方面,把舆情信息处理结果进行数据库存储以及对帖子标题建立索引,并给出了效率的对比。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号