首页> 中文学位 >基于Web信息的内容及其特征提取方法的研究
【6h】

基于Web信息的内容及其特征提取方法的研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

1.1 研究背景和意义

1.2 国内外现状研究

1.3 问题综述

1.4 本文的研究内容

1.5 本章小结

第二章 相关技术及理论

2.1 作者身份鉴别的一般方法

2.2 Web信息的种类

2.3 Web页面知识

2.4 电子邮件基本知识

2.5 文本挖掘与文本分类关键技术

2.6本章小结

第三章 Web信息的内容提取技术研究

3.1 研究的主要任务

3.2 BBS页面的内容提取

3.3 中文电子邮件的内容提取

3.4 Web信息内容提取实验

3.5 本章小结

第四章 Web信息特征分析与提取方法研究

4.1 Web信息的特点概述

4.2 Web信息的特征分析

4.3 特征提取方法分析

4.4潜在特征词提取方法研究

4.5 特征表达与利用方法研究

4.6 Web信息的特征提取实验

4.7 本章小结

第五章 总结与展望

致谢

参考文献

攻硕期间取得的研究成果

展开▼

摘要

随着全球信息化的程度日益加深,种类多样的Web信息已经成为人们日常生活和工作中获取信息的重要形式。Web信息资源的迅速增长,一方面提供给了人们一个方便快捷获取全球各种信息的途径,给人们的工作、学习和生活带来了极大便利;但另一方面,Web信息的滥用也日益成为互联网领域的一大难题,如:在互联网上出现的许多色情、反动、暴力等不健康的内容,还有不法分子利用BBS、电子邮件等形式进行反动宣传、诈骗、敲诈勒索和恐怖威胁等非法活动,这些非法信息在浪费宝贵网络资源的同时,还破坏了网络文明,给社会秩序和人身安全等方面造成了极大的危害。为了维护网络文明和社会秩序,就需要找出这些非法信息的发布源并予以处置。然而这些非法信息的发布者总是想方设法掩盖其真实身份以逃避侦查,如何在海量的信息中找出这些非法信息的发布源,还原他们的真实身份并依法处置,是亟待解决的关键问题。
  在对Web信息发布源进行同一认定的过程中,特征的提取是关键性的问题。Web信息中包含的许多与主题无关的信息,在一定程度上影响了Web信息特征提取的效率。所以在各种Web信息处理系统中,Web信息内容的提取是必需解决的基础问题。
  考虑到这种社会需求和研究背景,本研究决定针对Web信息的内容及其特征提取方法展开研究。本研究的目的就是以中文Web信息文本为研究对象,借鉴中文电子邮件特征提取的方法[9],分析研究 Web信息的内容及其特征提取方法,为Web信息发布源同一认定的研究奠定基础,从而达到识别Web信息发布者真实身份的目的,为计算机取证提供依据,追究Web信息作者的责任,具有重要的应用价值和现实意义。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号