首页> 中文学位 >基于HMM与WNN混合模型的Web信息抽取研究
【6h】

基于HMM与WNN混合模型的Web信息抽取研究

代理获取

目录

封面

声明

目录

中文摘要

英文摘要

第一章 概述

1.1 研究的背景及意义

1.2 国内外研究现状

第二章 HMM和WNN混合模型的理论基础

2.1 HMM理论

2.2 WNN理论

2.3 HMM和WNN混合模型中需要用到的一些其他理论

第三章WNN在信息抽取中的应用

3.1 数据预处理

3.2 WNN在信息抽取中的应用

3.3 小波神经网络在信息抽取时需注意的问题

第四章 HMM在信息抽取中的应用

4.1 HMM在信息抽取中的应用

4.2 HMM在信息抽取中的改进

4.3 HMM模型在信息抽取时一些应该注意的问题

第五章 HMM与WNN混合模型在信息抽取中的应用

5.1 HMM与WNN混合模型的建立

5.2 HMM与WNN混合模型的训练

5.3 实验与结果分析

第六章 结论与展望

参考文献

攻读硕士学位期间发表的论文

致谢

展开▼

摘要

本文提出一种将隐马尔科夫模型(HMM)和小波神经网络(WNN)相结合的混合模型应用于信息抽取。混合模型首先将网页节点特征化,并依据网页内容建立不同的HMM,之后通过WNN选取相应HMM用于信息抽取。HMM无法准确抽取的重要信息,利用WNN做辅助判别。实验证明,该混合模型可以提高Web信息抽取的精准度。
  本研究主要内容包括:⑴对Web页面进行解析。解析页面的同时利用正则表达式技术,将Web节点特征化。特征化节点这一步骤需要根据 Web大体环境,及待抽取信息的特点设计一组正则表达式及一套特征化方案。特征化之后,所有 Web页面都可以映射成一组特征值序列流,作为混合模型的输入。⑵建立小波网络模型。本文将建立三种小波网络模型,在文中将会被分别称为WNN1,WNN2,WNN3。WNN1用于计算HMM的观察概率密度,WNN2用于从建立的HMM集合中选取一个具体的HMM应用于待抽取信息的网页块,WNN3用于在HMM不能很好的抽取时,直接从网页块中抽取信息。⑶建立隐马尔科夫模型集合。特定类型的Web页面,或者 Web块将会对应于特定的HMM。信息抽取之前,混合模型会根据Web环境及待抽取信息建立一个HMM的集合。模型的训练阶段乃至实际的信息抽取过程中,如果已有的HMM不能很好的进行信息抽取,需要利用信息准则模型来进行HMM状态节点的分裂,自动生成新的HMM。最后给出了HMM与WNN混合模型用于实际Web环境的信息抽取实验,并根据实验结果给出混合模型的不足和需要改进的地方。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号