统计方法信息抽取中的若干关键技术研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

本文采用统计和机器学习的方法研究信息抽取领域的一些重要问题，提出了一种使用EM算法完成模型参数估计的语种识别方法。该方法基于字符层马尔科夫模型，不需要对语言特点和编码规范的分析，而且与以往的统计语种识别方法相比，能够建立混杂度更小的语言模型。　　　采用条件随机域模型识别复杂最长名词短语，能够回避最大熵隐马尔科夫模型等模型存在的标注偏置问题和传统方法处理长程关联的不足，同时，引入了一种受限的前向-后向解码算法以提高该方法的可实用性。　设计并初步实现了一个信息抽取体系结构MuLIE，并提出了一种与之相适应的分层管道过滤器体系结构风格。它提供信息抽取领域的典型的可重用元素，以支持特定应用的开发，不仅是本文研究成果的有机集成，还将为后继研究提供一个良定义的基础框架。

著录项

作者
冯冲;
展开▼
作者单位

中国科学技术大学;

展开▼
授予单位中国科学技术大学;
学科计算机应用
授予学位博士
导师姓名陈肇雄,黄河燕;
年度 2005
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字信息处理;自动推理、机器学习;
关键词
信息抽取; 统计机器学习; 指数线性模型; 语种识别;

相似文献

中文文献
外文文献
专利

1. 省级地理信息监测基本统计方法及关键技术研究 [J] . 郭倩 . 科技创新导报 . 2021,第011期
2. 基于.NET的Web信息抽取系统关键技术研究 [J] . 谭锋 ,李天真 ,崔亮亮 . 软件导刊 . 2010,第012期
3. 基于.NET的Web信息抽取系统关键技术研究 [J] . 谭锋 ,李天真 ,崔亮亮 . 软件导刊 . 2010,第012期
4. 非结构化信息抽取关键技术研究探讨 [J] . 周法国 ,王映龙 ,杨炳儒 . 计算机工程与应用 . 2009,第014期
5. 基于统计方法从文本中抽取分词词典 [J] . 黄超 . 电脑知识与技术 . 2020,第004期
6. 基于语料库统计方法在汉字文本识别应用中的若干问题 [C] . 夏莹 . 全国第四届计算机语言学联合学术会议 . 1997
7. 面向Web信息集成的Web信息抽取中若干关键问题的研究 [A] . 滕伟 . 2007

统计方法信息抽取中的若干关键技术研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅