首页> 中文学位 >上市公司公告信息抽取方法研究与实现
【6h】

上市公司公告信息抽取方法研究与实现

代理获取

目录

声明

第一章 绪论

1.1 研究背景与选题意义

1.2 信息抽取研究现状

1.2.1 命名实体识别研究进展

1.2.2 关系抽取研究进展

1.3 本文研究内容

1.4 论文组织架构

第二章 相关背景技术

2.1 词向量相关技术

2.1.1 one-hot词向量

2.1.2 Word2vec词向量原理

2.2 命名实体识别相关技术

2.2.1 隐马尔可夫模型与维特比解码

2.2.2 条件随机场模型

2.2.3 循环神经网络及其变体

2.2.4 卷积神经网络

2.3 信息抽取评价指标

2.4 本章小结

第三章 公告半结构化文本信息抽取方法研究

3.1 引言

3.2 问题描述

3.3 表格数据预处理

3.3.1 日期数据预处理

3.3.2 数字单位统一及预处理结果样例展示

3.4 基于词典的半结构化文本信息抽取

3.5 基于CBLC模型的半结构化文本信息抽取

3.5.1 Transformer编码器原理

3.5.2 BERT预训练模型原理

3.5.3 CBLC模型原理

3.5.4 基于CBLC模型的半结构化文本信息抽取

3.6 基于词典与模型联合抽取的半结构化文本实体识别方法

3.7 实验结果分析

3.7.1 实验准备

3.7.2 实验结果和讨论

3.8 本章小结

第四章 公告非结构化文本信息抽取方法研究

4.1 引言

4.2 问题描述

4.3 非结构化文本数据预处理与标注

4.4 非正常断句检测与合并

4.4.1 问题分析

4.4.2 非正常断句识别与合并规则设计

4.5 非结构化文本核心句子识别

4.5.1 核心句子识别问题分析

4.5.2 基于Word2vec-TextCNN模型的核心句子识别

4.5.3 实验准备与结果分析

4.6 基于多任务学习的句子序列标注方法

4.6.1 BILSTM-CRF模型原理

4.6.2 基于BERT-BILSTM-CRF模型和多任务学习的序列标注方法

4.7 实验结果分析

4.7.1 实验准备

4.7.2 实验结果讨论

4.8 本章小结

第五章 上市公司公告信息抽取系统设计

5.1 引言

5.2 上市公司公告信息抽取系统流程设计

5.2.1 上市公司公告信息抽取模块流程设计

5.2.2 上市公司公告信息抽取系统流程设计

5.3 人机交互界面设计

5.4 本章小结

第六章 工作总结与展望

6.1 工作总结

6.2 未来展望

参考文献

攻读硕士学位期间的研究成果目录

致谢

展开▼

著录项

  • 作者

    马强;

  • 作者单位

    东华大学;

  • 授予单位 东华大学;
  • 学科 控制工程
  • 授予学位 硕士
  • 导师姓名 赵鸣博;
  • 年度 2020
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 F83F42;
  • 关键词

  • 入库时间 2022-08-17 11:22:35

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号