首页> 中文学位 >基于分治策略的新闻文本匹配方法研究
【6h】

基于分治策略的新闻文本匹配方法研究

代理获取

目录

声明

摘要

第1章绪论

1.1课题背景

1.2本文工作与贡献

1.3论文组织

第2章相关工作与相关模型介绍

2.1深度文本匹配

2.1.1基于表示学习的文本匹配模型

2.1.2直接建模匹配的深度模型

2.2基于图的文本匹配方法

2.2.1文本的图表示方法

2.2.2构建知识图谱的方法

2.3预训练模型

2.3.1语言嵌入模型(ELMo)

2.3.2生成预训练模型

2.3.3双向编码预训练模型(BERT)

2.4本章小结

第3章问题描述与系统框架

3.1.1相关概念

3.1.2问题描述

3.2技术难点

3.3系统框架与主要流程

3.4本章小结

第4章文本预处理与文本实体识别

4.1文本预处理

4.1.1文本清洗

4.1.2文本分句

4.2实体识别

4.2.1 Bert模型

4.2.2 CRF层

4.2.3模型训练及预测

4.3本章小结

第5章实体交互图模型构建

5.1实体交互图构建

5.2局部匹配特征抽取

5.2.1 TF-IDF相似度

5.2.2 BM25相似度

5.2.3 Jaccard相似度

5.2.4 Ochiai相似度

5.2.5最长公共子串长度

5.2.6深度语义相似特征

5.3本章小结

第6章匹配特征交互与特征聚合

6.1循环神经网络模型

6.1.1 GRU网络

6.1.2模型结构

6.2图注意力网络模型

6.2.1 GATs网络

6.2.2计算过程

6.3新闻事件相似度计算

6.4本章小结

第7章实验结果与分析

7.1实验环境

7.2实验数据集

7.3评价指标

7.4实验设置

7.5实验结果与分析

7.5.1新闻文本匹配实验结果

7.5.2样例分析

7.5.3局部特征与特征交互实验结果

7.5.4新闻事件统计

7.6本章小结

第8章总结与展望

8.1工作总结

8.2未来研究工作展望

参考文献

攻读硕士学位期间主要的研究成果

致谢

展开▼

著录项

  • 作者

    翁润泽;

  • 作者单位

    浙江大学;

  • 授予单位 浙江大学;
  • 学科 计算机科学与技术
  • 授予学位 硕士
  • 导师姓名 寿黎但;
  • 年度 2020
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 TP3TP1;
  • 关键词

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号