首页> 中文学位 >基于词、段向量化表示的文本主题抽取技术研究
【6h】

基于词、段向量化表示的文本主题抽取技术研究

代理获取

目录

声明

第一章 绪论

1.1 自动文本摘要概述

1.1.1 自动文本摘要的发展及现状

1.1.2 自动文本摘要的评价

1.2 自动文本摘要相关技术

1.3 本文的研究工作

1.4 本文的组织结构

第二章 词向量生成方法

2.1 词向量生成模型

2.1.1 one-hot模型

2.1.2 奇异值分解模型

2.1.3 基于迭代的词嵌入模型

2.1.4 word2vector模型

2.2 基于最小二乘法的词嵌入模型

2.3 词向量评价模型

第三章 段向量生成方法

3.1 doc2vector模型

3.1.1 两种段向量生成模型

3.1.2 段向量评价模型

3.2 均值模型与拼接模型

3.3 神经网络训练模型

3.4 段向量评价模型

第四章 关键词提取方法

4.1 基于统计的关键词抽取算法

4.2 基于语义的关键词提取算法

4.3 基于机器学习的关键词提取算法

4.4 基于段向量的关键词提取算法

第五章 主题句抽取技术

5.1 基于统计特征的主题句抽取方法

5.1.1词概率模型

5.1.2 文档-逆文档频率模型

5.1.3其他统计特征

5.2 基于图排序的主题句抽取

5.3 基于排序学习模型的主题句抽取

5.4 摘要质量评价方法

第六章 结束语

6.1 全文工作总结

6.2 工作展望

致谢

参考文献

作者在学期间取得的学术成果

展开▼

著录项

  • 作者

    申强强;

  • 作者单位

    国防科学技术大学国防科技大学;

  • 授予单位 国防科学技术大学国防科技大学;
  • 学科 计算机应用技术
  • 授予学位 硕士
  • 导师姓名 熊岳山;
  • 年度 2018
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 TP3O23;
  • 关键词

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号