基于深度学习的英文文本可读性度量研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

阅读能力是语言习得的重要组成部分，而人们的阅读水平和理解能力不尽相同，因此，对于不同的语言学习者和从事语言教学工作的教师来说，要找到适用自己阅读学习的文本材料和收集适合相应学生阅读能力的教学材料是件费时费力的事情，所以也就有了大量度量文本可读性的需求。本文通过综述文本可读性的研究现状，分析总结文本可读性的度量研究成果，针对现有的文本可读性度量方法的局限性，引入基于深度学习的英文文本可读性的度量方法，旨在通过学习表示训练一个能够分析跨领域文本，通用性强，自动化好，性能高的可读性度量模型。　　现将本文的主要研究贡献概括如下：　　①提出了基于混合网络模型的英文文本可读性度量法。针对文本可读性度量的传统公式法和基于机器学习的度量法都过于依赖人工专家的经验来提取特征，限制了其实用性的痛点以及随着被提取使用的文本可读性度量特征种类越来越多，数量越来越大，人工提取深层特征的难度也越来越难，而且容易引入无关特征或冗余特征，造成模型性能下降的问题。本文引入了深度学习中混合网络模型的概念，通过组合卷积神经网络和双向长短时记忆网络和注意机制网络构建适合文本可读性度量的混合网络模型，通过表示学习代替人工自动提取特征，大大的提高了文本可读性的度量效率和性能。　　②提出了基于分层混合网络模型的英文文本可读性度量法。针对先前的研究和本文中所使用的混合网络模型都将整篇文档当作一个由词序列构成的长序列来处理，这样的处理方式会使得篇章的特征表示像行文逻辑关系，句子的上下文信息等相关特征丢失。也与人类将文档看作是由句子序列组成，而句子序列才由词序列构成的认知不符等这些不足，本文引入了分层混合网络模型的概念，构建了基于分层卷积循环注意机制网络的混合网络模型来度量英文文本的可读性，并通过实验证明了其模型有良好的性能。　　③设计了一个适合度量文本可读性的损失函数。一般基于深度学习的文本可读性度量法都是将文本可读性度量看作一个文本分类任务来完成，而分类任务中交叉熵损失函数的优越性能是其他损失函数很难逾越的。但文本可读性度量又因为其文本阅读难度等级标签之间有渐进关系，所以与一般的分类任务标签之间是相互独立的关系相比较有本质上的差别，基于此考虑，本文以交叉熵损失函数为主，以均方误差损失函数为辅的构造了一个主辅双损失的形式来联合训练我们的网络模型，通过实验证明其对整个模型的性能有一定的提升。

著录项

作者
沙政;
展开▼
作者单位

重庆大学;

展开▼
授予单位重庆大学;
学科工程(计算机技术)
授予学位硕士
导师姓名伍星;
年度 2019
页码
总页数
原文格式 PDF
正文语种 chi
中图分类
关键词
文本可读性,混合网络模型,注意机制网络,分层混合网络模型;

相似文献

中文文献
外文文献
专利

1. 基于深度学习的中英文混合短文本情感分析 [J] . 龚泽阳 ,徐华韫 ,何正杰 . 信息与电脑 . 2019,第005期
2. 年报可读性与股票流动性研究--基于文本挖掘的视角 [J] . 王运陈 ,贺康 ,万丽梅 . 证券市场导报 . 2020,第7期
3. 基于读者反应的红色旅游英译文本可读性研究 [J] . 徐睿 . 井冈山大学学报（社会科学版） . 2017,第001期
4. 基于图像区分模型的标牌可读性度量方法 [J] . 门海艳 ,杨凯 ,黎谦 . 计算机工程与设计 . 2010,第020期
5. 基于深度学习和距离度量的行人再识别研究 [J] . 韦忠亮 ,张顺香 ,梁兴柱 . 阜阳师范学院学报（自然科学版） . 2019,第002期
6. 文本可读性的自动分析研究综述 [C] . Wu Siyuan ,吴思远 ,Cai Jianyong . 第十七届全国计算语言学学术会议暨第六届基于自然标注大数据的自然语言处理国际学术研讨会（CCL 2018） . 2018
7. 西北土特名产英文推介文本的可读性研究 [A] . 林杜君 . 2016

基于深度学习的英文文本可读性度量研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅