基于策略梯度的对抗文本生成方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

人工智能技术近年来迅猛发展，可以轻松提取出自然数据中的特征和内在联系，非常擅长拟合高度非线性关系。因此，人工智能技术被广泛地应用于图像检测、语音识别、和自然语言处理任务中，并表现出了优异的性能。随着这些实际应用的推广使用，人工智能技术的安全性越来越引起重视。特别是对抗样本的发现使这些人工智能技术的应用面临巨大的威胁。通过研究对抗样本的生成方法，可以探索对抗样本存在的本质，更深层次的思考人工智能技术。研究对抗样本的产生和防御，开展人工智能技术的攻防战可以不断提升人工智能技术，进一步保障人工智能技术在实际应用中的安全性。　　对抗样本在图像分类器中被首次发现，在图像上增加人类察觉不到的噪声就可以让图像分类器分类错误。由于图像特征的丰富性和连续性，对抗图像的生成方法非常多样化。但是因为文本数据具有离散的特点，生成对抗图像的方法不适用于对抗文本生成。本文主要研究内容为对抗文本的生成方法，提出了一种基于策略梯度的对抗文本生成方法。在实际情况中很难获取到目标文本分类器的模型结构和参数信息，所以本文所提出的方法是在黑盒条件下对目标模型进行攻击。针对文本数据离散，无法直接加入连续扰动的特点，使用文本编码器来进行对抗文本生成。文本编码器将离散文本数据映射到连续的隐藏空间中，并基于隐藏空间特征向量生成文本。在没有标准对抗文本数据集的情况下，为了使文本编码器可以生成保留原始语义并能够使分类器分类错误的对抗文本，利用强化学习中策略梯度算法来对文本编码器中的参数进行调节。策略梯度的调节方式是最大化原始文本和生成文本样本对的奖励。只需将奖励的计算方式中纳入文本对分类结果差异和相似度计算便可以调整文本生成器参数，生成攻击效果显著的对抗文本。相比于现有的人为在文本中增加单词级或字符级的扰动，本文所提出的方法可以批量地生成更加自然的对抗文本。　　最后，本文基于深度学习框架Tensorflow实现了基于策略梯度的对抗文本生成方法，并在7个真实的自然语言处理数据集上进行攻击实验分析其性能。分析实验结果，本文提出方法生成的对抗文本可以使得准确率为95.9%的文本分类器下降53.48%。生成的对抗文本在不同的数据集上的降低的准确率在29.89%到53.28%之间。对抗文本与原文本的相似度分集中在0.8到0.9之间，并且生成的对抗文本对不同的文本分类模型都有攻击效果，具有可迁移性。

著录项

作者
周文;
展开▼
作者单位

湖南大学;

展开▼
授予单位湖南大学;
学科计算机科学与技术
授予学位硕士
导师姓名唐卓;
年度 2020
页码
总页数
原文格式 PDF
正文语种 chi
中图分类
关键词
对抗文本,自然语言处理,策略梯度,自编码器,深度学习;

相似文献

中文文献
外文文献
专利

1. 加入目标指导的强化对抗文本生成方法研究 [J] . 张志远 ,李媛媛 . 计算机应用研究 . 2020,第011期
2. 基于多层次分辨率递进生成对抗网络的文本生成图像方法 [J] . 许一宁 ,何小海 ,张津 . 计算机应用 . 2020,第012期
3. 基于对抗式生成网络的电力用户意图文本生成 [J] . 俞畅 ,欧阳昱 ,张波 . 微型机与应用 . 2019,第011期
4. 基于对抗式生成网络的电力用户意图文本生成 [J] . 俞畅 ,欧阳昱 ,张波 . 信息技术与网络安全 . 2019,第011期
5. 基于策略梯度和生成式对抗网络的变压器油色谱案例扩充方法 [J] . 李雅欣 ,侯慧娟 ,胥明凯 . 电力自动化设备 . 2020,第012期
6. 基于生成式对抗网络的文本生成研究 [C] . 代威 ,陈博 ,熊振 . 辽宁省通信学会2019年度学术年会 . 2019
7. 基于遗传算法的对抗文本生成方法研究 [A] . 李呈隆 . 2019

基于策略梯度的对抗文本生成方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅