面向中文文本分类的词级对抗样本生成方法

仝鑫; 王罗娜; 王润正; 王靖亚

首页> 中文期刊> 《信息网络安全》 >面向中文文本分类的词级对抗样本生成方法

面向中文文本分类的词级对抗样本生成方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对基于深度学习方法的中文文本分类模型的鲁棒性问题,文章提出一种词级黑盒对抗样本生成方法CWordAttacker.该算法采用定向词删除评分机制,能够在模型内部细节未知的情况下定位显著影响分类结果的关键词,并使用繁体、拼音替换等多种攻击策略生成与原句语义一致的对抗样本,可完成定向和非定向两种攻击模式.在情感、垃圾短信和新闻分类数据集上针对LSTM、TextCNN和带注意力的CNN模型进行测试的结果表明:CWordAttacker能够以较小的扰动大幅度降低靶机模型准确率.

著录项

来源
《信息网络安全》 |2020年第9期|12-16|共5页
作者
仝鑫; 王罗娜; 王润正; 王靖亚;
展开▼
作者单位

中国人民公安大学信息网络安全学院北京 100038;

北京字节跳动科技有限公司北京 100000;

中国人民公安大学信息网络安全学院北京 100038;

中国人民公安大学信息网络安全学院北京 100038;

展开▼
原文格式 PDF
正文语种 chi
中图分类安全保密;
关键词
对抗样本; 自然语言处理; 中文文本分类; 黑盒攻击; 人工智能安全;

相似文献

中文文献
外文文献
专利

1. 面向中文文本倾向性分类的对抗样本生成方法 [J] . 王文琦 ,汪润 ,王丽娜 . 软件学报 . 2019,第008期
2. 一个面向文本分类的中文特征词自动抽取方法 [J] . 付德宇 ,代成琴 . 计算机工程与应用 . 2006,第015期
3. 基于BERT的子词级中文文本分类方法 [J] . 李思锐 . 计算机科学与应用 . 2020,第006期
4. 对抗攻击及对抗样本生成方法综述 [J] . 蔡秀霞 ,杜慧敏 . 西安邮电学院学报 . 2021,第001期
5. 对抗攻击及对抗样本生成方法综述 [J] . 蔡秀霞 ,杜慧敏 . 西安邮电大学学报 . 2021,第001期
6. 基于类别核心词的朴素贝叶斯中文文本分类 [C] . 袁方 ,苑俊英 . 第四届全国搜索引擎和网上信息挖掘学术研讨会（SEWM2006） . 2006
7. 针对中文文本分类的对抗样本生成方法 [A] . 裴歌 . 2020

面向中文文本分类的词级对抗样本生成方法

摘要

著录项

相似文献

相关主题

期刊订阅