首页> 中文期刊>计算机技术与发展 >基于EDA和回译的导游投诉文本混合增强方法

基于EDA和回译的导游投诉文本混合增强方法

     

摘要

近年来,使用机器学习算法从导游投诉文本数据中识别出导游违规行为,辅助旅游监管人员工作,为旅游监管提供依据,成为一个必然趋势.然而导游投诉文本存在着语料单一、难以获取等困难,如何对这些导游投诉文本进行文本增强以满足导游违规行为识别需要,是一个迫切需要解决的问题.针对这一问题,提出了一种基于EDA(easy data augmentation)和回译的导游投诉文本混合增强方法.从EDA和回译两个角度对导游投诉文本进行增强,将两种方法返回的增强投诉语料进行混合,得到最终的增强文本;并将该方法在实际的导游违规行为识别系统中进行了应用与验证.通过大量实验对该方法与传统的EDA文本增强方法、回译文本增强方法进行了分析与对比,实验数据表明,基于EDA和回译的导游投诉文本混合增强方法相对于其他两种传统文本增强方法具有更高的准确率和更优秀的文本增强效果,应用在实际的导游违规行为识别系统中得到了87.54%的准确率,相比原始数据集准确率提升了7.4%.

著录项

  • 来源
    《计算机技术与发展》|2021年第3期|21-26|共6页
  • 作者单位

    电子科技大学 信息与软件工程学院 四川 成都 610054;

    中电科大数据研究院有限公司 贵州 贵阳 550022;

    中电科大数据研究院有限公司 贵州 贵阳 550022;

    提升政府治理能力大数据应用技术国家工程实验室 贵州 贵阳 550022;

    电子科技大学 信息与软件工程学院 四川 成都 610054;

    中电科大数据研究院有限公司 贵州 贵阳 550022;

    电子科技大学 信息与软件工程学院 四川 成都 610054;

    中电科大数据研究院有限公司 贵州 贵阳 550022;

    提升政府治理能力大数据应用技术国家工程实验室 贵州 贵阳 550022;

    中电科大数据研究院有限公司 贵州 贵阳 550022;

    提升政府治理能力大数据应用技术国家工程实验室 贵州 贵阳 550022;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 信息处理(信息加工);
  • 关键词

    导游违规行为识别; 文本增强; EDA; 回译; 混合增强;

  • 入库时间 2022-08-20 03:40:31

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号