首页> 中文学位 >汽车进口关税异常检测
【6h】

汽车进口关税异常检测

代理获取

摘要

异常检测技术广泛应用于现实世界中的许多问题,并且在过去的几十年引起了许多研究领域的关注。它尝试识别数据集中与可获得的预期行为或模式不同的事件、活动或观察结果。税务管理是迫切需要应用该技术的领域之一。逃税和税务欺诈是税务管理中一直关注的问题。为了解决这些问题并提高税收收入,人们越来越重视主动风险管理系统(RMS),这些系统的设计目的就是在计算税收之前识别和降低风险。其中,用于计算税收的一个重要因素就是“税值(value for duty purposes,VDP)”。
  VDP是通过关税率计算出来的税额值。VDP包含了购买物品的实际成本、运费、保险费、港口费等。进口商、结算代理人或海关人员可以篡改VDP,以便进口货物的受益人可以避免或逃避支付适当的税款。因此,本研究的目的是研究一种可以通过深入分析VDP来识别海关交易数据异常的方法。
  本文以马拉维为例。税收对马拉维非常重要,占政府收入的50%以上。政府在对税收征管建立正确的控制体系时出现任何失误都会导致一系列负面影响。那样,政府将无法为行政目的和提供基本服务筹集足够的收入。正是因为这个原因,掌握那些能够影响马拉维准确合理税收的因素是十分重要的。因此,本文提出,通过对税值(VDP)的深入分析,来识别海关交易数据中的异常现象。
  一旦货物被进口到马拉维,他们就会被海关当局保管,直到该货物被征收所有适当的税款为止。因此,进口商应申报其货物,并办理报关手续,以清关货物。货物进入系统进行处理时,处理风险管理模块被触发,强制通过基于配置系统中设置的参数的随机选择,通过三个可用通道之一对货物进行声明。如果声明发送到红色通道(Red Lane),则通常在仓库或代理处内进行文件核查。如果检测到异常或不同寻常的事物,则从海关那里进行调查。如果声明转到黄色通道(Yellow Lane),则声明中所有已经声明的价值都将根据提交给当局的发票进行严格检查,如果怀疑发票已被篡改,则机构检查购买货物的网站。使用的汇率和优惠待遇也将被检查。如果发现异常,则会引发调查,并且在对提出的调查作出响应之前不会处理该声明。这时系统就需要进行异常检测。如果发票上的参数没有改变或不起作用,那么它会成为一个问题,因为大部分的申报最后都是通过红色通道。如果申报货物被选中去绿色通道,那么申报上没有进行物理检查或文件检查,它就会立即被处理和释放。
  海关人员负责根据货运站点报告的资料管理选择模块。系统处理的唯一标准与进口商和代理商相关,而不是VDP。正是在这一点上,本研究中提出的算法将满足当前系统中固有的问题,以避免可能带来不准确的结果的手动干预。
  本研究使用从马拉维税务局(MRA)获得的数据。MRA是一个政府机构,负责对税收的估值、收取和会计工作。MRA成立于1998年,由议会法案于2000年2月启动,作为马拉维政府财政部税务机关。MRA收取的税收被用于马拉维政府推动若干社会经济发展项目的实施,例如建设道路、桥梁、学校、保健设施和提供社会服务。
  本研究采用定量方法。使用统计或数字数据作为研究对象的证据。基于这种方法,本研究从对声明的一些错误的观察开始,以增加对这种情况的大体了解。从2016年1月至2016年7月这6个月期间,共提取了7097笔交易。但由于MRA处理的进口交易量很大,所以7097笔交易只限于与机动车进口有关的交易。除了7097笔交易外,还从MRA网站以及通过与MRA不同部门的海关官员的直接接触中,获得了更多关于税收政策的信息。同时,还从在线图书馆获得了更多的海关知识,如Science Direct、IEEE、Spring Link、ProQuest等。
  然后,对原始数据进行数据预处理,使其成为适合分析的形式。数据处理过程中仅考虑那些对VDP和本文研究有影响的属性。数据清理后,通过使用归一化手段对数据进行标准化。此后,将其用于进行实验。
  本研究的重点是使用机器学习方法检测进口机动车辆税值的异常。首先对正常行为进行观察,再对正常行为建模,作为上下文,开始异常检测过程。不同的分类和聚类方法被用来分类和聚类异常现象。社会科学家统计软件包(SPSS)用于分析数据中各个属性。统计分析的方法包括相关性分析和回归,用来研究数据属性之间的相关性,具体通过有效性检查以检查属性是否彼此显着相关。这一过程是至关重要的,因为在不验证数据相关性的情况下,无法执行所有其他测试。背后的基本思想是,如果属性不相关,那么这些属性对结果没有影响。此外,在SPSS中生成了箱线图,用来显示超出范围的实例。之后,采用WEKA数据挖掘工具建立实际的分类和聚类模型。
  Weka是由怀卡托大学(新西兰)开发的机器学习和统计分析工具,用于处理数据预处理、回归、分类、关联规则和可视化等。该工具是根据通用公共许可证(GNU)在JAVA中编写的。它具有内置的Java库,使其兼容于Java编程环境中并用作图形用户界面(GUI)来访问各种功能进行分析。在WEKA中,首先检查数据是否正常;此后,将其作为基准精度检验进行ZeroR分析,其后采用J48、Logistic和Decision Table算法进行三次分类实验。另外,也对数据使用K-means算法进行聚类分析,以检查异常点。最后,使用四分位法进一步分析数据集,以检查其是否包含任何异常。聚类背后的主要动机是将数据分成不同类型的群组或群集。该算法的使用有助于根据各自的群集对类别进行分组。将数据分为训练集和测试集两个子集,使用交叉验证进行模型选择,训练集用于拟合模型,然后通过评估预测误差来验证模型的拟合效果。
  SPSS的分析结果表明,用于确定VDP的属性之间存在显着的相关性。制造年份、车辆描述、FOB和定制职责与目标变量VDP呈正相关。使用箱线图进行SPSS的进一步分析能够提取出异常值。对这些异常值的检查可以证实物品是异常还是正常。
  使用WEKA的分类算法根据它们的方法对不同的应用具有不同的性能。使用ZeroR进行的初始(基准)实验有79.97%的异常检测准确率。决策树算法在包含了11种属性的7097个实例的一个交叉验证集上运行,花费008秒建立了一个带有32个叶子、尺寸为55的决策树模型。J48模型可以正确分类7089个(9039%),J48模型的TP率为0.971。此外,模型的FP率为0.366,因此模型可以识别异常事件。当参与者实际属于A类时,算法将其分为A类的精度值大约为91.4%。当参与者实际属于B类时,精度值为84.8%。模型的F-测量值是0.942,证明了模型的召回和精度是均衡的。因此,J48分类器决策树模型成功地检测出了数据中的异常。使用逻辑回归分类器进行了10折交叉验证,其中10个集合共包含7097个具有9个属性的实例,用于构建模型的时间为029秒。结果表明,该模型正确分类了88.87%的实例。逻辑回归模型的正例准确率表现良好,其TP率为0.981,但其FP率为0.48,可见该模型有识别过多负例的趋势。该模型的总体准确率为89.88%,其余的没有正确分类。
  研究还发现使用K-means的聚类算法将数据分为了五个簇。标有C3的类别有1585个异常情况,占样本的22%。使用四分位数范围(IQR)的额外分析能够挑选极值和异常值。对四分之一范围的关注表明,7097例中有12.4%是异常值,有42.5%是极端值。
  在确定交易中存在异常的车辆被单独抽取出来,以确定和说明它们的税值真实异常情况。结果显示,分类为正常车辆的平均VDP为2,533.41美元,而分类为异常的车辆的平均VDP为1,317美元。因此,政府损失了1216.41美元的VDP。这个发现证明了可以使用机器学习方法检测VDP中的异常行为从而服务于关税征收。
  综上所述,本文的研究表明,数据挖掘与机器学习技术可以用于检测海关VDP中的异常情况,并促进征收关税。所有的实验都给出了有效的结果,证明其检测异常的有效性。另外,通过实验比较,进一步确定了哪些方法比其他方法表现更好,实验表明,J48和IQR比其他的方法表现更好。因此,建议采用J48和IQR来分析检测VDP中的异常行为。
  综上所述,本研究在方法研究和实践应用方面都做出了一些贡献。首先,本文提出了一个可用于检测汽车进口关税异常的机器学习框架,包括数据采集与处理、属性相关性分析、特征构造与形式化、以及异常检测算法。其次,本研究进行了大量的实验,包括分类、聚类以及四分位法的实验,通过对这些机器学习算法的比较分析,得出了较好的实验结果和结论。最后,本研究还展现了关税异常检测的应用前景,提出的方法框架将会提升马拉维海关管理系统的效率
  但是,本研究也存在一些限制。目前仅专注于机动车辆进口。非机动车辆以及其他许多货物都是马拉维的进口商品。因此,还需要进一步研究除汽车以外的其他各种进口货物,以验证本文研究结果的稳健性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号