首页> 外文会议>Iberian Conference on Information Systems and Technologies >Aplicacao de Text Mining na Detecao de Evidencia de Fraude em Documentos de Texto
【24h】

Aplicacao de Text Mining na Detecao de Evidencia de Fraude em Documentos de Texto

机译:文本挖掘在欺诈证据检测文本文件中的应用

获取原文

摘要

Este artigo tem como objetivo testar os resultados da aplicacao de algumas tecnicas de pre-processamento e processamento de texto na descoberta automatica de informacoes previamente desconhecidas e que podem ser potencialmente utilizavel para a detecao de fraude. A metodologia utilizada foi a aplicacao de tecnicas de limpeza, remocao de stopword, lematizacao e a criacao de matriz de termos por documento a partir de um conjunto de Diarios da Assembleia da Republica (AR) Portuguesa como forma de comparar os resultados com assunto tratado nas sessoes parlamentares previamente anotados por profissionais de catalogacao. Os resultados obtidos permitiram concluir que a remocao de "stopwords especificas" permitem maior eficiencia e resultados na extracao de termos e palavras-chave dos assuntos abordados nos textos analisados. Este este resultado pode ser aplicavel. num cenario de auditoria a fraude que engloba a selecao de um numero significativo de documentos para leitura com conteudos previamente desconhecidos.
机译:本文旨在测试在以前未知信息的自动发现中应用一些预处理和处理文本的应用结果,并且可以对欺诈的检测潜在地使用。采用的方法是清洗技术的应用,去除停用词,lemacy和方面的矩阵通过文件从一个方法来比较与处理过的事情结果的一组葡萄牙共和国议会(AR)的日记的矩阵以前由目录专业人士注释的议会会议。获得的结果允许得出结论,去除“特定的止动件”允许提高效率,并导致分析文本中涵盖的受试者的术语和关键词的提取。此结果可以适用。在审核方案中,欺诈包含大量读取以前未知的内容的大量文档的选择。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号