Aplicação de text mining na deteção de evidência de fraude em documentos de texto

机译：文本挖掘在检测文本文档中欺诈证据的应用

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

This article aims to test the results of applying some preprocessing and processing techniques in text of previously unknown information to automatic discovery information that may be potentially usable for fraud detection. The methodology used was the application of cleaning techniques, stopword removal, lemmatization and the creation of terms matrix by document from a set of Portuguese Republic Assembly (AR) Diaries as a way of comparing the results with the subject treated in the Parliamentary sessions previously annotated by cataloging professionals. The results obtained allowed to conclude that the removal of specific "stopwords" allow greater efficiency in the extraction of terms and keywords from the subjects addressed in the texts analyzed. This result may be applicable in a fraud audit scenario that involves selecting a significant number of documents for reading with previously unknown content.

机译：本文旨在测试将某些未知信息的文本中的某些预处理和处理技术应用于自动发现信息的结果，这些信息可能会用于欺诈检测。所使用的方法学是应用清洁技术，去除停用词，词组去词句化以及通过从一组葡萄牙共和国议会（AR）日记中的文档中创建术语矩阵的方法，以将结果与先前标注的议会会议处理的主题进行比较通过编目专业人员。获得的结果可以得出这样的结论，即删除特定的“停用词”可以提高从所分析文本中涉及的主题中提取术语和关键字的效率。此结果可能适用于欺诈审核场景，该场景涉及选择大量文档以供阅读，其中包含以前未知的内容。

著录项

来源
《Iberian Conference on Information Systems and Technologies》|2017年|1-6|共6页
会议地点
作者
Elcelina Silva;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词
Text mining; Cats; Cleaning; Blogs; Mobile communication; Internet;

机译：文本挖掘;猫;清洁;博客;移动通信;互联网;

相似文献

外文文献
中文文献
专利

1. Optimizacin del desempeo de un sistema de recomendacin de documentos de texto basado en la configuracin de los servidores - Improvement performance of a recommendation system for text documents based on servers configuration [J] . Rodrigo Vences Nava, Vctor Hugo Menndez Domnguez, Alfredo Zapata Gonzlez RECIBE . 2016,第2期

机译：-基于服务器配置的文本文档推荐系统的改进性能
2. Diamante da fraude: evidências empíricas nos relatórios de demandas externas do Ministério da Transparência e Controladoria Geral da Uni?o (CGU) dos municípios brasileiros [J] . Ana Luiza Pedrosa Paschoal, Nálbia de Araújo Santos, Walmer Faroni Revista Ambiente Contábil . 2020,第2期

机译：欺诈钻石：巴西市政府透明和综合控股部的外部需求报告的经验证据
3. Uma vis?o evidente da prática baseada em evidências na medicina perinatal: ausência de evidência n?o é evidência de ausência [J] . Augusto Sola, Fernando Dominguez Dieppa, Marta R. Rogido Jornal de Pediatria . 2007,第5期

机译：在围产期医学中清楚地了解基于证据的实践：没有证据不是缺席的证据
4. Aplica??o de Text Mining na Dete??o de Evidência de Fraude em Documentos de Texto [C] . Elcelina Silva Conference on Information Systems and Technologies . 2017

机译：文本挖掘在欺诈证据妥善文本文件中的应用
5. Integration of text mining with systems biology provides new insight into the pathogenesis of diabetic neuropathy. [D] . Hur, Junguk. 2010

机译：文本挖掘与系统生物学的集成为糖尿病性神经病的发病机理提供了新的见解。
6. A teoria da equidade reversa se aplica na atenção primária à saúde? Evidências de 5 564 municípios brasileiros [O] . Raphael Mendonça Guimarães 2018

机译：反向公平理论是否适用于初级卫生保健？来自5564个巴西直辖市的证据
7. Aplicação de técnicas de mineração de textos para classificação de documentos : um estudo da automatização da triagem de denúncias na CGU [O] . Andrade Patrícia Helena Maia Alves de 2015

机译：文本挖掘技术在文档分类中的应用：CGU投诉自动化研究

Aplicação de text mining na deteção de evidência de fraude em documentos de texto

摘要

著录项

相似文献

相关主题

期刊订阅