首页> 外文OA文献 >Desarrollo de un sistema de clasificación automática de contenidos en medios de comunicación españoles y mexicanos = Development of an automatic classification of content system in Spaniard-Mexican mass media
【2h】

Desarrollo de un sistema de clasificación automática de contenidos en medios de comunicación españoles y mexicanos = Development of an automatic classification of content system in Spaniard-Mexican mass media

机译:开发西班牙和墨西哥媒体内容的自动分类系统=开发西班牙墨西哥媒体大众化的内容系统自动分类系统

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

The objective of this research is to develop an automatic classification system for the contents retrieved through the Resync platform specializing in the investigation of sources of information media. This investigation is justified due to the lack of automated methods to organize the information gathered and the need to scrutinize the thematic categories addressed by the media by country. To resolve these problems, we transform the Eurovoc multilingual thesaurus in a pseudo-ontology vocabulary that is used as a qualifier for the documentary corpus. The test collection used has 400,000 contents from Mexican and Spaniard media published during the months of June-July 2011. Additionally, are designed and tested 5 automatic classification algorithms, accurate consultation and generic classification using the vocabulary above, for their harmonization with the collection of evidence. You get all the quantitative results of the experiment, concluding a progressive escalation in the percentage of classified content, given by the precision of the algorithm and its conditioning. Finally, the basis for qualitative evaluation of the classification made by the system, in order to perfect the process described herein.
机译:这项研究的目的是为通过Resync平台检索的内容开发一个自动分类系统,该系统专门研究信息媒体的来源。由于缺乏自动的方法来组织收集到的信息,并且需要按国家仔细审查媒体所涉及的主题类别,因此进行这项调查是合理的。为了解决这些问题,我们将Eurovoc多语言同义词库转换为伪本体词汇,该词汇用作记录语料库的限定词。所使用的测试集具有2011年6月至7月间来自墨西哥和西班牙媒体的40万内容。此外,还设计并测试了5种自动分类算法,使用上述词汇进行的准确咨询和通用分类,以使其与证据。您将获得实验的所有定量结果,包括通过算法的精度及其条件得出的分类内容所占百分比的逐步提高。最后,是对系统进行分类的定性评估的基础,以完善本文所述的过程。

著录项

  • 作者

    Blázquez-Ochando Manuel;

  • 作者单位
  • 年度 2012
  • 总页数
  • 原文格式 PDF
  • 正文语种 {"code":"es","name":"Spanish","id":10}
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号