首页> 外文OA文献 >easyMahout : entorno de ejecución de algoritmos inteligentes de Mahour para Hadoop y Big Data
【2h】

easyMahout : entorno de ejecución de algoritmos inteligentes de Mahour para Hadoop y Big Data

机译:easyMahout:Mahour的针对Hadoop和大数据的智能算法执行环境

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

"easyMahout" es un proyecto que tiene como objetivo hacer fácil lo difícil. Nos referimos a la utilización de algoritmos de minería de datos a través de Apache Mahout y Apache Hadoop. Hasta este momento, para utilizar las herramientas que nos ofrecían tanto Mahout como Hadoop necesitábamos de un conocimiento alto en lo referente al sistema operativo GNU/Linux, al uso de comando Shell y una gran inversión de tiempo en aprendizaje y configuración.udEl objetivo de este proyecto es ofrecer al usuario una interfaz gráfica fácil, simple y sencilla, es decir, intuitiva. Aunque a primera vista podría parecer una interfaz demasiado simple, easyMahout esconde en sus entrañas una completísima funcionalidad y configuración de sus algoritmos, permitiéndonos hacer fácilmente, lo que hasta ahora era una serie interminable de comandos para construir sistemas de recomendación, agrupamiento o clasificación. El modo de empleo es directo, el usuario ofrecerá los datos de entrada a la aplicación, así como una serie de parámetros necesarios para la correcta ejecución de los mismos, y obtendrá los resultados. El usuario podrá cambiar ciertos parámetros desde la interfaz, ajustando los algoritmos a sus necesidades y podrá observar la variación de los resultados hasta encontrar la configuración óptima para sus datos.udLa aplicación tiene la posibilidad de generar sistemas de recomendación, clustering y clasificación de datos genéricos de cualquier tipo, siempre y cuando tengan una estructura homogénea. El software “easyMahout” está dirigido a usuarios con cierto conocimiento en el uso de estos algoritmos de minería de datos, pudiendo así explotar el 100% de la funcionalidad que ofrece nuestra aplicación. Sin embargo, el funcionamiento es tan sencillo que cualquier persona será capaz de utilizarla con la ayuda de la lectura de esta memoria.udUna vez entendida la utilidad de la aplicación, también es importante explicar el ámbito en el que se encuentra. Hasta ahora, el lector podría pensar que no ofrecemos nada nuevo con respecto a otras aplicaciones de minería de datos. Esto es porque todavía no hemos introducido Apache Hadoop, ni el concepto de Big Data.udApache Hadoop es un framework para trabajar con aplicaciones altamente distribuidas, es decir, trabajar con miles de nodos y petabytes de datos usando un relativamente nuevo paradigma de programación: MapReduce. ¿Qué ofrece nuestra aplicación que no ofrece ninguna otra? La posibilidad de ejecutar estos algoritmos escritos en MapReduce, con todos los beneficios que ello conlleva, a través de una aplicación fácil como la propuesta en este proyecto.
机译:“ easyMahout”是一个旨在使困难的事情变得容易的项目。我们指的是通过Apache Mahout和Apache Hadoop使用数据挖掘算法。到目前为止,要使用Mahout和Hadoop都提供给我们的工具,我们需要对GNU / Linux操作系统有很高的了解,需要使用Shell命令以及在学习和配置上花费大量时间。该项目旨在为用户提供一个简单,直观的图形界面,即直观。尽管乍一看它的界面似乎太简单了,但easyMahout在其肠道中隐藏了非常完整的功能和算法的配置,使我们可以轻松地进行操作,直到现在为止,无休止的一系列命令用于构建推荐,分组或分类系统。使用方式是直接的,用户将向应用程序提供输入数据以及正确执行该应用程序所需的一系列参数,并将获得结果。用户将能够从界面上更改某些参数,根据自己的需要调整算法,并能够观察结果的变化,直到找到适合其数据的最佳配置。 Ud该应用程序可能会生成推荐系统,聚类和数据分类任何类型的泛型,只要它们具有均质的结构即可。 “ easyMahout”软件面向具有一些使用这些数据挖掘算法知识的用户,因此能够利用我们应用程序提供的功能的100%。但是,该操作是如此简单,以至于任何人都可以在读取此内存的帮助下使用它。 Ud一旦了解了应用程序的有用性,说明应用程序所在的范围也很重要。到目前为止,读者可能会认为与其他数据挖掘应用程序相比,我们没有提供任何新功能。这是因为我们尚未引入Apache Hadoop,也没有引入大数据的概念 UdApache Hadoop是一个用于处理高度分布式应用程序的框架,即使用相对较新的编程范例处理数千个节点和PB级数据: MapReduce。我们的应用程序提供了什么,而其他没有?通过一个简单的应用程序(如本项目中提出的应用程序),可以执行用MapReduce编写的算法,并具有所有这些好处。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号