首页> 外文OA文献 >Análisis de la web de la ESPOL y afines, utilizando hadoop como una plataforma de procesamiento masivo de datos
【2h】

Análisis de la web de la ESPOL y afines, utilizando hadoop como una plataforma de procesamiento masivo de datos

机译:使用hadoop作为海量数据处理平台来分析ESPOL网站等

摘要

El presente documento muestra los resultados del análisis de la red de laESPOL, utilizando Hadoop como plataforma de procesamiento masivo dedatos. Gracias al estudio que se ha realizado, se ha podido demostrar que laestructura de la Web de la ESPOL no tiene propiedades de pequeño mundo(no es una red libre de escala), forma que usualmente toman muchas de lasredes reales, y que tiene gran incidencia en la “navegabilidad y accesibilidadde la información en grandes redes de documentos” [18]. Esto dificultaría laexploración de la Web de la ESPOL, y tendría una incidencia negativa en lapercepción de la utilidad (a los usuarios) de nuestra Web.Para este estudio, utilizamos los índices obtenidos de la indexación de losenlaces entrantes como salientes de las páginas Web del dominioespol.edu.ec. Estos datos fueron procesados para así obtener la cantidad deenlaces entrantes y salientes para cada uno de ellos. Además, los mismosdatos nos permitieron conseguir la distribución estadística de enlaces(entrantes y salientes) de las paginas del dominio de la ESPOL, y así podercomprobar que la misma no tiene las propiedades de una distribución de leyde potencias (power law), un criterio fundamental que debe cumplir una redpara poder ser clasificada como libre de escala (scale free).Finalmente, para validar este análisis se ha considerado estudios previos alas redes de otras universidades, que sí muestran una estructura pequeñomundo.
机译:本文档显示了使用Hadoop作为海量数据处理平台的ESPOL网络分析结果。通过进行的研究,有可能证明ESPOL Web结构不具有小世界属性(它不是自由尺度网络),这是许多实际网络通常采用的形式,并且发生率很高在“大型文档网络中信息的可导航性和可访问性”中[18]。这将使探索ESPOL网站变得困难,并且会对我们网站的有用性(对用户)的感知产生负面影响。在本研究中,我们使用从传入链接的索引获得的索引作为网站的网页的出站。 domainspol.edu.ec。处理这些数据是为了获得每个输入和输出链接的数量。另外,相同的数据使我们能够实现ESPOL域页面的链接(入站和出站)的统计分布,从而能够验证其不具有幂律分布的特性,这是基本准则最后,为了验证这一分析,已经对其他大学的网络进行了先前的研究,这些研究的确显示出很小的世界结构。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号