首页> 外文OA文献 >Análisis y modelización de la dinámica emergente durante el proceso de difusión de información en las redes sociales de internet
【2h】

Análisis y modelización de la dinámica emergente durante el proceso de difusión de información en las redes sociales de internet

机译:Internet社交网络上信息传播过程中新兴动态的分析和建模

摘要

Durante la actividad diaria, la sociedad actual interactúa constantemente por medio de dispositivos electrónicos y servicios de telecomunicaciones, tales como el teléfono, correo electrónico, transacciones bancarias o redes sociales de Internet. Sin saberlo, masivamente dejamos rastros de nuestra actividad en las bases de datos de empresas proveedoras de servicios. Estas nuevas fuentes de datos tienen las dimensiones necesarias para que se puedan observar patrones de comportamiento humano a grandes escalas. Como resultado, ha surgido una reciente explosión sin precedentes de estudios de sistemas sociales, dirigidos por el análisis de datos y procesos computacionales. En esta tesis desarrollamos métodos computacionales y matemáticos para analizar sistemas sociales por medio del estudio combinado de datos derivados de la actividad humana y la teoría de redes complejas. Nuestro objetivo es caracterizar y entender los sistemas emergentes de interacciones sociales en los nuevos espacios tecnológicos, tales como la red social Twitter y la telefonía móvil. Analizamos los sistemas por medio de la construcción de redes complejas y series temporales, estudiando su estructura, funcionamiento y evolución en el tiempo. También, investigamos la naturaleza de los patrones observados por medio de los mecanismos que rigen las interacciones entre individuos, así como medimos el impacto de eventos críticos en el comportamiento del sistema. Para ello, hemos propuesto modelos que explican las estructuras globales y la dinámica emergente con que fluye la información en el sistema. Para los estudios de la red social Twitter, hemos basado nuestros análisis en conversaciones puntuales, tales como protestas políticas, grandes acontecimientos o procesos electorales. A partir de los mensajes de las conversaciones, identificamos a los usuarios que participan y construimos redes de interacciones entre los mismos. Específicamente, construimos una red para representar quién recibe los mensajes de quién y otra red para representar quién propaga los mensajes de quién. En general, hemos encontrado que estas estructuras tienen propiedades complejas, tales como crecimiento explosivo y distribuciones de grado libres de escala. En base a la topología de estas redes, hemos indentificado tres tipos de usuarios que determinan el flujo de información según su actividad e influencia. Para medir la influencia de los usuarios en las conversaciones, hemos introducido una nueva medida llamada eficiencia de usuario. La eficiencia se define como el número de retransmisiones obtenidas por mensaje enviado, y mide los efectos que tienen los esfuerzos individuales sobre la reacción colectiva. Hemos observado que la distribución de esta propiedad es ubicua en varias conversaciones de Twitter, sin importar sus dimensiones ni contextos. Con lo cual, sugerimos que existe universalidad en la relación entre esfuerzos individuales y reacciones colectivas en Twitter. Para explicar los factores que determinan la emergencia de la distribución de eficiencia, hemos desarrollado un modelo computacional que simula la propagación de mensajes en la red social de Twitter, basado en el mecanismo de cascadas independientes. Este modelo nos permite medir el efecto que tienen sobre la distribución de eficiencia, tanto la topología de la red social subyacente, como la forma en que los usuarios envían mensajes. Los resultados indican que la emergencia de un grupo selecto de usuarios altamente eficientes depende de la heterogeneidad de la red subyacente y no del comportamiento individual. Por otro lado, hemos desarrollado técnicas para inferir el grado de polarización política en redes sociales. Proponemos una metodología para estimar opiniones en redes sociales y medir el grado de polarización en las opiniones obtenidas. Hemos diseñado un modelo donde estudiamos el efecto que tiene la opinión de un pequeño grupo de usuarios influyentes, llamado élite, sobre las opiniones de la mayoría de usuarios. El modelo da como resultado una distribución de opiniones sobre la cual medimos el grado de polarización. Aplicamos nuestra metodología para medir la polarización en redes de difusión de mensajes, durante una conversación en Twitter de una sociedad políticamente polarizada. Los resultados obtenidos presentan una alta correspondencia con los datos offline. Con este estudio, hemos demostrado que la metodología propuesta es capaz de determinar diferentes grados de polarización dependiendo de la estructura de la red. Finalmente, hemos estudiado el comportamiento humano a partir de datos de telefonía móvil. Por una parte, hemos caracterizado el impacto que tienen desastres naturales, como innundaciones, sobre el comportamiento colectivo. Encontramos que los patrones de comunicación se alteran de forma abrupta en las áreas afectadas por la catástofre. Con lo cual, demostramos que se podría medir el impacto en la región casi en tiempo real y sin necesidad de desplegar esfuerzos en el terreno. Por otra parte, hemos estudiado los patrones de actividad y movilidad humana para caracterizar las interacciones entre regiones de un país en desarrollo. Encontramos que las redes de llamadas y trayectorias humanas tienen estructuras de comunidades asociadas a regiones y centros urbanos. En resumen, hemos mostrado que es posible entender procesos sociales complejos por medio del análisis de datos de actividad humana y la teoría de redes complejas. A lo largo de la tesis, hemos comprobado que fenómenos sociales como la influencia, polarización política o reacción a eventos críticos quedan reflejados en los patrones estructurales y dinámicos que presentan la redes construidas a partir de datos de conversaciones en redes sociales de Internet o telefonía móvil. ABSTRACT During daily routines, we are constantly interacting with electronic devices and telecommunication services. Unconsciously, we are massively leaving traces of our activity in the service providers’ databases. These new data sources have the dimensions required to enable the observation of human behavioral patterns at large scales. As a result, there has been an unprecedented explosion of data-driven social research. In this thesis, we develop computational and mathematical methods to analyze social systems by means of the combined study of human activity data and the theory of complex networks. Our goal is to characterize and understand the emergent systems from human interactions on the new technological spaces, such as the online social network Twitter and mobile phones. We analyze systems by means of the construction of complex networks and temporal series, studying their structure, functioning and temporal evolution. We also investigate on the nature of the observed patterns, by means of the mechanisms that rule the interactions among individuals, as well as on the impact of critical events on the system’s behavior. For this purpose, we have proposed models that explain the global structures and the emergent dynamics of information flow in the system. In the studies of the online social network Twitter, we have based our analysis on specific conversations, such as political protests, important announcements and electoral processes. From the messages related to the conversations, we identify the participant users and build networks of interactions with them. We specifically build one network to represent whoreceives- whose-messages and another to represent who-propagates-whose-messages. In general, we have found that these structures have complex properties, such as explosive growth and scale-free degree distributions. Based on the topological properties of these networks, we have identified three types of user behavior that determine the information flow dynamics due to their influence. In order to measure the users’ influence on the conversations, we have introduced a new measure called user efficiency. It is defined as the number of retransmissions obtained by message posted, and it measures the effects of the individual activity on the collective reacixtions. We have observed that the probability distribution of this property is ubiquitous across several Twitter conversation, regardlessly of their dimension or social context. Therefore, we suggest that there is a universal behavior in the relationship between individual efforts and collective reactions on Twitter. In order to explain the different factors that determine the user efficiency distribution, we have developed a computational model to simulate the diffusion of messages on Twitter, based on the mechanism of independent cascades. This model, allows us to measure the impact on the emergent efficiency distribution of the underlying network topology, as well as the way that users post messages. The results indicate that the emergence of an exclusive group of highly efficient users depends upon the heterogeneity of the underlying network instead of the individual behavior. Moreover, we have also developed techniques to infer the degree of polarization in social networks. We propose a methodology to estimate opinions in social networks and to measure the degree of polarization in the obtained opinions. We have designed a model to study the effects of the opinions of a small group of influential users, called elite, on the opinions of the majority of users. The model results in an opinions distribution to which we measure the degree of polarization. We apply our methodology to measure the polarization on graphs from the messages diffusion process, during a conversation on Twitter from a polarized society. The results are in very good agreement with offline and contextual data. With this study, we have shown that our methodology is capable of detecting several degrees of polarization depending on the structure of the networks. Finally, we have also inferred the human behavior from mobile phones’ data. On the one hand, we have characterized the impact of natural disasters, like flooding, on the collective behavior. We found that the communication patterns are abruptly altered in the areas affected by the catastrophe. Therefore, we demonstrate that we could measure the impact of the disaster on the region, almost in real-time and without needing to deploy further efforts. On the other hand, we have studied human activity and mobility patterns in order to characterize regional interactions on a developing country. We found that the calls and trajectories networks present community structure associated to regional and urban areas. In summary, we have shown that it is possible to understand complex social processes by means of analyzing human activity data and the theory of complex networks. Along the thesis, we have demonstrated that social phenomena, like influence, polarization and reaction to critical events, are reflected in the structural and dynamical patterns of the networks constructed from data regarding conversations on online social networks and mobile phones.
机译:在日常活动中,当今社会不断通过电子设备和电信服务(例如电话,电子邮件,银行交易或Internet社交网络)进行交互。不知不觉中,我们将大量活动的痕迹留在了服务提供商公司的数据库中。这些新的数据源具有一定的尺寸,以便可以大规模观察人类行为的模式。结果,在数据分析和计算过程的带动下,最近出现了前所未有的社会系统研究爆炸。在本文中,我们通过对人类活动数据和复杂网络理论的结合研究,开发了用于分析社会系统的计算和数学方法。我们的目标是表征和了解新技术空间(例如Twitter社交网络和移动电话)中新兴的社交互动系统。我们通过构建复杂的网络和时间序列来分析系统,研究其结构,运行和随着时间的演变。此外,我们通过控制个体之间相互作用的机制来调查观察到的模式的性质,以及我们测量了关键事件对系统行为的影响。为此,我们提出了可解释全局结构和系统中信息流动的动态模型的模型。对于社交网络Twitter上的研究,我们基于特定的对话(例如政治抗议,重大事件或选举过程)进行了分析。从对话的消息中,我们确定参与的用户并建立他们之间的互动网络。具体来说,我们建立一个网络来代表谁接收来自谁的消息,以及另一个网络来代表谁传播来自谁的消息。通常,我们发现这些结构具有复杂的特性,例如爆炸性增长和无鳞度分布。基于这些网络的拓扑,我们确定了三种类型的用户,这些类型的用户根据其活动和影响来确定信息流。为了衡量用户对会话的影响,我们引入了一种称为用户效率的新方法。效率定义为每发送一条消息获得的重传次数,并衡量个人努力对集体反应产生的影响。我们已经观察到,此属性的分布在各种Twitter对话中无处不在,无论其大小或上下文如何。通过这种方式,我们建议在Twitter上个人努力与集体反应之间的关系具有普遍性。为了解释决定效率分布出现的因素,我们开发了一个计算模型,该模型基于独立的级联机制来模拟Twitter社交网络上消息的传播。该模型使我们能够测量其对效率分布的影响,包括基础社交网络的拓扑结构和用户发送消息的方式。结果表明,一组精选的高效用户的出现取决于基础网络的异质性,而不取决于个人行为。另一方面,我们已经开发出推断社交网络中政治两极分化程度的技术。我们提出一种方法来估计关于社交网络的意见,并衡量所获得意见中的两极分化程度。我们设计了一个模型,在该模型中我们研究了少数有影响力的用户(称为精英)的意见对大多数用户的意见的影响。该模型导致意见的分布,我们根据该意见来衡量极化程度。在政治两极分化的Twitter上的对话中,我们运用我们的方法来测量消息广播网络中的两极分化。获得的结果显示与离线数据高度对应。通过这项研究,我们已经证明,所提出的方法能够根据网络结构确定不同的极化程度。最后,我们从手机数据中研究了人类行为。一方面,我们描述了洪水等自然灾害对集体行为的影响。我们发现,受灾难影响的地区的通讯方式突然改变。与哪个我们证明,几乎可以实时衡量对该区域的影响,而无需在实地进行部署。此外,我们研究了人类活动和流动模式,以描述发展中国家区域之间的相互作用。我们发现,通话和人类轨迹网络具有与区域和城市中心相关的社区结构。总之,我们已经表明,通过分析人类活动数据和复杂网络理论,可以理解复杂的社会过程。在整个论文中,我们已经验证了社会现象,例如影响,政治两极分化或对关键事件的反应,反映在由互联网或移动电话上的社交网络上的对话数据构成的网络所呈现的结构和动态模式中。 。摘要在日常工作中,我们不断与电子设备和电信服务进行交互。不知不觉中,我们将大量活动的痕迹留在了服务提供商的数据库中。这些新的数据源具有实现大规模观察人类行为模式所需的尺寸。结果,数据驱动的社会研究有了前所未有的爆炸式增长。本文通过对人类活动数据和复杂网络理论的综合研究,开发了分析社会系统的计算和数学方法。我们的目标是通过新技术领域(如在线社交网络Twitter和移动电话)上的人类互动来表征和理解新兴系统。我们通过构建复杂的网络和时间序列来分析系统,研究它们的结构,功能和时间演化。我们还通过控制个体之间相互作用的机制以及关键事件对系统行为的影响,研究了观察到的模式的性质。为此,我们提出了一些模型,这些模型解释了系统中信息流的全局结构和新兴动态。在对在线社交网络Twitter的研究中,我们的分析基于特定的对话,例如政治抗议,重要的公告和选举过程。从与对话相关的消息中,我们确定参与者用户并与他们建立互动网络。我们专门建立了一个网络来代表谁接收到谁的消息,以及另一个网络来代表谁在传播谁的消息。通常,我们发现这些结构具有复杂的特性,例如爆炸性增长和无鳞度分布。基于这些网络的拓扑特性,我们确定了三种类型的用户行为,这些行为决定了由于其影响而决定的信息流动态。为了衡量用户对会话的影响,我们引入了一种称为用户效率的新方法。它定义为通过发布消息获得的重传次数,并且它衡量单个活动对集体反应的影响。我们已经观察到,此属性的概率分布在多个Twitter对话中无处不在,无论它们的维度或社会背景如何。因此,我们建议在Twitter上的个人努力与集体反应之间的关系中存在普遍行为。为了解释决定用户效率分布的不同因素,我们基于独立的级联机制,开发了一种计算模型来模拟Twitter上消息的传播。该模型使我们能够测量对基础网络拓扑的紧急效率分布的影响,以及用户发布消息的方式。结果表明,一组排他的高效用户取决于底层网络的异构性,而不是单个行为。此外,我们还开发了推断社交网络两极分化程度的技术。我们提出了一种方法,用于估计社交网络中的意见并测量所获得意见中的两极分化程度。我们设计了一个模型来研究一小群有影响力的用户(称为精英)的意见对大多数用户的意见的影响。该模型产生意见分布,我们可以测量该意见分布的极化程度。在来自两极分化社会的Twitter上进行对话时,我们运用我们的方法来测量消息传播过程中图形的两极分化。结果与脱机和上下文数据非常吻合。通过这项研究,我们证明了我们的方法能够根据网络结构检测几个极化度。最后,我们还从手机数据中推断出人类的行为。一方面,我们描述了洪水等自然灾害对集体行为的影响。我们发现,在受灾难影响的地区,通讯方式突然发生了变化。因此,我们证明了我们可以几乎实时地衡量灾难对该地区的影响,而无需进行进一步的努力。另一方面,我们研究了人类的活动和流动方式,以描绘发展中国家之间区域互动的特征。我们发现呼叫和轨迹网络呈现了与区域和城市地区相关的社区结构。总而言之,我们已经表明,可以通过分析人类活动数据和复杂网络理论来理解复杂的社会过程。沿着论文,我们证明了社会现象,如影响,两极分化和对关键事件的反应,都反映在网络的结构和动态模式中,该网络是由有关在线社交网络和移动电话上的对话数据构成的。

著录项

  • 作者

    Morales Guzmán Alfredo;

  • 作者单位
  • 年度 2014
  • 总页数
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号