Redes Sociales: mecánica estadística aplicada a Facebook Andrés Medus Laboratorio de Física Estadística Computacional @ GEBI Marzo 2014
El LaFEC Director: Claudio Dorso Investigadores:...??? Doctorandos: Pedro Giménez Molinelli Andrés Medus Daniel Barmak Juani Nichols Pablo Alcain
Líneas Nuclear: línea clásica de Dorso Colisiones nucleares Fragmentación Estrellas de Neutrones Redes Complejas: Caracterización topológica Fenómenos de propagación: epidemias, dinámica de opiniones, etc. Problema de los Desaparecidos en Tucumán durante la última dictadura. Dinámica de peatones: Problemas de evacuación en condiciones de emergencia.
Metodología: física estadística Generación de ensambles estadísticos Dinámica molecular clásica Métodos Monte Carlo Teoría de fenómenos críticos en sistemas finitos Modelos estocásticos de agentes Redes complejas Modelos de movilidad de humanos Epidemiología matemática
Herramientas Lo que tenemos Código propio escrito en Fortran 77/90/95/2003/2008, C, GPGPU (CUDA), etc. Lo que necesitamos Scripting en Bash, Python, R, etc.
Redes Complejas Redes regulares Nodos y enlaces representando agentes y sus interacciones, respectivamente. Topología de la red Propagación
Aplicaciones Propagación de virus informáticos. Modelos de propagación de enfermedades basados en el individuo. Propagación de opiniones: formación de consenso, asimilación cultural, etc. Modelos de recomendación: Amazon, Netflix, etc. Aplicaciones biológicas: redes metabólicas, redes de interacción proteína-proteína, redes funcionales cerebrales, etc.
Caracterización topológica Distribución de grados P(k): distribución de Poisson (Poisson random networks), power-law (scale-free networks), etc. Distancia mínima media entre nodos (L). Diámetro: D=max(L(i,j)). Mundo pequeño: (Milgram). Clustering (C) o transitividad:
Caracterización topológica Clustering C Distancia media L Regular network alto alto Poisson random network bajo bajo Small-World network alto bajo Scale-free network bajo bajo Están bien caracterizadas y hay mecanismos que permiten generarlas: Watts-Strogatz (SW), Preferential attachment (SF), etc.
Redes sociales de contactos entre humanos En general son redes Small-World con alto C y bajo L. Las distribuciones de grado son variadas: desde Poisson hasta power-law. Presentan correlación positiva entre grados de dos nodos (asortatividad). Resultados de 5388 encuestas en UK J. R. Soc. Interface 7 November 2012 vol. 9 no. 76 2826-2833 Distribución de grados powerlaw o compatible con Poisson pero con alto clustering. Las redes scale-free presentan correlación negativa de dos nodos (deasortativas), mientras las redes sociales resultan casi siempre asortativas. Las redes sociales son bichos raros!
Redes sociales de contactos entre humanos El patrón heterogéneo de contactos es determinante para la propagación de, por ejemplo, una enfermedad infecciosa transmitida por contacto o proximidad. Modelos de campo medio en epidemiología: población homogénea totalmente mezclada. Matemáticamente muy tratables pero solo adecuados bajo aproximaciones rigurosas. Objetivo: Proponer un modelo de crecimiento de redes complejas con características topológicas compatibles con las correspondientes a redes sociales reales. Cuáles son los mecanismos microscópicos tras estos emergentes topológicos??
Facebook Población de China = 1 339 724 852 hab. (censo 2010) Fuente: Wikipedia. Estudiamos un subgrafo pequeño de Facebook con resolución temporal: Nodos=63731 Links=817090 correspondiente a usuarios de New Orleans (EEUU) ---> Red con crecimiento de población Bimal Viswanath, Alan Mislove, Meeyoung Cha, and P. Krishna Gummadi. On the evolution of user interaction in Facebook. In Jon Crowcroft and Balachander Krishnamurthy, editors, WOSN, pages 37 42. ACM, 2009.
Red de contactos cara-a-cara http://www.sociopatterns.org/about/ Sensores RF con alcance de ~1m y resolución temporal de 20 seg. Se registran los contactos cara a cara entre individuos dentro de recintos cerrados: conferencias, exposiciones, hospitales, escuelas. Ofrecen información de la dinámica de formación de enlaces. Conferencia ACM Hypertext (2009): red acumulada para 1 día, 113 participantes, 2196 links ---> Red con población constante Journal of Theoretical Biology 271, 166 (2011).
Análisis
Mecanismo de cierre triádico Los amigos de mis amigos tienen alta probabilidad de ser también mis amigos. Granovetter M 1973 Am. J. Sociol. 78 1360
Tasa de Actividad Muchnik, Lev, et al. Scientific reports 3 (2013). Todo parece indicar que la tasa de actividad de los individuos está distribuida de acuerdo con power-laws. Unos pocos acaparan casi todo (ley de Pareto, también adjudicada a Yule, Simon, Gibrat o a Zipf dependiendo de la disciplina). Perra, Nicola, et al. Scientific reports 2 (2012).
Tasa de Actividad Al considerar el tiempo acumulado en los distintos encuentros entre los asistentes a la conferencia HT09 también se obtiene una power-law:
Modelo estocástico de crecimiento de redes Se agregan nodos y enlaces. La población de nodos crece con tasa γ relativa a la de enlaces. Proceso estocástico con evolución dependiente del número de enlaces agregados. Ingredientes fundamentales del modelo: Enlace de cierre triádico con probabilidad q o al azar con probabilidad (1-q). Densidad power-law en tasa de actividad para los nodos.
Formulación analítica Término de preferential attachment responsable del comportamiento power-law
Resultados Actividad constante Población constante Población creciente Recordamos lo que daba para HT09 y Facebook
Resultados Actividad power-law Se observa que para grado k elevado el comportamiento en este caso aún es dominado por el mecanismo de cierre triádico.
Correlaciones de alto orden
Ajuste por el modelo Ajustando los dos parámetros del modelo solo para la distribución de grados, se alcanza un buen ajuste en los demás descriptores topológicos.
Conclusiones El modelo sencillo propuesto presenta resultados que presentan buena correspondencia con los observados en las redes sociales analizadas. Con un modelo de solo DOS parámetros (probabilidad de cierre triádico y exponente de la power-law de actividad) se pueden reproducir las características topológicas esenciales. Los seres humanos no podemos ser modelados como agentes sin memoria (ausencia de cierre triádico). Si bien todos somos únicos e irrepetibles pertenecemos a una especie con algunas características comportamentales (instintivas? evolutivas?) que nos son comunes.
Gracias!