Cadenas de Markov y Perron-Frobenius



Documentos relacionados
VECTORES. Módulo, dirección y sentido de un vector fijo En un vector fijo se llama módulo del mismo a la longitud del segmento que lo define.

Apuntes de Matemática Discreta 1. Conjuntos y Subconjuntos

AMPLIACIÓN DE MATEMÁTICAS. REPASO DE MATEMÁTICAS DISCRETA. CONGRUENCIAS. En el conjunto de los números enteros

Tema 1: Fundamentos de lógica, teoría de conjuntos y estructuras algebraicas: Apéndice

El teorema de estructura de módulos finitamente generados sobre un dominio de ideales principales

Cadenas de Markov.

Este documento ha sido generado para facilitar la impresión de los contenidos. Los enlaces a otras páginas no serán funcionales.

Tema 5. Aproximación funcional local: Polinomio de Taylor. 5.1 Polinomio de Taylor

Los polinomios. Un polinomio es una expresión algebraica con una única letra, llamada variable. Ejemplo: 9x 6 3x 4 + x 6 polinomio de variable x

Subespacios vectoriales en R n

Llamamos potencia a todo producto de factores iguales. Por ejemplo: 3 4 =

UNIDAD 6. POLINOMIOS CON COEFICIENTES ENTEROS

Centro de Capacitación en Informática

Tema 2. Espacios Vectoriales Introducción

MATEMÁTICAS CON LA HOJA DE CÁLCULO

Vamos a crear nuestro primer juego en el que tendremos que coger la comida que esta protegida por los gatos

1. INVERSA DE UNA MATRIZ REGULAR

Lección 9: Polinomios

Programa para el Mejoramiento de la Enseñanza de la Matemática en ANEP Proyecto: Análisis, Reflexión y Producción. Fracciones

Los números racionales

1. Teorema del Valor Medio

Vectores en el plano con punto inicial fijo

Autómatas Finitos. Leopoldo Altamirano, Eduardo Morales. Verano, 2011 INAOE. Introducción a. Autómatas. Definición formal de un. Finito Determinístico

FORMA CANONICA DE JORDAN Y ECUACIONES DIFERENCIALES LINEALES A COEFICIENTES CONSTANTES

3. Equivalencia y congruencia de matrices.

Valores propios y vectores propios

El rincón de los problemas. Oportunidades para estimular el pensamiento matemático. Triángulos de área máxima o de área mínima Problema

Lógica Proposicional IIC2212. IIC2212 Lógica Proposicional 1 / 56

Ejemplos y problemas resueltos de análisis complejo ( )

1-Comportamiento de una función alrededor de un punto:

Notaciones y Pre-requisitos

Tema 3: Aplicaciones de la diagonalización

Módulo mod_banners para insertar y visualizar anuncios o publicidad (banners) en Joomla. Contador. (CU00446A)

Tema 3. Espacios vectoriales

LÍMITES DE FUNCIONES. CONTINUIDAD

MATEMÁTICAS CCSS JUNIO 2010 (COMÚN MODELO5) SELECTIVIDAD ANDALUCÍA

Divisibilidad y números primos

Un problema sobre repetidas apuestas al azar

ENERGÍA DE DEFORMACIÓN DE UNA ESTRUCTURA

MATEMÁTICAS para estudiantes de primer curso de facultades y escuelas técnicas

NÚMEROS REALES MÓDULO I

Usamos que f( p) = q y que, por tanto, g( q) = g(f( p)) = h( p) para simplificar esta expresión:

Espacios generados, dependencia lineal y bases

Tema 2 Límites de Funciones

Capítulo 1: Fundamentos: Lógica y Demostraciones Clase 1: Lógica Proposicional

Índice Introducción Números Polinomios Funciones y su Representación. Curso 0: Matemáticas y sus Aplicaciones Tema 1. Números, Polinomios y Funciones

Teoría del Juego - Juegos Combinatoriales Imparciales

Una función f es derivable en un punto a de su dominio si existe el límite. f(x) f(a) Si f y g son derivables en a, entonces fg es derivable en a y

Matrices equivalentes. El método de Gauss

Colegio Alexander von Humboldt - Lima. Tema: La enseñanza de la matemática está en un proceso de cambio

Congruencias de Grado Superior

Definición de vectores

PROPIOS. DIAGONALIZACIÓN DE MATRICES CUADRADAS

Clases de apoyo de matemáticas Fracciones y decimales Escuela 765 Lago Puelo Provincia de Chubut

MÉTODO DEL CAMBIO DE BASE PARA CÁLCULO MANUAL DE SUBREDES CON IP V4.0

Dominios de factorización única

Sistemas de ecuaciones lineales

Objetivos: Al inalizar la unidad, el alumno:

Diferenciabilidad. Definición 1 (Función diferenciable). Cálculo. Segundo parcial. Curso

Tema 07. LÍMITES Y CONTINUIDAD DE FUNCIONES

ZCARTAS: Iniciación a la suma y resta de números enteros Introducción Actividad 1: Escenario con cartas numeradas desde -2 hasta 2...

Optimización, Solemne 2. Semestre Otoño 2012 Profesores: Paul Bosch, Rodrigo López, Fernando Paredes, Pablo Rey Tiempo: 110 min.

Experimento 6 LAS LEYES DE KIRCHHOFF. Objetivos. Teoría. Figura 1 Un circuito con dos lazos y varios elementos

1. Producto escalar, métrica y norma asociada

NÚMEROS NATURALES Y NÚMEROS ENTEROS

GUÍA PARA LA FORMULACIÓN PROYECTOS

Descomposición factorial de polinomios

Selectividad Septiembre 2009 SEPTIEMBRE Opción A

TEMA 2: FUNCIONES CONTINUAS DE VARIAS VARIABLES

Por qué tomar muestras? Si queremos conocer una población, Por qué no tomar una muestra de toda la población?, Por qué no hacer un censo?

Cadenas de Markov. Ejercicios resueltos Página 1 EJERCICIOS RESUELTOS DE CADENAS DE MARKOV

EL MÉTODO DE LA BISECCIÓN

Índice Introducción Estructuras Algebraicas Listas Los Números Enteros Polinomios. Álgebra y Matemática Discreta Sesión de Prácticas 1

La ventana de Microsoft Excel

290 SOBRE LAS FORMAS DE SEGUNDO GRADO.

CURSO BÁSICO DE FÍSICA MECÁNICA PROYECTO UNICOMFACAUCA TU PROYECTO DE VIDA

CPE (SEGUNDO CURSO) = P [T 1 ]P [T 2 ]... P [T 525,600 ] = ( ) 525,600 =

El número de arriba de la fracción, el numerador, nos dice cuántas de las partes iguales están coloreadas.

CAPÍTULO 10 Aplicaciones de la Derivada a Funciones Económicas

1. Ecuaciones no lineales

_ Antología de Física I. Unidad II Vectores. Elaboró: Ing. Víctor H. Alcalá-Octaviano

REPASO NÚMEROS NATURALES Y NÚMEROS ENTEROS

BASES Y DIMENSIÓN. Propiedades de las bases. Ejemplos de bases.

Análisis de Redes Complejas: Un paseo

Mecánica Racional 20 TEMA 3: Método de Trabajo y Energía.

Aplicaciones lineales continuas

Clase de apoyo de matemáticas Ángulos Escuela 765 Lago Puelo Provincia de Chubut

Alvaro J. Riascos Villegas Universidad de los Andes y Quantil. Marzo 14 de 2012

Teóricas de Análisis Matemático (28) - Práctica 4 - Límite de funciones. 1. Límites en el infinito - Asíntotas horizontales

T.1 CONVERGENCIA Y TEOREMAS LÍMITE

Traslaciones, Homotecias, Giros y Simetrías

x y 8000 x + y a) La región factible asociada a las restricciones anteriores es la siguiente: Pedro Castro Ortega lasmatematicas.

Cómo?: Resolviendo el sistema lineal homógeneo que satisfacen las componentes de cualquier vector de S. x4 = x 1 x 3 = x 2 x 1

LEYES DE CONSERVACIÓN: ENERGÍA Y MOMENTO

4. Se considera la función f(x) =. Se pide:

Espacios Vectoriales

CONCEPTOS PREVIOS TEMA 2

Anexo a la guía 4 Geometría: ejemplos y comentarios

Matrices Invertibles y Elementos de Álgebra Matricial

Teclado sobre una PDA para Personas con Parálisis Cerebral

Transcripción:

Cadenas de Markov y Perron-Frobenius Pablo Lessa 10 de octubre de 2014 1. Cadenas de Markov En 1996 Larry Page y Sergey Brin, en ese momento en Stanford, inventaron una manera de asignar un ranking de importancia a las páginas web de internet. Utilizar este método, llamado PageRank, fue uno de los elementos que permitió que su motor de búsqueda web, Google, se destacara por encima de las alternativas que existían en ese momento. La idea detrás de PageRank es simple. Se considera un personaje ficticio que navega por internet siguiendo las siguientes reglas 1. Con un 85 % de chance elije un enlace al azar de la página en la que se encuentra y lo sigue. 2. Con un 15 % de chance elije una página web al azar de todo internet y va navega a ella directamente (esto modela el hecho de que una vez cada tanto escribe directamente una dirección web en el navegador en lugar de seguir un enlace). El PageRank de una pagina web es la frecuencia con la cual este navegador ficticio visita a dicha página después de navegar durante muchísimo tiempo. Vamos a formalizar este modelo en esta sección respondiendo también a las siguientes preguntas: Porqué existe esa frecuencia límite (porqué no oscila con n la fracción de veces que el navegador pasa en cada página? El PageRank de una página depende de la página inicial en la que empieza el navegador? Cómo podría calcularse el PageRank y porqué dicho procedimiento está justificado? 1.1. Medidas de Markov Supongamos que X es un conjunto finito cuyos elementos representan las páginas web de internet (según una búsqueda web que recién hice hoy en día se estima que hay más de mil millones de páginas web... en todo caso es un número finito). Las posibles trayectorias del navegante al azar son puntos del espacio métrico separable y completo X N (el espacio de sucesiones de elementos en P con la distancia habitual suma de 2 n en los n en los cuales las dos sucesiones difieren). 1

Para modelar el comportamiento del navegador al azar tenemos que construir una probabilidad µ en X. El modelo es el siguiente: Fijamos una matriz (q(x, y)) x,y X donde q(x, y) es la probabilidad de que el navegador al azar vaya a y en un paso si se encuentra en la página web x. Según lo dicho anteriormente tenemos q(x, y) = 0,15 X + número de enlaces de x que apuntan a y número total de enlaces en la página web x. Luego falta definir en qué página comienza el navegante. Vamos a suponer que comienza en una página al azar de X con distribución p. Es decir p es una probabilidad en X. El caso en que el navegante siempre comienza en cierta página x 0 se corresponde a la probabilidad p que da masa 1 a x 0 y 0 al resto de las páginas. Entonces nuestro modelo, la probabilidad µ en X N, es la única medida tal que para todo cilindro [x 1,..., x n ] P N se cumple µ p,q ([x 1,..., x n ]) = p(x 1 )q(x 1, x 2 )q(x 2, x 3 ) q(x n 1, x n ). Ejercicio 1. Demostrar que para todo conjunto finito P, toda matriz (q(x, y)) x,y X que cumple y q(x, y) = 1 para todo x, y toda probabilidad p en X existe una única probabilidad µ p,q en P N tal queremos µ p,q ([x 1,..., x n ]) = p(x 1 )q(x 1, x 2 )q(x 2, x 3 ) q(x n 1, x n ) para todo cilindro [x 1,..., x n ]. Notemos que la medida µ p,q σ : X N X N definido por no tiene porqué ser invariante para el shift σ(x 1, x 2,...) = (x 2, x 3,...). El resultado más básico sobre este tipo de medidas es completamente elemental, dependiendo solamente de álgebra lineal en R n. Sin embargo es un resultado muy importante con una gran variedad de generalizaciones y aplicaciones en diferentes contextos. Ejercicio 2 (Teorema de Perron-Frobenius). 1. Demostrar que toda matriz de n n con entradas no negativas A existe un vector v con entradas no negativas que es vector propio de A. 2. Si además A cumple la propiedad de que la suma de las coordenadas de Av es igual a la de v para todo v R n, deducir que existe un vector propio con entradas no negativas y tal que su suma de coordenadas es 1. 3. Si además todas las coordenadas de A son estrictamente positivas demostrar que el v de la parte anterior es único. 4. Demostrar que para todo conjunto finito X y toda matriz de transición (q(x, y)) x,y X satisfaciendo la condición del ejercicio anterior, existe una probabilidad p en X tal que µ p,q es shift invariante en X N. 2

5. En las condiciones de la parte anterior, si además existe n tal que para todo x, y X existen x 1,..., x n 1 tales que q(x, x 1 )q(x 2, x 3 ) q(x n 1, y) > 0, deducir que p es única y que la medida µ p,q es ergódica para el shift. En las condiciones del último ítem del ejercicio anterior se dice que la cadena de Markov (o medida de Markov) es irreducible y aperiódica. Irreducible porque empezando en cualquier x hay probabilidad positiva de llegar a cualquier otra página y después de algunos pasos. Aperiódica porque el mayor divisor común de los tiempos en los cuales es posible llegar de x a y es 1. Notemos que el modelo de interés para PageRank es una cadena irreducible y aperiódica. Ejercicio 3. Si X = {x, y} y q(x, x) = q(y, y) = 0, q(x, y) = q(y, x) = 1, Cuales son las probabilidades p en X que hacen que µ p,q sea shift invariante? Cuáles hacen que µ p,q sea ergódica? Repetir el ejercicio con X = {0, 1, 2, 3} donde q(a, b) = 1/2 sí y sólo si a b = ±1(mod )4 y 0 en caso contrario (esto modela caminar en un cuadrado eligiendo ir horario o antihorario en cada paso con probabilidad 1/2). 1.2. Porqué existe el PageRank? y Cómo se calcula? Hemos fijado nuestro modelo para el navegador al azar, i.e. la probabilidad µ p,q en X N. El PageRank de una página x se define como PR(x) = 1 x (x 1 ) + + 1 x (x n ) lím donde (x 1,..., x n,...) es una sucesión típica para la probabilidad µ p,q. Es decir se podría aproximar el valor de PR numéricamente usando una computadora para simular una trayectoria muy larga del navegador al azar y calculando la fracción de tiempo que pasó en cada página. Esto parece un procedimiento muy ineficiente (dado que hay más de mil millones de páginas). El procedimiento basado en simulación está justificado por el siguiente resultado. Corolario 1 (Existencia de PageRank). En el modelo fijado para el navegador al azar, existe un conjunto A X N con µ p,q (A) = 1 probabilidad total tal que el límite 1 x (x 1 ) + + 1 x (x n ) PR(x) = lím existe y toma el mismo valor para toda trayectoria (x 1, x 2,...) Ahora enunciaremos el resultado general del cual lo anterior es un corolario. Teorema 1. Sea X un conjunto finito y q una matriz de transición que determina una cadena irreducible y aperiódica. Sea p 0 la única probabilidad en X tal que µ p0,q es shift invariante. Entonces para toda probabilidad p en X se cumple: µ p,q ({(x 1,...) X N 1 x (x 1 ) + + 1 x (x n ) : lím = p 0 (x) para todo x X. }) = 1, 3

Demostración. Empecemos poniéndole el nombre A al conjunto de trayectorias en X N que queremos mostrar que tiene medida 1 para toda probabilidad µ p,q, es decir { } A = (x 1,...) X N 1 x (x 1 ) + + 1 x (x n ) : lím = E µp0,q (1 x ). Como µ p0,q es ergódica para el shift se tiene µ p0,q(a) = 1. Dada una probabilidad cualquiera p en X mostraremos que µ p,q es absolutamente continua respecto a µ p0,q (i.e. todo conjunto de medida nula para µ p0,q tiene medida nula para µ p,q ). De esto se deduce el resultado inmediatamente. Para mostrar que µ p,q es absolutamente continua respecto a µ p0,q notemos que, como q es irreducible y aperiódica, existe n tal que para todo x, y X tenemos existen x 1,..., x n 1 tales que q(x, x 1 ) q(x n 1, y) > 0. Entonces para este valor de n se tiene µ p0,q({((x 1, x 2,...) X N : x n = x}) > 0 para todo x X. Como µ p0,q es shift invariante esto implica que p 0 (x) = µ p0,q({((x 1, x 2,...) X N : x 1 = x}) > 0 para todo X. Como consecuencia de lo anterior dada cualquier otra probabilidad p existe C tal que p(x) Cp 0 (x) para todo x X. De esto se deduce que µ p,q ([x 1,..., x m ]) Cµ p0,q([x 1,..., x m ]) para todo cilindro [x 1,..., x n ] X N. Esto implica que cualquier conjunto de medida nula para µ p0,q también tiene medida nula para µ p,q, lo cual concluye la demostración. El teorema anterior implica que el PageRank de una página web x es simplemente p 0 (x) donde p 0 es la única probabilidad en X tal que µ p0,q es shift invariante. Esto reduce el problema de calcular el PageRank al de calcular un vector propio de una matriz con entradas positivas. Para esto esto existen buenos métodos numéricos uno de los más simples es simplemente calcular un potencia grande de la matriz. Ejercicio 4. Sea A una matriz n n con entradas estrictamente positivas y tal que la suma de coordenadas de Av es igual a la de v para todo v R n. Mostrar que dado cualquier v con entradas no negativas y con suma de coordenadas igual a 1, A n v v 0 donde v 0 es el único vector propio de A con entradas positivas cuyas coordenadas suman 1. Ejercicio 5. En el siguiente grafo (se supone que cada vértices es una página web y las flechas son los enlaces) Cuál te parece que sería el orden de importancia de los nodos? Calculá el PageRank exactamente, o al menos con suficiente exactitud para ver si tu intuición coincide con el resultado. 4

1 2 4 3 5