Medidas y análisis del grafo de la Web
|
|
- Susana Córdoba Toledo
- hace 8 años
- Vistas:
Transcripción
1 Minería de la Web análisis del Marcelo F. Durante
2 Bibliografía Graph Structure in the Web, por Andrei Broder et al, año The Indexable Web is More than 11.5 Billion Pages, por A. Gulli & A. Signorini, año
3 Graph Structure in the Web 3
4 Introducción (1) El estudio de la Web como un grafo permite una nueva e interesante mirada a los algoritmos de crawling, búsqueda y recuperación de la información. En general es de gran ayuda a cualquier aplicación (académica o comercial) que desee realizar alguna acción sobre la web, al contar con una estructura de alto nivel. En este estudio se pusieron bajo la lupa diferentes propiedades del grafo, incluyendo diámetro, distribuciones de grados en los nodos (cantidad de enlaces entrantes y salientes), componentes conexos y estructura macroscópica y microscópica. 4
5 Introducción (2) Considera a la Web como un grafo dirigido cuyos nodos corresponden a las páginas estáticas, y cuyos arcos son los enlaces entre ellas. 5
6 Propósito Diseñar estrategias de web crawling Analizar el desempeño de los algoritmos que usan la información de los enlaces. Por ejemplo: cómo se comportaría PageRank sobre una estructura como el? la estructura del grafo pueden usarla los buscadores (como Google con su Page Rank) para jerarquizar sus resultados en base a las páginas más referenciadas o apuntadas, que son las páginas más populares. (BAEZA-YATES) Predecir el surgimiento y la evolución de estructuras web, así como desarrollar mejores algoritmos para descubrirlas, y organizarlas. 6
7 Definiciones y Terminología (1) GRAFO DIRIGIDO: Está formado por un conjunto de nodos y un conjunto de arcos. Cada arco es un par ordenado de nodos (u,v) representando una conexión o enlace dirigido desde u hasta v. OUT-DEGREE: representa la cantidad de arcos de la forma (u, v1),..., (u, vk); es decir, es el número de enlaces salientes de u (a cuantas páginas apunta). IN-DEGREE: representa la cantidad de arcos de la forma (v1, u),..., (vk, u); es decir, el número de enlaces entrantes a u (por cuántas páginas es apuntado). CAMINO: es una sequencia de arcos desde el nodo u hasta v, de la forma (u, u1), (u1, u2),..., (uk, v). Un camino de u a v no implica un camino de v a u. 7
8 Definiciones y Terminología (2) DISTANCIA: es la menor cantidad de arcos que representen un camino desde u a v; si no existe un camino de u a v, la distancia es infinito. COMPONENTE FUERTEMENTE CONEXO (SCC): dado un grafo dirigido, un SCC se define como el subconjunto de nodos donde para cualquier par de nodos (u, v) existe un camino desde u hasta v. Un grafo puede tener ninguno, uno o más de un SCC. Si existe más de uno, los SCC son disjuntos entre sí. COMPONENTE DÉBILMENTE CONEXO (WCC): es un componente de un grafo no dirigido obtenido en base a componentes de un grafo dirigido, pero ignorando el sentido de los arcos. 8
9 Definiciones y Terminología (3) BÚSQUEDA PRIMERO EN AMPLITUD (BFS): Una BFS en un grafo dirigido comienza e el nodo u, y procede a construir el conjunto de nodos alcanzables desde u en una serie de capas. Así, la capa 1 contiene a los nodos que están apuntados por un sólo arco desde u. La capa k contiene a los nodos al que está apuntando algún nodo en la capa k - 1, pero que no están en ninguna capa anterior. Por definición, las capas son disjuntas. La distancia de u a cualquier nodo se puede obtener de una BFS: el camino más corto de u a v es el índice de la capa a la que pertence v, si existe tal capa Un nodo que no es alcanzable desde u no pertenece a ninguna capa, y así se define la distancia infinita. Una BFS sobre un grafo no dirigido se define en forma análoga. 9
10 Definiciones y Terminología (4) DISTRIBUCIÓN POWER LAW Definición de Wikipedia ( Una relación power law entre dos escalares x e y se puede escribir como: y = ax k donde a (la constante de proporcionalidad) y k (el exponente de la power law) son constantes. Su característica es que si se grafica con escala logarítmica, la distribución se puede interpretar como una línea recta, puesto que la ecuación anterior se puede escribir como: log(y) = k log(x) + log(a) que es la misma forma que la ecuación de una recta: y = m x+c 10
11 Definiciones y Terminología (5) DISTRIBUCIÓN POWER LAW Definción del paper: Se enfoca en las distribuciones power law sobre los enteros positivos, definidas como la probabilidad de que un valor i sea proporcional a 1/i k, siendo k un número pequeño y positivo. Similar a la ley de Zipf 11
12 Trabajos previos Dos trabajos recientes (para la época de este paper) hechos a escalas completamente diferentes, sugieren que tanto el IN- DEGREE como el OUT-DEGREE de los nodos del grafo de la web siguen power laws. web crawl del año 97 hecho por Alexa INC con 40 M nodos. sitio de la universidad de Notre Dame (*.nd.edu) Todo esto indica que la distribución power law se da tanto a nivel macroscópico en toda la web, como a nivel microscópico dentro de las páginas de una universidad. 12
13 Información general (1) Se usaron 2 crawls de AltaVista (generados en Mayo y Octubre de 1999) ~200 millones (M) páginas ~1.5 billones (G) links en escala, 5 veces más grande que el mayor estudio anterior Kumar, et. al. usó un data set de 1997 con ~40 M páginas The power law for IN-DEGREE: la probabilidad que un nodo tenga i enlaces entrantes (es decir, que sea apuntado por i páginas) es proporcional a 1/i x,parax > 1 Esta ley se verifica en los experimentos actuales (sobre crawls considerablemente mayores), y se confirma como una propiedad básica de la web. 13
14 Infraestructura (1) Software: Connectivity Server 2 (CS2) desarrollado por Compaq Systems Research Center toma como entrada un Web crawl genera como salida el grafo de la web representa el grafo mediante una DB que contiene: URLsdelcrawl in-links out-links diseñado para alta performance en el accesso a los datos (almacenar la base en memoria). La base de datos generada ocupa 9.5 GB de memoria 14
15 Infraestructura (2) Datos: Altavista Crawls basado en un gran conjunto de puntos de inicio con las siguientes reglas: evitar sobrecarga en los servidores y robots traps evitar/detectar spam, resolver time-outs, etc. índice sin duplicados ni enlaces rotos, etc. Hardware: COMPAQ ALPHA SERVER 4100 de 465 Mhz con 12 GB de RAM 15
16 Algoritmos y Experimentos Se generaron las distribuciones de grado (IN-DEGREE y OUT- DEGREE) para verificar que se ajustan a distribuciones power law. Se hallaron los componentes fuertes y débiles de la Web, y se observó que los tamaños de dichos componentes también se ajustan a una distribución power law. (algoritmos SCC y WCC). Se realizaron 570 BFS, comenzando desde nodos elegidos en forma aleatoria (random-start BFS), tanto en forward como en backward. (algoritmo BFS). El análisis de los resultados muestra una figura que representa la estructura de la web en forma macroscópica. 16
17 Resultados (1) 17
18 Resultados (2) Si los enlaces se consideran no dirigidos, el 90% de los nodos están conectados, es decir, forman un gran componente conexo (débil) de 186 M páginas. Si se tiene en cuenta la dirección de los enlaces, éste único gran componente conexo se divide en cuatro partes o áreas: SCC: es el núcleo o centro, y es un componente fuertemente conexo, donde desde cualquier página se puede llegar a cualquier otra. IN: está formado por las páginas que pueden llegar al SCC, pero no viceversa OUT: está formado por las páginas que son accesibles desde el núcleo, pero que no apuntan a él, por ejemplo sitios corporativos que no tienen enlaces externos. TENDRILS: está formado por páginas que no apuntan al núcleo y que tampoco son apuntadas por éste. 18
19 Resultados (3) El diámetro del SCC es al menos 28, y el diámetro del grafo completo está por encima de 500, lo que contrasta con el modelo de small world. Baeza-Yates: en el núcleo existe un camino para ir de una página cualquiera a otra, siendo el largo máximo (diámetro del núcleo) al menos 28. En otras palabras, el camino más corto entre dos páginas en el peor caso implica visitar 28 de ellas. 19
20 Distribución de Grados (1) Se verifican observaciones anteriores Los resultados de mayo y octubre son coherentes y coincidentes. Exponente In-degree = 2.1 Exponente Out-degree = 2.72 El segmento inicial en Out-degree se desvía significatimavemte de la distribución, sugiriendo que las páginas con bajo Out-degree (es decir, que apuntan a pocos sitios) siguen una distribución diferente, talvez Poisson o una combinación entre power law y Poisson 20
21 Distribución de Grados (2) Distribuciones In-degree y Out-degree de Mayo and Octubre,
22 Distribuciones en SCC y WCC Muestra un gran SCC: cerca de 56 M páginas Representa el 28% de todas las páginas del crawl, todos los demás SCC son significativamente más chicos la distribución en el tamaño del SCC también obedece a una power law, con exponente 2.5. Ídem para el tamaño del WCC 22
23 Random-Start BFS Realizados para estudiar aspectos de diámetro y distancia promedio El algoritmo se comportaba de dos maneras: Die out después de alcanzar un pequeño conjunto de nodos (< 90 nodos) Explode hasta cubrir cerca de 100 M nodos aunque nunca los 186 M del WCC aveces ocurría tantoen forward como en backward 23
24 Power Law vs. Zipf La distribución In-degree se ajusta mejor a la ley de Zipf que a una power law. 24
25 Tamaño de componentes (1) Resultados de random-start BFS: 186 M nodos en un gran componente débil. 56 M nodos en un componente fuerte. Éstos resultados se utilizan para estimar los tamaños de los restantes componentes: IN, OUT, TENDRILS, y DISCONNECTED 25
26 Tamaño de componentes (2) Sabiendo que existe un camino directo para cada nodo en IN a cualquier nodo en SCC. Cada BFS con start node en SCC alcanza 100 M nodos, siguiendo una expansión a través de in-links. Sabiendo que existe un camino directo para cada nodo en SCC cualquier nodo en OUT. Cada nodo en SCC alcanza 100 M nodos, siguiendo una expansión a través de out-links. SCC + IN = SCC + OUT = ~100 M IN y OUT = 44 M nodos cada uno. 26
27 Tamaño de componentes (3) DISCONNECTED: Total de nodos en el web crawl M nodos Total de nodos en el WCC M nodos DISCONNECTED = Total WCC 16.8 M nodos TENDRILS WCC SCC IN OUT = Tendrils 44 M nodes 27
28 Conclusiones Utilizando data sets (web crawls) más grandes, se obtienen resultados más exactos. El grafo no dirigido de la web (WCC) muestra mucha más conectividad que el grafo dirigido. Y aunque SCC + IN + OUT comprenden el 70% del total, dadas dos páginas aleatorias, sólo se puede alcanzar una desde la otra un 25% de las veces. El efecto small world ya no es aplicable a ésta realidad, puesto que en algunos casos, para ir de una página a otra, sólo se puede hacer a través de cientos de páginas. 28
29 The Indexable Web is more than 11.5 billion pages 29
30 Propósito y Utilidad Estimar el tamaño de la web indexable, en base a los buscadores más grandes. Estimar el solapamiento o intersección entre GOOGLE, MSN, ASK/TEOMA y YAHOO! Estimar el tamaño de la web es muy útil para aplicaciones que realizan compresión de contenidos web, ranking, crawling y minería de la web. 30
31 Introducción Cuál es es tamaño actual de la web? Estimarlo es bastante difícil, por su naturaleza dinámica, sin embargo se puede estimar el tamaño de la web indexable. Qué es la a web indexable? se define como la porción de la web que indexan los buscadores más grandes. Por ejemplo, los utilizados en estos experimentos, son: GOOGLE: 8 G páginas MSN: 5 G páginas ASK/TEOMA: 2 G páginas YAHOO!: 4 G páginas 31
32 Procedimientos (1) SAMPLING: elege páginas al azar de forma uniforme y del índice de un motor de búsqueda en particular. CHECKING: determina si una página en particular está indexada por un dado motor de búsqueda. 32
33 Procedimientos (2) SAMPLING: basado en consultas se envía un grupo de consultas a un buscador seleccionado y se selecciona un URL al azar dentro de los 100 primeros resultados. para generar las consultas, utilizaron DMOZ (4 M páginas) para crear un diccionario de consultas-términos (2 M), los ordenaron por ocurrencia y los dividieron en bloques. de cada bloque se eligió un término y se envió a un buscador diferente. Luego, para cada consulta se seleccionó una de las primeras 100 respuestas. 33
34 Procedimientos (3) CHECKING basado en consultas cada buscador permite verficar si un dado URL se encuentra indexado esto requiere una cuidadosa normalización de los URLs Tanto para el Sampling como el Checking se utilizó Helios (un metabuscador open source). Cada consulta de sampling se envió a Helios que la reenvió a los motores de búsqueda mencionados. 34
35 Hardware Linux Cluster de 43 servidores Ancho de banda 70 GB Más de 3600 horas máquina 35
36 Resultados 36
37 Gracias!! Preguntas y/o sugerencias? VAMOS ARGENTINA!!!! 37
Módulo 9 Sistema matemático y operaciones binarias
Módulo 9 Sistema matemático y operaciones binarias OBJETIVO: Identificar los conjuntos de números naturales, enteros, racionales e irracionales; resolver una operación binaria, representar un número racional
Más detallesMotores de Búsqueda Web Tarea Tema 2
Motores de Búsqueda Web Tarea Tema 2 71454586A Motores de Búsqueda Web Máster en Lenguajes y Sistemas Informáticos - Tecnologías del Lenguaje en la Web UNED 30/01/2011 Tarea Tema 2 Enunciado del ejercicio
Más detallesDISCOS RAID. Se considera que todos los discos físicos tienen la misma capacidad, y de no ser así, en el que sea mayor se desperdicia la diferencia.
DISCOS RAID Raid: redundant array of independent disks, quiere decir conjunto redundante de discos independientes. Es un sistema de almacenamiento de datos que utiliza varias unidades físicas para guardar
Más detallesCOMO CONFIGURAR UNA MAQUINA VIRTUAL EN VIRTUALBOX PARA ELASTIX
COMO CONFIGURAR UNA MAQUINA VIRTUAL EN VIRTUALBOX PARA ELASTIX En este manual se presenta el proceso de configuración de una Maquina Virtual en VirtualBox, que será utilizada para instalar un Servidor
Más detallesCapítulo 12: Indexación y asociación
Capítulo 12: Indexación y asociación Conceptos básicos Índices ordenados Archivos de índice de árbol B+ Archivos de índice de árbol B Asociación estática Asociación dinámica Comparación entre indexación
Más detallesDOMINIO Y RANGO página 89. Cuando se grafica una función existen las siguientes posibilidades:
DOMINIO Y RANGO página 89 3. CONCEPTOS Y DEFINICIONES Cuando se grafica una función eisten las siguientes posibilidades: a) Que la gráfica ocupe todo el plano horizontalmente (sobre el eje de las ). b)
Más detallesa < b y se lee "a es menor que b" (desigualdad estricta) a > b y se lee "a es mayor que b" (desigualdad estricta)
Desigualdades Dadas dos rectas que se cortan, llamadas ejes (rectangulares si son perpendiculares, y oblicuos en caso contrario), un punto puede situarse conociendo las distancias del mismo a los ejes,
Más detallesHADOOP, como una plataforma de procesamiento masivo de datos
HADOOP, como una plataforma de procesamiento masivo de datos Esquema de Trabajo Objetivo Alcances Limitaciones Fundamentos Teóricos Análisis Preliminar Herramientas Estructura del Cluster Resultados Desarrollo
Más detallesEstructura de la Web. Felipe Bravo Márquez. 6 de noviembre de 2013
Felipe Bravo Márquez 6 de noviembre de 2013 La Web Internet Es un conjunto descentralizado de redes de comunicación interconectadas que utilizan la familia de protocolos TCP/IP. Qué es la Web? World Wide
Más detallesUN EJEMPLO DE BÚSQUEDA Tutorial sobre el uso de Google.
UN EJEMPLO DE BÚSQUEDA Tutorial sobre el uso de Google. En la actualidad uno de los buscadores más populares es Google, que se caracteriza por tener un sistema para jerarquizar y ordenar los resultados
Más detalles1.1. Introducción y conceptos básicos
Tema 1 Variables estadísticas Contenido 1.1. Introducción y conceptos básicos.................. 1 1.2. Tipos de variables estadísticas................... 2 1.3. Distribuciones de frecuencias....................
Más detalles2. Probabilidad. Estadística. Curso 2009-2010. Ingeniería Informática. Estadística (Aurora Torrente) 2. Probabilidad Curso 2009-2010 1 / 24
2. Probabilidad Estadística Ingeniería Informática Curso 2009-2010 Estadística (Aurora Torrente) 2. Probabilidad Curso 2009-2010 1 / 24 Contenidos 1 Experimentos aleatorios 2 Algebra de sucesos 3 Espacios
Más detallesConclusiones. Particionado Consciente de los Datos
Capítulo 6 Conclusiones Una de las principales conclusiones que se extraen de esta tesis es que para que un algoritmo de ordenación sea el más rápido para cualquier conjunto de datos a ordenar, debe ser
Más detallesRecuperación de Información en la Web y Motores de Búsqueda
Recuperación de Información en la Web y Motores de Búsqueda Gabriel H. Tolosa tolosoft@unlu.edu.ar - 2015 - Estructura y Características de la Web WWW Algunas preguntas: Qué es? Cuál es su estructura?
Más detallesReflexión. Inicio. Contenido
Exploradores de Internet Navegador WEb Reflexión "Una máquina puede hacer el trabajo de 50 hombres corrientes. Pero no existe ninguna máquina que pueda hacer el trabajo de un hombre extraordinario. Elbert
Más detallesCrawlers - Arañas. UCR ECCI CI-2414 Recuperación de Información Prof. M.Sc. Kryscia Daviana Ramírez Benavides
Crawlers - Arañas UCR ECCI CI-2414 Recuperación de Información Prof. M.Sc. Kryscia Daviana Ramírez Benavides Qué es una Araña? También se le llama robot o araña (spider, crawler). Una araña (crawler) es
Más detallesMineria de datos y su aplicación en web mining data Redes de computadores I ELO 322
Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322 Nicole García Gómez 2830047-6 Diego Riquelme Adriasola 2621044-5 RESUMEN.- La minería de datos corresponde a la extracción
Más detalles[15/2/2013] PROMOCIÓN Y DIFUSIÓN
[15/2/2013] PROMOCIÓN Y DIFUSIÓN En el presente informe se detallan las acciones de promoción y difusión realizadas durante la ejecución del proyecto. ÍNDICE MEDIOS IMPRESOS 2 MATERIAL IMPRESO DE COMUNICACIÓN
Más detallesPARA QUÉ NÚMEROS REALES... 2 SUCESIONES... 3 NÚMEROS COMPLEJOS... 5 CÓNICAS... 6 FUNCIÓN INVERSA... 7 FUNCIONES CUADRÁTICAS... 8
PARA QUÉ SIRVE? Índice NÚMEROS REALES.... 2 SUCESIONES.... 3 SUCESIONES ARITMÉTICAS Y GEOMÉTRICAS.... 4 NÚMEROS COMPLEJOS.... 5 CÓNICAS.... 6 FUNCIÓN INVERSA.... 7 FUNCIONES CUADRÁTICAS.... 8 TEOREMA DE
Más detallesUnidad II: Análisis de Redes
Unidad II: Análisis de Redes 2.1 Conceptos Básicos Un problema de redes es aquel que puede representarse por: LA IMPORTANCIA DE LOS MODELOS DE REDES: Muchos problemas comerciales pueden ser resueltos a
Más detallesEstadísticas de uso en Internet de sistemas operativos y navegadores en junio de 2014
Tutoriales de ayuda e información para todos los niveles (ver más tutoriales) Estadísticas de uso en Internet de sistemas operativos y navegadores en junio de 2014 Cuáles son los sistemas operativos, navegadores
Más detallesCAPÍTULO VI PREPARACIÓN DEL MODELO EN ALGOR. En este capítulo, se hablará acerca de los pasos a seguir para poder realizar el análisis de
CAPÍTULO VI PREPARACIÓN DEL MODELO EN ALGOR. En este capítulo, se hablará acerca de los pasos a seguir para poder realizar el análisis de cualquier modelo en el software Algor. La preparación de un modelo,
Más detallesActividades con GeoGebra
Conectar Igualdad - "Netbooks Uno a Uno" Actividades con GeoGebra Nociones básicas, rectas Silvina Ponce Dawson Introducción. El GeoGeobra es un programa que permite explorar nociones matemáticas desde
Más detallesESTIMACIÓN. puntual y por intervalo
ESTIMACIÓN puntual y por intervalo ( ) Podemos conocer el comportamiento del ser humano? Podemos usar la información contenida en la muestra para tratar de adivinar algún aspecto de la población bajo estudio
Más detallesArquitectura de sistema de alta disponibilidad
Mysql Introducción MySQL Cluster esta diseñado para tener una arquitectura distribuida de nodos sin punto único de fallo. MySQL Cluster consiste en 3 tipos de nodos: 1. Nodos de almacenamiento, son los
Más detallesCRECE EN INTERNET. Llegar a buen puerto: buscando información
CRECE EN INTERNET Llegar a buen puerto: buscando información Llegar a buen puerto: buscando información Internet es una red mundial que vincula miles de ordenadores que almacenan gran cantidad de documentos
Más detallesDOMINIO Y RANGO DE UNA FUNCIÓN I N D I C E. martilloatomico@gmail.com. Página. Titulo:
Titulo: DOMINIO Y RANGO I N D I C E Página DE UNA FUNCIÓN Año escolar: 4to. Año de Bachillerato Autor: José Luis Albornoz Salazar Ocupación: Ing Civil. Docente Universitario País de residencia: Venezuela
Más detallesDecisión: Indican puntos en que se toman decisiones: sí o no, o se verifica una actividad del flujo grama.
Diagrama de Flujo La presentación gráfica de un sistema es una forma ampliamente utilizada como herramienta de análisis, ya que permite identificar aspectos relevantes de una manera rápida y simple. El
Más detalles6. VECTORES Y COORDENADAS
6. VECTORES Y COORDENADAS Página 1 Traslaciones. Vectores Sistema de referencia. Coordenadas. Punto medio de un segmento Ecuaciones de rectas. Paralelismo. Distancias Página 2 1. TRASLACIONES. VECTORES
Más detallesGRAFOS. Prof. Ing. M.Sc. Fulbia Torres
ESTRUCTURAS DE DATOS 2006 Prof. DEFINICIÓN Un grafo consta de un conjunto de nodos(o vértices) y un conjunto de arcos (o aristas). Cada arco de un grafo se especifica mediante un par de nodos. Denotemos
Más detallesBeneficios estratégicos para su organización. Beneficios. Características V.2.0907
Herramienta de inventario que automatiza el registro de activos informáticos en detalle y reporta cualquier cambio de hardware o software mediante la generación de alarmas. Beneficios Información actualizada
Más detallesApuntes de Matemática Discreta 1. Conjuntos y Subconjuntos
Apuntes de Matemática Discreta 1. Conjuntos y Subconjuntos Francisco José González Gutiérrez Cádiz, Octubre de 2004 Universidad de Cádiz Departamento de Matemáticas ii Lección 1 Conjuntos y Subconjuntos
Más detallesPROBABILIDADES Y ESTADÍSTICA (C) Práctica 2
7 PROBABILIDADES Y ESTADÍSTICA (C) Práctica 2 1. Se eligen tres autos al azar y cada uno es clasificado N si tiene motor naftero o D si tiene motor diesel (por ejemplo, un resultado posible sería N N D).
Más detallesXLIV Olimpiada Matemática Española Fase nacional 2008 (Valencia) PRIMERA SESIÓN (28 de marzo)
Fase nacional 008 (Valencia) PRIMERA SESIÓN (8 de marzo).- Halla dos enteros positivos a y b conociendo su suma y su mínimo común múltiplo. Aplícalo en el caso de ue la suma sea 97 y el mínimo común múltiplo
Más detallesTema 6: Problemas Especiales de Programación Lineal
Tema 6: Problemas Especiales de Programación Lineal Transporte Asignación Transbordo Tienen una estructura especial que permite modelizar situaciones en las que es necesario: Determinar la manera óptima
Más detallesGuía Google Webmaster Tools
Domotua Marketing Online Guía Google Webmaster Tools Domotua Marketing Online 2014 Aumenta el número de clientes Aumenta la reputación de tu marca Te ayudamos a aprovecha Internet al 100% www.domotuamarketingonline.com
Más detallesPROBABILIDADES Y ESTADÍSTICA (C) Práctica 2
PROBABILIDADES Y ESTADÍSTICA (C) Práctica 2 1. Se eligen tres autos al azar y cada uno es clasificado N si tiene motor naftero o D si tiene motor diesel (por ejemplo, un resultado posible sería NND). a)
Más detallesRecuperación de Información en Internet Tema 3: Principios de Recuperación de Información
Recuperación de Información en Internet Tema 3: Principios de Recuperación de Información Mestrado Universitario Língua e usos profesionais Miguel A. Alonso Jesús Vilares Departamento de Computación Facultad
Más detallesINFORME AUDITORIA DE SU SITIO WEB GOOGLE PAGE RANK ÍNDICE INTERNET
INFORME AUDITORIA DE SU SITIO WEB HOTEL EJEMPLO HTTP://WWW.HOTELEJEMPLO.COM El propósito de este documento es demostrar con datos reales la situación de la página web respecto a los buscadores, y en concreto
Más detallesASÍ CONSIGUES QUE TU WEB FUNCIONE EN BUSCADORES:
Tener una web no es sinónimo de aparecer en las primeras posiciones de los buscadores, ya que esto es una tarea complicada que lleva mucho tiempo. Para lograr una buena posición es necesario utilizar técnicas
Más detallesInstructivo para la sincronización de servidores Intellect
Instructivo para la sincronización de servidores Intellect Este instructivo será de gran utilidad para los casos en que se cuente con una instalación de Intellect que tenga más de un servidor y sea preciso
Más detallesDatos del autor. Nombres y apellido: Germán Andrés Paz. Lugar de nacimiento: Rosario (Código Postal 2000), Santa Fe, Argentina
Datos del autor Nombres y apellido: Germán Andrés Paz Lugar de nacimiento: Rosario (Código Postal 2000), Santa Fe, Argentina Correo electrónico: germanpaz_ar@hotmail.com =========0========= Introducción
Más detallesJornadas de INCLUSION DIGITAL. a través de las TIC ORGANIZAN: CAPACITA: CLAEH
Jornadas de INCLUSION DIGITAL a través de las TIC ORGANIZAN: CAPACITA: CLAEH BÚSQUEDAS EN INTERNET SABER BUSCAR La cantidad de información disponible en Internet es inmensa y crece día a día, lo que implica
Más detallesCAPÍTULO II MARCO TEÓRICO ADMNISTRACIÓN DE PROYECTOS CON CPM
CAPÍTULO II MARCO TEÓRICO ADMNISTRACIÓN DE PROYECTOS CON CPM 10 2.1 Introducción La dirección de un proyecto de gran magnitud no es una tarea fácil. Para los administradores este es uno de los trabajos
Más detallesLa importancia de las pruebas de penetración (Parte I)
Publicado en Revista.Seguridad (http://revista.seguridad.unam.mx) Inicio > La importancia de las pruebas de penetración (Parte I) La importancia de las pruebas de penetración (Parte I) Por Erika Gladys
Más detallesBASES Y DIMENSIÓN. Propiedades de las bases. Ejemplos de bases.
BASES Y DIMENSIÓN Definición: Base. Se llama base de un espacio (o subespacio) vectorial a un sistema generador de dicho espacio o subespacio, que sea a la vez linealmente independiente. β Propiedades
Más detallesMANUAL PARA MODULO ESTADISTICAS. Este es un resumen para la mejor interpretación y análisis de las estadísticas de su sitio.
MANUAL PARA MODULO ESTADISTICAS Este es un resumen para la mejor interpretación y análisis de las estadísticas de su sitio. Nº de visitantes distintos: nº de servidores (direcciones IP) que entran a un
Más detallesCURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK. www.formacionhadoop.com
CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK www.formacionhadoop.com Índice 1 Qué es Big Data? 2 Problemas con los sistemas tradicionales 3 Qué es Spark? 3.1 Procesamiento de datos distribuido
Más detallesLINEAMIENTOS ESTÁNDARES APLICATIVOS DE VIRTUALIZACIÓN
LINEAMIENTOS ESTÁNDARES APLICATIVOS DE VIRTUALIZACIÓN Tabla de Contenidos LINEAMIENTOS ESTÁNDARES APLICATIVOS DE VIRTUALIZACIÓN... 1 Tabla de Contenidos... 1 General... 2 Uso de los Lineamientos Estándares...
Más detallesDATA MINING EN LA BASE DE DATOS DE LA OMS KNOWLEDGE DETECTION (DETECCIÓN DEL CONOCIMIENTO) Q.F.B. JUANA LETICIA RODRÍGUEZ Y BETANCOURT
DATA MINING EN LA BASE DE DATOS DE LA OMS KNOWLEDGE DETECTION (DETECCIÓN DEL CONOCIMIENTO) Q.F.B. JUANA LETICIA RODRÍGUEZ Y BETANCOURT REACCIONES ADVERSAS DE LOS MEDICAMENTOS Los fármacos por naturaleza
Más detallesLo primero que tenemos que hacer es abrirnos una cuenta gratuita en Google Places.
Si quieres saber como puedes posicionar tu empresa, negocio y/o sitio web, en el servicio de listados locales Google Maps y así poder dominar las primeras posiciones en los listados orgánicos de Google
Más detallesCURSO BÁSICO DE MATEMÁTICAS PARA ESTUDIANTES DE ECONÓMICAS Y EMPRESARIALES
INECUACIONES NOTA IMPORTANTE: El signo de desigualdad de una inecuación puede ser,, < o >. Para las cuestiones teóricas que se desarrollan en esta unidad únicamente se utilizará la desigualdad >, siendo
Más detallesHostaliawhitepapers. Las ventajas de los Servidores dedicados. www.hostalia.com. Cardenal Gardoki, 1 48008 BILBAO (Vizcaya) Teléfono: 902 012 199
Las ventajas de los Servidores dedicados Cardenal Gardoki, 1 48008 BILBAO (Vizcaya) Teléfono: 902 012 199 www.hostalia.com A la hora de poner en marcha una aplicación web debemos contratar un servicio
Más detallesDivisibilidad y números primos
Divisibilidad y números primos Divisibilidad En muchos problemas es necesario saber si el reparto de varios elementos en diferentes grupos se puede hacer equitativamente, es decir, si el número de elementos
Más detallesDatos estadísticos. 1.3. PRESENTACIÓN DE DATOS INDIVIDUALES Y DATOS AGRUPADOS EN TABLAS Y GRÁFICOS
.. PRESENTACIÓN DE DATOS INDIVIDUALES Y DATOS AGRUPADOS EN TABLAS Y GRÁFICOS Ser: Describir el método de construcción del diagrama de tallo, tabla de frecuencias, histograma y polígono. Hacer: Construir
Más detallesTEMA 4: EMPEZANDO A NAVEGAR ESCUELA UNIVERSITARIA DE INFORMÁTICA. Raúl Martín Martín
TEMA 4: EMPEZANDO A ESCUELA UNIVERSITARIA DE INFORMÁTICA NAVEGAR Raúl Martín Martín SERVICIOS DE INTERNET SERVICIOS DE INTERNET Las posibilidades que ofrece Internet se denominan servicios. Hoy en día,
Más detallesUNIVERSIDAD DE MEDELLÍN NUEVO PORTAL WEB MANUAL DE USUARIO GESTOR DE CONTENIDOS
UNIVERSIDAD DE MEDELLÍN MANUAL DE USUARIO GESTOR DE CONTENIDOS NUEVO PORTAL WEB TABLA DE CONTENIDO Tabla de Contenido 2 Consideraciones Iniciales 3 Ingreso al Sistema 4 Opciones de Gestor de contenidos
Más detallesMÓDULO IV INTERNET: ESTRATEGIAS DE BÚSQUEDA DE INFORMACIÓN ACADÉMICA PROGRAMA DE EDUCACIÓN EN INFORMACIÓN
MÓDULO IV INTERNET: ESTRATEGIAS DE BÚSQUEDA DE INFORMACIÓN ACADÉMICA PROGRAMA DE EDUCACIÓN EN INFORMACIÓN PANORÁMICA M-2 M-2 Biblioteca Biblioteca y sus sus servicios servicios M-3 M-3 Biblioteca Biblioteca
Más detallesAlgoritmos y Estructuras de Datos 2. Web Mining Esteban Meneses
Algoritmos y Estructuras de Datos 2 Web Mining Esteban Meneses 2005 Motivación La Web contiene miles de millones de documentos con información sobre casi cualquier tópico. Es la Biblioteca de Alejandría
Más detallesI. RELACIONES Y FUNCIONES 1.1. PRODUCTO CARTESIANO { }
I. RELACIONES Y FUNCIONES PAREJAS ORDENADAS Una pareja ordenada se compone de dos elementos x y y, escribiéndose ( x, y ) donde x es el primer elemento y y el segundo elemento. Teniéndose que dos parejas
Más detallesInstructivo de uso vfound Easy SEO v1.5.5
Instructivo de uso vfound Easy SEO v1.5.5 PROPOSITO VFO está pensado para que usted pueda lograr una buena posición en los resultados de las búsquedas de los principales motores de búsqueda (Google, Yahoo,
Más detallesApuntes de Matemática Discreta 9. Funciones
Apuntes de Matemática Discreta 9. Funciones Francisco José González Gutiérrez Cádiz, Octubre de 004 Universidad de Cádiz Departamento de Matemáticas ii Lección 9 Funciones Contenido 9.1 Definiciones y
Más detallesServicio de estadísticas de Alojamiento Fecha de revisión: 19/09/2005
Servicio de estadísticas de Alojamiento Fecha de revisión: 19/09/2005 1. Acerca de este documento Este documento describe el servicio de estadísticas del que actualmente disfrutan algunas de las páginas
Más detallesCiclo de vida y Metodologías para el desarrollo de SW Definición de la metodología
Ciclo de vida y Metodologías para el desarrollo de SW Definición de la metodología La metodología para el desarrollo de software es un modo sistemático de realizar, gestionar y administrar un proyecto
Más detallesSistemas de Recuperación de Información
Sistemas de Recuperación de Información Los SRI permiten el almacenamiento óptimo de grandes volúmenes de información y la recuperación eficiente de la información ante las consultas de los usuarios. La
Más detallesAprendizaje Automático y Data Mining. Bloque IV DATA MINING
Aprendizaje Automático y Data Mining Bloque IV DATA MINING 1 Índice Definición y aplicaciones. Grupos de técnicas: Visualización. Verificación. Descubrimiento. Eficiencia computacional. Búsqueda de patrones
Más detallesScripts de arranque. Pablo Sanz Mercado.
Scripts de arranque. Pablo Sanz Mercado. 1 1. Configuración y comandos básicos. Los niveles de ejecución en Linux son las diferentes formas en las que podemos encontrar un sistema operativo Linux. Cuando
Más detallesIntroducción a la Teoría de Probabilidad
Capítulo 1 Introducción a la Teoría de Probabilidad Para la mayoría de la gente, probabilidad es un término vago utilizado en el lenguaje cotidiano para indicar la posibilidad de ocurrencia de un evento
Más detallesQué es una página web?, qué conoces al respecto?, sabes crear una página
Semana 13 13 Empecemos! Bienvenidos a una nueva sesión, llena de aprendizajes! En semanas anteriores estudiamos lo que son bases de datos, estructuras de datos y métodos de ordenamientos, todo lo cual
Más detallesIntroducción. A continuación te presentamos 6 aspectos que todo retailer debe conocer acerca de sus clientes.
Página 1 Introducción Medir el tráfico, es decir, el número de personas que ingresaron a la tienda puede sonar simple, pero es solo el primer paso para mejorar tu negocio al conocer a tus clientes y realizar
Más detallesAnálisis de situación y Estrategia SEO www.myegoo.com/
Análisis de situación y Estrategia SEO www.myegoo.com/ PROYECTO: MyEgoo PRODUCTO: Plan Inicio Marketing CONTENIDO: Análisis de situación y estrategia FECHA: 16 de junio de 2011 TABLA DE CONTENIDO Introducción...
Más detalles1. Ecuaciones no lineales
1. Ecuaciones no lineales 1.1 Ejercicios resueltos Ejercicio 1.1 Dada la ecuación xe x 1 = 0, se pide: a) Estudiar gráficamente sus raíces reales y acotarlas. b) Aplicar el método de la bisección y acotar
Más detallesMedias Móviles: Señales para invertir en la Bolsa
www.gacetafinanciera.com Medias Móviles: Señales para invertir en la Bolsa Juan P López..www.futuros.com Las medias móviles continúan siendo una herramienta básica en lo que se refiere a determinar tendencias
Más detallesFunciones, x, y, gráficos
Funciones, x, y, gráficos Vamos a ver los siguientes temas: funciones, definición, dominio, codominio, imágenes, gráficos, y algo más. Recordemos el concepto de función: Una función es una relación entre
Más detallesGUIA DE LABORATORIO # Nombre de la Practica: Antivirus Laboratorio de Redes Tiempo Estimado: 2 Horas y 30 Minutos
UNIVERSIDAD DON BOSCO FACULTAD DE ESTUDIOS TECNOLÓGICOS ESCUELA DE COMPUTACIÓN CICLO: I-2015 GUIA DE LABORATORIO # Nombre de la Practica: Antivirus Lugar: Laboratorio de Redes Tiempo Estimado: 2 Horas
Más detallesServicios y aplicaciones clave de la web 2.0
Servicios y aplicaciones clave de la web 2.0 Etiquetado y social bookmarking La web 2,0 ha permitido crear comunidades llamadas Social Bookmarking o marcadores sociales, las cuales son una forma en la
Más detallesLos motores de búsqueda.
Ciclo III - Informática. Guía # 2 Los motores de búsqueda. RETO: Utilizar eficientemente los motores de búsqueda haciendo uso ético del Internet. SEGURIDAD PROTOCOLO ETICA NETIQUETA. LOS MOTORES DE BÚSQUEDA
Más detallesFigura 1: Sociogramas de los actores con mayor grado de la red en ambos periodos
Aproximación al Análisis de Redes Sociales TÉCNICAS Y HERRAMIENTAS DE APOYO A LA INVESTIGACIÓN Curso 2010/2011 Grupo 2 - J. Fresno Bausela, M. Pérez Rivas, C. Reyes Gonzalo, F. Salvador Llorente. Resumen:
Más detallesTema 1 con soluciones de los ejercicios. María Araceli Garín
Tema 1 con soluciones de los ejercicios María Araceli Garín Capítulo 1 Introducción. Probabilidad en los modelos estocásticos actuariales Se describe a continuación la Tarea 1, en la que se enumeran un
Más detallesPor otro lado podemos enunciar los objetivos más específicos de nuestro estudio:
RESUMEN La empresa familiar es aquella cuya administración, dirección y control está en manos de una familia. Sus miembros toman decisiones estratégicas y operativas, asumiendo por completo la responsabilidad
Más detallesPráctica de laboratorio: Investigación de herramientas de colaboración de red
Práctica de laboratorio: Investigación de herramientas de colaboración de red Objetivos Parte 1: Utilizar herramientas de colaboración Identificar el nivel de conocimiento actual de herramientas de colaboración.
Más detallesPosicionamiento de marca. Presencia de tu dominio en la web
Posicionamiento de marca Presencia de tu dominio en la web Sabes como está posicionada tu marca? La mayoría de las marcas logran posicionarse en los primeros puestos de Google; sin embargo Sabes como está
Más detallesUNIVERSIDAD DE ATACAMA
UNIVERSIDAD DE ATACAMA FACULTAD DE INGENIERÍA / DEPARTAMENTO DE MATEMÁTICA ESTADÍSTICA Y PROBABILIDAD GUÍA DE TRABAJO 2 Profesor: Hugo S. Salinas. Primer Semestre 2010 1. La dureza Rockwell de un metal
Más detallesMás Clientes Más Rápido: Marketing Online bien enfocado
Más Clientes Más Rápido: Marketing Online bien enfocado A continuación describo una propuesta comercial que estimo le interesará ya que tiene el potencial de incrementar su negocio en un período relativamente
Más detallesDISPOSITIVO DE BANDA ANCHA
Como funciona un ISP Un ISP es un canalizador de información, puede canalizar la información desde Internet y hacia Internet, es decir brinda acceso a paginas de Internet y a el correo electrónico (utilizando
Más detallesPor: Luis M. Jaramillo Efecternet. Que son los motores de búsqueda
Por: Luis M. Jaramillo Efecternet Que son los motores de búsqueda Los motores de búsqueda como Google, Yahoo, Bing, Altavista y otros, son grandes bases de datos que acopian información sobre una gran
Más detallesÍndice. Para adquirir informes personalizados llame al teléfono +34 618 802 175 o escriba a la dirección de correo electrónico comercial@netsuus.
Informe Compras Colectivas Marzo 2010 Febrero 2011 Índice Compras Colectivas. Análisis de la categoría... 3 Compras Colectivas. Presencia en Redes Sociales... 4 Sobre Netsuus... 6 Glosario... 7 Para adquirir
Más detallesDeterminación de primas de acuerdo al Apetito de riesgo de la Compañía por medio de simulaciones
Determinación de primas de acuerdo al Apetito de riesgo de la Compañía por medio de simulaciones Introducción Las Compañías aseguradoras determinan sus precios basadas en modelos y en información histórica
Más detallesIngeniería de Software I
Ingeniería de Software I Diagramas de Actividad 2 Cuatrimestre 1998 1. INTRODUCCIÓN 1 2. DIAGRAMA DE ACTIVIDAD 1 2.1. SEMÁNTICA 1 2.2. NOTACIÓN 1 2.3. EJEMPLO 2 3. ACCIÓN 3 3.1. SEMÁNTICA 3 3.2. NOTACIÓN
Más detallesIngeniería del Software I Clase de Testing Funcional 2do. Cuatrimestre de 2007
Enunciado Se desea efectuar el testing funcional de un programa que ejecuta transferencias entre cuentas bancarias. El programa recibe como parámetros la cuenta de origen, la de cuenta de destino y el
Más detallesNo se requiere que los discos sean del mismo tamaño ya que el objetivo es solamente adjuntar discos.
RAIDS MODO LINEAL Es un tipo de raid que muestra lógicamente un disco pero se compone de 2 o más discos. Solamente llena el disco 0 y cuando este está lleno sigue con el disco 1 y así sucesivamente. Este
Más detallesConceptos y Herramientas POSICIONAMIENTO WEB. www.envista.es 1
Conceptos y Herramientas POSICIONAMIENTO WEB www.envista.es 1 Por qué GOOGLE? Búsquedas en España: 90% en Google Google Otros www.envista.es 2 Google GUÍA SEO PARA PRINCIPIANTES www.envista.es 3 SEO? SearchEngineOptimization
Más detallesEvolución de la confianza del consumidor en la República Dominicana,
Ministerio de Economía, Planificación y Desarrollo Unidad Asesora de Análisis Económico y Social (UAAES) Evolución de la confianza del consumidor en la República Dominicana, Octubre 2007- Abril 2010 Presentación
Más detallesIntroducción a Moodle
Instituto la Américas de Nayarit Ing. Elías Portugal Luna Qué es Moodle? Moodle es una aplicación web de tipo Ambiente Educativo Virtual, un sistema de gestión de cursos, de distribución libre, que ayuda
Más detallesPosicionamiento WEB POSICIONAMIENTO WEB GARANTIZADO
Posicionamiento WEB 1 Tipos de Posicionamiento Web Posicionamiento Orgánico o Natural (SEO): es el posicionamiento que se consigue en los motores de búsqueda para las palabras clave seleccionadas. Este
Más detallesSitemap de texto plano (sin formato)
1 de 10 23/08/2008 1:55 Sitemap, Mapa del sitio web. Importancia para el posicionamiento en buscadores Fecha Domingo, 20 julio a las 02:10:51 Tema Internet y comunicaciones Establecer un formato correcto
Más detallesFUNCIONES CUADRÁTICAS Y RACIONALES
www.matesronda.net José A. Jiménez Nieto FUNCIONES CUADRÁTICAS Y RACIONALES 1. FUNCIONES CUADRÁTICAS. Representemos, en función de la longitud de la base (), el área (y) de todos los rectángulos de perímetro
Más detallesTema 7: Optimización sobre Redes Muchos de los problemas de Investigación Operativa pueden modelizarse y resolverse sobre un grafo: conjunto de
Tema 7: Optimización sobre Redes Muchos de los problemas de Investigación Operativa pueden modelizarse y resolverse sobre un grafo: conjunto de vértices o nodos conectados con arcos y/o aristas. Diseñar
Más detallesUniversidad de Antioquia Juan D. Mendoza V.
Universidad de Antioquia Juan D. Mendoza V. El router es una computadora diseñada para fines especiales que desempeña un rol clave en el funcionamiento de cualquier red de datos. la determinación del mejor
Más detalles