Proceso del KDD (minería de datos o DataMining)

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Proceso del KDD (minería de datos o DataMining)"

Transcripción

1 Qué es el KDD? Es un proceso no trivial que identifica patrones validos, previamente desconocidos, potencialmente utiles y fundamentalmente entendibles en los datos. es como se reconoce de manera teoria a la minería de datos (DataMining). Proceso del KDD (minería de datos o DataMining) Selección: obtencion de los datos de diversas fuentes. Preprocesado: limpieza de datos. Transformación: convertir todos los datos a un formato común. DataMining: obtenr los resultados deseados. Interpretación: presentar los resultados al usuario de manera adecuada. Pablo Alberto Fernandes Fernandes, alumno de Recuperación y Acceso a la Información, UC3M.

2 Qué es el WebMining? Consiste en la aplicacion de las tecnicas de DataMining a datos en la Web, con el proposito de extraer el conocimiento de la Web (recuperación y acceso a la información). Tipos de Datos en la WEB para aplicar WebMining -- Datos de Contenido ---> son los datos relacionados con los textos las imagenes, el contenido propio de la pagina Web.

3 -- Datos de Estructura ---> son los datos relacionados con las etiquetas, y los hiperenlaces. -- Datos de Utilización ---> son los datos de los logg de http, logg del servidor, de utilizacion de la web, de accesos y sus forma de acceder a las diferentes partes de la Web. WebMining: Investigación. En la investigacion de esta Tecnica convergen varias disciplinas: Bases de Datos (BD). Recuperación de la Informacion (IR). Inteligencia Artificial (AI). Procesado Lenguaje Natural (NLP). Pablo Alberto Fernandes Fernandes, alumno de Recuperación y Acceso a la Información, UC3M.

4 Qué es el WebMining de Contenido? Es un proceso de extración de informacion util, del contenido de las paginas Web, tal como texto, imagenes, audio, listas, tablas y otros. En este campo podemos encontrar tecnicas como Recuperacion de la Informacion (IR) y Procesado Lenguaje Natural (NLP). Preprocesado del contenido: se realiza una extraccion del texto del documento HTML, se calculan las palabras frecuentes "StopWord", se calculan la Frecuencia de palabras en una coleccion(df), por ultimo se calcula la frecuenciade terminos por el documento (TF). Por ultimo se crea el Vector de pesos asociado a la pagina, utilizando la tecnica de TF-IDF. Técnicas del WebMining: las técnicas mas comunes en el WebMining del Contenido de una Web son: la

5 clasificacion, el Clustering, y las Asociaciones. Otras ideas significativas son: identificacion de un tema,relevancia del contenido de la web. Clasificación de Documentos: es parte del aprendizaje supervisado, las categorías o clases existen a priori, y los documentos Web se asignana a esta clases previas. El entrenamiento se realiza a traves de documentos previamente clasificados. Agrupación de documentos: es parte del aprendizaje no supervisado, los documentos se agurpan basandose en la medida de similaridad, en este caso no existen clases definidas previamente, para la similitud se utiliza los vectores calculados en el preprocesado. Aplicaciones: el WebMining en el contenido tiene diferentes aplicaciones, entre ellas podemos destacar: Identificación de temas en el documento Web. Categorizar el documento. Encontrar Web similares. Relevancia Contenido. Qué es el WebMining de Estructura? Es un proceso de extración de informacion util, de la estructura de las paginas Web, este proceso se puede llevar a cabo a nivel de documento (intra-page) como a nivel de hiperenlaces (inter-page). Estudio de Hiperenlaces: los hiperenlaces sirven para la navegacion, y poder apuntar a paginas con autoridad, que hablan del mismo tema que nuestra pagina. Utilizando los hiperenlaces se puede Recuperar informacion util de la web.

6 Tecnicas HITS: Hiperlink Induced Topic Seach. La idea de esta tecnica es si un documento A tiene un enlace al Documento B, entonces el autor de A piensa que el documento B tiene informacion Valiosa. Tecnicas PageRank: Prioriza los resultados de busqueda, es utilizado por Google, es el rango de una pagina, este rango depende de las paginas que te apuntan. WebMining estructura Resumen: en este apartado podemos destacar 3 puntos importantes: -- Calidad de las paginas Web: Autoridad(hub & authotities), Valoracion (pagerank Google). -- Estructura interna: representacion de patrones graficamente de promociones. -- Clasificación de las paginas Web: identificar comunidades Web. Qué es el WebMining de Utilización? Es un proceso de extración de informacion util, de la actividad de los usuarios en linea, ademas exhibe un amplio rango de patrones de comportamiento. el WebMining de utilizacion es el descubrimiento de patrones utiles a partir de los datos generados por las transacciones entre clienteservidor en uno o en mas sitios Web. Datos de registro del servidor: por cada sesion de navegacion se registran datos como, el registro de acceso, el registro de errores, el registro de cookies. Descubrimiento patrones uso: Dependiendo de los datosse aplican diferentes tecnicas: --Analisis estadistico

7 --Descubrimiento regla asociaión --Agrupamiento --Clasificación --Patrones secuenciales WebMining Ejemplos: Podemos destacar los siguientes ejemplos: -- Reglas de Asociación: "los clientes accedieron a productos tambien accedieron a productos/deporte" -- patrones secuenciales: "el 80% de los clientes acceden a la web a traves de productos/deportes" -- Clustering y Clasificacion: "los clientes descargan software entre las 16:00 y las 19:00" Pablo Alberto Fernandes Fernandes, alumno de Recuperación y Acceso a la Información, UC3M.

Texto, imágenes, video Hiperenlaces Archivo log

Texto, imágenes, video Hiperenlaces Archivo log Web Mining Web Mining Aplicación técnicas data mining sobre datos que Web Descubrimiento automático información útil de documentos y servicios Web Texto, imágenes, video Hiperenlaces Archivo log Netcraft

Más detalles

Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322

Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322 Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322 Nicole García Gómez 2830047-6 Diego Riquelme Adriasola 2621044-5 RESUMEN.- La minería de datos corresponde a la extracción

Más detalles

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003 MINERÍA DE DATOS Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE Octubre - 2003 CONTENIDO Qué es Data Warehousing Data Warehouse Objetivos del Data Warehouse

Más detalles

CONSIDERACIONES GENERALES DEL WEB MINING

CONSIDERACIONES GENERALES DEL WEB MINING CONSIDERACIONES GENERALES DEL WEB MINING Sandra Milena Leal Elizabeth Castiblanco Calderón* RESUMEN: el presente artículo describe los conceptos básicos para la utilización del Webmining, dentro de los

Más detalles

MINERIA DE DATOS Y Descubrimiento del Conocimiento

MINERIA DE DATOS Y Descubrimiento del Conocimiento MINERIA DE DATOS Y Descubrimiento del Conocimiento UNA APLICACIÓN EN DATOS AGROPECUARIOS INTA EEA Corrientes Maximiliano Silva La información Herramienta estratégica para el desarrollo de: Sociedad de

Más detalles

Web mining y obtención de información para la generación de

Web mining y obtención de información para la generación de Web mining y obtención de información para la generación de inteligencia Miguel Ángel Esteban (Universidad de Zaragoza) mesteban@unizar.es Instituto Juan Velázquez de Velasco de Investigación en Inteligencia

Más detalles

Ingeniería del conocimiento. Sesión 1 Por qué estudiar aprendizaje automático?

Ingeniería del conocimiento. Sesión 1 Por qué estudiar aprendizaje automático? Ingeniería del conocimiento Sesión 1 Por qué estudiar aprendizaje automático? 1 Agenda Qué vamos a ver en la asignatura? Para qué sirve todo esto? Cómo aprobar la asignatura? 2 Extracción del conocimiento

Más detalles

CLUSTERING MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN)

CLUSTERING MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN) CLASIFICACIÓN NO SUPERVISADA CLUSTERING Y MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN) info@clustering.50webs.com Indice INTRODUCCIÓN 3 RESUMEN DEL CONTENIDO 3 APRENDIZAJE

Más detalles

Universidad Latinoamericana de Ciencia y Tecnología. Facultad de Ingeniería. Escuela de Ingeniería Informática

Universidad Latinoamericana de Ciencia y Tecnología. Facultad de Ingeniería. Escuela de Ingeniería Informática Universidad Latinoamericana de Ciencia y Tecnología Facultad de Ingeniería Escuela de Ingeniería Informática Trabajo final para optar por el grado de Licenciatura en Ingeniería de Sistemas con Énfasis

Más detalles

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING Aprendizaje Automático y Data Mining Bloque IV DATA MINING 1 Índice Definición y aplicaciones. Grupos de técnicas: Visualización. Verificación. Descubrimiento. Eficiencia computacional. Búsqueda de patrones

Más detalles

Aplicación en Minería de Datos Web Mining

Aplicación en Minería de Datos Web Mining Aplicación en Minería de Datos Web Mining Sánchez Enriquez, Heider Ysaias 1 19 de marzo de 2008 1 Agradesco a nuestra destinguida Profesora por exigirme trabajar en L A TEX Resumen Web mining es una extensión

Más detalles

Visión global del KDD

Visión global del KDD Visión global del KDD Series Temporales Máster en Computación Universitat Politècnica de Catalunya Dra. Alicia Troncoso Lora 1 Introducción Desarrollo tecnológico Almacenamiento masivo de información Aprovechamiento

Más detalles

Minería de Datos. Vallejos, Sofia

Minería de Datos. Vallejos, Sofia Minería de Datos Vallejos, Sofia Contenido Introducción: Inteligencia de negocios (Business Intelligence). Descubrimiento de conocimiento en bases de datos (KDD). Minería de Datos: Perspectiva histórica.

Más detalles

activuspaper Text Mining and BI Abstract

activuspaper Text Mining and BI Abstract Text Mining and BI Abstract Los recientes avances en lingüística computacional, así como la tecnología de la información en general, permiten que la inserción de datos no estructurados en una infraestructura

Más detalles

Inteligencia en Redes de Comunicaciones. Tema 7 Minería de Datos. Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda

Inteligencia en Redes de Comunicaciones. Tema 7 Minería de Datos. Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda Inteligencia en Redes de Comunicaciones Tema 7 Minería de Datos Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda {jvillena, rcrespo, rueda}@it.uc3m.es Índice Definición y conceptos

Más detalles

ASIGNATURA: Tecnologías de Información y Comunicación II

ASIGNATURA: Tecnologías de Información y Comunicación II ASIGNATURA: Tecnologías de Información y Comunicación II 53 HORAS DESCRIPCIÓN DE LA ASIGNATURA: Esta asignatura proporciona al alumno las competencias y herramientas teóricas necesarias para la aplicación

Más detalles

POSIBLE APLICACIÓN DE LA MINERÍA DE TEXTOS A LOS TRABAJOS DE LA COMISIÓN MINISTERIAL DE INFORMÁTICA

POSIBLE APLICACIÓN DE LA MINERÍA DE TEXTOS A LOS TRABAJOS DE LA COMISIÓN MINISTERIAL DE INFORMÁTICA POSIBLE APLICACIÓN DE LA MINERÍA DE TEXTOS A LOS TRABAJOS DE LA COMISIÓN MINISTERIAL DE INFORMÁTICA M.ª del Pilar Cantero Blanco Jefa de Servicio de Sistemas Informáticos. Subdirección General de Planificación

Más detalles

CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN.

CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN. SISTEMA EDUCATIVO inmoley.com DE FORMACIÓN CONTINUA PARA PROFESIONALES INMOBILIARIOS. CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN. Business Intelligence. Data Mining. PARTE PRIMERA Qué es

Más detalles

Introducción a la Minería de Datos

Introducción a la Minería de Datos Introducción a la Minería de Datos Abdelmalik Moujahid, Iñaki Inza y Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Índice 1 Minería de

Más detalles

Bases de Datos Avanzadas Introducción Curso Maestría

Bases de Datos Avanzadas Introducción Curso Maestría Bases de Datos Avanzadas Introducción Curso Maestría Por Elizabeth León Guzmán, Ph.D. Profesora Asociada Ingeniería de Sistemas Grupo de Investigación MIDAS Agenda 1. Qué son Bases de Datos? Datos, Información,

Más detalles

Proyecto técnico MINERÍA DE DATOS. Febrero 2014. www.osona-respon.net info@osona-respon.net

Proyecto técnico MINERÍA DE DATOS. Febrero 2014. www.osona-respon.net info@osona-respon.net Proyecto técnico MINERÍA DE DATOS Febrero 2014 www.osona-respon.net info@osona-respon.net 0. Índice 0. ÍNDICE 1. INTRODUCCIÓN... 2 2. LOS DATOS OCULTOS... 3 2.1. Origen de la información... 3 2.2. Data

Más detalles

TÉCNICAS DE MINERÍA DE DATOS Y TEXTO APLICADAS A LA SEGURIDAD AEROPORTUARIA

TÉCNICAS DE MINERÍA DE DATOS Y TEXTO APLICADAS A LA SEGURIDAD AEROPORTUARIA TÉCNICAS DE MINERÍA DE DATOS Y TEXTO APLICADAS A LA SEGURIDAD AEROPORTUARIA MSC ZOILA RUIZ VERA Empresa Cubana de Aeropuertos y Servicios Aeronáuticos Abril 2010 ANTECEDENTES El proyecto Seguridad es una

Más detalles

Minería de Datos. Vallejos, Sofia

Minería de Datos. Vallejos, Sofia Minería de Datos Contenido Introducción: Inteligencia de negocios (Business Intelligence). Componentes Descubrimiento de conocimiento en bases de datos (KDD). Minería de Datos: Perspectiva histórica. Fases

Más detalles

Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI)

Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI) Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI) OFERTAS TECNOLÓGICAS 1) GESTIÓN ORGANIZACIONAL Y LOGÍSTICA INTEGRADA: TÉCNICAS Y SISTEMAS DE INFORMACIÓN 2) GESTIÓN

Más detalles

GUÍA Nro. 1 TECNOLOGÍA DE INTERNET. TIII PIII

GUÍA Nro. 1 TECNOLOGÍA DE INTERNET. TIII PIII GUÍA Nro. 1 TECNOLOGÍA DE INTERNET. TIII PIII GUIA DISPONIBLE EN: http://preparadorivan.blogspot.com/ - http://preparadormssi.50webs.com/inicio.html La World Wide Web o la Web, es una de las múltiples

Más detalles

Base de datos II Facultad de Ingeniería. Escuela de computación.

Base de datos II Facultad de Ingeniería. Escuela de computación. Base de datos II Facultad de Ingeniería. Escuela de computación. Introducción Este manual ha sido elaborado para orientar al estudiante de Bases de datos II en el desarrollo de sus prácticas de laboratorios,

Más detalles

FACULTAD DE INGENIERIAS PROGRAMAS INFORMATICOS PROGRAMACION DE PRIMEROS EXAMENES PARCIALES LUNES 27 DE SEPTIEMBRE A SABADO 2 DE OCTUBRE DE 2010

FACULTAD DE INGENIERIAS PROGRAMAS INFORMATICOS PROGRAMACION DE PRIMEROS EXAMENES PARCIALES LUNES 27 DE SEPTIEMBRE A SABADO 2 DE OCTUBRE DE 2010 27 de Septiembre Lunes 06:00 08:00 ELECTIVA 1 01 P17-314 27 de Septiembre Lunes 06:00 08:00 ELECTIVA 1 02 P17-302 27 de Septiembre Lunes 06:00 08:00 ELECTIVA 1 03 P59-206 27 de Septiembre Lunes 18:00 20:00

Más detalles

MANUAL PARA MODULO ESTADISTICAS. Este es un resumen para la mejor interpretación y análisis de las estadísticas de su sitio.

MANUAL PARA MODULO ESTADISTICAS. Este es un resumen para la mejor interpretación y análisis de las estadísticas de su sitio. MANUAL PARA MODULO ESTADISTICAS Este es un resumen para la mejor interpretación y análisis de las estadísticas de su sitio. Nº de visitantes distintos: nº de servidores (direcciones IP) que entran a un

Más detalles

Tecnologías de Información y Comunicación II

Tecnologías de Información y Comunicación II Tecnologías de Información y Comunicación II WEB MINING WEB MINING Como Concepto Webmining es una metodología de recuperación de la información que usa herramientas de la minería de datos para extraer

Más detalles

Botón menú Objetivo de la Minería de datos.

Botón menú Objetivo de la Minería de datos. Titulo de Tutorial: Minería de Datos N2 Botón menú: Introducción. Las instituciones y empresas privadas coleccionan bastante información (ventas, clientes, cobros, pacientes, tratamientos, estudiantes,

Más detalles

PROGRAMA DEL DIPLOMADO DE PROCESO BENCHMARKING. TEMA 7. MANEJO DE LA INFORMACIÓN.

PROGRAMA DEL DIPLOMADO DE PROCESO BENCHMARKING. TEMA 7. MANEJO DE LA INFORMACIÓN. PROGRAMA DEL DIPLOMADO DE PROCESO BENCHMARKING. TEMA 7. MANEJO DE LA INFORMACIÓN. Objetivo: Al final de la unidad el alumno comprenderá la presencia de estas herramientas informáticas (programas Datamining))

Más detalles

Algoritmos y Estructuras de Datos 2. Web Mining Esteban Meneses

Algoritmos y Estructuras de Datos 2. Web Mining Esteban Meneses Algoritmos y Estructuras de Datos 2 Web Mining Esteban Meneses 2005 Motivación La Web contiene miles de millones de documentos con información sobre casi cualquier tópico. Es la Biblioteca de Alejandría

Más detalles

Aplicaciones del Soft Computing al análisis de ficheros log de sitios Web

Aplicaciones del Soft Computing al análisis de ficheros log de sitios Web UNIVERSIDAD DE GRANADA UNIVERSIDAD TECNOLOGICA METROPOLITANA Santiago de Chile Aplicaciones del Soft Computing al análisis de ficheros log de sitios Web Autor: Ricardo Valenzuela Gaete Director de Tesis:

Más detalles

Sistemas de Recuperación de Información

Sistemas de Recuperación de Información Sistemas de Recuperación de Información Los SRI permiten el almacenamiento óptimo de grandes volúmenes de información y la recuperación eficiente de la información ante las consultas de los usuarios. La

Más detalles

Informática II Ing. Industrial. Data Warehouse. Data Mining

Informática II Ing. Industrial. Data Warehouse. Data Mining Data Warehouse Data Mining Definición de un Data Warehouses (DW) Fueron creados para dar apoyo a los niveles medios y altos de una empresa en la toma de decisiones a nivel estratégico en un corto o mediano

Más detalles

Los futuros desafíos de la Inteligencia de Negocios. Richard Weber Departamento de Ingeniería Industrial Universidad de Chile rweber@dii.uchile.

Los futuros desafíos de la Inteligencia de Negocios. Richard Weber Departamento de Ingeniería Industrial Universidad de Chile rweber@dii.uchile. Los futuros desafíos de la Inteligencia de Negocios Richard Weber Departamento de Ingeniería Industrial Universidad de Chile rweber@dii.uchile.cl El Vértigo de la Inteligencia de Negocios CRM: Customer

Más detalles

MANUAL DE USO DE LAS ESTADÍSTICAS GENERADAS POR WEBALIZER

MANUAL DE USO DE LAS ESTADÍSTICAS GENERADAS POR WEBALIZER MANUAL DE USO DE LAS ESTADÍSTICAS GENERADAS POR WEBALIZER Conceptos preliminares Acceso Archivos Páginas Visitas KBytes (de datos) Páginas de entrada y de salida Código de respuesta (HTML) Página Principal

Más detalles

MINERÍA DE DATOS Y DESCUBRIMIENTO DE CONOCIMIENTO (DATA MINING AND KNOWLEDGE DISCOVERY)

MINERÍA DE DATOS Y DESCUBRIMIENTO DE CONOCIMIENTO (DATA MINING AND KNOWLEDGE DISCOVERY) MINERÍA DE DATOS Y DESCUBRIMIENTO DE CONOCIMIENTO (DATA MINING AND KNOWLEDGE DISCOVERY) Autor: Lic. Manuel Ernesto Acosta Aguilera Entidad: Facultad de Economía, Universidad de La Habana Dirección: Edificio

Más detalles

Text mining versus redes neuronales. Dos métodos de análisis aplicados al caso de las políticas de las revistas sobre datos

Text mining versus redes neuronales. Dos métodos de análisis aplicados al caso de las políticas de las revistas sobre datos Text mining versus redes neuronales. Dos métodos de análisis aplicados al caso de las políticas de las revistas sobre datos Alicia García-García, Xavier García-Massó, Antonia Ferrer, Luis-Millán González,

Más detalles

Data Mining. Hugo Alatrista-SALAS PUCP, GRPIAA Labs. halatrista@pucp.pe http://hugo.alatristasalas.free.fr/ 17 de noviembre de 2014

Data Mining. Hugo Alatrista-SALAS PUCP, GRPIAA Labs. halatrista@pucp.pe http://hugo.alatristasalas.free.fr/ 17 de noviembre de 2014 Data Mining Hugo Alatrista-SALAS PUCP, GRPIAA Labs. halatrista@pucp.pe http://hugo.alatristasalas.free.fr/ 17 de noviembre de 2014 Outline La información y el proceso KDD 1 La información y el proceso

Más detalles

Sistemas de Sensación Segmentación, Reconocimiento y Clasificación de Objetos. CI-2657 Robótica M.Sc. Kryscia Ramírez Benavides

Sistemas de Sensación Segmentación, Reconocimiento y Clasificación de Objetos. CI-2657 Robótica M.Sc. Kryscia Ramírez Benavides Sistemas de Sensación Segmentación, Reconocimiento y Clasificación de Objetos CI-2657 Robótica M.Sc. Kryscia Ramírez Benavides Introducción La visión artificial, también conocida como visión por computador

Más detalles

Análisis de Incidentes Informáticos usando Modelos de Asociación y Métodos del Análisis de Datos Multivariante.

Análisis de Incidentes Informáticos usando Modelos de Asociación y Métodos del Análisis de Datos Multivariante. Análisis de Incidentes Informáticos usando Modelos de Asociación y Métodos del Análisis de Datos Multivariante. García, Alejandro (1), Corso, Cynthia Lorena (2), Gibellini, Fabián (3), Rapallini, Marcos

Más detalles

INSTITUTO TECNOLÓGICO DE MORELIA

INSTITUTO TECNOLÓGICO DE MORELIA DEPARTAMENTO DE SISTEMAS Y COMPUTACION INSTRUMENTACIÓN DIDÁCTICA DEL PERIODO agosto_diciembre2008 MATERIA: SISTEMAS DE INFORMACION HT 4 HP 2 CR 10 NO. DE UNIDADES 6 GRUPO: A CARRERA: N INFORMATICA LINF

Más detalles

Google Analytics Y Herramientas para Webmasters

Google Analytics Y Herramientas para Webmasters Google Analytics Y Herramientas para Webmasters Metricas basicas Páginas vistas Cada vez que se descarga una página del sitio web. La gran mayoría de las herramientas de analítica web permite al cliente

Más detalles

Inteligencia Artificial en Redes Sociales: la IA 2.0. Carlos A. Iglesias Univ. Politécnica Madrid. Santiago de Compostela, 2010

Inteligencia Artificial en Redes Sociales: la IA 2.0. Carlos A. Iglesias Univ. Politécnica Madrid. Santiago de Compostela, 2010 Inteligencia Artificial en Redes Sociales: la IA 2.0 Carlos A. Iglesias Univ. Politécnica Madrid Santiago de Compostela, 2010 Índice Inteligencia Colectiva Recomendación colectiva Minería de Opiniones

Más detalles

María del Cisne García Muñoz

María del Cisne García Muñoz UNIVERSIDAD SAN FRANCISCO DE QUITO Módulo para Clasificación Automática y Temática de Páginas Web María del Cisne García Muñoz Tesis de Grado presentada como requisito para la obtención del título de Ingeniera

Más detalles

Minería de Datos. Universidad Politécnica de Victoria

Minería de Datos. Universidad Politécnica de Victoria Minería de Datos Universidad Politécnica de Victoria 1 Motivación Nuevas Necesidades del Análisis de Grandes Volúmenes de Datos El aumento del volumen y variedad de información que se encuentra informatizada

Más detalles

Tesis doctoral. Método general de Extracción de Información basado en el uso de Lógica Borrosa. Aplicación en portales web.

Tesis doctoral. Método general de Extracción de Información basado en el uso de Lógica Borrosa. Aplicación en portales web. ESCUELA TÉCNICA SUPERIOR DE INGENIERÍA INFORMÁTICA Departamento de Tecnología Electrónica Tesis doctoral Método general de Extracción de Información basado en el uso de Lógica Borrosa. Aplicación en portales

Más detalles

Una metaheurística para la extracción de reglas de asociación. Aplicación a terremotos.

Una metaheurística para la extracción de reglas de asociación. Aplicación a terremotos. Escuela Técnica Superior de Ingeniería Informática Máster Oficial en Ingeniería y Tecnología del Software TRABAJO FIN DE MÁSTER Una metaheurística para la extracción de reglas de asociación. Aplicación

Más detalles

Proyecto de Taller V. Leticia Pérez. Fernández. INCO - Facultad de Ingeniería Universidad de la República

Proyecto de Taller V. Leticia Pérez. Fernández. INCO - Facultad de Ingeniería Universidad de la República Diseño e implementación de un generador de sitios web adaptativos automáticos: Descubrimiento de patrones de navegación Proyecto de Taller V Estudiantes: Tutor: Luis Do Rego Leticia Pérez Ing. Eduardo

Más detalles

CURSO MINERÍA DE DATOS AVANZADO

CURSO MINERÍA DE DATOS AVANZADO CURSO MINERÍA DE DATOS AVANZADO La minería de datos (en inglés, Data Mining) se define como la extracción de información implícita, previamente desconocida y potencialmente útil, a partir de datos. En

Más detalles

Proyecto Piloto sobre Viabilidad de Internet como Fuente de Datos. Resultados del Proyecto

Proyecto Piloto sobre Viabilidad de Internet como Fuente de Datos. Resultados del Proyecto Proyecto Piloto sobre Viabilidad de Internet como Fuente de Datos Resultados del Proyecto ÍNDICE 1. Detección automática de B2C 2. Análisis de demanda de profesionales TICC y programas formativos 3. Análisis

Más detalles

UNIDAD 3. Herramientas de Internet

UNIDAD 3. Herramientas de Internet ECBTI Curso Herramientas Teleinformaticas-201120 UNIDAD 3. Herramientas de Internet Redes de Tutores Herramientas Teleinformáticas Conceptos Básicos WWW: Estas siglas, provienen de las palabras World Wide

Más detalles

Inteligencia Artificial y Seguridad Informática. en plataformas Open Source

Inteligencia Artificial y Seguridad Informática. en plataformas Open Source Inteligencia Artificial y Seguridad Informática en plataformas Open Source Jornadas de Software Libre y Seguridad Informática Santa Rosa La Pampa 4 y 5 de Diciembre de 2009 AGENDA Primera Parte Definiciones

Más detalles

Diseño de un modelo para Agentes basados en Redes Neuronales para WebMining

Diseño de un modelo para Agentes basados en Redes Neuronales para WebMining La Universidad Católica de Loja ESCUELA DE CIENCIAS DE LA COMPUTACIÓN Diseño de un modelo para Agentes basados en Redes Neuronales para WebMining Tesis de grado previa a la obtención del título de: Ingeniero

Más detalles

Una metodología para mejorar el contenido de un sitio web a partir de la identificación de sus web site keywords

Una metodología para mejorar el contenido de un sitio web a partir de la identificación de sus web site keywords Revista Ingeniería de Sistemas Volumen XXI, AÑO 2007 Una metodología para mejorar el contenido de un sitio web a partir de la identificación de sus web site keywords José I. Fernández * Juan D. Velásquez

Más detalles

Minería de datos en la nube. Patricia Rayón Villela

Minería de datos en la nube. Patricia Rayón Villela Minería de datos en la nube Patricia Rayón Villela 1 Contenido Big-Data BI en la nube Analítica Texto Video Visual 2 Big data Problemas que eran difíciles o imposibles de resolver antes de ahora son manejables.

Más detalles

Sistema categorizador de ofertas de empleo informáticas

Sistema categorizador de ofertas de empleo informáticas Diego Expósito Gil diegoexpositogil@hotmail.com Manuel Fidalgo Sicilia Manuel_fidalgo@hotmail.com Diego Peces de Lucas pecesdelucas@hotmail.com Sistema categorizador de ofertas de empleo informáticas 1.

Más detalles

Introducción: Los Mapas Conceptuales

Introducción: Los Mapas Conceptuales Introducción: Los Mapas Conceptuales Este Tutorial tiene por objetivo Facilitar el uso de la herramienta CmapsTools para realizar mapas conceptuales. Un mapa conceptual puede ser definido como un instrumento,

Más detalles

Arquitectura de un Sistema Recomendador

Arquitectura de un Sistema Recomendador DCIC SR: Situación de Aplicabilidad Sistemas de Recomendación y Personalización Necesito información de películas, pero... por dónde empiezo?? Hay tanta información!! Hey! Yo te puedo recomendar:... Viviana

Más detalles

Minería de Datos JESÚS ANTONIO GONZÁLEZ BERNAL. Universidad UPP

Minería de Datos JESÚS ANTONIO GONZÁLEZ BERNAL. Universidad UPP Universidad Politécnica de Puebla UPP JESÚS ANTONIO GONZÁLEZ BERNAL 1 2 Evolución de la Tecnología BD 1960 s y antes Creación de las BD en archivos primitivos 1970 s hasta principios de los 1980 s BD Jerárquicas

Más detalles

Instituto Politécnico Nacional. Escuela Superior de Turismo

Instituto Politécnico Nacional. Escuela Superior de Turismo Instituto Politécnico Nacional Escuela Superior de Turismo Santiago Peña Joyce Mariana 1M7 Lorena Correa Investigación sobre Buscador y Navegador Tic s Qué es un navegador? Un navegador (también llamado

Más detalles

Diseño e Implementación de un Sistema para la Segmentación de Clientes de una Operadora Celular

Diseño e Implementación de un Sistema para la Segmentación de Clientes de una Operadora Celular Diseño e Implementación de un Sistema para la Segmentación de Clientes de una Operadora Celular AUTORES: Fabián Cabrera Cuenca 1, Sergio Jonathan León García 2, Ilse Lorena Ycaza Díaz 3, Juan Aurelio Alvarado

Más detalles

Clasificación de los Sistemas de Información

Clasificación de los Sistemas de Información Universidad Nacional Autónoma de México Facultad de Contaduría y Administración Clasificación de los Sistemas de Información Autor: L.I. Alejandro Muñoz Estrada Clasificación de los Sistemas de Información

Más detalles

Universidad Autónoma Metropolitana. Unidad Azcapotzalco. División de Ciencias Básicas e Ingeniería. Ingeniería en Computación

Universidad Autónoma Metropolitana. Unidad Azcapotzalco. División de Ciencias Básicas e Ingeniería. Ingeniería en Computación Universidad Autónoma Metropolitana Unidad Azcapotzalco División de Ciencias Básicas e Ingeniería Ingeniería en Computación Sistema configurable de Minería Web Alumno: Urquiza Pérez Alina Firma: Matricula:

Más detalles

LA GESTIÓN DEL CONOCIMIENTO

LA GESTIÓN DEL CONOCIMIENTO Plan de Formación 2006 ESTRATEGIAS Y HABILIDADES DE GESTIÓN DIRECTIVA MÓDULO 9: 9 LA ADMINISTRACIÓN ELECTRÓNICA EN LA SOCIEDAD DE LA INFORMACIÓN LA GESTIÓN DEL CONOCIMIENTO José Ramón Pereda Negrete Jefe

Más detalles

Documentación científica

Documentación científica Documentación científica Unidad 4: Tecnologías de la información y la comunicación en la recuperación de la documentación científica Tema 11. Gestión de la información: las bases de datos bibliográficas

Más detalles

Minería Web: un recurso insoslayable para el profesional de la información*

Minería Web: un recurso insoslayable para el profesional de la información* Acimed 2007; 16(4) Minería Web: un recurso insoslayable para el profesional de la información* Lic. Sady C. Fuentes Reyes 1 e Ing. Marina Ruiz Lobaina 2 RESUMEN Se estudian los principales conceptos relacionados

Más detalles

Evaluación, limpieza y construcción de los datos: un enfoque desde la inteligencia artificial

Evaluación, limpieza y construcción de los datos: un enfoque desde la inteligencia artificial Universidad del Cauca Facultad de Ingeniería Electrónica y Telecomunicaciones Programas de Maestría y Doctorado en Ingeniería Telemática Seminario de Investigación Evaluación, limpieza y construcción de

Más detalles

PROGRAMA FORMATIVO INTERNET: BLOGS Y POSICIONAMIENTO WEB

PROGRAMA FORMATIVO INTERNET: BLOGS Y POSICIONAMIENTO WEB PROGRAMA FORMATIVO INTERNET: BLOGS Y POSICIONAMIENTO WEB www.bmformacion.es info@bmformacion.es Objetivos Cómo posicionar páginas web: Durante el curso, el alumno conocerá las principales técnicas de posicionamiento

Más detalles

Capítulo 1. Introducción. 1.1. Antecedentes

Capítulo 1. Introducción. 1.1. Antecedentes Capítulo 1. Introducción En este capítulo se presenta una descripción general del problema a investigar y el enfoque con el que se aborda. Se establece la necesidad de incorporar técnicas de análisis novedosas

Más detalles

CLASIFICACIÓN NO SUPERVISADA

CLASIFICACIÓN NO SUPERVISADA CLASIFICACIÓN NO SUPERVISADA CLASIFICACION IMPORTANCIA PROPÓSITO METODOLOGÍAS EXTRACTORES DE CARACTERÍSTICAS TIPOS DE CLASIFICACIÓN IMPORTANCIA CLASIFICAR HA SIDO, Y ES HOY DÍA, UN PROBLEMA FUNDAMENTAL

Más detalles

De qué tratará el curso. Otras consideraciones. Objetivos. Introducción. Motivación Explosión en la disponibilidad de información:

De qué tratará el curso. Otras consideraciones. Objetivos. Introducción. Motivación Explosión en la disponibilidad de información: Datamining y Aprendizaje Automatizado Prof. Carlos Iván Chesñevar Email: cic@cs.uns.edu.ar Http:\\cs.uns.edu.ar\~cic Departamento de Cs. e Ing. de la Computación Universidad Nacional del Sur Bahía Blanca,

Más detalles

Minería de Datos. Abstract. Existencia de herramientas automáticas que no hacen necesario el ser un experto en estadística Potencia de computo

Minería de Datos. Abstract. Existencia de herramientas automáticas que no hacen necesario el ser un experto en estadística Potencia de computo Minería de Datos Óscar Palomo Miñambres Universidad Carlos III de Madrid Avda. De la Universidad, 30 28911, Leganés (Madrid-España) 100049074@alumnos.uc3m.es Abstract En este artículo analizaremos las

Más detalles

TÓPICOS AVANZADOS DE BASES DE DATOS

TÓPICOS AVANZADOS DE BASES DE DATOS TÓPICOS AVANZADOS DE BASES DE DATOS 1. DATOS DE LA ASIGNATURA. Nombre de la asignatura: TÓPICOS AVANZADOS DE BASES DE DATOS Carrera: Ingeniería en Sistemas Computacionales Clave de la asignatura: Modulo

Más detalles

Manual de Procedimientos

Manual de Procedimientos 1 de 10 Elaborado por: Revisado por: Aprobado por: Oficina de Informática y Telecomunicaciones - OITEL Web Manager Director Oficina de Informática y Telecomunicaciones - OITEL TABLA DE CONTENIDO 1. OBJETIVOS...

Más detalles

QUE INCLUYEN NUESTROS CURSOS

QUE INCLUYEN NUESTROS CURSOS CURSOS A DISTANCIA A TRAVÉS DE INTERNET QUE INCLUYEN NUESTROS CURSOS Un CD-Rom interactivo que incluye una barra animada con un conjunto de botones que permiten, de forma muy sencilla, acceder a los temas

Más detalles

Curso del Data Mining al Big Data

Curso del Data Mining al Big Data Curso del Data Mining al Big Data Instructor: Dr. Luis Carlos Molina Félix Presentación. Las bases de datos y los sistemas de administración de datos han jugado un papel primordial en el crecimiento y

Más detalles

Alfredo Hidalgo Limbrick. Inteligencia de Redes de Datos

Alfredo Hidalgo Limbrick. Inteligencia de Redes de Datos Alfredo Hidalgo Limbrick Inteligencia de Redes de Datos Web Crawlers Google, Internet Archive, Mercator Funcionamiento de Mercator Problemas conocidos Estadísticas e Imágenes Son programas que inspeccionan

Más detalles

Clasificación Bayesiana de textos y páginas web

Clasificación Bayesiana de textos y páginas web Clasificación Bayesiana de textos y páginas web Curso de doctorado: Ingeniería Lingüística aplicada al Procesamiento de Documentos Víctor Fresno Fernández Introducción Enorme cantidad de información en

Más detalles

Taller: Búsqueda en el WWW

Taller: Búsqueda en el WWW I. Bienvenida Bienvenid@s a todos. La búsqueda de información en el Internet requiere saber cómo ir de un lugar a otro. El Internet es como una gran biblioteca y aprender a navegar en el es como ir de

Más detalles

Recuperación de información Bases de Datos Documentales Licenciatura en Documentación Curso 2011/2012

Recuperación de información Bases de Datos Documentales Licenciatura en Documentación Curso 2011/2012 Bases de Datos Documentales Curso 2011/2012 Miguel Ángel Rodríguez Luaces Laboratorio de Bases de Datos Universidade da Coruña Introducción Hemos dedicado la primera mitad del curso a diseñar e implementar

Más detalles

INTELIGENCIA EN REDES DE COMUNICACIONES

INTELIGENCIA EN REDES DE COMUNICACIONES INTELIGENCIA EN REDES DE COMUNICACIONES MINERÍA DE DATOS EN EL DEPORTE PROFESIONAL Jorge Carrasco Troitiño NIA 100029724 Grupo 91-5 Ingeniería Superior de Telecomunicación INTRODUCCIÓN: Las técnicas de

Más detalles

Búsqueda Personalizada de Google Google Custom Search. Ing. Alfredo Alonso Peña

Búsqueda Personalizada de Google Google Custom Search. Ing. Alfredo Alonso Peña Búsqueda Personalizada de Google Google Custom Search Ing. Alfredo Alonso Peña PARA QUE ME SIRVE UN BUSCADOR? El objetivo de un sitio Web es publicar información útil al usuario y facilitar que este usuario

Más detalles

Ordenamiento de imágenes Web de acuerdo a su relevancia utilizando un enfoque de fusión multimodal

Ordenamiento de imágenes Web de acuerdo a su relevancia utilizando un enfoque de fusión multimodal Ordenamiento de imágenes Web de acuerdo a su relevancia utilizando un enfoque de fusión multimodal Reporte final Ricardo Omar Chávez García Instituto Nacional de Astrofísica Óptica y Electrónica, 72840

Más detalles

Apéndice A Herramientas utilizadas

Apéndice A Herramientas utilizadas Apéndice A Herramientas utilizadas A.1 Java Media Framework El Java Media Framework (JMF) es una interfaz para el desarrollo de aplicaciones (API) e incorpora el manejo de audio y video en el lenguaje

Más detalles

ORGANIZACIÓN MUNDIAL DE LA PROPIEDAD INTELECTUAL GINEBRA COMITÉ PERMANENTE DE TECNOLOGÍAS DE LA INFORMACIÓN

ORGANIZACIÓN MUNDIAL DE LA PROPIEDAD INTELECTUAL GINEBRA COMITÉ PERMANENTE DE TECNOLOGÍAS DE LA INFORMACIÓN OMPI S SCIT/WG/2/4 ORIGINAL: Inglés FECHA: 10 de agosto de 1999 ORGANIZACIÓN MUNDIAL DE LA PROPIEDAD INTELECTUAL GINEBRA COMITÉ PERMANENTE DE TECNOLOGÍAS DE LA INFORMACIÓN GRUPOS DE TRABAJO Segunda reunión

Más detalles

Página 1 EVALUACIÓN DE CONTENIDOS DE SITIOS WEB EVALUACIÓN DE CONTENIDOS DE SITIOS WEB. Adaptación del Test de Alexander & Tate 1

Página 1 EVALUACIÓN DE CONTENIDOS DE SITIOS WEB EVALUACIÓN DE CONTENIDOS DE SITIOS WEB. Adaptación del Test de Alexander & Tate 1 Adaptación del Test de Alexander & Tate 1 PREGUNTAS REFERIDAS A LA PAGINA PRINCIPAL por José Luis Orihuela (Clave: BIEN/REGULAR/MAL/NO APLICABLE) Se indica con claridad qué organización, persona o empresa

Más detalles

Cómo interpretar las estadísticas?

Cómo interpretar las estadísticas? Cómo interpretar las estadísticas? AW Stats nos brinda la siguiente información: Número de visitas y número de visitantes únicos Duración de las visitas y últimas visitas Usuarios autenticados y últimos

Más detalles

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 2 -

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 2 - Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 2 - Juan Alfonso Lara Torralbo 1 Índice de contenidos (I) Introducción a Data Mining Actividad. Tipos

Más detalles

Trabajo final de Ingeniería

Trabajo final de Ingeniería UNIVERSIDAD ABIERTA INTERAMERICANA Trabajo final de Ingeniería Weka Data Mining Jofré Nicolás 12/10/2011 WEKA (Data Mining) Concepto de Data Mining La minería de datos (Data Mining) consiste en la extracción

Más detalles

Joomla! 3.3 Cree y administre sus sitios Web

Joomla! 3.3 Cree y administre sus sitios Web Capítulo 1: Descubrir Joomla! A. Razones para crear un sitio con Joomla! 9 B. Documentarse sobre Joomla! 9 C. La hoja de ruta de Joomla! 10 D. Qué es un CMS? 12 E. HTML y XHTML 12 F. Diferenciar el contenido

Más detalles

ESCUELA POLITÉCNICA SUPERIOR

ESCUELA POLITÉCNICA SUPERIOR UNIVERSIDAD DE CÓRDOBA ESCUELA POLITÉCNICA SUPERIOR INGENIERÍA TÉCNICA EN INFORMÁTICA DE GESTIÓN PETICIÓN DE TEMA PARA PROYECTO FIN DE CARRERA: TÍTULO Herramienta para la preparación de conjuntos de aprendizaje

Más detalles

Foxylicious+Clu: Gestor automatizado de bookmarks online

Foxylicious+Clu: Gestor automatizado de bookmarks online Proyecto Fin de Carrera de Ingeniería Informática Foxylicious+Clu: Gestor automatizado de bookmarks online Escuela Técnica Superior de Ingeniería Informática Julio 2009 Alumnos: Directores: Abraham Troitiño

Más detalles

MÁQUINA DE VECTORES DE SOPORTE

MÁQUINA DE VECTORES DE SOPORTE MÁQUINA DE VECTORES DE SOPORTE La teoría de las (SVM por su nombre en inglés Support Vector Machine) fue desarrollada por Vapnik basado en la idea de minimización del riesgo estructural (SRM). Algunas

Más detalles

GUIA DE OBSERVACION: TINF-04/M2S3/ ED 1-3

GUIA DE OBSERVACION: TINF-04/M2S3/ ED 1-3 GUIA DE OBSERVACION: TINF-04/M2S3/ ED 1-3 Instrucciones para el alumno: En la computadora asignada utiliza tags HTML para generar páginas web, siguiendo las indicaciones del profesor. 1. Utilizo los las

Más detalles

Minería de datos educativa: Una herramienta para la investigación de patrones de aprendizaje sobre un contexto educativo

Minería de datos educativa: Una herramienta para la investigación de patrones de aprendizaje sobre un contexto educativo Minería de datos educativa: Una herramienta para la investigación de patrones de aprendizaje sobre un contexto educativo Alejandro Ballesteros Román, Daniel Sánchez-Guzmán and Ricardo García Salcedo Centro

Más detalles

Minería Web para el Comercio Electrónico

Minería Web para el Comercio Electrónico Informe Técnico Technical Report DPTOIA-IT-2006-003 mayo, 2009 Minería Web para el Comercio Electrónico Saddys Segrera Francia María N. Moreno García Departamento de Informática y Automática Universidad

Más detalles

Información confidencial y propiedad de Google

Información confidencial y propiedad de Google Cómo alcanzar sus objetivos con Analytics 21 de Marzo de 2012 1 Cómo se define y mide el "éxito"? 2 Configuración de Objetivos en Google Analytics 3 4 5 Configuración de Comercio electrónico en Google

Más detalles

Web Mining: Fundamentos Básicos

Web Mining: Fundamentos Básicos Web Mining: Fundamentos Básicos Francisco Manuel De Gyves Camacho fdegyves@usal.es Resumen. La web es uno de las aplicaciones o fenómenos más importantes que han surgido en los últimos tiempos, por que?,

Más detalles