Introducción a la Minería de Datos
|
|
|
- Patricia Cano Franco
- hace 9 años
- Vistas:
Transcripción
1 Introducción a la Minería de Datos
2 Introducción a la Minería de Datos Estamos viviendo en la era de la información Vivimos en la era de los datos WWW ( Tera o Pentha bytes de data) Almacenamiento de datos provenientes de: Negocios Sociedad Ciencias Ingeniería Medicina Etc...
3 Introducción a la Minería de Datos Avances en las tecnologías de recolección y almacenamiento de datos A partir de fuentes como: Ciencia, Ingeniería, Medicina Bases de datos muy grandes Negocios, Bancos Datos Redes de telecomunicaciones Instituciones públicas y privadas La Web Comunidades Virtuales y redes sociales, entre otras Diferentes y nuevos conjuntos de datos: imágenes, textos, multimedia, espaciales, temporales, streams,
4 Introducción a la Minería de Datos Registros médicos Datos? Registros del uso de tarjetas de crédito, historiales crediticios Transacciones en supermercados, tiendas, entre otras Accesos a la Web Detalles del uso de telefonía móvil Imágenes espaciales, médicas, entre otras Genoma humano Librerías digitales, textos, páginas Web Datos climáticos Interacciones en redes sociales y muchos más!
5 Introducción a la Minería de Datos En los datos hay conocimiento oculto, el cual puede ser utilizado para la toma de decisiones. Registros médicos asociados a pacientes Identificar los pacientes con riesgo de sufrir una patología concreta. Archivos de registro de servidores web Detectar patrones de comportamiento de los usuarios Variables financieras de compañías Determinar la capacidad de pagos de crédito Tweets de los usuarios Valores de métricas que caracterizan un proyecto de software Determinar el impacto en la población de eventos naturales o epidemias Estimar el costo y tiempo de desarrollo
6 Introducción a la Minería de Datos Entonces, Datos? Conocimiento útil para la toma de decisiones Cómo extraer conocimiento a partir de datos?
7 Introducción a la Minería de Datos Una alternativa a la búsqueda y extracción de conocimiento a partir de datos: KDD (Knowledge Discovery in Databases) Proceso de descubrimiento de conocimiento a partir de datos Definición: según Fayyad, 1996 Proceso no trivial de identificar, a partir de datos, patrones válidos, novedosos, potencialmente útiles y, en última instancia, comprensibles Según esta definición, las propiedades deseables del conocimiento extraído son:
8 Introducción a la Minería de Datos Válido: los patrones deben ser precisos para nuevos datos. Novedoso: deben aportar algo desconocido para el usuario Potencialmente útil: Comprensible: deben producir algún beneficio para el usuario Que posibilite su interpretación, revisión, validación y uso en la toma de decisiones. Entonces, objetivo del KDD Procesar automáticamente grandes cantidades de datos, identificar los patrones más significativos y relevantes, y presentarlos como conocimiento apropiado para satisfacer las necesidades del usuario
9 Introducción a la Minería de Datos El proceso de KDD envuelve: Datos Preparación de los datos Minería de datos Etapa del proceso KDD Evaluación e interpretación Conocimiento (patrones, estructuras descubiertas)
10 Introducción a la Minería de Datos Definiciones de minería de datos: Proceso de extraer conocimiento útil y comprensible, previamente desconocido, desde grandes cantidades de datos almacenados en distintos formatos. Proceso no trivial de identificación de patrones válidos, novedosos, potencialmente útiles y entendibles que se encuentran ocultos en los datos. Conjunto de técnicas y herramientas aplicadas al proceso no trivial de extraer y presentar conocimiento implícito, previamente desconocido, potencialmente útil y humanamente comprensible, a partir de conjuntos de datos. Proceso de descubrir automáticamente conocimiento en grandes volúmenes de datos
11 Introducción a la Minería de Datos Entonces, Datos Minería de datos Conocimiento (útil y novedoso) (Proceso KDD) Analizar los datos para extraer conocimiento que permita resolver problemas y apoye la toma de decisiones
12 Introducción a la Minería de Datos Aprendizaje automático Minería de datos Estadística Técnicas, de la Inteligencia Artificial, para el aprendizaje a partir de ejemplos (machine learning) Conceptos, teorías y técnicas Bases de datos Almacenes de datos y OLAP Visualización de datos Otras disciplinas Dependiendo del tipo de datos: técnicas de procesamiento del lenguaje natural, procesamiento de imágenes, señales, etc.
13 Aplicaciones En diferentes dominios: Medicina: diagnóstico de enfermedades, gestión hospitalaria, recomendación de medicinas, Educación: Construcción de perfiles de estudiantes, predicción del rendimiento de estudiantes, Industria: Detección de piezas defectuosas, predicción de fallas, extracción de modelos de producción, estimación de modelos de calidad, Mercado: Segmentación de clientes, estimación de ventas, evaluación de campañas publicitarias, determinación de perfiles de compra, Inteligencia de negocios: determinación del comportamiento de clientes, análisis de mercados, predicción de ventas, Asistencia personalizada: buscadores Web adaptados a los usuarios, periódicos electrónicos con noticias personalizadas,
14 Aplicaciones Banca y Finanzas: Análisis de riesgo de asignación de créditos, detección de fraude, Biología y Ambiente: Modelos de calidad del agua, construcción de indicadores ecológicos, clasificación de especies, Turismo: Identificación de patrones de reserva, segmentación de clientes, Telecomunicaciones: Determinación de patrones de llamadas y uso de telefonía móvil, detección de intrusos, Web: Análisis del comportamiento de usuarios, clasificación de sitios Web Ingeniería de Software: Predicción y estimación de índices de calidad del software, coste, duración de proyectos,... y muchas más
15 Aplicaciones Otros ejemplos: Identificación de grupos con características similares (por ejemplo, a partir de los viajes que han realizado clientes de una agencia de viajes, identificar grupos de personas con preferencias similares, con el objetivo de organizar diferentes ofertas). Detección de patrones de comportamiento de usuarios (por ejemplo, es posible descubrir las asociaciones entre los accesos y usos de la Web por parte de los usuarios. Esta información puede servir de ayuda para mejorar y replantear el sitio Web con el fin de facilitar la búsqueda). Predicción de fallas (por ejemplo, a partir de los registros de los usuarios de una compañía de telefonía celular, identificar las posibles fallas que se puedan presentar en el servicio. Esto permitiría mejorar los tiempos de respuesta de los casos hacia los usuarios y mejorar la calidad del servicio).
16 Aplicaciones Construcción de sistemas de recomendación (por ejemplo, partir de las búsquedas que realiza un usuario en la Web es posible determinar sus preferencias o perfil, para construir un buscador personalizado que realice recomendaciones de acuerdo al perfil detectado) Detección de fraude (por ejemplo, a partir de los registros de uso de las tarjetas de crédito por parte de los usuarios de un entidad bancaria, es posible detectar eventos anómalos que puedan indicar posibilidad de fraude). Videojuegos adaptativos: (por ejemplo, a partir de las sesiones de juego de los usuarios se podría detectar su nivel de experticia para realizar una recomendación de niveles).
17 Heramientas Sobre la base del proceso de extracción de conocimiento a partir de datos, en general estas herramientas proporcionan: Datos Preparación de los datos Minería de datos Evaluación e interpretación Funcionalidades para limpieza y preparación de los datos, así como para la visualización y análisis exploratorio. Implantación de diversos algoritmos aprendizaje para resolver diferentes tareas de la minería de datos Funcionalidades para la evaluación de los modelos obtenidos y visualización de resultados.
18 Herramientas De libre distribución: WEKA (Universidad de Waikato) Suite de Minería de Datos de PENTAHO (basado en Weka) Orange (Facultad de informática de la Universidad de Ljubljana) RapidMiner (Universidad de Dortmund, puede utilizar los algoritmos de Weka) R (R Development Core Team) DBMiner (Universidad Simon Fraser, Canadá) Otros: SPSS Clementine ORACLE Data Miner SAS Enterprise Miner STATISTICA Data Miner
19 Herramientas Ejemplo: WEKA Proyecto de la Universidad de Waikato WEKA es una colección de algoritmos de aprendizaje automático para las tareas de minería de datos. Los algoritmos pueden ser aplicados directamente a un conjunto de datos o ser llamados desde código Java. Contiene herramientas para el pre-procesamiento de los datos y visualización, clasificación, regresión, agrupación y reglas de asociación. También permite la incorporación de nuevos algoritmos de aprendizaje Sitio Web:
20 Herraientas Interfaz de WEKA
21 En este curso Datos Preparación de los datos Minería de datos Evaluación e interpretación Cómo preparar los datos para el proceso de minería de datos? Cuáles técnicas pueden ser aplicadas para extraer conocimiento a partir de datos? Cómo evaluar e interpretar los modelos extraídos? Conocimiento
22 Datos, patrones y tareas de la MD Minería de datos: Conjunto de técnicas y herramientas aplicadas al proceso no trivial de extraer y presentar conocimiento implícito, previamente desconocido, potencialmente útil y humanamente comprensible, a partir de conjuntos de datos. Datos Minería de datos (Proceso KDD) Conocimiento (útil y novedoso) Analizar los datos para extraer conocimiento que permita resolver problemas y apoye la toma de decisiones
23 Datos, patrones y tareas de la MD Datos Cómo son los datos? Tipos de conjuntos de datos Minería de datos Qué tipo de problemas pueden resolverse? Conocimiento Cómo expresarlo? Tipos de patrones Tareas de la minería de datos
24 Conjuntos de datos La minería de datos puede aplicarse a muchos tipos de conjuntos de datos Almacén de datos Hojas de cálculo Bases de datos relacionales Datos transaccionales
25 Conjuntos de datos Multimedia: Imágenes, video, audio Conjunto de imágenes de espermatozoides Señal de audio
26 Conjuntos de datos Espaciales: Donde las relaciones espaciales (ubicación) son muy importantes (datos geográficos, imágenes satelitales) Sistema de información geográfico Temperatura promedio mensual de la tierra y el océano (espacio-temporal)
27 Conjuntos de datos Temporales: con atributos relacionados con el tiempo Estudios poblacionales Señales en cardiologí a
28 Conjuntos de datos Documentales: como textos Páginas Web
29 Conjuntos de datos En general, independiente de: Preprocesamiento Conjunto de datos Tabla atributovalor
30 Conjuntos de datos Tabla Atributo Valor: Atributo 1 Atributo 2 Atributo d Cada fila: Instancias Ejemplos Registros Casos Muestras Observaciones Un atributo es una propiedad de un objeto Una colección de atributos describe a un objeto Cada columna: Atributo Variable Característica Campo
31 Conjuntos de datos Cada atributo puede ser de cierto tipo: Nominales o categóricos: Toman valores en un número finito y predeterminado de símbolos o categorías. Ejemplos: - Sexo: [M,F] - Color de ojos: [negro, marrón, azul, verde] - Tipo de correo: [Spam, No Spam] Binarios: Atributo nominal que sólo puede tomar dos categorías o estados: y 1, donde el significa ausencia y 1 significa presencia. Ejemplo: - Paciente fumador: indica que no fuma, 1 indica que fuma.
32 Conjuntos de datos Ordinales: Toman valores en un número finito y predeterminado de símbolos o categorías ordenados. Ejemplos: - Satisfacción del cliente: [muy satisfecho, medianamente satisfecho, poco satisfecho] - Grado académico: [Bachiller, Técnico, Licenciado, Postgrado] - Tamaño: [Pequeño, Mediano, Grande] Numéricos o cuantitativos: Asumen valores enteros o reales. Ejemplos: - Edad: [1, 9] años - Temperatura: [, 4] grados - Salario: [7,5] Bs. F
33 Conjuntos de datos Si los datos son complejos: Preprocesamiento Conjunto de datos (Tabla atributovalor)
34 Conjuntos de datos Preprocesamiento Conjunto de datos (Tabla atributovalor)
35 Tareas de la minería de datos Minería de datos Qué tipo de problemas pueden resolverse? Importante: Minería de datos Datos Información del problema Inducción Aprendizaje a partir de ejemplos Modelo estimado Deducción Lo que se quiere aprender: Concepto, función, modelo, que explique los datos y que permita hacer predicciones válidas para nuevos datos Predicción, Respuestas
36 Tareas de la minería de datos Población Muestra Que permita hacer predicciones, dar respuestas, explicaciones, VÁLIDAS, para la población
37 Tareas de la minería de datos Básicamente se pueden generar dos tipos de modelos: Modelos predictivos (asociados a tareas predictivas) Predicen el valor de un atributo particular basado en los valores de otros atributos. Estiman valores futuros o desconocidos de variables de interés ( = variable dependiente u objetivo), a partir de otras variables (= variables independientes o predictivas). Identifican patrones que explican o describen los datos. Modelos descriptivos (asociados a tareas descriptivas) Derivan patrones (correlaciones, grupos, anomalías, trayectorias) que sumarizan las relaciones fundamentales de los datos. Sirven para explorar las propiedades de los datos
38 Tareas de la minería de datos Tareas de la minería de datos Tareas predictivas Tareas descriptivas Clasificación Agrupación (clustering) Regresión Análisis de asociación (descubrimiento de reglas de asociación) Aprendizaje supervisado: Se dispone de un atributo que representa la respuesta del problema Detección de anomalías Aprendizaje no supervisado: La respuesta del problema no está dada
39 Tareas de la minería de datos A) Clasificación: - Dada una colección de registros o instancias (conjunto de aprendizaje) Donde cada registro contiene un conjunto de atributos, uno de los cuales es la clase (cada instancia pertenece a una clase) - Encontrar un modelo para el atributo clase como una función de los valores de los otros atributos. Dato s Modelo de clasificació n Clase Objetivo: Predecir la clase para nuevas instancias o registros tan exactamente como sea posible. Respuesta (variable categórica)
40 Tareas de la minería de datos Clasificación: ejemplo 1 Determinar el rechazo o aceptación de una solicitud de crédito basado en la información financiera y personal del solicitante. - Conjunto de datos: solicitudes realizadas anteriormente, con la información del cliente y la decisión sobre la aceptación o no de la solicitud por parte de la entidad bancaria. Eda d Años en el banco Tarjeta de crédito Saldo en cuenta Asignación 3 4 SI > 2M SI 19 1 NO < 2M NO 44 1 SI < 2M SI Clase - A partir de esta información estimar un modelo para el atributo clase, que permita determinar si dadas las características de un solicitud nueva es viable la concesión del crédito
41 Tareas de la minería de datos Clasificación: ejemplo 2 Predecir si un correo es un SPAM a partir de la información contenida en el mismo. - Conjunto de datos: textos de correos clasificados como SPAM y No SPAM. - Estos datos son preprocesados con técnicas de procesamiento de textos para transformarlos en una tabla, donde cada columna representa las frecuencias relativas de palabras claves en los textos. P1 P2 P3 P4 P5 P6 TIPO SPAM NO SPAM SPAM Clase - A partir de esta tabla, estimar un modelo para el atributo clase, que permita predecir si un correo desconocido es un SPAM o no
42 Tareas de la minería de datos Clasificación: ejemplo 3 Identificar los números de un código postal manuscrito a partir de una imagen digitalizada. - Conjunto de datos: Imágenes de los 1 dígitos con su etiqueta de clase U N O D O S U N O TR ES SIE TE - Estos datos son preprocesados para transformarlos en una tabla donde cada columna representa una característica extraída mediante algoritmos de procesamiento de imágenes. - A partir de esta tabla, estimar un modelo para el atributo clase, que permita determinar el dígito en una imagen. Clase
43 Tareas de la minería de datos B) Regresión: - Dada una colección de registros o instancias (conjunto de aprendizaje) Donde cada instancia tiene asociado un valor real - Encontrar un modelo para el atributo real como una función de los valores de los otros atributos. Dato s Modelo de regresión Respuesta (variable numérica) Valor numérico Objetivo: Predecir un valor real para nuevas instancias o registros tan exactamente como sea posible
44 Tareas de la minería de datos Regresión: ejemplo 1 Predecir el valor de un inmueble a partir de las características de la zona de ubicación y su arquitectura. - Conjunto de datos: registros asociados a diferentes tipos de inmuebles en diferentes zonas..... No. de habitacione s No. de baños índice de criminalidad Índice de acceso a TP Valor (x 1 Bs.F) Atributo de Salida. - A partir de esta información, encontrar un modelo de regresión que permita estimar el valor de un nuevo inmueble.
45 Tareas de la minería de datos Regresión: ejemplo 2 Determinar el rendimiento relativo de un dispositivo (CPU) - Conjunto de datos: registros de diferentes dispositivos caracterizados según la casa de fabricación y variables de rendimiento.... Nombre del vendedor Ciclos de máquina Memoria Cache Memoria Principal IBM HP ADVISER SIEMENS Rendimiento Atributo de salida - A partir de esta información, encontrar un modelo de regresión que permita estimar el rendimiento de un dispositivo.
46 Tareas de la minería de datos C) Agrupación (clustering): - Dada una colección de registros o instancias Donde cada registro tiene asociado un conjunto de atributos, no hay salida definida. - Encontrar grupos naturales a partir de los datos - Objetivo: Los objetos de un grupo son muy similares entre sí y muy diferentes a los objetos de otros grupos. La distancia intragrupo se minimiza La distancia entre grupos se maximiza Se utilizan medidas de similitud, que dependerán del tipo de variable presente en el conjunto de datos
47 Tareas de la minería de datos Agrupación: ejemplo 1 Determinar diferentes tipos de documentos basados en su contenido - Conjunto de datos: conjunto de documentos - Estos datos son preprocesados para transformarlos en una tabla donde cada columna representa las frecuencias relativas de términos claves en los documentos. Términos D oc. Industria Mercad o Trabaj o País Inflació n Precio Sal ud Drog a Vacuna Médico Utilizando una medida de similitud adecuada, encontrar grupos de documentos que son similares entre si basados en los términos importantes que aparecen en ellos, para posteriormente identificar el tema de un nuevo documento.
48 Tareas de la minería de datos Agrupación: ejemplo 2 Determinar diferentes estados operacionales en una planta de tratamiento de aguas residuales. - Conjunto de datos: registros diarios de los sensores de la planta Flujo de entrada ph de entrada Cantidad de zinc de entrada Sedimento s de entrada Sólidos de entrada - Utilizando una medida de similitud adecuada, encontrar grupos que especifiquen diferentes estados de operación para posteriormente predecir posibles fallas.
49 Tareas de la minería de datos D) Análisis de asociación: - Dada una colección de registros o instancias Donde cada registro contiene un conjunto de atributos o items, no hay salida definida - Encontrar combinaciones o asociaciones de items (atributos) que ocurren frecuentemente. - Objetivo: descubrir patrones que describen características fuertemente asociadas en los datos. Identificar relaciones no explícitas entre atributos categóricos. Regla de asociación: Si el atributo X toma el valor A entonces el atributo Y toma el valor B Regla de dependencia que permite predecir la ocurrencia de un item basado en la ocurrencia de otros items
50 Tareas de la minería de datos Reglas de asociación: ejemplo 1 Manejo de los estantes de un supermercado - Conjunto de datos: registros de las compras de los clientes provenientes de los puntos de ventas. - Identificar items que son comprados juntos por un número suficiente de clientes, para mejorar la organización física del almacén. Transacción 1 Pan, Leche Transacción 2 Pan, Servilletas, Cerveza, Huevos Transacción 3 Leche, Servilletas, Cerveza, Agua Transacción 4 Pan, Leche, Servilletas, Cerveza Transacción 5 Pan, Servilletas, Cerveza, Refresco... Una regla clásica sería: Si el cliente compra pan y servilletas muy probablemente comprará cerveza
51 Tareas de la minería de datos Reglas de asociación: ejemplo 2 Análisis de petición de servicios médicos en un institución - Conjunto de datos: registros cuyos atributos expresan si se ha realizado o no, cada una de las posibles pruebas médicas que pueden aplicarse a un paciente. - Identificar las pruebas médicas que frecuentemente se realizan juntas, para mejorar la gestión de la institución. Paciente Perfi l 2 Orina Heces Coleste rol VIH Glicem ia 1 X X 2 X X X X 3 X X X X 4 X X X X 5 X X X X Una regla que puede ser encontrada: 7% de las veces que se pide un análisis de orina también se solicita uno de sangre, y esto ocurre en 6 de cada 1 pacientes
52 Tareas de la minería de datos E) Detección de anomalías: - Dada una colección de registros o instancias Donde cada registro contiene un conjunto de atributos - Detectar desviaciones significativas del comportamiento normal - Objetivo: Identificar instancias o registros cuyas características son significativamente diferentes del resto (= outlier)
53 Tareas de la minería de datos Detección de anomalías: ejemplo 1 Detección de fraude en el uso de tarjetas de crédito - Conjunto de datos: registros del uso de las tarjetas de créditos para cada uno de los clientes de un banco - A partir de estos datos se construye un perfil de cada cliente - Utilizando este perfil, se detectan comportamientos anómalos ( = observaciones que difieren significativamente del perfil normal ) Detección de anomalías: ejemplo 2 Detección de disturbios en ecosistemas - Conjunto de datos: registros de sensores. - A partir de estos datos se construye un modelo de comportamiento de la zona bajo estudio. - Utilizando este modelo, se pueden detectar posibles situaciones anómalas que permitan implantar planes de prevención.
54 Tareas de la minería de datos Para los siguientes problemas, indique qué tarea de minería de datos puede ser adecuada para su resolución y describa un posible conjunto de datos. Justifique. Identificar patrones de comportamiento de usuarios en un sitio Web. Determinar la aptitud física de la tierra para un determinado cultivo. Indicar la cantidad de lluvia a corto plazo a partir de datos climatológicos Determinar la categoría de un Servicio Web. Determinar las fallas de un servicio de telefonía móvil a partir de los registros de los usuarios Identificar brotes de gripe a partir de los Tweets de los usuarios Determinar el costo de un nuevo contrato en una compañía a partir de los costos correspondientes a contratos anteriores. Determinar cuáles son los itinerarios más seguidos por los visitantes de un sitio Web Estimar el tamaño del software a partir de mediciones realizadas en el ámbito de la especificación de requisitos. Indicar la presencia de intrusos o eventos maliciosos en un sistema móvil. Determinar las preferencias de compra de clientes en un sistema de comercio electrónico. Identificar patrones de comportamiento de estudiantes en un sistema e-learning
DATA MINING CONCEPTOS Y EXPERIENCIA EN LA FISCALIZACIÓN DEL MERCADO DE VALORES DE CHILE
VII Reunión sobre casos prácticos de inspección y vigilancia de mercados y entidades. Santiago de Chile DATA MINING CONCEPTOS Y EXPERIENCIA EN LA FISCALIZACIÓN DEL MERCADO DE VALORES DE CHILE Marcelo García
Minería de Datos. Índice. Raquel M. Crespo García. Julio Villena Román. Definición y conceptos Técnicas y modelos
Inteligencia en Redes de Comunicaciones Minería de Datos Raquel M. Crespo García Julio Villena Román {rcrespo, jvillena}@it.uc3m.es Índice Definición y conceptos Técnicas y modelos IRC - JVR, RCG - 1 1
Introducción a la minería de datos
Introducción a la minería de datos 1 Temario Qué es minería de datos? Quién usa minería de datos? Por qué de la minería de datos? Ciclo virtuoso de la minería de datos 2 Definición de minería de datos
Introducción a la minería de datos. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR
Introducción a la minería de datos CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Minería de datos Detección, interpretación y predicción de patrones cuantitativos y cualitativos
Modelos de Mercadotecnia Tema 1: Dimensión del Marketing
Tema 1: Dimensión del Marketing Sesión 2: Bases de Datos Objetivo de la Sesión: Al concluir la sesión el alumno reconocerá el proceso para llevar a cabo la minería de datos y describirá cómo las herramientas
Lingüística computacional
Lingüística computacional Definición y alcance Escuela Nacional de Antropología e Historia (ENAH) Agosto diciembre de 2015 Lingüística Ciencias de la computación Lingüística computacional Estudio del lenguaje
CURSO/GUÍA PRÁCTICA DEL BIG DATA INMOBILIARIO
SISTEMA EDUCATIVO inmoley.com DE FORMACIÓN CONTINUA PARA PROFESIONALES INMOBILIARIOS. CURSO/GUÍA PRÁCTICA DEL BIG DATA INMOBILIARIO Gestión empresarial de la información. Business Intelligence. Data Mining.
10 EXÁMENES
10 EXÁMENES 2014-2018 Convocatoria Extraordinaria de Septiembre 1 de Septiembre de 2014 1. (1 pto.) a) Aunque por abuso del lenguaje hemos hablado de minería de datos y de KDD como sinónimos, indica las
Científico de datos o data scientist
Científico de datos o data scientist La demanda de científicos de datos se ha incrementado de manera constante en los últimos años, existe en el mercado una amplia oferta para los científicos de datos.
Minería de Datos. Profra. Heidy Marisol Marin Castro Universidad Politécnica de Victoria
Minería de Datos Profra. Heidy Marisol Marin Castro Universidad Politécnica de Victoria 1 Que es un conjunto de datos? Es una colección de objetos con sus respectivo atributos. Un atributo es una propiedad
INTRODUCTION TO MACHINE LEARNING ISABELLE GUYON
INTRODUCTION TO MACHINE LEARNING ISABELLE GUYON 2008-02-31 Notas tomadas por: María Eugenia Rojas Qué es Machine Learning? El proceso de aprendizaje de maquina consiste en tener una gran base de datos
Inteligencia Artificial: Su uso para la investigación
Inteligencia Artificial: Su uso para la investigación Dra. Helena Montserrat Gómez Adorno Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas [email protected] 1 Introducción
Buenas prácticas para la implementación de herramientas de Ciencia de Datos Leonardo Alfonso Ramos Corona Facultad de Geografía, UAEM.
Buenas prácticas para la implementación de herramientas de Ciencia de Datos Leonardo Alfonso Ramos Corona Facultad de Geografía, UAEM. Qué es la ciencia de datos? Es muy difícil encontrar una definición
APLICACIONES DE MINERA DE DATOS EN ADUANA DE PERU. Luis Azaña Bocanegra
APLICACIONES DE MINERA DE DATOS EN ADUANA DE PERU Luis Azaña Bocanegra TEMARIO CONCEPTOS DEFINICION DE MINERIA DE DATOS USOS DE LA MINERIA DE DATOS TECNICAS DE MINERIA DE DATOS ETAPAS DE UN PROYECTO DE
Técnicas de Minería de Datos
Técnicas de Minería de Datos Act. Humberto Ramos S. 1 Qué es Minería de datos? El desarrollo de dispositivos tecnológicos para acumular datos a bajo costo. Acumulación o registro de gran cantidad de datos.
INTRODUCCIÓN A LA ESTADÍSTICA TEMA 1: DATOS Y ESTADÍSTICA
UNIDAD 1 INTRODUCCIÓN A LA ESTADÍSTICA TEMA 1: DATOS Y ESTADÍSTICA Datos numéricos que ayudan a entender la información 1 Datos numéricos que ayudan a entender la información Promedios, medias, porcentajes
Reconocimiento de Patrones DRA. LETICIA FLORES PULIDO
Reconocimiento de Patrones DRA. LETICIA FLORES PULIDO 2 CONTENIDO TEMA1: INTRODUCCIÓN TEMA2: APRENDIZAJE MÁQUINA TEMA3: REDES NEURONALES MULTICAPA TEMA4: PROGRAMACIÓN EVOLUTIVA 3 TEMA 2 : APRENDIZAJE MÁQUINA
Estadística Computacional
Estadística Computacional Profesor : Héctor Allende O. Departamento de Informática Universidad Técnica Federico Santa María Estructura del Curso 1.- Introducción. 2.- Análisis Exploratorio de Datos. 3.-
Aplicaciones de minería de datos. Por: M.C. Leopoldo González Rosas campodeencinos.wordpress.com
Aplicaciones de minería de datos Por: M.C. Leopoldo González Rosas www.cnys.com.mx campodeencinos.wordpress.com Agenda Presentación Motivación qué es minería de datos? Disciplinas involucradas Aplicaciones
Minería de datos para la innovación y desarrollo de alimentos. por Rocío del Carmen Molina // Somos Datos
2016 Minería de datos para la innovación y desarrollo de alimentos por Rocío del Carmen Molina // Somos Datos Quiénes Somos? Somos una comunidad de habla hispana especializada en big data y minería de
Índice general. Prefacio...5
Índice general Prefacio...5 Capítulo 1 Introducción...13 1.1 Introducción...13 1.2 Los datos...19 1.3 Etapas en los procesos de big data...20 1.4 Minería de datos...21 1.5 Estructura de un proyecto de
INTELIGENCIA ARTIFICAL COMO HERRAMIENTA EN LA TOMA DE DECISIONES. Tecnología i3b
INTELIGENCIA ARTIFICAL COMO HERRAMIENTA EN LA TOMA DE DECISIONES Tecnología i3b G R U P O I B E R M Á T I C A Introducción Objetivos Puntos de información y de estudio Tipos de análisis Análisis proactivo
Universidad de Costa Rica Facultad de Ingeniería Escuela de Ciencias de la Computación e Informática Licenciatura en Computación e Informática
Universidad de Costa Rica Facultad de Ingeniería Escuela de Ciencias de la Computación e Informática Licenciatura en Computación e Informática Plan de Estudios 2008 (Modificado: Resolución VD-8687-2011)
Afinación y Rendimiento de Bases de Datos
DIPLOMADO Afinación y Rendimiento de Bases de Datos TEMARIO DURACIÓN: 250 hrs. 1. Sistemas de Información OLTP y SQL (40 hrs.) 1.1 Componentes de un Sistema de Información 1.2 Tipos de un Sistema de Información
Introducción Aprendizaje de Máquina. Gerardo Gutiérrez Gutiérrez Alexis Rodríguez Gutiérrez
Introducción Aprendizaje de Máquina Gerardo Gutiérrez Gutiérrez Alexis Rodríguez Gutiérrez Qué es Aprendizaje de Máquina? "Field of study that gives computers the ability to learn without being explicitly
POSGRADOS. Maestría en Analítica e Inteligencia de Negocios
POSGRADOS Maestría en Analítica e Inteligencia de Negocios CRECE PROFESIONALMENTE y perfecciona tus habilidades y aptitudes En la Maestría en Analítica e Inteligencia de Negocios de la UNITEC adquieres
1.1. El concepto de Estadística. Qué es y para qué sirve?
1.1. El concepto de Estadística. Qué es y para qué sirve? La Estadística se ocupa de la recolección, agrupación, presentación, análisis e interpretación de datos. A menudo se llaman estadísticas a las
Análisis Inteligente de Datos: Introducción
Análisis Inteligente de Datos: [email protected] Departamento de Informática - Universidad Técnica Federico Santa María Santiago, Marzo 2009 Temario 1 Temario 1 Preguntas Relevantes Por qué análisis
Introducción. Qué es Machine Learning?
Introducción Qué es Machine Learning? Introducción Hay problemas en Informática que se pueden definir concretamente y son simples de convertir en un algoritmo Ejemplo: Ordenar alfabéticamente una lista,
DATA ANALYTICS EL VALOR INTRINSECO EN EL DATO INNOVATION QUANT ANALYSIS BIG DATA STRATEGY
DATA ANALYTICS EL VALOR INTRINSECO EN EL DATO INNOVATION QUANT ANALYSIS BIG DATA STRATEGY DATA ANALYTICS ANTES DE LA APARICIÓN DE INTERNET Y REDES SOCIALES Pentaquark posee una metodología que se basa
Programa Internacional. Programa Certificado en. Big Data
Programa Internacional Programa Certificado en Big Data A1 Introducción La revolución del Mundo Digital ha permitido que las personas encuentren un gran sinnúmero de información, en el cual el problema
Unidad 1: Introducción a la Minería de Datos
Unidad 1: Introducción a la Minería de Datos Rafael Vázquez Pérez Sábados de 10-13 Agenda 1. Introducción 1.1 Porque Minar Datos? 1.2 Que es la Minería de Datos? 1.3 Que datos pueden ser minados? 2. Descubriendo
BI (Business Intelligence o inteligencia de negocio) ING. MSC. GABRIELA BOBADILLA ING. LOURDES DELGADO ING. KATIA AYALA
BI (Business Intelligence o inteligencia de negocio) ING. MSC. GABRIELA BOBADILLA ING. LOURDES DELGADO ING. KATIA AYALA Cuántos de ustedes disponen de más información y de menos tiempo para analizarla?
PR1: Programación I 6 Fb Sistemas Lógicos 6 Obligatoria IC: Introducción a los computadores 6 Fb Administración de
CUADRO DE ADAPTACIÓN INGENIERÍA INFORMÁTICA - Campus Río Ebro Código Asignaturas aprobadas Créditos Carácter Asignaturas/Materias reconocida Créditos Carácter 12007 Cálculo 7,5 MAT1; Matemáticas I 12009
CURSO/GUÍA PRÁCTICA DEL BIG DATA INMOBILIARIO
SISTEMA EDUCATIVO inmoley.com DE FORMACIÓN CONTINUA PARA PROFESIONALES INMOBILIARIOS. CURSO/GUÍA PRÁCTICA DEL BIG DATA INMOBILIARIO Gestión empresarial de la información. Business Intelligence. Data Mining.
DIPLOMADO EN DATA MINING
DIPLOMADO EN DATA MINING DIPLOMADO EN DATA MINING Los datos que tienen relevancia para las decisiones de gestión, se están acumulando a un ritmo increíble, debido a una serie de avances tecnológicos. La
Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores
Análisis de Datos Introducción al aprendizaje supervisado Profesor: Dr. Wilfrido Gómez Flores 1 Conceptos básicos Desde la antigüedad, el problema de buscar patrones en datos es fundamental en diversas
ÍNDICE. Parte 1 Información y tecnología de la investigación de mercados... 1
ÍNDICE Parte 1 Información y tecnología de la investigación de mercados... 1 Capítulo 1 Función de la investigación de mercados en la planeación estratégica... 2 Valor de la información de la investigación
Universidad de Costa Rica Sistema de Aplicaciones Estudiantiles SAE
Página 1 de 8 Plan de Estudio Enfasis 0 Bloque Común(no hay énfasis) Nivel Curso Nombre del curso T P L TP Cred. Requisitos y Req. Equivalentes Correquisitos y Correq. Equivalentes 1 CI1010 INTRODUCCIÓN
FACULTAD DE INGENIERÍA Y ARQUITECTURA ESCUELA PROFESIONAL DE INGENIERÍA DE SISTEMAS E INFORMÁTICA
FACULTAD DE INGENIERÍA Y ARQUITECTURA ESCUELA PROFESIONAL DE INGENIERÍA DE SISTEMAS E INFORMÁTICA SILABO DE TOPICO ESPECIALES DE INGENIERÍA DE SISTEMAS E INFORMÁTICA I. DATOS GENERALES 1.0 Unidad Académica
INDICE. Parte 1. Información y Tecnología de la Investigación de Mercados 1 Capitulo 1. Función de la Investigación de mercados en la
INDICE Parte 1. Información y Tecnología de la Investigación de Mercados 1 Capitulo 1. Función de la Investigación de mercados en la 2 Planeación Estratégica Valor de la información de la investigación
Computación distribuida e inteligencia computacional aplicadas a ciudades inteligentes
Computación distribuida e inteligencia computacional aplicadas a ciudades inteligentes Sergio Nesmachnow, Renzo Massobrio, Sebastián Baña Universidad de la República, Uruguay AGENDA Ciudades inteligentes
SISTEMA INTEGRAL PARA LA PROYECCIÓN Y DETECCIÓN DE LA PREVENCIÓN DEL DELITO, MEDIANTE MINERÍA DE DATOS.
SISTEMA INTEGRAL PARA LA PROYECCIÓN Y DETECCIÓN DE LA PREVENCIÓN DEL DELITO, MEDIANTE MINERÍA DE DATOS. MTIE. Erik Guerrero Bravo. Universidad Tecnológica Tula - Tepeji. Introducción Sistemas Transaccionales
CAPÍTULO 1 INTRODUCCIÓN
CAPÍTULO 1 INTRODUCCIÓN En este capítulo, primero se introducirán algunos conceptos estadísticos básicos, luego se dará una definición y división de la estadística. Finalmente se hará una clasificación
LAS 14 AREAS TEMATICAS DE LA COMPUTACIÓN
En los años 1986-1989 la ACM(Association for Computing Machinery) y la IEEE (Institute for Electrical and Electronic Engineers)Computer Society : Peter Denning y otros definen la Informática como disciplina
CAPÍTULO 1. INTRODUCCIÓN
CAPÍTULO 1. INTRODUCCIÓN Las tecnologías de la información son herramientas que ayudan a las personas a tomar decisiones de forma eficiente y efectiva. Los Data Warehouse [16, 5], Minería de datos [9,
CAPÍTULO 1 INTRODUCCIÓN
CAPÍTULO 1 INTRODUCCIÓN En este capítulo, primero se introducirán algunos conceptos estadísticos básicos, luego se dará una definición y división de la estadística. Finalmente se hará una clasificación
Introducción a la Minería de Datos
Introducción a la Minería de Datos Abdelmalik Moujahid, Iñaki Inza y Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Índice 1 Minería de
UNIDAD ACADÉMICA DE ESTUDIOS GENERALES ESTADÍSTICA
UNIDAD ACADÉMICA DE ESTUDIOS GENERALES ESTADÍSTICA Mg. AGUSTINA RAMÍREZ TORRES [email protected] OBSERVEMOS LAS SIGUIENTES NOTICIAS: PENSIÓN PROMEDIO POR JUBILACIÓN Del total de 88.985 jubilados
Desarrollo de Productos Editoriales Multimedia
Desarrollo de Productos Editoriales Multimedia REF: E101240 OBJETIVO Este conjunto de materiales didácticos se ajusta a lo expuesto en el itinerario de aprendizaje perteneciente al Certificado de Profesionalidad
Minería Multimedia. Minería de datos NO estructurados (Textos, Imágenes, Audios y Videos)
Minería Multimedia Minería de datos NO estructurados (Tetos, Imágenes, Audios y Videos) Ana Isabel Oviedo Docente Universidad Pontificia Bolivariana [email protected] Medellín, octubre 19 de 2017 Motivación
PERFIL PROFESIOGRÁFICO PARA IMPARTIR LAS ASIGNATURAS DE LA LICENCIATURA EN INGENIERÍA EN COMPUTACIÓN (PLAN DE ESTUDIOS 2005)
ASIGNATURAS SEMESTRE LICENCIATURA EN OTROS REQUERIMIENTOS Álgebra (1100) 1 Geometría Analítica (1102) 1 Ingeniería, Matemáticas, Física o carreras cuyo contenido en el área de las Matemáticas sea similar
Jesús García Herrero METODOLOGÍA DE ANÁLISIS DE DATOS
Jesús García Herrero METODOLOGÍA DE ANÁLISIS DE DATOS En esta clase concluimos el curso de Análisis de Datos con una visión de las metodologías del análisis de datos. Como se ha visto, este es un campo
PERFIL PROFESIOGRÁFICO PARA IMPARTIR LAS ASIGNATURAS DE LA LICENCIATURA EN INFORMÁTICA (PLAN DE ESTUDIOS 2005)
ASIGNATURAS SEMESTRE LICENCIATURA EN: OTROS REQUERIMIENTOS Teoría del Conocimiento (1156) 1 Filosofía Administración Básica (1157) 1 Administración o afín, Maestría en Administración Análisis, Diseño e
FACULTAD DE INGENIERÍA
FACULTAD DE INGENIERÍA FORMACIÓN EN INGENIERÍA DE SOFTWARE Y BASES DE DATOS EN LOS ESTUDIANTES DE LA CARRERA DE ING. EN COMPUTACIÓN DE LA FI, UNAM EN EL PLAN DE ESTUDIOS 2015 MAYO, 2015 Porcentaje de alumnos
Tareas de la minería de datos: clasificación. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR
Tareas de la minería de datos: clasificación CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja
GLOSARIO DE TÉRMINOS
Apéndice A, Apartado 3: Glosario de términos!401" APÉNDICE A, APARTADO 3 GLOSARIO DE S Administración de la calidad Conjunto de actividades de la función general de administración que determina la política
SOLUCIONES DE INTELIGENCIA ARTIFICIAL, MACHINE LEARNING Y EXPLOTACIÓN COGNITIVA
SOLUCIONES DE INTELIGENCIA ARTIFICIAL, MACHINE LEARNING Y EXPLOTACIÓN COGNITIVA Recientemente, tecnologías como la Inteligencia Artificial (IA) han avanzado significativamente, y han creado grandes oportunidades
Nota de los autores... vi
ÍNDICE Nota de los autores... vi 1 Qué es la estadística?... 1 1.1 Introducción... 2 1.2 Por qué se debe estudiar estadística?... 2 1.3 Qué se entiende por estadística?... 4 1.4 Tipos de estadística...
