Minería de datos (Fases de la minería de datos)

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Minería de datos (Fases de la minería de datos)"

Transcripción

1 Minería de datos (Fases de la minería de datos) M. en C. Sergio Luis Pérez Pérez UAM CUAJIMALPA, MÉXICO, D. F. Trimestre 12-O. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 1 / 23

2 Fase de integración y recopilación Fase de integración y recopilación I El primer paso es, en su caso, la integración de múltiples bases de datos en almacenes de datos (data warehousing). Un almacen de datos es un conjunto de datos históricos, internos o externos, que describen un contexto o área de estudio. Un almacen de datos se encuentra organizado de manera que permite aplicar eficientemente las herramientas para resumir, describir y analizar los datos. Un almacen de datos generalmente maneja modelos de tipo multidimensional. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 2 / 23

3 Fase de integración y recopilación Fase de integración y recopilación II En un modelo multidimensional los datos se organizan en torno a hechos que poseen ciertos atributos o medidas que pueden verse con cierto detalle dependiendo de las dimensiones. Medidas o atributos cuánto. Dimensiones cuándo, qué, dónde. Un almacen de datos es deseable pero no imprescindible. Se puede trabajar con formatos heterogéneos. Archivos de texto. Hojas de cálculo. Bases de datos. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 3 / 23

4 Fase de selección, limpieza y transformación El proceso de selección Consiste en utilizar la información adecuada para utilizarla en el modelo de minería de datos. Considerar la parte de los datos más pertinentes a analizar. Entender el tipo de conocimiento que se desea extraer y cómo se desea presentar. Destacar el conocimiento que puede ser válido, novedoso e interesante. Buscar el conocimiento que previo que hace falta para generar el nuevo conocimiento. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 4 / 23

5 Fase de selección, limpieza y transformación Limpieza de datos I Al obtener la información desde distintas fuentes se debe procurar que datos sobre el mismo objeto se unifiquen. Posibles errores: Dos o mas datos de diferentes individuos se mezclan nuevos individuos que pueden ocasionar ruido en el modelo. Dos o mas fuentes del mismo individuo se replican ocasiona menos ruido pero si es recurrente llevará a resultados inesperados. Soluciones: Identificar patrones similares durante el proceso de mezclado. Por ejemplo: {hombre, varon, masculino} hombre Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 5 / 23

6 Fase de selección, limpieza y transformación Limpieza de datos II Identificar posibles formatos de claves y unificarlos. Por ejemplo: { , , , } Donde 55 es la lada del estado y 582 de la región o zona. Detección de valores faltantes. Posibles problemas: El método de minería de datos puede no tratar correctamente estos datos. Los valores faltantes pueden ocasionar malos cálculos de totales, medias. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 6 / 23

7 Fase de selección, limpieza y transformación Limpieza de datos III Es importante entender la posible causa que origina el dato faltante. Cuestiones a considerar: La falta de valores puede expresar características relevantes. Ej.: La falta de número celular pues no todos poseen. Valores no existentes. Ej.: Quizá el registro -usuario, cliente- es nuevo y aún no tiene historial. Datos incompletos. Ocasionado por el proceso de mezcla. Una vez que se ha analizado la causa del dato faltante, se pueden dar los siguientes tratamientos: Ignorar tales datos. Pues algoritmos como los árboles de decisión son sencibles a esos casos. Eliminar el campo. Sólo si la cantidad de valores nulos es muy alta. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 7 / 23

8 Fase de selección, limpieza y transformación Limpieza de datos IV Filtrar la fila. Puede sesgar los datos. Reemplazar el valor. Ya sea manualmente o automáticamente en funciones de otros objetos similares. Esperar los datos faltantes. Puede retrasar el proyecto. Detección de valores erróneos o anómalos. Posibles problemas: Pueden afectar severamente el resultado. No necesariamente son erróneos sino pueden ser especiales o incluso cruciales según el tema de estudio. Es importante entender la posible causa que origina el anómalo. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 8 / 23

9 Fase de selección, limpieza y transformación Limpieza de datos V Posibles tratamientos: Ignorar tales datos. Eliminar el campo. Si es que afecta a campos de mayor calidad. Filtrar la fila. Puede sesgar los datos pues quizás sean casos o tipos especiales. Reemplazar el valor. Discretizar. Es decir clasificarlos o discretizarlos. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 9 / 23

10 Fase de selección, limpieza y transformación Transformación I Significa modificar la forma de los datos. Método de análisis de componentes principales. Consiste en transformar los atributos o variables originales en otro conjunto tal que Donde es deseable que m n. x 1, x 2,..., x n y 1, y 2,..., y m Análisis factorial. Intenta reducir el número de atributos utilizando técnicas de mínimos cuadrados, máxima verosimilitud, entre otras. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 10 / 23

11 Fase de minería de datos Fase de minería de datos I Entender el problema que se desea resolver. Determinar el tipo de modelo a aplicar. Predictivo. Descriptivo. Elegir el algoritmo de minería que resuelva la tarea y/o obtenga el modelo. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 11 / 23

12 Fase de minería de datos Fase de minería de datos II Tareas de la minería de datos: Clasificación (Tarea predictiva) Cada instancia pertenece a una clase distinguidas por un tipo de atributo. Los demás atributos de la instancia se utilizan para predecir la clase. Ejemplo: Un oftalmólogo desea determinar cuáles de sus nuevos clientes son candidatos a una cirugía ocular y cuáles no, basado en los resultados de sus clientes anteriores y la evolución de éstos después de la cirugía. Algunos factores a considerar son el tipo de enfermedad ocular y algunos padecimientos que pueden afectar la cirugía. El modelo final clasificaría a los nuevos pacientes como operables o no. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 12 / 23

13 Fase de minería de datos Fase de minería de datos III Regresión (Tarea predictiva) Consiste en aprender una función real que asigna a cada instancia un valor real, de manera que el objetivo es predecir un valor numérico. Ejemplo: Una constructora desea determinar el costo adecuado para los departamentos que va a construir y vender en una determinada zona. Para ello la constructora se puede basar en el costo de las viviendas cercanas a la zona. El modelo ayudaría a predecir el costo factible de sus nuevos deptos. Agrupamiento (Tarea descriptiva) A diferencia de la clasificación, aquí se busca agrupar a los individuos maximizando el grado de similitud entre las instancias de un mismo grupo y minimizando la similitud entre grupos. Los grupos pueden ser o no disjuntos. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 13 / 23

14 Fase de minería de datos Fase de minería de datos IV Correlaciones (Tarea descriptiva) Ayudan a determinar el grado de similitud entre variables numéricas. El coeficiente de correlación r, con r [ 1, 1], si r = 0 indica que no hay relación entre las variables, r > 0 indica que las variables estan directamente relacionadas y r < 0 indica relación inversa. Ejemplo: El departamento de bomberos desea determinar las correlaciones negativas entre el empleo de distintos grosores de protección de material eléctrico y la frecuencia de incendios. Reglas de asociación (Tarea descriptiva) El objetivo es determinar relaciones no evidentes entre atributos categóricos. No necesariamente las reglas son del tipo causa-efecto. Ejemplo: El ejemplo clásico es el de la cesta de compra para organizar los productos físicamente en el supermercado. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 14 / 23

15 Fase de minería de datos Fase de minería de datos V Técnicas de la minería de datos. Regresión lineal. La fórmula general para una regresión lineal es y = c 0 + c 1 x c n x n x i son los atributos predictores. y es la salida o variable dependiente. Regresión no lienal. Cuadrados, logaritmos, etc. y = c 0 + f 1 (x 1 ) +... f n (x n ) Métodos bayesianos. Basados en el teorema de bayes. Clasificación Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 15 / 23

16 Fase de minería de datos Fase de minería de datos VI p(h E) = p(e H) P(H) p(e) Donde P(A) representa la probabilidad del suceso A y p(a B) denota la probabilidad del suceso P(A) condicionada al suceso P(B). Árboles de decisión. Son una serie de condiciones organizadas en forma jerárquica, a modo de árbol. Clasificación, Agrupamiento, Regresión Instancia pronóstico humedad viento jugar 1 soleado alta débil No 2 nublado alta débil Si 3 lluvioso alta débil Si 4 lluvioso normal fuerte No 5 soleado baja débil Si Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 16 / 23

17 Fase de minería de datos Fase de minería de datos VII Se puede utilizar la inducción de reglas para derivar el conjunto de condiciones adecuadas para el problema. Si cond 1 y cond 2 y... ycond n entonces pred. Para nuestro ejemplo tenemos que: Si pronóstico = soleado y humedad = normal entonces jugar sí Si pronóstico = cubierto entonces jugar sí Si pronóstico = lluvioso y viento = débil entonces jugar sí en otro caso no Problemas con la inducción de reglas: Las reglas no necesariamente forman un árbol. Las reglas pueden no cubrir todas las posibilidades. Las reglas pueden entrar en conflicto. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 17 / 23

18 Fase de minería de datos Fase de minería de datos VIII Redes neuronales. Trabajan directamente con números y en caso de que se desee trabajar con datos nominales, éstos deben numerizarse. Clasificación, Agrupamiento, Regresión Las redes neuronales consisten generalmente de tres capas: de entrada, oculta y de salida. Internamente pueden verse como una gráfica dirigida. Algoritmos evolutivos. Son métodos de búsqueda colectiva dentro de un espacio de soluciones. Se siguen patrones de la evolución biológica como el cruce de los genes de los padres para la producción de hijos. Clasificación, Agrupamiento, Reglas de asociación Algunos tipos de algoritmos evolutivos son: Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 18 / 23

19 Fase de minería de datos Fase de minería de datos IX Algoritmos genéticos, estrategia evolutiva, programación genética, algoritmos meméticos, algoritmos culturales, evolución diferencial. Construcción del modelo. Es bueno explorar varios modelos. También es recomendable explorar nuevos modelos mediante otras técnicas. Se aconseja que el modelo sea validado utilizando parte de los datos. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 19 / 23

20 Fase de evaluación e interpretación Fase de evaluación e interpretación I Técnicas de evaluación. Para entrenar y probar un modelo se parten los datos en dos conjuntos: el conjunto de entrenamiento y el conjunto de prueba. Validación simple. Se utiliza cuando se posee un gran conjunto de datos. De modo que se elige entre el 5 y 50 % de los datos para la parte de las pruebas. Validación cruzada. Se parte el conjunto de datos en dos conjuntos. Primero se utiliza al primer conjunto para predecir los datos del segundo conjunto y luego se aplica el mismo proceso en modo inverso. Si la cantidad de errores no es muy grande se crea un modelo con ambos conjuntos. Validación cruzada con n pliegues. En este caso los datos se parten en n conjuntos y sólo se reserva un conjunto para pruebas. El proceso se repite para los n 1 grupos restantes. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 20 / 23

21 Fase de evaluación e interpretación Fase de evaluación e interpretación II Bootstrapping. Se sugiere cuando se poseen muy pocos datos. 1 Se contruye un modelo con todos los datos. 2 Se crean varios conjuntos de datos llamados bootstrap samples haciendo un muestreo de los datos originales con reemplazo (se pueden repetir instancias). 3 Se crean tantos modelos como conjuntos de datos se hayan generado. 4 Con los datos restantes de cada muestreo se hacen las pruebas para el cálculo del error y se promedian los errores. Medidas de evaluación de modelos. Dependen de la tarea sobre la que se este trabajando. Clasificación. Se evalua la calidad de los patrones encontrados respecto a su precisión predictiva. instancias clasificadas correctamente instancias totales Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 21 / 23

22 Fase de evaluación e interpretación Fase de evaluación e interpretación III Reglas de asociación. Se suele evaluar aquellas reglas que pueden aplicarse a un número mayor de instancias. Se suele medir: Cobertura. Número de instancias a las que la regla predice correctamente. Confianza. Proporción de instancias que la regla predice correctamente. Regresión. Dado que la salida de este modelo es un valor numérico, lo más común es evaluar utilizando el error cuadrático medio. Se utiliza el valor predicho vs el valor utilizado para la validación. Agrupamiento. Se suele evaluar mediante funciones que nos proporcionen la cohesión del grupo y la separación entre grupos. Por ejemplo calculando la distancia media al centro del grupo y la distancia media entre grupos. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 22 / 23

23 Fase de difusión y despliegue de resultados Fase de difusión y despliegue de resultados Al final se tiene un modelo que se utilizará para proporcionar recomendaciones. Tales recomendaciones ayudarán en procesos: De la vida real solicitud de créditos bancarios, agencias de viajes Virtuales detección de spam, detección de compras fraudulentas Se recomienda medir constantemente la evolución de la funcionalidad del modelo. Por ejemplo ciertos patrones o recomendaciones respecto a las ventas pueden verse afectados por factores externos como la tasa de inflación. Revaluado Re-entrenado o reconstruido por completo. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 23 / 23

Minería de Datos. Profra. Heidy Marisol Marin Castro Universidad Politécnica de Victoria

Minería de Datos. Profra. Heidy Marisol Marin Castro Universidad Politécnica de Victoria Minería de Datos Profra. Heidy Marisol Marin Castro Universidad Politécnica de Victoria 1 Que es un conjunto de datos? Es una colección de objetos con sus respectivo atributos. Un atributo es una propiedad

Más detalles

Tareas de la minería de datos: clasificación. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR

Tareas de la minería de datos: clasificación. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Tareas de la minería de datos: clasificación CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja

Más detalles

Introducción a la minería de datos. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR

Introducción a la minería de datos. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Introducción a la minería de datos CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Minería de datos Detección, interpretación y predicción de patrones cuantitativos y cualitativos

Más detalles

Minería de datos (Algoritmos evolutivos)

Minería de datos (Algoritmos evolutivos) Minería de datos (Algoritmos evolutivos) M. en C. Sergio Luis Pérez Pérez UAM CUAJIMALPA, MÉXICO, D. F. Trimestre 14-I. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 1 / 23 Extracción de

Más detalles

MASTER DE INGENIERÍA BIOMÉDICA. Métodos de ayuda al diagnóstico clínico. Tema 6: Árboles de decisión.

MASTER DE INGENIERÍA BIOMÉDICA. Métodos de ayuda al diagnóstico clínico. Tema 6: Árboles de decisión. MASTER DE INGENIERÍA BIOMÉDICA. Métodos de ayuda al diagnóstico clínico. Tema 6: Árboles de decisión. 1 Objetivos del tema Conocer en qué consiste un árbol de decisión. Aprender los problemas que pueden

Más detalles

Tareas de la minería de datos: clasificación. PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR

Tareas de la minería de datos: clasificación. PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR Tareas de la minería de datos: clasificación PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja o asocia datos

Más detalles

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 11 -

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 11 - Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 11 - Juan Alfonso Lara Torralbo 1 Índice de contenidos Actividad. Resolución manual de clasificación bayesiana

Más detalles

Métodos de Inteligencia Artificial

Métodos de Inteligencia Artificial Métodos de Inteligencia Artificial L. Enrique Sucar (INAOE) esucar@inaoep.mx ccc.inaoep.mx/esucar Tecnologías de Información UPAEP Agentes que Aprenden Introducción Tipos de aprendizaje Aprendizaje cómo

Más detalles

Técnicas de Minería de Datos

Técnicas de Minería de Datos Técnicas de Minería de Datos Act. Humberto Ramos S. 1 Qué es Minería de datos? El desarrollo de dispositivos tecnológicos para acumular datos a bajo costo. Acumulación o registro de gran cantidad de datos.

Más detalles

Reconocimiento de Patrones DRA. LETICIA FLORES PULIDO

Reconocimiento de Patrones DRA. LETICIA FLORES PULIDO Reconocimiento de Patrones DRA. LETICIA FLORES PULIDO 2 CONTENIDO TEMA1: INTRODUCCIÓN TEMA2: APRENDIZAJE MÁQUINA TEMA3: REDES NEURONALES MULTICAPA TEMA4: PROGRAMACIÓN EVOLUTIVA 3 TEMA 2 : APRENDIZAJE MÁQUINA

Más detalles

ANÁLISIS DE DATOS. Jesús García Herrero

ANÁLISIS DE DATOS. Jesús García Herrero ANÁLISIS DE DATOS Jesús García Herrero ANALISIS DE DATOS EJERCICIOS Una empresa de seguros de automóviles quiere utilizar los datos sobre sus clientes para obtener reglas útiles que permita clasificar

Más detalles

LA MINERÍA DE DATOS APLICADA A LA BÚSQUEDA DE PATRONES DE SUPERVIVIENCIA EN LA NEOPLASIA MALIGNA DE TRÁQUEA, BRONQUIOS Y PULMÓN

LA MINERÍA DE DATOS APLICADA A LA BÚSQUEDA DE PATRONES DE SUPERVIVIENCIA EN LA NEOPLASIA MALIGNA DE TRÁQUEA, BRONQUIOS Y PULMÓN LA MINERÍA DE DATOS APLICADA A LA BÚSQUEDA DE PATRONES DE SUPERVIVIENCIA EN LA NEOPLASIA MALIGNA DE TRÁQUEA, BRONQUIOS Y PULMÓN Miguel Ángel Negrín; Christian González; Jaime Pinilla; Francisco-José Vázquez-Polo

Más detalles

Taller Minería de datos aplicados a la educación

Taller Minería de datos aplicados a la educación Taller Minería de datos aplicados a la educación 2ª parte Presentación del software PASW Modeler 27 de junio de 2011 Mercedes Torrado Departamento Métodos de Investigación y Diagnóstico en Educación (MIDE)

Más detalles

DATA MINING CONCEPTOS Y EXPERIENCIA EN LA FISCALIZACIÓN DEL MERCADO DE VALORES DE CHILE

DATA MINING CONCEPTOS Y EXPERIENCIA EN LA FISCALIZACIÓN DEL MERCADO DE VALORES DE CHILE VII Reunión sobre casos prácticos de inspección y vigilancia de mercados y entidades. Santiago de Chile DATA MINING CONCEPTOS Y EXPERIENCIA EN LA FISCALIZACIÓN DEL MERCADO DE VALORES DE CHILE Marcelo García

Más detalles

Análisis de Datos. Validación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Validación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Validación de clasificadores Profesor: Dr. Wilfrido Gómez Flores 1 Introducción La mayoría de los clasificadores que se han visto requieren de uno o más parámetros definidos libremente,

Más detalles

Aprendizaje Automatizado

Aprendizaje Automatizado Aprendizaje Automatizado Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto

Más detalles

Introducción a la minería de datos

Introducción a la minería de datos Introducción a la minería de datos 1 Temario Qué es minería de datos? Quién usa minería de datos? Por qué de la minería de datos? Ciclo virtuoso de la minería de datos 2 Definición de minería de datos

Más detalles

ARBOLES DE DECISION. Miguel Cárdenas-Montes. 1 Introducción. Objetivos: Entender como funcionan los algoritmos basados en árboles de decisión.

ARBOLES DE DECISION. Miguel Cárdenas-Montes. 1 Introducción. Objetivos: Entender como funcionan los algoritmos basados en árboles de decisión. ARBOLES DE DECISION Miguel Cárdenas-Montes Los árboles de decisión son estructuras lógicas con amplia utilización en la toma de decisión, la predicción y la minería de datos. Objetivos: Entender como funcionan

Más detalles

INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016

INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016 ANEXO ESTADÍSTICO 1 : COEFICIENTES DE VARIACIÓN Y ERROR ASOCIADO AL ESTIMADOR ENCUESTA NACIONAL DE EMPLEO (ENE) INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 9 de Abril de 016 1 Este anexo estadístico es una

Más detalles

Análisis de Datos. Combinación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Combinación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Combinación de clasificadores Profesor: Dr. Wilfrido Gómez Flores 1 Introducción Diversos algoritmos de clasificación están limitados a resolver problemas binarios, es decir, con dos

Más detalles

ÍNDICE. Introducción... Capítulo 1. Investigación de mercados y muestreo. Muestreo aleatorio simple y sistemático... 1

ÍNDICE. Introducción... Capítulo 1. Investigación de mercados y muestreo. Muestreo aleatorio simple y sistemático... 1 Introducción... XI Capítulo 1. Investigación de mercados y muestreo. Muestreo aleatorio simple y sistemático... 1 Las técnicas de muestreo y la investigación de mercados... 1 Población, marco y muestra...

Más detalles

Cómo se usa Data Mining hoy?

Cómo se usa Data Mining hoy? Cómo se usa Data Mining hoy? 1 Conocer a los clientes Detectar segmentos Calcular perfiles Cross-selling Detectar buenos clientes Evitar el churning, attrition Detección de morosidad Mejora de respuesta

Más detalles

Posibles trabajos HIA

Posibles trabajos HIA Posibles trabajos HIA Posibles trabajos Comparar otras herramientas de Minería de Datos con Weka Estudiar la influencia del ruido en bagging y boosting Estudiar la influencia del parámetro de poda en J48

Más detalles

Taller #3. Carlos Reveco Cinthya Vergara

Taller #3. Carlos Reveco Cinthya Vergara Taller #3 Carlos Reveco creveco@dcc.uchile.cl Cinthya Vergara cvergarasilv@ing.uchile.cl 1 Taller#3 - Uso de RapidMiner 5.0 Limpieza y selección de datos Data Cleansing: Eliminación de valores nulos o

Más detalles

TRABAJO PRÁCTICO III: Minería de datos. PARTE 01: Arboles de decisión (J48)

TRABAJO PRÁCTICO III: Minería de datos. PARTE 01: Arboles de decisión (J48) TRABAJO PRÁCTICO III: Minería de datos PARTE 01: Arboles de decisión (J48) Introducción: En este trabajo se implementa el primero de una serie de algoritmos que se presentarán durante la materia para realizar

Más detalles

Técnicas de aprendizaje sobre series temporales

Técnicas de aprendizaje sobre series temporales Técnicas de aprendizaje sobre series temporales Contenido 1. Motivación. 2. Ejemplo del Problema. 3. Aproximaciones al problema de clasificación de series temporales. 4. Aprendizaje de reglas. 5. Boosting

Más detalles

APLICACIONES DE MINERA DE DATOS EN ADUANA DE PERU. Luis Azaña Bocanegra

APLICACIONES DE MINERA DE DATOS EN ADUANA DE PERU. Luis Azaña Bocanegra APLICACIONES DE MINERA DE DATOS EN ADUANA DE PERU Luis Azaña Bocanegra TEMARIO CONCEPTOS DEFINICION DE MINERIA DE DATOS USOS DE LA MINERIA DE DATOS TECNICAS DE MINERIA DE DATOS ETAPAS DE UN PROYECTO DE

Más detalles

Tema 4: Aprendizaje de conceptos

Tema 4: Aprendizaje de conceptos Inteligencia Artificial II Curso 2004 2005 Tema 4: Aprendizaje de conceptos José A. Alonso Jiménez Francisco Jesús Martín Mateos José Luis Ruiz Reina Dpto. de Ciencias de la Computación e Inteligencia

Más detalles

VIII Jornadas de Usuarios de R

VIII Jornadas de Usuarios de R VIII Jornadas de Usuarios de R Análisis del Abandono en el Sector Bancario Predicción del abandono de clientes Albacete, 17 de Noviembre de 2016 I. INDICE : Modelo Abandonos I. COMPRENSIÓN DEL NEGOCIO

Más detalles

GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC)

GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC) GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC) Curso Académico: 2015-2016 Programa: Centro: Universidad: Máster Universitario en Ingeniería Informática Escuela Politécnica Superior

Más detalles

UNIVERSIDAD ALAS PERUANAS FACULTAD DE CIENCIAS DE LA COMUNICACIÓN SILABO POR COMPETENCIA

UNIVERSIDAD ALAS PERUANAS FACULTAD DE CIENCIAS DE LA COMUNICACIÓN SILABO POR COMPETENCIA UNIVERSIDAD ALAS PERUANAS FACULTAD DE CIENCIAS DE LA COMUNICACIÓN SILABO POR COMPETENCIA I. DATOS INFORMATIVOS 1.1 Asignatura : Estadística para el Comunicador Social 1.2 Código : 1001-1023 1.3 Pre-requisito

Más detalles

Aprendizaje Automático Segundo Cuatrimestre de Árboles de Decisión

Aprendizaje Automático Segundo Cuatrimestre de Árboles de Decisión Aprendizaje Automático Segundo Cuatrimestre de 2015 Árboles de Decisión Aproximación de Funciones Ejemplo: Un amigo juega al tenis los sábados. Juega o no, dependiendo del estado del tiempo. Cielo: {Sol,

Más detalles

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE ESTUDIOS SUPERIORES ACATLÁN LICENCIATURA EN MATEMÁTICAS APLICADAS Y COMPUTACIÓN

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE ESTUDIOS SUPERIORES ACATLÁN LICENCIATURA EN MATEMÁTICAS APLICADAS Y COMPUTACIÓN UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE ESTUDIOS SUPERIORES ACATLÁN LICENCIATURA EN MATEMÁTICAS APLICADAS Y COMPUTACIÓN ACATLÁN PROGRAMA DE ASIGNATURA CLAVE: SEMESTRE: 5 (QUINTO) MODALIDAD

Más detalles

Object Recognition as Machine Translation: Learning a Lexicon for a Fixed Image Vocabulary

Object Recognition as Machine Translation: Learning a Lexicon for a Fixed Image Vocabulary Object Recognition as Machine Translation: Learning a Lexicon for a Fixed Image Vocabulary P. Duygulu, K. Barnard, J.F.G. de Freitas, and D.A. Forsyth Dr. Enrique Sucar 1 Victor Hugo Arroyo Dominguez 1

Más detalles

Índice. Resumen 15 Motivación 15 Desarrollos y aportes 16 Publicaciones derivadas de esta tesis doctoral 19

Índice. Resumen 15 Motivación 15 Desarrollos y aportes 16 Publicaciones derivadas de esta tesis doctoral 19 Índice Resumen 15 Motivación 15 Desarrollos y aportes 16 Publicaciones derivadas de esta tesis doctoral 19 Capítulo 1. Introducción a la Minería de Datos 21 1. Minería de datos 21 1.1. Tipos de datos 24

Más detalles

Apéndice A: Matrices de confusión y resultados de precisión, exhaustividad y medida F

Apéndice A: Matrices de confusión y resultados de precisión, exhaustividad y medida F Apéndices 77 Apéndice A: Matrices de confusión y resultados de precisión, exhaustividad y medida F En este apéndice se presentan seis tablas con otros resultados obtenidos. En cada una de las primeras

Más detalles

Manual de GeoConcept 6 II Parte

Manual de GeoConcept 6 II Parte Manual de GeoConcept 6 II Parte Noviembre de 006 Convenciones Usted notará la presencia de diferentes iconos que le indicarán la existencia de un párrafo importante, un señalamiento o un ejercicio. Atención,

Más detalles

Automatización de la Evaluación del Impacto Social en Proyectos de Inversión Publica

Automatización de la Evaluación del Impacto Social en Proyectos de Inversión Publica Automatización de la Evaluación del Impacto Social en Proyectos de Inversión Publica Ronald René Vergara Pareja 1 Agenda Objetivo de la Investigación. Situación Actual de los Proyectos de Inversión Publica.

Más detalles

CLASIFICACIÓN DE LA IMAGEN. Escuela de Ingeniería Civil y Geomática Francisco Luis Hernández Torres

CLASIFICACIÓN DE LA IMAGEN. Escuela de Ingeniería Civil y Geomática Francisco Luis Hernández Torres CLASIFICACIÓN DE LA IMAGEN TÉCNICA QUE PERMITE LA IDENTIFICACIÓN DE LOS DIFERENTES OBJETOS O GRUPOS PRESENTES EN UNA IMAGEN MULTI-ESPECTRAL. MÉTODO NO SUPERVISADO MÉTODO SUPERVISADO El Desarrollo De Las

Más detalles

CRITERIOS DE SELECCIÓN DE MODELOS

CRITERIOS DE SELECCIÓN DE MODELOS Inteligencia artificial y reconocimiento de patrones CRITERIOS DE SELECCIÓN DE MODELOS 1 Criterios para elegir un modelo Dos decisiones fundamentales: El tipo de modelo (árboles de decisión, redes neuronales,

Más detalles

Cátedra: Estadística Técnica Facultad de Ingeniería UNCuyo. Índice D. Fernández & M. Guitart TABLA DE CONTENIDOS

Cátedra: Estadística Técnica Facultad de Ingeniería UNCuyo. Índice D. Fernández & M. Guitart TABLA DE CONTENIDOS Cátedra: TABLA DE CONTENIDOS INTRODUCCIÓN Qué es la Probabilidad? Qué es la Estadística? La evolución histórica de la Estadística Algunos conceptos imprescindibles Fuentes de datos Tipos de datos y escalas

Más detalles

El nivel Interno. Índice Tema 3

El nivel Interno. Índice Tema 3 El nivel Interno Índice Tema 3 iel nivel Interno...1 Introducción...2 Etapas de acceso a la base de datos...2 Gestor de Disco...3 Gestor de Ficheros...3 Agrupamiento...4 Interactivos...4 Entrearchivos...4

Más detalles

Psicometría Tema 6 VALIDEZ DE LAS INFERENCIAS I

Psicometría Tema 6 VALIDEZ DE LAS INFERENCIAS I Psicometría Tema 6 VALIDEZ DE LAS INFERENCIAS I Psicometría Mª Isabel García Barbero, UNED. Universidad Nacional de Educación a Distancia, 2006 1 La fiabilidad de un instrumento de medida es una condición

Más detalles

Procesamiento de información para medir el aprendizaje estudiantil utilizando el programado Excel recopilados. Los participantes rán en el

Procesamiento de información para medir el aprendizaje estudiantil utilizando el programado Excel recopilados. Los participantes rán en el Procesamiento de información para medir el aprendizaje estudiantil utilizando el programado Excel recopilados. Los participantes rán en el Julio E. Rodríguez Torres Chamary uso de Fuentes Excel. Vergara

Más detalles

11. FUENTES DE INFORMACIÓN

11. FUENTES DE INFORMACIÓN multidimensionales Unidad 3: Tratamiento del color Identificar las características del histograma y su uso para el tratamiento del color Obtener el histograma de diferentes imágenes para indicar las características

Más detalles

Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO

Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO 2 Objetivo El objetivo principal de las técnicas de clasificación supervisada es obtener un modelo clasificatorio válido para permitir tratar

Más detalles

Validación Cruzada (cross-validation) y Remuestreo (bootstrapping)

Validación Cruzada (cross-validation) y Remuestreo (bootstrapping) Validación Cruzada (cross-validation) y Remuestreo (bootstrapping) Padres de cross-validation y el bootstrapping Bradley Efron y Rob Tibshirani Bradley Efron Rob Tibshirani Enfoque: tabla de aprendizaje

Más detalles

Estándares de evaluación en la materia de MATEMÁTICAS de 1º de ESO. Curso 2016/2017.

Estándares de evaluación en la materia de MATEMÁTICAS de 1º de ESO. Curso 2016/2017. Estándares de evaluación en la materia de MATEMÁTICAS de 1º de ESO. Curso 2016/2017. Bloque 1. Procesos, métodos y actitudes en matemáticas. Los criterios correspondientes a este bloque son los marcador

Más detalles

Análisis de Datos y Métodos Cuantitativos para la D.T. VI versión MGM

Análisis de Datos y Métodos Cuantitativos para la D.T. VI versión MGM Universidad Católica del Norte Escuela de Negocios Mineros Magister en Gestión Minera Análisis de Datos y Métodos Cuantitativos para la D.T. VI versión MGM Antofagasta, Junio de 2013 Profesor: Fernando

Más detalles

Modelos de Scoring para Riesgo de Crédito

Modelos de Scoring para Riesgo de Crédito Modelos de Scoring para Riesgo de Crédito Los modelos de scoring de riesgo, dentro del proceso de otorgamiento de crédito, están orientados a anticipar comportamiento futuro. Podemos dividirlos en tres

Más detalles

Estadísticas Elemental Tema 3: Describir la relación entre dos variables: Correlación y regresión 3.1-1

Estadísticas Elemental Tema 3: Describir la relación entre dos variables: Correlación y regresión 3.1-1 Estadísticas Elemental Tema 3: Describir la relación entre dos variables: Correlación y regresión 3.1-1 Relación entre dos variables Al estudiar conjuntos de variables con más de una variable, una pregunta

Más detalles

6. PROGRAMACIÓN DEL CURSO 4º A DE E. S. O.

6. PROGRAMACIÓN DEL CURSO 4º A DE E. S. O. 6. PROGRAMACIÓN DEL CURSO 4º A DE E. S. O. 6.1 OBJETIVOS GENERALES DEL CURSO Reconocer las diferentes clases de números, y operar correctamente con ellos. Aplicaciones aritméticas. Conocer y manejar la

Más detalles

NEWTON TREES. Árboles de Estimación Estocástica de Probabilidades:

NEWTON TREES. Árboles de Estimación Estocástica de Probabilidades: Tesis de Máster en Ingeniería del Software, Métodos Formales y Sistemas de Información Árboles de Estimación Estocástica de Probabilidades: NEWTON TREES Autor: Fernando Martínez Plumed 1 Directores: Cèsar

Más detalles

CÁLCULO DE PROBABILIDADES

CÁLCULO DE PROBABILIDADES CÁLCULO DE PROBABILIDADES Tipo de asignatura: Troncal Anual. Créditos ECTS: 15 I.- INTRODUCCIÓN AL CÁLCULO DE PROBABILIDADES. (16 horas presenciales) Tema 1.- La naturaleza del cálculo de probabilidades.

Más detalles

Introducción a la Minería de Datos

Introducción a la Minería de Datos Introducción a la Minería de Datos Abdelmalik Moujahid, Iñaki Inza y Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Índice 1 Minería de

Más detalles

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows. TEMA 13 REGRESIÓN LOGÍSTICA Es un tipo de análisis de regresión en el que la variable dependiente no es continua, sino dicotómica, mientras que las variables independientes pueden ser cuantitativas o cualitativas.

Más detalles

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Introducción al aprendizaje supervisado Profesor: Dr. Wilfrido Gómez Flores 1 Conceptos básicos Reconocimiento de patrones (RP): clasificar objetos en un número de categorías o clases.

Más detalles

Consultor en investigación social y de mercados y analista web.

Consultor en investigación social y de mercados y analista web. Consultor en investigación social y de mercados y analista web 23 años de experiencia en investigación de mercados Amplio conocimiento de metodologías Manejo de SPSS y de modelos multivariantes Analista

Más detalles

Inteligencia Artificial

Inteligencia Artificial Algoritmos genéticos Bases En la naturaleza todos los seres vivos se enfrentan a problemas que deben resolver con éxito, como conseguir más luz solar o conseguir comida. La Computación Evolutiva interpreta

Más detalles

Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)

Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r) Correlación El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r) El coeficiente de correlación lineal de Pearson (r) permite medir el grado de asociación entre

Más detalles

Tema 7: Aprendizaje de árboles de decisión

Tema 7: Aprendizaje de árboles de decisión Inteligencia Artificial 2 Curso 2002 03 Tema 7: Aprendizaje de árboles de decisión José A. Alonso Jiménez Miguel A. Gutiérrez Naranjo Francisco J. Martín Mateos José L. Ruiz Reina Dpto. de Ciencias de

Más detalles

Reconocimiento de Patrones

Reconocimiento de Patrones Reconocimiento de Patrones Jesús Ariel Carrasco Ochoa Instituto Nacional de Astrofísica Óptica y Electrónica ariel@inaoep.mx Contenido Introducción Enfoques Problemas Selección de Variables Clasificación

Más detalles

Mantenimiento del Software

Mantenimiento del Software Mantenimiento del Software S6 Francisco Ruiz, Macario Polo Grupo Alarcos Dep. de Informática ESCUELA SUPERIOR DE INFORMÁTICA UNIVERSIDAD DE CASTILLA-LA MANCHA http://alarcos.inf-cr.uclm.es/doc/mso/ Ciudad

Más detalles

Información general. Obligatoria básica o de fundamentación X. Obligatoria profesional. Horas de trabajo independiente del estudiante

Información general. Obligatoria básica o de fundamentación X. Obligatoria profesional. Horas de trabajo independiente del estudiante Guía de asignatura Formato institucional Rev. Abril 2013 Información general Asignatura E S T A D I S T I C A Código 73210011 Tipo de asignatura Obligatoria X Electiva Tipo de saber Número de créditos

Más detalles

La Identificación de Stakeholders en la Ingeniería de Requisitos

La Identificación de Stakeholders en la Ingeniería de Requisitos La Identificación de Stakeholders en la Ingeniería de Requisitos Trabajo de investigación tutelado. Doctorando: Carla Leninca Pacheco Agüero. Tutor: Dr. Edmundo Tovar Caro. S I N T E S I S La primera medida

Más detalles

Jesús García Herrero METODOLOGÍA DE ANÁLISIS DE DATOS

Jesús García Herrero METODOLOGÍA DE ANÁLISIS DE DATOS Jesús García Herrero METODOLOGÍA DE ANÁLISIS DE DATOS En esta clase concluimos el curso de Análisis de Datos con una visión de las metodologías del análisis de datos. Como se ha visto, este es un campo

Más detalles

Tema: Análisis de valores faltantes con SPSS

Tema: Análisis de valores faltantes con SPSS Tema: Análisis de valores faltantes con SPSS 1.- Introducción Hemos de comenzar advirtiendo que el Procedimiento Valores perdidos no se incluye en el sistema Base de SPSS, por lo que solo estará disponible

Más detalles

Universidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL

Universidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL Universidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL OBJETIVO Analizar las Diferentes formas de Describir la Relación entre dos variables numéricas Trazar un diagrama de dispersión

Más detalles

Project Luis Angulo Aguirre. N. de páginas: 456. Edición: 1. a Medida: 17.5 x Material incluido:

Project Luis Angulo Aguirre. N. de páginas: 456. Edición: 1. a Medida: 17.5 x Material incluido: Pág. N. 1 Project 2013 Familia: Editorial: Autor: Tecnología de la Información y Computación Macro Luis Angulo Aguirre ISBN: Físico Digital N. de páginas: 456 9786123041250 9786123043704 Edición: 1. a

Más detalles

Capítulo 8. Selección de variables Introducción

Capítulo 8. Selección de variables Introducción Capítulo 8 Selección de variables 8.1. Introducción En muchos problemas de regresión es posible considerar un número importante de variables predictoras. Un empresario podría estudiar los factores que

Más detalles

Guía Docente: ESTADÍSTICA Y CÁLCULO MATEMÁTICO

Guía Docente: ESTADÍSTICA Y CÁLCULO MATEMÁTICO ESTADÍSTICA Y CÁLCULO MATEMÁTICO FACULTAD DE CIENCIAS QUÍMICAS UNIVERSIDAD COMPLUTENSE DE MADRID CURSO 2014-2015 I.- IDENTIFICACIÓN NOMBRE DE LA ASIGNATURA: NÚMERO DE CRÉDITOS: 6 CARÁCTER: Obligatoria

Más detalles

APRENDIZAJE PROBABILÍSTICO NAIVE BAYES

APRENDIZAJE PROBABILÍSTICO NAIVE BAYES 1 APRENDIZAJE PROBABILÍSTICO NAIVE BAYES Bases de Datos Masivas 9 de Noviembre de 2016 2 Razonamiento Probabilístico Es una herramienta de aprendizaje estadístico. Se trata de razonar en un contexto incierto;

Más detalles

DE LAS BD A LOS ALMACENES DE DATOS (DW) FINALIDADES Y EVOLUCIÓN DE LOS SISTEMAS DE INFORMACIÓN FINALIDADES Y EVOLUCIÓN DE LOS SISTEMAS DE INFORMACIÓN

DE LAS BD A LOS ALMACENES DE DATOS (DW) FINALIDADES Y EVOLUCIÓN DE LOS SISTEMAS DE INFORMACIÓN FINALIDADES Y EVOLUCIÓN DE LOS SISTEMAS DE INFORMACIÓN DE LAS BD A LOS ALMACENES DE DATOS (DW)... ALMACENES DE DATOS (DATA WAREHOUSES Y DATA MARTS), OLAP (PROCESO ANALÍTICO EN LÍNEA) Y. DE LAS BD A LOS DW 1 DE LAS BD A LOS DW 2 LA INFORMACIÓN REDUCE NUESTRA

Más detalles

Árboles de Decisión Árboles de Sintaxis

Árboles de Decisión Árboles de Sintaxis Árboles de Decisión Árboles de Sintaxis Estructuras de Datos Andrea Rueda Pontificia Universidad Javeriana Departamento de Ingeniería de Sistemas Árboles de Decisión Árbol de Decisión Forma gráfica de

Más detalles

Programación Evolutiva

Programación Evolutiva Introducción a la Computación Evolutiva Quinta Clase: Programación Evolutiva Programación Evolutiva Desarrollada en USA durante los años 60 Autores principales: D. Fogel Aplicada típicamente a: PE tradicional:

Más detalles

Selección de fuentes de datos y calidad de datos

Selección de fuentes de datos y calidad de datos Selección de fuentes de datos y calidad de datos ESCUELA COMPLUTENSE DE VERANO 2014 MINERIA DE DATOS CON SAS E INTELIGENCIA DE NEGOCIO Juan F. Dorado José María Santiago . Valores atípicos. Valores faltantes.

Más detalles

Estadística Descriptiva. Poblaciones y muestras.

Estadística Descriptiva. Poblaciones y muestras. Estadística Descriptiva. Poblaciones y muestras. fgarcia@cipf.es CIPF s Research Development Programme Indice 1 Introducción 2 3 Análisis Estadístico Población y muestra Software estadístico CIPF s Research

Más detalles

Índice general. Pág. N. 1. Capítulo 1 ETAPAS DE UNA INVESTIGACIÓN. Diseño. Población. Muestra. Individuo (Observación, Caso, Sujeto) Variables

Índice general. Pág. N. 1. Capítulo 1 ETAPAS DE UNA INVESTIGACIÓN. Diseño. Población. Muestra. Individuo (Observación, Caso, Sujeto) Variables Pág. N. 1 Índice general Capítulo 1 ETAPAS DE UNA INVESTIGACIÓN 1.1 Diseño 1.2 Descriptiva 1.3 Inferencia Diseño Población Muestra Individuo (Observación, Caso, Sujeto) Variables Ejercicios de Población

Más detalles

Índice general. Pág. N. 1

Índice general. Pág. N. 1 Pág. N. 1 Índice general CAPÍTULO 1: NATURALEZA DE LOS PROYECTOS 1.1. PROYECTOS 1.1.1. Definición de proyecto 1.1.2. Características 1.1.3. Ejemplos de proyectos 1.1.4. Diagramas que ayudan a la gestión

Más detalles

SISTEMA INTEGRAL PARA LA PROYECCIÓN Y DETECCIÓN DE LA PREVENCIÓN DEL DELITO, MEDIANTE MINERÍA DE DATOS.

SISTEMA INTEGRAL PARA LA PROYECCIÓN Y DETECCIÓN DE LA PREVENCIÓN DEL DELITO, MEDIANTE MINERÍA DE DATOS. SISTEMA INTEGRAL PARA LA PROYECCIÓN Y DETECCIÓN DE LA PREVENCIÓN DEL DELITO, MEDIANTE MINERÍA DE DATOS. MTIE. Erik Guerrero Bravo. Universidad Tecnológica Tula - Tepeji. Introducción Sistemas Transaccionales

Más detalles

MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES II

MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES II CONTENIDOS MÍNIMOS TEMA 1: SISTEMAS DE ECUACIONES. MÉTODO DE GAUSS Sistemas de ecuaciones lineales. Método de Gauss Sistemas de ecuaciones dependientes de un parámetro Resolución de problemas mediante

Más detalles

INDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica

INDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica INDICE 1. Qué es la Estadística? 1 Introducción 2 Qué significa estadística? 2 Por qué se estudia la estadística? 4 Tipos de estadística 5 Estadística descriptiva 5 Estadística inferencial 6 Tipos de variables

Más detalles

Aprendizaje Automático. Objetivos. Funciona? Notas

Aprendizaje Automático. Objetivos. Funciona? Notas Introducción Las técnicas que hemos visto hasta ahora nos permiten crear sistemas que resuelven tareas que necesitan inteligencia La limitación de estos sistemas reside en que sólo resuelven los problemas

Más detalles

MÓDULO 1: ORGANIZACIÓN Y ESTRUCTURA DE LA INFORMACIÓN. Tema 2: Creación de la Base de Datos. Leire Aldaz, Begoña Eguía y Leire Urcola

MÓDULO 1: ORGANIZACIÓN Y ESTRUCTURA DE LA INFORMACIÓN. Tema 2: Creación de la Base de Datos. Leire Aldaz, Begoña Eguía y Leire Urcola MÓDULO 1: ORGANIZACIÓN Y ESTRUCTURA DE LA INFORMACIÓN Leire Aldaz, Begoña Eguía y Leire Urcola CREACIÓN DE LA BASE DE DATOS Una vez se han definido el diseño conceptual y el lógico de la base de datos,

Más detalles

Analizando patrones de datos

Analizando patrones de datos Analizando patrones de datos SQL Server DM, Excel DM, Azure ML y R Ana María Bisbé York @ambynet http://amby.net/ Temario Introducción a Minería de datos MS Office Excel Herramientas de tabla y Minería

Más detalles

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING Aprendizaje Automático y Data Mining Bloque IV DATA MINING 1 Índice Definición y aplicaciones. Grupos de técnicas: Visualización. Verificación. Descubrimiento. Eficiencia computacional. Búsqueda de patrones

Más detalles

Tópicos Selectos en Aprendizaje Maquinal. Algoritmos para Reconocimiento de Patrones

Tópicos Selectos en Aprendizaje Maquinal. Algoritmos para Reconocimiento de Patrones Tópicos Selectos en Aprendizaje Maquinal Guía de Trabajos Prácticos N 1 (2da. parte) Algoritmos para Reconocimiento de Patrones 20 de Octubre de 2010 1. Objetivos Introducir conceptos básicos de aprendizaje

Más detalles

Tema 8: Árboles de decisión

Tema 8: Árboles de decisión Introducción a la Ingeniería del Conocimiento Curso 2004 2005 Tema 8: Árboles de decisión Miguel A. Gutiérrez Naranjo Dpto. de Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla

Más detalles

PROBABILIDAD Y ESTADÍSTICA. Sesión 4 4. REGRESIÓN Y CORRELACIÓN SIMPLE

PROBABILIDAD Y ESTADÍSTICA. Sesión 4 4. REGRESIÓN Y CORRELACIÓN SIMPLE PROBABILIDAD Y ESTADÍSTICA Sesión 4 4. REGRESIÓN Y CORRELACIÓN SIMPLE 4.1 Regresión lineal simple y curvilínea 4.1.1 Variable dependiente e independiente 4.1.2 Ecuación de regresión 4.1.2.1 Aplicación

Más detalles

MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES II DISTRITO ÚNICO DE ANDALUCÍA

MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES II DISTRITO ÚNICO DE ANDALUCÍA MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES II DISTRITO ÚNICO DE ANDALUCÍA CONTENIDOS Y OBJETIVOS MÍNIMOS PARA EL CURSO 2007/08. 1. INTRODUCCIÓN A LOS CONTENIDOS. ( Decreto 208/2002. B.O.J.A. de 20.08.02

Más detalles

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO UNIVERSIDAD AUTONOMA DE SANTO DOMINGO FACULTAD DE CIENCIAS ECONOMICAS Y SOCIALES DEPARTAMENTO DE ESTADISITICA CATEDRA Estadística Especializada ASIGNATURA Estadística Industrial (EST-121) NUMERO DE CREDITOS

Más detalles

Reconociendo mis fortalezas como estudiante. Docente y Estudiantes

Reconociendo mis fortalezas como estudiante. Docente y Estudiantes Reconociendo mis fortalezas como estudiante Docente y Estudiantes 2016 OBJETIVO Reconocer actitudes y habilidades personales que apoyan la mejora de nuestros aprendizajes. 2 RECOMENDACIONES PARA DESARROLLAR

Más detalles

Fundamentos de Ingeniería de Software [Etapas II]

Fundamentos de Ingeniería de Software [Etapas II] Fundamentos de Ingeniería de Software [Etapas II] M. en C. Sergio Luis Pérez Pérez UAM CUAJIMALPA, MÉXICO, D. F. Trimestre 13-I Sergio Luis Pérez (UAM CUAJIMALPA) Curso de fundamentos de ing. de software

Más detalles

Inteligencia Artificial. Aprendizaje neuronal. Ing. Sup. en Informática, 4º. Curso académico: 2011/2012 Profesores: Ramón Hermoso y Matteo Vasirani

Inteligencia Artificial. Aprendizaje neuronal. Ing. Sup. en Informática, 4º. Curso académico: 2011/2012 Profesores: Ramón Hermoso y Matteo Vasirani Inteligencia Artificial Aprendizaje neuronal Ing. Sup. en Informática, 4º Curso académico: 20/202 Profesores: Ramón Hermoso y Matteo Vasirani Aprendizaje Resumen: 3. Aprendizaje automático 3. Introducción

Más detalles

18 Experimentos aleatorios. Sucesos y espacio muestral. Frecuencia y probabilidad de un suceso.

18 Experimentos aleatorios. Sucesos y espacio muestral. Frecuencia y probabilidad de un suceso. PRIMER CURSO DE E.S.O Criterios de calificación: 80% exámenes, 10% actividades, 10% actitud y trabajo 1 Números naturales. 2 Potencias de exponente natural. Raíces cuadradas exactas. 3 Divisibilidad. Concepto

Más detalles

ESCUELA COMERCIAL CÁMARA DE COMERCIO EXTENSIÓN DE ESTUDIOS PROFESIONALES MAESTRÍA EN ADMINISTRACIÓN

ESCUELA COMERCIAL CÁMARA DE COMERCIO EXTENSIÓN DE ESTUDIOS PROFESIONALES MAESTRÍA EN ADMINISTRACIÓN CICLO, ÁREA O MÓDULO: TERCER CUATRIMESTRE OBJETIVO GENERAL DE LA ASIGNATURA: Al termino del curso el alumno efectuara el análisis ordenado y sistemático de la Información, a través del uso de las técnicas

Más detalles

Experto en Data Mining

Experto en Data Mining titulación de formación continua bonificada expedida por el instituto europeo de estudios empresariales Experto en Data Mining duración total: precio: 0 * modalidad: Online * hasta 100 % bonificable para

Más detalles

Probabilidad y Estadística

Probabilidad y Estadística Probabilidad y Estadística Grado en Ingeniería Informática - Curso 2 Pablo Candela Departamento de Matemáticas (despacho 212) Universidad Autónoma de Madrid pablo.candela@uam.es Introducción 1 / 8 Organización

Más detalles

Nivel Intermedio. A comprender de forma activa conceptos fundamentales de estadística. Crear bases de datos estadísticos.

Nivel Intermedio. A comprender de forma activa conceptos fundamentales de estadística. Crear bases de datos estadísticos. Análisis de datos mediante el SPSS A comprender de forma activa conceptos fundamentales de estadística. Crear bases de datos estadísticos. Procesar eficientemente información estadística. Analizar con

Más detalles

Capítulo 6 Multicolinealidad Luis Quintana Romero. Econometría Aplicada Utilizando R

Capítulo 6 Multicolinealidad Luis Quintana Romero. Econometría Aplicada Utilizando R Capítulo 6 Multicolinealidad Luis Quintana Romero Objetivo Identificar la multicolinealidad en un modelo econométrico, así como las pruebas de detección de la multicolinealidad y correcciones. Introducción

Más detalles