Minería de datos (Fases de la minería de datos)
|
|
- Ana María Sandoval Rodríguez
- hace 7 años
- Vistas:
Transcripción
1 Minería de datos (Fases de la minería de datos) M. en C. Sergio Luis Pérez Pérez UAM CUAJIMALPA, MÉXICO, D. F. Trimestre 12-O. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 1 / 23
2 Fase de integración y recopilación Fase de integración y recopilación I El primer paso es, en su caso, la integración de múltiples bases de datos en almacenes de datos (data warehousing). Un almacen de datos es un conjunto de datos históricos, internos o externos, que describen un contexto o área de estudio. Un almacen de datos se encuentra organizado de manera que permite aplicar eficientemente las herramientas para resumir, describir y analizar los datos. Un almacen de datos generalmente maneja modelos de tipo multidimensional. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 2 / 23
3 Fase de integración y recopilación Fase de integración y recopilación II En un modelo multidimensional los datos se organizan en torno a hechos que poseen ciertos atributos o medidas que pueden verse con cierto detalle dependiendo de las dimensiones. Medidas o atributos cuánto. Dimensiones cuándo, qué, dónde. Un almacen de datos es deseable pero no imprescindible. Se puede trabajar con formatos heterogéneos. Archivos de texto. Hojas de cálculo. Bases de datos. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 3 / 23
4 Fase de selección, limpieza y transformación El proceso de selección Consiste en utilizar la información adecuada para utilizarla en el modelo de minería de datos. Considerar la parte de los datos más pertinentes a analizar. Entender el tipo de conocimiento que se desea extraer y cómo se desea presentar. Destacar el conocimiento que puede ser válido, novedoso e interesante. Buscar el conocimiento que previo que hace falta para generar el nuevo conocimiento. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 4 / 23
5 Fase de selección, limpieza y transformación Limpieza de datos I Al obtener la información desde distintas fuentes se debe procurar que datos sobre el mismo objeto se unifiquen. Posibles errores: Dos o mas datos de diferentes individuos se mezclan nuevos individuos que pueden ocasionar ruido en el modelo. Dos o mas fuentes del mismo individuo se replican ocasiona menos ruido pero si es recurrente llevará a resultados inesperados. Soluciones: Identificar patrones similares durante el proceso de mezclado. Por ejemplo: {hombre, varon, masculino} hombre Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 5 / 23
6 Fase de selección, limpieza y transformación Limpieza de datos II Identificar posibles formatos de claves y unificarlos. Por ejemplo: { , , , } Donde 55 es la lada del estado y 582 de la región o zona. Detección de valores faltantes. Posibles problemas: El método de minería de datos puede no tratar correctamente estos datos. Los valores faltantes pueden ocasionar malos cálculos de totales, medias. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 6 / 23
7 Fase de selección, limpieza y transformación Limpieza de datos III Es importante entender la posible causa que origina el dato faltante. Cuestiones a considerar: La falta de valores puede expresar características relevantes. Ej.: La falta de número celular pues no todos poseen. Valores no existentes. Ej.: Quizá el registro -usuario, cliente- es nuevo y aún no tiene historial. Datos incompletos. Ocasionado por el proceso de mezcla. Una vez que se ha analizado la causa del dato faltante, se pueden dar los siguientes tratamientos: Ignorar tales datos. Pues algoritmos como los árboles de decisión son sencibles a esos casos. Eliminar el campo. Sólo si la cantidad de valores nulos es muy alta. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 7 / 23
8 Fase de selección, limpieza y transformación Limpieza de datos IV Filtrar la fila. Puede sesgar los datos. Reemplazar el valor. Ya sea manualmente o automáticamente en funciones de otros objetos similares. Esperar los datos faltantes. Puede retrasar el proyecto. Detección de valores erróneos o anómalos. Posibles problemas: Pueden afectar severamente el resultado. No necesariamente son erróneos sino pueden ser especiales o incluso cruciales según el tema de estudio. Es importante entender la posible causa que origina el anómalo. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 8 / 23
9 Fase de selección, limpieza y transformación Limpieza de datos V Posibles tratamientos: Ignorar tales datos. Eliminar el campo. Si es que afecta a campos de mayor calidad. Filtrar la fila. Puede sesgar los datos pues quizás sean casos o tipos especiales. Reemplazar el valor. Discretizar. Es decir clasificarlos o discretizarlos. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 9 / 23
10 Fase de selección, limpieza y transformación Transformación I Significa modificar la forma de los datos. Método de análisis de componentes principales. Consiste en transformar los atributos o variables originales en otro conjunto tal que Donde es deseable que m n. x 1, x 2,..., x n y 1, y 2,..., y m Análisis factorial. Intenta reducir el número de atributos utilizando técnicas de mínimos cuadrados, máxima verosimilitud, entre otras. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 10 / 23
11 Fase de minería de datos Fase de minería de datos I Entender el problema que se desea resolver. Determinar el tipo de modelo a aplicar. Predictivo. Descriptivo. Elegir el algoritmo de minería que resuelva la tarea y/o obtenga el modelo. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 11 / 23
12 Fase de minería de datos Fase de minería de datos II Tareas de la minería de datos: Clasificación (Tarea predictiva) Cada instancia pertenece a una clase distinguidas por un tipo de atributo. Los demás atributos de la instancia se utilizan para predecir la clase. Ejemplo: Un oftalmólogo desea determinar cuáles de sus nuevos clientes son candidatos a una cirugía ocular y cuáles no, basado en los resultados de sus clientes anteriores y la evolución de éstos después de la cirugía. Algunos factores a considerar son el tipo de enfermedad ocular y algunos padecimientos que pueden afectar la cirugía. El modelo final clasificaría a los nuevos pacientes como operables o no. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 12 / 23
13 Fase de minería de datos Fase de minería de datos III Regresión (Tarea predictiva) Consiste en aprender una función real que asigna a cada instancia un valor real, de manera que el objetivo es predecir un valor numérico. Ejemplo: Una constructora desea determinar el costo adecuado para los departamentos que va a construir y vender en una determinada zona. Para ello la constructora se puede basar en el costo de las viviendas cercanas a la zona. El modelo ayudaría a predecir el costo factible de sus nuevos deptos. Agrupamiento (Tarea descriptiva) A diferencia de la clasificación, aquí se busca agrupar a los individuos maximizando el grado de similitud entre las instancias de un mismo grupo y minimizando la similitud entre grupos. Los grupos pueden ser o no disjuntos. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 13 / 23
14 Fase de minería de datos Fase de minería de datos IV Correlaciones (Tarea descriptiva) Ayudan a determinar el grado de similitud entre variables numéricas. El coeficiente de correlación r, con r [ 1, 1], si r = 0 indica que no hay relación entre las variables, r > 0 indica que las variables estan directamente relacionadas y r < 0 indica relación inversa. Ejemplo: El departamento de bomberos desea determinar las correlaciones negativas entre el empleo de distintos grosores de protección de material eléctrico y la frecuencia de incendios. Reglas de asociación (Tarea descriptiva) El objetivo es determinar relaciones no evidentes entre atributos categóricos. No necesariamente las reglas son del tipo causa-efecto. Ejemplo: El ejemplo clásico es el de la cesta de compra para organizar los productos físicamente en el supermercado. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 14 / 23
15 Fase de minería de datos Fase de minería de datos V Técnicas de la minería de datos. Regresión lineal. La fórmula general para una regresión lineal es y = c 0 + c 1 x c n x n x i son los atributos predictores. y es la salida o variable dependiente. Regresión no lienal. Cuadrados, logaritmos, etc. y = c 0 + f 1 (x 1 ) +... f n (x n ) Métodos bayesianos. Basados en el teorema de bayes. Clasificación Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 15 / 23
16 Fase de minería de datos Fase de minería de datos VI p(h E) = p(e H) P(H) p(e) Donde P(A) representa la probabilidad del suceso A y p(a B) denota la probabilidad del suceso P(A) condicionada al suceso P(B). Árboles de decisión. Son una serie de condiciones organizadas en forma jerárquica, a modo de árbol. Clasificación, Agrupamiento, Regresión Instancia pronóstico humedad viento jugar 1 soleado alta débil No 2 nublado alta débil Si 3 lluvioso alta débil Si 4 lluvioso normal fuerte No 5 soleado baja débil Si Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 16 / 23
17 Fase de minería de datos Fase de minería de datos VII Se puede utilizar la inducción de reglas para derivar el conjunto de condiciones adecuadas para el problema. Si cond 1 y cond 2 y... ycond n entonces pred. Para nuestro ejemplo tenemos que: Si pronóstico = soleado y humedad = normal entonces jugar sí Si pronóstico = cubierto entonces jugar sí Si pronóstico = lluvioso y viento = débil entonces jugar sí en otro caso no Problemas con la inducción de reglas: Las reglas no necesariamente forman un árbol. Las reglas pueden no cubrir todas las posibilidades. Las reglas pueden entrar en conflicto. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 17 / 23
18 Fase de minería de datos Fase de minería de datos VIII Redes neuronales. Trabajan directamente con números y en caso de que se desee trabajar con datos nominales, éstos deben numerizarse. Clasificación, Agrupamiento, Regresión Las redes neuronales consisten generalmente de tres capas: de entrada, oculta y de salida. Internamente pueden verse como una gráfica dirigida. Algoritmos evolutivos. Son métodos de búsqueda colectiva dentro de un espacio de soluciones. Se siguen patrones de la evolución biológica como el cruce de los genes de los padres para la producción de hijos. Clasificación, Agrupamiento, Reglas de asociación Algunos tipos de algoritmos evolutivos son: Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 18 / 23
19 Fase de minería de datos Fase de minería de datos IX Algoritmos genéticos, estrategia evolutiva, programación genética, algoritmos meméticos, algoritmos culturales, evolución diferencial. Construcción del modelo. Es bueno explorar varios modelos. También es recomendable explorar nuevos modelos mediante otras técnicas. Se aconseja que el modelo sea validado utilizando parte de los datos. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 19 / 23
20 Fase de evaluación e interpretación Fase de evaluación e interpretación I Técnicas de evaluación. Para entrenar y probar un modelo se parten los datos en dos conjuntos: el conjunto de entrenamiento y el conjunto de prueba. Validación simple. Se utiliza cuando se posee un gran conjunto de datos. De modo que se elige entre el 5 y 50 % de los datos para la parte de las pruebas. Validación cruzada. Se parte el conjunto de datos en dos conjuntos. Primero se utiliza al primer conjunto para predecir los datos del segundo conjunto y luego se aplica el mismo proceso en modo inverso. Si la cantidad de errores no es muy grande se crea un modelo con ambos conjuntos. Validación cruzada con n pliegues. En este caso los datos se parten en n conjuntos y sólo se reserva un conjunto para pruebas. El proceso se repite para los n 1 grupos restantes. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 20 / 23
21 Fase de evaluación e interpretación Fase de evaluación e interpretación II Bootstrapping. Se sugiere cuando se poseen muy pocos datos. 1 Se contruye un modelo con todos los datos. 2 Se crean varios conjuntos de datos llamados bootstrap samples haciendo un muestreo de los datos originales con reemplazo (se pueden repetir instancias). 3 Se crean tantos modelos como conjuntos de datos se hayan generado. 4 Con los datos restantes de cada muestreo se hacen las pruebas para el cálculo del error y se promedian los errores. Medidas de evaluación de modelos. Dependen de la tarea sobre la que se este trabajando. Clasificación. Se evalua la calidad de los patrones encontrados respecto a su precisión predictiva. instancias clasificadas correctamente instancias totales Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 21 / 23
22 Fase de evaluación e interpretación Fase de evaluación e interpretación III Reglas de asociación. Se suele evaluar aquellas reglas que pueden aplicarse a un número mayor de instancias. Se suele medir: Cobertura. Número de instancias a las que la regla predice correctamente. Confianza. Proporción de instancias que la regla predice correctamente. Regresión. Dado que la salida de este modelo es un valor numérico, lo más común es evaluar utilizando el error cuadrático medio. Se utiliza el valor predicho vs el valor utilizado para la validación. Agrupamiento. Se suele evaluar mediante funciones que nos proporcionen la cohesión del grupo y la separación entre grupos. Por ejemplo calculando la distancia media al centro del grupo y la distancia media entre grupos. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 22 / 23
23 Fase de difusión y despliegue de resultados Fase de difusión y despliegue de resultados Al final se tiene un modelo que se utilizará para proporcionar recomendaciones. Tales recomendaciones ayudarán en procesos: De la vida real solicitud de créditos bancarios, agencias de viajes Virtuales detección de spam, detección de compras fraudulentas Se recomienda medir constantemente la evolución de la funcionalidad del modelo. Por ejemplo ciertos patrones o recomendaciones respecto a las ventas pueden verse afectados por factores externos como la tasa de inflación. Revaluado Re-entrenado o reconstruido por completo. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 23 / 23
Minería de Datos. Profra. Heidy Marisol Marin Castro Universidad Politécnica de Victoria
Minería de Datos Profra. Heidy Marisol Marin Castro Universidad Politécnica de Victoria 1 Que es un conjunto de datos? Es una colección de objetos con sus respectivo atributos. Un atributo es una propiedad
Más detallesTareas de la minería de datos: clasificación. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR
Tareas de la minería de datos: clasificación CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja
Más detallesIntroducción a la minería de datos. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR
Introducción a la minería de datos CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Minería de datos Detección, interpretación y predicción de patrones cuantitativos y cualitativos
Más detallesMinería de datos (Algoritmos evolutivos)
Minería de datos (Algoritmos evolutivos) M. en C. Sergio Luis Pérez Pérez UAM CUAJIMALPA, MÉXICO, D. F. Trimestre 14-I. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 1 / 23 Extracción de
Más detallesMASTER DE INGENIERÍA BIOMÉDICA. Métodos de ayuda al diagnóstico clínico. Tema 6: Árboles de decisión.
MASTER DE INGENIERÍA BIOMÉDICA. Métodos de ayuda al diagnóstico clínico. Tema 6: Árboles de decisión. 1 Objetivos del tema Conocer en qué consiste un árbol de decisión. Aprender los problemas que pueden
Más detallesTareas de la minería de datos: clasificación. PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR
Tareas de la minería de datos: clasificación PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja o asocia datos
Más detallesFundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 11 -
Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 11 - Juan Alfonso Lara Torralbo 1 Índice de contenidos Actividad. Resolución manual de clasificación bayesiana
Más detallesMétodos de Inteligencia Artificial
Métodos de Inteligencia Artificial L. Enrique Sucar (INAOE) esucar@inaoep.mx ccc.inaoep.mx/esucar Tecnologías de Información UPAEP Agentes que Aprenden Introducción Tipos de aprendizaje Aprendizaje cómo
Más detallesTécnicas de Minería de Datos
Técnicas de Minería de Datos Act. Humberto Ramos S. 1 Qué es Minería de datos? El desarrollo de dispositivos tecnológicos para acumular datos a bajo costo. Acumulación o registro de gran cantidad de datos.
Más detallesReconocimiento de Patrones DRA. LETICIA FLORES PULIDO
Reconocimiento de Patrones DRA. LETICIA FLORES PULIDO 2 CONTENIDO TEMA1: INTRODUCCIÓN TEMA2: APRENDIZAJE MÁQUINA TEMA3: REDES NEURONALES MULTICAPA TEMA4: PROGRAMACIÓN EVOLUTIVA 3 TEMA 2 : APRENDIZAJE MÁQUINA
Más detallesANÁLISIS DE DATOS. Jesús García Herrero
ANÁLISIS DE DATOS Jesús García Herrero ANALISIS DE DATOS EJERCICIOS Una empresa de seguros de automóviles quiere utilizar los datos sobre sus clientes para obtener reglas útiles que permita clasificar
Más detallesLA MINERÍA DE DATOS APLICADA A LA BÚSQUEDA DE PATRONES DE SUPERVIVIENCIA EN LA NEOPLASIA MALIGNA DE TRÁQUEA, BRONQUIOS Y PULMÓN
LA MINERÍA DE DATOS APLICADA A LA BÚSQUEDA DE PATRONES DE SUPERVIVIENCIA EN LA NEOPLASIA MALIGNA DE TRÁQUEA, BRONQUIOS Y PULMÓN Miguel Ángel Negrín; Christian González; Jaime Pinilla; Francisco-José Vázquez-Polo
Más detallesTaller Minería de datos aplicados a la educación
Taller Minería de datos aplicados a la educación 2ª parte Presentación del software PASW Modeler 27 de junio de 2011 Mercedes Torrado Departamento Métodos de Investigación y Diagnóstico en Educación (MIDE)
Más detallesDATA MINING CONCEPTOS Y EXPERIENCIA EN LA FISCALIZACIÓN DEL MERCADO DE VALORES DE CHILE
VII Reunión sobre casos prácticos de inspección y vigilancia de mercados y entidades. Santiago de Chile DATA MINING CONCEPTOS Y EXPERIENCIA EN LA FISCALIZACIÓN DEL MERCADO DE VALORES DE CHILE Marcelo García
Más detallesAnálisis de Datos. Validación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores
Análisis de Datos Validación de clasificadores Profesor: Dr. Wilfrido Gómez Flores 1 Introducción La mayoría de los clasificadores que se han visto requieren de uno o más parámetros definidos libremente,
Más detallesAprendizaje Automatizado
Aprendizaje Automatizado Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto
Más detallesIntroducción a la minería de datos
Introducción a la minería de datos 1 Temario Qué es minería de datos? Quién usa minería de datos? Por qué de la minería de datos? Ciclo virtuoso de la minería de datos 2 Definición de minería de datos
Más detallesARBOLES DE DECISION. Miguel Cárdenas-Montes. 1 Introducción. Objetivos: Entender como funcionan los algoritmos basados en árboles de decisión.
ARBOLES DE DECISION Miguel Cárdenas-Montes Los árboles de decisión son estructuras lógicas con amplia utilización en la toma de decisión, la predicción y la minería de datos. Objetivos: Entender como funcionan
Más detallesINSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016
ANEXO ESTADÍSTICO 1 : COEFICIENTES DE VARIACIÓN Y ERROR ASOCIADO AL ESTIMADOR ENCUESTA NACIONAL DE EMPLEO (ENE) INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 9 de Abril de 016 1 Este anexo estadístico es una
Más detallesAnálisis de Datos. Combinación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores
Análisis de Datos Combinación de clasificadores Profesor: Dr. Wilfrido Gómez Flores 1 Introducción Diversos algoritmos de clasificación están limitados a resolver problemas binarios, es decir, con dos
Más detallesÍNDICE. Introducción... Capítulo 1. Investigación de mercados y muestreo. Muestreo aleatorio simple y sistemático... 1
Introducción... XI Capítulo 1. Investigación de mercados y muestreo. Muestreo aleatorio simple y sistemático... 1 Las técnicas de muestreo y la investigación de mercados... 1 Población, marco y muestra...
Más detallesCómo se usa Data Mining hoy?
Cómo se usa Data Mining hoy? 1 Conocer a los clientes Detectar segmentos Calcular perfiles Cross-selling Detectar buenos clientes Evitar el churning, attrition Detección de morosidad Mejora de respuesta
Más detallesPosibles trabajos HIA
Posibles trabajos HIA Posibles trabajos Comparar otras herramientas de Minería de Datos con Weka Estudiar la influencia del ruido en bagging y boosting Estudiar la influencia del parámetro de poda en J48
Más detallesTaller #3. Carlos Reveco Cinthya Vergara
Taller #3 Carlos Reveco creveco@dcc.uchile.cl Cinthya Vergara cvergarasilv@ing.uchile.cl 1 Taller#3 - Uso de RapidMiner 5.0 Limpieza y selección de datos Data Cleansing: Eliminación de valores nulos o
Más detallesTRABAJO PRÁCTICO III: Minería de datos. PARTE 01: Arboles de decisión (J48)
TRABAJO PRÁCTICO III: Minería de datos PARTE 01: Arboles de decisión (J48) Introducción: En este trabajo se implementa el primero de una serie de algoritmos que se presentarán durante la materia para realizar
Más detallesTécnicas de aprendizaje sobre series temporales
Técnicas de aprendizaje sobre series temporales Contenido 1. Motivación. 2. Ejemplo del Problema. 3. Aproximaciones al problema de clasificación de series temporales. 4. Aprendizaje de reglas. 5. Boosting
Más detallesAPLICACIONES DE MINERA DE DATOS EN ADUANA DE PERU. Luis Azaña Bocanegra
APLICACIONES DE MINERA DE DATOS EN ADUANA DE PERU Luis Azaña Bocanegra TEMARIO CONCEPTOS DEFINICION DE MINERIA DE DATOS USOS DE LA MINERIA DE DATOS TECNICAS DE MINERIA DE DATOS ETAPAS DE UN PROYECTO DE
Más detallesTema 4: Aprendizaje de conceptos
Inteligencia Artificial II Curso 2004 2005 Tema 4: Aprendizaje de conceptos José A. Alonso Jiménez Francisco Jesús Martín Mateos José Luis Ruiz Reina Dpto. de Ciencias de la Computación e Inteligencia
Más detallesVIII Jornadas de Usuarios de R
VIII Jornadas de Usuarios de R Análisis del Abandono en el Sector Bancario Predicción del abandono de clientes Albacete, 17 de Noviembre de 2016 I. INDICE : Modelo Abandonos I. COMPRENSIÓN DEL NEGOCIO
Más detallesGUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC)
GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC) Curso Académico: 2015-2016 Programa: Centro: Universidad: Máster Universitario en Ingeniería Informática Escuela Politécnica Superior
Más detallesUNIVERSIDAD ALAS PERUANAS FACULTAD DE CIENCIAS DE LA COMUNICACIÓN SILABO POR COMPETENCIA
UNIVERSIDAD ALAS PERUANAS FACULTAD DE CIENCIAS DE LA COMUNICACIÓN SILABO POR COMPETENCIA I. DATOS INFORMATIVOS 1.1 Asignatura : Estadística para el Comunicador Social 1.2 Código : 1001-1023 1.3 Pre-requisito
Más detallesAprendizaje Automático Segundo Cuatrimestre de Árboles de Decisión
Aprendizaje Automático Segundo Cuatrimestre de 2015 Árboles de Decisión Aproximación de Funciones Ejemplo: Un amigo juega al tenis los sábados. Juega o no, dependiendo del estado del tiempo. Cielo: {Sol,
Más detallesUNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE ESTUDIOS SUPERIORES ACATLÁN LICENCIATURA EN MATEMÁTICAS APLICADAS Y COMPUTACIÓN
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE ESTUDIOS SUPERIORES ACATLÁN LICENCIATURA EN MATEMÁTICAS APLICADAS Y COMPUTACIÓN ACATLÁN PROGRAMA DE ASIGNATURA CLAVE: SEMESTRE: 5 (QUINTO) MODALIDAD
Más detallesObject Recognition as Machine Translation: Learning a Lexicon for a Fixed Image Vocabulary
Object Recognition as Machine Translation: Learning a Lexicon for a Fixed Image Vocabulary P. Duygulu, K. Barnard, J.F.G. de Freitas, and D.A. Forsyth Dr. Enrique Sucar 1 Victor Hugo Arroyo Dominguez 1
Más detallesÍndice. Resumen 15 Motivación 15 Desarrollos y aportes 16 Publicaciones derivadas de esta tesis doctoral 19
Índice Resumen 15 Motivación 15 Desarrollos y aportes 16 Publicaciones derivadas de esta tesis doctoral 19 Capítulo 1. Introducción a la Minería de Datos 21 1. Minería de datos 21 1.1. Tipos de datos 24
Más detallesApéndice A: Matrices de confusión y resultados de precisión, exhaustividad y medida F
Apéndices 77 Apéndice A: Matrices de confusión y resultados de precisión, exhaustividad y medida F En este apéndice se presentan seis tablas con otros resultados obtenidos. En cada una de las primeras
Más detallesManual de GeoConcept 6 II Parte
Manual de GeoConcept 6 II Parte Noviembre de 006 Convenciones Usted notará la presencia de diferentes iconos que le indicarán la existencia de un párrafo importante, un señalamiento o un ejercicio. Atención,
Más detallesAutomatización de la Evaluación del Impacto Social en Proyectos de Inversión Publica
Automatización de la Evaluación del Impacto Social en Proyectos de Inversión Publica Ronald René Vergara Pareja 1 Agenda Objetivo de la Investigación. Situación Actual de los Proyectos de Inversión Publica.
Más detallesCLASIFICACIÓN DE LA IMAGEN. Escuela de Ingeniería Civil y Geomática Francisco Luis Hernández Torres
CLASIFICACIÓN DE LA IMAGEN TÉCNICA QUE PERMITE LA IDENTIFICACIÓN DE LOS DIFERENTES OBJETOS O GRUPOS PRESENTES EN UNA IMAGEN MULTI-ESPECTRAL. MÉTODO NO SUPERVISADO MÉTODO SUPERVISADO El Desarrollo De Las
Más detallesCRITERIOS DE SELECCIÓN DE MODELOS
Inteligencia artificial y reconocimiento de patrones CRITERIOS DE SELECCIÓN DE MODELOS 1 Criterios para elegir un modelo Dos decisiones fundamentales: El tipo de modelo (árboles de decisión, redes neuronales,
Más detallesCátedra: Estadística Técnica Facultad de Ingeniería UNCuyo. Índice D. Fernández & M. Guitart TABLA DE CONTENIDOS
Cátedra: TABLA DE CONTENIDOS INTRODUCCIÓN Qué es la Probabilidad? Qué es la Estadística? La evolución histórica de la Estadística Algunos conceptos imprescindibles Fuentes de datos Tipos de datos y escalas
Más detallesEl nivel Interno. Índice Tema 3
El nivel Interno Índice Tema 3 iel nivel Interno...1 Introducción...2 Etapas de acceso a la base de datos...2 Gestor de Disco...3 Gestor de Ficheros...3 Agrupamiento...4 Interactivos...4 Entrearchivos...4
Más detallesPsicometría Tema 6 VALIDEZ DE LAS INFERENCIAS I
Psicometría Tema 6 VALIDEZ DE LAS INFERENCIAS I Psicometría Mª Isabel García Barbero, UNED. Universidad Nacional de Educación a Distancia, 2006 1 La fiabilidad de un instrumento de medida es una condición
Más detallesProcesamiento de información para medir el aprendizaje estudiantil utilizando el programado Excel recopilados. Los participantes rán en el
Procesamiento de información para medir el aprendizaje estudiantil utilizando el programado Excel recopilados. Los participantes rán en el Julio E. Rodríguez Torres Chamary uso de Fuentes Excel. Vergara
Más detalles11. FUENTES DE INFORMACIÓN
multidimensionales Unidad 3: Tratamiento del color Identificar las características del histograma y su uso para el tratamiento del color Obtener el histograma de diferentes imágenes para indicar las características
Más detallesTécnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO
Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO 2 Objetivo El objetivo principal de las técnicas de clasificación supervisada es obtener un modelo clasificatorio válido para permitir tratar
Más detallesValidación Cruzada (cross-validation) y Remuestreo (bootstrapping)
Validación Cruzada (cross-validation) y Remuestreo (bootstrapping) Padres de cross-validation y el bootstrapping Bradley Efron y Rob Tibshirani Bradley Efron Rob Tibshirani Enfoque: tabla de aprendizaje
Más detallesEstándares de evaluación en la materia de MATEMÁTICAS de 1º de ESO. Curso 2016/2017.
Estándares de evaluación en la materia de MATEMÁTICAS de 1º de ESO. Curso 2016/2017. Bloque 1. Procesos, métodos y actitudes en matemáticas. Los criterios correspondientes a este bloque son los marcador
Más detallesAnálisis de Datos y Métodos Cuantitativos para la D.T. VI versión MGM
Universidad Católica del Norte Escuela de Negocios Mineros Magister en Gestión Minera Análisis de Datos y Métodos Cuantitativos para la D.T. VI versión MGM Antofagasta, Junio de 2013 Profesor: Fernando
Más detallesModelos de Scoring para Riesgo de Crédito
Modelos de Scoring para Riesgo de Crédito Los modelos de scoring de riesgo, dentro del proceso de otorgamiento de crédito, están orientados a anticipar comportamiento futuro. Podemos dividirlos en tres
Más detallesEstadísticas Elemental Tema 3: Describir la relación entre dos variables: Correlación y regresión 3.1-1
Estadísticas Elemental Tema 3: Describir la relación entre dos variables: Correlación y regresión 3.1-1 Relación entre dos variables Al estudiar conjuntos de variables con más de una variable, una pregunta
Más detalles6. PROGRAMACIÓN DEL CURSO 4º A DE E. S. O.
6. PROGRAMACIÓN DEL CURSO 4º A DE E. S. O. 6.1 OBJETIVOS GENERALES DEL CURSO Reconocer las diferentes clases de números, y operar correctamente con ellos. Aplicaciones aritméticas. Conocer y manejar la
Más detallesNEWTON TREES. Árboles de Estimación Estocástica de Probabilidades:
Tesis de Máster en Ingeniería del Software, Métodos Formales y Sistemas de Información Árboles de Estimación Estocástica de Probabilidades: NEWTON TREES Autor: Fernando Martínez Plumed 1 Directores: Cèsar
Más detallesCÁLCULO DE PROBABILIDADES
CÁLCULO DE PROBABILIDADES Tipo de asignatura: Troncal Anual. Créditos ECTS: 15 I.- INTRODUCCIÓN AL CÁLCULO DE PROBABILIDADES. (16 horas presenciales) Tema 1.- La naturaleza del cálculo de probabilidades.
Más detallesIntroducción a la Minería de Datos
Introducción a la Minería de Datos Abdelmalik Moujahid, Iñaki Inza y Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Índice 1 Minería de
Más detallesDepartamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.
TEMA 13 REGRESIÓN LOGÍSTICA Es un tipo de análisis de regresión en el que la variable dependiente no es continua, sino dicotómica, mientras que las variables independientes pueden ser cuantitativas o cualitativas.
Más detallesAnálisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores
Análisis de Datos Introducción al aprendizaje supervisado Profesor: Dr. Wilfrido Gómez Flores 1 Conceptos básicos Reconocimiento de patrones (RP): clasificar objetos en un número de categorías o clases.
Más detallesConsultor en investigación social y de mercados y analista web.
Consultor en investigación social y de mercados y analista web 23 años de experiencia en investigación de mercados Amplio conocimiento de metodologías Manejo de SPSS y de modelos multivariantes Analista
Más detallesInteligencia Artificial
Algoritmos genéticos Bases En la naturaleza todos los seres vivos se enfrentan a problemas que deben resolver con éxito, como conseguir más luz solar o conseguir comida. La Computación Evolutiva interpreta
Más detallesCorrelación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)
Correlación El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r) El coeficiente de correlación lineal de Pearson (r) permite medir el grado de asociación entre
Más detallesTema 7: Aprendizaje de árboles de decisión
Inteligencia Artificial 2 Curso 2002 03 Tema 7: Aprendizaje de árboles de decisión José A. Alonso Jiménez Miguel A. Gutiérrez Naranjo Francisco J. Martín Mateos José L. Ruiz Reina Dpto. de Ciencias de
Más detallesReconocimiento de Patrones
Reconocimiento de Patrones Jesús Ariel Carrasco Ochoa Instituto Nacional de Astrofísica Óptica y Electrónica ariel@inaoep.mx Contenido Introducción Enfoques Problemas Selección de Variables Clasificación
Más detallesMantenimiento del Software
Mantenimiento del Software S6 Francisco Ruiz, Macario Polo Grupo Alarcos Dep. de Informática ESCUELA SUPERIOR DE INFORMÁTICA UNIVERSIDAD DE CASTILLA-LA MANCHA http://alarcos.inf-cr.uclm.es/doc/mso/ Ciudad
Más detallesInformación general. Obligatoria básica o de fundamentación X. Obligatoria profesional. Horas de trabajo independiente del estudiante
Guía de asignatura Formato institucional Rev. Abril 2013 Información general Asignatura E S T A D I S T I C A Código 73210011 Tipo de asignatura Obligatoria X Electiva Tipo de saber Número de créditos
Más detallesLa Identificación de Stakeholders en la Ingeniería de Requisitos
La Identificación de Stakeholders en la Ingeniería de Requisitos Trabajo de investigación tutelado. Doctorando: Carla Leninca Pacheco Agüero. Tutor: Dr. Edmundo Tovar Caro. S I N T E S I S La primera medida
Más detallesJesús García Herrero METODOLOGÍA DE ANÁLISIS DE DATOS
Jesús García Herrero METODOLOGÍA DE ANÁLISIS DE DATOS En esta clase concluimos el curso de Análisis de Datos con una visión de las metodologías del análisis de datos. Como se ha visto, este es un campo
Más detallesTema: Análisis de valores faltantes con SPSS
Tema: Análisis de valores faltantes con SPSS 1.- Introducción Hemos de comenzar advirtiendo que el Procedimiento Valores perdidos no se incluye en el sistema Base de SPSS, por lo que solo estará disponible
Más detallesUniversidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL
Universidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL OBJETIVO Analizar las Diferentes formas de Describir la Relación entre dos variables numéricas Trazar un diagrama de dispersión
Más detallesProject Luis Angulo Aguirre. N. de páginas: 456. Edición: 1. a Medida: 17.5 x Material incluido:
Pág. N. 1 Project 2013 Familia: Editorial: Autor: Tecnología de la Información y Computación Macro Luis Angulo Aguirre ISBN: Físico Digital N. de páginas: 456 9786123041250 9786123043704 Edición: 1. a
Más detallesCapítulo 8. Selección de variables Introducción
Capítulo 8 Selección de variables 8.1. Introducción En muchos problemas de regresión es posible considerar un número importante de variables predictoras. Un empresario podría estudiar los factores que
Más detallesGuía Docente: ESTADÍSTICA Y CÁLCULO MATEMÁTICO
ESTADÍSTICA Y CÁLCULO MATEMÁTICO FACULTAD DE CIENCIAS QUÍMICAS UNIVERSIDAD COMPLUTENSE DE MADRID CURSO 2014-2015 I.- IDENTIFICACIÓN NOMBRE DE LA ASIGNATURA: NÚMERO DE CRÉDITOS: 6 CARÁCTER: Obligatoria
Más detallesAPRENDIZAJE PROBABILÍSTICO NAIVE BAYES
1 APRENDIZAJE PROBABILÍSTICO NAIVE BAYES Bases de Datos Masivas 9 de Noviembre de 2016 2 Razonamiento Probabilístico Es una herramienta de aprendizaje estadístico. Se trata de razonar en un contexto incierto;
Más detallesDE LAS BD A LOS ALMACENES DE DATOS (DW) FINALIDADES Y EVOLUCIÓN DE LOS SISTEMAS DE INFORMACIÓN FINALIDADES Y EVOLUCIÓN DE LOS SISTEMAS DE INFORMACIÓN
DE LAS BD A LOS ALMACENES DE DATOS (DW)... ALMACENES DE DATOS (DATA WAREHOUSES Y DATA MARTS), OLAP (PROCESO ANALÍTICO EN LÍNEA) Y. DE LAS BD A LOS DW 1 DE LAS BD A LOS DW 2 LA INFORMACIÓN REDUCE NUESTRA
Más detallesÁrboles de Decisión Árboles de Sintaxis
Árboles de Decisión Árboles de Sintaxis Estructuras de Datos Andrea Rueda Pontificia Universidad Javeriana Departamento de Ingeniería de Sistemas Árboles de Decisión Árbol de Decisión Forma gráfica de
Más detallesProgramación Evolutiva
Introducción a la Computación Evolutiva Quinta Clase: Programación Evolutiva Programación Evolutiva Desarrollada en USA durante los años 60 Autores principales: D. Fogel Aplicada típicamente a: PE tradicional:
Más detallesSelección de fuentes de datos y calidad de datos
Selección de fuentes de datos y calidad de datos ESCUELA COMPLUTENSE DE VERANO 2014 MINERIA DE DATOS CON SAS E INTELIGENCIA DE NEGOCIO Juan F. Dorado José María Santiago . Valores atípicos. Valores faltantes.
Más detallesEstadística Descriptiva. Poblaciones y muestras.
Estadística Descriptiva. Poblaciones y muestras. fgarcia@cipf.es CIPF s Research Development Programme Indice 1 Introducción 2 3 Análisis Estadístico Población y muestra Software estadístico CIPF s Research
Más detallesÍndice general. Pág. N. 1. Capítulo 1 ETAPAS DE UNA INVESTIGACIÓN. Diseño. Población. Muestra. Individuo (Observación, Caso, Sujeto) Variables
Pág. N. 1 Índice general Capítulo 1 ETAPAS DE UNA INVESTIGACIÓN 1.1 Diseño 1.2 Descriptiva 1.3 Inferencia Diseño Población Muestra Individuo (Observación, Caso, Sujeto) Variables Ejercicios de Población
Más detallesÍndice general. Pág. N. 1
Pág. N. 1 Índice general CAPÍTULO 1: NATURALEZA DE LOS PROYECTOS 1.1. PROYECTOS 1.1.1. Definición de proyecto 1.1.2. Características 1.1.3. Ejemplos de proyectos 1.1.4. Diagramas que ayudan a la gestión
Más detallesSISTEMA INTEGRAL PARA LA PROYECCIÓN Y DETECCIÓN DE LA PREVENCIÓN DEL DELITO, MEDIANTE MINERÍA DE DATOS.
SISTEMA INTEGRAL PARA LA PROYECCIÓN Y DETECCIÓN DE LA PREVENCIÓN DEL DELITO, MEDIANTE MINERÍA DE DATOS. MTIE. Erik Guerrero Bravo. Universidad Tecnológica Tula - Tepeji. Introducción Sistemas Transaccionales
Más detallesMATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES II
CONTENIDOS MÍNIMOS TEMA 1: SISTEMAS DE ECUACIONES. MÉTODO DE GAUSS Sistemas de ecuaciones lineales. Método de Gauss Sistemas de ecuaciones dependientes de un parámetro Resolución de problemas mediante
Más detallesINDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica
INDICE 1. Qué es la Estadística? 1 Introducción 2 Qué significa estadística? 2 Por qué se estudia la estadística? 4 Tipos de estadística 5 Estadística descriptiva 5 Estadística inferencial 6 Tipos de variables
Más detallesAprendizaje Automático. Objetivos. Funciona? Notas
Introducción Las técnicas que hemos visto hasta ahora nos permiten crear sistemas que resuelven tareas que necesitan inteligencia La limitación de estos sistemas reside en que sólo resuelven los problemas
Más detallesMÓDULO 1: ORGANIZACIÓN Y ESTRUCTURA DE LA INFORMACIÓN. Tema 2: Creación de la Base de Datos. Leire Aldaz, Begoña Eguía y Leire Urcola
MÓDULO 1: ORGANIZACIÓN Y ESTRUCTURA DE LA INFORMACIÓN Leire Aldaz, Begoña Eguía y Leire Urcola CREACIÓN DE LA BASE DE DATOS Una vez se han definido el diseño conceptual y el lógico de la base de datos,
Más detallesAnalizando patrones de datos
Analizando patrones de datos SQL Server DM, Excel DM, Azure ML y R Ana María Bisbé York @ambynet http://amby.net/ Temario Introducción a Minería de datos MS Office Excel Herramientas de tabla y Minería
Más detallesAprendizaje Automático y Data Mining. Bloque IV DATA MINING
Aprendizaje Automático y Data Mining Bloque IV DATA MINING 1 Índice Definición y aplicaciones. Grupos de técnicas: Visualización. Verificación. Descubrimiento. Eficiencia computacional. Búsqueda de patrones
Más detallesTópicos Selectos en Aprendizaje Maquinal. Algoritmos para Reconocimiento de Patrones
Tópicos Selectos en Aprendizaje Maquinal Guía de Trabajos Prácticos N 1 (2da. parte) Algoritmos para Reconocimiento de Patrones 20 de Octubre de 2010 1. Objetivos Introducir conceptos básicos de aprendizaje
Más detallesTema 8: Árboles de decisión
Introducción a la Ingeniería del Conocimiento Curso 2004 2005 Tema 8: Árboles de decisión Miguel A. Gutiérrez Naranjo Dpto. de Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla
Más detallesPROBABILIDAD Y ESTADÍSTICA. Sesión 4 4. REGRESIÓN Y CORRELACIÓN SIMPLE
PROBABILIDAD Y ESTADÍSTICA Sesión 4 4. REGRESIÓN Y CORRELACIÓN SIMPLE 4.1 Regresión lineal simple y curvilínea 4.1.1 Variable dependiente e independiente 4.1.2 Ecuación de regresión 4.1.2.1 Aplicación
Más detallesMATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES II DISTRITO ÚNICO DE ANDALUCÍA
MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES II DISTRITO ÚNICO DE ANDALUCÍA CONTENIDOS Y OBJETIVOS MÍNIMOS PARA EL CURSO 2007/08. 1. INTRODUCCIÓN A LOS CONTENIDOS. ( Decreto 208/2002. B.O.J.A. de 20.08.02
Más detallesUNIVERSIDAD AUTONOMA DE SANTO DOMINGO
UNIVERSIDAD AUTONOMA DE SANTO DOMINGO FACULTAD DE CIENCIAS ECONOMICAS Y SOCIALES DEPARTAMENTO DE ESTADISITICA CATEDRA Estadística Especializada ASIGNATURA Estadística Industrial (EST-121) NUMERO DE CREDITOS
Más detallesReconociendo mis fortalezas como estudiante. Docente y Estudiantes
Reconociendo mis fortalezas como estudiante Docente y Estudiantes 2016 OBJETIVO Reconocer actitudes y habilidades personales que apoyan la mejora de nuestros aprendizajes. 2 RECOMENDACIONES PARA DESARROLLAR
Más detallesFundamentos de Ingeniería de Software [Etapas II]
Fundamentos de Ingeniería de Software [Etapas II] M. en C. Sergio Luis Pérez Pérez UAM CUAJIMALPA, MÉXICO, D. F. Trimestre 13-I Sergio Luis Pérez (UAM CUAJIMALPA) Curso de fundamentos de ing. de software
Más detallesInteligencia Artificial. Aprendizaje neuronal. Ing. Sup. en Informática, 4º. Curso académico: 2011/2012 Profesores: Ramón Hermoso y Matteo Vasirani
Inteligencia Artificial Aprendizaje neuronal Ing. Sup. en Informática, 4º Curso académico: 20/202 Profesores: Ramón Hermoso y Matteo Vasirani Aprendizaje Resumen: 3. Aprendizaje automático 3. Introducción
Más detalles18 Experimentos aleatorios. Sucesos y espacio muestral. Frecuencia y probabilidad de un suceso.
PRIMER CURSO DE E.S.O Criterios de calificación: 80% exámenes, 10% actividades, 10% actitud y trabajo 1 Números naturales. 2 Potencias de exponente natural. Raíces cuadradas exactas. 3 Divisibilidad. Concepto
Más detallesESCUELA COMERCIAL CÁMARA DE COMERCIO EXTENSIÓN DE ESTUDIOS PROFESIONALES MAESTRÍA EN ADMINISTRACIÓN
CICLO, ÁREA O MÓDULO: TERCER CUATRIMESTRE OBJETIVO GENERAL DE LA ASIGNATURA: Al termino del curso el alumno efectuara el análisis ordenado y sistemático de la Información, a través del uso de las técnicas
Más detallesExperto en Data Mining
titulación de formación continua bonificada expedida por el instituto europeo de estudios empresariales Experto en Data Mining duración total: precio: 0 * modalidad: Online * hasta 100 % bonificable para
Más detallesProbabilidad y Estadística
Probabilidad y Estadística Grado en Ingeniería Informática - Curso 2 Pablo Candela Departamento de Matemáticas (despacho 212) Universidad Autónoma de Madrid pablo.candela@uam.es Introducción 1 / 8 Organización
Más detallesNivel Intermedio. A comprender de forma activa conceptos fundamentales de estadística. Crear bases de datos estadísticos.
Análisis de datos mediante el SPSS A comprender de forma activa conceptos fundamentales de estadística. Crear bases de datos estadísticos. Procesar eficientemente información estadística. Analizar con
Más detallesCapítulo 6 Multicolinealidad Luis Quintana Romero. Econometría Aplicada Utilizando R
Capítulo 6 Multicolinealidad Luis Quintana Romero Objetivo Identificar la multicolinealidad en un modelo econométrico, así como las pruebas de detección de la multicolinealidad y correcciones. Introducción
Más detalles