Técnicas de Preprocesado
|
|
|
- María Mercedes Fuentes Figueroa
- hace 8 años
- Vistas:
Transcripción
1 Técnicas de Preprocesado Series Temporales Máster en Computación Universitat Politècnica de Catalunya Dra. Alicia Troncoso Lora 1
2 Contenido Por qué preprocesar p los datos? Técnicas de filtro Depuración Tratamiento de valores ausentes (Missing) Detección de Outliers Trasformación Normalización Estandarización Atributos Calculados Discretización No Supervisada (Igual anchura/frecuencia) Supervisada: Fayyad e Irani, 1Rule, USD 2
3 Por qué preprocesar los datos? Los datos reales están sucios Datos incompletos: valores de atributos inexistentes Datos con ruido: errores de precisión, ió errores de medición, errores de almacenamiento Datos inconsistentes: outliers Para obtener conclusiones válidas y útiles al aplicar minería de datos, es necesario una adecuada preparación de los datos previa al proceso de minería 3
4 Técnicas de filtro: Depuración Tratamiento de Missings: Eliminar ejemplos con atributos missings Pérdida de información Asignar una constante t Mala interpretación WEKA t -ió Filtro: del algoritmo de aprendizaje Unsupervised Attribute ReplaceMissingValue s Sustituir por valores con influencia mínima: Continuos: Media Discretos Moda Predecir el valor (clasificación, regresión) Muy costoso 4
5 Técnicas de filtro: Depuración Detección de Outliers WEKA Clusterers SimplekMeans WEKA Clusterers EM Para la detección y eliminación outliers se suelen aplicar técnicas de agrupamiento (clustering): K-Means EM (Expectation Maximization) Procedimiento: Agrupar en clusters y eliminar clusters poco densos y/o lejanos 5
6 Técnicas de filtro: Transformación Normalización Trasforma el rango de valores a un intervalo determinado (normalmente [0,1]) ValorNorm Valor Min Max Min Es necesario si se van a aplicar algoritmos de aprendizaje aje basados en distancias para que todos los atributos estén en el mismo rango. WEKA: Filters Unsupervised Attribute Normalize 6
7 Técnicas de filtro: Transformación Estandarización Transforma los valores de los atributos para que tengan media 0 y desviación 1 Sólo si la distribución es normal ValorEst Valor Media Desviación WEKA: Filters Unsupervised Attribute Standardize 7
8 Técnicas de filtro: Nuevos atributos Se trata de añadir nuevos atributos aplicando una expresión matemática a atributos ya existentes en el conjunto de datos. Ejemplo: sepalarea = sepallength x sepalwidth WEKA: Filters Unsupervised Attribute AddExpresionp p 8
9 Técnicas de filtro: Discretización Hay algoritmos de aprendizaje que sólo operan con atributos discretos Transformación de atributos continuos a discretos (rango finito de valores). Consiste en dividir el rango de valores continuos en un conjunto o finito de intervalos aos (o cortes). Ejemplo: Notas [0,10] {Suspenso, Aprobado, Notable, Sobresaliente} No Supervisado: Igual Anchura: k intervalos de igual anchura Igual Frecuencia: k intervalos de N/k valores cada uno WEKA: Unsupervised Attribute Discretize Supervisado: Fayyad e Irani, Kononenko, 1Rule, USD 9
10 Técnicas de filtro: Discretización Fayyad e Irani: Basados en criterios de entropía mínima y longitud de decripción mínima (MDL) La mejor descripción del conjunto de datos es la que minimiza la longitud de la descripción de todo el conjunto de datos U.M. Fayyad, K.B. Irani. Multi-Interval Discretization of Continuous-Valued Attributes for Classification Learning. XIII International Joint Conference on Artificial Intelligence, pp , France, 1993 Los puntos de corte serán aquellos que formen barreras entre clases después de ordenar los valores de las características continuas WEKA: Filters: Supervised Attribute Discretize (Use Kohonenko = false) 10
11 Técnicas de filtro: Discretización 1Rule: Clasificación como discretización R.C. Holte, Very simple classification rules perform well on most commonly used datasets, t Machine Learning, Vol. 11, pp , Idea Algoritmo: Para cada atributo: Ordena los valores Recorre el conjunto de datos estableciendo cortes que cumplan: Hay al menos una clase óptima para más de un número mínimo (SMALL) de valores en el intervalo. (Esta restricción no se aplica al último intervalo). Un intervalo no puede tener la misma clase óptima que el intervalo o valor inmediatamente anterior o posterior. WEKA: Classify: Rules OneR 11
12 Técnicas de filtro: Discretización USD (Unparametrized Supervised Discretization) : Raúl Giráldez et al. Discretization Oriented to Decision Rule Generation (KES). IOS Press, pp , Intervalos generados: Debe obtener un conjunto finito de intervalos disjuntos para cada atributo continuo que cubra todo el rango de valores. Precisión: El error introducido por la discretización debe ser mínimo Discretización Supervisada. Número de intervalos: A menor número de intervalos, menor será el espacio de búsqueda. Eficiencia: El método debe ser de un coste computacional reducido 12
13 Técnicas de filtro: Discretización Inicialización: Cortes básicos maximizando el nivel de pureza. Refinamiento: Une intervalos adyacentes si la bondad de la unión es mayor que la bondad media de los intervalos participantes. Ejemplo Inicialización i ió Inicialización Refinamiento 1ª IteraciónRefinamiento 13
14 Ejercicio Discretización del ozono en 3 etiquetas que correspondan con ozono bajo, ozono medio y ozono alto Discretización del ozono en 4 etiquetas que correspondan con ozono bajo, ozono medio, ozono alto y ozono muy alto Analizar las dependencias entre el ozono y las otras variables Cuáles son las variables más influyentes en el ozono? De dichas variables, cuáles son los rangos de valores que más afectan? 14
Minería de Datos. Preprocesamiento: Reducción de Datos - Discretización
Minería de Datos Preprocesamiento: Reducción de Datos - Discretización Dr. Edgar Acuña Departamento de Ciencias Matemáticas Universidad de Puerto Rico-Mayaguez E-mail: [email protected], [email protected]
Visión global del KDD
Visión global del KDD Series Temporales Máster en Computación Universitat Politècnica de Catalunya Dra. Alicia Troncoso Lora 1 Introducción Desarrollo tecnológico Almacenamiento masivo de información Aprovechamiento
PREPROCESADO DE DATOS PARA MINERIA DE DATOS
Ó 10.1007/978-3-319-02738-8-2. PREPROCESADO DE DATOS PARA MINERIA DE DATOS Miguel Cárdenas-Montes Frecuentemente las actividades de minería de datos suelen prestar poca atención a las actividades de procesado
M1. FUNDAMENTOS DE MINERÍA DE DATOS
MÁSTER OFICIAL DE LA UNIVERSIDAD DE GRANADA "SOFT COMPUTING Y SISTEMAS INTELIGENTES" M1. FUNDAMENTOS DE MINERÍA DE DATOS J.L. CUBERO, F. BERZAL, F. HERRERA Dpto. Ciencias de la Computación e I.A. Universidad
GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC)
GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC) Curso Académico: 2015-2016 Programa: Centro: Universidad: Máster Universitario en Ingeniería Informática Escuela Politécnica Superior
Unidad 1. Obtención, Medición y Representación de Datos. Estadística E.S.O.
Unidad 1 Obtención, Medición y Representación de Datos Estadística E.S.O. Objetivos Distinguir, localizar y manejar las fuentes de información estadística más usuales que proporcionan información útil.
Selección de fuentes de datos y calidad de datos
Selección de fuentes de datos y calidad de datos ESCUELA COMPLUTENSE DE VERANO 2014 MINERIA DE DATOS CON SAS E INTELIGENCIA DE NEGOCIO Juan F. Dorado José María Santiago . Valores atípicos. Valores faltantes.
CERTIFICADO DE APTITUD PEDAGÓGICA -CAP- 2007/2008
10-abr-08 UNIVERSIDAD DE JAÉN 01826153 SOBRESALIENTE NOTABLE SOBRESALIENTE SOBRESALIENTE SOBRESALIENTE 02068506 NOTABLE NOTABLE NOTABLE NOTABLE SOBRESALIENTE 03878074 SOBRESALIENTE SOBRESALIENTE SOBRESALIENTE
ANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA
ANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA ANALISIS DE CLUSTER EN SPSS Opción: Analizar Clasificar ANALISIS DE CLUSTER EN SPSS Tres posibles OPCIONES 1.- Cluster en dos etapas 2.- K-means 3.- Jerárquicos
Fundamentos de Estadística y Simulación Básica
Fundamentos de Estadística y Simulación Básica TEMA 2 Estadística Descriptiva Clasificación de Variables Escalas de Medición Gráficos Tabla de frecuencias Medidas de Tendencia Central Medidas de Dispersión
Análisis de imágenes digitales
Análisis de imágenes digitales SEGMENTACIÓN DE LA IMAGEN Segmentación basada en texturas INTRODUCCIÓN La textura provee información sobre la distribución espacio-local del color o niveles de intensidades
METODOLOGÍA DE CONSTRUCCIÓN DE GRUPOS SOCIOECONÓMICOS Pruebas SIMCE 2012
METODOLOGÍA DE CONSTRUCCIÓN DE GRUPOS SOCIOECONÓMICOS Pruebas SIMCE 2012 Departamento de Pruebas Nacionales División de Evaluación de Logros de Aprendizaje AGENCIA DE CALIDAD DE LA EDUCACIÓN Índice 1.
Resolución de problemas de búsqueda
Resolución de problemas de búsqueda Memoria de Prácticas de Segunda Entrega 26 de noviembre de 2007 Autores: Mariano Cabrero Canosa [email protected] Elena Hernández Pereira [email protected] Directorio de entrega:
Preparación de Datos. Preparación de datos
Preparación de Datos Dr. Ing. Biom. Elmer A. Fernández Universidad Católica de Córdoba Fac. Ingeniería Preparación de datos Esta es una etapa crítica. En esta etapa se acondicionan los datos que luego
Cómo se usa Data Mining hoy?
Cómo se usa Data Mining hoy? 1 Conocer a los clientes Detectar segmentos Calcular perfiles Cross-selling Detectar buenos clientes Evitar el churning, attrition Detección de morosidad Mejora de respuesta
Otros aspectos. Procesado de la entrada Procesado de la salida. Carlos J. Alonso González Departamento de Informática Universidad de Valladolid
Otros aspectos Procesado de la entrada Procesado de la salida Carlos J. Alonso González Departamento de Informática Universidad de Valladolid Contenido 1. Procesado de la entrada 1. Motivación y tareas
Construcción de Gráficas en forma manual y con programados
Universidad de Puerto Rico en Aguadilla División de Educación Continua y Estudios Profesionales Proyecto CeCiMaT Segunda Generación Tercer Año Título II-B, Mathematics and Science Partnerships Construcción
GLOSARIO ESTADÍSTICO. Fuente: Murray R. Spiegel, Estadística, McGraw Hill.
GLOSARIO ESTADÍSTICO Fuente: Murray R. Spiegel, Estadística, McGraw Hill. CONCEPTOS Y DEFINICIONES ESPECIALES Es el estudio científico de los métodos para recoger, organizar, resumir y analizar los datos
Data Mining utilizando Redes Neuronales. Juan M. Ale [email protected] Facultad de Ingeniería Universidad de Buenos Aires
Data Mining utilizando Redes Neuronales Romina Laura Bot [email protected] Juan M. Ale [email protected] Facultad de Ingeniería Universidad de Buenos Aires Resumen: Las Redes Neuronales son ampliamente utilizadas
Detección de Patrones de Bajo Rendimiento Académico y Deserción Estudiantil con Técnicas de Minería de Datos
Detección de Patrones de Bajo Rendimiento Académico y Deserción Estudiantil con Técnicas de Minería de Datos Ricardo Timarán Pereira, Ph.D. Departamento de Sistemas, Facultad de Ingeniería, Universidad
Proyecto 6. Árboles de decisión: Un árbol de decisión es un modelo de predicción utilizado en el ámbito de la inteligencia artificial.
Árboles de decisión: Un árbol de decisión es un modelo de predicción utilizado en el ámbito de la inteligencia artificial. Funcionamiento: Se realiza un test en cada nodo interno del árbol, a medida que
SISTEMAS INTELIGENTES
SISTEMAS INTELIGENTES T8: Aprendizaje basado en instancias www.aic.uniovi.es/ssii Índice Aprendizaje basado en instancias Métricas NN Vecino más próximo: Regiones de Voronoi El parámetro K Problemas de
Tema 3: El Método Simplex. Algoritmo de las Dos Fases.
Tema 3: El Método Simplex Algoritmo de las Dos Fases 31 Motivación Gráfica del método Simplex 32 El método Simplex 33 El método Simplex en Formato Tabla 34 Casos especiales en la aplicación del algoritmo
Acuerdo del Consejo de Gobierno de fecha 22 de julio de 2009 en el que se aprueba la unificación de los sistemas de calificación.
I. DISPOSICIONES Y ACUERDOS DE LOS ÓRGANOS DE GOBIERNO DE LA UNIVERSIDAD COMPLUTENSE I.3. CONSEJO DE GOBIERNO I.3.1. Secretaría General Acuerdo del Consejo de Gobierno de fecha 22 de julio de 2009 en el
Aprendizaje: Boosting y Adaboost
Técnicas de Inteligencia Artificial Aprendizaje: Boosting y Adaboost Boosting 1 Indice Combinando clasificadores débiles Clasificadores débiles La necesidad de combinar clasificadores Bagging El algoritmo
Fase 2. Estudio de mercado: ESTADÍSTICA
1. CONCEPTO DE ESTADÍSTICA. ESTADÍSTICA DESCRIPTIVA 2. 3. TABLA DE FRECUENCIAS 4. REPRESENTACIONES GRÁFICAS 5. TIPOS DE MEDIDAS: A. MEDIDAS DE POSICIÓN B. MEDIDAS DE DISPERSIÓN C. MEDIDAS DE FORMA 1 1.
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)
VARIABLES Variable: característica de cada sujeto (cada caso) de una base de datos. Se denomina variable precisamente porque varía de sujeto a sujeto. Cada sujeto tiene un valor para cada variable. El
Minería de Datos Web. 1 er Cuatrimestre 2015. Página Web. Prof. Dra. Daniela Godoy. http://www.exa.unicen.edu.ar/catedras/ageinweb/
Minería de Datos Web 1 er Cuatrimestre 2015 Página Web http://www.exa.unicen.edu.ar/catedras/ageinweb/ Prof. Dra. Daniela Godoy ISISTAN Research Institute UNICEN University Tandil, Bs. As., Argentina http://www.exa.unicen.edu.ar/~dgodoy
Campos gravitatorios en el espacio muestral
Campos gravitatorios en el espacio muestral Dept. Lenguajes y Ciencias de la Computación Septiembre, 2004 1/28 Enfocando el problema Aprendizaje supervisado Clasificación dicotómica (2 clases) Atributos
INFORMÁTICA Y COMUNICACIONES
441 INFORMÁTICA Y COMUNICACIONES Microsoft Access 2003 (Completo) DESCRIPCIÓN Microsoft Access 2003 (Completo) Descripción del funcionamiento del programa de gestión de bases de datos Microsoft Access
Weka como herramienta de data mining
Weka como herramienta de data mining Lic. Aldave Rojas Isaac Alberto Instituto Tecnológico Superior de Ciudad Serdán Abstract El presente trabajo muestra un ejemplo introductorio a la herramienta de Data
DOCUMENTO DE APOYO PARA PROYECTOS
DOCUMENTO DE APOYO PARA PROYECTOS Los ejemplos que a continuación se encuentran en este documento de apoyo al estudiante, tiene como objetivo dar una serie de ejemplos mínimos de algunas partes de los
Unidad 5 Control Estadístico de la Calidad. Administración de Operaciones III
Unidad 5 Control Estadístico de la Calidad Administración de Operaciones III 1 Contenido 1. Antecedentes del control estadístico de la calidad 2. Definición 3. Importancia y aplicación 4. Control estadístico
BÚSQUEDA Y CARACTERIZACIÓN DE SUBGRUPOS DE POBREZA MEDIANTE LA APLICACIÓN DE ALGUNAS TÉCNICAS DE MINERÍA DE DATOS
BÚSQUEDA Y CARACTERIZACIÓN DE SUBGRUPOS DE POBREZA MEDIANTE LA APLICACIÓN DE ALGUNAS TÉCNICAS DE MINERÍA DE DATOS Marta Sananes Surendra P. Sinha Elizabeth Torres Luis Nava Puente Instituto de Estadística
Text Mining Introducción a Minería de Datos
Text Mining Facultad de Matemática, Astronomía y Física UNC, Córdoba (Argentina) http://www.cs.famaf.unc.edu.ar/~laura SADIO 12 de Marzo de 2008 qué es la minería de datos? A technique using software tools
Introducción a selección de. Blanca A. Vargas Govea [email protected] Reconocimiento de patrones cenidet Octubre 1, 2012
Introducción a selección de atributos usando WEKA Blanca A. Vargas Govea [email protected] Reconocimiento de patrones cenidet Octubre 1, 2012 Contenido 1 Introducción a WEKA El origen Interfaces
CÁLCULO DE PROBABILIDADES
CÁLCULO DE PROBABILIDADES Tipo de asignatura: Troncal Anual. Créditos ECTS: 15 I.- INTRODUCCIÓN AL CÁLCULO DE PROBABILIDADES. (16 horas presenciales) Tema 1.- La naturaleza del cálculo de probabilidades.
Preprocesado de Datos
Preprocesado de Datos Juan A. Botía Departamento de Ingeniería de la Información y las Comunicaciones Universidad de Murcia Ingeniería Superior en Informática, UMU Juan A. Botía (Departamento de Ingeniería
ESTADISTICA DESCRIPTIVA Y PROBABILIDAD
ESTADISTICA DESCRIPTIVA Y PROBABILIDAD CODIGO 213543 (COMPUTACION) 223543 (SISTEMAS) 253443 (CONTADURIA) 263443( ADMINISTRACION) 273443 (GRH) HORAS TEORICAS HORAS PRACTICAS UNIDADES CREDITO SEMESTRE PRE
Introducción a la Minería de Datos
Introducción a la Minería de Datos Abdelmalik Moujahid, Iñaki Inza y Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Índice 1 Minería de
Introducción al paquete estadístico SPSS:
2 Introducción al paquete estadístico SPSS: Prof.: Marisa Ballestar Departamento de Enfermería [email protected] 1. Aspectos previos: Estructura de la ventana del editor de datos. Propiedades de las variables.
INDICE 1. Introducción a la Contabilidad de Costos y la Administración de Costos Parte 1. Conceptos Básicos de la Administración de Costos
INDICE 1. Introducción a la Contabilidad de Costos y la Administración de 1 Costos Contabilidad financiera, Administración y de Costos 2 Evolución de la contabilidad 3 Primeros sistemas de contabilidad
matemáticas como herramientas para solución de problemas en ingeniería. PS Probabilidad y Estadística Clave de la materia: Cuatrimestre: 4
PS0401 - Probabilidad y Estadística DES: Ingeniería Programa(s) Educativo(s): Ingeniería de Software Tipo de materia: Obligatoria Clave de la materia: PS0401 Cuatrimestre: 4 UNIVERSIDAD AUTÓNOMA DE Área
INDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos
INDICE Prefacio VII 1. Introducción 1 1.1. Qué es la estadística moderna? 1 1.2. El crecimiento y desarrollo de la estadística moderna 1 1.3. Estudios enumerativos en comparación con estudios analíticos
Data Mining Técnicas y herramientas
Data Mining Técnicas y herramientas Introducción POR QUÉ? Empresas necesitan aprender de sus datos para crear una relación one-toone con sus clientes. Recogen datos de todos lo procesos. Datos recogidos
Medidas de Tendencia Central. Dra. Noemí L. Ruiz Limardo Derechos de Autor Reservados Revisado 2010
Medidas de Tendencia Central Dra. Noemí L. Ruiz Limardo Derechos de Autor Reservados Revisado 2010 Objetivos de Lección Conocer cuáles son las medidas de tendencia central más comunes y cómo se calculan
EPB 603 Sistemas del Conocimiento
EPB Sistemas del Conocimiento Dr. Oldemar Rodríguez R. Maestría en Administración de la Tecnología de la Información Escuela de Informática Universidad Nacional Capítulo Método K-Means (Nubes Dinámicas)
Determinación del radio de la Tierra y de los radios y distancias en el sistema Tierra-Luna-Sol
Determinación del radio de la Tierra y de los radios y distancias en el sistema Tierra-Luna-Sol Rosa M. Ros Universitat Politécnica de Catalunya Aristarco (310-230 a.c,) dedujo algunas proporciones entre
Profesor(a): Ing. Miriam Cerón Brito
Área Académica: Informática Tema: Hoja electrónica Profesor(a): Ing. Miriam Cerón Brito Periodo: Enero Junio 2014 Abstract: This presentation show the spreadsheet's characteristics and show the principals
Página 1 de 11. Apartado 7.9: Filtro de partículas Se incluye este apartado sobre el filtro interno de partículas del analizador.
PRINCIPALES CAMBIOS EN LAS NORMAS UNE-EN 2013 CON RESPECTO A LAS NORMAS UNE- EN 2005/2006, RELATIVAS A LOS METODOS DE REFERENCIA PARA LA DETERMINACION DE LAS CONCENTRACIONES DE OXIDOS DE NITROGENO, DIOXIDO
Localización. CI-2657 Robótica M.Sc. Kryscia Ramírez Benavides
M.Sc. Kryscia Ramírez Benavides Problemas de Navegación de los Robots Dónde estoy?. Dónde he estado? Mapa de decisiones. A dónde voy? Planificación de misiones. Cuál es la mejor manera de llegar? Planificación
1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2.
1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2. GENERALIDADES SOBRE LAS TÉCNICAS DE INVESTIGACIÓN SOCIAL Y DE MERCADOS
Curso de Excel CURSO DE
CURSO DE EXCEL Curso de Excel LECCIÓN 1 INTRODUCCIÓN 3 LA PANTALLA PRINCIPAL 3 LOS MENÚS DE EXCEL 4 CONCEPTOS BÁSICOS 4 DESPLAZAMIENTO POR LA HOJA 5 SELECCIÓN DE CELDAS 6 ESCRIBIR TEXTO 6 MODIFICAR Y BORRAR
Dr. Richard Mercado Rivera 18 de agosto de 2012 Matemática Elemental
Universidad de Puerto Rico Recinto de Aguadilla Programa CeCiMat Elemental Definición de conceptos fundamentales de la Estadística y la Probabilidad y su aportación al mundo moderno Dr. Richard Mercado
Métodos Numéricos. Carrera: BQM Participantes. Representantes de las academias de Ingeniería Bioquímica. Academia de Ingeniería
1.- DATOS DE LA ASIGNATURA Nombre de la asignatura: Carrera: Clave de la asignatura: Horas teoría-horas práctica-créditos Métodos Numéricos Ingeniería Bioquímica BQM - 0524 3-2-8 2.- HISTORIA DEL PROGRAMA
ACCESS XP. Objetivos. Duración. 64 horas. Contenidos. Módulo 1: Introducción. Parte 1 Bienvenida Certificado MOUS Resumen
ACCESS XP Objetivos Aprender todas las funciones del programa Access XP para la gestión de Bases de Datos. Conocer la terminología del programa y los elementos que se utilizan en la aplicación Trabajar
Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO
Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO 2 Objetivo El objetivo principal de las técnicas de clasificación supervisada es obtener un modelo clasificatorio válido para permitir tratar
IBM SPSS Data Preparation
IBM SPSS Statistics 19 IBM SPSS Data Preparation Mejore la preparación de los datos para obtener resultados más precisos Funciones destacadas Identificar valores de datos, variables y casos sospechosos
Especialidades en GII-TI
Especialidades en GII-TI José Luis Ruiz Reina (coordinador) Escuela Técnica Superior de Ingeniería Informática Mayo 2014 Qué especialidades tiene la Ingeniería Informática? Según las asociaciones científicas
Wialon Logistics. La nueva solución de gestión de pedidos
Wialon Logistics La nueva solución de gestión de pedidos Un solo servicio para la oficina y en terreno Despachadores y empleados móviles unidos con un servicio universal de control sobre todas las etapas
MANUAL DE USO PROGRAMA SENSIBAR
MANUAL DE USO PROGRAMA SENSIBAR ANALSIS DE SENSIBILIDAD Y SIMULACION DE MONTECARLO JOSE FUENTES VALDES FACEA - UNIVERSIDAD DE CONCEPCION Facultad de Economía Universidad de Concepción 1 SensiBar. ANALSIS
ESTADÍSTICA I Código: 8219
ESTADÍSTICA I Código: 8219 Departamento : Metodología Especialidad : Ciclo Básico Prelación : Sin Prelación Tipo de Asignatura : Obligatoria Teórica y Práctica Número de Créditos : 3 Número de horas semanales
MEDIDAS DE CENTRALIZACIÓN, POSICIÓN Y DISPERSIÓN. Matemáticas PAI 5 (4ºESO)
CENTRALIZACIÓN, POSICIÓN Y DISPERSIÓN Matemáticas PAI 5 (4ºESO) Ejercicio 2 Actividad de aula 3 Medidas estadísticas Recupera la tabla de frecuencias que realizaste en el ejercicio 2 de la actividad de
Estadística Inferencial. Estadística Descriptiva
INTRODUCCIÓN Estadística: Ciencia que trata sobre la teoría y aplicación de métodos para coleccionar, representar, resumir y analizar datos, así como realizar inferencias a partir de ellos. Recogida y
SVM: Máquinas de Vectores Soporte. Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid
SVM: Máquinas de Vectores Soporte Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid Contenido 1. Clasificación lineal con modelos lineales 2. Regresión
FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- BLOQUE ESTADÍSTICA: ESTADÍSTICA VARIABLE UNIDIMENSIONAL. Estadística variable unidimensional
FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- Estadística variable unidimensional 1. Conceptos de Estadística 2. Distribución de frecuencias 2.1. Tablas de valores con variables continuas 3. Parámetros
PROGRAMACIÓN DE LOS CONTENIDOS DE MATEMÁTICAS EN LA PREPARACIÓN DE LA PARTE COMÚN DE LA PRUEBA DE ACCESO A LOS C.F.G.S. (Opción C)
PROGRAMACIÓN DE LOS CONTENIDOS DE MATEMÁTICAS EN LA PREPARACIÓN DE LA PARTE COMÚN DE LA PRUEBA DE ACCESO A LOS C.F.G.S. (Opción C) I.E.S. Universidad Laboral de Málaga Curso 2015/2016 PROGRAMACIÓN DE LA
Grupo de investigación en Minería de Datos http://mida.usal.es
Departamento de Informática y Automática Postgrado en Informática y Automática MÁSTER EN SISTEMAS INTELIGENTES ASIGNATURAS Introducción a la Minería de Datos Minería Web María N. Moreno García http://avellano.usal.es/~mmoreno
Desambigüación del sentido de las palabras (WSD)
Desambigüación del sentido de las palabras (WSD) Miguel A. Alonso Departamento de Computación, Facultad de Informática, Universidade da Coruña 1 / 18 Índice 1 Introducción 2 Evaluación 3 Enfoques basados
Porqué analizar imágenes?
Porqué analizar imágenes? Medidas que requieren estudiar un número demasiado elevado de imágenes. Análisis cuantitativo: La visión humana no cuantifica por si sola. El análisis automático es más repetitivo
El ejemplo: Una encuesta de opinión
El ejemplo: Una encuesta de opinión Objetivos Lo más importante a la hora de planificar una encuesta es fijar los objetivos que queremos lograr. Se tiene un cuestionario ya diseñado y se desean analizar
PRÁCTICA DE CHATTER SUPERVISIÓN AUTOMÁTICA DE PROCESOS
PRÁCTICA DE CHATTER SUPERVISIÓN AUTOMÁTICA DE PROCESOS Desarrollar un sistema capaz de supervisar un proceso y en caso necesario, intervenir para corregirlo si su evolución no es aceptable. Es necesario
1. Introducción 2. Esquema básico 3. Codificación 4. Evaluación 5. Selección 6. Operadores 7. Ejemplo. Algoritmos genéticos
1. Introducción 2. Esquema básico 3. Codificación 4. Evaluación 5. Selección 6. Operadores 7. Ejemplo Algoritmos genéticos Introducción Propuestos por Holland, mediados 70, computación evolutiva Popularizados
Tema 15: Combinación de clasificadores
Tema 15: Combinación de clasificadores p. 1/21 Tema 15: Combinación de clasificadores Abdelmalik Moujahid, Iñaki Inza, Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial
I. Estadística Descriptiva de una variable
I. Estadística Descriptiva de una variable Objetivo: Organizar un conjunto de datos para extraer el máximo posible de información Herramientas: A. Estadísticos: Media, Varianza, moda, etc B. Representaciones
MINERIA DE DATOS Y Descubrimiento del Conocimiento
MINERIA DE DATOS Y Descubrimiento del Conocimiento UNA APLICACIÓN EN DATOS AGROPECUARIOS INTA EEA Corrientes Maximiliano Silva La información Herramienta estratégica para el desarrollo de: Sociedad de
MICROSOFT OFFICE 2010
MICROSOFT OFFICE 2010 DURACION: 50 HORAS OBJETIVOS: o OBJETIVO GENERAL: Capacitar al alumno para el perfecto manejo de los principales programas que componen Microsoft Office 2010, así como el manejo de
Buenas Prácticas en Bases de Datos. María del Pilar Angeles. Posgrado de la Facultad de Ingeniería, UNAM. [email protected].
Buenas Prácticas en Bases de Datos María del Pilar Angeles. Posgrado de la Facultad de Ingeniería, UNAM. [email protected] Algunos Tópicos de Base de Datos Modelado y Diseño Programación
ANÁLISIS CUANTITATIVO DE DATOS EN CIENCIAS SOCIALES CON EL SPSS (I)
ANÁLISIS CUANTITATIVO DE DATOS EN CIENCIAS SOCIALES CON EL SPSS (I) Modalidad: Semipresencial Inicio del curso: 12 de junio de 2012 Sesiones presenciales: 12 y 13 de junio (de 17 a 20 hrs.). Lugar: Ala
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO. Facultad de Medicina Veterinaria y Zootecnia. Licenciatura en Medicina Veterinaria y Zootecnia
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO Facultad de Medicina Veterinaria y Zootecnia Licenciatura en Medicina Veterinaria y Zootecnia Clave 1212 Modalidad del curso: Carácter Métodos estadísticos en medicina
Universidad Nacional Autónoma de Nicaragua UNAN-Managua. Curso de Investigación de Operaciones
Universidad Nacional Autónoma de Nicaragua UNAN-Managua Curso de Investigación de Operaciones Profesor: MSc. Julio Rito Vargas Avilés. Presentación del Programa de Investigación de Operaciones Estudiantes:
NOMBRE DEL CURSO: Excel 2010 Intermedio
NOMBRE DEL CURSO: Excel 2010 Intermedio DURACION: 15 Horas MODALIDAD: Presencial TITULACION: Al finalizar el curso el alumno recibirá un Diploma o Certificado de Aprovechamiento. AREA FORMATIVA: Informática
Operadores aritméticos: suma (+), resta (-), producto (*), cociente (/) y potencia (**).
TEMA 3 TRANSFORMACIÓN DE DATOS En ocasiones es necesario crear nuevas variables a partir de otras ya existentes o modificarlas para poder explotarlas de forma más adecuada. Esto se realiza mediante las
ÍNDICE. Introducción... Capítulo 1. El concepto de Data Mining... 1
ÍNDICE Introducción... XV Capítulo 1. El concepto de Data Mining... 1 Introducción... 1 Una definición de Data Mining... 3 El proceso de Data Mining... 6 Selección de objetivos... 8 La preparación de los
Ricardo Aler Mur CLASIFICADORES KNN-I
Ricardo Aler Mur CLASIFICADORES KNN-I En esta clase se habla del aprendizaje de modelos de clasificación y regresión basados en instancias o ejemplares. En concreto: Se define la clasificación y regresión
Generación de Variables Aleatorias. UCR ECCI CI-1453 Investigación de Operaciones Prof. M.Sc. Kryscia Daviana Ramírez Benavides
Generación de Variables Aleatorias UCR ECCI CI-453 Investigación de Operaciones Prof. M.Sc. Kryscia Daviana Ramírez Benavides Introducción Las variables aleatorias se representan por medio de distribuciones
EPB 603 Sistemas del Conocimiento!"#$ %& $ %'
Metodología para el Desarrollo de Proyectos en Minería de Datos CRISP-DM EPB 603 Sistemas del Conocimiento!"#$ %& $ %' Modelos de proceso para proyectos de Data Mining (DM) Son diversos los modelos de
EMPRESA PRODUCTORA EMPRESA COMERCIAL EMPRESA DE SERVICIOS INMOVILIZADO EXISTENCIAS VALORACIÓN EXISTENCIAS EFICIENCIA
UNIDAD 3. EL PLAN DE OPERACIONES PLAN OPERACIONES CONCEPTO EMPRESA PRODUCTORA EMPRESA COMERCIAL EMPRESA DE SERVICIOS INVERSIONES APROVISIONAMIENTO INMOVILIZADO EXISTENCIAS VALORACIÓN EXISTENCIAS CICLO
Trabajo de Estadística 3º ESO
Pasos para realizar el trabajo Trabajo de Estadística 3º ESO 1º Organizarse en grupos de 2-3 personas 2º Elegir el problema a estudiar: Variable estadística cuantitativa discreta 3º Determinar la Población
Estadística Descriptiva
M. en C. Juan Carlos Gutiérrez Matus Instituto Politécnico Nacional 2004 IPN UPIICSA c 2004 Juan C. Gutiérrez Matus Desde la segunda mitad del siglo anterior, el milagro industrial sucedido en Japón, hizo
SISTEMA INTEGRAL PARA LA PROYECCIÓN Y DETECCIÓN DE LA PREVENCIÓN DEL DELITO, MEDIANTE MINERÍA DE DATOS.
SISTEMA INTEGRAL PARA LA PROYECCIÓN Y DETECCIÓN DE LA PREVENCIÓN DEL DELITO, MEDIANTE MINERÍA DE DATOS. MTIE. Erik Guerrero Bravo. Universidad Tecnológica Tula - Tepeji. Introducción Sistemas Transaccionales
CM0244. Suficientable
IDENTIFICACIÓN NOMBRE ESCUELA ESCUELA DE CIENCIAS NOMBRE DEPARTAMENTO Ciencias Matemáticas ÁREA DE CONOCIMIENTO MATEMATICAS, ESTADISTICA Y AFINES NOMBRE ASIGNATURA EN ESPAÑOL ESTADÍSTICA GENERAL NOMBRE
