Sistemas de predicción Aprendizaje automático Data Mining & Machine Learning
|
|
|
- Juana Esperanza Nieto Marín
- hace 9 años
- Vistas:
Transcripción
1 Data Mining & Machine Learning Ibon B. Salbidegoitia 1
2 Comunicación 2
3 Comunicación 3
4 Comunicación 4
5 Almacenamiento SIZE: byte kilobyte megabyte gigabyte terabyte petabyte exabyte zettabyte yottabyte xenottabyte shilentnobyte Domegemegrottebyte (10^33) 5
6 Almacenamiento 6
7 Big Data 7
8 Big Data Quantity of global digital data exabyte exabyte exabyte exabyte 8
9 Big Data 9
10 Big Data 10
11 Data Mining Data mining es el campo de la ciencia computacional que busca patrones en grandes cantidades de datos a través de métodos como la inteligencia artificial, machine learning, estadística y sistemas de bases de datos. 11
12 Data Mining 12
13 Machine Learning Predicciones como la detección de spam, predicciones meteorológicas, detección de texto a mano alzada, errores en fabricación, detección de fraude, previsiones del sistema eléctrico, estimación de precio de una vivienda... 13
14 Machine Learning 14
15 Machine Learning 15
16 Machine Learning 16
17 Machine Learning Objetivo claro del sistema Correlation: Correlation:
18 Machine Learning Requiere conocimiento del sistema Correlation: Correlation:
19 Machine Learning 1. Linear Regression (Logistic Regression) 2. Neural Networks 3. Clustering 4. Decision tree 19
20 Linear Regression Ajuste polinómico de mínimos cuadrados. 20
21 Linear Regression Hypothesis Cost function Gradient descent 21
22 Linear Regression 22
23 Linear Regression Regularization Dataset Train: 80% Test: 20% 23
24 Linear Regression Multi-Variable 24
25 Linear Regression Ejemplo 25
26 Linear Regression Ejemplo: Paraboloide 26
27 Logistic Regression 27
28 Logistic Regression Logistic Regression 28
29 Logistic Regression Logistic Regression Order: O3 O6 O9 O12 Logistic Regression with Regularization Order: O3 O6 O9 O12 29
30 Logistic Regression Ejemplo 30
31 Linear Regression Multi-Variable Cuantos términos? Tiempo de computación? 31
32 Machine Learning 1. Linear Regression (Logistic Regression) 2. Neural Networks 3. Clustering 4. Decision tree 32
33 Neural Networks Las redes neuronales son modelos de computación de Machine Learning inspirados en el sistema nervioso de los animales. Sistemas interconectados por neuronas que computan valores de entrada y salida. 33
34 Neural Networks Capas (Layers) 34
35 Neural Networks Capas (Layers) 35
36 Neural Networks Aplicaciones Reconocimiento de patrones (face recognition, object recognition, radar systems) Sequence recognition (OCR mano alzada, gestos, código postal) Diagnóstico médico (Medical Decision Support System) Sistema financiero (HTF, fraudes) Sistemas de identificación y control (control vehículo, control de procesos, gestión de recursos) 36
37 37
38 Machine Learning 1. Linear Regression (Logistic Regression) 2. Neural Networks 3. Clustering 4. Decision tree 38
39 Clustering Los clusters son modelos computacionales que agrupan objetos de tal manera que los objetos en el mismo grupo tienen más en común que aquellos que están en otros grupos. 39
40 Clustering Aplicaciones Segmentación de mercado Análisis de redes sociales Análisis de datos científicos 40
41 Clustering k means cluster analysis 41
42 Clustering k means cluster analysis + How many clusters? 42
43 Clustering k means cluster analysis + How many clusters? - Elbow method 43
44 Clustering Ejemplo 44
45 Clustering Ejemplo 45
46 Machine Learning 1. Linear Regression (Logistic Regression) 2. Neural Networks 3. Clustering 4. Decision tree 46
47 Decision tree El árbol de decisión es un modelo de decisión basado en una estructura ramificada para predecir las posibles consecuencias en función de n condiciones. 47
48 Decision tree 48
49 Decision tree 49
50 Consciente de... No es una ciencia exacta 50
51 Consciente de... Requiere conocimiento del sistema Correlation: Correlation:
52 Industria acero 52
53 Industria acero Fabricación planchas de acero 53
54 Industria acero Fabricación planchas de acero Qué fuerza es necesaria para una reducción del espesor? Parámetros (Atributos): Espesor Temperatura Diámetro rodillo Composición química Velocidad de rodillo 54
55 Industria acero Fabricación planchas de acero 55
56 Industria acero Fabricación planchas de acero 56
57 Meteo for Energy Detección de nubosidad (Gemasolar, Torresol Energy) 57
58 Meteo for Energy Detección de nubosidad (Gemasolar) VIDEO 58
59 Correo postal 59
60 Correo postal 60
61 Correo postal 61
62 Netflix 62
63 Netflix 63
64 Netflix 64
65 Netflix Netflix Recommendation Algorithm Directs 75% of Viewership 65
66 Youtube 66
67 Youtube 67
68 Google Translate 68
69 Google Translate 69
70 Google Translate 70
71 Skype Translate 71
72 Skype Translate 72
73 73
INFORMÁTICA. Clasificación de las medidas de almacenamiento de información
INFORMÁTICA Clasificación de las medidas de almacenamiento de información Medidas de almacenamiento de información Las medidas de almacenamiento son aquellas unidades de medición que permiten determinar
INFORMÁTICA HARDWARE Y SOFTWARE
INFORMÁTICA HARDWARE Y SOFTWARE Informática: Es el conjunto de conocimientos científicos y técnicos que se encargan del tratamiento automatizado de la información, utilizando las computadoras como herramientas
Aplicaciones. Inteligencia Computacional Carrera de Ingeniería Informática
Aplicaciones Inteligencia Computacional Carrera de Ingeniería Informática Aplicaciones de IC Unidad VIII: Configuración del problema y aplicación de las técnicas de inteligencia computacional en: clasificación
Predicción de potencia en el parque eólico de Villonaco, Loja, Ecuador. Alberto Reyes y Tania Guerrero INER Ecuador
Predicción de potencia en el parque eólico de Villonaco, Loja, Ecuador Alberto Reyes y Tania Guerrero INER Ecuador INTRODUCCIÓN El comportamiento del viento presenta alto grado de aleatoriedad, incertidumbre
Analítica avanzada para la optimización del tráfico
Analítica avanzada para la optimización del tráfico Pau Agulló Kernel Analytics Barcelona, 30 de Marzo de 2017 Organizan Auspician Apoya Índice TO THE FUTURE La revolución del big data Definiciones e impacto
Maestría en Ciencia de Datos
Maestría en Ciencia de Datos José Luis Morales http://mcienciadatos.itam.mx/ Seminario Internacional: BIG DATA Para la información oficial y la toma de decisiones. INEGI 2014 sólo datos? Tablilla de Venus
UNIDADES Y ARCHIVOS. Tema 3
UNIDADES Y ARCHIVOS Tema 3 Archivos Un archivo o fichero informático es un conjunto de bits almacenado en un dispositivo. Archivos en la nube Modelo de almacenamiento de datos basado en redes. Los datos
Big Data & Machine Learning. MSc. Ing. Máximo Gurméndez Universidad de Montevideo
Big Data & Machine Learning MSc. Ing. Máximo Gurméndez Universidad de Montevideo Qué es Big Data? Qué es Machine Learning? Qué es Data Science? Ejemplo: Predecir origen de artículos QUÉ DIARIO LO ESCRIBIÓ?
Machine Learning y su Utilización en Riesgo de. Seemant Teotia Sr. Director International Analytics Equifax Inc. USA. Crédito
Machine Learning y su Utilización en Riesgo de Seemant Teotia Sr. Director International Analytics Equifax Inc. USA Crédito Principios de Machine Learning Qué es? Por qué lo usamos? Cuándo lo usamos? Ejemplos
1. DATOS e INFORMACIÓN.
TEMA 1 HARDWARE 1. DATOS e INFORMACIÓN. Datos (en informática): Información codificada, lista para ser introducida y procesada por un ordenador. Carecen de significado y sólo lo alcanzan cuando son descodificados
Aplicación de Apache Spark y su librería MLlib para el desarrollo de sistemas recomendadores
Aplicación de Apache Spark y su librería MLlib para el desarrollo de sistemas recomendadores Enrique Costa-Montenegro1, Alexander Tsybanev1, Héctor Cerezo-Costas2, Francisco Javier González-Castaño 1,
Tema 5 Jerarquía de Memoria
Tema 5 Jerarquía de Memoria Grupo ARCOS Estructura de Computadores Grado en Ingeniería Informática Universidad Carlos III de Madrid Contenidos 1. Tipos de memoria 2. Jerarquía de memoria 3. Memoria principal
BIT. Conceptos Básicos. Es la unidad mas pequeña de información y sus valores posibles son el cero y el uno.
Lenguaje Binario Toda computadora trabaja usando un sistema binario que no es otra cosa que condiciones eléctricas que representan valores verdaderos o falsos que en realidad son variaciones de voltaje.
2021: Odisea del Ciberespacio
2021: Odisea del Ciberespacio M.C. Romeo A. Sánchez López CISM CEH CISSP CCNA CCSI SCSA SCJP SCMAD ITIL MCP TOGAF Ingeniero en Seguridad Computacional Maestro en Educación Maestro en Ciencias en Sistemas
Índice general. Prefacio...5
Índice general Prefacio...5 Capítulo 1 Introducción...13 1.1 Introducción...13 1.2 Los datos...19 1.3 Etapas en los procesos de big data...20 1.4 Minería de datos...21 1.5 Estructura de un proyecto de
Analizando patrones de datos
Analizando patrones de datos SQL Server DM, Excel DM, Azure ML y R Ana María Bisbé York @ambynet http://amby.net/ Temario Introducción a Minería de datos MS Office Excel Herramientas de tabla y Minería
DEL BIG DATA AL SMART DATA. Smart Technology Forum
DEL BIG DATA AL SMART DATA Smart Technology Forum Todos hablamos de Big Data... Pero, qué significa exactamente? Smart Technology Forum Del Big Data al Smart Data Cada vez más todo lo que hacemos deja
Colegio Diocesano San José de Carolinas
Tema 1. Representación digital de la información 1. Introducción. Los ordenadores son máquinas digitales y como tales operan con información representada en formato binario. La unidad elemental de información
FORTISSIMO 2 EXPERIMENT 904: MEJORA DEL SISTEMA REMOTO
OTEAres FORTISSIMO 2 EXPERIMENT 904: MEJORA DEL SISTEMA REMOTO EXPERTO BASADO EN EL SOFTWARE OTEA innovation programme under grant agreement No 680481 (Fortissimo 2 project). Objetivos de OTEAres OTEARES
Big Analytics: de la información al conocimiento
Programa Introducción Arquitectura/Bases de datos relacionados /Infraestructuras (AMAZON) R Introducción al análisis masivo de datos: descriptivos y visualización de Big Data Hackathon + Series Temporales
Plataforma SAS SAS Viya. La Mejor Plataforma Analítica Las Mejores Soluciones Analíticas Única Plataforma Analítica Integral
Plataforma SAS SAS Viya La Mejor Plataforma Analítica Las Mejores Soluciones Analíticas Única Plataforma Analítica Integral SAS desde 2004: SAS 9 Qué nos pedía el mercado? (o sea Uds.) PLATAFORMA SAS HERRAMIENTAS
Big Data Los seres humanos estamos creando y almacenando información constantemente y cada vez más en cantidades astronómicas. Se podría decir que si
Big Data Big Data Los seres humanos estamos creando y almacenando información constantemente y cada vez más en cantidades astronómicas. Se podría decir que si todos los bits y bytes de datos del último
REGRESIÓN LINEAL Y CORRELACIÓN
UNIVERSIDAD AUTÓNOMA DEL ESTADO DE HIDALGO ESCUELA SUPERIOR DE HUEJUTLA LICENCIATURA EN ADMINISTRACIÓN REGRESIÓN LINEAL Y CORRELACIÓN MTRA. ROXANA SIFUENTES CARRILLO JULIO-DICIEMBRE 017 LINEAR REGRESSION
DIPLOMADO EN DATA MINING
DIPLOMADO EN DATA MINING DIPLOMADO EN DATA MINING Los datos que tienen relevancia para las decisiones de gestión, se están acumulando a un ritmo increíble, debido a una serie de avances tecnológicos. La
Sistema Binario. Pedro Chávez Lugo webpage:http://lsc.fie.umich.mx/ pedro. 23 de junio de 2013
mailto:[email protected] webpage:http://lsc.fie.umich.mx/ pedro 23 de junio de 2013 1 Sistema Numérico Binario Conversión Binario Octal Conversión Binario Hexadecimal 2 3 Sistema Numérico Binario Conversión
Unidades de medida en Informática. Un repaso de las unidades de medida en la informática que utilizamos a diario
Un repaso de las unidades de medida en la informática que utilizamos a diario Las unidades de medida en a veces pueden resultar algo confusas. Vamos a tratar de aclarar algunos conceptos viendo a qué se
Temario. Informática IE. Computadora. Computadora. Computadora. Informática IE Conceptos básicos de computadoras: Hardware
Informática IE Conceptos básicos de computadoras: Qué es una computadora? : periféricos de entrada / salida Almacenamiento Dr. Diego R. Garcia Depto. de Ciencias e Ingeniería de la Computación Universidad
2 Año EMP Administración
2 Año EMP Administración Nivelación de Conocimientos Docente Andrea Diego Fuente: Dr. Luciano H. Tamargo http://cs.uns.edu.ar- Universidad Nacional del Sur Qué es una computadora? Hardware Hardware: periféricos
ANALÍTICA DE BIG DATA (BDA)
ANALÍTICA DE BIG DATA (BDA) Tendencias Retos Oportunidades Fabián García Nocetti IIMAS-UNAM CAACFMI-UNAM AMIAC Ciencia de Datos y Big Data Analítica de Big Data (BDA) Aplicaciones Arquitectura General
Inteligencia de Negocios: Herramientas y Trascendencia
Inteligencia de Negocios: Herramientas y Trascendencia Ing. Fernando Arce II Congreso de Ingeniería e Informática Facultad de Ciencias e Ingeniería de la PUCP Octubre 2015 Temario La Importancia de BI
Científico de datos o data scientist
Científico de datos o data scientist La demanda de científicos de datos se ha incrementado de manera constante en los últimos años, existe en el mercado una amplia oferta para los científicos de datos.
APLICACIONES DE NEGOCIO PARA INTELIGENCIA ARTIFICIAL. Copyright 2017 Accenture All rights reserved.
APLICACIONES DE NEGOCIO PARA INTELIGENCIA ARTIFICIAL AGENDA 01 QUÉ ES? 05 LECCIONES DE NEGOCIO 02 ÁREAS DE INVESTIGACIÓN 03 APLICACIONES 04 EJEMPLOS DE NEGOCIO 01. QUÉ ES?. TIPOS DE INTELIGENCIA Lingüística
Predictor Basado en Prototipos Difusos y Clasificación Nosupervisada
Predictor Basado en Prototipos Difusos y Clasificación Nosupervisada JIISIC-CEIS'2015 Aníbal Vásquez, Enrique Peláez y Xavier Ochoa anibal.vasquez @cti.espol.edu.ec, [email protected], [email protected]
Big Data, qué es y su impacto en las áreas de Riesgo y Crédito. Augusto Umaña Ruiz. Banco Davivienda. Gerente de Inteligencia de Negocios
Big Data, qué es y su impacto en las áreas de Riesgo y Crédito Augusto Umaña Ruiz Banco Davivienda Gerente de Inteligencia de Negocios [email protected] Qué es Big Data Viejo Problema. Nuevas Soluciones
Smart Sound Processing for the digital living: Smart COmpuTing. SSPressing Scot. Universidad de Oviedo (UOVI) Parte II: Deep Computing
Smart Sound Processing for the digital living: Smart COmpuTing SSPressing Scot Universidad de Oviedo (UOVI) Parte II: Deep Computing Febrero 3, 2017 Valencia SSPressing Scot Deep Computing MOTIVACIÓN Intensidad
Qué son y qué papel juegan estas tecnologías en la era de la revolución digital? Inteligencia Artificial (AI) Machine Learning & Cognitive Computing
Qué son y qué papel juegan estas tecnologías en la era de la revolución digital? Inteligencia Artificial (AI) Machine Learning & Cognitive Computing Javier Alexander Rengifo, MSc. Javier Alexander Rengifo,
Ingeniería del conocimiento. Sesión 1 Por qué estudiar aprendizaje automático?
Ingeniería del conocimiento Sesión 1 Por qué estudiar aprendizaje automático? 1 Agenda Qué vamos a ver en la asignatura? Para qué sirve todo esto? Cómo aprobar la asignatura? 2 Extracción del conocimiento
Introducción a la Operación de Computadoras Personales
Introducción a la Operación de Computadoras Personales Conceptos básicos de computadoras: Hardware Depto. de Ciencias e Ingeniería de la Computación Universidad Nacional del Sur Bahía Blanca Temario Qué
CURSO/GUÍA PRÁCTICA DEL BIG DATA INMOBILIARIO
SISTEMA EDUCATIVO inmoley.com DE FORMACIÓN CONTINUA PARA PROFESIONALES INMOBILIARIOS. CURSO/GUÍA PRÁCTICA DEL BIG DATA INMOBILIARIO Gestión empresarial de la información. Business Intelligence. Data Mining.
Aprendizaje Automatizado. Redes Neuronales Artificiales
Aprendizaje Automatizado Redes Neuronales Artificiales Introducción Otra forma de emular características propias de los humanos: memorizar y asociar hechos. Se aprende de la experiencia. El cerebro humano
NOMBRE CÓDIGO - CATEGORIZACIÓN
1 NOMBRE CÓDIGO - CATEGORIZACIÓN Kiara Lucas Herrera 1 1 Carrera de Ingeniería en Sistemas Computacionales Universidad de Guayaquil diferentes cluster de productos de la página de Amazon, llegando al resultado
Técnicas de inteligencia computacional en predicción de viento en parques eólicos y problemas relacionados
Técnicas de inteligencia computacional en predicción de viento en parques eólicos y problemas relacionados Sancho Salcedo Sanz Grupo de Heurísticos Modernos de Optimización y Diseño de Redes () Departamento
BIG DATA SCIENCE & ANALYTICS
BIG DATA SCIENCE & ANALYTICS Enzo Roccasalva Head of Practice: Advanced Analytics & Risk CONOCIENDO A SAS +40 Años de Experiencia +75,000 Instalaciones +140 Países 1 o Empresa privada de software más grande
Deep Learning para el Reconocimiento de Texto Manuscrito. Trabajo Fin de Grado
Deep Learning para el Reconocimiento de Texto Manuscrito Trabajo Fin de Grado Quién es este chiquillo? Índice Reconocimiento de Caracteres Motivación Reconocimiento Óptico de Caracteres (OCR) Caracteres
HOJA DE VIDA DE ROBERTO CRUZ RODES
HOJA DE VIDA DE ROBERTO CRUZ RODES FORMACIÓN 1996 2000 Doctorado en Ciencias Matemáticas. Instituto de Cibernetica Matemática y Física, ICIMAF, Cuba, Año de obtención: 2000 1981 1986 Pregrado/Universitario
Wind power forecasting for the Villonaco wind farm using AI techniques
Wind power forecasting for the Villonaco wind farm using AI techniques A. Reyes 1, P. H. Ibargüengoytia 1, J. Diego Jijón 2, Tania Guerrero 2, Uriel García 1, and M. Borunda 3 1. Instituto Nacional de
Minería Multimedia. Minería de datos NO estructurados (Textos, Imágenes, Audios y Videos)
Minería Multimedia Minería de datos NO estructurados (Tetos, Imágenes, Audios y Videos) Ana Isabel Oviedo Docente Universidad Pontificia Bolivariana [email protected] Medellín, octubre 19 de 2017 Motivación
Tema 1 Fundamentos de Computación
Tema 1 Fundamentos de Computación Clase 2 Prof. María Alejandra Quintero Asignatura: Informática Escuela de Ingeniería Forestal Puntos a tratar Continuación hardware Memoria principal Dispositivos de almacenamiento
Para conectarse a Internet solo se requiere un equipo de cómputo, una línea de trasmisión, un proveedor de acceso a Internet y un navegador.
Qué necesita un Usuario para conectarse a Internet? Para conectarse a Internet solo se requiere un equipo de cómputo, una línea de trasmisión, un proveedor de acceso a Internet y un navegador. Red de Computadoras
Introducción a la minería de datos
Introducción a la minería de datos 1 Temario Qué es minería de datos? Quién usa minería de datos? Por qué de la minería de datos? Ciclo virtuoso de la minería de datos 2 Definición de minería de datos
Como SAS está apalancando las nuevas tecnologías. Copyright 2014, SAS Institute Inc. All rights reserved.
Como SAS está apalancando las nuevas tecnologías BIG DATA ANALYTICS Es el volumen o la complejidad de datos que te saca de tu zona de confort VOLUMEN VARIEDAD VELOCIDAD VALOR COMPLEJIDAD Definición Tradicional
Herramientas para Mineria de Datos Masivos(Big Data)
Herramientas para Mineria de Datos Masivos(Big Data) Dr. Edgar Acuna Departamento de Ciencias Mathematicas y Programa Doctoral en Ciencias e Ingenieria de la Informacion y Computacion Universidad de Puerto
MOMENTO I. BLOQUE 1. Opera las funciones básicas del sistema operativo y garantiza la seguridad de la información
MOMENTO I. BLOQUE 1. Opera las funciones básicas del sistema operativo y garantiza la seguridad de la información Objetos de aprendizaje: Computadora LECTURA 1: La computadora La computadora Es una máquina
Seminario de Informática. UNIDAD 1: Introducción a la Informática
Seminario de Informática UNIDAD 1: Introducción a la Informática 2016 Programa UNIDAD 1: Introducción a la Informática 1.Informática: Elementos de un sistema Informático. 2.Soporte Físico (HARDWARE): conceptos,
Luis Felipe Duque Álvarez. Estudiante de Ingeniería Electrónica. Grupo de Política y Gestión Tecnológica. Universidad Pontificia Bolivariana Medellín.
Bogotá 15 y 16 de Agosto de 2008 EXTRACCIÓN DE PATRONES DE LA ENCUESTA ANUAL MANUFACTURERA COLOMBIANA EMPLEANDO INTELIGENCIA ARTIFICIAL Luis Felipe Duque Álvarez. Estudiante de Ingeniería Electrónica.
Implantación de Sistemas Operativos 1º ASIR
Sistemas de Numeración Sistema decimal El sistema de numeración que utilizamos es el decimal, que se compone de diez símbolos o dígitos a los que otorga un valor dependiendo de la posición que ocupen en
1. La importancia de la Informática
Introducción Contenidos 1. La importancia de la informática 2. Conceptos básicos y definiciones 3. Unidades de medida de la información 4. Componentes físicos y lógicos del ordenador 5. Evolución de los
Base Trabajo Practico BIG DATA
Base Trabajo Practico BIG DATA Facultad de Sociales 1 BIG DATA Trabajo Practico 1. Leer el material de clase y ver los videos conforme el orden sugerido de la presentación siguiente 1. Registrarse e ingresar
Técnicas de aprendizaje automático en el análisis de datos de DP. Dr. Carlos Fernández Lozano Juan de la Cierva-Formación
Técnicas de aprendizaje automático en el análisis de datos de DP Dr. Carlos Fernández Lozano Juan de la Cierva-Formación [email protected] Índice Acerca de mí Big data? Medicina de precisión? Integración
Big data, clima y meteorología
Big data, clima y meteorología Leopoldo Carro Calvo Ricardo García Herrera Natalia Calvo Fernández David Barriopedro Cepero Carlos Ordóñez García Facultad de Ciencias Físicas Big Data Características del
