Seminario-Taller Ciencia de Datos con Python
|
|
|
- Juan Coronel Zúñiga
- hace 7 años
- Vistas:
Transcripción
1 Seminario-Taller Ciencia de Datos con Python
2 Tutor: El seminario-taller será impartido por el Dr. Oldemar Rodriguez Rojas. El Dr. Rodríguez realizó sus estudios doctorales en la Universidad de París IX Dauphine, Francia y un Posdoctorado en Ciencias de Datos de la Universidad de Stanford California. Es Catedrático de la Universidad de Costa Rica y Director de Formación de PROMiDAT. Premio Nacional de Ciencia y Tecnología Clodomiro Picado Twight en el año Por sus trabajos y patentes en modelos predictivos simbólicos para predecir fraudes en tarjetas de crédito recibió la condecoración de la Medalla de Oro para el Inventor Destacado del año 2004 por la Organización Mundial de Propiedad Intelectual (OMPI) con sede en Ginebra Suiza. Duración: 8 horas. Descripción: En este seminario-taller se estudiará en primera instancia a Python como un Lenguaje de Programación Funcional y Orientado a Objetos. Luego se estudiarán en detalle la implementación de Métodos Exploratorios y de Clustering (Aprendizaje no Supervisado) en Python, métodos como Análisis en Componentes Principales, Agrupación Jerárquica y k-medias serán estudiados. También se estudiarán en detalle la implementación de métodos Métodos Predictivos y de Regresión (Aprendizaje Supervisado) en Python, métodos como los K vecinos más cercanos, el Método de Bayes, Análisis Discriminante Lineal y Cuadrático, Máquinas Vectoriales de Soporte, Árboles de Decisión, Bosques Aleatorios (Random Forest) y Métodos de Potenciación (Boosting) 2 PROMIDAT
3 Objetivos: El estudiante será capaz de: 1. Programar en Lenguaje Python con una filosofía Funcional y conocer la perspectiva Orientada a Objetos del lenguaje Python. 2. Utilizar Python para generar modelos exploratorios (aprendizaje no supervizado). 3. Utilizar Python para generar modelos predictivos (aprendizaje supervizado). 4. Analizar tablas de datos reales utilizando scrips propios y paquetes especializados de Python. Metodología: Basado en la teoría y en la aplicación directa de los conceptos aprendidos. Para esto se dispondrán de las siguientes herramientas. Cuatro sesiones de 2 horas cada una. Aula virtual en Moodle en donde podrá bajar todos los materiales, códigos y datos usados en el seminario-taller; también podrá ver en el aula virtual vídeos de apoyo con los temas tratados en el seminario-taller. Contenido: 1. Sesión Número 1: Python como Lenguaje de Programación (9am a 11am) a. Python 2 versus Python 3 b. Instalando Anaconda, Spyder, Scikit-Learn, NumPy, SciPy, IPython, Jupiter, Matplotlib, Pandas y Sympy. c. Variables y tipos de datos d. Listas y Diccionarios en Python e. Sentencias de control tipo if f. Ciclos tipo While g. Funciones en Python h. Diseño de programas Orientados a Objetos en Python PROMIDAT 3
4 2. Sesión Número 2: Python en Análisis de Datos Exploratorio y Aprendizaje NO Supervisado (11am a 12m y de 1pm a 2pm) a. Uso de NumPy b. Manipulación de Datos con Pandas c. Visualización de Datos con Matplotlib d. Introducción a Scikit-Learn e. Análisis en Componentes Principales f. Clustering Jerárquico g. El método de K-medias 3. Sesión Número 3: Python en Aprendizaje Supervisado (2:30pm a 4:30pm) a. Matriz de confusión y medición de la calidad de un modelo predictivo b. El método de los K vecinos más cercanos c. Método de Bayes d. Análisis Discriminante Lineal y Cuadrático e. Máquinas Vectoriales de Soporte 4. Sesión Número 4: Python en Aprendizaje Supervisado (5pm a 7pm) a. Árboles de Decisión b. Bosques Aleatorios (Random Forest) c. Métodos de Potenciación (Boosting y XGBoosting) d. Redes Neuronales e. Validación cruzada en Scikit-Learn f. Curva ROC Bibliografía: 1. Andreas C. Müller and Sarah Guido. Introduction to Machine Learning with Python: A Guide for Data Scientists. O Reilly, 1st Edition, PROMIDAT
5 2. Dusty Phillips. Python 3 Object-oriented Programming, Second Edition. Packt Publishing Ltd, Eric Matthes. Python Crash Course A Hands-On, Project-Based introduction to Programming. No Starch Press, Inc Jake VanderPlas. Python Data Science. O Reilly, John Paul Mueller (Author) and Luca Massaron. Python for Data Science For Dummies (For Dummies (Computer/Tech)) 1st Edition, Steven F. Lott. Mastering Object-oriented Python. Packt Publishing Ltd, Python Software Foundation Python documentation. python.org. 8. Anaconda Download Anaconda Distribution Python 3.6 version. Anaconda Inc. 9. Anaconda Anaconda Documentation. Anaconda Inc. PROMIDAT 5
Ciencia de Datos con Python
Ciencia de Datos con Python Tutor: El curso será impartido por el Dr. Oldemar Rodriguez Rojas. El Dr Rodríguez realizó sus estudios doctorales en la Universidad de París IX Dauphine, Francia y un Posdoctorado
Métodos Predictivos en Minería de Datos
Métodos Predictivos en Minería de Datos Tutor: El curso será impartido por Dr. Oldemar Rodríguez graduado de la Universidad de París IX y con un postdoctorado en Minería de Datos de la Universidad de Stanford.
Métodos Predictivos en Minería de Datos
Métodos Predictivos en Minería de Datos Tutor: El curso será impartido por Dr. Oldemar Rodríguez graduado de la Universidad de París IX y con un postdoctorado de la Universidad de Stanford. Duración: Cuatro
Métodos de Regresión en Minería de Datos
Métodos de Regresión en Minería de Datos Tutor: El curso será impartido por Dr. Oldemar Rodríguez graduado de la Universidad de París IX y con un postdoctorado en Minería de Datos de la Universidad de
Programación en Lenguaje R
Programación en Lenguaje R Tutor: El curso será impartido por el Dr Oldemar Rodríguez y el Ing. Carlos Agüero. Duración: Cuatro semanas. Descripción: Este curso ofrece una introducción práctica a las técnicas
Predicción de Inventarios Series de Tiempo
Predicción de Inventarios Series de Tiempo Tutor: El curso será impartido por Dr. Oldemar Rodríguez graduado de la Universidad de París IX y con un postdoctorado en Minería de Datos de la Universidad de
Machine Learning Bases
Machine Learning Bases Programa de Estudio Machine Learning Bases Si te interesa convertirte en un experto en Inteligencia Artificial, en este curso se detallarán los conocimientos imprescindibles para
Data Science. Herramientas, lenguajes y Python
SM ke r ne l Obs e r vat ions SM e s t imat e ( MSE =1.0149) DSE - GP C M e s t imat e ( MSE =1.0507) 6 4 2 0 Herramientas, lenguajes y Python 2 0.4 0.5 AMIS 4 10 5 0 T ime 5 10 Aprendizaje de Máquinas,
Índice general. Prefacio...5
Índice general Prefacio...5 Capítulo 1 Introducción...13 1.1 Introducción...13 1.2 Los datos...19 1.3 Etapas en los procesos de big data...20 1.4 Minería de datos...21 1.5 Estructura de un proyecto de
R for Data Mining Análisis de datos, segmentación y técnicas de predicción con R. web
R for Data Mining Análisis de datos, segmentación y técnicas de predicción con R web Presentación R es el lenguaje de programación estadístico por excelencia. Se destaca por que es una las herramientas
Curso: Python for Analytics. Aprende Python orientado a la ciencia y minería de datos
1 Curso: Python for Analytics Aprende Python orientado a la ciencia y minería de datos 2 Presentación Python es un lenguaje de programación potente y fácil de aprender. Cuenta con estructuras de datos
BIG DATA SCIENCE & ANALYTICS
BIG DATA SCIENCE & ANALYTICS Enzo Roccasalva Head of Practice: Advanced Analytics & Risk CONOCIENDO A SAS +40 Años de Experiencia +75,000 Instalaciones +140 Países 1 o Empresa privada de software más grande
Programa Internacional. Programa Certificado en. Big Data
Programa Internacional Programa Certificado en Big Data A1 Introducción La revolución del Mundo Digital ha permitido que las personas encuentren un gran sinnúmero de información, en el cual el problema
Curso: Python for Analytics
1 Curso: Python for Analytics 2 Presentación Python es un lenguaje de programación potente y fácil de aprender. Cuenta con estructuras de datos eficientes, de alto nivel y un enfoque simple pero efectivo
Big Analytics: de la información al conocimiento
Programa Introducción Arquitectura/Bases de datos relacionados /Infraestructuras (AMAZON) R Introducción al análisis masivo de datos: descriptivos y visualización de Big Data Hackathon + Series Temporales
Curso: Python for Analytics
1 Curso: Python for Analytics 2 Presentación Python es un lenguaje de programación potente y fácil de aprender. Cuenta con estructuras de datos eficientes, de alto nivel y un enfoque simple pero efectivo
Buenas prácticas para la implementación de herramientas de Ciencia de Datos Leonardo Alfonso Ramos Corona Facultad de Geografía, UAEM.
Buenas prácticas para la implementación de herramientas de Ciencia de Datos Leonardo Alfonso Ramos Corona Facultad de Geografía, UAEM. Qué es la ciencia de datos? Es muy difícil encontrar una definición
Tema 2: Introducción a scikit-learn
Tema 2: Introducción a scikit-learn José Luis Ruiz Reina Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Razonamiento asistido por computador, 2017-18 Ejemplo:
Segmentación de una cartera de clientes usando aprendizaje de máquina
Inicio Segmentación de una cartera de clientes usando aprendizaje de máquina Universidad San Ignacio de Loyola I encuentro interdisciplinario de investigación desarrollo y tecnología USIL 2014 Inicio Inicio
PARA INGENIEROS. Ser ingeniero en la época del Big Data, Data Science e Internet of Things. Con la colaboración de:
PARA INGENIEROS Ser ingeniero en la época del Big Data, Data Science e Internet of Things Con la colaboración de: Ser ingeniero en la época del Big Data, Data Science e Internet of Things Todos sabemos
DIPLOMADO EN DATA MINING
DIPLOMADO EN DATA MINING DIPLOMADO EN DATA MINING Los datos que tienen relevancia para las decisiones de gestión, se están acumulando a un ritmo increíble, debido a una serie de avances tecnológicos. La
Machine Learning. Programa de Estudio.
Machine Learning Programa de Estudio Machine Learning Desarrolla tu perfil técnico en Inteligencia artificial. Introdúcete al mundo de Machine Learning.Comprende los desafíos sociales e industriales que
Aprendizaje Supervisado Máquinas Vectoriales de Soporte
Aprendizaje Supervisado Máquinas Vectoriales de Soporte Tipos de Variables 10 10 Modelo general de los métodos de Clasificación Id Reembolso Estado Civil Ingresos Anuales 1 Sí Soltero 125K No 2 No Casado
EXPERTO EN DATA SCIENCE
POSTgrado Ingeniería EXPERTO EN DATA SCIENCE Machine Learning (Aprendizaje Automático) Data Analytics Data Science RStudio Caret Storm Spark Random Forest IPython NumPy Recall F-Measure A/B Testing Active
Fundamentos de SQL para Minería de Datos
Fundamentos de SQL para Minería de Datos Tutor: El curso será impartido por M.Sc. Fabio Fernández Senior Manager Risk Reporting en Scotiabank, Toronto, Canadá. Es Máster en Matemática Aplicada de la Universidad
Clasificación de estados cerebralesusando neuroimágenes funcionales
Clasificación de estados cerebralesusando neuroimágenes funcionales Clase 2: Reconocimiento de patrones en datos de neuroimagenes Enzo Tagliazucchi ([email protected]) Primera clase: introducción
SILABO ASIGNATURA: HERRAMIENTAS DE DESARROLLO WEB
SILABO ASIGNATURA: HERRAMIENTAS DE DESARROLLO WEB I. DATOS GENERALES 1.1. Código de la Asignatura : 355 1.2. Escuela Académico Profesional : Ingeniería de Sistemas 1.3. Departamento Académico : Ingeniería
Planificaciones Algoritmos y Programación I. Docente responsable: GUARNA PABLO FRANCISCO. 1 de 6
Planificaciones 7540 - Algoritmos y Programación I Docente responsable: GUARNA PABLO FRANCISCO 1 de 6 OBJETIVOS Conocer un lenguaje de programación imperativo. Aplicar las capacidades que ofrece el lenguaje
PLAN DE ESTUDIOS
ESCUELA UNIVERSITARIA DE INGENIERÍA FACULTAD DE INGENIERÍA INDUSTRIAL CARRERA DE INGENIERÍA DE SISTEMAS 6500 PLAN DE ESTUDIOS 2017-1 PRIMER NIVEL 5111 6506 LENGUAJE Y COMUNICACIÓN I ---------------- 5
XS-41100: INTRODUCCION AL ANALISIS MULTIVARIADO PROGRAMA II SEMESTRE 2018
XS-41100: INTRODUCCION AL ANALISIS MULTIVARIADO PROGRAMA II SEMESTRE 2018 Docente: Ricardo Alvarado Barrantes. Correo electrónico: [email protected] Horario de clases: L: 1:00-4:50pm Oficina: 17 Estadística.
I PROGRAMA DE ESPECIALIZACION EN MACHINE LEARNING CON PYTHON
DE Centro de Tecnologías de Información y Comunicaciones I PROGRAMA DE ESPECIALIZACION EN MACHINE LEARNING CON PYTHON EDICIÓN DIAS DE SEMANA 20 DE NOVIEMBRE I PROGRAMA DE ESPECIALIZACION EN MACHINE LEARNING
UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS (Universidad del Perú, DECANA DE AMÉRICA)
UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS (Universidad del Perú, DECANA DE AMÉRICA) FACULTAD DE INGENIERIA DE SISTEMAS E INFORMATICA ESCUELA PROFESIONAL DE INGENIERÍA DE SOFTWARE 1. INFORMACIÓN GENERAL
Métodos Descriptivos en Minería de Datos
Métodos Descriptivos en Minería de Datos Descripción: En este curso se presentarán los principales conceptos y métodos en Minería de Datos. El énfasis principal del curso será examinar dichos métodos desde
Introducción a la Estadística para Data Science (con Python)
(con Python) 4ª edición Inicio /02/18 30 h. Presencial Madrid Bolsa de (También en empleo Barcelona) 495 Curso de Introducción a para Data 4ed. Tener nociones de estadística y soltura manejando los conceptos
Curso: R for Data Mining. Análisis de datos, segmentación y técnicas de predicción con R
1 Curso: R for Data Mining Análisis de datos, segmentación y técnicas de predicción con R 2 Presentación R es el lenguaje de programación estadístico por excelencia. Se destaca por que es una las herramientas
TABLA DE EQUIVALENCIAS DE ASIGNATURAS PLAN DE ESTUDIOS PROPUESTO PLAN DE ESTUDIOS
6500 FACULTAD DE INGENIERÍA Y ARQUITECTURA CARRERA DE INGENIERÍA DE SISTEMAS TABLA DE EQUIVALENCIAS DE ASIGNATURAS PLAN DE ESTUDIOS PROPUESTO 2018-1 PLAN DE ESTUDIOS 2017-1 PRIMER NIVEL 5111 6506 LENGUAJE
Curso: Python Introduction. programación orientada a objetos, programación imperativa y programación funcional.
1 Curso: Python Introduction programación orientada a objetos, programación imperativa y programación funcional. 2 Presentación Python es un lenguaje de programación multiparadigma. Esto significa que
Random Forests. Teoría y ejemplos. Romain Gouron. Conferencia 9, GLAM, Doble titulo Ecole Centrale de Nantes (Francia)
Teoría y ejemplos 1 1 Departamiento de Ingenería Matemática Doble titulo Ecole Centrale de Nantes (Francia) Conferencia 9, GLAM, 2016 Outline 1 Árboles de decisión Construcción 2 3 Rotation forest Gradient
