Precisión del Modelo

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Precisión del Modelo"

Transcripción

1 Precisión del Modelo Gráficas, estadística y minería de datos con python Miguel Cárdenas Montes Centro de Investigaciones Energéticas Medioambientales y Tecnológicas, Madrid, Spain miguel.cardenas@ciemat.es 6-10 de Octubre de 2014 M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

2 Tabla de Contenidos 1 Objetivos 2 Introducción 3 Precisión en Clasificadores 4 Precisión en Regresión 5 Holdout Method 6 Cross-validation 7 Bootstrap 8 Bagging 9 ROC 10 No Free Lunch Theorem 11 Sobreajuste M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

3 Objetivos Conocer las herramientas para medir la calidad de los modelos en aprendizaje supervisado. Aspectos Técnicos scikit-learn API Matriz de Confusión. Método de Retención Validación Cruzada Bootstrap M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

4 Introducción M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

5 Introducción Las técnicas de validación tienen dos motivaciones fundamentales: Casi todas las técnicas tienen parámetros libres, por ejemplo el número de vecinos en KNN, lo cuales se desean ajustar de forma que maximicen la precisión. Se desea conocer la precisión del modelo de cara a la clasificación de datos en el futuro. Además, cuando se dispone de un conjunto de datos y varios métodos para clasificarlos es lógico querer saber la precisión que ofrece cada método. M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

6 Introducción Si se dispusiera de un conjunto ilimitado de datos, muchas de las cuestiones que se tratarán en esta presentación no tendrían sentido. Sin embargo, el caso suele ser justo el opuesto: un número finito y normalmente más pequeño de lo deseado. Un problema a tener en cuenta es, que para un número finito de datos, el modelo suele sobreajustarse a éstos. M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

7 Propuesta % de los datos para el conjunto de entrenamiento. 20% de los datos para el conjunto de validación, para el ajuste de los parámetros del algoritmo. 20% de los datos para el conjunto de test. Este es el valor del error generalizado! M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

8 Propuesta % de los datos para el conjunto de entrenamiento. Con esto entrenaremos el algoritmo: kmeans, knn, svm, etc, con diferentes configuraciones. Por ejemplo, knn con 3, 5, 7,... vecinos. 20% de los datos para el conjunto de validación, para el ajuste de los parámetros del algoritmo. Se evalúa este conjunto de datos con los datos anteriormente entrenados: knn con 3, 5, 7, etc. El mínimo obtenido marca la mejor configuración del algoritmo. 20% de los datos para el conjunto de test. Este es el valor del error generalizado! Sobre el algoritmo anterior, con la mejor configuración obtenida anteriormente (por ejemplo knn con 5 vecinos), se evalúa este conjunto de datos, lo cual marcará el error generalizado del modelo. M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

9 Precisión en Clasificadores M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

10 Medida de Precisión de Clasificador I El uso de los datos de entrenamiento para simultáneamante derivar un clasificador y a la vez estimar la precisión del modelo de aprendizaje conduce a la obtención de valores muy optimistas de este valor. La precisión del modelo puede ser definida como el porcentaje de tuplas clasificadas correctamente. También se puede hablar del ratio de error o de malas clasificaciones. M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

11 Medida de Precisión de Clasificador II Gran parte de las técnicas de este capítulo pueden ser también aplicadas a la medida de la calidad de ajustes mediante algoritmos evolutivos. Esto las dota de una alcance más allá de la minería de datos. Otro factor a tener encuenta en las medidas de error es el tiempo que requieren para su cálculo. M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

12 Matriz de Confusión I La matriz de confusión resume cuatro casos: Verdadero positivo: caso positivo etiquetados como positivo. Verdadero negativo: caso negativo etiquetados como negativo. Falso positivo: caso negativo etiquetado como positivo. Falso negativo: caso positivo etiquetado como negativo. Partiendo de estos casos, se puede hacer una estadística más elaborada. Clas. Verdadero Clas. Falso Verdadero verdaderos positivos falsos negativos Falso falsos positivos verdaderos negativos M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

13 Matriz de Confusión II Se denomina sensitivity o recall al cociente entre los verdaderos positivos y el total de positivos. También se denomina recognition. Clas. Verdadero Clas. Falso Verdadero verdaderos positivos falsos negativos Falso falsos positivos verdaderos negativos sensitivity = truepositive totalpositive M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

14 Matriz de Confusión III Se denomina specificity al cociente entre los verdaderos negativos y el total de negativos. Clas. Verdadero Clas. Falso Verdadero verdaderos positivos falsos negativos Falso falsos positivos verdaderos negativos specificity = truenegative totalnegative M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

15 Matriz de Confusión IV Se denomina precision al cociente entre los verdaderos positivos y la suma de los verdaderos positivos y los falsos positivos. Clas. Verdadero Clas. Falso Verdadero verdaderos positivo falsos negativo Falso falsos positivo verdaderos negativo precision = verdadero positivo verdadero positivo+falso positivo M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

16 Matriz de Confusión V La matriz de confusión ideal para M positivos y N negativos es: Clas. Verdadero Clas. Falso Verdadero M 0 Falso 0 N M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

17 Matriz de Confusión VI 1000 positivos en la muestra. 100 negativos en la muestra. Clas. Verdadero Clas. Falso 995 V = 99.50% sensitivity 80 F = 80.00% specificity = 98.03% precision M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

18 Accuracy I Una medida adicional de la precisión es el concepto de accuracy: accuracy = sensitivity Aplicado al caso anterior: pos pos +neg + specificity neg pos +neg accuracy = = M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

19 Matriz de Confusión VII Debilidades No existen sugerencias sobre la división de un conjunto único de datos: una parte se asigna al conjunto de entrenamiento y el resto al conjunto de test. La medida es única y tiene tratamiento estadístico. Pierde utilidad con datos desbalanceados. M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

20 Matriz de Confusión VIII Para M clases, la matriz de confusión tendría M M dimensiones. La diagonal serían los verdaderos, y el resto las clasificaciones erróneas. M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

21 Matriz de Confusión: Ejemplo import random import numpy as np from sklearn import svm from sklearn.metrics import confusion_matrix # training set X = np.r_[ 1,2,0, \ [25, 35, 45, 20, 35, 52, 23, 40, 60, 48, 33], \ [10, 60, 80, 20, 120, 18, 95, 62, 100, 220, 150] ] Y = np.array( [0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1]) p = range(len(x)) random.seed(0) random.shuffle(p) X, Y = X[p], Y[p] half = int(len(x) / 2) classifier = svm.svc(kernel= linear ) y_ = classifier.fit(x[:half], Y[:half]).predict(X[half:]) # Compute confusion matrix cm = confusion_matrix(y[half:], y_) print cm M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

22 Matthews Correlation Coefficient El coeficiente de correlación de Matthews es aplicable a la matriz de confusión incluso con datos desbalanceados. MCC es aplicable a clasificaciones binarias. Devuelve un valor entre -1 y 1, siendo 1 el caso de predicción perfecta, -1 el totalmente incorrecta y 0 predicción aleatoria. MCC = TP TN FP FN (TP +FP)(TP +FN)(TN +FP)(TN +FN) M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

23 Precisión en Regresión M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

24 Medida de Errores en Regresión I La función de pérdida mide el error entre el valor real, y i, y el valor predicho, y i. Error absoluto: y i y i Error cuadrático: (y i y Error absoluto medio: Error cuadrático medio: i )2 N y i y i N N (y i y i )2 N M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

25 Holdout Method Método de Retención M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

26 Holdout Method En este método, un conjunto de datos son divididos aleatoriamente en dos subconjuntos: el de entrenamiento y el de test. La proporción suele ser dos tercios (entrenamiento) a un tercio (test). El subconjunto de entrenamiento es usado para la realización del modelo, mientras que el de test es utilizado para medir su precisión. M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

27 Random Subsampling Random subsampling es una variación de Holdout Method en el cual este método es repetido K veces. La precisión global se estima como la media de los valores obtenidos. M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

28 Estratificación La estratificación es una técnica que trata de asegurar que todas las clases aparezan representadas en la muestra de test y además con proporción similar a la que tienen en los datos. Esta variación es deseable si los datos están desbalanceados: hay muchos más datos de una clase que de otra. Se puede aplicar a Holdout Method, Random subsampling, pero también a Cross-validation. M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

29 Cross-validation Validación Cruzada M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

30 K-fold cross-validation I En este método el conjunto de datos es particionado en k muestras excluyentes y de tamaño similar. La creación del modelo y su medida de error se realiza repetidamente (k veces) con k-1 muestras para la creación del modelo, y 1 muestra para la medida del error. M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

31 K-fold cross-validation II A diferencia de Holdout Method y Random subsampling, aquí cada muestra es utilizada el mismo número de veces para entrenamiento y una vez para test. La precisión estimada es el número total de clasificaciones correctas (tras las k iteraciones), dividida por el número total de tuplas. El error estimado es el número total de clasificaciones incorrectas (tras las k iteraciones), dividida por el número total de tuplas. M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

32 K-fold cross-validation III Habitualmente se usa k=10 porque los experimentos han mostrado que es una buena opción para obtener una estimación de la precisión. M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

33 Random cross-validation Este método divide aleatoriamente el conjunto de datos en subconjuntos de entrenamiento y test. Cada subconjunto es usado como en k-fold. La desventaja de este método es que algunas observaciones nunca serán seleccionadas, mientras que otras lo serán mútiples veces. M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

34 Leave-one-out cross-validation I Leave-one-out es una variación de k-fold donde k es igual al número de tuplas. Leave-one-out es computacionalmente caro. M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

35 Leave-one-out cross-validation II import numpy as np from sklearn import neighbors, datasets from sklearn.cross_validation import LeaveOneOut X = np.array([[ 25, 10], [ 35, 60], [ 45, 80], [ 20, 20], [ 35, 120], [ 52, 18], [ 23, 95], [ 40, 62], [ 60, 100], [ 48, 220], [ 33, 150] ]) Y = np.array( [0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1]) scores = list() n_neighbors = 1 loo = LeaveOneOut(len(Y)) clf = neighbors.kneighborsclassifier(n_neighbors, weights= uniform ) for train, test in loo: X_train, X_test = X[train], X[test] Y_train, Y_test = Y[train], Y[test] clf.fit(x_train, Y_train) scores.append(clf.score(x_test, Y_test)) Z= clf.predict(x_test) print Z, Y[test] print scores M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

36 Leave-one-out cross-validation III Salida: [0] [0] [1] [0] [1] [0] [0] [0] [1] [0] [0] [0] [0] [1] [0] [1] [0] [1] [1] [1] [0] [1] [1.0, 0.0, 0.0, 1.0, 0.0, 1.0, 0.0, 0.0, 0.0, 1.0, 0.0] M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

37 Bootstrap M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

38 Bootstrap I A diferencia de los anteriores métodos, en bootstrap una tupla puede ser seleccionada más de una vez para el subconjunto de entrenamiento. Bootstrap tiene diversas variantes. La más comunmente utilizada es la denominada.632 bootstrap. M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

39 Bootstrap II Si el conjunto de datos tiene d tuplas, el conjunto es muestreado d veces, pudiéndose elegirse varias veces la misma tupla. Existen ciertas tuplas que no será elegidas. Las tuplas no elegidas forman el subconjunto de test. Cada tupla tiene una probabilidad de ser elegida 1 d, y una probabilidad de no ser elegida, (1 1 d ). Para bootstrap hay que realizar d selecciones, por lo tanto, la probabilidad de no ser elegida es (1 1 d )d. Si d es grande, entonce la probabilidad de que una tupla no sea elegida para el subconjunto de entrenamiento es: e 1 = 0.368, 36.8%. Y de ser elegida es 63.2%. M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

40 Bootstrap III Intuitivamente, la muestra original se considera como la población verdadera. Cada muestra simula el proceso de muestreo desde la población verdadera. M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

41 Bootstrap III Si el proceso se repite k veces, entonces la precisión global puede ser estimada como: Acc(M) = k (0.632 Acc(M i ) testset Acc(M i ) training set ) i=1 Acc(M i ) testset es la predicción del model obtenido con la muestra bootstrap i cuando se aplica al subconjunto de test i. Acc(M i ) training set es la predicción del model obtenido con la muestra bootstrap i cuando se aplica al conjunto original de datos. M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

42 Bootstrap IV 1 Muestrear (con repetición) un subconjunto m de instancias de conjunto D, D > m. 2 Usar el subconjunto m para entrenar un modelo M. 3 Calcular el error sobre el training set, e training set. 4 Usar las tuplas restantes de D para evaluar el modelo M, y así calcular el error sobre el test set, e testset. 5 Estimar el error con la combinación lineal Acc(M i ) testset Acc(M i ) training set. 6 Promediar el error repitiendo el proceso N veces. N i error i /N. M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

43 Bootstrap V El uso de la combinación lineal Acc(M i ) testset Acc(M i ) training set intenta balancear la influencia de la estimación optimista al usar el tranning set y la estimación pesimista test set. M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

44 Bootstrap VI Debilidades Bootstrap tiene una baja varianza pero requiere muchas iteraciones para obtener una buena estimación del error. A medida que el volumen de datos crece el algoritmo se vuelve muy lento. M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

45 Bagging y Boosting M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

46 Bagging I Existen estrategias para mejorar la precisión de los modelos, tanto en clasificación como en regresión. Estos métodos se denominan ensemble methods ya que combinan los resultados de más de un modelo. Bagging (bootstrap agregation) es uno de los más populares. M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

47 Bagging II Dado un conjunto de datos D, compuesto de d tuplas, en cada iteración, i, un subconjunto de entrenamiento, D i de d tuplas es creado a partir de D usando bootstrap. Por cada subconjunto de entrenamiento, D i, se crea un modelo, M i. Para clasificar una tupla desconocida, cada modelo M i emite una predicción sobre dicha tupla, la cual cuenta como un voto. Finalmente, el clasificador bagging cuenta los votos y asigna la clase más votada a e la tupla desconocida. Para regresión, bagging puede aplicarse igualmente tomado el valor promedio de cada predicción para la tupla desconocida. M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

48 Bagging III Bagging ofrece un incremento sobre la precisión de cualquiera de los clasificadores individuales utilizados. Además es más robusto porque el modelo compuesto reduce la varianza de los clasificadores individuales. M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

49 Boosting I En la técnica denominada boosting se asignan pesos a cada tupla del conjunto de entrenamiento. A continuación se usa una serie de k clasificadores. Después de cada clasificador se incrementa el peso de las tuplas mal clasificadas. Esto permite concentrar la atención del clasificador en estas tuplas difíciles de clasificar. Boosting generará una secuencia de clasificadores, donde en cada nuevo ciclo el clasificador es un experto en clasificar algunas de la tuplas mal clasificadas de la iteración anterior. El clasificador final combina los votos de cada clasificador individual, donde el peso del voto de cada clasificador es una función de su exactitud. M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

50 AdaBoost I De todas las variantes de boosting, AdaBoost es una de las más populares. Adaboost tiene dos variantes: Seleccionar las tupas de acuerdo con las clasificaciones erróneas del clasificador anterior. Más representantes de las tuplas mal clasificadas son elegidas. Las tuplas mal clasificadas tienen un peso superior. Los pesos se incrementan o se disminuyen en función de que las tuplas se clasifiquen correctamente o erróneamente. M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

51 Boosting y Bagging I Boosting Se utiliza un único algoritmo para crear hipótesis alternativas sobre el mismo conjunto de dato. Para ello se aumenta el peso en cada iteración sobre los ejemplos que han sido clasificados erróneamente. Finalmente se combinan las distintas hipótesis. Bagging Se utiliza un único algoritmo para crear hipótesis alternativas sobre N muestras del conjunto original de datos (M tuplas). Finalmente se combinan las distintas hipótesis. M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

52 ROC M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

53 ROC I El nombre ROC deriva de Receiver Operating Characteristic. Su construcción está relacionada con la Matriz de Confusión a través del true-positive rate que se dibuja en el eje Y, y del false- positive rate que se dibuja en el eje X. true-positive rate proporción de tuplas positivas que son correctamente indentificadas. false-positive rate proporción de tuplas negativas que son incorrectamente identificadas como positivas. M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

54 ROC II El nombre ROC deriva de Receiver Operating Characteristic. Su construcción está relacionada con la Matriz de Confusión a través del true-positive rate que se dibuja en el eje Y, y del false-positive rate que se dibuja en el eje X. M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

55 ROC Ejemplo I Clasificador no excelente. V F V F TPR = = 0.6 FPR = = 0.3 TPR FPR M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

56 ROC Ejemplo II Clasificador mejorado. V F V F TPR = = 0.8 FPR = = 0.2 TPR FPR M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

57 No Free Lunch Theorem M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

58 No Free Lunch Theorem I Entre varios algoritmos de Minería de datos, cuál es el que produce el modelo más preciso? Podemos esperar que un algoritmo en particular tenga un redimiento superior a la media de un conjunto amplio de algoritmos para un grupo importante de problemas? Es decir, existe un algoritmo superior o mejor de todos los demás? M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

59 No Free Lunch Theorem II Forma 1 Todos los algoritmos que buscan el extremo de una función objetivo tienen el mismo rendimiento cuando si se promedian sobre todas las funciones de coste posibles. Forma 2 El rendimiento medio de cualquier par de algoritmos sobre todos los posibles problemas es idéntico. M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

60 Sobreajuste - Overfitting M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

61 Sobreajuste I M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

62 Sobreajuste II M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

63 Gracias Gracias Preguntas? Más preguntas? M. Cárdenas (CIEMAT) Errores 6-10 de Octubre de / 63

Aprendizaje: Boosting y Adaboost

Aprendizaje: Boosting y Adaboost Técnicas de Inteligencia Artificial Aprendizaje: Boosting y Adaboost Boosting 1 Indice Combinando clasificadores débiles Clasificadores débiles La necesidad de combinar clasificadores Bagging El algoritmo

Más detalles

Validación Cruzada (cross-validation) y Remuestreo (bootstrapping)

Validación Cruzada (cross-validation) y Remuestreo (bootstrapping) Validación Cruzada (cross-validation) y Remuestreo (bootstrapping) Padres de cross-validation y el bootstrapping Bradley Efron y Rob Tibshirani Bradley Efron Rob Tibshirani Enfoque: tabla de aprendizaje

Más detalles

Aprendizaje Automatizado

Aprendizaje Automatizado Aprendizaje Automatizado Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto

Más detalles

Tema 15: Combinación de clasificadores

Tema 15: Combinación de clasificadores Tema 15: Combinación de clasificadores p. 1/21 Tema 15: Combinación de clasificadores Abdelmalik Moujahid, Iñaki Inza, Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial

Más detalles

4.1 Análisis bivariado de asociaciones

4.1 Análisis bivariado de asociaciones 4.1 Análisis bivariado de asociaciones Los gerentes posiblemente estén interesados en el grado de asociación entre dos variables Las técnicas estadísticas adecuadas para realizar este tipo de análisis

Más detalles

Teoría de la decisión

Teoría de la decisión 1.- Un problema estadístico típico es reflejar la relación entre dos variables, a partir de una serie de Observaciones: Por ejemplo: * peso adulto altura / peso adulto k*altura * relación de la circunferencia

Más detalles

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos Agro 6998 Conferencia Introducción a los modelos estadísticos mixtos Los modelos estadísticos permiten modelar la respuesta de un estudio experimental u observacional en función de factores (tratamientos,

Más detalles

Método de cuadrados mínimos

Método de cuadrados mínimos REGRESIÓN LINEAL Gran parte del pronóstico estadístico del tiempo está basado en el procedimiento conocido como regresión lineal. Regresión lineal simple (RLS) Describe la relación lineal entre dos variables,

Más detalles

Aprendizaje basado en ejemplos.

Aprendizaje basado en ejemplos. Aprendizaje basado en ejemplos. In whitch we describe agents that can improve their behavior through diligent study of their own experiences. Porqué queremos que un agente aprenda? Si es posible un mejor

Más detalles

Distribuciones muestrales. Distribución muestral de Medias

Distribuciones muestrales. Distribución muestral de Medias Distribuciones muestrales. Distribución muestral de Medias TEORIA DEL MUESTREO Uno de los propósitos de la estadística inferencial es estimar las características poblacionales desconocidas, examinando

Más detalles

[20380] Visió per Computador Prueba 2 (2013) Teoria (10p) (una pregunta test fallada descuenta 1/4 de pregunta acertada)

[20380] Visió per Computador Prueba 2 (2013) Teoria (10p) (una pregunta test fallada descuenta 1/4 de pregunta acertada) 102784 [20380] Visió per Computador Prueba 2 (2013) Teoria (10p) (una pregunta test fallada descuenta 1/4 de pregunta acertada) 1. En cuál de estas posibles aplicaciones podríamos utilizar una característica

Más detalles

Aprendizaje Supervisado K - Vecinos más cercanos Knn-Method

Aprendizaje Supervisado K - Vecinos más cercanos Knn-Method Aprendizaje Supervisado K - Vecinos más cercanos Knn-Method 10 10 Modelo general de los métodos de Clasificación Id Reembolso Estado Civil Ingresos Anuales 1 Sí Soltero 125K No 2 No Casado 100K No 3 No

Más detalles

INDICE. Prólogo a la Segunda Edición

INDICE. Prólogo a la Segunda Edición INDICE Prólogo a la Segunda Edición XV Prefacio XVI Capitulo 1. Análisis de datos de Negocios 1 1.1. Definición de estadística de negocios 1 1.2. Estadística descriptiva r inferencia estadística 1 1.3.

Más detalles

Unidad IV: Distribuciones muestrales

Unidad IV: Distribuciones muestrales Unidad IV: Distribuciones muestrales 4.1 Función de probabilidad En teoría de la probabilidad, una función de probabilidad (también denominada función de masa de probabilidad) es una función que asocia

Más detalles

VARIABLES ESTADÍSTICAS BIDIMENSIONALES

VARIABLES ESTADÍSTICAS BIDIMENSIONALES VARIABLES ESTADÍSTICAS BIDIMENSIONALES 1.- En una variable estadística bidimensional, el diagrama de dispersión representa: a) la nube de puntos. b) las varianzas de las dos variables. c) los coeficientes

Más detalles

MÓDULO 1: GESTIÓN DE CARTERAS

MÓDULO 1: GESTIÓN DE CARTERAS MÓDULO 1: GESTIÓN DE CARTERAS TEST DE EVALUACIÓN 1 Una vez realizado el test de evaluación, cumplimenta la plantilla y envíala, por favor, antes del plazo fijado. En todas las preguntas sólo hay una respuesta

Más detalles

Teorema Central del Límite (1)

Teorema Central del Límite (1) Teorema Central del Límite (1) Definición. Cualquier cantidad calculada a partir de las observaciones de una muestra se llama estadístico. La distribución de los valores que puede tomar un estadístico

Más detalles

Pronósticos Automáticos

Pronósticos Automáticos Pronósticos Automáticos Resumen El procedimiento de Pronósticos Automáticos esta diseñado para pronosticar valores futuros en datos de una serie de tiempo. Una serie de tiempo consiste en un conjunto de

Más detalles

TEMA 6. SVM Support Vector Machines (Máquinas de Vectores Soporte)

TEMA 6. SVM Support Vector Machines (Máquinas de Vectores Soporte) TEMA 6. SVM Support Vector Machines (Máquinas de Vectores Soporte) Francisco José Ribadas Pena Modelos de Razonamiento y Aprendizaje 5 Informática ribadas@uvigo.es 17 de abril de 2012 FJRP ccia [Modelos

Más detalles

3. ANÁLISIS DE DATOS DE PRECIPITACIÓN.

3. ANÁLISIS DE DATOS DE PRECIPITACIÓN. 3. ANÁLISIS DE DATOS DE PRECIPITACIÓN. Teniendo en cuenta que la mayoría de procesos estadísticos se comportan de forma totalmente aleatoria, es decir, un evento dado no está influenciado por los demás,

Más detalles

Capítulo 8. Análisis Discriminante

Capítulo 8. Análisis Discriminante Capítulo 8 Análisis Discriminante Técnica de clasificación donde el objetivo es obtener una función capaz de clasificar a un nuevo individuo a partir del conocimiento de los valores de ciertas variables

Más detalles

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición... Contenidos 1 Introducción al paquete estadístico S-PLUS 19 1.1 Introducción a S-PLUS............................ 21 1.1.1 Cómo entrar, salir y consultar la ayuda en S-PLUS........ 21 1.2 Conjuntos de datos..............................

Más detalles

Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO

Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO 2 Objetivo El objetivo principal de las técnicas de clasificación supervisada es obtener un modelo clasificatorio válido para permitir tratar

Más detalles

EJERCICIOS. Curso: Estadística. Profesores: Mauro Gutierrez Martinez Christiam Miguel Gonzales Chávez. Cecilia Milagros Rosas Meneses

EJERCICIOS. Curso: Estadística. Profesores: Mauro Gutierrez Martinez Christiam Miguel Gonzales Chávez. Cecilia Milagros Rosas Meneses EJERCICIOS Curso: Estadística Profesores: Mauro Gutierrez Martinez Christiam Miguel Gonzales Chávez. Cecilia Milagros Rosas Meneses 1. Un fabricante de detergente sostiene que los contenidos de las cajas

Más detalles

Aplicación del modelo de frontera estocástica de producción para analizar la eficiencia técnica de la industria eléctrica en México

Aplicación del modelo de frontera estocástica de producción para analizar la eficiencia técnica de la industria eléctrica en México SECCIÓN DE ESTUDIOS DE POSGRADO E INVESTIGACIÓN Aplicación del modelo de frontera estocástica de producción para analizar la eficiencia técnica de la industria eléctrica en México Presentan: Dr. Miguel

Más detalles

Generación de Variables Aleatorias. UCR ECCI CI-1453 Investigación de Operaciones Prof. M.Sc. Kryscia Daviana Ramírez Benavides

Generación de Variables Aleatorias. UCR ECCI CI-1453 Investigación de Operaciones Prof. M.Sc. Kryscia Daviana Ramírez Benavides Generación de Variables Aleatorias UCR ECCI CI-453 Investigación de Operaciones Prof. M.Sc. Kryscia Daviana Ramírez Benavides Introducción Las variables aleatorias se representan por medio de distribuciones

Más detalles

INTERVALOS DE CONFIANZA. La estadística en cómic (L. Gonick y W. Smith)

INTERVALOS DE CONFIANZA. La estadística en cómic (L. Gonick y W. Smith) INTERVALOS DE CONFIANZA La estadística en cómic (L. Gonick y W. Smith) EJEMPLO: Será elegido el senador Astuto? 2 tamaño muestral Estimador de p variable aleatoria poblacional? proporción de personas que

Más detalles

EXPERIMENTO ALEATORIO

EXPERIMENTO ALEATORIO EXPERIMENTO ALEATORIO En concepto de la probabilidad, un experimento aleatorio es aquel que bajo el mismo conjunto aparente de condiciones iniciales, puede presentar resultados diferentes, en otras palabras,

Más detalles

DIVISIBILIDAD: Resultados

DIVISIBILIDAD: Resultados DIVISIBILIDAD: Resultados Página 1 de 9 Se enumeran a continuación, como referencia, ciertos resultados sobre divisibilidad. 1.1 Definición. Dados los enteros a y b, se dice que a divide a b (Notación:

Más detalles

GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC)

GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC) GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC) Curso Académico: 2015-2016 Programa: Centro: Universidad: Máster Universitario en Ingeniería Informática Escuela Politécnica Superior

Más detalles

Análisis de Componentes de la Varianza

Análisis de Componentes de la Varianza Análisis de Componentes de la Varianza Resumen El procedimiento de Análisis de Componentes de Varianza está diseñado para estimar la contribución de múltiples factores a la variabilidad de una variable

Más detalles

ANÁLISIS DISCRIMINANTE

ANÁLISIS DISCRIMINANTE DEFINICIÓN: Cómo técnica de análisis de dependencia: Pone en marcha un modelo de causalidad en el que la variable endógena es una variable NO MÉTRICA y las independientes métricas. Cómo técnica de análisis

Más detalles

Probabilidad y Estadística Descripción de Datos

Probabilidad y Estadística Descripción de Datos Descripción de Datos Arturo Vega González a.vega@ugto.mx Division de Ciencias e Ingenierías Universidad de Guanajuato Campus León Universidad de Guanajuato, DCI, Campus León 1 / 28 Contenido 1 Probabilidad

Más detalles

Tema 4: Probabilidad y Teoría de Muestras

Tema 4: Probabilidad y Teoría de Muestras Tema 4: Probabilidad y Teoría de Muestras Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 4: Probabilidad y Teoría de Muestras Curso 2008-2009

Más detalles

Estadística Descriptiva. SESIÓN 11 Medidas de dispersión

Estadística Descriptiva. SESIÓN 11 Medidas de dispersión Estadística Descriptiva SESIÓN 11 Medidas de dispersión Contextualización de la sesión 11 En la sesión anterior se explicaron los temas relacionados con la dispersión, una de las medidas de dispersión,

Más detalles

Introducción a la Probabilidad

Introducción a la Probabilidad Introducción a la Probabilidad Tema 3 Ignacio Cascos Depto. Estadística, Universidad Carlos III 1 Ignacio Cascos Depto. Estadística, Universidad Carlos III 2 Objetivos Entender el concepto de experimento

Más detalles

MODULO VIII. Semana 1 ASPECTOS DE EVALUACIÓN FINANCIERA, ECONÓMICA, SOCIAL Y AMBIENTAL.

MODULO VIII. Semana 1 ASPECTOS DE EVALUACIÓN FINANCIERA, ECONÓMICA, SOCIAL Y AMBIENTAL. MODULO VIII Semana 1 ASPECTOS DE EVALUACIÓN FINANCIERA, ECONÓMICA, SOCIAL Y AMBIENTAL Esquema de Proyecto SNIP INDICE INTRODUCCION I. ASPECTOS GENERALES II. IDENTIFICACION III. FORMULACION IV. EVALUACION

Más detalles

Guía práctica de estudio 03: Algoritmos

Guía práctica de estudio 03: Algoritmos Guía práctica de estudio 03: Algoritmos Elaborado por: M.C. Edgar E. García Cano Ing. Jorge A. Solano Gálvez Revisado por: Ing. Laura Sandoval Montaño Guía práctica de estudio 03: Algoritmos Objetivo:

Más detalles

Análisis de datos Categóricos

Análisis de datos Categóricos Introducción a los Modelos Lineales Generalizados Universidad Nacional Agraria La Molina 2016-1 Introducción Modelos Lineales Generalizados Introducción Componentes Estimación En los capítulos anteriores

Más detalles

EJERCICIOS RESUELTOS TEMA 1.

EJERCICIOS RESUELTOS TEMA 1. EJERCICIOS RESUELTOS TEMA 1. 1.1. El proceso por el cual se asignan números a objetos o características según determinadas reglas se denomina: A) muestreo; B) estadística; C) medición. 1.2. Mediante la

Más detalles

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión INTERPRETACIÓN DE LA REGRESIÓN Este gráfico muestra el salario por hora de 570 individuos. 1 Interpretación de la regresión. regresión Salario-Estudios Source SS df MS Number of obs = 570 ---------+------------------------------

Más detalles

Matemáticas 2.º Bachillerato. Intervalos de confianza. Contraste de hipótesis

Matemáticas 2.º Bachillerato. Intervalos de confianza. Contraste de hipótesis Matemáticas 2.º Bachillerato Intervalos de confianza. Contraste de hipótesis Depto. Matemáticas IES Elaios Tema: Estadística Inferencial 1. MUESTREO ALEATORIO Presentación elaborada por el profesor José

Más detalles

Variables estadísticas bidimensionales

Variables estadísticas bidimensionales Variables estadísticas bidimensionales BEITO J GOZÁLEZ RODRÍGUEZ (bjglez@ulles) DOMIGO HERÁDEZ ABREU (dhabreu@ulles) MATEO M JIMÉEZ PAIZ (mjimenez@ulles) M ISABEL MARRERO RODRÍGUEZ (imarrero@ulles) ALEJADRO

Más detalles

Guía práctica de estudio 03: Algoritmos

Guía práctica de estudio 03: Algoritmos Guía práctica de estudio 03: Algoritmos Elaborado por: M.C. Edgar E. García Cano Ing. Jorge A. Solano Gálvez Revisado por: Ing. Laura Sandoval Montaño Guía práctica de estudio 03: Algoritmos Objetivo:

Más detalles

Inteligencia Artificial. Aprendizaje neuronal. Ing. Sup. en Informática, 4º. Curso académico: 2011/2012 Profesores: Ramón Hermoso y Matteo Vasirani

Inteligencia Artificial. Aprendizaje neuronal. Ing. Sup. en Informática, 4º. Curso académico: 2011/2012 Profesores: Ramón Hermoso y Matteo Vasirani Inteligencia Artificial Aprendizaje neuronal Ing. Sup. en Informática, 4º Curso académico: 20/202 Profesores: Ramón Hermoso y Matteo Vasirani Aprendizaje Resumen: 3. Aprendizaje automático 3. Introducción

Más detalles

TÉCNICAS E INSTRUMENTOS DE RECOLECCIÓN DE DATOS. Adela del Carpio Rivera Doctor en medicina

TÉCNICAS E INSTRUMENTOS DE RECOLECCIÓN DE DATOS. Adela del Carpio Rivera Doctor en medicina TÉCNICAS E INSTRUMENTOS DE RECOLECCIÓN DE DATOS Adela del Carpio Rivera Doctor en medicina METODO Es el medio o camino a través del cual se establece la relación entre el investigador y el consultado para

Más detalles

1: INTRODUCCIÓN AL USO DE LA HOJA DE CALCULO EXCEL COMO HERRAMIENTA PARA DESARROLLAR PROBLEMAS EN INGENIERÍA. SOLVER, REGRESION LINEAL MULTIPLE

1: INTRODUCCIÓN AL USO DE LA HOJA DE CALCULO EXCEL COMO HERRAMIENTA PARA DESARROLLAR PROBLEMAS EN INGENIERÍA. SOLVER, REGRESION LINEAL MULTIPLE Practica 1: INTRODUCCIÓN AL USO DE LA HOJA DE CALCULO EXCEL COMO HERRAMIENTA PARA DESARROLLAR PROBLEMAS EN INGENIERÍA. SOLVER, REGRESION LINEAL MULTIPLE I. INTRODUCCION Las planillas de cálculo se han

Más detalles

Selección de fuentes de datos y calidad de datos

Selección de fuentes de datos y calidad de datos Selección de fuentes de datos y calidad de datos ESCUELA COMPLUTENSE DE VERANO 2014 MINERIA DE DATOS CON SAS E INTELIGENCIA DE NEGOCIO Juan F. Dorado José María Santiago . Valores atípicos. Valores faltantes.

Más detalles

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua ESTADÍSTICA Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal Cuantitativa discreta continua DISTRIBUCIÓN DE FRECUENCIAS Frecuencia absoluta: fi Frecuencia relativa:

Más detalles

Tema 5. Contraste de hipótesis (I)

Tema 5. Contraste de hipótesis (I) Tema 5. Contraste de hipótesis (I) CA UNED de Huelva, "Profesor Dr. José Carlos Vílchez Martín" Introducción Bienvenida Objetivos pedagógicos: Conocer el concepto de hipótesis estadística Conocer y estimar

Más detalles

2. Calcula las raíces o soluciones para cada ecuación cuadrática.

2. Calcula las raíces o soluciones para cada ecuación cuadrática. Matemáticas 3 Bloque I Instrucciones. Lee y contesta correctamente lo que se te pide. 1. Cuánto tiempo tardará en llegar al suelo un objeto que se deja caer verticalmente desde la azotea de un edificio

Más detalles

Tema 5 Algunas distribuciones importantes

Tema 5 Algunas distribuciones importantes Algunas distribuciones importantes 1 Modelo Bernoulli Distribución Bernoulli Se llama experimento de Bernoulli a un experimento con las siguientes características: 1. Se realiza un experimento con dos

Más detalles

6.4. APLICACIÓN DE REDES NEURONALES EN EL CÁLCULO DE LA TASA DE CONTORNEAMIENTOS Velocidad de retorno del rayo con distribución uniforme

6.4. APLICACIÓN DE REDES NEURONALES EN EL CÁLCULO DE LA TASA DE CONTORNEAMIENTOS Velocidad de retorno del rayo con distribución uniforme Aplicación de redes neuronales en el cálculo de sobretensiones y tasa de contorneamientos 233 6.4. APLICACIÓN DE REDES NEURONALES EN EL CÁLCULO DE LA TASA DE CONTORNEAMIENTOS 6.4.1. Introducción Como ya

Más detalles

3. Correlación. Introducción. Diagrama de dispersión

3. Correlación. Introducción. Diagrama de dispersión 1 3. Correlación Introducción En los negocios, no todo es el producto, pueden existir factores relacionados o externos que modifiquen cómo se distribuye un producto. De igual manera, la estadística no

Más detalles

INDICE Capítulo I: Conceptos Básicos Capitulo II: Estadística Descriptiva del Proceso

INDICE Capítulo I: Conceptos Básicos Capitulo II: Estadística Descriptiva del Proceso INDICE Capítulo I: Conceptos Básicos 1.- Introducción 3 2.- Definición de calidad 7 3.- Política de calidad 10 4.- Gestión de la calidad 12 5.- Sistema de calidad 12 6.- Calidad total 13 7.- Aseguramiento

Más detalles

MEDIDAS DE TENDENCIA CENTRAL

MEDIDAS DE TENDENCIA CENTRAL MEDIDAS DE TENDENCIA CENTRAL Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro

Más detalles

Cómo se hace la Prueba t a mano?

Cómo se hace la Prueba t a mano? Cómo se hace la Prueba t a mano? Sujeto Grupo Grupo Grupo Grupo 33 089 74 5476 84 7056 75 565 3 94 8836 75 565 4 5 704 76 5776 5 4 6 76 5776 6 9 8 76 5776 7 4 78 6084 8 65 45 79 64 9 86 7396 80 6400 0

Más detalles

Taller de Validación de Métodos Verificación de Procedimientos de Medidas Cualitativos: Enfermedades Infecciosas. PONENTE: Gabriel A.

Taller de Validación de Métodos Verificación de Procedimientos de Medidas Cualitativos: Enfermedades Infecciosas. PONENTE: Gabriel A. Taller de Validación de Métodos Verificación de Procedimientos de Medidas Cualitativos: Enfermedades Infecciosas PONENTE: Gabriel A. Migliarino Agenda Introducción Evaluación de Procedimientos de Medida

Más detalles

Cómo se usa Data Mining hoy?

Cómo se usa Data Mining hoy? Cómo se usa Data Mining hoy? 1 Conocer a los clientes Detectar segmentos Calcular perfiles Cross-selling Detectar buenos clientes Evitar el churning, attrition Detección de morosidad Mejora de respuesta

Más detalles

CLASIFICACIÓN DE LA IMAGEN. Escuela de Ingeniería Civil y Geomática Francisco Luis Hernández Torres

CLASIFICACIÓN DE LA IMAGEN. Escuela de Ingeniería Civil y Geomática Francisco Luis Hernández Torres CLASIFICACIÓN DE LA IMAGEN TÉCNICA QUE PERMITE LA IDENTIFICACIÓN DE LOS DIFERENTES OBJETOS O GRUPOS PRESENTES EN UNA IMAGEN MULTI-ESPECTRAL. MÉTODO NO SUPERVISADO MÉTODO SUPERVISADO El Desarrollo De Las

Más detalles

Repaso de conceptos. Tipos de RNA más utilizados. Técnicas de Clasificación con RNA. Contenido

Repaso de conceptos. Tipos de RNA más utilizados. Técnicas de Clasificación con RNA. Contenido Contenido Introducción al Diseño de Experimentos para el Reconocimiento de Patrones Capítulo 3: Redes Neuronales Artificiales Curso de doctorado impartido por Dr. Quiliano Isaac Moro Dra. Aranzazu Simón

Más detalles

Conceptos básicos estadísticos

Conceptos básicos estadísticos Conceptos básicos estadísticos Población Población, en estadística, también llamada universo o colectivo, es el conjunto de elementos de referencia sobre el que se realizan las observaciones. El concepto

Más detalles

DESPLIEGUE DE LA CALIDAD (Quality Function Deployment, QFD)

DESPLIEGUE DE LA CALIDAD (Quality Function Deployment, QFD) DESPLIEGUE DE LA CALIDAD (Quality Function Deployment, QFD) El Despliegue de la Calidad o Despliegue de la Función de la Calidad es una metodología de origen japonés utilizada para traducir las necesidades

Más detalles

1. VALORES FALTANTES 2. MECANISMOS DE PÉRDIDA

1. VALORES FALTANTES 2. MECANISMOS DE PÉRDIDA 1. VALORES FALTANTES Los valores faltantes son observaciones que en un se tenía la intención de hacerlas, pero por distintas razones no se obtuvieron. Puede ser que no se encuentre a un encuestado, entonces

Más detalles

REGRESIÓN LINEAL SIMPLE, COEFICIENTE DE DETERMINACIÓN Y CORRELACIONES (EJERCICIOS RESUELTOS)

REGRESIÓN LINEAL SIMPLE, COEFICIENTE DE DETERMINACIÓN Y CORRELACIONES (EJERCICIOS RESUELTOS) 1 REGRESIÓN LINEAL SIMPLE, COEFICIENTE DE DETERMINACIÓN Y CORRELACIONES (EJERCICIOS RESUELTOS) 1. EN LA REGIÓN DE DRAKUL DE LA REPÚBLICA DE NECROLANDIA, LAS AUTORIDADES ECONÓMICAS HAN REALIZADO UNA REVISIÓN

Más detalles

UNIDAD II. INTEGRAL DEFINIDA Y LOS MÉTODOS DE INTEGRACIÓN. Tema: LA INTEGRAL DEFINIDA

UNIDAD II. INTEGRAL DEFINIDA Y LOS MÉTODOS DE INTEGRACIÓN. Tema: LA INTEGRAL DEFINIDA UNIDAD II. INTEGRAL DEFINIDA Y LOS MÉTODOS DE INTEGRACIÓN Tema: LA INTEGRAL DEFINIDA La integral definida Anteriormente se mencionó que la Integral Indefinida da como resultado una familia de funciones

Más detalles

Métodos Estadísticos Multivariados

Métodos Estadísticos Multivariados Métodos Estadísticos Multivariados Victor Muñiz ITESM Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre 2011 1 / 20 Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre

Más detalles

Tema 2. Descripción Conjunta de Varias Variables

Tema 2. Descripción Conjunta de Varias Variables Tema 2. Descripción Conjunta de Varias Variables Cuestiones de Verdadero/Falso 1. La covarianza mide la relación lineal entre dos variables, pero depende de las unidades de medida utilizadas. 2. El análisis

Más detalles

CAPÍTULO 4 RECOPILACIÓN DE DATOS Y CÁLCULO DEL VPN. En el presente capítulo se presenta lo que es la recopilación de los datos que se tomarán

CAPÍTULO 4 RECOPILACIÓN DE DATOS Y CÁLCULO DEL VPN. En el presente capítulo se presenta lo que es la recopilación de los datos que se tomarán CAPÍTULO 4 RECOPILACIÓN DE DATOS Y CÁLCULO DEL VPN En el presente capítulo se presenta lo que es la recopilación de los datos que se tomarán para realizar un análisis, la obtención del rendimiento esperado

Más detalles

GRAFICOS DE CONTROL DATOS TIPO VARIABLES

GRAFICOS DE CONTROL DATOS TIPO VARIABLES GRAFICOS DE CONTROL DATOS TIPO VARIABLES OBJETIVO DEL LABORATORIO El objetivo del presente laboratorio es que el estudiante conozca y que sea capaz de seleccionar y utilizar gráficos de control, para realizar

Más detalles

Máster en comunicaciones. Clase 2. Modelos predictores.

Máster en comunicaciones. Clase 2. Modelos predictores. Máster en comunicaciones. Clase 2. Modelos predictores. 1. Introducción Uno de los cometidos más importantes de la estadística es la explotación de los datos observados de una o más características de

Más detalles

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7) TEMA Nº 7 DISTRIBUCIONES CONTINUAS DE PROBABILIDAD OBJETIVOS DE APRENDIZAJE: Conocer las características de la distribución normal como distribución de probabilidad de una variable y la aproximación de

Más detalles

Objetivos. Aprender a construir gráficos p y/o np. Aprender a construir gráficos c y u. Cuando usarlos. Epígrafes

Objetivos. Aprender a construir gráficos p y/o np. Aprender a construir gráficos c y u. Cuando usarlos. Epígrafes Objetivos Aprender a construir gráficos p y/o np. Aprender a construir gráficos c y u. Cuando usarlos Epígrafes Introducción a los Gráficos p, np. Interpretación Gráficos c y u. Interpretación 2-1 Gráfico

Más detalles

Diseño Estructurado de Algoritmos

Diseño Estructurado de Algoritmos Diseño Estructurado de Algoritmos 1 Sesión No. 11 Nombre: Estructuras algorítmicas. Tercera parte. Objetivo de la sesión: Al concluir la sesión el estudiante aplicará las estructuras algorítmicas repetitivas

Más detalles

LECTURA 01: LA ESTADÍSTICA. TÉRMINOS DE ESTADÍSTICA. RECOLECCIÓN DE DATOS TEMA 1: LA ESTADISTICA Y CLASIFICACION

LECTURA 01: LA ESTADÍSTICA. TÉRMINOS DE ESTADÍSTICA. RECOLECCIÓN DE DATOS TEMA 1: LA ESTADISTICA Y CLASIFICACION LECTURA 01: LA ESTADÍSTICA. TÉRMINOS DE ESTADÍSTICA. RECOLECCIÓN DE DATOS TEMA 1: LA ESTADISTICA Y CLASIFICACION 1. LA ESTADÍSTICA La estadística es una ciencia que proporciona un conjunto métodos y técnicas

Más detalles

Unidad III: Estadística descriptiva

Unidad III: Estadística descriptiva Unidad III: Estadística descriptiva 3.1 Conceptos básicos de estadística: Definición, Teoría de decisión, Población, Muestra aleatoria, Parámetros aleatorios TEORÍA DE DECISIÓN Estudio formal sobre la

Más detalles

Tema 5. Muestreo y distribuciones muestrales

Tema 5. Muestreo y distribuciones muestrales Tema 5. Muestreo y distribuciones muestrales Contenidos Muestreo y muestras aleatorias simples La distribución de la media en el muestreo La distribución de la varianza muestral Lecturas recomendadas:

Más detalles

CURSO DE MÉTODOS CUANTITATIVOS I

CURSO DE MÉTODOS CUANTITATIVOS I CURSO DE MÉTODOS CUANTITATIVOS I TEMA VI: INTRODUCCIÓN AL MUESTREO Ing. Francis Ortega, MGC Concepto de Población y Muestra POBLACIÓN (N) Es el conjunto de todos los elementos de interés en un estudio

Más detalles

CÁLCULO DE INCERTIDUMBRE EN LAS MEDICIONES

CÁLCULO DE INCERTIDUMBRE EN LAS MEDICIONES OBJETIVOS CÁLCULO DE INCERTIDUMBRE EN LAS MEDICIONES Reportar correctamente resultados, a partir del procesamiento de datos obtenidos a través de mediciones directas. INTRODUCCION En el capítulo de medición

Más detalles

Probabilidad Condicional

Probabilidad Condicional Probabilidad Condicional Algunas veces la ocurrencia de un evento A puede afectar la ocurrencia posterior de otro evento B; por lo tanto, la probabilidad del evento B se verá afectada por el hecho de que

Más detalles

15. Regresión lineal. Te recomiendo visitar su página de apuntes y vídeos:

15. Regresión lineal. Te recomiendo visitar su página de apuntes y vídeos: 15. Regresión lineal Este tema, prácticamente íntegro, está calacado de los excelentes apuntes y transparencias de Bioestadística del profesor F.J. Barón López de la Universidad de Málaga. Te recomiendo

Más detalles

Método de Análisis del Riesgo (Estudio del Calibrador Atributos)

Método de Análisis del Riesgo (Estudio del Calibrador Atributos) Método de Análisis del Riesgo (Estudio del Calibrador Atributos) Resumen El Método de Análisis del Riesgo cuantifica la incertidumbre de un sistema de medición donde las observaciones consisten de atributos

Más detalles

clustering: Clasificación no Supervisada

clustering: Clasificación no Supervisada clustering: Clasificación no Supervisada Gráficas estadística y minería de datos con python Miguel Cárdenas Montes Centro de Investigaciones Energéticas Medioambientales y Tecnológicas, Madrid, Spain miguel.cardenas@ciemat.es

Más detalles

4.1. Polinomios y teoría de ecuaciones

4.1. Polinomios y teoría de ecuaciones CAPÍTULO 4 Polinomios y teoría de ecuaciones 4.1. Polinomios y teoría de ecuaciones Un polinomio real en x, o simplemente polinomio en x es una expresión algebraica de la forma a n x n + a n 1 x n 1 +

Más detalles

ESTADISTICA Y PROBABILIDAD ESTADÍSTICA

ESTADISTICA Y PROBABILIDAD ESTADÍSTICA ESTADÍSTICA La estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comprobaciones y sacar conclusiones. Un estudio estadístico consta

Más detalles

INTERVALOS DE CONFIANZA Julián de la Horra Departamento de Matemáticas U.A.M.

INTERVALOS DE CONFIANZA Julián de la Horra Departamento de Matemáticas U.A.M. 1 Introducción INTERVALOS DE CONFIANZA Julián de la Horra Departamento de Matemáticas U.A.M. En este capítulo, vamos a abordar la estimación mediante Intervalos de Confianza, que es otro de los tres grandes

Más detalles

Complejidad computacional (Análisis de Algoritmos)

Complejidad computacional (Análisis de Algoritmos) Definición. Complejidad computacional (Análisis de Algoritmos) Es la rama de las ciencias de la computación que estudia, de manera teórica, la optimización de los recursos requeridos durante la ejecución

Más detalles

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO UNIVERSIDAD AUTONOMA DE SANTO DOMINGO FACULTAD DE CIENCIAS ECONOMICAS Y SOCIALES DEPARTAMENTO DE ESTADISITICA CATEDRA Estadística Especializada ASIGNATURA Estadística Industrial (EST-121) NUMERO DE CREDITOS

Más detalles

Aplicación de Vectores Estadísticos de Características y Ensambles para el Reconocimiento Automático del Llanto de Bebés

Aplicación de Vectores Estadísticos de Características y Ensambles para el Reconocimiento Automático del Llanto de Bebés Aplicación de Vectores Estadísticos de Características y Ensambles para el Reconocimiento Automático del Llanto de Bebés Amaro Camargo Erika, Reyes García Carlos A. Instituto Nacional de Astrofísica, Óptica

Más detalles

Herramientas de Programación. M.C. Juan Carlos Olivares Rojas

Herramientas de Programación. M.C. Juan Carlos Olivares Rojas Herramientas de Programación M.C. Juan Carlos Olivares Rojas Febrero 2011 Temario Simbología Reglas para la construcción de Diagramas Pseudocódigo Temario Tipos de Datos y Expresiones Estructuras lógicas

Más detalles

INSTITUTO POLITÉCNICO NACIONAL SECRETARIA ACADEMICA DIRECCIÓN DE ESTUDIOS PROFESIONALES EN INGENIERÍA Y CIENCIAS FÍSICO MATEMÁTICAS

INSTITUTO POLITÉCNICO NACIONAL SECRETARIA ACADEMICA DIRECCIÓN DE ESTUDIOS PROFESIONALES EN INGENIERÍA Y CIENCIAS FÍSICO MATEMÁTICAS ESCUELA: UPIICSA CARRERA: INGENIERÍA EN TRANSPORTE ESPECIALIDAD: COORDINACIÓN: ACADEMIAS DE MATEMÁTICAS DEPARTAMENTO: CIENCIAS BÁSICAS PROGRAMA DE ESTUDIO ASIGNATURA: ESTADÍSTICA APLICADA CLAVE: TMPE SEMESTRE:

Más detalles

RELACION, ELONGACION-PESO DE UN RESORTE

RELACION, ELONGACION-PESO DE UN RESORTE RELACION, ELONGACION-PESO DE UN RESORTE Tatiana Ortiz 1, Natalie Díaz 2, Silvia Alvarado 3, Juan Felipe Mateus 4 Estudiante Microbiología Industrial- lady.ortiz@javeriana.edu.co Estudiante Biología natalie.diaz@javeriana.edu.co

Más detalles

CONTENIDOS MÍNIMOS BLOQUE 2. NÚMEROS

CONTENIDOS MÍNIMOS BLOQUE 2. NÚMEROS CONTENIDOS Y CRITERIOS DE EVALUACIÓN DE MATEMÁTICAS 1º DE ESO. Bloque 1: Contenidos Comunes Este bloque de contenidos será desarrollado junto con los otros bloques a lo largo de todas y cada una de las

Más detalles

UANL UNIVERSIDAD AUTONOMA DE NUEVO LEON PREPARATORIA 23

UANL UNIVERSIDAD AUTONOMA DE NUEVO LEON PREPARATORIA 23 PORTAFOLIO DE PROBABILIDAD Y ESTADÍSTICA CUARTA OPORTUNIDAD FECHA DE EXAMEN: HORA: Nombre del alumno: Grupo: RÚBRICA: Ten en cuenta que el hecho de entregar el trabajo no te otorga automáticamente 40 puntos.

Más detalles

CAMPO MAGNÉTICO SOLENOIDE

CAMPO MAGNÉTICO SOLENOIDE No 7 LABORATORIO DE ELECTROMAGNETISMO MEDICIÓN DEL CAMPO MAGNÉTICO EN UN SOLENOIDE DEPARTAMENTO DE FISICA Y GEOLOGIA UNIVERSIDAD DE PAMPLONA FACULTAD DE CIENCIAS BÁSICAS Objetivos 1. Medir el campo magnético

Más detalles

INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016

INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016 ANEXO ESTADÍSTICO 1 : COEFICIENTES DE VARIACIÓN Y ERROR ASOCIADO AL ESTIMADOR ENCUESTA NACIONAL DE EMPLEO (ENE) INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 9 de Abril de 016 1 Este anexo estadístico es una

Más detalles

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA MODELO DE REGRESIÓN LOGÍSTICA Introducción A grandes rasgos, el objetivo de la regresión logística se puede describir de la siguiente forma: Supongamos que los individuos de una población pueden clasificarse

Más detalles

Evaluando las Hipótesis Inductivas. Tomás Arredondo Vidal 8/9/2011

Evaluando las Hipótesis Inductivas. Tomás Arredondo Vidal 8/9/2011 Evaluando las Hipótesis Inductivas Tomás Arredondo Vidal 8/9/2011 Evaluando las Hipótesis Inductivas Contenidos Estimando la Precisión Comparando Hipótesis Comparando Algoritmos de Clasificación Evaluando

Más detalles

Tomamos como imagen de prueba la figura 4.17 en escala de grises. Figura Imagen de prueba.

Tomamos como imagen de prueba la figura 4.17 en escala de grises. Figura Imagen de prueba. 4.3 PARÁMETRO DE ESCALADO Para el caso del parámetro de escalado se va a proceder de la siguiente forma. Partimos de una imagen de referencia (imagen A), a la cual se le aplican cambios de translación

Más detalles

Identificación Paramétrica

Identificación Paramétrica Identificación Paramétrica Métodos para la Obtención de un Modelo Discreto Un modelo, incluyendo el ruido o perturbación, a tiempo discreto puede ser representado por la siguiente i ecuación Donde: ( )

Más detalles