Evaluando las Hipótesis Inductivas. Tomás Arredondo Vidal 8/9/2011

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Evaluando las Hipótesis Inductivas. Tomás Arredondo Vidal 8/9/2011"

Transcripción

1 Evaluando las Hipótesis Inductivas Tomás Arredondo Vidal 8/9/2011

2 Evaluando las Hipótesis Inductivas Contenidos Estimando la Precisión Comparando Hipótesis Comparando Algoritmos de Clasificación

3 Evaluando las Hipótesis Inductivas La precisión (accuracy) de la hipótesis h sobre los datos de entrenamiento esta sesgada dado que h fue construida para calzar esos datos (e.g. bias en la estimación y posible sobreajuste). La precisión debe ser evaluada en un conjunto de pruebas independiente (generalmente disjunto) de los datos de entrenamiento. Mientras mayor es el conjunto de prueba, mejor la precisión medida y menor es la varianza observada en distintos conjuntos de prueba. Definición: X es un conjunto de posibles instancias (e.g. el conjunto de todas las personas con varios atributos como edad, ocupacion, veces que han esquiado,...) sobre la cual se puede definir una función objetivo f: X -> {0, 1} (e.g. las personas que van a comprar esquís este año). X se puede encontrar con distintas frecuencias dada una distribución D de probabilidades (e.g. D puede asignar mayor probabilidad a los de 19 años que a la gente de 100 años).

4 Error de Muestra vs Error Verdadero Definición: El error de muestra (sample error) de la hipótesis h con respecto a la función objetivo f( ) dado una muestra S es error S ( h)= 1 n x S δ ( f ( x),h( x )) δ ( f ( x ),h( x ))=1 si f ( x ) h( x ), 0 de otra forma. Definición: El error verdadero (true error) es el error de la hipótesis h con respecto a la función objetivo f( ) dado la distribución D. Es la probabilidad que h mis-clasifique una instancia elegida de acuerdo a D. [ f ( x ) h ( x)]

5 Relación con la Distribución Binomial Como es que la desviación entre el error de muestreo y el error verdadero depende del tamaño de la muestra? La respuesta tiene que ver con que cuando medimos el error de la muestra S estamos haciendo un experimento aleatorio con un resultado aleatorio. Tomemos una muestra S i de n instancias independientes de la distribución D y midamos el error Si (h). Si repetimos este experimento k veces {S i : S 1, S 2.,..., S k } esperaríamos distintos números de errores cada vez. Decimos que error Si (h) es una variable aleatoria y si graficamos un histograma mostrando la frecuencia de obtener cada posible valor de error a medida que k creciera esta distribución seria una Binomial.

6 Relación con la Distribución Binomial (cont) Ej: En la distribución Binomial la probabilidad de observar r caras (X = r ) en una muestra de n tiros independientes de una moneda, cuando la probabilidad de sacar cara en un tiro individual es p esta dada por: n! P( X=r )=P(r )= r!(n r )! pr (1 p ) n r Estimar p de una muestra aleatoria es equivalente a estimar error D (h) al probar la hipótesis h en una muestra aleatoria S i. Un tiro de la moneda corresponde a sacar una muestra de D y determinar si esta mal clasificada por h. La probabilidad p corresponde a error D (h), r corresponde al numero de misclasificaciones y r / n a error Si (h). error D (h)=p error Si (h )= r n (1)

7 Relación con la Distribución Binomial (cont) Si una variable aleatoria X sigue una distribución Binomial entonces: La probabilidad Pr (X = r) = P(r) El promedio (mean) de X es E(X) = Σx i Pr(X=x i ) = np La varianza de X, Var(X) es Var(X) = E[(X-E[X]) 2 ] = np(1 p) La desviación std de X, σ X es P(r )= n! r!(n r )! pr (1 p) n r σ X = Var(X) 1/2 = (np(1 p)) 1/2 n=40, p=0.3

8 Bias y Varianza en el Estimador Se puede considerar error S (h) como un estimador del error verdadero error D (h). Definición: El sesgo de estimación (estimation bias) de un estimador Y para un parámetro arbitrario p es estimation Bias = E[ Y ] - p error S (h) = E(r / n) = p indica un estimador sin sesgo (unbiased) Definición: La desviación std de error S (h) dado nuestro estimador de p con r errores en n muestras (constante) es σ errors ( h) = σ r n = p(1 p) error S (h)(1 error S (h)) n n Dada la posible elección entre distintos estimadores es mejor uno sin estimation bias y con la varianza mas pequeña. (2)

9 La Distribución Normal como Aproximación error S (h) es el porcentaje de ejemplos en un conjunto de prueba S muestreada independientemente de tamaño n que son clasificados erróneamente por h. error D (h) es el error verdadero para la distribución general de datos D (la que se puede esperar cuando se aplica la hipótesis a ejemplos futuros). Cuando n es al menos 30, el teorema del limite central (Central Limit Theorem) garantiza que la distribución de error S (h) para una muestra aleatoria S va a ser aproximada de manera cercana por una distribución Normal (Gausiana). P(error S(h)) error D (h) error S (h)

10 La Distribución Normal como Aproximación (cont) Teorema: Teorema del limite central. Considerando un conjunto de variables aleatorias independientes (Y i ), idénticamente distribuidas gobernadas por una distribución arbitraria con promedio µ y varianza finita σ 2. Se define el promedio de muestra como: n Ȳ n =(1/n ) i=1 A medida que n ->, independiente de la distribución que gobierna las variables aleatorias subyacentes Y i, esta muestra se acerca a una distribución Normal con: Y i Ȳ n =μ Ȳ n =σ /n

11 Intervalos de Confianza Lo que se quiere saber es error D (h) de la hipótesis porque este es el error que se puede esperar cuando se aplica la hipótesis a ejemplos futuros... Pero lo único que podemos medir es error S (h) para los datos que tenemos disponibles... La pregunta entonces es: Cuan buena es la estimación de error D (h) dada por error S (h)?

12 Intervalos de Confianza Si una variable aleatoria Y obedece una distribución Normal con promedio µ y una desviación std σ entonces el valor medido de Y va a estar en el siguiente intervalo un N% del tiempo y N = µ ± z N σ (3) Int. conf. N%: 50% 68% 80% 90% 95% 98% 99% Const. z N : Ej: una Normal con µ = 0, σ = 1 Con un 80% de confianza el valor de la la variable aleatoria Y va a estar entre [-1.28, 1.28]. Con 90% de confianza Y va a estar en el intervalo [-, 1.28].

13 Intervalos de Confianza Asumiendo que: la muestra S contiene n ejemplos independientes, independientes de h y de acuerdo a la distribución D, n 30, h comete r errores sobre estas n muestras (error S (h) = r / n). Bajo estas condiciones la estadística nos permite decir que: el valor mas probable de error D (h) es el error promedio error S (h), el verdadero error con una probabilidad N% esta en el intervalo: poniendo (1) y (2) -> (3): error D,N ( h)=error S (h )±z N error S (h )(1 error S (h)) n La constante z N da la distancia desde la media en desviaciones std en cualquiera de las dos direcciones.

14 Evaluando las Hipótesis Inductivas Contenidos Estimando la Precisión Comparando Hipótesis Comparando Algoritmos de Clasificación

15 Comparando Dos Hipótesis Aprendidas Cuando se evalúan dos hipótesis distintas, su ordenamiento observado con respecto a precisión puede o no reflejar el orden de sus precisiones individuales reales. Se asume que h 1 es probado en el set S 1 de tamaño n 1 h 2 es probado en un conjunto S 2 de tamaño n 2 P(error S(h)) error S1 (h 1 ) error S2 (h 2 ) error S (h) Se observa h 1 mas precisa que h 2

16 Comparando Dos Hipótesis Aprendidas Cuando se evalúan dos hipótesis distintas, su ordenamiento observado con respecto a precisión puede o no reflejar el orden de sus precisiones individuales reales. Se asume que h 1 es probado en el set S 1 de tamaño n 1 h 2 es probado en un conjunto S 2 de tamaño n 2 P(error S(h)) error S1 (h 1 ) error S2 (h 2 ) error S (h) Se observa h 1 menos precisa que h 2

17 Pruebas Estadísticas de Hipótesis Como determinar si la probabilidad que una diferencia observada empíricamente entre dos variables es aleatoria sin diferencias estadísticas subyacentes? Como determinar lo significativo de dos promedios calculados de dos muestras distintas bajo distintas condiciones? Es común usar la hipótesis nula, que es la probabilidad de que ambas muestras fueron sacadas de la misma distribución subyacente. Por convención científica rechazamos la hipótesis nula y decimos que la diferencia es estadísticamente significativa si la probabilidad de la hipótesis nula es menor que el 5% (p < 0.05) o alternativamente podemos aceptar que la diferencia esta dada por una causa subyacente con confianza de (1 p).

18 Tests de uno o dos lados Tests usando un lado (one sided tests) asumen que uno espera una diferencia en una dirección (e.g. A es mejor que B) y que la diferencia es consistente con esa suposición Tests de dos lados no asumen una diferencia en una u otra dirección. Tests de dos lados (i.e. two-sided tests) son mas conservativos dado que requieren una mayor diferencia para concluir que la diferencia es significativa.

19 Test Z-Score para Comparar Hipótesis Aprendidas Se asume que h 1 es probado en un test set S 1 de tamaño n 1 y h 2 en un test set S 2 de tamaño n 2. Se calcula la diferencia entre la precisión de h 1 y h 2 : d= error S1 (h 1 ) error S2 (h 2 ) Se calcula la desviación estándar de la estimación muestreada de la diferencia: = σ error S 1 (h 1 ) (1 error S1 ( h 1 )) d + error S 2 ( h 2 ) (1 error S2 ( h 2 )) n 1 n 2 Se calcula el z-score de la diferencia (viene de (3)): z= d σ d

20 Test Z-Score para Comparar Hipótesis Aprendidas (cont) Se determina la confianza de la diferencia al buscar la confianza mas alta C, para el z-score calculado usando una tabla. confidence level 50% 68% 80% 90% 95% 98% 99% z-score Esto da la confianza para un test de dos lados (twotailed test), para un test de un lado incremente la confianza una mitad hacia 100%. C ' =(100 (100 C ) 2 )

21 Ejemplo 1 Z-Score Test Asumir que probamos dos hipótesis en sets de prueba de tamaño 100 y se observa: error S1 (h 1 )=0.20 error S2 ( h 2 )=0.30 d= error S1 (h 1 ) error S2 (h 2 ) = =0.1 σ d = error S 1 ( h 1 ) (1 error S1 (h 1 )) n 1 + error S 2 (h 2 ) (1 error S2 (h 2 )) n 2 = 0.2 (1 0. 2) 100 z= d = 0.1 = σ d (1 0. 3) + = Confianza para z-test de dos colas: 90% Confianza para z-test de una cola: (100 (100 90)/2) = 95%

22 Ejemplo 2 Z-Score Test Asumir que probamos dos hipótesis en sets de prueba de tamaño 100 y se observa: error S1 (h 1 )=0.20 error S2 ( h 2 )=0.25 d= error S1 (h 1 ) error S2 (h 2 ) = =0.05 σ d = error S 1 ( h 1 ) (1 error S1 (h 1 )) n 1 + error S 2 (h 2 ) (1 error S2 (h 2 )) n 2 = 0.2 (1 0. 2) (1 0.25) = z= d = =0.848 σ d Confianza para test de dos colas: 50% Confianza para test de una cola: (100 (100 50)/2) = 75%

23 Suposiciones del Test Z-Score Hipótesis pueden ser probadas en distintos sets de prueba. Si se usa el mismo set de prueba se podrían justificar conclusiones mas fuertes. Sets de prueba deben tener por lo menos 30 ejemplos elegidos independientes. Hipótesis son construidas desde sets de entrenamiento independientes. Solo compara dos hipótesis especificas independiente de los métodos usados para construirlos. No compara los métodos de aprendizaje subyacentes en general.

24 Evaluando las Hipótesis Inductivas Contenidos Estimando la Precisión Comparando Hipótesis Comparando Algoritmos de Clasificación

25 Comparando Algoritmos de Aprendizaje Comparando la precisión promedio de hipótesis producidas por dos métodos distintos de aprendizaje es mas difícil dado que se debe promediar sobre múltiples casos de entrenamiento. Idealmente queremos medir: E S D (error D ( L A ( S )) error D ( L B ( S))) en el cual L X (S) representa la hipótesis aprendida por el método L X usando los datos S. Para estimar precisamente esto necesitamos promediar sobre múltiples sets independientes de entrenamiento y prueba. Dado que los datos etiquetados son limitados, generalmente se debe promediar usando múltiples divisiones de los datos de entrenamiento y prueba.

26 Validación Cruzada K-Fold Aleatoriamente dividir datos D en k dsets disjuntos de igual tamaño P 1 P k For i from 1 to k do: Usar P i de test set y el resto como sets de entrenamiento S i = (D P i ) h A = L A (S i ) h B = L B (S i ) δ i = error Pi (h A ) error Pi (h B ) Retornar el error promedio de la diferencia: k δ= 1 k i= 1 δ i

27 Validación Cruzada K-Fold (cont) Cada set se usa como set de prueba una vez y como set de entrenamiento k 1 veces. Todo los sets de prueba son independientes pero los sets de entrenamiento se sobrelapan. Mediciones de precisión de hipótesis se generan para [(k 1)/k] D datos de entrenamiento. Método standard es 10-fold. Si k es bajo, no hay suficiente numero de sets de entrenamiento/test; si k es alto, el test set es pequeño, la varianza en el test es alto y el tiempo de ejecución se incrementa. Si k = D, método de validacion cruzada se llama deja-unoafuera (leave-one-out).

28 Test de Relevancia (significance tests) Típicamente si k<30, no son suficientes muestras para un z test. Se puede usar un t-test apareado (paired), que puede determinar diferencias mas pequeñas dado que los sets de entrenamiento/prueba son los mismos para ambas hipótesis siendo comparadas. Puede usarse un (Student s) t-test, que es mas preciso cuando el numero de muestras es bajo. Los tests z y t asumen que las muestras son independientes.no es asi para validación cruzada k-fold: Conjuntos de prueba son independientes Conjuntos de entrenamiento no son independientes Otros tests estadísticos han sido propuestos (e.g. McNemar s test) A pesar de que ningún test es perfecto, cuando los datos son limitados y no hay muestras independientes, algunos tests que consideran varianzas son deseables.

29 Ejemplo de Resultados Experimentales Cual experimento provee mejor evidencia que el sistema A es mejor que B? Experimento 1 Experimento 2 Syst. A Syst. B Diff Syst. A Syst. B Diff Trial 1 87% 82% +5% Trial 1 90% 82% +8% Trail 2 83% 78% +5% Trail 2 93% 76% +17% Trial 3 88% 83% +5% Trial 3 80% 85% 5% Trial 4 82% 77% +5% Trial 4 85% 75% +10% Trial 5 85% 80% +5% Trial 5 77% 82% 5% Average 85% 80% +5% Average 85% 80% +5%

30 Curvas de Aprendizaje Grafico precisión vs tamaño de set de entrenamiento. La máxima precisión (Bayes Optimal) se ha logrado o podría mejorar con mas ejemplos? La mayoría de métodos (i.e. learners) eventualmente convergen al optimo de Bayes dado suficientes ejemplos de entrenamiento. 100% Test Accuracy Bayes optimal Random guessing # Training examples

31 Validación Cruzada de Aprendizaje Divide data in k partitions of equal size For trial i = 1 to k do: Use partition i for testing and the union of the other partitions for training. For each desired point p on the learning curve do: For each learning system L Train L on the first p examples of the training set and record training time, training accuracy, and learned concept complexity. Test L on the test set, recording testing time and test accuracy. Compute average for each performance statistic across k trials. Plot curves for any desired performance statistic versus training set size. Use a paired t-test to determine significance of any differences between any two systems for a given training set size.

32 Curvas de Ruido Graficar precisión versus el nivel de ruido para determinar la resistencia relativa a datos de entrenamiento ruidosos. Artificialmente se agrega ruido en las categorías o características al remplazar alguna fracción de estos con valores aleatorios. 100% Test Accuracy % noise added

33 Conclusiones de Evaluación Experimental Una buena metodología experimental es clave para poder evaluar métodos experimentales de aprendizaje. Es importante probar en una variedad de problemas para demostrar una utilidad para una variedad de problemas. Probar en 20 o + sets de datos es común. Variedad de fuentes de datos disponibles: UCI Machine Learning Repository KDD Cup (large data sets for data mining) CoNLL Shared Task (natural language problems) Datos de problemas reales son preferidos a datos artificiales.

34 Evaluando las Hipótesis Referencias: [1] Mitchel, T., Machine Learning, McGraw Hill, 1997 [2] Mooney, R., Machine Learning Slides, University of Texas

Tests de hipótesis estadísticas

Tests de hipótesis estadísticas Tests de hipótesis estadísticas Test de hipótesis sobre la media de una población. Introducción con un ejemplo. Los tests de hipótesis estadísticas se emplean para muchos problemas, en particular para

Más detalles

Ciudad de Guatemala, 2013

Ciudad de Guatemala, 2013 Ciudad de Guatemala, 2013 1 Clase 5 Muestreo y tamaño de muestra D i e g o A y c i n e n a diegoaa@ufm.edu Universidad Francisco Marroquín 2 Clases (Profesores) H o r a r i o Actividades en Grupo (Todos)

Más detalles

SESIÓN PRÁCTICA 6: CONTRASTES DE HIPÓTESIS PROBABILIDAD Y ESTADÍSTICA. PROF. Esther González Sánchez. Departamento de Informática y Sistemas

SESIÓN PRÁCTICA 6: CONTRASTES DE HIPÓTESIS PROBABILIDAD Y ESTADÍSTICA. PROF. Esther González Sánchez. Departamento de Informática y Sistemas SESIÓN PRÁCTICA 6: CONTRASTES DE HIPÓTESIS PROBABILIDAD Y ESTADÍSTICA PROF. Esther González Sánchez Departamento de Informática y Sistemas Facultad de Informática Universidad de Las Palmas de Gran Canaria

Más detalles

ESTIMACIÓN. puntual y por intervalo

ESTIMACIÓN. puntual y por intervalo ESTIMACIÓN puntual y por intervalo ( ) Podemos conocer el comportamiento del ser humano? Podemos usar la información contenida en la muestra para tratar de adivinar algún aspecto de la población bajo estudio

Más detalles

7.- PRUEBA DE HIPOTESIS

7.- PRUEBA DE HIPOTESIS 7.- PRUEBA DE HIPOTEI 7.1. INTRODUCCIÓN La estadística inferencial es el proceso de usar la información de una muestra para describir el estado de una población. in embargo es frecuente que usemos la información

Más detalles

Análisis estadístico. Tema 1 de Biología NS Diploma BI Curso 2013-2015

Análisis estadístico. Tema 1 de Biología NS Diploma BI Curso 2013-2015 Análisis estadístico Tema 1 de Biología NS Diploma BI Curso 2013-2015 Antes de comenzar Sobre qué crees que trata esta unidad? - Escríbelo es un post-it amarillo. Pregunta guía Cómo podemos saber si dos

Más detalles

PRÁCTICA 4. Ingeniería Técnica Industrial (2º) - Mecánica.

PRÁCTICA 4. Ingeniería Técnica Industrial (2º) - Mecánica. PRÁCTICA 4. Ingeniería Técnica Industrial (2º) - Mecánica. Profesores: Javier Faulín y Francisco Ballestín 1. Introducción. El objetivo de esta parte es obtener resultados sobre contrastes de hipótesis

Más detalles

Se asignaron al azar ratas en condiciones similares a cuatro dietas (A D). Dos semanas después se midió el tiempo de coagulación.

Se asignaron al azar ratas en condiciones similares a cuatro dietas (A D). Dos semanas después se midió el tiempo de coagulación. EJEMPLO 1 Se asignaron al azar ratas en condiciones similares a cuatro dietas (A D). Dos semanas después se midió el tiempo de coagulación. DIETA1 DIETA2 DIETA3 DIETA4 62 63 68 56 60 67 66 62 63 71 71

Más detalles

"CONTRASTES DE HIPÓTESIS" 4.4 Parte básica

CONTRASTES DE HIPÓTESIS 4.4 Parte básica 76 "CONTRASTES DE HIPÓTESIS" 4.4 Parte básica 77 4.4.1 Introducción a los contrastes de hipótesis La Inferencia Estadística consta de dos partes: Estimación y Contrastes de Hipótesis. La primera se ha

Más detalles

Solución ESTADÍSTICA. Prueba de evaluación contínua 2 - PEC2

Solución ESTADÍSTICA. Prueba de evaluación contínua 2 - PEC2 Semestre set04 - feb05 Módulos 11-17 Prueba de evaluación contínua 2 - PEC2 Solución Presentación i objetivos Enunciados: descripción teórica de la práctica a realizar Materiales Criterios de evaluación

Más detalles

Capítulo 7: Distribuciones muestrales

Capítulo 7: Distribuciones muestrales Capítulo 7: Distribuciones muestrales Recordemos: Parámetro es una medida de resumen numérica que se calcularía usando todas las unidades de la población. Es un número fijo. Generalmente no lo conocemos.

Más detalles

Inferencia Estadística

Inferencia Estadística Felipe José Bravo Márquez 11 de noviembre de 2013 Para realizar conclusiones sobre una población, generalmente no es factible reunir todos los datos de ésta. Debemos realizar conclusiones razonables respecto

Más detalles

Aprendizaje automático mediante árboles de decisión

Aprendizaje automático mediante árboles de decisión Aprendizaje automático mediante árboles de decisión Aprendizaje por inducción Los árboles de decisión son uno de los métodos de aprendizaje inductivo más usado. Hipótesis de aprendizaje inductivo: cualquier

Más detalles

Eduardo Kido 26-Mayo-2004 ANÁLISIS DE DATOS

Eduardo Kido 26-Mayo-2004 ANÁLISIS DE DATOS ANÁLISIS DE DATOS Hoy día vamos a hablar de algunas medidas de resumen de datos: cómo resumir cuando tenemos una serie de datos numéricos, generalmente en variables intervalares. Cuando nosotros tenemos

Más detalles

Curso: Métodos de Monte Carlo Unidad 2, Sesión 6: Integración por Monte Carlo

Curso: Métodos de Monte Carlo Unidad 2, Sesión 6: Integración por Monte Carlo Curso: Métodos de Monte Carlo Unidad 2, Sesión 6: Integración por Monte Carlo Departamento de Investigación Operativa Instituto de Computación, Facultad de Ingeniería Universidad de la República, Montevideo,

Más detalles

BLOQUE 2 MÉTODOS DE MONTE CARLO Y TÉCNICAS DE BOOTSTRAP. Preliminares. Técnicas de Monte Carlo

BLOQUE 2 MÉTODOS DE MONTE CARLO Y TÉCNICAS DE BOOTSTRAP. Preliminares. Técnicas de Monte Carlo BLOQUE 2 MÉTODOS DE MONTE CARLO Y TÉCNICAS DE BOOTSTRAP Preliminares Para seguir adecuadamente estos apuntes es preciso recordar los conceptos claves de inferencia estadística. Es conveniente al menos

Más detalles

7.6 Comparación entre dos medias Poblacionales usando muestras independientes

7.6 Comparación entre dos medias Poblacionales usando muestras independientes 7.6 Comparación entre dos medias Poblacionales usando muestras independientes Supongamos que se tiene dos poblaciones distribuidas normalmente con medias desconocidas µ y µ, respectivamente. Se puede aplicar

Más detalles

Academia de Matemáticas. Apuntes para la Materia de Estadística II. Guía Básica para el Estudio de la Estadística Inferencial.

Academia de Matemáticas. Apuntes para la Materia de Estadística II. Guía Básica para el Estudio de la Estadística Inferencial. UNIVERSIDAD MICHOACANA DE SAN NICOLÁS DE HIDALGO Facultad de Contaduría y Ciencias Administrativas Academia de Matemáticas Apuntes para la Materia de Estadística II Guía Básica para el Estudio de la Estadística

Más detalles

Estimar, descomponer y comparar el error de mala clasificación

Estimar, descomponer y comparar el error de mala clasificación Estimar, descomponer y comparar el error de mala clasificación Evaluando y analizando el comportamiento de algoritmos de inducción de clasificadores Aritz Pérez, Pedro Larrañaga e Iñaki Inza Intelligent

Más detalles

Estimación. Intervalos de Confianza para la Media y para las Proporciones

Estimación. Intervalos de Confianza para la Media y para las Proporciones Estimación. Intervalos de Confianza para la Media y para las Proporciones Algunas secciones han sido tomadas de: Apuntes de Estadística Inferencial Instituto Tecnológico de Chiuhuahua Estimación El objetivo

Más detalles

STATGRAPHICS se refiere a cada fila del archivo como un subgrupo. El tamaño del subgrupo es n = 5.

STATGRAPHICS se refiere a cada fila del archivo como un subgrupo. El tamaño del subgrupo es n = 5. Gráficos X-Bar y R Resumen El procedimiento Gráficos X-Bar y R crea gráficos de control para una única variable numérica cuando los datos han sido reunidos en subgrupos. Crea un Gráfico X-bar para monitorear

Más detalles

COMITÉ DE ÉTICA EN INVESTIGACIÓN Y COMITÉ DE INVESTIGACIÓN. Autores: Dra. Liliana Muñoz Hernandez Dr. Carlos A. Aguilar Salinas

COMITÉ DE ÉTICA EN INVESTIGACIÓN Y COMITÉ DE INVESTIGACIÓN. Autores: Dra. Liliana Muñoz Hernandez Dr. Carlos A. Aguilar Salinas COMITÉ DE ÉTICA EN INVESTIGACIÓN Y COMITÉ DE INVESTIGACIÓN Autores: Dra. Liliana Muñoz Hernandez Dr. Carlos A. Aguilar Salinas Los comités de Ética en Investigación y de Investigación Clínica le dan la

Más detalles

Universidad del CEMA Prof. José P Dapena Métodos Cuantitativos V - ESTIMACION PUNTUAL E INTERVALOS DE CONFIANZA. 5.1 Introducción

Universidad del CEMA Prof. José P Dapena Métodos Cuantitativos V - ESTIMACION PUNTUAL E INTERVALOS DE CONFIANZA. 5.1 Introducción V - ESTIMACION PUNTUAL E INTERVALOS DE CONFIANZA 5.1 Introducción En este capítulo nos ocuparemos de la estimación de caracteristicas de la población a partir de datos. Las caracteristicas poblacionales

Más detalles

T.1 CONVERGENCIA Y TEOREMAS LÍMITE

T.1 CONVERGENCIA Y TEOREMAS LÍMITE T.1 CONVERGENCIA Y TEOREMAS LÍMITE 1. CONVERGENCIA DE SUCESIONES DE VARIABLES ALEATORIA CONVERGENCIA CASI-SEGURA CONVERGENCIA EN PROBABILIDAD CONVERGENCIA EN MEDIA CUADRÁTICA CONVERGENCIA EN LEY ( O DISTRIBUCIÓN)

Más detalles

IIC 3633 - Sistemas Recomendadores

IIC 3633 - Sistemas Recomendadores Tests Estadísticos para Comparar Recomendaciones IIC 3633 - Sistemas Recomendadores Denis Parra Profesor Asistente, DCC, PUC CHile Page 1 of 11 TOC En esta clase 1. Significancia Estadistica de los Resultados

Más detalles

Cadenas de Markov y Perron-Frobenius

Cadenas de Markov y Perron-Frobenius Cadenas de Markov y Perron-Frobenius Pablo Lessa 10 de octubre de 2014 1. Cadenas de Markov En 1996 Larry Page y Sergey Brin, en ese momento en Stanford, inventaron una manera de asignar un ranking de

Más detalles

Tema 5. Variables aleatorias discretas

Tema 5. Variables aleatorias discretas Tema 5. Variables aleatorias discretas Resumen del tema 5.1. Definición de variable aleatoria discreta 5.1.1. Variables aleatorias Una variable aleatoria es una función que asigna un número a cada suceso

Más detalles

Porqué varían los resultados analíticos?

Porqué varían los resultados analíticos? ESTADÍSTICA BÁSICA I 1. La estadística y sus objetivos. Aplicación de la Estadística en Química Analítica 3. Variabilidad analítica. Distribución normal 4. Otros conceptos básicos. Intervalos de confianza

Más detalles

Biometría Clase 8 Pruebas de hipótesis para una muestra. Adriana Pérez 1

Biometría Clase 8 Pruebas de hipótesis para una muestra. Adriana Pérez 1 Biometría Clase 8 Pruebas de hipótesis para una muestra Adriana Pérez 1 Qué es una prueba de hipótesis? Es un proceso para determinar la validez de una aseveración hecha sobre la población basándose en

Más detalles

EJERCICIOS RESUMEN. Aplicación: INFERENCIA ESTADÍSTICA. Nota técnica preparada por: Mayte Zaragoza Benítez Fecha: 13 de mayo de 2013

EJERCICIOS RESUMEN. Aplicación: INFERENCIA ESTADÍSTICA. Nota técnica preparada por: Mayte Zaragoza Benítez Fecha: 13 de mayo de 2013 Aplicación: INFERENCIA ESTADÍSTICA EJERCICIOS RESUMEN Nota técnica preparada por: Mayte Zaragoza Benítez Fecha: 13 de mayo de 2013 Página1 DESCRIP Ejercicio 1 Los siguientes son los números de cambios

Más detalles

Relación de Problemas. Modelos de Probabilidad

Relación de Problemas. Modelos de Probabilidad Relación de Problemas. Modelos de Probabilidad 1. Sabemos que en una ciudad, de cada 50000 personas, 1500 están viendo un cierto programa de TV. Cuál es la probabilidad de que de 100 personas elegidas

Más detalles

Tema 3. Variables aleatorias. Inferencia estadística

Tema 3. Variables aleatorias. Inferencia estadística Estadística y metodología de la investigación Curso 2012-2013 Pedro Faraldo, Beatriz Pateiro Tema 3. Variables aleatorias. Inferencia estadística 1. Introducción 1 2. Variables aleatorias 1 2.1. Variable

Más detalles

INFERENCIA ESTADÍSTICA: CONTRASTE DE HIPÓTESIS

INFERENCIA ESTADÍSTICA: CONTRASTE DE HIPÓTESIS INFERENCIA ESTADÍSTICA: CONTRASTE DE HIPÓTESIS Página 311 REFLEXIONA Y RESUELVE Máuina empauetadora El fabricante de una máuina empauetadora afirma ue, si se regula para ue empauete palés con 100 kg, los

Más detalles

Minería de Datos. Preprocesamiento: Reducción de Datos - Discretización

Minería de Datos. Preprocesamiento: Reducción de Datos - Discretización Minería de Datos Preprocesamiento: Reducción de Datos - Discretización Dr. Edgar Acuña Departamento de Ciencias Matemáticas Universidad de Puerto Rico-Mayaguez E-mail: edgar.acuna@upr.edu, eacunaf@gmail.com

Más detalles

ANÁLISIS DE DATOS CONTROL DE CALIDAD. Ing. Carlos Brunatti

ANÁLISIS DE DATOS CONTROL DE CALIDAD. Ing. Carlos Brunatti ANÁLISIS DE DATOS CONTROL DE CALIDAD Ing. Carlos Brunatti Montevideo, ROU, junio 2015 Control de calidad No resulta sorprendente que el hormigón sea un material variable, pues hay muchos factores involucrados

Más detalles

CONTRASTES DE HIPÓTESIS DE 1 POBLACIÓN

CONTRASTES DE HIPÓTESIS DE 1 POBLACIÓN CONTRASTES DE IPÓTESIS DE POBLACIÓN Autores: Alicia Vila (avilag@uoc.edu), Máximo Sedano (msedanoh@uoc.edu), Ángel A. Juan (ajuanp@uoc.edu), Anna López (alopezrat@uoc.edu). ESQUEMA DE CONTENIDOS Definición

Más detalles

Curso de Estadística no-paramétrica

Curso de Estadística no-paramétrica Curso de Estadística no-paramétrica Sesión 1: Introducción Inferencia no Paramétrica David Conesa Grup d Estadística espacial i Temporal Departament d Estadística en Epidemiologia i Medi Ambient i Investigació

Más detalles

Queríamos determinar cuántas partes se deben evaluar para obtener estimaciones de la variación entre partes con diferentes niveles de precisión.

Queríamos determinar cuántas partes se deben evaluar para obtener estimaciones de la variación entre partes con diferentes niveles de precisión. Este documento forma parte de un conjunto de informes técnicos que explican la investigación llevada a cabo por los especialistas en estadística de Minitab para desarrollar los métodos y las verificaciones

Más detalles

Métodos no paramétricos para la comparación de dos muestras

Métodos no paramétricos para la comparación de dos muestras Investigación Métodos no paramétricos para la comparación de dos muestras Métodos no paramétricos para la comparación de dos muestras Pértega Díaz, S. Unidad de Epidemiología Clínica y Bioestadística.

Más detalles

IIC 3633 - Sistemas Recomendadores

IIC 3633 - Sistemas Recomendadores Tests Estadísticos para Comparar Recomendaciones IIC 3633 - Sistemas Recomendadores Denis Parra Profesor Asistente, DCC, PUC CHile Page 1 of 16 TOC En esta clase 1. Significancia Estadistica de los Resultados

Más detalles

Curso Práctico de Bioestadística Con Herramientas De Excel

Curso Práctico de Bioestadística Con Herramientas De Excel Curso Práctico de Bioestadística Con Herramientas De Excel Fabrizio Marcillo Morla MBA barcillo@gmail.com (593-9) 4194239 Fabrizio Marcillo Morla Guayaquil, 1966. BSc. Acuicultura. (ESPOL 1991). Magister

Más detalles

Test de hipótesis. Si H0 es cierta el estadístico. sigue una distribución t de Student con n grados de libertad: s n

Test de hipótesis. Si H0 es cierta el estadístico. sigue una distribución t de Student con n grados de libertad: s n Un diseño experimental que se utiliza muy a menudo es el de un grupo control y uno de tratamiento. En el caso de que los datos sean cuantitativos y sigan una distribución normal, la hipótesis de interés

Más detalles

Estadística Descriptiva

Estadística Descriptiva Estadística Descriptiva Observamos datos provenientes de una o varias muestras de la población bajo estudio. El objetivo es obtener conclusiones sobre toda la población a partir de la muestra observada.

Más detalles

Aprendizaje Automatizado

Aprendizaje Automatizado Aprendizaje Automatizado Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto

Más detalles

Este procedimiento también crea una escala cusum grafica para datos individuales monitoreando la variabilidad del proceso.

Este procedimiento también crea una escala cusum grafica para datos individuales monitoreando la variabilidad del proceso. Gráfico Cusum (H-K) Resumen Los gráficos de sumas acumulativas monitorean datos por variables graficando las sumas acumulativas de las desviaciones al valor obetivo. Esto lo hace, incorporando la historia

Más detalles

Estimación de la densidad

Estimación de la densidad 23 de marzo de 2009 : histograma Si suponemos que F tiene función de densidad f puede ser útil estimarla. Un estimador muy utilizado es el histograma. Dado un origen x 0 y un ancho h > 0 el histograma

Más detalles

Test ( o Prueba ) de Hipótesis

Test ( o Prueba ) de Hipótesis Test de Hipótesis 1 Test ( o Prueba ) de Hipótesis Ejemplo: Una muestra de 36 datos tiene una media igual a 4.64 Qué puede deducirse acerca de la población de donde fue tomada? Se necesita contestar a

Más detalles

Variables aleatorias continuas

Variables aleatorias continuas Variables aleatorias continuas Hemos definido que una variable aleatoria X es discreta si I X es un conjunto finito o infinito numerable. En la práctica las variables aleatorias discretas sirven como modelos

Más detalles

Pero qué hacemos cuando no se cumple la normalidad o tenemos muy pocos datos?

Pero qué hacemos cuando no se cumple la normalidad o tenemos muy pocos datos? Capítulo. Métodos no paramétricos Los métodos presentados en los capítulos anteriores, se basaban en el conocimiento de las distribuciones muestrales de las diferencias de porcentajes o promedios, cuando

Más detalles

INFERENCIA ESTADÍSTICA

INFERENCIA ESTADÍSTICA INFERENCIA ESTADÍSTICA Pensemos en los tres siguientes ejemplos: Hacemos una encuesta entre los clientes de una tienda para preguntarles su opinión sobre cambios generales que pretendemos hacer en diversas

Más detalles

Relación de problemas: Variables aleatorias

Relación de problemas: Variables aleatorias Estadística y modelización. Ingeniero Técnico en Diseño Industrial. Relación de problemas: Variables aleatorias 1. Se lanza tres veces una moneda y se observa el número de caras. (a) Calcula la distribución

Más detalles

Comparación de medias

Comparación de medias 12 Comparación de medias Irene Moral Peláez 12.1. Introducción Cuando se desea comprobar si los valores de una característica que es posible cuantificar (como podría ser la edad o la cifra de tensión arterial,

Más detalles

INFERENCIA ESTADISTICA: CONTRASTE DE HIPÓTESIS

INFERENCIA ESTADISTICA: CONTRASTE DE HIPÓTESIS UNIVERSIDAD CENTROCCIDENTAL LISANDRO ALVARADO DECANATO DE MEDICINA DEPARTAMENTO DE MEDICINA PREVENTIVA Y SOCIAL SECCIÓN DE EPIDEMIOLOGÍA-BIOESTADÍSTICA INFERENCIA ESTADISTICA: CONTRASTE DE HIPÓTESIS Objetivo:

Más detalles

Pruebas de. Hipótesis

Pruebas de. Hipótesis Pruebas de ipótesis Pruebas de ipótesis Otra manera de hacer inferencia es haciendo una afirmación acerca del valor que el parámetro de la población bajo estudio puede tomar. Esta afirmación puede estar

Más detalles

Estadística aplicada y modelización. 15 de junio de 2005

Estadística aplicada y modelización. 15 de junio de 2005 Estadística aplicada y modelización. 15 de junio de 2005 SOLUCIÓN MODELO A 1. En una población de fumadores se quiere examinar la relación entre el número de cigarrillos que consumen diariamente y el número

Más detalles

Inteligencia Artificial II (Curso 2012-2013) Ejercicios propuestos del tema 4

Inteligencia Artificial II (Curso 2012-2013) Ejercicios propuestos del tema 4 Inteligencia Artificial II (Curso 2012-2013) Ejercicios propuestos del tema 4 Ejercicio 1: En una máquina expendedora de huevos sorpresa, unos huevos están pintados de rojo y otros de azul. El 40% de los

Más detalles

Anexo 4. Herramientas Estadísticas

Anexo 4. Herramientas Estadísticas Anexo 4 Herramientas Estadísticas La estadística descriptiva es utilizada como una herramienta para describir y analizar las características de un conjunto de datos, así como las relaciones que existen

Más detalles

Distribuciones de Probabilidad en Arena

Distribuciones de Probabilidad en Arena Distribuciones de Probabilidad en Arena Arena posee una amplia gama de funciones o distribuciones estadísticas incorporadas para la generación de números aleatorios. Estas distribuciones aparecen cuando,

Más detalles

VivaMéxico sin PRI. Quiero que mi país sea de todos. Dr. Ivo H. Pineda Torres. Otoño 2013

VivaMéxico sin PRI. Quiero que mi país sea de todos. Dr. Ivo H. Pineda Torres. Otoño 2013 VivaMéxico sin PRI Quiero que mi país sea de todos. Dr. Ivo H. Pineda Torres Facultad de Ciencias de la Computación Benemérita Universidad Autónoma de Puebla Otoño 2013 IMAGENESpemexmorena Adquisición

Más detalles

Tema 3. Concepto de Probabilidad

Tema 3. Concepto de Probabilidad Tema 3. Concepto de Probabilidad Presentación y Objetivos. El Cálculo de Probabilidades estudia el concepto de probabilidad como medida de incertidumbre. En situaciones donde se pueden obtener varios resultados

Más detalles

Cómo se usa Data Mining hoy?

Cómo se usa Data Mining hoy? Cómo se usa Data Mining hoy? 1 Conocer a los clientes Detectar segmentos Calcular perfiles Cross-selling Detectar buenos clientes Evitar el churning, attrition Detección de morosidad Mejora de respuesta

Más detalles

Naive Bayes Multinomial para Clasificación de Texto Usando un Esquema de Pesado por Clases

Naive Bayes Multinomial para Clasificación de Texto Usando un Esquema de Pesado por Clases Naive Bayes Multinomial para Clasificación de Texto Usando un Esquema de Pesado por Clases Emmanuel Anguiano-Hernández Abril 29, 2009 Abstract Tratando de mejorar el desempeño de un clasificador Naive

Más detalles

Tema 1. Inferencia estadística para una población

Tema 1. Inferencia estadística para una población Tema 1. Inferencia estadística para una población Contenidos Inferencia estadística Estimadores puntuales Estimación de la media y la varianza de una población Estimación de la media de la población mediante

Más detalles

LA MEDIDA Y SUS ERRORES

LA MEDIDA Y SUS ERRORES LA MEDIDA Y SUS ERRORES Magnitud, unidad y medida. Magnitud es todo aquello que se puede medir y que se puede representar por un número. Para obtener el número que representa a la magnitud debemos escoger

Más detalles

Hipótesis Alternativa: Afirmación sobre las posibles alternativas que se tienen a la afirmación hecha en la hipótesis nula.

Hipótesis Alternativa: Afirmación sobre las posibles alternativas que se tienen a la afirmación hecha en la hipótesis nula. PRUEBA DE HIPÓTESIS Introducción (10 min) En el mundo de las finanzas, la administración y la economía tan importante como saber hacer y entender a cabalidad las estimaciones que nos ayudaran a la toma

Más detalles

Sistemas de Generación de Energía Eléctrica HIDROLOGÍA BÁSICA. Universidad Tecnológica De Pereira

Sistemas de Generación de Energía Eléctrica HIDROLOGÍA BÁSICA. Universidad Tecnológica De Pereira 2010 Sistemas de Generación de Energía Eléctrica HIDROLOGÍA BÁSICA Universidad Tecnológica De Pereira Conceptos Básicos de Hidrología La hidrología es una ciencia clave en el estudio de los sistemas de

Más detalles

PRUEBAS DE HIPÓTESIS

PRUEBAS DE HIPÓTESIS PRUEBAS DE HIPÓTESIS Muchos problemas de ingeniería, ciencia, y administración, requieren que se tome una decisión entre aceptar o rechazar una proposición sobre algún parámetro. Esta proposición recibe

Más detalles

1. Conceptos de teoría de la probabilidad

1. Conceptos de teoría de la probabilidad Master de Investigación en Economía Aplicada. Métodos Cuantitativos II. 9-. G.García.. Conceptos de teoría de la probabilidad Espacios de probabilidad. Establece el espacio de probabilidad asociado al

Más detalles

www.medigraphic.org.mx

www.medigraphic.org.mx Investigación Vol. 80, Núm. 2 Marzo-Abril 2013 pp 81-85 Cómo seleccionar una prueba estadística (Segunda parte) (Choosing a statistical test. [Second part]) Manuel Gómez-Gómez,* Cecilia Danglot-Banck,*

Más detalles

Clase 8: Distribuciones Muestrales

Clase 8: Distribuciones Muestrales Clase 8: Distribuciones Muestrales Distribución Muestral La inferencia estadística trata básicamente con generalizaciones y predicciones. Por ejemplo, podemos afirmar, con base a opiniones de varias personas

Más detalles

TRATAMIENTO ESTADÍSTICO DEL RUIDO EN LA MEDICIÓN

TRATAMIENTO ESTADÍSTICO DEL RUIDO EN LA MEDICIÓN TRATAMIENTO ESTADÍSTICO DEL RUIDO EN LA MEDICIÓN Julio Guimpel Estas páginas son un resumen tipo ayuda-memoria para el tratamiento estadístico del ruido en la medición. No se demostrarán las ecuaciones

Más detalles

Tema 2: Estimación puntual

Tema 2: Estimación puntual Tema 2: Estimación puntual 1 (basado en el material de A. Jach (http://www.est.uc3m.es/ajach/) y A. Alonso (http://www.est.uc3m.es/amalonso/)) Planteamiento del problema: estimador y estimación Insesgadez

Más detalles

Tema 3 VARIABLE ALEATORIA DISCRETA. PRINCIPALES DISTRIBUCIONES

Tema 3 VARIABLE ALEATORIA DISCRETA. PRINCIPALES DISTRIBUCIONES Tema 3 VARIABLE ALEATORIA DISCRETA. PRINCIPALES DISTRIBUCIONES 1.- Definición de variable aleatoria discreta. Normalmente, los resultados posibles (espacio muestral Ω) de un experimento aleatorio no son

Más detalles

Anexo 11. Valoración de la calidad de los distintos tipos de estudios

Anexo 11. Valoración de la calidad de los distintos tipos de estudios Anexo 11. Valoración de la calidad de los distintos tipos de estudios Ensayos Clínicos Un ensayo clínico aleatorizado (ECA) es un estudio experimental en el que se aplica una intervención a un grupo de

Más detalles

aplicado al Experiencia La gestión de un servicio y, por ende, la

aplicado al Experiencia La gestión de un servicio y, por ende, la EN PORTADA 6 Sigma aplicado al Experiencia En este artículo vamos a dar una visión más particular sobre la aplicabilidad de 6 Sigma al sector Servicios. Existe abundante literatura al respecto, pero sobre

Más detalles

Experimentos con un solo factor: El análisis de varianza. Jhon Jairo Padilla Aguilar, PhD.

Experimentos con un solo factor: El análisis de varianza. Jhon Jairo Padilla Aguilar, PhD. Experimentos con un solo factor: El análisis de varianza Jhon Jairo Padilla Aguilar, PhD. Experimentación en sistemas aleatorios: Factores Controlables Entradas proceso Salidas Factores No controlables

Más detalles

Inferencia Estadística

Inferencia Estadística Universidad Nacional de San Cristóbal de Huamanga Facultad de Ingeniería de Minas, Geología y Civil Departamento Académico de Matemática y Física Área de Estadística Inferencia Estadística Alejandro Guillermo

Más detalles

Propiedades de Muestras Grandes y Simulación

Propiedades de Muestras Grandes y Simulación Propiedades de Muestras Grandes y Simulación Microeconomía Cuantitativa R. Mora Departmento of Economía Universidad Carlos III de Madrid Esquema 1 Propiedades en muestras grandes (W App C3) 2 3 Las propiedades

Más detalles

TEMA UNIDAD III:INFERENCIA ESTADÍSTICA 11.1. INTRODUCCIÓN

TEMA UNIDAD III:INFERENCIA ESTADÍSTICA 11.1. INTRODUCCIÓN PRUEBA DE HIPÓTESIS TEMA..INTRODUCCIÓN..ELEMENTOS DE LAS PRUEBAS DE HIPÓTESIS.3.PRUEBA DE HIPÓTESIS PARA UNA MEDIA POBLACIONAL.3.. Caso: muestra grande.3.. Caso: muestra pequeña.4.prueba DE HIPÓTESIS PARA

Más detalles

Aprendizaje Basado en Similaridades (SBL) Árboles de Decisión (TDIDT) (INAOE) 1 / 65. Algoritmo ID3 Cómo le hace

Aprendizaje Basado en Similaridades (SBL) Árboles de Decisión (TDIDT) (INAOE) 1 / 65. Algoritmo ID3 Cómo le hace INAOE (INAOE) 1 / 65 Contenido 1 2 (INAOE) 2 / 65 SBL Atributos Peludo? Edad? Tamaño? Clase si viejo grande león no joven grande no león si joven mediano león si viejo pequeño no león si joven pequeño

Más detalles

Soluciones Examen de Estadística Ingeniería Superior de Telecomunicación

Soluciones Examen de Estadística Ingeniería Superior de Telecomunicación Soluciones Examen de Estadística Ingeniería Superior de Telecomunicación de Septiempbre, 00 Cuestiones 1h C1. El tiempo que un ordenador tarda en ejecutar una tarea es una v.a. Y Expλ). Para hacer un estudio

Más detalles

Planificación del tamaño de la muestra. para las evaluaciones de impactos. David Evans, Banco Mundial. (Banco Mundial) Turning Promises into Evidence

Planificación del tamaño de la muestra. para las evaluaciones de impactos. David Evans, Banco Mundial. (Banco Mundial) Turning Promises into Evidence Planificación del tamaño de la muestra para las evaluaciones de impactos David Evans, Banco Mundial Basada en transparencias de Esther Duflo (J-PAL) y Jed Friedman (Banco Mundial) REGIONAL IMPACT EVALUATION

Más detalles

EL PODER ESTADÍSTICO. DIFERENCIAS OBSERVADAS CUANDO SE CAMBIA EL ALFA ESTABLECIDO EN UN ESTUDIO DE INVESTIGACIÓN

EL PODER ESTADÍSTICO. DIFERENCIAS OBSERVADAS CUANDO SE CAMBIA EL ALFA ESTABLECIDO EN UN ESTUDIO DE INVESTIGACIÓN EL PODER ESTADÍSTICO. DIFERENCIAS OBSERVADAS CUANDO SE CAMBIA EL ALFA ESTABLECIDO EN UN ESTUDIO DE INVESTIGACIÓN Mylord Reyes Tosta, EdD Resumen Se utilizaron dos ejemplos para una prueba de hipótesis

Más detalles

Clase 5: Variables Aleatorias y Distribuciones de Probabilidad

Clase 5: Variables Aleatorias y Distribuciones de Probabilidad Clase 5: Variables Aleatorias y Distribuciones de Probabilidad Variables Aleatorias Una variable aleatoria es una función que asocia un número real con cada elemento del EM. Ejemplo 1: El EM que da una

Más detalles

ESTADÍSTICA. Tema 3 Contrastes de hipótesis

ESTADÍSTICA. Tema 3 Contrastes de hipótesis ESTADÍSTICA Grado en CC. de la Alimentación Tema 3 Contrastes de hipótesis Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 1 Estructura de este tema Qué es un contraste

Más detalles

LA DISTRIBUCIÓN NORMAL, LA CALCULADORA Y LAS NUEVAS TECNOLOGÍAS Abel Martín ( * ) Rosana Álvarez García ( )

LA DISTRIBUCIÓN NORMAL, LA CALCULADORA Y LAS NUEVAS TECNOLOGÍAS Abel Martín ( * ) Rosana Álvarez García ( ) LA DISTRIBUCIÓN NORMAL, LA CALCULADORA Y LAS NUEVAS TECNOLOGÍAS Abel Martín ( * ) Rosana Álvarez García ( ) La distribución Normal tiene numerosas aplicaciones en el campo de la Probabilidad y la Estadística,

Más detalles

MATEMÁTICAS CCSS JUNIO 2010 (COMÚN MODELO5) SELECTIVIDAD ANDALUCÍA

MATEMÁTICAS CCSS JUNIO 2010 (COMÚN MODELO5) SELECTIVIDAD ANDALUCÍA IES Fco Ayala de Granada Junio de 010 (General Modelo 5) Soluciones Germán-Jesús Rubio Luna MATEMÁTICAS CCSS JUNIO 010 (COMÚN MODELO5) SELECTIVIDAD ANDALUCÍA OPCIÓN A EJERCICIO 1 Sea el recinto definido

Más detalles

Estimación puntual. Estadística II. Curso 2011/2012. Universidad de Salamanca

Estimación puntual. Estadística II. Curso 2011/2012. Universidad de Salamanca Estadística II Universidad de Salamanca Curso 2011/2012 Outline 1 Introducción 2 3 4 Introducción Una estimación puntual de algún parámetro poblacional θ es un valor único del estadístico θ. Por ejemplo,

Más detalles

1. Introducción a la estadística 2. Estadística descriptiva: resumen numérico y gráfico de datos 3. Estadística inferencial: estimación de parámetros

1. Introducción a la estadística 2. Estadística descriptiva: resumen numérico y gráfico de datos 3. Estadística inferencial: estimación de parámetros TEMA 0: INTRODUCCIÓN Y REPASO 1. Introducción a la estadística 2. Estadística descriptiva: resumen numérico y gráfico de datos 3. Estadística inferencial: estimación de parámetros desconocidos 4. Comparación

Más detalles

PROBABILIDADES Y ESTADÍSTICA (C) Práctica 2

PROBABILIDADES Y ESTADÍSTICA (C) Práctica 2 PROBABILIDADES Y ESTADÍSTICA (C) Práctica 2 1. Se eligen tres autos al azar y cada uno es clasificado N si tiene motor naftero o D si tiene motor diesel (por ejemplo, un resultado posible sería NND). a)

Más detalles

ANÁLISIS ESTADÍSTICO DE DATOS USANDO MINITAB

ANÁLISIS ESTADÍSTICO DE DATOS USANDO MINITAB ANÁLISIS ESTADÍSTICO DE DATOS USANDO MINITAB Tercera Edición EDGAR ACUÑA FERNANDEZ UNIVERSIDAD DE PUERTO RICO RECINTO UNIVERSITARIO DE MAYAGUEZ DEPARTAMENTO DE MATEMATICAS e-mail:edgar@math.uprm.edu homepage:math.uprm.edu/~edgar

Más detalles

Métodos y Diseños utilizados en Psicología

Métodos y Diseños utilizados en Psicología Métodos y Diseños utilizados en Psicología El presente documento pretende realizar una introducción al método científico utilizado en Psicología para recoger información acerca de situaciones o aspectos

Más detalles

Determinación de primas de acuerdo al Apetito de riesgo de la Compañía por medio de simulaciones

Determinación de primas de acuerdo al Apetito de riesgo de la Compañía por medio de simulaciones Determinación de primas de acuerdo al Apetito de riesgo de la Compañía por medio de simulaciones Introducción Las Compañías aseguradoras determinan sus precios basadas en modelos y en información histórica

Más detalles

Integrantes: Leonardo Tilli (leotilli@gmail.com) Fernando Hernández (matematicas527@yahoo.es)

Integrantes: Leonardo Tilli (leotilli@gmail.com) Fernando Hernández (matematicas527@yahoo.es) UNIVERSIDAD DE BUENOS AIRES Facultad de Ciencias Exactas y Naturales Departamento de Computación Trabajo Práctico de Metaheurística Segundo cuatrimestre 2010 Implementación de un Algoritmo basado en la

Más detalles

MADRID / JUNIO 06 LOGSE / MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES / OPCIÓN A/ EXAMEN COMPLETO

MADRID / JUNIO 06 LOGSE / MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES / OPCIÓN A/ EXAMEN COMPLETO EXAMEN COMPLETO INSTRUCCIONES GENERALES Y VALORACIÓN INSTRUCCIONES: El examen presenta dos opciones: A y B. El alumno deberá elegir una de ellas y contestar razonadamente a los cuatro ejercicios de que

Más detalles

Distribuciones discretas. Distribución Binomial

Distribuciones discretas. Distribución Binomial Boletín: Distribuciones de Probabilidad IES de MOS Métodos estadísticos y numéricos Distribuciones discretas. Distribución Binomial 1. Una urna contiene 3 bolas blancas, 1 bola negra y 2 bolas azules.

Más detalles

ERRORES CONCEPTUALES DE ESTADÍSTICA EN ESTUDIANTES

ERRORES CONCEPTUALES DE ESTADÍSTICA EN ESTUDIANTES ERRORES CONCEPTUALES DE ESTADÍSTICA EN ESTUDIANTES DE BÁSICA PRIMARIA EN LA CIUDAD DE PEREIRA José R. Bedoya Universidad Tecnológica de Pereira Pereira, Colombia La formación estadística en la ciudadanía,

Más detalles

INFERENCIA ESTADISTICA: Lic. Laura Marangunich

INFERENCIA ESTADISTICA: Lic. Laura Marangunich INFERENCIA ESTADISTICA: Lic. Laura Marangunich Frente a la necesidad de estudiar un fenómeno en la población y ante la imposibilidad de censarla (estudiarla en forma exhaustiva), debemos recurrir a la

Más detalles

Curso Comparabilidad de resultados

Curso Comparabilidad de resultados Curso Comparabilidad de resultados Director: Gabriel A. Migliarino. Docente: Evangelina Hernández. Agenda Introducción. n. Protocolos iniciales de comparación de métodos. m * EP9-A2. CLSI. * Comparación

Más detalles

Una introducción a la ESTADÍSTICA INFERENCIAL

Una introducción a la ESTADÍSTICA INFERENCIAL Una introducción a la ESTADÍSTICA INFERENCIAL José Chacón Esta obra está bajo una licencia Reconocimiento No comercial Compartir bajo la misma licencia.5 de Creative Commons. Para ver una copia de esta

Más detalles