Análisis de la Varianza (ANOVA) y Correlación
|
|
- Marcos Segura Naranjo
- hace 6 años
- Vistas:
Transcripción
1 Universidad de Chile Rodrigo Assar FCFM MA34B Andrés Iturriaga DIM Víctor Riquelme Análisis de la Varianza (ANOVA) y Correlación Resumen El test ANOVA analiza la relación entre una variable numérica y una categórica, y ve si hay relación funcional entre ambas. La correlación nos da una medida de la relación lineal entre dos variables numéricas. 1. ANOVA 1.1. Razón de Correlación Supongamos tenemos dos variables aleatorias X e, tales que toma valores numéricos (digamos continuos), y X toma valores en un conjunto de categorías finito (digamos {x 1,..., x p }). Entonces queremos analizar la relación entre y X (o sea si depende de la categoría a la que pertenezca X). Definamos ȳ j = 1 n j nj k=1 y jk media en el grupo j. ȳ = 1 n p j=1 n jȳ j media total. s 2 y = 1 n n l=1 (y l ȳ) 2 = 1 p nj n j=1 k=1 (y jk ȳ) 2 varianza muestral (y jk es el dato del individuo k ésimo que pertenece al grupo j). w 2 j = 1 n j nj k=1 (y jk ȳ j ) 2 la varianza al interior del grupo j. b 2 = 1 n p j=1 n j(ȳ j ȳ) 2 la varianza ponderada entre-grupos. ω 2 = 1 n p j=1 n jw 2 j = 1 n p j=1 nj k=1 (y jk ȳ j ) 2 la varianza intra-grupos. 1
2 1 ANOVA 2 Obs: Se tiene que s 2 y = b 2 + ω 2 (esta es una descomposición de la varianza). Definamos η 2 X = b2 s 2 y la razón de correlación. Si ω 2 = 0 (o sea, η 2 X = 1), entonces w2 j = 0 j; o sea, al interior de los grupos no hay diferencia y se concluye que el pertenecer a un grupo define completamente a la variable (relación funcional estricta entre X e ). Si b 2 = 0 (o sea, η 2 X = 0), entonces no hay difenencia entre las medias de los grupos, por lo que pertenecer a algún grupo no define a la variable (no hay relación funcional). En el caso intermedio (o sea, η 2 X (0, 1)), se tiene cierta tendencia funcional. Luego, η 2 X da una medida de la relación funcional entre y X ANOVA a un factor Supongamos que las observaciones en cada grupo j son normales de varianza σ 2 j. Entonces n j w 2 j σ 2 j χ 2 n j 1. Suponiendo que σj 2 = σ 2 j, se tiene que nω2 σ 2 (suma de las varianzas de los p grupos). Consideremos el estadístico χ 2 n p. También, que nb2 σ 2 χ 2 p 1 F = nb 2 /σ 2 (p 1) nω 2 /σ 2 n p = b2 /(p 1) ω 2 /(n p) F p 1,n p Nuestra hipótesis nula será H 0 : µ 1 = µ 2 =... = µ p Como ya vimos, si no hay relación funcional entre y X, b 2 es chico y las medias serían muy parecidas, por lo que si el p valor es chico (menor a cierto nivel de significación) se rechaza la hipótesis (recordemos que el p valor es P ( F F ) ). Esto significa que el factor es significativo. Podemos escribir nuestra información en una tabla, como sigue: S.C. G.L. C.M. F p valor Factor nb 2 p 1 nb 2 nb /(p 1) 2 /(p 1) P ( F > F ) nω 2 /(n p) Errores nω 2 n p nω 2 /(n p) Total ns 2 y n 1
3 2 COVARIANZA CORRELACIÓN 3 2. Covarianza y Correlación 2.1. Teóricos Primero, recordemos la definición de covarianza y correlación. Definición 1 Sean X e dos variables aleatorias con alguna distribución conjunta; sean E [X] = µ X, E [ ] = µ, Var (X) = σ 2 X, Var ( ) = σ 2. Definimos la covarianza entre X e, denotada por Cov (X, ), por: Cov (X, ) = E [(X µ X )( µ )] También, definamos la correlación entre X e por ρ (X, ) = Cov (X, ) σ X σ Hay una propiedad que permite decir algo importante acerca de la correlación: Teorema 1 (Desigualdad de Schwarz) Para cualquier par de variables aleatorias U, V se tiene que E [UV ] (E [ U 2] E [ V 2] ) 1 2 Dem Si E [ U 2] = 0 entonces P (U = 0) = 1. Luego, P (UV = 0) = 1, por lo que E [UV ] = 0, y la desigualdad se tiene. Si E [ U 2] =, la desigualdad se tiene trivialmente. Supongamos que 0 < E [ U 2] <, 0 < E [ V 2] <. Sabemos que a, b (a 2 E [ U 2] + b 2 E [ V 2] ) 2abE [UV ] y de igual manera 0 E [ (au + bv ) 2] = a 2 E [ U 2] + b 2 E [ V 2] + 2abE [UV ] 0 E [ (au bv ) 2] = a 2 E [ U 2] + b 2 E [ V 2] 2abE [UV ] 2abE [UV ] (a 2 E [ U 2] + b 2 E [ V 2] ) Elegimos a = E [ V 2], b = E [ U 2]. Entonces 2 E [ U 2] E [ V 2] E [UV ] (E [ V 2] E [ U 2] + E [ U 2] E [ V 2] ) 2 E [ U 2] E [ V 2] E [UV ] 2E [ U 2] E [ V 2] E [UV ] E [ U 2] E [ V 2]
4 2 COVARIANZA CORRELACIÓN 4 de igual forma E [ U 2] E [ V 2] E [UV ] y eso concluye el resultado. Ahora, lo que nos interesa es lo siguiente: si llamamos U = X µ X, V = µ, obtenemos que E [(X µ X )( µ )] E [ (X µ X ) 2] E [ ( µ ) 2] Cov (X, ) Var (X)Var ( ) Entonces, ρ (X, ) [ 1, 1]. Proposición 1 Para cualquier par de variables aleatorias X e, con σx 2 <, σ2 tiene que Cov (X, ) = E [X ] E [X]E [ ] <, se Dem Cov (X, ) = E [(X µ X )( µ )] = E [X Xµ µ X + µ X µ ] = E [X ] E [X]µ E [ ]µ X + µ X µ = E [X ] µ X µ Proposición 2 Si X e son variables aleatorias independientes con 0 < σ 2 X <, 0 < σ2 <, entonces Cov (X, ) = ρ (X, ) = 0 Dem Como X e son independientes, entonces E [X ] = E [X]E [ ]. Por la proposición anterior, se concluye. Proposición 3 Suponga que X es una variable aleatoria con varianza positiva finita, y que = ax + b para algunas constantes a, b, a 0. Entonces, si a > 0, ρ (X, ) = 1; si a > 0, ρ (X, ) = 1 Dem Primero vemos que E [ ] = E [ax + b] = ae [X] + b = aµ X + b Var ( ) = Var (ax + b) = a 2 Var ( ) = a 2 σ 2 X. ρ (X, ) = Cov (X, ) Var (X)Var ( )
5 2 COVARIANZA CORRELACIÓN 5 = E [(X µ x)(ax + b aµ X b)] σ 2 X a 2 σx 2 = ae [ (X µ X ) 2] a σx 2 = a a = a a Var (X) σ 2 X Si a > 0, lo anterior vale 1, y si a < 0, lo anterior vale 1. Obs: Para constantes a, b, Cov (ax, b ) = abcov (X, ) pues Cov (ax, b ) = E [(ax)(b )] E [ax]e [b ] = ab(e [X ] E [X]E [ ]) Teorema 2 Si X 1,..., X n son v.a. con varianza finita, entonces ( n ) n n Var X i = Cov (X j, X k ) = i=1 i=1 Var (X i ) + j,k j k Dem Propuesta (para n = 2 se ve fácil). i=1 Var (X i ) + 2 j,k j<k Cov (X j, X k ) 2.2. Empíricos Ahora consideremos una muestra aleatoria bivariada {(x i, y i )} n i=1 del par de variables aleatorias (X, ). Denotemos: x = 1 n n i=1 x i, ȳ = 1 n n i=1 y i las medias empíricas. s 2 x = 1 n n i=1 (x i x) 2 = 1 n n i=1 x2 i x 2, s 2 y = 1 n n i=1 (y i ȳ) 2 = 1 n n i=1 y2 i ȳ 2 las varianzas empíricas. cov x,y = 1 n n i=1 (x i x)(y i ȳ) = 1 n n i=1 x iy i xȳ la covarianza empírica. r X, = covx,y s xs y es el coeficiente de correlación empírico. Calculando el valor r X, se puede decir algo acerca de la correlación entre X e, de forma análoga a lo dicho para ρ (X, ).
6 3 PROBLEMAS 6 3. Problemas 3.1. Problema 1 [Ajuste χ 2 ] Se ha tomado una muestra de 90 motores de cierta marca y se ha medido el tiempo de funcionamiento en miles de horas, hasta que fallan por primera vez, obteniendose los siguientes resultados: Tiempo Frecuencia (0, 1] 35 (1, 2] 26 (2, 3] 12 (3, 4] 6 Más de 4 11 Se puede aceptar que el tiempo hasta el fallo de estos motores sigue una distribución exponencial? 3.2. Problema 2 [ANOVA] Un agricultor quiere analizar la influencia de 4 grupos F1S1,F2S2,F1S2,F2S1 del factor fertilizantesuelo con la producción de choclos. Se obtiene la siguiente tabla: Fertilizante-Suelo Frecuencia Media producción Desviación Standard F1S F2S F1S F2S Total Haga un test que indique o que le permita deducir la igualdad de las medias para los 4 grupos Problema 3 (a) Supóngase que X e son variables aleatorias que representan las mediciones de la alturas del padre y del hijo respectivamente, donde µ X = µ = µ, σx 2 = σ2 = σ2. Sean X, v.a. tales que X = X + ɛ; = + η donde ɛ, η son los errores de medición, y X, son los valores reales de las alturas; supóngase también que η, ɛ son independientes de X e
7 4 RESOLUCIÓN DE LOS PROBLEMAS 7 e independientes entre si. Exprese la correlación entre X e en términos de la correlación entre X e. Concluya. (b) Se obtiene una muestra de familias y se obtienen los siguientes resultados: x = ; ȳ = i=1 x2 1 i = 29239; i=1 x iy i = i=1 y2 i = Deduzca el coeficiente de correlación entre las tallas observadas del padre y del hijo. Si se supone que la varianza de los errores de medición es 9, de una estimación de la correlación ρ (X, ) entre las tallas verdaderas X,. Comente 4. Resolución de los problemas 4.1. Problema 1 Primero, para postular la distribución a ser testeada, estimamos el parámetro de la exponencial. H 0 : T Exp(ˆλ) ˆλ = 1 T = = = Ahora necesitamos el vector de probabilidades a testear. En este caso, será el vector p R 5 tal que p i = P (T I i ) (I 1 = (0, 1], I 2 = (1, 2], I 3 = (2, 3], I 4 = (3, 4], I 5 = (4, ], y una distribución exponencial de parametro ˆλ). P (α < T β) = P (α T ) P (β T ) = e ˆλα e ˆλβ Luego, p = (0.43; 0.25; 0.14; 0.08; 0.1). Entonces el estadístico (distribuido como χ ) (se resta uno más por la estimación del parámetro) toma el valor Q = El p valor es P (Q > 1.57) (0.6, 0.7) > 0.05, con lo que se concluye que no se rechaza la hipótesis de que los tiempos de falla sean exponenciales.
8 4 RESOLUCIÓN DE LOS PROBLEMAS Problema 2 Calculemos las varianzas entregrupo e intragrupo: b 2 = 4 j=1 n j n (ȳ j ȳ) 2 = 7.04 Entonces, haciendo la tabla ω 2 = 4 j=1 n j n w2 j = S.C. G.L. C.M. F p valor Factor = Errores = Total Analizando el p valor, rechazamos la hipótesis, y por lo tanto concluimos que el tipo de suelo es relevante para la producción de choclos. Ahora, la razón de correlación es η 2 X = b2 s 2 y = nb2 ns 2 y = = 0.7 Podemos concluir que existe una tendencia funcional entre la producción de choclos y el tipo de fertilizante Problema 3 Parte (a) Primero calculemos la varianza de X: Var (X) = Var (X + ɛ) = Var (X ) + Var (ɛ) = σ 2 X + Var (ɛ) σ2 X De igual manera, para : σ 2 X σ 2 X Var ( ) = Var ( + η) = Var ( ) + Var (η) = σ 2 + Var (η) σ2 σ 2 σ 2
9 4 RESOLUCIÓN DE LOS PROBLEMAS 9 Ahora, la covarianza entre X e : Cov (X, ) = Cov (X + ɛ, + η) = Cov (X, ) + Cov (X, η) + Cov (ɛ, ) + Cov (ɛ, η) Cov (X, ) = Cov (X, ) Luego, ρ (X, ) = Cov (X, ) σ X σ = Cov (X, ) (σx 2 + Var (ɛ))(σ 2 + Var (η)) ρ (X, ) ρ (X, ) Podemos concluir que la correlación de los datos de la muestra subestima la correlación de los datos reales. Parte (b) Como estimador de la correlación entre X e usaremos el coeficiente de correlación empírico r X, r X, = = = 1 1 i=1 (x i x)(y i ȳ) i=1 (x i x) 2 1 i=1 (y i ȳ) 2 1 i=1 x iy i xȳ 1 i=1 x2 i x2 1 i=1 y2 i ȳ = = = Para estimar la correlación entre los valores reales, consideremos donde r X, = σ Xσ r X, σ X σ σx 2 = σx 2 + Var (ɛ) = σ 2 X + 9 σ X = 8.39
10 REFERENCIAS 10 Luego, σ 2 = σ 2 + Var (η) = σ σ = r X, = = = 0.91 Aquí se nota cuanto se subestima la correlación de los valores reales con el uso de los datos muestrales Referencias [DeGroot;1986] DeGroot, M.H.; Probability and Statistics, Second Edition ; Addison-Wesley S.A.; pp ; [Lacourly;04] Lacourly, N.; Estadística ; Depto. de Publicaciones DIM ; pp ; 04.
Tema 4: Probabilidad y Teoría de Muestras
Tema 4: Probabilidad y Teoría de Muestras Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 4: Probabilidad y Teoría de Muestras Curso 2008-2009
Más detallesANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.
ANEXO 1. CONCEPTOS BÁSICOS Este anexo contiene información que complementa el entendimiento de la tesis presentada. Aquí se exponen técnicas de cálculo que son utilizados en los procedimientos de los modelos
Más detallesTeorema Central del Límite (1)
Teorema Central del Límite (1) Definición. Cualquier cantidad calculada a partir de las observaciones de una muestra se llama estadístico. La distribución de los valores que puede tomar un estadístico
Más detallesDistribuciones de probabilidad bidimensionales o conjuntas
Distribuciones de probabilidad bidimensionales o conjuntas Si disponemos de dos variables aleatorias podemos definir distribuciones bidimensionales de forma semejante al caso unidimensional. Para el caso
Más detallesESTADÍSTICA. Tema 4 Regresión lineal simple
ESTADÍSTICA Grado en CC. de la Alimentación Tema 4 Regresión lineal simple Estadística (Alimentación). Profesora: Amparo Baíllo Tema 4: Regresión lineal simple 1 Estructura de este tema Planteamiento del
Más detallesMétodos Estadísticos Multivariados
Métodos Estadísticos Multivariados Victor Muñiz ITESM Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre 2011 1 / 20 Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre
Más detallesEstructura de este tema. Tema 3 Contrastes de hipótesis. Ejemplo
Estructura de este tema Tema 3 Contrastes de hipótesis José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Qué es un contraste de hipótesis? Elementos de un contraste: hipótesis,
Más detallesESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua
ESTADÍSTICA Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal Cuantitativa discreta continua DISTRIBUCIÓN DE FRECUENCIAS Frecuencia absoluta: fi Frecuencia relativa:
Más detallesMétodos Estadísticos de la Ingeniería Tema 7: Momentos de Variables Aleatorias Grupo B
Métodos Estadísticos de la Ingeniería Tema 7: Momentos de Variables Aleatorias Grupo B Área de Estadística e Investigación Operativa Licesio J. Rodríguez-Aragón Marzo 2010 Contenidos...............................................................
Más detallesTabla de Test de Hipótesis ( Caso: Una muestra ) A. Test para µ con σ 2 conocida: Suponga que X 1, X 2,, X n, es una m.a.(n) desde N( µ, σ 2 )
Test de Hipótesis II Tabla de Test de Hipótesis ( Caso: Una muestra ) A. Test para µ con σ conocida: Suponga que X, X,, X n, es una m.a.(n) desde N( µ, σ ) Estadística de Prueba X - μ Z 0 = σ / n ~ N(0,)
Más detallesINTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión
INTERPRETACIÓN DE LA REGRESIÓN Este gráfico muestra el salario por hora de 570 individuos. 1 Interpretación de la regresión. regresión Salario-Estudios Source SS df MS Number of obs = 570 ---------+------------------------------
Más detalles1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA
MODELO DE REGRESIÓN LOGÍSTICA Introducción A grandes rasgos, el objetivo de la regresión logística se puede describir de la siguiente forma: Supongamos que los individuos de una población pueden clasificarse
Más detallesTEMA 3: Contrastes de Hipótesis en el MRL
TEMA 3: Contrastes de Hipótesis en el MRL Econometría I M. Angeles Carnero Departamento de Fundamentos del Análisis Económico Curso 2011-12 Econometría I (UA) Tema 3: Contrastes de Hipótesis Curso 2011-12
Más detallesPrueba Integral Lapso /6
Prueba Integral Lapso 2 009-2 76 - /6 Universidad Nacional Abierta Probabilidad y Estadística I (76) Vicerrectorado Académico Cód. Carrera: 06-20 - 508 Fecha: 2-2 - 2 009 MODELO DE RESPUESTAS Objetivos,
Más detallesVariables aleatorias
Distribuciones continuas Se dice que una variable aleatoria X tiene una distribución continua, o que X es una variable continua, si existe una función no negativa f, definida sobre los números reales,
Más detallesVARIABLES ALEATORIAS DISCRETAS
VARIABLES ALEATORIAS DISCRETAS M. en C. Juan Carlos Gutiérrez Matus Instituto Politécnico Nacional Primavera 2004 IPN UPIICSA c 2004 Juan C. Gutiérrez Matus Variables Aleatorias Variables Aleatorias Definición:
Más detallesAnálisis de Componentes de la Varianza
Análisis de Componentes de la Varianza Resumen El procedimiento de Análisis de Componentes de Varianza está diseñado para estimar la contribución de múltiples factores a la variabilidad de una variable
Más detallesAgro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos
Agro 6998 Conferencia Introducción a los modelos estadísticos mixtos Los modelos estadísticos permiten modelar la respuesta de un estudio experimental u observacional en función de factores (tratamientos,
Más detallesTEMA 4 ELABORACIÓN Y COMPROBACIÓN DE LAS HIPÓTESIS DE INVESTIGACIÓN
TEMA 4 ELABORACIÓN Y COMPROBACIÓN DE LAS HIPÓTESIS DE INVESTIGACIÓN 1 MODELO LINEAL GENERAL applemodelo estadístico appledescribe una combinación lineal de los efectos aditivos que forman la puntuación
Más detallesEJERCICIOS RESUELTOS DE ESTADÍSTICA II
EJERCICIOS RESUELTOS DE ESTADÍSTICA II RESUMEN DE EJERCICIOS DADOS EN CLASES POR: EILEEN JOHANA ARAGONES GENEY DISTRIBUCIONES DOCENTE: JUAN CARLOS VERGARA SCHMALBACH ESTIMACIÓN PRUEBAS DE HIPÓTESIS Grupo
Más detallesINTERVALOS DE CONFIANZA. La estadística en cómic (L. Gonick y W. Smith)
INTERVALOS DE CONFIANZA La estadística en cómic (L. Gonick y W. Smith) EJEMPLO: Será elegido el senador Astuto? 2 tamaño muestral Estimador de p variable aleatoria poblacional? proporción de personas que
Más detallesEJERCICIOS RESUELTOS DE ESTADÍSTICA II
EJERCICIOS RESUELTOS DE ESTADÍSTICA II RESUMEN DE EJERCICIOS DADOS EN CLASES PARTE II POR: EILEEN JOHANA ARAGONES GENEY DISTRIBUCIONES DOCENTE: JUAN CARLOS V ERGARA SCHMALBACH ESTIMACIÓN PRUEBAS DE HIPÓTESIS
Más detalles478 Índice alfabético
Índice alfabético Símbolos A, suceso contrario de A, 187 A B, diferencia de los sucesos A y B, 188 A/B, suceso A condicionado por el suceso B, 194 A B, intersección de los sucesos A y B, 188 A B, unión
Más detallesCONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS
CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS 1 POR QUÉ SE LLAMAN CONTRASTES NO PARAMÉTRICOS? A diferencia de lo que ocurría en la inferencia paramétrica, ahora, el desconocimiento de la población que vamos
Más detallesVariables estadísticas bidimensionales: problemas resueltos
Variables estadísticas bidimensionales: problemas resueltos BENITO J. GONZÁLEZ RODRÍGUEZ (bjglez@ull.es) DOMINGO HERNÁNDEZ ABREU (dhabreu@ull.es) MATEO M. JIMÉNEZ PAIZ (mjimenez@ull.es) M. ISABEL MARRERO
Más detalles1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN MÚLTIPLE Julián de la Horra Departamento de Matemáticas U.A.M.
MODELO DE REGRESIÓN MÚLTIPLE Julián de la Horra Departamento de Matemáticas U.A.M. 1 Introducción Abordaremos en este capítulo el modelo de regresión lineal múltiple, una vez que la mayor parte de las
Más detallesEconometría II Grado en finanzas y contabilidad
Econometría II Grado en finanzas y contabilidad Variables aleatorias y procesos estocásticos. La FAC y el correlograma Profesora: Dolores García Martos E-mail:mdgmarto@est-econ.uc3m.es Este documento es
Más detallesJUNIO Encuentra, si existen, matrices cuadradas A, de orden 2, distintas de la matriz identidad, tales que: A
Bloque A JUNIO 2003 1.- Encuentra, si existen, matrices cuadradas A, de orden 2, distintas de la matriz identidad, tales que: 1 0 A = 1 0 A Cuántas matrices A existen con esa condición? Razona tu respuesta.
Más detallesEstadística y sus aplicaciones en Ciencias Sociales 7. El modelo de regresión simple. Facultad de Ciencias Sociales - UdelaR
Estadística y sus aplicaciones en Ciencias Sociales 7. El modelo de regresión simple Facultad de Ciencias Sociales - UdelaR Índice 7.1 Introducción 7.2 Análisis de regresión 7.3 El Modelo de Regresión
Más detallesUNIDAD 6. Estadística
Matemática UNIDAD 6. Estadística 2 Medio GUÍA N 1 MEDIDAS DE DISPERSIÓN PARA DATOS NO AGRUPADOS ACTIVIDAD Consideremos los siguientes conjuntos de valores referidos a las edades de los jugadores de dos
Más detallesContrastes de hipótesis paramétricos
Estadística II Universidad de Salamanca Curso 2011/2012 Outline Introducción 1 Introducción 2 Contraste de Neyman-Pearson Sea X f X (x, θ). Desonocemos θ y queremos saber que valor toma este parámetro,
Más detallesEconometria de Datos en Paneles
Universidad de San Andres Agosto de 2011 Porque paneles? Ejemplo (Cronwell y Trumbull): Determinantes del crimen y = g(i), y = crimen, I = variables de justicia criminal. Corte transversal: (y i, I i )
Más detallesRESUMEN DE ALGUNOS CONCEPTOS ESTADÍSTICOS ELEMENTALES Y NOTACIÓN EMPLEADA EN EL CURSO
RESUMEN DE ALGUNOS CONCEPTOS ESTADÍSTICOS ELEMENTALES Y NOTACIÓN EMPLEADA EN EL CURSO 1 rojo 1 2 3 4 5 6 Supongamos que tenemos dos dados, uno rojo y otro verde, cada uno de los cuales toma valores entre
Más detallesPRUEBAS DE ACCESO A LA UNIVERSIDAD L.O.G.S.E
PRUEBAS DE ACCESO A LA UNIVERSIDAD L.O.G.S.E CURSO 00-.003 - CONVOCATORIA: MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES - Cada alumno debe elegir sólo una de las pruebas (A o B) y, dentro de ella, sólo
Más detallesF (x, y) = no es la función de distribución acumulada de ningún vector aleatorio. b) Mostrar que. { (1 e x )(1 e y ) si x 0, y 0
Probabilidades y Estadística (M) Práctica 5 1 o cuatrimestre 2014 Vectores aleatorios 1. a) Demostrar que la función F (x, y) = 1 e x y si x 0, y 0 0 en caso contrario no es la función de distribución
Más detallesINFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón
Metodología de Investigación Tesifón Parrón Contraste de hipótesis Inferencia Estadística Medidas de asociación Error de Tipo I y Error de Tipo II α β CONTRASTE DE HIPÓTESIS Tipos de Test Chi Cuadrado
Más detallesINFERENCIA ESTADISTICA
1 INFERENCIA ESTADISTICA Es una rama de la Estadística que se ocupa de los procedimientos que nos permiten analizar y extraer conclusiones de una población a partir de los datos de una muestra aleatoria,
Más detalles2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...
Contenidos 1 Introducción al paquete estadístico S-PLUS 19 1.1 Introducción a S-PLUS............................ 21 1.1.1 Cómo entrar, salir y consultar la ayuda en S-PLUS........ 21 1.2 Conjuntos de datos..............................
Más detallesConceptos Básicos de Inferencia
Conceptos Básicos de Inferencia Álvaro José Flórez 1 Escuela de Ingeniería Industrial y Estadística Facultad de Ingenierías Febrero - Junio 2012 Inferencia Estadística Cuando obtenemos una muestra, conocemos
Más detallesEstadística Espacial en Ecología del Paisaje
Estadística Espacial en Ecología del Paisaje Introducción H. Jaime Hernández P. Facultad de Ciencias Forestales U. de Chile Tipos de datos en análisis espacial Patrones espaciales puntuales Muestras geoestadísticas
Más detallesSimulación I. Investigación Operativa, Grado en Estadística y Empresa, 2011/12
Simulación I Prof. José Niño Mora Investigación Operativa, Grado en Estadística y Empresa, 2011/12 Esquema Modelos de simulación y el método de Montecarlo Ejemplo: estimación de un área Ejemplo: estimación
Más detallesTeoría de la Probabilidad Tema 2: Teorema de Extensión
Teoría de la Probabilidad Tema 2: Teorema de Extensión Alberto Rodríguez Casal 25 de septiembre de 2015 Definición Una clase (no vacía) A de subconjuntos de Ω se dice que es un álgebra si A es cerrada
Más detallesClase 8 Matrices Álgebra Lineal
Clase 8 Matrices Álgebra Lineal Código Escuela de Matemáticas - Facultad de Ciencias Universidad Nacional de Colombia Matrices Definición Una matriz es un arreglo rectangular de números denominados entradas
Más detallesDiseño de Bloques al azar. Diseño de experimentos p. 1/25
Diseño de Bloques al azar Diseño de experimentos p. 1/25 Introducción En cualquier experimento, la variabilidad proveniente de un factor de ruido puede afectar los resultados. Un factor de ruido es un
Más detallesIntervalos de confianza y contrastes de hipótesis. Intervalo de confianza de la media.
R PRÁCTICA IV Intervalos de confianza y contrastes de hipótesis Sección IV.1 Intervalo de confianza de la media. 44. Cargar (abrir) el conjunto de Datos Pulso.rda. Se pide: a) Calcular el de confianza
Más detallesContraste de hipótesis Tema Pasos del contraste de hipótesis. 1.1 Hipótesis estadísticas: nula y alternativa. 1.3 Estadístico de contraste
1 Contraste de hipótesis Tema 3 1. Pasos del contraste de hipótesis 1.1 Hipótesis estadísticas: nula y alternativa 1.2 Supuestos 1.3 Estadístico de contraste 1.4 Regla de decisión: zona de aceptación y
Más detallesFacultad de Ciencias Sociales - Universidad de la República
Facultad de Ciencias Sociales - Universidad de la República Estadística y sus aplicaciones en Ciencias Sociales Edición 2016 Ciclo Avanzado 3er. Semestre (Licenciatura en Ciencia Política/ Licenciatura
Más detallesCapítulo 7. Espacios vectoriales. 7.1 Definición y ejemplos
Capítulo Espacios vectoriales.1 Definición y ejemplos Un espacio vectorial sobre un cuerpo K (que supondremos conmutativo es un conjunto no vacío junto con 1. una operación interna, +, a la que llamaremos
Más detallesPruebas de Hipótesis-ANOVA. Curso de Seminario de Tesis Profesor QF Jose Avila Parco Año 2016
Pruebas de Hipótesis-ANOVA Curso de Seminario de Tesis Profesor Q Jose Avila Parco Año 2016 Análisis de la Varianza de un factor (ANOVA) El análisis de la varianza (ANOVA) es una técnica estadística paramétrica
Más detallesEconometría de series de tiempo aplicada a macroeconomía y finanzas
Econometría de series de tiempo aplicada a macroeconomía y finanzas Series de Tiempo no Estacionarias Carlos Capistrán Carmona ITAM Tendencias Una tendencia es un movimiento persistente de largo plazo
Más detallesDISTRIBUCIÓN N BINOMIAL
DISTRIBUCIÓN N BINOMIAL COMBINACIONES En muchos problemas de probabilidad es necesario conocer el número de maneras en que r objetos pueden seleccionarse de un conjunto de n objetos. A esto se le denomina
Más detallesSeries. Capítulo Introducción. Definición 4.1 Sea (x n ) n=1 una sucesión de números reales. Para cada n N. S n = x k = x 1 + x x n.
Capítulo 4 Series 4 Introducción Definición 4 Sea (x n ) n= una sucesión de números reales Para cada n N definimos n S n = x k = x + x 2 + + x n k= La sucesión (S n ) n se conoce como la serie infinita
Más detallesLímite superior y límite inferior de una sucesión
Límite superior y límite inferior de una sucesión Objetivos. Definir las nociones de los límites superior e inferior de una sucesión y estudiar sus propiedades básicas. Requisitos. Supremo e ínfimo de
Más detalles3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS
1. INTRODUCCIÓN Este tema se centra en el estudio conjunto de dos variables. Dos variables cualitativas - Tabla de datos - Tabla de contingencia - Diagrama de barras - Tabla de diferencias entre frecuencias
Más detallesTema 2: Teorema de estructura de los grupos abelianos finitamente generados.
ESTRUCTURAS ALGEBRAICAS GRADO EN MATEMÁTICAS. CURSO 215/216 Tema 2: Teorema de estructura de los grupos abelianos finitamente generados. 1.1. Grupo abeliano libre. Bases. Definición 1.1. El grupo Z n con
Más detallesDeterminación del tamaño de muestra (para una sola muestra)
STATGRAPHICS Rev. 4/5/007 Determinación del tamaño de muestra (para una sola muestra) Este procedimiento determina un tamaño de muestra adecuado para la estimación o la prueba de hipótesis con respecto
Más detallesDistribuciones de probabilidad multivariadas
Capítulo 3 Distribuciones de probabilidad multivariadas Sobre un dado espacio muestral podemos definir diferentes variables aleatorias. Por ejemplo, en un experimento binomial, X 1 podría ser la variable
Más detallesPruebas de Hipótesis Multiples
Pruebas de Hipótesis Multiples Cuando queremos hacer comparaciones de mas de dos poblaciones, una alternativa es comparar todos los grupos a la vez con el método de Análisis de Varianza (ANOVA) H o : µ
Más detallesTema 1. El Modelo de Regresión Lineal con Regresores Aleatorios.
ema El Modelo de Regresión Lineal con Regresores Aleatorios Introducción En este tema vamos a analizar las propiedades del modelo de regresión lineal con regresores aleatorios Suponer que los regresores
Más detallesINTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)
TEMA Nº 7 DISTRIBUCIONES CONTINUAS DE PROBABILIDAD OBJETIVOS DE APRENDIZAJE: Conocer las características de la distribución normal como distribución de probabilidad de una variable y la aproximación de
Más detallesTema 5. Muestreo y distribuciones muestrales
Tema 5. Muestreo y distribuciones muestrales Contenidos Muestreo y muestras aleatorias simples La distribución de la media en el muestreo La distribución de la varianza muestral Lecturas recomendadas:
Más detallesTema 2 Datos multivariantes
Aurea Grané Máster en Estadística Universidade Pedagógica 1 Aurea Grané Máster en Estadística Universidade Pedagógica 2 Tema 2 Datos multivariantes 1 Matrices de datos 2 Datos multivariantes 2 Medias,
Más detallesINTERVALOS DE CONFIANZA Julián de la Horra Departamento de Matemáticas U.A.M.
1 Introducción INTERVALOS DE CONFIANZA Julián de la Horra Departamento de Matemáticas U.A.M. En este capítulo, vamos a abordar la estimación mediante Intervalos de Confianza, que es otro de los tres grandes
Más detallesIII Verano de Probabilidad y Estadística Curso de Procesos de Poisson (Víctor Pérez Abreu) Lista de Ejercicios
III Verano de Probabilidad y Estadística Curso de Procesos de Poisson (Víctor Pérez Abreu) Lista de Ejercicios Esta lista contiene ejercicios y problemas tanto teóricos como de modelación. El objetivo
Más detallesTEMA 8.- NORMAS DE MATRICES Y
Álgebra II: Tema 8. TEMA 8.- NORMAS DE MATRICES Y NúMERO DE CONDICIóN Índice. Introducción 2. Norma vectorial y norma matricial. 2 2.. Norma matricial inducida por normas vectoriales......... 4 2.2. Algunos
Más detallesDistribución Chi (o Ji) cuadrada (χ( 2 )
Distribución Chi (o Ji) cuadrada (χ( 2 ) PEARSON, KARL. On the Criterion that a Given System of Deviations from the Probable in the Case of a Correlated System of Variables is such that it Can Reasonably
Más detallesCapítulo 8. Análisis Discriminante
Capítulo 8 Análisis Discriminante Técnica de clasificación donde el objetivo es obtener una función capaz de clasificar a un nuevo individuo a partir del conocimiento de los valores de ciertas variables
Más detallesTÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD
TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD Contrastes de hipótesis paramétricos para una y varias muestras: contrastes sobre la media, varianza y una proporción. Contrastes sobre la diferencia
Más detallesb. Universidad Nacional-Sede Medellín
Comparación de Intervalos de Confianza para el Coeficiente de Correlación Juan Carlos Correa a, Liliana Vanessa Pacheco b Email: jccorrea@unal.edu.co a. Universidad Nacional-Sede Medellín b. Universidad
Más detallesTema 6: Ecuaciones diferenciales lineales.
Tema 6: Ecuaciones diferenciales lineales Una ecuación diferencial lineal de orden n es una ecuación que se puede escribir de la siguiente forma: a n (x)y (n) (x) + a n 1 (x)y (n 1) (x) + + a 0 (x)y(x)
Más detallesPruebas de Hipótesis H0 : μ = 6 H1 : μ 6 α = 0.05 zα/2 = 1.96 (6-1,96 0,4 ; 6+1,96 0,4) = (5,22 ; 6,78) 5,6 Aceptamos la hipótesis nula H 0 2.
Pruebas de Hipótesis 1. Se sabe que la desviación típica de las notas de cierto examen de Matemáticas es,4. Para una muestra de 6 estudiantes se obtuvo una nota media de 5,6. Sirven estos datos para confirmar
Más detalles= P (Z ) - P (Z ) = P (Z 1 25) P (Z -1 25)= P (Z 1 25) [P (Z 1 25)] = P (Z 1 25) [1- P (Z 1 25)] =
El peso en kg de los estudiantes universitarios de una gran ciudad se supone aproximado por una distribución normal con media 60kg y desviación típica 8kg. Se toman 100 muestras aleatorias simples de 64
Más detallesMODELO DE RESPUESTAS Objetivos del 1 al 9
PRUEBA INTEGRAL LAPSO 05-764 - /9 Universidad Nacional Abierta Probabilidad y Estadística I (Cód. 764) Vicerrectorado Académico Cód. Carrera: 6 Fecha: 0-04-06 MODELO DE RESPUESTAS Objetivos del al 9 OBJ
Más detallesMOOC UJI: La Probabilidad en las PAU
4. Probabilidad Condicionada: Teoremas de la Probabilidad Total y de Bayes 4.1. Probabilidad Condicionada Vamos a estudiar como cambia la probabilidad de un suceso A cuando sabemos que ha ocurrido otro
Más detallesTAMAÑO DE MUESTRA EN LA ESTIMACIÓN DE LA MEDIA DE UNA POBLACIÓN
TAMAÑO DE MUESTRA EN LA ESTIMACIÓN DE LA MEDIA DE UNA POBLACIÓN En este artículo, se trata de explicar una metodología estadística sencilla y sobre todo práctica, para la estimación del tamaño de muestra
Más detallesMaestría en Bioinformática Probabilidad y Estadística: Clase 3
Maestría en Bioinformática Probabilidad y Estadística: Clase 3 Gustavo Guerberoff gguerber@fing.edu.uy Facultad de Ingeniería Universidad de la República Abril de 2010 Contenidos 1 Variables aleatorias
Más detallesPRÁCTICA 3: Ejercicios del capítulo 5
PRÁCICA 3: Eercicios del capítulo 5 1. Una empresa bancaria a contratado a un equipo de expertos en investigación de mercados para que les asesoren sobre el tipo de campaña publicitaria más recomendable
Más detallesFundamentos de Estadística
Fundamentos de Estadística Introducción a la Estadística Prof. Dr. Eduardo Valenzuela Domínguez eduardo.valenzuela@usm.cl Universidad Técnica Federico Santa María Dr. Eduardo Valenzuela D.; MEE 2005 p.
Más detallesMétodo de cuadrados mínimos
REGRESIÓN LINEAL Gran parte del pronóstico estadístico del tiempo está basado en el procedimiento conocido como regresión lineal. Regresión lineal simple (RLS) Describe la relación lineal entre dos variables,
Más detallesJUNIO Bloque A
Selectividad Junio 009 JUNIO 009 Bloque A 1.- Estudia el siguiente sistema en función del parámetro a. Resuélvelo siempre que sea posible, dejando las soluciones en función de parámetros si fuera necesario.
Más detallesUnidad IV: Distribuciones muestrales
Unidad IV: Distribuciones muestrales 4.1 Función de probabilidad En teoría de la probabilidad, una función de probabilidad (también denominada función de masa de probabilidad) es una función que asocia
Más detallesEJERCICIOS DE SELECTIVIDAD
EJERCICIOS DE SELECTIVIDAD INFERENCIA 1998 JUNIO OPCIÓN A Un fabricante de electrodomésticos sabe que la vida media de éstos sigue una distribución normal con media μ = 100 meses y desviación típica σ
Más detallesEspacios Vectoriales
Espacios Vectoriales Espacios Vectoriales Verónica Briceño V. noviembre 2013 Verónica Briceño V. () Espacios Vectoriales noviembre 2013 1 / 47 En esta Presentación... En esta Presentación veremos: Espacios
Más detalles1 Ecuaciones diferenciales
1 Ecuaciones diferenciales La solución a una ecuación algebraica es un número, o un conjunto de números que satisfacen la ecuación. Por ejemplo las soluciónes de x 2 4x + 3 = 0 son x 0 = 1 y x 1 = 3. Las
Más detallesDesigualdad de Chebyshev bidimensional
Scientia et Technica Año XVII, No 51, Agosto de 2012. Universidad Tecnológica de Pereira. ISSN 0122-1701 242 Desigualdad de Chebyshev bidimensional Two - dimensional Chebyshev Inequality Edgar Alirio Valencia,
Más detalles. Universidad Tecnológica Nacional - Facultad Regional Rosario. Álgebra y Geometría Analítica EL PLANO
. Universidad Tecnológica Nacional - Facultad Regional Rosario Álgebra y Geometría Analítica EL PLANO Autores: Lic. Martha Fascella Ing. Ricardo F. Sagristá 0 Contenido EL PLANO... 3.- Definición del plano
Más detallesINFERENCIA ESTADÍSTICA
INFERENCIA ESTADÍSTICA 1. DEFINICIÓN DE INFERENCIA ESTADÍSTICA Llamamos Inferencia Estadística al proceso de sacar conclusiones generales para toda una población a partir del estudio de una muestra, así
Más detallesProbabilidad y Estadística Descripción de Datos
Descripción de Datos Arturo Vega González a.vega@ugto.mx Division de Ciencias e Ingenierías Universidad de Guanajuato Campus León Universidad de Guanajuato, DCI, Campus León 1 / 28 Contenido 1 Probabilidad
Más detallesPROGRAMA ACADEMICO Ingeniería Industrial
1. IDENTIFICACIÓN DIVISION ACADEMICA Ingenierías DEPARTAMENTO Ingeniería Industrial PROGRAMA ACADEMICO Ingeniería Industrial NOMBRE DEL CURSO Análisis de datos en Ingeniería COMPONENTE CURRICULAR Profesional
Más detallesRegresión lineal SIMPLE MÚLTIPLE N A Z IRA C A L L E J A
Regresión lineal REGRESIÓN LINEAL SIMPLE REGRESIÓN LINEAL MÚLTIPLE N A Z IRA C A L L E J A Qué es la regresión? El análisis de regresión: Se utiliza para examinar el efecto de diferentes variables (VIs
Más detalles6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE
6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA La estadística está dividida en descriptiva e inferencial donde La estadística Descriptiva se relaciona principalmente
Más detallesTEOREMA DEL LÍMITE CENTRAL
Material de clase n 2 Domingo 13 Junio TEOREMA DEL LÍMITE CENTRAL A medida que n se vuelve más grande, la distribución de las medias muestrales se aproxima a una distribución normal con una media x = µ
Más detallesOPCIÓN A. La empresa A (x) tiene 30 trabajadores, la B (y) 20 trabajadores y la C (z) 13 trabajadores.
PRUEBAS DE ACCESO A LA UNIVERSIDAD PARA EL ALUMNADO DE BACHILLERATO. 159 MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES. JUNIO 16 EXAMEN RESUELTO POR JAVIER SUÁREZ CABALLERO (@javiersc9) OBSERVACIONES IMPORTANTES:
Más detallesEl Modelo de Regresión Simple
El Modelo de Regresión Simple Carlos Velasco 1 1 Departamento de Economía Universidad Carlos III de Madrid Econometría I Máster en Economía Industrial Universidad Carlos III de Madrid Curso 2007/08 C Velasco
Más detallesAnálisis de datos Categóricos
Introducción a los Modelos Lineales Generalizados Universidad Nacional Agraria La Molina 2016-1 Introducción Modelos Lineales Generalizados Introducción Componentes Estimación En los capítulos anteriores
Más detalles520142: ALGEBRA y ALGEBRA LINEAL
520142: ALGEBRA y ALGEBRA LINEAL Segundo Semestre 2008, Universidad de Concepción CAPITULO 10: Espacios Vectoriales DEPARTAMENTO DE INGENIERIA MATEMATICA Facultad de Ciencias Físicas y Matemáticas 1 Definición
Más detalles15. Regresión lineal. Te recomiendo visitar su página de apuntes y vídeos:
15. Regresión lineal Este tema, prácticamente íntegro, está calacado de los excelentes apuntes y transparencias de Bioestadística del profesor F.J. Barón López de la Universidad de Málaga. Te recomiendo
Más detallesDescomposición en valores singulares de una matriz
Descomposición en valores singulares de una matriz Estas notas están dedicadas a demostrar una extensión del teorema espectral conocida como descomposición en valores singulares (SVD en inglés) de gran
Más detallesMÉTODOS ESTADÍSTICOS APLICADOS
Pedro Sánchez Algarra (autor y coordinador) Xavier Baraza Sánchez Ferran Reverter Comas Esteban Vegas Lozano Departament d Estadística TEXTOS DOCENTS 3 MÉTODOS ESTADÍSTICOS APLICADOS Pedro Sánchez Algarra
Más detallesEJERCICIOS RESUELTOS DE ESTADÍSTICA II
EJERCICIOS RESUELTOS DE ESTADÍSTICA II RESUMEN DE EJERCICIOS DADOS EN CLASES PARTE I POR: EILEEN JOHANA ARAGONES GENEY DISTRIBUCIONES DOCENTE: JUAN CARLOS V ERGARA SCHMALBACH ESTIMACIÓN PRUEBAS DE HIPÓTESIS
Más detalles