Problema: Existe relación entre el estado nutricional y el rendimiento académico de estudiantes de enseñanza básica?

Documentos relacionados
H 0 : La distribución poblacional es uniforme H 1 : La distribución poblacional no es uniforme

Problemas donde intervienen dos o más variables numéricas

Modelos unifactoriales de efectos aleatorizados

Estadísticos muéstrales

10. VIBRACIONES EN SISTEMAS CON N GRADOS DE LIBERTAD

A. Una pregunta muy particular que se puede hacer a una distribución de datos es de qué magnitud es es la heterogeneidad que se observa.

Tema 1.3_A La media y la desviación estándar

EXPERIMENTACIÓN COMERCIAL(I)

REGRESION LINEAL SIMPLE

TEMA 3. VARIABLE ALEATORIA

Tema 3. Estadísticos univariados: tendencia central, variabilidad, asimetría y curtosis

MODELOS DE ELECCIÓN BINARIA

PyE_ EF1_TIPO1_

Relaciones entre variables

Contraste de Hipótesis

Tema 1. Conceptos generales

CAPÍTULO 5 REGRESIÓN CON VARIABLES CUALITATIVAS

Econometría de corte transversal. Pablo Lavado Centro de Investigación de la Universidad del Pacífico

Reconocimiento de Locutor basado en Procesamiento de Voz. ProDiVoz Reconocimiento de Locutor 1

Efectos fijos o aleatorios: test de especificación

Capítulo 12 CONTRASTES NO PARAMÉTRICOS

3. VARIABLES ALEATORIAS.

Tema 4: Variables aleatorias

ESTADISTÍCA. 1. Población, muestra e individuo. 2. Variables estadísticas. 3. El proceso que se sigue en estadística

Investigación y Técnicas de Mercado. Previsión de Ventas TÉCNICAS CUANTITATIVAS ELEMENTALES DE PREVISIÓN UNIVARIANTE. (IV): Ajustes de Tendencia

De factores fijos. Mixto. Con interacción Sin interacción. No equilibrado. Jerarquizado

Apéndice A: Metodología para la evaluación del modelo de pronóstico meteorológico

Análisis de Varianza no paramétricos

INTRODUCCIÓN. Técnicas estadísticas

Tema 1: Análisis de datos unidimensionales

Medidas de centralización

unidad 12 Estadística

EJERCICIO 1 1. VERDADERO 2. VERDADERO (Esta afirmación no es cierta en el caso del modelo general). 3. En el modelo lineal general

Regresión Binomial Negativa

Ejemplo: Consumo - Ingreso. Ingreso. Consumo. Población 60 familias

Reconciliación de datos experimentales. MI5022 Análisis y simulación de procesos mineralúgicos

EL MÉTODO DE DIFERENCIAS FINITAS POR GUILLERMO HERNÁNDEZ GARCÍA

Media es la suma de todas las observaciones dividida por el tamaño de la muestra.

Mª Dolores del Campo Maldonado. Tel: :

ESTADÍSTICA (GRUPO 12)

LECTURA N 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) TEMA 14: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION

TRABAJO 1: Variables Estadísticas Unidimensionales (Tema 1).

Tema 4 MODELOS CON DATOS DE RECUENTO

Cálculo y EstadísTICa. Primer Semestre.

Vectores VECTORES 1.- Magnitudes Escalares y Magnitudes Vectoriales. Las Magnitudes Escalares: Las Magnitudes Vectoriales:

Métodos de Apareamiento (Matching)

ESTADÍSTICA DESCRIPTIVA

Optimización no lineal

ESTADÍSTICA BIDIMENSIONAL ÍNDICE GENERAL

REGRESION Y CORRELACION

Muestra: son datos de corte transversal correspondientes a 120 familias españolas.

1. Concepto y origen de la estadística Conceptos básicos Tablas estadísticas: recuento Representación de graficas...

ELECTRICIDAD Y MAGNETISMO FIZ 1300 FIS 1532 (6a)

Gráficos de flujo de señal

OPERACIONES ARMONIZACION DE CRITERIOS EN CALCULO DE PRECIOS Y RENDIMIENTOS

T. 9 El modelo de regresión lineal

CAPITULO 3.- ANÁLISIS CONJUNTO DE DOS VARIABLES. 3.1 Presentación de los datos. Tablas de doble entrada.

MÉTODOS PARA PROBAR NUMEROS

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.

Análisis de Weibull. StatFolio de Muestra: Weibull analysis.sgp

Riesgos Proporcionales de Cox

Tema 8 - Estadística - Matemáticas CCSSI 1º Bachillerato 1

Histogramas: Es un diagrama de barras pero los datos son siempre cuantitativos agrupados en clases o intervalos.

LECTURA 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) LA MEDIA ARITMÉTICA TEMA 15: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION

Dicha tabla adopta la forma del diagrama de árbol del dibujo. En éste, a cada uno de los sucesos A y A c se les ha asociado los sucesos B y B c.

Pruebas Estadísticas de Números Pseudoaleatorios

Métodos específicos de generación de diversas distribuciones discretas

Tema 1: Estadística Descriptiva Unidimensional Unidad 2: Medidas de Posición, Dispersión y de Forma

Departamento de Señales, Sistemas y Radicomunicaciones Comunicaciones Digitales, junio 2011

Teoría de Modelos y Simulación Enrique Eduardo Tarifa Facultad de Ingeniería - Universidad Nacional de Jujuy. Generación de Números Aleatorios

Organización y resumen de datos cuantitativos

Capítulo III Medidas de posición y de dispersión

Correlación y regresión lineal simple

Universidad Diego Portales Facultad de Economía y Empresa

16.21 Técnicas de diseño y análisis estructural. Primavera 2003 Unidad 8 Principio de desplazamientos virtuales

EJERCICIOS. Ejercicio 1.- Para el modelo de regresión simple siguiente: Y i = βx i + ε i i =1,..., 100. se tienen las siguientes medias muestrales:

TEMA 10: ESTADÍSTICA

ESTADÍSTICA DESCRIPTIVA

Análisis de Regresión y Correlación

PROBABILIDAD Y ESTADÍSTICA

IES Menéndez Tolosa (La Línea) Física y Química - 1º Bach - Gráficas

TÉCNICAS AUXILIARES DE LABORATORIO

Variable aleatoria: definiciones básicas

TEMA 4. TEORÍA DE LA DUALIDAD.

Bloque 2 Análisis de circuitos alimentados en corriente continua. Teoría de Circuitos

Variables Aleatorias. Variables Aleatorias. Variables Aleatorias. Objetivos del tema: Al final del tema el alumno será capaz de:

MATEMÁTICAS para estudiantes de primer curso de facultades y escuelas técnicas

Análisis de Capabilidad (Defectos Por Unidad)

Además podemos considerar diferentes tipos de medidas de resumen. Entre ellas tenemos:

FIABILIDAD (V): COMPARACIÓN (NO PARAMÉTRICA) DE MUESTRAS

6 Impacto en el bienestar de los beneficiarios del PAAM

Maestría en Administración. Medidas Descriptivas. Formulario e Interpretación. Dr. Francisco Javier Cruz Ariza

CÁLCULO DE INCERTIDUMBRE EN MEDIDAS FÍSICAS: MEDIDA DE UNA MASA

PRÁCTICA 16: MODELO DE REGRESIÓN MÚLTIPLE SOLUCIÓN

TERMODINÁMICA AVANZADA

Métodos de Apareamiento

i=1 Demuestre que cumple los axiomas de norma. Calcule el límite Verifiquemos cada uno de los axiomas de la definición de norma: i=1

Glosario básico. de términos estadísticos

Facultad de Ingeniería División de Ciencias Básicas Coordinación de Ciencias Aplicadas Departamento de Probabilidad y Estadística

Tema 21: Distribución muestral de un estadístico

Transcripción:

Relacones entre varables cualtatvas Problema: xste relacón entre el estado nutrconal y el rendmento académco de estudantes de enseñanza básca? stado Nutrconal Malo Regular Bueno TOTAL Bajo 13 95 3 55 Rendmento Académco Promedo 9 45 35 575 Sobre 7 3 7 17 TOTAL 9 575 135 1 Ya vmos cómo podemos descrbr los datos que provenen de este tpo de problema, medante tablas de contngenca o de doble entrada. n esta undad revsaremos los test estadístcos dsponbles, el test de J cuadrado y el test F. Test de J-cuadrado xsten varos tests de J cuadrado * que srven para contestar dstntas preguntas, pero estos tenen certas característcas comunes: 1. Los datos conssten en frecuencas observadas (O), esto es, cuantos ítems o sujetos caen en cada categoría.. Se calculan las frecuencas esperadas () bajo H, esto es, las frecuencas que esperamos ver en cada categoría s la correspondente hpótess nula es correcta. 3. Comparamos las frecuencas observadas con las esperadas por medo del test estadístco que será una medda de cuán cerca están las frecuencas observadas de las frecuencas esperadas bajo H. ntonces, s la "dstanca" es grande, tenemos evdenca para rechazar H. l test de J cuadrado es: χ ( O ) = S las frecuencas observadas están cerca de las frecuencas esperadas bajo H, entonces el estadístco de χ debe ser chco. Valores grandes del estadístco ndcan dferencas entre lo observado y lo esperado. Como sólo valores grandes son evdenca a favor de la hpótess alternatva, los tests de J cuadrado son unlaterales y la dreccón del extremo es haca la derecha. l valor-p será la probabldad de observar un test estadístco gual o mayor al calculado, asumendo que la hpótess nula es certa. 4. La relacón entre el test y la dstrbucón funcona ben sempre cuando el número esperado es al menos 5. n general los softwares estadístcos verfcan este supuesto. Propedades de la dstrbucón de J-cuadrado χ ( gl) - La dstrbucón no es smétrca, es sesgada a la derecha - Sus valores son cero o postvos, no negatvos. - La dstrbucón está defnda por el número de grados de lbertad. - l promedo de la dstrbucón de J-cuadrado es gual a sus grados de lbertad. - La varanza de la dstrbucón de J-cuadrado es dos veces sus grados de lbertad ( gl). * sencalmente la prueba de asocacón que veremos aquí y las pruebas de bondad de ajuste. 1

gl=1 gl=4 gl=1 5 1 15 χ Fgura: Dstrbucones de J cuadrado con dstntos grados de lbertad

Tabla de J cuadrado 3

Prueba de asocacón o de ndependenca * La prueba de asocacón, permte al nvestgador saber s exste asocacón entre dos varables cualtatvas. jemplo: Para evaluar un nuevo tratamento, cuyos resultados son desconocdos, se trata a 1 pacentes con el nuevo tratamento y a 13 pacentes (selecconados aleatoramente) con un tratamento antguo y se regstra s mejora o no. stado Tratamento xpermental Antguo Total Mejora 9 11 No mejora 3 11 14 Total 1 13 5 a) Planteamento de la hpótess Hpótess de nuldad ( H ): No hay asocacón entre el estado del pacente y el tratamento, es decr, el porcentaje de pacentes que mejora es el msmo, sn mportar a qué tratamento fue sometdo. Smbólcamente, H P = P : en que P representa el porcentaje de mejoría. exp ant Hpótess alternatva ( H 1 ): Hay asocacón entre el estado del pacente y el tratamento, es decr, el porcentaje de pacentes que mejora es dferente entre los sometdos al tratamento expermental y los sometdos al tratamento antguo. Smbólcamente, H 1 : P exp Pant stadístca a utlzar: en que: O = frecuenca observada en la celda = frecuenca esperada en la celda χ fxc = Σ = 1 ( O ) fxc = número de celdas, se obtene multplcando número de flas (f) por número de columnas (c). n este problema =4 b) Cálculo del J-cuadrado Bajo la hpótess nula, no hay asocacón entre el estado del pacente y el tratamento; por lo tanto, el porcentaje que mejora debería ser el msmo para los dos tratamentos. Su mejor estmacón será: 11/5, 44%, vale decr, el porcentaje de mejoría observado en el total. La frecuenca esperada ( ) de los que mejoran la obtenemos aplcando este porcentaje a los totales margnales, respectvamente. 11 11 1 = 1= 5,8 = 13= 5, 7 5 5 Por analogía, la frecuenca esperada ( ) de los que no mejoran la obtendremos aplcando 14/5, 56% el porcentaje de los que no mejoran a los totales margnales, respectvamente. 14 14 3 = 1= 6,7 4 = 13= 7, 8 5 5 * Algunos textos hacen la dstncón entre una prueba de J cuadrado de ndependenca y una prueba de J cuadrado de homogenedad. l cálculo y la nterpretacón práctca de cada procedmento son déntcos. Utlzamos la prueba de asocacón para nclur ambos tpos. 4

Una manera alternatva para el cálculo de las frecuencas esperadas para determnada celda utlza los totales de la fla y de la columna en que se encuentra el valor observado de la celda: l estadístco observado a partr de los datos de este ejemplo es: = (total fla x total columna)/ Total χ OBS = ( 9 5,8) ( 5,7) ( 3 6,7) ( 11 7,8) 5,8 + 5,7 + 6,7 + 7,8 = 9, c) Grados de lbertad ste test de J cuadrado tene dstrbucón de J cuadrado con (número de flas - 1) x (número de columnas - 1) grados de lbertad. n este ejemplo, (-1) x (-1) = 1 grado de lbertad Comparemos con la salda del SPSS: Ch-cuadrado de Pearson Correccón por contnudad a Razón de verosmltudes stadístco exacto de Fsher Asocacón lneal por lneal N de casos váldos Pruebas de ch-cuadrado Sg. asntótca Valor gl (blateral) 9. b 1.3 6.744 1.9 9.638 1. 8.64 1.3 5 a. Calculado sólo para una tabla de x. Sg. exacta (blateral) Sg. exacta (unlateral).5.4 b. casllas (.%) tenen una frecuenca esperada nferor a 5. La frecuenca mínma esperada es 5.8. 5

Supuestos del test de J cuadrado La prueba de J cuadrado no asume dstrbucón alguna para las observacones, es decr es una prueba no paramétrca. Un supuesto básco al utlzar esta prueba consste en que cada observacón regstrada en la tabla de contngenca es ndependente de las demás. "Independenca" en este contexto sgnfca que no más de una observacón vene de cada undad observaconal. La undad más común es una persona. S hay 96 personas en estudo, el número total de observacones en la tabla de contngenca deberá ser 96. S la msma persona contrbuye en más de una entrada en una tabla, la prueba de J cuadrada no es apropada. Por últmo, un supuesto mportante es saber que el estadístco de J cuadrado sgue una dstrbucón de J cuadrado sempre que los valores esperados sean mayores que 5, s esto no se cumple, el test no es váldo. Qué hacer s tenemos frecuencas esperadas menores que 5? l test de probabldad exacta de Fsher Se utlza para el análss de tablas de contngenca cuando no se cumple el requsto del tamaño mínmo para aplcar el método de J cuadrado, que exge que los valores esperados en cada celda de la tabla sean al menos 5. l test de probabldad exacta de Fsher requere el cálculo de las probabldades ndvduales para las dstntas maneras (combnacones) en que pueden aparecer las frecuencas dentro de las celdas de la tabla de contngenca, mantenendo constantes las frecuencas margnales. No vamos a revsar los cálculos para la prueba de Fsher sno que revsaremos la solucón que nos da la salda SPSS cuando analzamos tablas de contngenca. Paradoja de Smpson (opconal) Ya hemos revsado el problema de las varables confundentes, el efecto de estas varables podría nfluencar la asocacón entre dos varables categórcas. jemplo: Suponga que el Mnstero de Salud nos entrega datos sobre la mortaldad de dos Hosptales de la Regón. Los datos en una tabla de x nos muestran la sobrevvenca de pacentes después de crugía en el hosptal A y B, donde sobrevvenca sgnfca que el pacente está vvo al menos 6 semanas después de la crugía. HOSPITAL A B stado Vvo 37 784 pacente Muerto 63 16 Total 1 8 Hosptal A perde 63/1 = 3% de los pacentes de crugía y Hosptal B perde 16/8 = % de los pacentes de crugía. Conclumos que el Hosptal B es "mejor". Pero, no todas las crugías son del msmo tpo. Luego, se entregan nuevos datos que ncluyen la condcón de los pacentes antes de la crugía clasfcados como "buena" o "mala". stado Buena condcón Mala condcón Hosptal Hosptal A B A B Sobrevve 594 59 stado Sobrevve 1443 19 Muere 6 8 Muere 57 8 Total 6 6 Total 15 S analzamos ahora según la condcón, resulta que en el Hosptal A sólo 6/6 = 1% muere y en el Hosptal B 8/6 = 1,3% muere entre los pacentes que estaban en buenas condcones. ntre los pacentes que están en malas condcones en el Hosptal A sólo 57/15 = 3,8% muere y en el Hosptal B 8/ = 4% muere. ste fenómeno es conocdo como la paradoja de Smpson. 6