4 Descripción conjunta de varias variables. Análisis Exploratorio de Datos Tema Ordenación de los datos

Tamaño: px
Comenzar la demostración a partir de la página:

Download "4 Descripción conjunta de varias variables. Análisis Exploratorio de Datos Tema Ordenación de los datos"

Transcripción

1 Grado en Estadística y Empresa 1 Grado en Estadística y Empresa 2 4 Descripción conjunta de varias variables Análisis Exploratorio de Datos Tema 4 Aurea Grané Dpto Estadística Universidad Carlos III de Madrid Cuando en un mismo individuo se observan dos carácteres, el conjunto de las diferentes observaciones posibles, en forma de valores apareados, recibe el nombre de variable bidimensional o bivariante Denotaremos cada una de las variables observadas por X, Y yla variable bivariante por (X, Y ) En una muestra de tamaño n de la variable bivariante (X, Y ), supondremos que se han observado k valores diferentes de X y r valores diferentes de Y, de manera que la variable (X, Y ) puede tomar k r pares de valores diferentes (x i,y j ), i =1,,k, j =1,,r Grado en Estadística y Empresa 3 Grado en Estadística y Empresa 4 41 Ordenación de los datos Sean (x i,y j )losk r pares diferentes de valores que puede tomar la variable (X, Y ) sobre los n individuos de la muestra La frecuencia absoluta n ij es el número de veces que se ha observado el par (x i,y j )enlosn individuos de la muestra La frecuencia relativa es el cociente f ij = n ij /n Se denomina distribución conjunta de (X, Y ) al conjunto formado por los valores observados en forma de pares (x i,y j ), i =1,,k, j =1,,r en los n individuos de la muestra, y las frecuencias absolutas correspondientes a cada uno de estos pares Tabla de doble entrada y tabla de contingencias: Silas variables X e Y son cuantitativas, la tabla se denomina tabla de doble entrada y si son cualitativas, se denomina tabla de contingencias Y X y 1 y 2 y j y r n X x 1 n 11 n 12 n 1j n 1r n 1 x 2 n 21 n 22 n 2j n 2r n 2 x i n i1 n i2 n ij n ir n i x k n k1 n k2 n kj n kr n k n Y n 1 n 2 n j n r n

2 Grado en Estadística y Empresa 5 Grado en Estadística y Empresa 6 Frecuencias marginales: La frecuencia absoluta marginal del valor x i de la variable X es n i = n i1 + n i2 + + n ir = ylafrecuencia absoluta marginal del valor y j de la variable Y es n j = n 1j + n 2j + + n kj = La frecuencia relativa marginal del valor x i es f i = n i /n ylafrecuencia relativa marginal del valor y j es f j = n j /n r l=1 k l=1 n il n lj Frecuencias acumuladas marginales: Ordenando los valores de las variables X e Y en orden creciente, se define: La frecuencia absoluta marginal acumulada del valor x i es N i = n 1 + n n i = ylafrecuencia absoluta marginal acumulada del valor y j es N j = n 1 + n n j = Análogamente, las frecuencias relativas marginales acumuladas son F i = N i /n para el valor x i,yf j = N j /n para el valor y j i l=1 j l=1 n l n l Grado en Estadística y Empresa 7 Propiedades de las frecuencias: 1 0 n ij n, 0 f ij 1, i =1,,k, j =1,,r 2 k i=1 n i = n, r j=1 n j = n 3 k i=1 f i =1, r j=1 f j =1 4 N 1 = n 1, N i = N i 1 + n i, i =2,,k N 1 = n 1, N j = N j 1 + n j, j =2,,r 5 F 1 = f 1, F i = F i 1 + f i, i =2,,k F 1 = f 1, F j = F j 1 + f j, j =2,,r 6 N k = N r = n, F k = F r =1 Grado en Estadística y Empresa 8 Distribuciones marginales: Distribución marginal de X es el conjunto formado por los diferentes valores que ha tomado X junto con sus frecuencias absolutas marginales Distribución marginal de Y es el conjunto formado por los diferentes valores que ha tomado Y junto con sus frecuencias absolutas marginales X n X Y n Y x 1 n 1 y 1 n 1 x 2 n 2 y 2 n 2 x k n k y r n r n n Observación 1 Las distribuciones marginales son distribuciones univariantes

3 Grado en Estadística y Empresa 9 Grado en Estadística y Empresa 10 Ejemplo 1 La siguiente tabla contiene información sobre los fondos activos (en billones de dólares) de 220 empresas de Estados Unidos agrupadas según el sector al que pertenecen: Sector Fondos activos Energía Finanzas Tecnología [0, 5) [5, 15) [15, 50] Cuáles son las variables de estudio? De qué tipo son? Qué valores toman? Cuáles son sus distribuciones marginales? Ejemplo 2 La tabla siguiente contiene los resultados sobre una encuesta realizada a 400 personas: Tiene usted lector de libros digitales? Sí No Edad (años) Hombres Mujeres Hombres Mujeres Total [15, 25) [25, 35) [35, 55) [55, 75] Cuántas variables hay en este estudio? De qué tipo son? Cuáles son sus distribuciones marginales? Grado en Estadística y Empresa 11 Grado en Estadística y Empresa 12 Distribuciones condicionadas: Dada la distribución conjunta de (X, Y ), se denomina distribución condicionada a la distribución de frecuencias absolutas de una de las variables suponiendo conocido y fijado el valor que toma la otra variable La distribución de X condicionada a que Y tome el valor y j es X Y =yj x 1 x 2 x i x k n ij n 1j n 2j n ij n kj n j y la distribución de Y condicionada a que X tome el valor x i es Y X=xi y 1 y 2 y j y r n ij n i1 n i2 n ij n ir n i Observación 2 Las definiciones anteriores son casos muy sencillos de distribución condicionada Pero puede condicionarse también al hecho que la variable tome varios valores aislados o bien a que tome valores dentro de un intervalo Por ejemplo, X Y yj, Y X xi En el ejemplo siguiente: Sector Fondos activos Energía Finanzas Tecnología [0, 5) [5, 15) [15, 50] las preguntas es cierto que los fondos activos del sector financiero son superiores en media a los del sector tecnológico? qué porcentaje de las empresas que no son del sector energértico tienen unos fondos activos superiores a los 10 billones de dólares? se resuelven a partir de ciertas distribuciones condiconadas

4 Grado en Estadística y Empresa 13 Grado en Estadística y Empresa Características numéricas marginales 42 Representaciones gráficas Diagrama de dispersión Se utiliza cuando las dos variables son continuas Es una representación sobre el plano R 2 de los diferentes puntos observados (x i,y j ) En el eje horitzontal se representa la variable X y en el eje vertical la variable Y Diagrama de barras en tres dimensiones Es una representación en R 3 de las frecuencias absolutas (o relativas) de los pares (x i,y j ), cuando ninguna de las variables está agrupada en intervalos de clase Se suele utilizar para variables discretas con pocos valores diferentes Medias marginales: x = 1 n Varianzas marginales: s 2 X = 1 n s 2 Y = 1 n k x i n i, i=1 y = 1 n r y j n j j=1 k (x i x) 2 n i = x 2 x 2, i=1 r (y j y) 2 n j = y 2 y 2, j=1 Observación 3 Para las distribuciones marginales y condicionadas (univariantes) pueden calcularse todas las medidas numéricas estudiadas en el Tema 2 Grado en Estadística y Empresa 15 Grado en Estadística y Empresa 16 Ejercicio 41 La siguiente tabla muestra la distribución conjunta de frecuencias relativas de la variable X, que representa el número de tarjetas de crédito que posee una persona, y la variable Y, que refleja el número de compras semanales pagadas con tarjeta de crédito Y = Num compras por semana X = Num tarjetas a) Si se sabe que en el estudio han participado 300 personas, hallar la distribución conjunta de frecuencias absolutas a) Puesto que la tabla anterior contiene las frecuencias relativas, f ij = n ij, para i =1,,3, j =1,,5, n la distribución conjunta de frecuencias absolutas se obtendrá multiplicando cada f ij por n = 300 Y = Num compras por semana X = Num tarjetas

5 Grado en Estadística y Empresa 17 Grado en Estadística y Empresa 18 b) y c) La distribución marginal de Y se obtiene sumando, para cada valor de la variable Y, las filas de la tabla, mientras que la distribución marginal de X se obtiene sumando, para cada valor de la variable X, las columnas de la tabla b) Hallar la distribución marginal de Y Cuál es el número medio y la desviación típica del número de compras semanales pagadas con tarjeta de crédito? c) Obtener la distribución del número de tarjetas de crédito que poseen las personas de dicho estudio Cuál es el número más frecuente de tarjetas de crédito que posee una de estas personas? Y = Num compras por semana X = Num tarjetas n i n j Cuál es el número más frecuente de tarjetas de crédito que posee una de estas personas? Grado en Estadística y Empresa 19 Grado en Estadística y Empresa 20 El número más frecuente de tarjetas de crédito se obtiene con la moda de X, queesmo(x) = 1 La media y desviación de Y se calculan a partir de la distribución marginal de Y : Y = Num compras por semana X = Num tarjetas n i n j n j y j n j yj d) Calcular la distribución del número de compras semanales pagadas con tarjetas de crédito que realizan las personas que poseen tres tarjetas Cuál es la media de esta distribución? Cuánto valen su moda y su mediana? Interpretar estas medidas y = =211, sn(y )2 = (211)2 =166, s n(y )= 166 = 129

6 Grado en Estadística y Empresa 21 Grado en Estadística y Empresa 22 d) La distribución de Y condicionada a X = 3, es decir, Y X=3,se obtiene mediante la tercera fila de la tabla del apartado (a): Y X=3 n 3j N 3j y j n 3j total La media es y X=3 = 213/78 = 273 y representa el número medio de compras por semana que hacen las personas que tienen 3 tarjetas La mediana es Me(Y X=3 ) = 3, indicando que el 50% de las personas que tienen 3 tarjetas hacen como máximo 3 compras por semana Cuánto vale la moda? Pregunta: En media, qué grupo de personas realiza más compras por semana, las que solamente tienen una tarjeta de crédito, las que tienen dos o las que tienen tres tarjetas de crédito? Para contestar a esta pregunta hay que calcular la media de las tres distribuciones condicionadas siguientes: Y X=1, Y X=2, Y X=3 : y X=1 = =156, y X=2 = =226, y X=3 = =273 Portanto,enmedia,elgrupoquemás compras semanales realiza es el de las personas con tres tarjetas de crédito Grado en Estadística y Empresa 23 Grado en Estadística y Empresa Características numéricas conjuntas para tablas de doble entrada Pregunta: Existe alguna relación entre el número de compras que una persona realiza por semana y el número de tarjetas de crédito que posee? Para poder responder a esta pregunta necesitamos poder medir la variación conjunta de ambas variables Esto no se consigue con ninguna de las medidas marginales vistas hasta ahora Dos de las medidas más utilizadas para datos bivariantes que cuantifican el grado de dependencia lineal entre dos variables son la covarianza y el coeficiente de correlación lineal de Pearson Covarianza: Es una medida de variación conjunta de dos variables Se define como: s XY = 1 k r (x i x)(y j y) n ij = xy x y, n donde i=1 j=1 xy = 1 n Observación 4 s XX = s 2 X k i=1 j=1 r x i y j n ij

7 Grado en Estadística y Empresa 25 Grado en Estadística y Empresa 26 Interpretación geométrica de la covarianza Consideremos la nube de puntos formada por los n pares de datos (x i,y i ), cuyo centro de gravedad es (x, y), de manera que la nube de puntos queda dividida en cuatro cuadrantes Figure 1: Interpretación geométrica de la covarianza Relación lineal entre variables Qué valores puede tomar la covarianza? s XY = 1 n k r (x i x)(y j y) n ij i=1 j=1 Cuando será positiva? Cuando negativa? Puede ser igual a cero? (x, y) (x, y) Los puntos que se encuentran en el primer y tercer cuadrante contribuyen positivamente a s XY, y los que se encuentran en el segundo y cuarto cuadrante lo hacen negativamente (a) s XY > 0 (b) s XY < 0 (a) Y tiende a aumentar cuando lo hace X (relación lineal directa), (b) Y tiende a disminuir cuando X aumenta (relación lineal inversa) Grado en Estadística y Empresa 27 Grado en Estadística y Empresa 28 Si los puntos se reparten con igual intensidad alrededor del centro de gravedad, entonces se tendrá ques XY = 0, lo que indicará queno hay relación lineal entre las variables Esto no significa que no pueda existir otro tipo relación entre las variables Figure 2: Interpretación geométrica de la covarianza lineal entre variables Relación no Para responder a la pregunta (del Ejercicio 41) Pregunta: Existe alguna relación entre el número de compras que una persona realiza por semana y el número de tarjetas de crédito que posee? (x, y) (x, y) Debemos calcular la covarianza entre X= número de tarjetas de crédito que posee una persona e Y= número de compras semanales pagadas con tarjeta de creédito s XY =0 s XY =0

8 Grado en Estadística y Empresa 29 Grado en Estadística y Empresa 30 Covarianza entre X e Y : Y X n i n i x i n i x 2 i x i ( 5 j=1 nij yj ) n j n j y j n j yj x = =187, s2 x = (187)2 =063, y =211, s 2 y =166, s xy = xy x y = 1296 (187) (211) = Qué significa que s xy =037? Inconvenientes de la covarianza: No está acotada ni superior ni inferiormente ( <s XY < + ), Depende de las unidades de medida de las variables Proposición 41 Si (x 1,y 1 ),,(x n,y n ) es una muestra de tamaño n de la variable bidimensional (X, Y ), a R, b R, conb 0,y Z = a + by es una transformación lineal de Y, entonces (Demostración) s X,Z = bs XY Esta proposición dice que la covarianza, al igual que ocurría con la varianza, es invariante frente a traslaciones, pero no frente a cambios de escala que afecten a las variables Grado en Estadística y Empresa 31 Grado en Estadística y Empresa 32 El coeficiente de correlación lineal de Pearson Es una medida adimensional de la variación conjunta de dos variables Se define como: r XY = s XY, 1 r XY 1 s X s Y El signo de r XY coincide con el signo de s XY e indica el tipo de dependencia entre X e Y Interpretación: Si r XY > 0 dependencia directa Si r XY < 0 dependencia inversa r XY =1 correlación máxima entre X e Y Relación lineal perfecta r XY =0 No existe correlación lineal entre X e Y ysedicequeestán incorreladas X e Y no tienen relación lineal Proposición 42 El coeficiente de correlación entre dos variables no se ve afectado por las traslaciones ni por los cambios de escala Demostración: Consideremos la variable bidimensional (X, Y )yla variable Z = a + by,cona, b R y b>0 Entonces: r XZ = s XZ s X s Z = bs XY bs X s Y = s XY s X s Y = r XY, es decir, los pares (X, Y )e(x, Z) tienen el mismo coeficiente de correlación Observación: r XX =1

9 Grado en Estadística y Empresa 33 Grado en Estadística y Empresa 34 Pregunta: En el Ejercicio 41, cómo es la relación entre el el número de compras que una persona realiza por semana y el número de tarjetas de crédito que posee? Para responder a esta pregunta, podemos calcular el coeficiente de correlación lineal de Pearson, sabiendo que s xy =037, s 2 x =063 y s 2 y =166 Sustituyendo: r xy = s xy 037 = =036 s x s y Qué significa que r xy =036? Ejercicio 42 Responde a las siguientes cuestiones: a) Supongamos que se miden dos variables y que la segunda siempre toma un valor más pequeño que la primera Es verdad que el coeficiente de correlación lineal de Pearson será negativo? Poner un ejemplo b) Supongamos que en las parejas de hermanos gemelos, uno siempre fuese un 2% más bajo que el otro Cuál sería la correlación lineal entre las alturas de los dos hermanos? Justificar la respuesta c) En general, qué se puede deducir si el coeficiente de correlación lineal entre dos variables es exactamente igual a cero? Grado en Estadística y Empresa 35 Grado en Estadística y Empresa 36 Matriz de covarianzas: Dada una variable multidimensional (X 1,X 2,,X p ), las varianzas de cada una de estas variables y las covarianzas entre pares de ellas pueden expresarse en forma matricial, dando lugar a la matriz de covarianzas: s 2 1 s 12 s 1p s 21 s 2 2 s 2p S =, s p1 s p2 s 2 p donde s 2 i = s2 X i para i =1,,p y s ij = s Xi,X j para i j Observación: La matriz de covarianzas es simétrica: s ij = s ji, i, j Matriz de correlaciones: Dada una variable multidimensional (X 1,X 2,,X p ), las correlaciones entre pares de variables pueden expresarse en forma matricial, dando lugar a las matriz de correlaciones: 1 r 12 r 1p r 21 1 r 2p R =, r p1 r p2 1 donde r ij = r Xi,X j para i j Observación: La matriz de correlaciones es simétrica: r ij = r ji, i, j

10 Grado en Estadística y Empresa 37 Grado en Estadística y Empresa 38 Ejercicio 43 Se han clasificado 100 familias según el número de hijos e hijas, en la siguiente tabla: M H a) Hallar las medias, varianzas y desviaciones típicas marginales b) Qué número medio de hijas hay en aquellas familias con 2 hijos? c) Qué número medio de hijos hay en aquellas familias que sin hijas? d) Qué número medio de hijos tienen aquellas familias que a lo sumo tienen 2 hijas? e) Hallar la covarianza Ejercicio 43 (continuación): a) Definimos las variables X = número de hijos e Y = número de hijas, y construimos la tabla de frecuencias marginales: Y X y 1 =0 y 2 =1 y 3 =2 y 4 =3 y 5 =4 n i x 1 = x 2 = x 3 = x 4 = x 5 = n j Grado en Estadística y Empresa 39 Ejercicio 43 (continuación): x = 1 n Y X n i n i x i n i x 2 i x 1 = x 2 = x 3 = x 4 = x 5 = n j n j y j n j y 2 j i=1 n i x i = =156, y = 1 n 5 i=1 n j y j = =146, Grado en Estadística y Empresa 40 Ejercicio 43 (continuación): Y X n i n i x i n i x 2 i x 1 = x 2 = x 3 = x 4 = x 5 = n j n j y j n j y 2 j s 2 X = x 2 x 2 = (156)2 =153 s X = 153 = 124, s 2 Y = y 2 y 2 = (146)2 =129 s Y = 129 = 114

11 Grado en Estadística y Empresa 41 Grado en Estadística y Empresa 42 Ejercicio 43 (continuación): b) Nos preguntan por y X=2 Distribución de Y condicionada a X = x 3 =2: y X=2 = 1 n 3 Y X=2 n 3 j n 3 j y j y 1 =0 7 0 y 2 =1 8 8 y 3 = y 4 =3 3 9 y 5 =4 1 4 total j=1 n 3 jy j = =129 Ejercicio 43 (continuación): c) Nos preguntan por x Y =0 Distribución de X condicionada a Y = y 1 =0: x Y =0 = 1 n 1 X Y =0 n i 1 n i 1 x i x 1 =0 4 0 x 2 =1 5 5 x 3 = x 4 = x 5 =4 2 8 total i=1 n i 1x i = =183 Grado en Estadística y Empresa 43 Ejercicio 43 (continuación): d) Nos preguntan cuánto vale x Y 2 Distribución de X condicionada a que Y tome los valores y 1 =0,y 2 =1,y 3 =2: X Y 2 n i 1 n i 2 n i 3 3 j=1 nij ( 3 j=1 nij ) x i x 1 = x 2 = x 3 = x 4 = x 5 = total x Y 2 = 1 3 j=1 nij 5 3 i=1 j=1 n ij x i = =159 Grado en Estadística y Empresa 44 Ejercicio 43 (continuación): e) Covarianza: Y X n i n i x i n i x 2 i x 5 i j=1 nij yj x 1 = x 2 = x 3 = x 4 = x 5 = n j n j y j n j y 2 j s XY = x, y x y = 209 (156)(146) =

12 Grado en Estadística y Empresa 45 Grado en Estadística y Empresa El coeficiente de correlación de Spearman Permite determinar si hay concordancia, discordancia o independencia entre los criterios seguidos por dos observadores a la hora de asignar preferencias (o rangos) sobre un conjunto de elementos Se define como: r S =1 6 k i=1 d2 i k (k 2 1), 1 r S 1, donde d i = A i B i representa la diferencia entre el orden de preferencia asignado al i-ésimo elemento por los observadores A y B, k es el número de elementos del conjunto a ordenar Interpretación: Si r S = 1, la concordancia entre los dos criterios será absoluta Si r S = 0, diremos que los criterios seguidos son independientes Si r S = 1, la discordancia entre los dos criterios será absoluta Ejemplo 43 Preguntamos a dos hermanos sus preferencias sobre diferentes deportes La seguiente tabla contiene los órdenes de preferencias dados por cada hermano: deporte A i B i tennis 1 7 fútbol 5 3 baloncesto 6 2 natación 2 6 waterpolo 3 5 voleibol 7 1 golf 4 4 Averiguad si los gustos deportivos de estos dos hemanos son iguales, opuestos o independientes Grado en Estadística y Empresa 47 Grado en Estadística y Empresa 48 Ejemplo 43 (continuación): deporte A i B i d i d 2 i tennis fútbol baloncesto natación waterpolo voleibol golf Tenemos k = 7 elementos El coeficiente de correlación de Spearman es: r S =1 6 k i=1 d2 i =1 k (k 2 1) 7 48 = 1, por tanto, los gustos deportivos de los dos hermanos son totalmente opuestos, ya que los dos criterios de ordenación son del todo discordantes 46 Medidas de associación para tablas de contingencias Las tablas de contingencias sirven para estudiar la relación entre dos variables cualitativas o variables que han sido previamente categorizadas Estudiar la relación significa estudiar la independencia ylaasociación Para estudiar la independencia entre variables se utiliza el contraste de independencia chi-cuadrado Para estudiar este grado de dependencia dos variables cualitativas se utilizan las medidas de asociación

13 Grado en Estadística y Empresa 49 Grado en Estadística y Empresa 50 El contraste de independencia χ 2 El contraste de independencia χ 2 es uno de los más usados en aplicaciones estadísticas (sobre todo en ciencias experimentales) Fue introducido por Karl Pearson en 1900 Sirve para decidir si dos criterios de clasificación sobre el mismo conjunto de individuos son independientes o no (es decir, si existe o no relación entre dos variables categóricas que se han medido sobre la misma muestra de individuos) Por ejemplo, nos puede interesar determinar si el ser fumador tiene relación con cierto aumento de la presión arterial, si el consumo habitual de alcohol está relacionado con la pérdida de cierto tipo de reflejos, si el practicar deporte con cierta regularidad disminuye la probabilidad de padecer enfermedades cardiovasculares, etc Si denominamos X e Y a las variables categóricas, y x 1,x 2,,x k e y 1,y 2,,y r, son los diferentes valores que pueden tomar, respectivamente, la clasificación de la muestra según estos valores da lugar a una tabla de contingencias donde las casillas contienen las frecuencias observadas para cada par de valores X \ Y y 1 y 2 y j y r n X x 1 n 11 n 12 n 1j n 1r n 1 x 2 n 21 n 22 n 2j n 2r n 2 x i n i1 n i2 n ij n ir n i x k n k1 n k2 n kj n kr n k n Y n 1 n 2 n j n r n Grado en Estadística y Empresa 51 Grado en Estadística y Empresa 52 La fórmula del estadístico χ 2 es Q = k r i=1 j=1 (n ij e ij ) 2 e ij, donde e ij son las frecuencias que esperaríamos encontrar si los dos criterios de clasificación fueran independientes Esta cantidad es una medida de concordancia (distancia) entre las frecuencias observadas (las n ij ) y las frecuencias esperadas Q tomará valores mayores cuando menos se parezcan las frecuencias observadas a las esperadas Cómo se obtienen las frecuencias esperadas? Se utiliza el siguiente resultado de probabilidades: Si las dos variables son independientes, P (X = x i,y = y j )=P (X = x i ) P (Y = y j ), i, j, Para estimar las probabilidades P (X = x i )yp(y = y j ) se utilizan las frecuencias relativas marginales f i y f j, respectivamente Por tanto, el valor que esperaríamos encontrar en la casilla (i, j) es: e ij = f i f j n = n i n n j n n = n i n j n Sustituyendo en la fórmula del estadístico, se tiene que: Q = k i=1 j=1 r (n ij n i n j /n) 2 n i n j /n

14 Grado en Estadística y Empresa 53 Grado en Estadística y Empresa 54 El estadístico Q intenta medir cuánto se parecen las frecuencias observadas con las esperadas bajo el supuesto de independencia Fijémonos en el numerador de su fórmula: Q = k i=1 j=1 r (n ij n i n j /n) 2 n i n j /n Cuando Q tome valores grandres será poco creíble que ambas frecuencias se parecen Por el contrario, cuando Q tome valores pequeños esta hipótesis será más creíble Por tanto, hay que calibrar qué esgrande yquéespequeño Bajo la hipótesis de independencia, el estadístico Q tiene una ley χ 2 (k 1)(r 1) Se utiliza como umbral de decisión (o valor crítico) el percentil (1 α)100 de esta ley de probabilidad Figure 3: Función de densidad del estadístico Q en el supuesto de independencia c 1 α Criterio de decisión: Si Q>c 1 α la hipótesis de independecia no resultará creíble Grado en Estadística y Empresa 55 Grado en Estadística y Empresa 56 Observación 5 Para que el estadístico Q tenga una ley χ 2 (k 1)(r 1) debe cumplirse que e ij 10, i, j, y que al menos el número de filas o el número de columnas de la tabla de contingencias sea mayor que 2 Si alguna frecuencia esperada es tal que 5 e ij 10 obiensise trata de una tabla 2 2, entonces hay que aplicar al estadístico Q la denominada corrección de Yates: Q = k i=1 j=1 r ( n ij n i n j /n 05) 2, n i n j /n Si alguna frecuencia esperada es inferior a 5 y no pueden agruparse categorías, entonces hay que recorrer a otros métodos que no se verán en este curso introductorio (test exacto de Fisher) Ejemplo de cálculo del estadístico χ 2 Un equipo de médicos quiere estudiar si existe un componente genético en el hecho de padecer o no determinadas enfermedades infecciosas Para llevar a cabo la investigación, seleccionan una muestra de 4368 parejas de gemelos, de los cuales 880 son genéticamente idénticos De éstos, en 151 pares ambos gemelos padecen alguna de las enfermedades, mientras que, de los no idénticos, en 53 casos están ambos enfermos Cuál puede ser la conclusión del estudio? enfermos no enfermos n X gemelos idénticos gemelos no idénticos 53 n Y 4368

15 Grado en Estadística y Empresa 57 Grado en Estadística y Empresa Medidas de asociación para variables nominales Tabla de frecuencias esperadas: gemelos idénticos gemelos no idénticos enfermos no enfermos Las más comunes son: a) basadas en el estadístico chi-cuadrado b) basadas en reducción proporcional del error El estadístico Q (con la corrección de Yates) es: Q = El percentil 95% de una χ 2 1 es c 095 = Conclusión: a) Medidas basadas en el estadístico chi-cuadrado El estadístico χ 2 usado para contrastar la independencia entre variables no es una buena medida de asociación porque: su valor depende del tamaño muestral, depende del grado de independencia entre variables, sólo depende de las frecuencias observadas y esperadas Es decir, tablas muy diferentes pueden dar lugar a un mismo valor de Q Grado en Estadística y Empresa 59 Grado en Estadística y Empresa 60 Las mediads basadas en el estadístico χ 2 intentan eliminar la influencia del tamaño muestral efectuando diversas correcciones que pretenden normalizarlo de forma que tome un valor entre 0 y 1 Dos de las más importantes son: El coeficiente de contingencia de Pearson Q/n C = 1+Q/n, 0 C<1 Si C =0 independencia Si C 1 asociación completa Cuando k = r, se puede demostrar que C toma valores menores que 1 1/k La V de Cramer Q/n V = min{k 1,r 1}, 0 V 1 Si V =0 independencia (no existe asociación) Si V = 1 asociación completa Pregunta: Cuánto valen C y V para el ejemplo anterior?

16 Grado en Estadística y Empresa 61 Grado en Estadística y Empresa 62 b) Medidas de asociación basadas en la reducción proporcional del error Se asume que una de las dos variables que dan lugar a la tabla de contingencias es función de la otra variable Por ejemplo, si Y es función de X, diremosquey es la variable dependiente y que X es la variable independiente Miden cómo de bien se puede predecir el valor de la variable dependiente conocido el valor de la variable independiente Para ello comparan el error cometido en dos situaciones: una donde no se usa la variable independiente para predecir la variable dependiente y otra donde sí El coeficiente λ de Goodman-Kruskal λ = P (error, sin información de X) P (error, con información de X), P (error, sin información de X) 0 λ 1 Si X e Y son independientes λ =0 Peroλ = 0 no implica que X e Y sean independientes Si λ =0 la información sobre X no ayuda en la predicción de Y λ =1 P (error, con información de X) =0 la información sobre X sí ayuda en la predicción de Y Grado en Estadística y Empresa 63 Grado en Estadística y Empresa Medidas de asociación para variables ordinales Se basan en la concordancia o discordancia de los pares de valores Por ejemplo: individuo nivel de ingresos estudios 1 bajo primarios 2 medio superiores 3 alto secundarios El par formado por los individuos 1 y 2 es un par concordante, puesto que los valores de las variables nivel de ingresos y estudios siempre son inferiores en el individuo 1 El par formado por los individuos 2 y 3 es una par discordante, porque el nivel de ingresos es inferior para el individuo 2, pero el nivel de estudios del individuo 2 es superior al del individuo 3 Cómo es el par formado por los individuos 1 y 3? Si en la tabla de contingencias la mayoría de pares de valores son concordantes se dice que la asociación es positiva, mientras que si la mayoría de pares de valores son discordantes se dice que la asociación es negativa Si llamamos C al número de pares concordantes y D es el número de pares discordantes, algunas medidas de asociación para este tipo de datos son: La γ de Goodman-Kruskal γ = C D, 1 γ 1 C + D Si γ =0 independencia (no existe asocicación) Si γ =1 asociación completa positiva Si γ = 1 asociación completa negativa

17 Grado en Estadística y Empresa 65 Grado en Estadística y Empresa 66 La D de Sommer C D D =, 1 D 1, n(n 1)/2 T X donde T X = k n i (n i 1) i=1 2, T Y = r n j(n j 1) j=1 2 La interpretación de esta medida es análogaaladelaγ de Goodman-Kruskal La τ B ylaτ C de Kendall τ B = C D (n(n 1)/2 TX )(n(n 1)/2 T Y ), 1 τ B 1, min{k, r}(c D) τ C = min{k 1,r 1} n 2, 1 τ C 1 La interpretación de estas medidas es análoga a la de la γ de Goodman-Kruskal Ejemplo: Se realiza un estudio de mercado sobre el uso y el grado de satisfacción de cierto detergente Para ello se considera una muestra de 310 individuos que responden a las siguientes preguntas: X: Grado de satisfacción con el detergente (bajo, medio, alto) Y : Uso del detergente (algunas veces, muchas veces, siempre) Uso del detergente Grado de algunas muchas satisfacción veces veces siempre bajo medio alto Qué se puede decir de la relación entre ambas variables? Grado en Estadística y Empresa 67 Grado en Estadística y Empresa 68 En primer lugar, mediante el estadístico χ 2 hay que determinar si existe relación entre ambas variables Tabla de frecuencias esperadas: Uso del detergente Grado de algunas muchas satisfacción veces veces siempre bajo medio alto Q = 3 i=1 j=1 3 (n ij n i n j /n) 2 = n i n j /n (20 645)2 ( )2 ++ = Si el percentil 95% para una χ 2 4 es c 095 =949, cuál es la decisión? Cuántos pares concordantes hay con los 20 individuos que usan el detergente algunas veces y su grado de satisfacción es bajo? Uso del detergente Grado de algunas muchas satisfacción veces veces siempre bajo medio alto Y con los 20 individuos que usan el detergente muchas veces ysugrado de satisfacción es bajo? Todos los que usen el detergente más de muchas veces y que su grado de satisfacción sea mayor que bajo Cuántos son? Hay algún par concordante con los 10 individuos que usan siempre el detergente y su grado de satisfacción es bajo? El número de pares concordantes es C = = 12100

18 Grado en Estadística y Empresa 69 Grado en Estadística y Empresa 70 Cuántos pares disconcordantes hay con los 20 individuos que usan el detergente muchas veces y su grado de satisfacción es bajo? Uso del detergente Grado de algunas muchas satisfacción veces veces siempre bajo medio alto Y con los 10 individuos que usan el detergente siempre y su grado de satisfacción es bajo? Todos los que usen el detergente menos que siempre y que su grado de satisfacción sea mayor que bajo Cuántos son? Hay algún par concordante con los 20 individuos que usan algunas veces el detergente y su grado de satisfacción es bajo? El número de pares disconcordantes es D = = 6100 Cuál es el grado de asociación entre las variables uso y grado de satisfacción del detergente? γ de Goodman-Kruskall: γ =(C D)/(C + D) =03297, τ C de Kendall: min{k, r} (C D) 3 ( ) τ C = = =00936, min{k 1,r 1} n2 2 (310 2 ) D de Sommer: D = C D ( ) = n(n 1)/2 T X 310(309)/ =02069, donde T X = 1 k 2 i=1 ni (ni 1) = 1 ( ) = El grado de dependencia es moderadamente bajo, puesto que no supera el 33% La asociación es positiva, indicando que cuánto más satisfecho está el cliente más usa el producto Grado en Estadística y Empresa 71 Grado en Estadística y Empresa 72 Ejercicio 45 Para probar la efectividad de una vacuna se realiza el siguiente experimento a un grupo de personas: se vacuna a una parte de ellas y se observa si contraen o no la enfermedad Los datos se recogen en la siguiente tabla: vacunados no vacunados enfermos no enfermos Estudiar la efectividad de la vacuna Para decidir si la vacuna es efectiva se realiza el contraste de independencia χ 2 entre las variables categóricas nominales X = contraer la enfermedad e Y = estar vacunado Qué representa la hipótesis de independencia? Primero se obtienen las frecuencias marginales: X \ Y vacunados no vacunados n i enfermos no enfermos n j y después la tabla de frecuencias esperadas bajo la hipótesis de independencia: vacunados no vacunados enfermos /914 = /914 = no enfermos /914 = /914 = 44911

19 Grado en Estadística y Empresa 73 Grado en Estadística y Empresa 74 Se calcula el estdístico χ 2, utilizando la corrección de Yates, al tratarse de una tabla 2 2: ( )2 ( )2 Q = ( )2 ( ) = = 6492 El percentil 95% de una ley χ 2 1 es c 095 =3841 Resulta creíble la hipótesis de independencia? Por qué? Qué seestá afirmando? Para saber el grado de efectividad de la vacuna, se calcula alguna medida de asociación para variables nominales Por ejemplo, el coeficiente de contingencia de Pearson C = Q/n 1+Q/n = 6492/ /914 = = 02575, olavdecramer Q/n 6492/914 V = min{k 1,r 1} = = Ambas medidas señalan que el grado de dependencia es bajo (del orden del 26%), indicando que la efectividad de la vacuna no es muy alta Es decir que el estar vacunado influye poco a la hora de contraer la enfermedad Grado en Estadística y Empresa 75 Grado en Estadística y Empresa 76 Ejercicio 46 La tabla siguiente contiene 901 individuos clasificados según las variables categóricas X = sueldo (en dólares USA) e Y = satisfacción con el trabajo Las categorías de la variable Y son: VI = muy insatisfecho, MI = moderadamente insatisfecho, MS = moderadamente satisfecho, VS= muy satisfecho sueldo VI MI MS VS < > Utilizando los datos de esta tabla calcular las medidas de asociación que se crean oportunas Puesto que X e Y estan medidas en una escala ordinal, calcularemos medidas de asociación para variables ordinales, que están basadas en los pares concordantes y pares discordantes Empezamos calculando las frecuencias marginales en la tabla de frecuencias observadas sueldo VI MI MS VS n i < > n j

20 Grado en Estadística y Empresa 77 Grado en Estadística y Empresa 78 A continuación calculamos los pares concordantes: C = 20( ) + 24( ) + 80( ) + 22( ) + 38( ) + 104( ) + 13( ) + 28( ) + 81(92) = y los pares discordantes: D = 24( ) + 80( ) + 82( ) + 38(13 + 7) + 104( ) + 125( ) + 28(7) + 81(7 + 18) + 113( ) = Grado en Estadística y Empresa 79 Grado en Estadística y Empresa 80 Finalmente, la γ de Goodman-Kruskall y la τ c de Kendall son: γ = C D = C + D =0127, min{k, r} (C D) 4( ) τ C = = =0040 min{k 1,r 1} n Para calcular la D de Sommer y la τ B de Kendall, necesitamos obtener T X = 1 k n i (n i 1) = 1 ( ) = , 2 2 i=1 T Y = 1 r n j (n j 1) = 1 ( ) = , 2 2 j=1 yentonces D = τ B = = C D n(n 1)/2 T X = =0082, C D (n(n 1)/2 TX)(n(n 1)/2 T Y ) =0093 ( )( )

4 Descripción conjunta de varias variables.

4 Descripción conjunta de varias variables. ANÁLISIS EXPLORATORIO DE DATOS 23 ANÁLISIS EXPLORATORIO DE DATOS 2 Descripción conjunta de varias variables..1 Ejemplos Ejemplo.1 La siguiente tabla de frecuencias absolutas corresponde a 200 observaciones

Más detalles

4 Descripción conjunta de varias variables. Ejemplos y ejercicios.

4 Descripción conjunta de varias variables. Ejemplos y ejercicios. ESTADÍSTICA DESCRIPTIVA Y ANÁLISIS DE DATOS 7 4 Descripción conjunta de varias variables. Ejemplos y ejercicios. 4.1 Ejemplos. Ejemplo 4.1 La siguiente tabla de frecuencias absolutas corresponde a 200

Más detalles

Estadística I Tema 3: Análisis de datos bivariantes

Estadística I Tema 3: Análisis de datos bivariantes Estadística I Tema 3: Análisis de datos bivariantes Tema 3: Análisis de datos bivariantes Contenidos 31 Tablas de doble entrada Datos bivariantes Estructura de la tabla de doble entrada Distribuciones

Más detalles

Tema 3: Análisis de datos bivariantes

Tema 3: Análisis de datos bivariantes Tema 3: Análisis de datos bivariantes 1 Contenidos 3.1 Tablas de doble entrada. Datos bivariantes. Estructura de la tabla de doble entrada. Distribuciones de frecuencias marginales. Distribución conjunta

Más detalles

Distribución bidimensional. Marginales. Correlación lineal. Rectas de regresión.

Distribución bidimensional. Marginales. Correlación lineal. Rectas de regresión. REGRESIÓN LINEAL. Distribución bidimensional. Marginales. Correlación lineal. Rectas de regresión. Dada una población, hasta ahora hemos estudiado cómo a partir de una muestra extraída de ella podemos

Más detalles

Técnicas de Inferencia Estadística II. Tema 6. Contrastes de independencia

Técnicas de Inferencia Estadística II. Tema 6. Contrastes de independencia Técnicas de Inferencia Estadística II Tema 6. Contrastes de independencia M. Concepción Ausín Universidad Carlos III de Madrid Grado en Estadística y Empresa Curso 2015/16 Contenidos 1. Introducción 2.

Más detalles

Análisis descriptivo con SPSS. Favio Murillo García

Análisis descriptivo con SPSS. Favio Murillo García Análisis descriptivo con SPSS Favio Murillo García Tablas de contingencia Cuando se trabaja con variables categóricas, los datos suelen organizarse en tablas de doble entrada en las que cada entrada representa

Más detalles

Distribuciones bidimensionales. Correlación.

Distribuciones bidimensionales. Correlación. Temas de Estadística Práctica Antonio Roldán Martínez Proyecto http://www.hojamat.es/ Tema 4: Distribuciones bidimensionales. Correlación. Resumen teórico Resumen teórico de los principales conceptos estadísticos

Más detalles

TEMA 14 ESTADÍSTICA. Cuantitativa: si puede medirse y expresarse con números (es una variable), por ejemplo la talla de calzado.

TEMA 14 ESTADÍSTICA. Cuantitativa: si puede medirse y expresarse con números (es una variable), por ejemplo la talla de calzado. Objetivos / Criterios de evaluación TEMA 14 ESTADÍSTICA O.15.1 Conocer el significado y saber calcular los parámetros de centralización y dispersión O.15.2 Interpretar y utilizar los parámetros de dispersión.

Más detalles

Estadística I Tema 3: Análisis de datos bivariantes

Estadística I Tema 3: Análisis de datos bivariantes Estadística I Tema 3: Análisis de datos bivariantes Tema 3: Análisis de datos bivariantes Contenidos 1. Introducción. Datos bivariantes. 2. Representaciones. Tablas de doble entrada. Distribución conjunta

Más detalles

Estadística I Ejercicios Tema 3 Curso 2016/17

Estadística I Ejercicios Tema 3 Curso 2016/17 Estadística I Ejercicios Tema 3 Curso 2016/17 1. En la siguiente tabla se representa la distribución conjunta de frecuencias (relativas) de 2 variables: calificación en Estadística I, y número de horas

Más detalles

ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL. 30/09/2004 Proyecto MaMaEuSch 1

ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL. 30/09/2004 Proyecto MaMaEuSch 1 ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL 0/09/00 Proyecto MaMaEuSch Estadística Ciencia que trata sobre los métodos científicos para: Recoger, organizar, resumir y analizar datos Sacar conclusiones relevantes

Más detalles

Tema 2: Análisis de datos bivariantes

Tema 2: Análisis de datos bivariantes 1 Tema 2: Análisis de datos bivariantes En este tema: Tabla de contingencia, tabla de doble entrada, distribución conjunta. Frecuencias relativas, marginales, condicionadas. Diagrama de dispersión. Tipos

Más detalles

Estadística I Tema 3: Análisis de datos bivariantes

Estadística I Tema 3: Análisis de datos bivariantes Estadística I Tema 3: Análisis de datos bivariantes Tema 3: Análisis de datos bivariantes Contenidos 1. Introducción. Datos bivariantes. 2. Representaciones. Tablas de doble entrada. Distribución conjunta

Más detalles

1, 2, 2, 3, 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 2, 1, 1, 4, 1

1, 2, 2, 3, 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 2, 1, 1, 4, 1 8 Estadística 81 Distribuciones unidimensionales Tablas de frecuencias En este tema nos ocuparemos del tratamiento de datos estadísticos uestro objeto de estudio será pues el valor de una cierta variable

Más detalles

INFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón

INFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón Metodología de Investigación Tesifón Parrón Contraste de hipótesis Inferencia Estadística Medidas de asociación Error de Tipo I y Error de Tipo II α β CONTRASTE DE HIPÓTESIS Tipos de Test Chi Cuadrado

Más detalles

Tema 2: Análisis de datos bivariantes

Tema 2: Análisis de datos bivariantes Tema 2: Análisis de datos bivariantes Los contenidos a desarrollar en este tema son los siguientes: 1. Tablas de doble entrada. 2. Diagramas de dispersión. 3. Covarianza y Correlación. 4. Regresión lineal.

Más detalles

Tema 9: Estadística en dos variables (bidimensional)

Tema 9: Estadística en dos variables (bidimensional) Tema 9: Estadística en dos variables (bidimensional) 1. Distribución de frecuencias bidimensional En el tema anterior se han estudiado las distribuciones unidimensionales obtenidas al observar sólo un

Más detalles

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 4)

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 4) OBJETIVOS DE APRENDIZAJE: TEMA Nº ANÁLISIS CONJUNTO DE DOS VARIABLES Distinguir entre variables cualitativas y cuantitativas, y saber elegir los métodos en cada caso. Conocer métodos gráficos y cuantitativos

Más detalles

Tema 10: Introducción a los problemas de Asociación y Correlación

Tema 10: Introducción a los problemas de Asociación y Correlación Tema 10: Introducción a los problemas de Asociación y Correlación Estadística 4 o Curso Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 10: Asociación y Correlación

Más detalles

Ejemplos y ejercicios de. Estadística Descriptiva. yanálisis de Datos. 2 Descripción estadística de una variable. Ejemplos y ejercicios.

Ejemplos y ejercicios de. Estadística Descriptiva. yanálisis de Datos. 2 Descripción estadística de una variable. Ejemplos y ejercicios. ESTADÍSTICA DESCRIPTIVA Y ANÁLISIS DE DATOS Ejemplos y ejercicios de Estadística Descriptiva yanálisis de Datos Diplomatura en Estadística Curso 007/08 Descripción estadística de una variable. Ejemplos

Más detalles

Tema: Medidas de Asociación con SPSS

Tema: Medidas de Asociación con SPSS Tema: Medidas de Asociación con SPSS 1.- Introducción Una de las tareas habituales en el análisis de encuestas es la generación y análisis de tablas de contingencia, para las variables y categorías objetivo

Más detalles

U ED Tudela Introducción al Análisis de Datos - Tema 4

U ED Tudela Introducción al Análisis de Datos - Tema 4 I TRODUCCIÓ AL A ÁLISIS DE DATOS TEMA 4: Análisis conjunto de dos variables. 1.- Cuando se dice que dos variables están correlacionadas positivamente, se tiene que interpretar que: A) un aumento en una

Más detalles

DISTRIBUCIONES BIDIMENSIONALES

DISTRIBUCIONES BIDIMENSIONALES RESUMEN DISTRIBUCIONES BIDIMENSIONALES J. Vega RELACIONES LABORALES ESTADÍSTICA 15 de noviembre de 2008 RESUMEN 1 DISTRIBUCIONES BIDIMENSIONALES DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES

Más detalles

1 Resolución de algunos ejemplos y ejercicios del tema 1.

1 Resolución de algunos ejemplos y ejercicios del tema 1. INTRODUCCIÓN A LA ESTADÍSTICA. GRUPO 71 LADE. 1 1 Resolución de algunos ejemplos y ejercicios del tema 1. 1.1 Ejemplos Ejemplo 1 Se han medido el grup sanguíneo de 40 individuos y se han observado las

Más detalles

TABLAS DE CONTINGENCIA

TABLAS DE CONTINGENCIA Tablas de contingencia 1 TABLAS DE CONTINGENCIA En SPSS, el procedimiento de Tablas de Contingencia crea tablas de clasificación doble y múltiple y, además, proporciona una serie de pruebas y medidas de

Más detalles

Representaciones gráficas de las distribuciones bidimensionales de frecuencias... 74

Representaciones gráficas de las distribuciones bidimensionales de frecuencias... 74 Índice 1. Introducción al R 15 1.1. Introducción............................. 15 1.2. El editor de objetos R....................... 18 1.3. Datos en R............................. 19 1.3.1. Vectores...........................

Más detalles

TEMA 9 EL ANÁLISIS BÁSICO DE LA INFORMACIÓN EN LA INVESTIGACION DE MERCADOS

TEMA 9 EL ANÁLISIS BÁSICO DE LA INFORMACIÓN EN LA INVESTIGACION DE MERCADOS TEMA 9 EL ANÁLISIS BÁSICO DE LA INFORMACIÓN EN LA INVESTIGACION DE MERCADOS 9.1. Análisis Descriptivo de la Información 9.2. La Tabulación Cruzada 9.3. Contraste de Hipótesis 9.1. Análisis Descriptivo

Más detalles

X Y

X Y Capítulo 2 Distribuciones bivariantes Hasta ahora hemos estudiado herramientas que nos permiten describir las características de un único carácter Sin embargo, en muchos casos prácticos, es necesario estudiar

Más detalles

D I S T R I B U C I O N E S B I D I M E N S I O N A L E S

D I S T R I B U C I O N E S B I D I M E N S I O N A L E S D I S T R I B U C I O N E S B I D I M E N S I O N A L E S 1. VARIABLES ESTADÍSTICAS BIDIMENSIONALES En numerosas ocasiones interesa estudiar simultáneamente dos (o más) caracteres de una población. En

Más detalles

Descripción conjunta de dos variables

Descripción conjunta de dos variables Descripción conjunta de dos variables Tema 2 Descripción breve del tema. Introducción Ignacio Cascos Depto. Estadística, Universidad Carlos III Ignacio Cascos Depto. Estadística, Universidad Carlos III

Más detalles

Tema 5. Estadística descriptiva bivariable con variables categóricas y numéricas

Tema 5. Estadística descriptiva bivariable con variables categóricas y numéricas Clase 5 Tema 5. Estadística descriptiva bivariable con variables categóricas y numéricas Relaciones entre variables categóricas La relación entre dos variables categóricas se analiza mediante una tabla

Más detalles

TEMA 2: DISTRIBUCIONES BIDIMENSIONALES

TEMA 2: DISTRIBUCIONES BIDIMENSIONALES TEMA : DISTRIBUCIONES BIDIMENSIONALES 1.- DISTRIBUCIONES BIDIMENSIONALES Cuando estudiamos un solo carácter estadístico, los datos que obtenemos forman una variable estadística unidimensional. También

Más detalles

Estadística I Tema 2: Análisis de datos univariantes

Estadística I Tema 2: Análisis de datos univariantes Estadística I Tema 2: Análisis de datos univariantes Tema 2: Análisis de datos univariantes Contenidos Gráficas para datos categóricos (diagrama de barras, diagrama de sectores). Gráficas para datos numéricos

Más detalles

UNIDAD DIDÁCTICA III ESTADÍSTICA BIDIMENSIONAL Y REGRESIÓN LINEAL SIMPLE

UNIDAD DIDÁCTICA III ESTADÍSTICA BIDIMENSIONAL Y REGRESIÓN LINEAL SIMPLE UNIDAD DIDÁCTICA III ESTADÍSTICA BIDIMENSIONAL Y REGRESIÓN LINEAL SIMPLE 1 INTRODUCCIÓN TEMA 1. TABLAS DE CONTINGENCIA : LECTURA E INTERPRETACIÒN TEMA 2. APLICACIONES TEMA 3.GRÀFICAS CON DOS VARIABLES

Más detalles

Cuaderno de actividades 1º

Cuaderno de actividades 1º Cuaderno de actividades 1º 1 ITRODUCCIÓ: Variables estadísticas bidimensionales En numerosas ocasiones interesa estudiar simultáneamente dos (o más) caracteres de una población En el caso de dos (o más)

Más detalles

Estadística Estadística descriptiva bivariante

Estadística Estadística descriptiva bivariante Estadística Estadística descriptiva bivariante Vamos a medir dos características (variables) sobre cada individuo. Las variables pueden ser cuantitativas o cualitativas combinadas de todas las formas posibles

Más detalles

Part I. Descripción estadística de dos variables. Estadística I. Mario Francisco. Variable. bidimensional. Distribuciones de frecuencias

Part I. Descripción estadística de dos variables. Estadística I. Mario Francisco. Variable. bidimensional. Distribuciones de frecuencias Part I Descripción de dos variables Introducción Si para un mismo individuo observamos simultáneamente k obtendremos como resultado una variable k-dimensional. Nos ocuparemos del estudio de las variables

Más detalles

MÉTODOS DE INVESTIGACIÓN EN EDUCACIÓN. Tema 8

MÉTODOS DE INVESTIGACIÓN EN EDUCACIÓN. Tema 8 Métodos de Investigación en Educación 1º Psicopedagogía Grupo Mañana Curso 009-010 010 MÉTODOS DE INVESTIGACIÓN EN EDUCACIÓN Tema 8 La relación entre variables. Los índices de correlación Objetivos Definir

Más detalles

Apuntes de Estadística

Apuntes de Estadística Apuntes de Estadística La Estadística es la ciencia que se encarga de recoger, organizar, describir e interpretar datos referidos a distintos fenómenos para, posteriormente, analizarlos e interpretarlos.

Más detalles

El análisis de correspondencias. Ana María López Jiménez Dept. Psicología Experimental (USE)

El análisis de correspondencias. Ana María López Jiménez Dept. Psicología Experimental (USE) El análisis de correspondencias Ana María López Jiménez Dept. Psicología Experimental (USE) 4. El análisis de correspondencias 4.. Introducción 4.2. Tabla de correspondencias 4.3. Dependencia e independencia

Más detalles

UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ECONÓMICAS

UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ECONÓMICAS UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ECONÓMICAS INSTITUTO DE INVESTIGACIÓN DE LA FACULTAD DE CIENCIAS ECONÓMICAS INFORME FINAL DEL TEXTO TEXTO: ESTADÍSTICA DESCRIPTIVA APLICADA A LA ECONOMIA

Más detalles

TEMA 5 Estadística descriptiva. Análisis de datos

TEMA 5 Estadística descriptiva. Análisis de datos TEMA 5 Estadística descriptiva. Análisis de datos Florence Nightingale (1820-1910) 1. Introducción. Modelos matemáticos 2. Métodos numéricos. Resolución de sistemas lineales y ecuaciones no lineales 3.

Más detalles

Variables estadísticas bidimensionales

Variables estadísticas bidimensionales Variables estadísticas bidimensionales BEITO J GOZÁLEZ RODRÍGUEZ (bjglez@ulles) DOMIGO HERÁDEZ ABREU (dhabreu@ulles) MATEO M JIMÉEZ PAIZ (mjimenez@ulles) M ISABEL MARRERO RODRÍGUEZ (imarrero@ulles) ALEJADRO

Más detalles

Qué es? Primer paso Representación en un sistema de coordenadas. numéricos Cada punto muestra el valor de cada pareja de datos (X e Y)

Qué es? Primer paso Representación en un sistema de coordenadas. numéricos Cada punto muestra el valor de cada pareja de datos (X e Y) Gráfico de dispersión Qué es? Primer paso Representación en un sistema de coordenadas cartesianas de los datos numéricos Cada punto muestra el valor de cada pareja de datos (X e Y) Gráfico de dispersión

Más detalles

Técnicas Cuantitativas para el Management y los Negocios

Técnicas Cuantitativas para el Management y los Negocios Técnicas Cuantitativas para el Management y los Negocios Contador Público Módulo I: ESTADÍSTICA DESCRIPTIVA Contenidos Módulo I Unidad 1. Introducción y conceptos básicos Conceptos básicos de Estadística.

Más detalles

Lucila Finkel Temario

Lucila Finkel Temario Lucila Finkel Temario 1. Introducción: el análisis exploratorio de los datos. 2. Tablas de contingencia y asociación entre variables. 3. Correlación bivariada. 4. Contrastes sobre medias. 5. Regresión

Más detalles

Julio Deride Silva. 18 de agosto de 2010

Julio Deride Silva. 18 de agosto de 2010 Estadística Descriptiva Julio Deride Silva Área de Matemática Facultad de Ciencias Químicas y Farmcéuticas Universidad de Chile 18 de agosto de 2010 Tabla de Contenidos Estadística Descriptiva Julio Deride

Más detalles

Tema 9: Estadística descriptiva

Tema 9: Estadística descriptiva Tema 9: Estadística descriptiva Matemáticas específicas para maestros Grado en Educación Primaria Matemáticas específicas para maestros Tema 9: Estadística descriptiva Grado en Educación Primaria 1 / 47

Más detalles

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS 1. INTRODUCCIÓN Este tema se centra en el estudio conjunto de dos variables. Dos variables cualitativas - Tabla de datos - Tabla de contingencia - Diagrama de barras - Tabla de diferencias entre frecuencias

Más detalles

Estadística ESTADÍSTICA

Estadística ESTADÍSTICA ESTADÍSTICA La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un estudio estadístico consta

Más detalles

Universidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL

Universidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL Universidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL OBJETIVO Analizar las Diferentes formas de Describir la Relación entre dos variables numéricas Trazar un diagrama de dispersión

Más detalles

Análisis de datos cualitativos

Análisis de datos cualitativos Capítulo Análisis de datos cualitativos DEFINICIÓN DE VARIABLES CUALITATIVAS Son aquellas variables cuyos valores son un conjunto de cualidades no numéricas a las que se llama categorías o modalidades.

Más detalles

Estadística para el análisis de los Mercados S3_A1.1_LECV1. Estadística Descriptiva Bivariada

Estadística para el análisis de los Mercados S3_A1.1_LECV1. Estadística Descriptiva Bivariada Estadística Descriptiva Bivariada En el aspecto conceptual, este estudio puede ser generalizado fácilmente para el caso de la información conjunta de L variables aunque las notaciones pueden resultar complicadas

Más detalles

Tema 2: Estadística Bivariante Unidad 1: Correlación y Regresión

Tema 2: Estadística Bivariante Unidad 1: Correlación y Regresión Estadística Tema 2: Estadística Bivariante Unidad 1: Correlación y Regresión Área de Estadística e Investigación Operativa Licesio J. Rodríguez-Aragón Octubre 2010 Contenidos...............................................................

Más detalles

Contrastes basados en el estadístico Ji Cuadrado

Contrastes basados en el estadístico Ji Cuadrado Capítulo 10 Contrastes basados en el estadístico Ji Cuadrado 10.1. Introducción Existen multitud de situaciones en el ámbito de la salud en el que las variables de interés, las cuales no pueden cuantificarse

Más detalles

ESTADÍSTICA BIDIMENSIONAL

ESTADÍSTICA BIDIMENSIONAL ESTADÍSTICA BIDIMENSIONAL 0. REPASO DE ESTADÍSTICA La estadística es la parte de las Matemática que estudia los fenómenos que se prestan a cuantificación, que generan conjunto de datos. La misión del estadístico

Más detalles

Soluciones al examen de Estadística Aplicada a las Ciencias Sociales Junio 2008 Primera semana

Soluciones al examen de Estadística Aplicada a las Ciencias Sociales Junio 2008 Primera semana Soluciones al examen de Estadística Aplicada a las Ciencias Sociales Junio 008 Primera semana Ejercicio 1. Para analizar la asociación entre el nivel de estudios y la renta calcularemos el estadístico

Más detalles

Estadística Descriptiva y Probabilidad FORMULARIO

Estadística Descriptiva y Probabilidad FORMULARIO Estadística Descriptiva y Probabilidad FORMULARIO Departament d Estadística i Investigació Operativa Universitat de València Angel Corberán Francisco Montes 2 3 Capítulo 1 Estadística Descriptiva 1.1.

Más detalles

Tema 9: Relación entre variables categóricas

Tema 9: Relación entre variables categóricas Tema 9: Relación entre variables categóricas Estadística 4 o Curso Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 9: Relación entre variables categóricas Curso

Más detalles

DISTRIBUCIONES BIDIMENSIONALES

DISTRIBUCIONES BIDIMENSIONALES La estadística unidimensional estudia los elementos de un conjunto de datos considerando sólo una variable o característica. Si ahora incorporamos, otra variable, y se observa simultáneamente el comportamiento

Más detalles

SELECCIÓN Y SECUENCIACIÓN DE CONTENIDOS PARA MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I. BLOQUE 1 : ARITMÉTICA Y ÁLGEBRA

SELECCIÓN Y SECUENCIACIÓN DE CONTENIDOS PARA MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I. BLOQUE 1 : ARITMÉTICA Y ÁLGEBRA SELECCIÓN Y SECUENCIACIÓN DE CONTENIDOS PARA MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I. BLOQUE 1 : ARITMÉTICA Y ÁLGEBRA Se comenzará el curso, si el profesor lo considera necesario, con un pequeño

Más detalles

Análisis de Correspondencias Simple

Análisis de Correspondencias Simple 1 Capítulo 4 Análisis de Correspondencias Simple 41 INTRODUCCIÓN El Análisis de Correspondencias Simple permite describir las relaciones entre dos variables categóricas dispuestas en una tabla de contingencia

Más detalles

Técnicas de Investigación Social

Técnicas de Investigación Social Licenciatura en Sociología Curso 2006/07 Técnicas de Investigación Social Medir la realidad social (4) La regresión (relación entre variables) El término REGRESIÓN fue introducido por GALTON en su libro

Más detalles

Tema 8: Distribuciones Unidimensionales y Distribuciones Bidimensionales. Consideraciones iniciales:

Tema 8: Distribuciones Unidimensionales y Distribuciones Bidimensionales. Consideraciones iniciales: Tema 8: Distribuciones Unidimensionales y Distribuciones Bidimensionales. Consideraciones iniciales: - Población: Es el conjunto de todos los elementos que cumplen una determinada característica. Ej.:

Más detalles

Estadística aplicada a la comunicación

Estadística aplicada a la comunicación Estadística aplicada a la comunicación Tema 5: Análisis de datos cuantitativos I: estadística descriptiva b. Análisis bivariante OpenCourseWare UPV/EHU Unai Martín Roncero Departamento de Sociología 2

Más detalles

Una primera mediada podría ser la diferencia de porcentajes Para Sánchez Carrión, J. (1995) es la mejor de todos ellas.

Una primera mediada podría ser la diferencia de porcentajes Para Sánchez Carrión, J. (1995) es la mejor de todos ellas. Medidas de asociación (variables no métricas) Podemos definir la asociación entre dos variables como la intensidad con la que unas categorías de una variable diferencian las frecuencias obtenidas en el

Más detalles

El ejemplo: Una encuesta de opinión

El ejemplo: Una encuesta de opinión El ejemplo: Una encuesta de opinión Objetivos Lo más importante a la hora de planificar una encuesta es fijar los objetivos que queremos lograr. Se tiene un cuestionario ya diseñado y se desean analizar

Más detalles

Estadística I Tema 2: Análisis de datos univariantes Descripción numérica de datos

Estadística I Tema 2: Análisis de datos univariantes Descripción numérica de datos Estadística I Tema 2: Análisis de datos univariantes Descripción numérica de datos Descripción numérica de datos: medidas descriptivas Centro Posición Variación Forma media cuartiles rango coef. asimetría

Más detalles

ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL. 30/09/2004 Proyecto MaMaEuSch 1

ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL. 30/09/2004 Proyecto MaMaEuSch 1 ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL 0/09/2004 Proyecto MaMaEuSch Estadística Ciencia que trata sobre los métodos científicos para: Recoger, organizar, resumir y analizar datos Sacar conclusiones relevantes

Más detalles

2.- Tablas de frecuencias

2.- Tablas de frecuencias º BACHILLERATO MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES II TEMA 3.- ESTADÍSTICA DESCRIPTIVA PROFESOR: RAFAEL NÚÑEZ -----------------------------------------------------------------------------------------------------------------------------------------------------------------

Más detalles

REPASO DE ESTADÍSTICA DESCRIPTIVA

REPASO DE ESTADÍSTICA DESCRIPTIVA ÍNDICE: 1.- Tipos de variables 2.- Tablas de frecuencias 3.- Gráficos estadísticos 4.- Medidas de centralización 5.- Medidas de dispersión REPASO DE ESTADÍSTICA DESCRIPTIVA 1.- Tipos de variables La estadística

Más detalles

Sumario Prólogo Unidad didáctica 1. Introducción a la estadística. Conceptos preliminares Objetivos de la Unidad...

Sumario Prólogo Unidad didáctica 1. Introducción a la estadística. Conceptos preliminares Objetivos de la Unidad... ÍNDICE SISTEMÁTICO PÁGINA Sumario... 5 Prólogo... 7 Unidad didáctica 1. Introducción a la estadística. Conceptos preliminares... 9 Objetivos de la Unidad... 11 1. Población y muestra... 12 2. Parámetro

Más detalles

Estadística de dos variables

Estadística de dos variables Versión: Estadística de dos variables 19 de septiembre de 013 1 Introducción En el Tema 1 se consideran las variables estadísticas unidimensionales, es decir, cada individuo de la muestra se describe de

Más detalles

Distribuciones Bidimensionales.

Distribuciones Bidimensionales. Distribuciones Bidimensionales. 1.- Variables Estadísticas Bidimensionales. Las variables estadísticas bidimensionales se representan por el par (X, Y) donde, X es una variable unidimensional, e Y es otra

Más detalles

Curso: 2º Créditos ECTS: 6 Tipo de asignatura: Básica Tipo de formación: Teórico-Práctica

Curso: 2º Créditos ECTS: 6 Tipo de asignatura: Básica Tipo de formación: Teórico-Práctica Ficha Técnica Titulación: Plan BOE: Asignatura: Módulo: Grado en Criminología BOE número 75 de 28 de marzo de 2012 / Corrección de errores: BOE número 85 de 9 de abril de 2012 Metodología Curso: 2º Créditos

Más detalles

Tablas estadísticas bidimensionales. Regresión y correlación lineal. Coe ciente de correlación. Signi cado y aplicaciones

Tablas estadísticas bidimensionales. Regresión y correlación lineal. Coe ciente de correlación. Signi cado y aplicaciones Tema 62 Tablas estadísticas bidimensionales Regresión y correlación lineal Coe ciente de correlación Signi cado y aplicaciones 621 Introducción Consideremos una población de n individuos descritos simultáneamente

Más detalles

1 de 12 15/07/ :49

1 de 12 15/07/ :49 1 de 12 15/07/2010 12:49 Saltar a... UPM - TITULACIONES OFICIALES ampliacion_mate2 Cuestionarios Test Estadística Descriptiva Información Resultados Vista previa Editar Visión general Recalificar Calificación

Más detalles

y = 2, entonces: a) x es más dispersa que y. b) son igual de dispersas. 9.- Sean dos variables estadísticas x e y con los siguientes valores x = 5, σ

y = 2, entonces: a) x es más dispersa que y. b) son igual de dispersas. 9.- Sean dos variables estadísticas x e y con los siguientes valores x = 5, σ VARIABLES ESTADÍSTICAS 1.- Sea X una variable estadística de media 2 metros y desviación típica 5 metros. Sea Y una variable estadística de media 24 cm y desviación típica 60 centímetros. a) Y es más dispersa

Más detalles

ANEXO VI. DETALLE ESTADÍSTICO

ANEXO VI. DETALLE ESTADÍSTICO ANEXO VI. DETALLE ESTADÍSTICO El análisis de variables categóricas 8 mediante tablas cruzadas o de contingencia, es uno de los más empleados en ciencias sociales para estudiar la existencia de relación

Más detalles

FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- BLOQUE ESTADÍSTICA: ESTADÍSTICA VARIABLE UNIDIMENSIONAL. Estadística variable unidimensional

FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- BLOQUE ESTADÍSTICA: ESTADÍSTICA VARIABLE UNIDIMENSIONAL. Estadística variable unidimensional FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- Estadística variable unidimensional 1. Conceptos de Estadística 2. Distribución de frecuencias 2.1. Tablas de valores con variables continuas 3. Parámetros

Más detalles

2. ESTADÍSTICAS BIDIMENSIONALES

2. ESTADÍSTICAS BIDIMENSIONALES TEMA. ESTADÍSTICAS BIDIMENSIONALES.... Definición. Objetivos.... Coeficiente de Correlación. Lineal... 4 3. Rectas de regresión.... 7 . Definición. Objetivos En el tema anterior hemos estudiado las distribuciones

Más detalles

M Dolores Redondas Curso

M Dolores Redondas Curso M Dolores Redondas dolores.redondas@upm.es E.U. Arquitectura Técnica U.P.M. Curso 2009-2010 2 Problemas básicos de la estadística aplicada Algunos problemas básicos que suelen presentarse en la investigación

Más detalles

TEMA 4: DISTRIBUCIONES BIDIMENSIONALES

TEMA 4: DISTRIBUCIONES BIDIMENSIONALES TEMA 4: DISTRIBUCIOES BIDIMESIOALES 4.1.- DISTRIBUCIOES BIDIMESIOALES DE FRECUECIAS. 4.2.- REPRESETACIOES GRÁFICAS. 4.3.- MOMETOS DE DISTRIBUCIOES BIDIMESIOALES. 4.1- DISTRIBUCIOES BIDIMESIOALES DE FRECUECIAS.

Más detalles

Estadística Descriptiva

Estadística Descriptiva Ignacio Cascos Fernández Departamento de Estadística Universidad Carlos III de Madrid Estadística Descriptiva Estadística I curso 2008 2009 1. Definiciones fundamentales La Estadística Descriptiva se ocupa

Más detalles

TEMA 8 REGRESIÓN Y CORRELACIÓN

TEMA 8 REGRESIÓN Y CORRELACIÓN /7 TEMA 8 REGRESIÓN Y CORRELACIÓN Dada una variable aleatoria bidimensional (, ) supongamos que las variables no sean independientes, es decir, que eista cierta relación entre ellas. Nos planteamos entonces

Más detalles

4. Obtén las siguientes tablas de doble entrada para las variables Dispersión y Formación:

4. Obtén las siguientes tablas de doble entrada para las variables Dispersión y Formación: ACTIVIDAD DE INFERENCIA Y ASOCIACIÓN 1. Obtén los estadísticos descriptivos básicos y un intervalo de confianza del 95% para la media del coste en farmacia por habitante. A partir del resultado obtenido

Más detalles

ÍNDICE INTRODUCCIÓN... 21

ÍNDICE INTRODUCCIÓN... 21 INTRODUCCIÓN... 21 CAPÍTULO 1. ORGANIZACIÓN DE LOS DATOS Y REPRESENTACIONES GRÁFICAS... 23 1. ORGANIZACIÓN DE LOS DATOS... 23 1.1. La distribución de frecuencias... 24 1.2. Agrupación en intervalos...

Más detalles

Estadística Descriptiva. Poblaciones y muestras.

Estadística Descriptiva. Poblaciones y muestras. Estadística Descriptiva. Poblaciones y muestras. fgarcia@cipf.es CIPF s Research Development Programme Indice 1 Introducción 2 3 Análisis Estadístico Población y muestra Software estadístico CIPF s Research

Más detalles

Estadística. Análisis de datos.

Estadística. Análisis de datos. Estadística Definición de Estadística La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un

Más detalles

TEMA 1: ESTADISTICA DESCRIPTIVA

TEMA 1: ESTADISTICA DESCRIPTIVA ESTADÍSTICA, CURSO 008 009 1 TEMA 1: ESTADISTICA DESCRIPTIVA 1 FUDAMETOS 11 VARIABLES ESTADISTICAS Población: conjunto completo de elementos, con alguna característica común, objeto del estudio estadístico

Más detalles

ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA Definición de Estadística: La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer

Más detalles

Matemáticas Aplicadas I: Ev2 Recuperación febrero 2018

Matemáticas Aplicadas I: Ev2 Recuperación febrero 2018 Matemáticas Aplicadas I: Ev2 Recuperación febrero 2018 PARTE 1: ESTADÍSTICA UNIDIMENSIONAL Y BIDIMENSIONAL 1. La siguiente tabla recoge las edades de las personas que han subido a un avión. Edad [0, 18)

Más detalles

Estadística Descriptiva II: Relación entre variables

Estadística Descriptiva II: Relación entre variables Estadística Descriptiva II: Relación entre variables Iniciación a la Investigación Ciencias de la Salud MUI Ciencias de la Salud, UEx 25 de octubre de 2010 De qué trata? Descripción conjunto concreto de

Más detalles

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 7) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 7) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 7) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía VIDEOCLASE: La Correlación. https://www.intecca.uned.es/portalavip/grabacion.php?id_grabacion=56932&id_sala=605

Más detalles

ESTADÍSTICA. A su vez, las variables pueden ser :

ESTADÍSTICA. A su vez, las variables pueden ser : ESTADÍSTICA La ESTADÍSTICA es una rama de las Matemáticas que recoge, ordena, analiza e interpreta datos relativos a un conjunto de personas o cosas ( POBLACIÓN ). La población es FINITA cuando lo es el

Más detalles

CUESTIONES Y PROBLEMAS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES PROPUESTOS EN EXÁMENES

CUESTIONES Y PROBLEMAS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES PROPUESTOS EN EXÁMENES TUTORÍA DE INTRODUCCIÓN A LA ESTADÍSTICA (º A.D.E.) CUESTIONES Y PROBLEMAS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES PROPUESTOS EN EXÁMENES 1º) Qué ocurre cuando r = 1: a) Los valores teóricos no

Más detalles

Estadística Descriptiva en R: Parámetros y estadísticos. José Enrique Martín García Universidad Politécnica de Gimialcón (Copyright 2016)

Estadística Descriptiva en R: Parámetros y estadísticos. José Enrique Martín García Universidad Politécnica de Gimialcón (Copyright 2016) Estadística Descriptiva en R: Parámetros y estadísticos José Enrique Martín García Universidad Politécnica de Gimialcón (Copyright 2016) Parámetros y Estadísticos Parámetro: Es una cantidad numérica calculada

Más detalles

a. Poisson: los totales marginales y el total muestral varían libremente.

a. Poisson: los totales marginales y el total muestral varían libremente. TEMA 2º: TABLAS DE CONTINGENCIA BIDIMENSIONALES 1º Distribución de frecuencias observadas El único aspecto cuantificable en el análisis cualitativo es el número de individuos que presenta una combinación

Más detalles