Ejercicio 1.. Clasificar las siguientes variables: Preferencias políticas (izquierda, derecha o centro). Marcas de cerveza. Velocidad en Km/h. El peso en Kg. Signo del zodiaco. Nivel educativo (primario secundario, superior). Años de estudios completados. Tipo de enseñanza (privada o pública). Número de empleados de una empresa. La temperatura de un enfermo en grados Celsius. La clase social (baja, media o alta). La presión de un neumático en Nw/cm2 Ejercicio 2. Clasifique las variables que aparecen en el siguiente cuestionario. 1. Cuál es su edad? 2. Estado civil: a) Soltero b) Casado c) Separado d) Divorciado e) Viudo 3. Cuanto tiempo emplea para desplazarse a su trabajo? 4. Tamaño de su municipio de residencia: a) Municipio pequeño (menos de 2.000 habitantes) b) Municipio mediano (de 2.000 a 10.000 hab.) c) Municipio grande (de 10.000 a 50.000 hab.) d) Ciudad pequeña (de 50.000 a 100.000 hab.) e) Ciudad grande (más de 100.000 hab.) 5. Está afiliado a la seguridad social? Ejercicio 3. En el siguiente conjunto de números, se proporcionan los pesos (redondeados a la libra más próxima) de los bebés nacidos durante un cierto intervalo de tiempo en un hospital: 4, 8, 4, 6, 8, 6, 7, 7, 7, 8, 10, 9, 7, 6, 10, 8, 5, 9, 6, 3, 7, 6, 4, 7, 6, 9, 7, 4, 7, 6, 8, 8, 9, 11, 8, 7, 10, 8, 5, 7, 7, 6, 5, 10, 8, 9, 7, 5, 6, 5. 1. Construir una distribución de frecuencias de estos pesos. 2. Encontrar las frecuencias relativas. 3. Encontrar las frecuencias acumuladas. 4. Encontrar las frecuencias relativas acumuladas. 5. Dibujar un histograma con los datos de la parte a. 6. Por qué se ha utilizado un histograma para representar estos datos, en lugar de una gráfica de barras? 7. Calcular las medidas de tendencia central. 8. Calcular las medidas de dispersión. 9. Calcular las medidas de forma. 10. Es esta una distribución sesgada? De ser así, en qué dirección? 11. Encontrar el percentil 24. Ejercicio 4. A continuación se dan los resultados obtenidos con una muestra de 50 universitarios. la característica es el tiempo de reacción ante un estímulo auditivo:
0,110 0,110 0,126 0,112 0,117 0,113 0,135 0,107 0,122 0,113 0,098 0,122 0,105 0,103 0,119 0,100 0,117 0,113 0,124 0,118 0,132 0,108 0,115 0,120 0,107 0,123 0,109 0,117 0,111 0,112 0,101 0,112 0,111 0,119 0,103 0,100 0,108 0,120 0,099 0,102 0,129 0,115 0,121 0,130 0,134 0,118 0,106 0,128 0,094 0,1114 1. Cuál es la amplitud total de la distribución de los datos? 2. Obtenga la distribución de frecuencias absolutas y relativas. 3. Obtenga la distribución de frecuencias acumuladas, absolutas y relativas, con los intervalos anteriores. 4. Calcular la media y la varianza con los intervalos del apartado b y después calculense las mismas magnitudes sin ordenar los datos en una tabla estadística. Con qué método se obtiene mayor precisión? 5. Dibuje el polígono de frecuencias relativas. 6. Dibuje el polígono de frecuencias relativas acumuladas. Ejercicio 5. Con el fin de observar la relación entre la inteligencia y el nivel socioeconómico (medido por el salario mensual familiar) se tomaron dos grupos, uno formado con sujetos de cociente intelectual inferior a 95 y otro formado por los demás; De cada sujeto se anotó el salario mensual familiar. Teniendo en cuenta los resultados que se indican en la tabla: Nivel socioeconómico Sujetos con CI < 95 Sujetos con CI _ 95 Intervalos Frecuencia Frecuencia 10 o menos _(4,10] 75 19 10 16 35 26 16 22 20 25 22 28 30 30 28 34 25 54 más de 34 _(34,40] 15 46 1. Dibuje un gráfico que permita comparar ambos grupos. 2. Calcule las medidas de tendencia central para aquellos sujetos con CI < 95. 3. Calcular las medidas de dispersión para aquellos sujetos con CI _ 95. Ejercicio 6. Un estudio consistió en anotar el número de palabras leídas en 15 segundos por un grupo de 120 sujetos disléxicos y 120 individuos normales. Teniendo en cuenta los resultados de la tabla N_ de palabras leídas Disléxicos nd Normales nn 25 o menos _25 56 1 26 24 9 27 16 21 28 12 29 29 10 28 30 o más _30 2 32 calcule: 1. Las medias aritméticas de ambos grupos. 2. Las medianas de ambos grupos. 3. El porcentaje de sujetos disléxicos que superaron la mediana de los normales. 4. Compare la variabilidad relativa de ambos grupos.
Ejercicio 7. La tabla siguiente muestra la composición por edad, sexo y trabajo de un grupo de personas con tuberculosis pulmonar en la provincia de Vizcaya en el año 1979: Edad Trabajadores No trabajadores Totales Varón Mujer Total Varón Mujer Total Varón Mujer Total 14 19 2 1 3 25 40 65 27 41 68 19 24 10 4 14 20 36 56 30 40 70 24 29 32 10 42 15 50 65 47 60 107 29 34 47 12 59 13 34 47 60 46 106 34 39 38 8 46 10 25 35 48 33 81 39 44 22 4 26 7 18 25 29 22 51 1. Representar gráficamente la distribución de frecuencias de aquellas personas trabajadoras que padecen tuberculosis. 2. Representar gráficamente la distribución de frecuencias de los varones no trabajadores que padecen tuberculosis. 3. Representar gráficamente la distribución de frecuencias del número total de mujeres que padecen tuberculosis. 4. Cuál es la edad en la que se observa con mayor frecuencia que no trabajan los varones? Y las mujeres? Determinar asímismo la edad más frecuente (sin distinción de sexos ni ocupación). 5. Por debajo de qué edad está el 50% de los varones? 6. Por encima de qué edad se encuentra el 80% de las mujeres? 7. Obtener la media, mediana y desviación típica de la distribución de las edades de la muestra total. 8. Estudiar la asimetría de las tres distribuciones. Ejercicio 8. En una epidemia de escarlatina, se ha recogido el número de muertos en 40 ciudades de un país, obteniéndose la siguiente tabla: N_ de muertos 0 1 2 3 4 5 6 7 Ciudades 7 11 10 7 1 2 1 1 1. Representar gráficamente estos datos. 2. Obtener la distribución acumulada y representarla. 3. Calcular media, mediana y moda. 4. Calcular la varianza y la desviación típica. 5. Porcentaje de ciudades con al menos 2 muertos. 6. Porcentaje de ciudades con más de 3 muertos. 7. Porcentaje de ciudades con a lo sumo 5 muertos. Ejercicio 9. Se realiza un estudio para establecer una ecuación mediante la cual se pueda utilizar la concentración de estrona en saliva(x) para predecir la concentración del esteroide en plasma libre (Y ). Se extrajeron los siguientes datos de 14 varones sanos: X 1,4 7,5 8,5 9 9 11 13 14 14,5 16 17 18 20 23 Y 30 25 31,5 27,5 39,5 38 43 49 55 48,5 51 64,5 63 68 1. Estúdiese la posible relación lineal entre ambas variables. 2. Obtener la ecuación que se menciona en el enunciado del problema. 3. Determinar la variación de la concentración de estrona en plasma por unidad de estrona en saliva.
Ejercicio 10. Los investigadores están estudiando la correlación entre obesidad y la respuesta individual al dolor. La obesidad se mide como porcentaje sobre el peso ideal (X). La respuesta al dolor se mide utilizando el umbral de reflejo de flexión nociceptiva (Y ), que es una medida de sensación de punzada. Se obtienen los siguientes datos: X 89 90 75 30 51 75 62 45 90 20 Y 2 3 4 4,5 5,5 7 9 13 15 14 1. Qué porcentaje de la varianza del peso es explicada mediante un modelo de regresión lineal por la variación del umbral de reflejo? 2. Estúdiese la posible relación lineal entre ambas variables, obteniendo su grado de ajuste. 3. Qué porcentaje de sobrepeso podemos esperar para un umbral de reflejo de 10? Ejercicio 11. Se lleva a cabo un estudio, por medio de detectores radioactivos, de la capacidad corporal para absorber hierro y plomo. Participan en el estudio 10 sujetos. A cada uno se le da una dosis oral idéntica de hierro y plomo. Después de 12 días se mide la cantidad de cada componente retenida en el sistema corporal y, a partir de ésta, se determina el porcentaje absorbido por el cuerpo. Se obtuvieron los siguientes datos: Porcentaje de hierro _ X 17 22 35 43 80 85 91 92 96 100 Porcentaje de plomo _ Y 8 17 18 25 58 59 41 30 43 58 1. Comprobar la idoneidad del modelo lineal de regresión. 2. Obtener la recta de regresión, si el modelo lineal es adecuado. 3. Predecir el porcentaje de hierro absorbido por un individuo cuyo sistema corporal absorbe el 15% del plomo ingerido. Ejercicio 12. Para estudiar el efecto de las aguas residuales de las alcantarillas que afluyen a un lago, se toman medidas de la concentración de nitrato en el agua. Para monitorizar la variable se ha utilizado un antiguo método manual. Se idea un nuevo método automático. Si se pone de manifiesto una alta correlación positiva entre las medidas tomadas empleando los dos métodos, entonces se hará uso habitual del método automático. Los datos obtenidos son los siguientes: Manual _ X 25 40 120 75 150 300 270 400 450 575 Automático _ Y 30 80 150 80 200 350 240 320 470 583 1. Hallar el coeficiente de determinación para ambas variables. 2. Comprobar la idoneidad del modelo lineal de regresión. Si el modelo es apropiado, hallar la recta de regresión de Y sobre X y utilizarla para predecir la lectura que se obtendría empleando la técnica automática con una muestra de agua cuya lectura manual es de 100. 3. Para cada una de las observaciones, halle las predicciones que ofrece el modelo lineal de regresión para X en función de Y, e Y en función de X, es decir, Xˆ e Ŷ. 4. Calcule los errores para cada una de dichas predicciones, es decir, las variables X Xˆ e Y Ŷ. 5. Que relación hay entre las medias de X y Xˆ? Y entre las de Y e Ŷ? 6. Calcule las medias de X Xˆ e Y Ŷ. Era de esperar el valor obtenido? 7. Calcule las varianzas de X, Xˆ, Y, Ŷ, X Xˆ e Y Ŷ.
Ejercicio 13. Se ha medido el aclaramiento de creatinina en pacientes tratados con Captopril tras la suspensión del tratamiento con diálisis, resultando la siguiente tabla: Días tras la diálisis _ X 1 5 10 15 20 25 35 Creatinina (mg/dl) _ Y 5,7 5,2 4,8 4,5 4,2 4 3,8 1. Hállese la expresión de la ecuación lineal que mejor exprese la variación de la creatinina, en función de los dias transcurridos tras la diálisis, así como el grado de bondad de ajuste y la varianza residual. 2. En qué porcentaje la variación de la creatinina es explicada por el tiempo transcurrido desde la diálisis? 3. Si un individuo presenta 401 mg/dl de creatinina, cuánto tiempo es de esperar que haya transcurrido desde la suspensión de la diálisis? Ejercicio 14. En un ensayo clínico realizado tras el posible efecto hipotensor de un fármaco, se evalúa la tensión arterial diastólica (TAD) en condiciones basales (X), y tras 4 semanas de tratamiento (Y ), en un total de 14 pacientes hipertensos. Se obtienen los siguiente valores de TAD: X 95 100 102 104 100 95 95 98 102 96 100 96 110 99 Y 85 94 84 88 85 80 80 92 90 76 90 87 102 89 1. Existe relación lineal entre la TAD basal y la que se observa tras el tratamiento? 2. Cuál es el valor de TAD esperado tras el tratamiento, en un paciente que presentó una TAD basal de 95 mm de Hg? Ejercicio 15. Se han realizado 9 tomas de presión intracraneal en animales de laboratorio, por un método estándar directo y por una nueva técnica experimental indirecta, obteniéndose los resultados siguientes en mm de Hg: Método estándar _ X 9 12 28 72 30 38 76 26 52 Método experimental _ Y 6 10 27 67 25 35 75 27 53 1. Hallar la ecuación lineal que exprese la relación existente entre las presiones intracraneales, determinadas por los dos métodos. 2. Qué tanto por ciento de la variabilidad de Y es explicada por la regresión? Hállese el grado de dependencia entre las dos variables y la varianza residual del mismo.