Una introducción a la ESTADÍSTICA INFERENCIAL

Save this PDF as:
 WORD  PNG  TXT  JPG

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Una introducción a la ESTADÍSTICA INFERENCIAL"

Transcripción

1 Una introducción a la ESTADÍSTICA INFERENCIAL José Chacón Esta obra está bajo una licencia Reconocimiento No comercial Compartir bajo la misma licencia.5 de Creative Commons. Para ver una copia de esta licencia, visite nc sa/.5/ o envie una carta a Creative Commons, 559 Nathan Abbott Way, Stanford, California 94305, USA.

2

3 Tema 1. Introducción Esta asignatura ha sido orientada a entender los principios en los que se basa la estadística inferencial. Entender significa que es posible saber, en primer lugar, qué razones han llevado a elegir un determinado cálculo y, no menos importante, la relevancia real de los resultados de ese cálculo. La estadística inferencial no es más que un argumento. Un buen argumento hace creíble una afirmación. En nuestro caso, cualquier estudio necesitará, al menos dos argumentos sólidos: el estadístico y el relativo al diseño de investigación (lo que se puede aprender en Métodos I y II). Desde este punto de vista, nuestra tarea es poder entender (y calibrar) los argumentos estadísticos y también poder construirlos nosotros mismos. La estadística inferencial es necesaria cuando queremos hacer alguna afirmación sobre más elementos de los que vamos a medir. La estadística inferencial hace que ese salto de la parte al todo se haga de una manera controlada. Aunque nunca nos ofrecerá seguridad absoluta, sí nos ofrecerá una respuesta probabilística. Esto es importante: la estadística no decide; sólo ofrece elementos para que el investigador o el lector decidan. En muchos casos, distintas personas perciben diferentes conclusiones de los mismos datos. El proceso será siempre similar. La estadística dispone de multitud de modelos que están a nuestra disposición. Para poder usarlos hemos de formular, en primer lugar, una pregunta en términos estadísticos. Luego hemos de comprobar que nuestra situación se ajusta a algún modelo (si no se ajusta no tendría sentido usarlo). Pero si se ajusta, el modelo nos ofrecerá una respuesta estadística a nuestra pregunta estadística. Es tarea nuestra devolver a la psicología esa respuesta, llenándola de contenido psicológico. 1. Definiciones e ideas previas En el ámbito científico, la estadística, en general, y la estadística inferencial, en particular, es el camino que hay que recorrer para llegar de una pregunta a la respuesta adecuada. Así, la estadística no es más que un argumento para defender nuestras ideas. Cuándo es necesaria la estadística inferencial? Cuando queremos hacer alguna afirmación sobre más elementos de los que vamos a medir. La estadística descriptiva, como indica su nombre, tiene por finalidad describir. Así, si queremos estudiar diferentes aspectos de, por ejemplo, un grupo de personas, la estadística descriptiva nos puede ayudar. Lo primero será tomar medidas, en todos los miembros del grupo, de esos aspectos o variables para, posteriormente, indagar en lo que nos interese. Por ejemplo, para saber cuál es la edad del grupo, podemos resumir el conjunto de todas las edades mediante la media. Eso nos dice, aproximadamente, alrededor de qué edad se sitúan todos. Ya sabemos, pongamos, que la edad media es 40 años. Pero además podemos utilizar la desviación típica, si

4 1. Introducción, queremos saber si el grupo tiene edades muy dispares (por ejemplo, una desviación típica de 1 años) o si, por el contrario, tienen edades parecidas (una desviación típica de años). Sólo con esos indicadores ya podemos hacernos una idea, podemos describir a ese conjunto de personas, al menos en referencia a su edad. Pero el tamaño de los grupos que suelen interesar es demasiado grande, a veces tan grande como todo el mundo. Y esto, más que ser una rareza, es en muchos campos la norma. Por ejemplo, cuando se afirma que las personas tenemos una agudeza visual menor que la de los halcones, podemos estar seguros de que no hemos medido la agudeza visual de todos los humanos ni la de todos los halcones. Pues bien, la estadística inferencial es la que va a permitir dar ese salto de los resultados obtenidos para un grupo a la totalidad. Planteemos una cuestión concreta: Un profesor de estadística afirma que se aprende mejor estadística inferencial utilizando los ordenadores para mostrar lo que se estudia. Cómo podemos decidir si esta afirmación es cierta? Una posible forma sería seleccionando dos grupos de alumnos (equivalentes) que estudien estadística inferencial, y dar las mismas clases a ambos, incluido el mismo profesor, idénticos ejercicios, etc., excepto que uno de ellos utilizan los ordenadores en su aprendizaje y otro no. Veamos las definiciones en relación a este ejemplo, suponiendo que realizamos el estudio con los alumnos de los grupos F (con ordenador) y G (sin ordenador): Grupo F (con ordenador) Grupo G (sin ordenador) Población: un conjunto de elementos (generalmente personas, en psicología) que comparten al menos una característica bien definida. Estudiantes de primero de psicología que cursan estadística inferencial con ordenador Estudiantes de primero de psicología que cursan estadística inferencial sin ordenador Muestra: es un subconjunto de elementos extraídos de una población. Los estudiantes de primero de psicología de la UCM, grupo F Los estudiantes de primero de psicología de la UCM, grupo G Variable: Característica de los elementos de una población que puede tomar diversos valores (al menos, dos). Nivel de conocimientos en estadística II, medidos a través de un examen. Datos: Valores obtenidos al medir una variable en una muestra. Conjunto de notas obtenidas en el examen de estadística para los alumnos del grupo F Nivel de conocimientos en estadística II, medidos a través de un examen. Conjunto de notas obtenidas en el examen de estadística para los alumnos del grupo G Estadístico: Es un valor numérico que expresa una característica de una muestra. Formalmente, un estadístico es una función definida sobre una variable. Media ( ) de las notas obtenidas en el examen de estadística para alumnos del grupo F Media ( ) de las notas obtenidas en el examen de estadística para alumnos del grupo G

5 1. Introducción, 3 Parámetro: Es un valor numérico que expresa una característica de una población. Media (µ) de las notas obtenidas en el examen de estadística para todos los estudiantes de primero de psicología que cursan estadística inferencial con ordenador. Media (µ) de las notas obtenidas en el examen de estadística para todos los estudiantes de primero de psicología que cursan estadística inferencial sin ordenador.. El azar y la probabilidad La estadística inferencial resulta de aplicar la probabilidad a los estadísticos que ya conocemos por la estadística descriptiva. Los resultados de esa aplicación vendrán expresados, pues, en lenguaje probabilístico. Y esto no ayuda precisamente a sentirse cómodo con la estadística inferencial. Además de ser matemática, tiene la fea costumbre de no decir sí o no. En lugar de ello, sus respuestas suenan a veces a excusas, eso sí, muy diplomáticas, como no hay suficiente evidencia o esa afirmación es altamente improbable. Pero en lenguaje matemático. El resultado es quizás extraño, difuso pero preciso; no se decanta pero nos da cuatro decimales: a partir de los datos que me ofrece, la probabilidad de que ocurra eso que usted afirma es Pero aun así nos permite incrementar nuestro conocimiento. Las afirmaciones anteriores pretenden ilustrar algo fundamental: las afirmaciones que nos permite hacer la estadística inferencial tienen un riesgo, y quien la usa debe saberlo. No es difícil, de todas maneras, porque todas estas afirmaciones están formuladas en términos de riesgo, de seguridad e inseguridad: de probabilidad. El azar es, por definición, lo impredecible. Cómo es posible entonces utilizar lo impredecible para obtener información? La clave está en que incluso lo impredecible, para poder serlo, ha de cumplir algunas normas. El conjunto de esas normas, y las técnicas para extraer información del azar, es lo que llamamos probabilidad. No hay nada mágico en el azar; resulta de una sucesión de circunstancias no controlables que lleva a no poder predecir el resultado. Fijémonos en la moneda de toda la vida. Lo que hace que lanzarla sea un experimento aleatorio es que es imposible controlar la fuerza con la que se lanza, los giros que da y los ángulos con que golpea el suelo una y otra vez hasta detenerse. Basta situar la moneda de canto en una mesa y empujarla deliberadamente en una dirección para que desaparezca el azar. Pero si estando de canto la hacemos girar rápidamente volvemos a disponer de un experimento aleatorio. Pero, podemos realmente utilizar esta información para decidir sobre algo real? Supongamos que lanzamos la moneda al aire. Cuáles son esas normas que po 1 Las respuestas que obtendremos serán ligeramente diferentes, pero esa frase sirve para ilustrar el estilo. Esto no es completamente cierto: hay prestidigitadores que se entrenan hasta controlar el lanzamiento de las monedas. Controlan la fuerza, los giros y el momento justo de detener el movimiento para conseguir cierto resultado. El truco consiste, por tanto, en que no hay azar.

6 1. Introducción, 4 demos utilizar? En este caso, que la moneda tiene dos caras, y que no hay preferencia por una u otra a la hora de posarse. Es decir: las dos únicas posibilidades se reparten por igual el derecho a ser el resultado final. Si aplicamos los conceptos básicos de la probabilidad, y recordando que la probabilidad total es 1, tenemos que las probabilidades de que salga cara o cruz son: P( cara) = 0.5 Pcruz ( ) = 0.5 Lo que suele ser difícil de digerir para nuestro entendimiento son cuestiones como, por ejemplo, que aunque un determinado suceso tenga una probabilidad ínfima, como 0.01 (un 1 por ciento), también puede ocurrir. Aunque todo el que lea esto esté realmente convencido de que es verdad, la experiencia demuestra que no aplicamos este conocimiento. 3. El muestreo Para extraer conclusiones de una población a partir de una muestra, es vital que la muestra sea representativa. Hay dos tipos de muestreo: probabilístico (se conoce, o puede calcularse, la probabilidad de cada elemento, por tanto, de cada muestra posible) y no probabilístico (se desconoce o no interesa la probabilidad de cada elemento; el investigador selecciona aquella muestra que considera más representativa o que le resulta más fácil). Cuidado: no es que el muestreo no probabilístico no permita generar muestras representativas; lo que ocurre es que no tenemos ninguna información sobre el grado de representatividad de la muestra elegida. El muestreo probabilístico puede darse de diferentes formas, según estemos considerando poblaciones finitas (los votantes de la Comunidad de Madrid, los pacientes con insomnio) o infinitas (los posibles tiempos de reacción ante una tarea de búsqueda visual), y según consideremos (en las finitas) un muestreo con o sin reposición. El muestreo aleatorio simple se da cuando se cumple la igualdad de distribuciones (cualquier valor tiene la misma probabilidad de salir en cada extracción) e independencia (la probabilidad de obtener un determinado valor no se modifica por los valores ya obtenidos). Otros tipos de muestreo probabilístico son el m. a. sistemático, el m. a. estratificado y el m. a. por conglomerados.

7 Tema. Estimación de parámetros Cuando queremos estimar el valor de un parámetro, disponemos de dos aproximaciones: La estimación puntual y la estimación por intervalos. 1. Estimación puntual La estimación puntual asigna directamente al parámetro el valor obtenido para el estadístico. [La estimación por intervalos, en cambio, proporciona un intervalo, un rango de valores entre los que estará situado el parámetro con una cierta probabilidad. Para poder conocer esa probabilidad debemos conocer previamente la distribución de probabilidad del estadístico que estemos usando como estimador: la distribución muestral del estadístico. En los puntos y 3 veremos estas dos cuestiones con más detalle.] La estimación puntual constituye la inferencia más simple que podemos realizar: asignar al parámetro el valor del estadístico que mejor sirva para estimarlo. Pero para que un estadístico sea considerado un buen estimador ha de cumplir ciertas condiciones. Si usamos los símbolosθ para un parámetro cualquiera, y ˆ θ, para un posible estimador de θ, podemos enunciar las propiedades de la siguiente forma: Carencia de sesgo: Un estimador, ˆ θ, será insesgado si su valor esperado coincide con el del parámetro a estimar, θ. E( ˆ θ ) = θ Consistencia: Un estimador, ˆ θ, será consistente si, conforme aumenta el tamaño muestral, n, su valor se va aproximando a θ. Expresado más formalmente, indica que dada una cantidad arbitrariamente pequeña, δ, cuando n tiende a infinito, P( ˆ θ θ < δ) 1 Eficiencia: Dados dos posibles estimadores ˆ θ 1 y ˆ θ, diremos que ˆ θ 1 es un estimador más eficiente que ˆ θ si se cumple que σ < σ ˆ ˆ 1 θ θ Suficiencia: Un estimador, ˆ θ, será suficiente si utiliza toda la información muestral disponible. La tabla a continuación muestra los estimadores de algunos parámetros: Estimadores Insesgados Consistentes Eficientes Parámetros µ Sn 1 S n S, P P P π n 1 S n σ

8 . Estimación de parámetros, 6 Y el siguiente gráfico puede ilustrar el significado de esas propiedades:. Distribución muestral de la media La distribución muestral (de la media o de cualquier otro estadístico) es fundamental: si la conocemos podemos saber con qué probabilidad puede adoptar determinados valores. Eso nos permitirá responder a ciertas cuestiones, por ejemplo, obtener el intervalo de confianza para la media, hacer un contraste de hipótesis o calcular la potencia de un contraste de hipótesis. Conocer la distribución muestral de un estadístico (de aquí en adelante, la media) implica conocer su forma y sus parámetros. Por ejemplo, saber si su forma es la de la distribución normal, y saber que los parámetros son: media, 30 y desviación típica, 6.5. A fin de cuentas, lo que nos interesa es que la distribución muestral coincida con alguna conocida, de la que dispongamos de tablas. La forma en que la estadística nos permitirá conocer la DMM es a través de condiciones o supuestos: Si nuestros datos cumplen lo que pide un procedimiento estadístico, entonces ese procedimiento estadístico nos da alguna información útil. Por ejemplo, 1 Si tenemos un muestreo aleatorio, y las observaciones son independientes, y el tamaño de la muestra es n, tenemos un muestreo aleatorio, y las observaciones son independientes, y la distribución de la variable es normal, entonces los parámetros de la DMM son µ = µ σ = σ la DMM es normal, con independencia del tamaño de la muestra, n y con parámetros µ = µ σ = σ n n

9 3 4 tenemos un muestreo aleatorio, y las observaciones son independientes, y no conocemos la distribución de la variable, estamos en cualquiera de los casos anteriores, y desconocemos σ,. Estimación de parámetros, 7 la DMM se aproximará a la normal, conforme aumenta el tamaño de la muestra, n y con parámetros µ = µ σ = σ la DMM se aproximará a la distribución t con n 1 grados de libertad, y con parámetros µ = µ σ n S n 1 n De (1) obtenemos los parámetros de la DMM: la media y la desviación típica, que suele denominarse error típico de la media. De () podemos deducir que, si nuestra variable de interés es normal en la población, también lo será nuestra DMM. De (3) extraemos que, aunque la distribución de la variable en la población no sea normal o, lo más frecuente, si no sabemos si es o no normal, la DMM sí será normal si el tamaño de la muestra, n, es lo suficientemente grande (aproximadamente mayor que 30). Gracias a (4) solucionamos un problema bastante común: el no conocer la desviación típica poblacional de la variable. En este caso usamos como estimador Sn 1, pero entonces la DMM sigue la forma de la distribución t. Las distribuciones normal y t se diferencian visiblemente sólo cuando los grados de libertad son pequeños, como se observa en las gráficas siguientes. Cuando aumenta n, σ y Sn 1 se van pareciendo más y más, y las distribuciones normal y t también. Es por esto que, a un nivel práctico, a partir de un n mayor que 30 suelen usarse indistintamente. En las dos gráficas que siguen se pueden ver las distribuciones normal (azul) y t (rojo) para dos tamaños de muestra distinto: n igual a 5 (arriba) y n igual a 30 (debajo). Para ambas se calcula los límites que abarcan un 95% del área total de cada curva. Las discrepancias son evidentes con n igual a 5, pero inapreciables para n = 30.

10 . Estimación de parámetros, 8 con n = 5. con n = 30. A efectos prácticos, todo lo visto supone lo que detallamos a continuación. Considérese siempre que el muestreo es aleatorio (los datos proceden de elementos representativos) e independiente (es decir, que el haber elegido un elemento no afecta a la probabilidad de elegir otros). En estas condiciones, puede ocurrir lo siguiente: Como es difícil conocer σ, consideraremos siempre de partida que la DMM se distribuirá segùn tn 1, ya sea cuando sepamos que la variable se distribuye normalmente o cuando n sea igual o mayor que 30 o ambas cosas. Como las tablas de la distribución t aparecen tipificadas (con media = 0 y desviación típica = 1), para hacer cualquier uso de ella deberemos tipificar el valor de interés, : µ temp = tn 1 S n n 1 Si, en el caso anterior, conocemos además la desviación típica poblacional, entonces la DMM se distribuirá según la distribución normal: Por la misma razón de antes, para usar las tablas previamente debemos tipificar: µ zemp = N(0,1) σ n Pero si no conocemos la forma de la distribución de la variable, ni el n es lo suficientemente grande como para hacer uso del punto (3), entonces no pode

11 . Estimación de parámetros, 9 mos utilizar esta información. [Pero no todo está perdido: En ese caso habría que estudiar la forma de la distribución de la variable, transformar las puntuaciones hasta que adopten una forma normal o, en última instancia, usar pruebas no paramétricas, que no imponen supuestos sobre la forma de la distribución. Todo esto son conceptos que se verán más adelante.] Como regla general utilizaremos siempre la distribución t (rara vez conoceremos σ), aunque podremos usar la tabla de la distribución normal (siempre que n sea suficientemente grande) para localizar valores que no aparezcan en la tabla de la distribución t. Qué obtenemos de todo esto? Lo que afirmábamos anteriormente: que conociendo cómo se comportan las medias (su distribución muestral o distribución de probabilidad), podemos usar estas probabilidades siempre que sea necesario. Una de ellas, que veremos ahora, es la obtención de intervalos de confianza. Otra aplicación, más adelante, será utilizada en el contraste de hipótesis. 3. Estimación por intervalos Supongamos que conociésemos la población. Podríamos obtener la DMM para un determinado tamaño de la muestra, n. Una vez caracterizada la DMM, seríamos capaces de decir, con una determinada seguridad, dónde estarán las medias que podremos obtener si muestreamos. Invirtiendo el razonamiento (y yendo a la realidad), dada una muestra, podemos calcular la DMM donde, con una cierta seguridad, estará la media poblacional que buscamos. Este razonamiento se muestra en la figura siguiente.

12 . Estimación de parámetros, 10 Observando vemos que a partir de la muestra (recuérdese que la población y sus parámetros son desconocidos) el IC, al 95%, para la media poblacional es [54.03, 65.90]. Eso quiere decir que la probabilidad de haber atrapado la media poblacional es 0.95, la probabilidad de haber acertado. O dicho de otro modo: la probabilidad de habernos equivocado, de no haber atrapado la media poblacional es 0.05, el 5%. En el caso de la figura anterior, la media poblacional (64.31) cae dentro del intervalo, pero esto no siempre es así: si repetimos el proceso, un 5% de las veces la media poblacional quedará fuera del intervalo propuesto, como se observa en la figura siguiente: La obtención de un determinado intervalo es fácil, dado que conocemos la DMM. Basta con: 1. Localizar en la distribución de probabilidad (normal o t) los valores que contienen el nivel de confianza.. Traducir esos dos valores a la escala de nuestra variable,. En la práctica, deberemos definir un nivel de confianza (NC), que determinará un nivel de riesgo, α = 1 NC. A partir de ahí, y asumiendo que se sigue la distribución t: 1. Obtener los límites inferior y superior, es decir, los valores para tn 1 que dejan a la izquierda y a la derecha α/ (la mitad del nivel de riesgo). Estos valores serán t t n 1, α y n 1,1 α.. Traducir esos dos valores a la escala de nuestra variable,. Así, y teniendo en cuenta que tn 1,1 = tn 1, los límites serían: α α

13 li = t ls = + t n 1, α n 1, α S n S n n 1 n 1. Estimación de parámetros, 11 Al término que es sumado y restado de la media suele denominársele error máximo, y se denota por Emax. En estos términos, los límites de un intervalo de confianza suelen expresarse genéricamente como li = Emax ls = + Emax En resumen, una vez obtenido el intervalo de confianza se puede afirmar lo siguiente: Pl ( < µ < l) = 1 α i s Que significa que la probabilidad de que la media poblacional esté situada dentro del intervalo obtenido es igual al nivel de confianza especificado (1 α).

14 Tema 3. Contraste de hipótesis 1. Contraste de hipótesis Un contraste de hipótesis es un proceso de decisión en el que una hipótesis formulada en términos estadísticos es puesta en relación con los datos empíricos para determinar si es o no compatible con ellos. Los datos empíricos siempre provendrán de un muestra, un subconjunto limitado de la población de referencia. Las hipótesis, por el contrario, siempre preguntarán acerca de la población. Piénsese que es absurdo preguntar si una media obtenida en una muestra, por ejemplo, 5 8, es mayor que 5. Por supuesto que lo es, y nadie (exceptuando los que estudian estadística) puede hacerse semejante pregunta seriamente. Lo que sí es relevante preguntar es si la media poblacional, que no conocemos, es mayor que 5. En tanto no la conocemos, usaremos la media muestral como un estimador (una aproximación) de esa media poblacional. 1.1 Las hipótesis estadísticas (la pregunta, formalizada) Una hipótesis estadística es una afirmación sobre una o más distribuciones de probabilidad; más concretamente, sobre la forma de una distribución de probabilidad o sobre el valor de un parámetro de esa distribución de probabilidad. En cuanto a nuestro ejemplo, nos centraremos en una distribución de probabilidad con el parámetro media poblacional igual a 5. El contraste de hipótesis nos dirá si es más o menos probable, bajo esa distribución de probabilidad, obtener en una muestra aleatoria una media igual a 5 8. Todo contraste necesita dos hipótesis: H0 y H1, que serán exhaustivas y mutuamente exclusivas. H0 es la hipótesis nula, y es la que se somete a contraste. H1 es la hipótesis alternativa a H0, y es la negación de H0. Mientras que H0 es exacta, H1 suele ser inexacta. Un detalle importante: el signo = siempre va en la H0, sea exacta o inexacta. Es sobre este signo = sobre el que se construirá el modelo probabilístico, como ya hemos visto. 1. Los supuestos ( nuestra situación se parece a la del modelo?) Son un conjunto de afirmaciones que necesitamos establecer (sobre la población de partida y la muestra utilizada) para conseguir determinar la distribución de probabilidad en la que se basará nuestra decisión sobre H0. Si nuestra situación no se ajusta a estas condiciones, necesarias, entonces no debemos usar el modelo. La razón es obvia: el modelo no nos sirve, luego cualquier cosa que deduzcamos de él será inexacta y/o errónea.

15 1.3 El estadístico de contraste y su distribución de probabilidad 3. Contraste de hipótesis, 13 Un estadístico de contraste no es más que un cálculo o función que cumple lo siguiente: (1) expresa de forma adecuada nuestra pregunta psicológica, () tiene una distribución muestral (de probabilidad) conocida, y (3) viene traducido (o expresado) en la escala de esa distribución de probabilidad. 1.4 La decisión ( H0 sí o H0 no?) La decisión requiere, en primer lugar, trazar un punto de corte (o dos, en el contraste bilateral), que definirá dos zonas, una de rechazo (o crítica) y otra de aceptación. Ese punto de corte vendrá dada por el nivel de confianza y el nivel de riesgo, α. La decisión consiste en rechazar la H0 si el estadístico de contraste cae en la región de rechazo, y mantenerla si cae en la región de aceptación. Mantener la H0 significa que la hipótesis es compatible con los datos. falsa. Rechazarla implica que ambos son incompatibles, luego consideramos la H0 Caso general 1. Hipótesis Contr. Bilateral: Contr. Unil. Der.: Contr. Unil. Izq.:. Supuestos H H H H H H : µ = µ 0 0 : µ µ 1 0 : µ µ 0 0 : µ > µ 1 0 : µ µ 0 0 : µ < µ 1 0 Población de partida normal Muestra aleatoria de tamaño n. 3. Estadístico de contraste t µ = t emp n 1 Sn 1 n 4. La decisión Primero, la zona de rechazo según α Contr. Bilateral: t t teor_inf teor_sup = t = t n 1, α Contr. Unil. Der.: tteor = tn 1,1 α n 1,1 α Ejemplo específico Hay un nivel de aciertos mayor que el esperado por azar, en 0 ensayos? NC = 0.95; n = 48. H0 : µ 10 H1 : µ > 10 Tenemos un n suficientemente grande para garantizar una DMM normal. t emp = = = α = 1 NC = = 0.05; Contraste unilateral derecho, luego t = t = t = teor n 1,1 α 47, El estadístico de contraste cae en la región de aceptación: t emp < t teor

16 3. Contraste de hipótesis, 14 Contr. Unil. Izq.: tteor = tn 1, α La regla de decisión Se rechaza H0 si temp cae en la zona de rechazo determinada por tteor. Luego mantenemos la H0: los resultados son compatibles con una media igual a 10, es decir, son compatibles con los aciertos esperados por azar. En las gráficas siguientes se observa la representación de las puntuaciones obtenidas y, superpuesta, la DMM con la región de rechazo definida por un α = En la gráfica inferior aparece ampliada la DMM. Obsérvese que los valores están en la escala de la variable, y no tipificada.

17 3. Contraste de hipótesis, 15. Estimación por intervalos y contraste de hipótesis Es fácil darse cuenta de la relación que existe entre un contraste de hipótesis y el intervalo de confianza. Por ejemplo, calculamos un intervalo de confianza, al 95%, para la media esperada. Como resultado, si la media obtenida está dentro de ese intervalo, consideraremos que no se aleja lo suficiente como para considerarla distinta. Eso es justamente lo que hacemos en un contraste de hipótesis bilateral: establecemos dos puntos de corte y comprobamos si la media obtenida está dentro del intervalo definido o no. Sobre este hecho realizamos la decisión. Es diferente si consideramos un contraste unilateral. En ese caso, todo el nivel de riesgo se sitúa en un lado. En tanto todos los intervalos están construidos de forma bilateral, la equivalencia no es perfecta. Habría que multiplicar el alfa por dos para que fuera equivalente. 3. Errores tipo I y II. Potencia de un contraste. Hemos aprendido a realizar un contrate de hipótesis, y ahora sabemos tomar una decisión acerca de si rechazamos o no la H0. Además, conocemos las probabilidades asociadas a cualquiera de las decisiones tomadas. Podemos representar gráficamente esta situación (ver figura anterior). Pero todas estas decisiones se basan en que H0 sea cierta. Qué ocurre, entonces, si H0 es falsa? Esto puede resumirse en la siguiente tabla: Decisión Mantener H0 Rechazar H0 Situación de H0 H0 Verdadera H0 Falsa Decisión correcta Error tipo II P = 1 α P = β Nivel de confianza Decisión correcta Error tipo I P = 1 β P = α Potencia Cómo podemos representar gráficamente esta nueva perspectiva? Lo primero será considerar que, si H0 se considera falsa, adoptaremos como valor de H1 el obtenido en nuestra muestra. A partir de ahí, podemos plantear una nueva DMM, centrada precisamente en H1 (donde µ = 10.44):

18 3. Contraste de hipótesis, 16 Ahora podemos ver que ese punto de corte determina otras dos áreas en la DMM para H1. Si analizamos la DMM para H1 es fácil saber lo que indican esas dos áreas: la de la izquierda (en verde), la probabilidad de que, siendo H0 falsa (es decir, adoptando H1 como verdadera), consideremos que H0 es cierta (o H1 es falsa), es decir, el error tipo II. El área de la derecha (sin relleno), por el contrario, nos indica la probabilidad de rechazar H0 (y, por tanto, considerar cierta H1), 1 β. Tenemos, por tanto, dos áreas (probabilidades) de error: α y β, y dos áreas de acierto, 1 α y 1 β. Pues bien, si α y β son los errores tipo I y tipo II, respectivamente, sus complementarios son el nivel de confianza (1 α) y la potencia (1 β). Hasta hace poco, sólo se prestaba atención al nivel de riesgo o error tipo I, α. Pero ahora es cada vez más habitual (y siempre recomendable) ver incluida la potencia en los estudios publicados. Para qué sirve, después de todo? Pues para varias cosas: 1. Primero, su valor siempre es informativo. Démonos cuenta de que también es importante que, si H1 es cierta, la probabilidad de elegirla (la potencia) sea alta.. Permite, dado un alfa, aumentar la potencia a través de un truco. Cuál? Aumentando el n. Es habitual obtener la potencia a partir del tamaño del efecto (ver punto siguiente) utilizando las tablas apropiadas. 4. Nivel crítico y tamaño del efecto Hay dos informaciones más que podemos extraer y que pueden ser extremadamente útiles. Por un lado, el nivel crítico, p: es la probabilidad asociada al estadístico de contraste o, dicho de otro modo, el nivel de significación más pequeño al que una H0 puede ser rechazada con nuestro estadístico de contraste, temp. Así, y en el caso de un contraste unilateral derecho, p puede definirse como la probabilidad de encontrar valores mayores que nuestro estadístico de contraste: p= P( t > t emp )

19 3. Contraste de hipótesis, 17 Con el nivel crítico se pretende salir de la decisión binaria (sí/no) y proporcionar al lector la probabilidad asociada al estadístico de contraste obtenido. Así, puede observarse la compatibilidad o discrepancia entre la H0 y la evidencia obtenida de la muestra (a través del estadístico de contraste). El siguiente cuadro muestra cuatro resultados y las diferentes decisiones según se use (de forma mecánica) un criterio basado en un α tomado a priori o atendiendo al estadístico de contraste y su nivel crítico o p asociada: Se rechaza la H0? (α = 0.05) t p Contr. Hipótesis Decisión en función de p No No No Repetir el contraste con otra muestra Sí Repetir el contraste con otra muestra Sí Sí El tamaño del efecto es otra información interesante. Su utilidad se aprecia ante la siguiente pregunta: Una diferencia significativa implica una diferencia grande? La respuesta es no. Supongamos el siguiente ejemplo: se pone a prueba si un nuevo método de enseñanza del inglés es mejor que el anterior. Tras medir a 500 alumnos a los que se les ha aplicado el nuevo método y comparar la media obtenida con la anterior, vemos que existen diferencias significativas (t500 =.0; p < 0.0). Efectivamente, la media anterior se situaba en 6.35 puntos y, con el método actual se ha alcanzado una media de 6.4. La diferencia es significativa pero, es grande? O lo que es más importante, es relevante? Cómo para cambiar todo un sistema educativo? Parece que no. En estos casos, el tamaño del efecto nos informa de la diferencia entre el valor propuesto (en la H0) y el valor obtenido. Y para evitar diferencias aparentes en función de la escala de la variable medida, esa diferencia se divide por la desviación típica de los datos obtenidos: d = µ S De esta forma, el tamaño del efecto viene expresado en unidades de desviación típica: un valor de 0.5 significa que la diferencia entre la media obtenida y la propuesta en la H0 representa 0.5 veces el tamaño de la desviación típica. Cómo interpretar el tamaño del efecto? Cohen (1977) propone unos valores orientativos: Pequeño: d = 0.; Moderado: d = 0.5; Grande: d = 0.8. n 1 0

20 3. Contraste de hipótesis, 18 Para obtener la potencia a partir del tamaño del efecto debemos calcular primero : = d n Y luego utilizamos la tabla de potencias, donde a partir de α y podemos obtener la potencia del contraste. Y de igual forma podríamos calcular el n necesario para alcanzar una determinada potencia: n = d Así, dado d y el α del contraste, podemos buscar en la tabla de potencias cuál es la que desearíamos alcanzar y localizar el valor D correspondiente. Sustituyendo en la fórmula anterior obtendríamos el tamaño de la muestra necesario para conseguirlo. Resumiendo todo esto en una tabla como la anterior: 5. Nivel crítico p asociada al temp = Contr. Bilateral: p= P( t > temp ) Contr. Unil. Der.: p= P( t > temp) Contr. Unil. Izq.: p= P( t< temp) p = P( t > 1.558) = = Lo que indica que hay un 10.56% de prob. de obtener resultados iguales o mayores que los nuestros. Muy superior al 5 % establecido como para rechazar H0. 6. Intervalo de confianza IC al nivel de confianza de 0.95 li = tn 1, / Sn 1 / n α IC = l ( ) i = ( / 48 ) = 9.76 ls = + tn 1, α / Sn 1 / n l ( ( ) s = / 48 ) = 11.1 P(9.76 < µ < 11.1) = Tamaño del efecto µ d = d = = 0.18 S.41 n 1 (valor pequeño, según Cohen, 1977) 8. Potencia = d n Mirar en tabla L, para α y Cálculo de n para una potencia dada n = d = = β = 0.35 Para una potencia de 0.75, = n = = = Apéndice: Solución mediante el SPSS Si utilizáramos el SPSS, lo primero sería introducir los datos (o si ya están introducidos, cargarlos abriendo el fichero correspondiente). El aspecto sería el siguiente:

21 3. Contraste de hipótesis, 19 Realizamos el contraste el contraste mediante el menú Analizar: Especificamos la variable a analizar (la única presente) y el valor de comparación (el definido en la H0) para realizar el contraste. Obsérvese que en ningún momento se indica el nivel de confianza o α, el nivel de riesgo o también llamado nivel de significación del contraste.

22 3. Contraste de hipótesis, 0 Damos a aceptar y obtenemos los siguientes resultados: Prueba T Estadísticos para una muestra Aciertos N Desviación Error típ. de Media típ. la media Prueba para una muestra Aciertos Valor de prueba = 10 95% Intervalo de confianza para la Diferencia diferencia t gl Sig. (bilateral) de medias Inferior Superior Inicialmente, el procedimiento ofrece unos descriptivos básicos en el primer recuadro, y los resultados del contraste en el segundo. En este último, si atendemos al recuadro Sig. (bilateral) vemos cómo SPSS nos ofrece el nivel crítico, p, de forma bilateral por defecto. Como nuestro contraste es unilateral, deberemos dividirlo por dos (p = ) para conocer nuestro verdadero nivel crítico (también llamado probabilidad asociada al estadístico de contraste, o significación del estadístico de contraste). Como se observa, la salida del SPSS no proporciona información sobre el tamaño del efecto ni la potencia, pero podemos calcularlo tal como hemos visto. En cuanto a la interpretación de estos resultados, es idéntica a la que hicimos: Este resultado nos llevaría a mantener la H0 a un nivel α (también llamado nivel de riesgo o nivel de significación) de 0.05, ya que p es superior (0.1075; la significación bilateral, 0.15, dividida por ). En términos estadísticos, el nivel crítico, p, obtenido nos indica que la probabilidad de obtener unos resultados como los nuestros, supuesta cierta la H0, es de , es decir, algo más de un 10% de las veces (si repitiéramos indefinidamente este experimento sobre una H0 cierta). Por tanto, es razonable considerar este resultado demasiado probable como para llevarnos a pensar que la H0 es falsa.

"CONTRASTES DE HIPÓTESIS" 4.4 Parte básica

CONTRASTES DE HIPÓTESIS 4.4 Parte básica 76 "CONTRASTES DE HIPÓTESIS" 4.4 Parte básica 77 4.4.1 Introducción a los contrastes de hipótesis La Inferencia Estadística consta de dos partes: Estimación y Contrastes de Hipótesis. La primera se ha

Más detalles

INFERENCIA ESTADÍSTICA

INFERENCIA ESTADÍSTICA INFERENCIA ESTADÍSTICA Pensemos en los tres siguientes ejemplos: Hacemos una encuesta entre los clientes de una tienda para preguntarles su opinión sobre cambios generales que pretendemos hacer en diversas

Más detalles

PRUEBAS DE HIPÓTESIS

PRUEBAS DE HIPÓTESIS PRUEBAS DE HIPÓTESIS Muchos problemas de ingeniería, ciencia, y administración, requieren que se tome una decisión entre aceptar o rechazar una proposición sobre algún parámetro. Esta proposición recibe

Más detalles

Introducción a la Teoría de Probabilidad

Introducción a la Teoría de Probabilidad Capítulo 1 Introducción a la Teoría de Probabilidad Para la mayoría de la gente, probabilidad es un término vago utilizado en el lenguaje cotidiano para indicar la posibilidad de ocurrencia de un evento

Más detalles

Eduardo Kido 26-Mayo-2004 ANÁLISIS DE DATOS

Eduardo Kido 26-Mayo-2004 ANÁLISIS DE DATOS ANÁLISIS DE DATOS Hoy día vamos a hablar de algunas medidas de resumen de datos: cómo resumir cuando tenemos una serie de datos numéricos, generalmente en variables intervalares. Cuando nosotros tenemos

Más detalles

Unidad 9. Estimación

Unidad 9. Estimación Unidad 9 Estimación Estimación En los capítulos anteriores se han estudiado las nociones fundamentales de distribución de probabilidad y distribución muestral. Estamos ya en condiciones de tratar los métodos

Más detalles

Test ( o Prueba ) de Hipótesis

Test ( o Prueba ) de Hipótesis Test de Hipótesis 1 Test ( o Prueba ) de Hipótesis Ejemplo: Una muestra de 36 datos tiene una media igual a 4.64 Qué puede deducirse acerca de la población de donde fue tomada? Se necesita contestar a

Más detalles

MOOC UJI: La Probabilidad en las PAU

MOOC UJI: La Probabilidad en las PAU 3. Definición intuitiva de probabilidad: ley de Laplace La palabra probabilidad, que usamos habitualmente, mide el grado de creencia que tenemos de que ocurra un hecho que puede pasar o no pasar. Imposible,

Más detalles

SESIÓN PRÁCTICA 6: CONTRASTES DE HIPÓTESIS PROBABILIDAD Y ESTADÍSTICA. PROF. Esther González Sánchez. Departamento de Informática y Sistemas

SESIÓN PRÁCTICA 6: CONTRASTES DE HIPÓTESIS PROBABILIDAD Y ESTADÍSTICA. PROF. Esther González Sánchez. Departamento de Informática y Sistemas SESIÓN PRÁCTICA 6: CONTRASTES DE HIPÓTESIS PROBABILIDAD Y ESTADÍSTICA PROF. Esther González Sánchez Departamento de Informática y Sistemas Facultad de Informática Universidad de Las Palmas de Gran Canaria

Más detalles

Usamos que f( p) = q y que, por tanto, g( q) = g(f( p)) = h( p) para simplificar esta expresión:

Usamos que f( p) = q y que, por tanto, g( q) = g(f( p)) = h( p) para simplificar esta expresión: Univ. de Alcalá de Henares Ingeniería de Telecomunicación Cálculo. Segundo parcial. Curso 2004-2005 Propiedades de las funciones diferenciables. 1. Regla de la cadena Después de la generalización que hemos

Más detalles

Tema 3. Variables aleatorias. Inferencia estadística

Tema 3. Variables aleatorias. Inferencia estadística Estadística y metodología de la investigación Curso 2012-2013 Pedro Faraldo, Beatriz Pateiro Tema 3. Variables aleatorias. Inferencia estadística 1. Introducción 1 2. Variables aleatorias 1 2.1. Variable

Más detalles

Imagen de Rosaura Ochoa con licencia Creative Commons

Imagen de Rosaura Ochoa con licencia Creative Commons Imagen de Rosaura Ochoa con licencia Creative Commons Durante el primer tema hemos aprendido a elaborar una encuesta. Una vez elaborada la encuesta necesitamos escoger a los individuos a los que se la

Más detalles

7.- PRUEBA DE HIPOTESIS

7.- PRUEBA DE HIPOTESIS 7.- PRUEBA DE HIPOTEI 7.1. INTRODUCCIÓN La estadística inferencial es el proceso de usar la información de una muestra para describir el estado de una población. in embargo es frecuente que usemos la información

Más detalles

Límites y Continuidad de funciones

Límites y Continuidad de funciones CAPITULO Límites y Continuidad de funciones Licda. Elsie Hernández Saborío Instituto Tecnológico de Costa Rica Escuela de Matemática Revista digital Matemática, educación e internet (www.cidse.itcr.ac.cr)

Más detalles

Soluciones de los ejercicios de Selectividad sobre Probabilidad de Matemáticas Aplicadas a las Ciencias Sociales II

Soluciones de los ejercicios de Selectividad sobre Probabilidad de Matemáticas Aplicadas a las Ciencias Sociales II Soluciones de los ejercicios de Selectividad sobre Probabilidad de ntonio Francisco Roldán López de Hierro * Convocatoria de 2007 Las siguientes páginas contienen las soluciones de los ejercicios propuestos

Más detalles

1.1. Introducción y conceptos básicos

1.1. Introducción y conceptos básicos Tema 1 Variables estadísticas Contenido 1.1. Introducción y conceptos básicos.................. 1 1.2. Tipos de variables estadísticas................... 2 1.3. Distribuciones de frecuencias....................

Más detalles

Anexo a la guía 4 Geometría: ejemplos y comentarios

Anexo a la guía 4 Geometría: ejemplos y comentarios Anexo a la guía 4 Geometría: ejemplos y comentarios Sergio Dain 26 de mayo de 2014 En las guías 1 y 2 discutimos vectores, covectores y tensores de manera puramente algebraica, sin hacer referencia a la

Más detalles

Límites. Definición de derivada.

Límites. Definición de derivada. Capítulo 4 Límites. Definición de derivada. 4.1. Límites e indeterminaciones Hemos visto en el capítulo anterior que para resolver el problema de la recta tangente tenemos que enfrentarnos a expresiones

Más detalles

Tema 7: Juegos con información incompleta

Tema 7: Juegos con información incompleta Tema 7: Juegos con información incompleta Microeconomía Avanzada II Iñigo Iturbe-Ormaeche U. de Alicante 2008-09 Modelo de Spence Introducción y ejemplos Equilibrio Bayesiano de Nash Aplicaciones Señales

Más detalles

Biometría Clase 8 Pruebas de hipótesis para una muestra. Adriana Pérez 1

Biometría Clase 8 Pruebas de hipótesis para una muestra. Adriana Pérez 1 Biometría Clase 8 Pruebas de hipótesis para una muestra Adriana Pérez 1 Qué es una prueba de hipótesis? Es un proceso para determinar la validez de una aseveración hecha sobre la población basándose en

Más detalles

Tema 1: Fundamentos de lógica, teoría de conjuntos y estructuras algebraicas: Apéndice

Tema 1: Fundamentos de lógica, teoría de conjuntos y estructuras algebraicas: Apéndice Tema 1: Fundamentos de lógica, teoría de conjuntos y estructuras algebraicas: Apéndice 1 Polinomios Dedicaremos este apartado al repaso de los polinomios. Se define R[x] ={a 0 + a 1 x + a 2 x 2 +... +

Más detalles

Tests de hipótesis estadísticas

Tests de hipótesis estadísticas Tests de hipótesis estadísticas Test de hipótesis sobre la media de una población. Introducción con un ejemplo. Los tests de hipótesis estadísticas se emplean para muchos problemas, en particular para

Más detalles

Escritura de ecuaciones de problemas de algebraicos

Escritura de ecuaciones de problemas de algebraicos 1 Escritura de ecuaciones de problemas de algebraicos Herbert Mendía A. 2011-10-12 www.cimacien.org.gt Conocimientos previos necesarios Operaciones básicas: suma, resta, multiplicación y división. Jerarquía

Más detalles

Academia de Matemáticas. Apuntes para la Materia de Estadística II. Guía Básica para el Estudio de la Estadística Inferencial.

Academia de Matemáticas. Apuntes para la Materia de Estadística II. Guía Básica para el Estudio de la Estadística Inferencial. UNIVERSIDAD MICHOACANA DE SAN NICOLÁS DE HIDALGO Facultad de Contaduría y Ciencias Administrativas Academia de Matemáticas Apuntes para la Materia de Estadística II Guía Básica para el Estudio de la Estadística

Más detalles

Universidad Católica del Maule. Fundamentos de Computación Especificación de tipos de datos ESPECIFICACIÓN ALGEBRAICA DE TIPOS DE DATOS

Universidad Católica del Maule. Fundamentos de Computación Especificación de tipos de datos ESPECIFICACIÓN ALGEBRAICA DE TIPOS DE DATOS Especificación algebraica ESPECIFICACIÓN ALGEBRAICA DE TIPOS DE DATOS Un tipo abstracto de datos se determina por las operaciones asociadas, incluyendo constantes que se consideran como operaciones sin

Más detalles

LA DISTRIBUCIÓN NORMAL, LA CALCULADORA Y LAS NUEVAS TECNOLOGÍAS Abel Martín ( * ) Rosana Álvarez García ( )

LA DISTRIBUCIÓN NORMAL, LA CALCULADORA Y LAS NUEVAS TECNOLOGÍAS Abel Martín ( * ) Rosana Álvarez García ( ) LA DISTRIBUCIÓN NORMAL, LA CALCULADORA Y LAS NUEVAS TECNOLOGÍAS Abel Martín ( * ) Rosana Álvarez García ( ) La distribución Normal tiene numerosas aplicaciones en el campo de la Probabilidad y la Estadística,

Más detalles

Capítulo 10. Análisis descriptivo: Los procedimientos Frecuencias y Descriptivos

Capítulo 10. Análisis descriptivo: Los procedimientos Frecuencias y Descriptivos Capítulo 10 Análisis descriptivo: Los procedimientos Frecuencias y Descriptivos Al analizar datos, lo primero que conviene hacer con una variable es, generalmente, formarse una idea lo más exacta posible

Más detalles

Un juego de cartas: Las siete y media

Un juego de cartas: Las siete y media Un juego de cartas: Las siete y media Paula Lagares Federico Perea Justo Puerto * MaMaEuSch ** Management Mathematics for European Schools 94342 - CP - 1-2001 - DE - COMENIUS - C21 * Universidad de Sevilla

Más detalles

1.3 Números racionales

1.3 Números racionales 1.3 1.3.1 El concepto de número racional Figura 1.2: Un reparto no equitativo: 12 5 =?. Figura 1.3: Un quinto de la unidad. Con los números naturales y enteros es imposible resolver cuestiones tan simples

Más detalles

MATEMÁTICAS CON LA HOJA DE CÁLCULO

MATEMÁTICAS CON LA HOJA DE CÁLCULO MATEMÁTICAS CON LA HOJA DE CÁLCULO Podemos dar a esta aplicación un uso práctico en el aula de Matemáticas en varios sentidos: Como potente calculadora: sucesiones, límites, tablas estadísticas, parámetros

Más detalles

Asignatura: Econometría. Conceptos MUY Básicos de Estadística

Asignatura: Econometría. Conceptos MUY Básicos de Estadística Asignatura: Econometría Conceptos MUY Básicos de Estadística Ejemplo: encuesta alumnos matriculados en la UMH Estudio: Estamos interesados en conocer el nivel de renta y otras características de los estudiantes

Más detalles

ESTADÍSTICA. Tema 3 Contrastes de hipótesis

ESTADÍSTICA. Tema 3 Contrastes de hipótesis ESTADÍSTICA Grado en CC. de la Alimentación Tema 3 Contrastes de hipótesis Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 1 Estructura de este tema Qué es un contraste

Más detalles

MANUAL SIMPLIFICADO DE ESTADÍSTICA APLICADA VIA SPSS

MANUAL SIMPLIFICADO DE ESTADÍSTICA APLICADA VIA SPSS 1 MANUAL SIMPLIFICADO DE ESTADÍSTICA APLICADA VIA SPSS Medidas de tendencia central Menú Analizar: Los comandos del menú Analizar (Estadística) ejecutan los procesamientos estadísticos. Sus comandos están

Más detalles

Soluciones de los ejercicios de la primera Unidad. Dr. Jorge Martín Dr. José Antonio Carrillo

Soluciones de los ejercicios de la primera Unidad. Dr. Jorge Martín Dr. José Antonio Carrillo Soluciones de los ejercicios de la primera Unidad Dr. Víctor Hernández Dr. Jorge Martín Dr. José Antonio Carrillo 5 de marzo de 0 Índice general Ejercicio.. Manejo del formalismo de los sucesos.............

Más detalles

DESIGUALDADES página 1

DESIGUALDADES página 1 DESIGUALDADES página 1 1.1 CONCEPTOS Y DEFINICIONES Una igualdad en Álgebra es aquella relación que establece equivalencia entre dos entes matemáticos. Es una afirmación, a través del signo =, de que dos

Más detalles

ESTIMACIÓN. puntual y por intervalo

ESTIMACIÓN. puntual y por intervalo ESTIMACIÓN puntual y por intervalo ( ) Podemos conocer el comportamiento del ser humano? Podemos usar la información contenida en la muestra para tratar de adivinar algún aspecto de la población bajo estudio

Más detalles

INFERENCIA ESTADÍSTICA

INFERENCIA ESTADÍSTICA Capítulo 4 INFERENCIA ESTADÍSTICA 4.1. Introducción Inferir: Sacar una consecuencia de una cosa. Sacar consecuencia o deducir una cosa de otra. La estadística, ciencia o rama de las Matemáticas que se

Más detalles

1 Introducción a contrastes de hipótesis

1 Introducción a contrastes de hipótesis Inferencia Estadística II Teoría, handout 1 1 Introducción a contrastes de hipótesis En este curso vamos a aprender a usar los datos para cuestionar la validez de ciertas afirmaciones teóricas. Los fenómenos

Más detalles

Inteligencia Artificial II (Curso 2012-2013) Ejercicios propuestos del tema 4

Inteligencia Artificial II (Curso 2012-2013) Ejercicios propuestos del tema 4 Inteligencia Artificial II (Curso 2012-2013) Ejercicios propuestos del tema 4 Ejercicio 1: En una máquina expendedora de huevos sorpresa, unos huevos están pintados de rojo y otros de azul. El 40% de los

Más detalles

Tema 3. Concepto de Probabilidad

Tema 3. Concepto de Probabilidad Tema 3. Concepto de Probabilidad Presentación y Objetivos. El Cálculo de Probabilidades estudia el concepto de probabilidad como medida de incertidumbre. En situaciones donde se pueden obtener varios resultados

Más detalles

8.2.2. Intervalo para la media (caso general)

8.2.2. Intervalo para la media (caso general) 182 Bioestadística: Métodos y Aplicaciones 100 de ellos se obtiene una media muestral de 3 kg, y una desviación típica de 0,5 kg, calcular un intervalo de confianza para la media poblacional que presente

Más detalles

Probabilidad. La probabilidad de un suceso es un nombre que pertenece al intervalo [0, 1]

Probabilidad. La probabilidad de un suceso es un nombre que pertenece al intervalo [0, 1] Probabilidad Un fenómeno es aleatorio si conocemos todos sus posibles resultados pero no podemos predecir cual de ellos ocurrirá. Cada uno de estos posibles resultados es un suceso elemental del fenómeno

Más detalles

U2-T4: Un método personalizado: Gauss

U2-T4: Un método personalizado: Gauss AVISO: Esta página ha sido generada para facilitar la impresión de los contenidos. Los enlaces externos a otras páginas no serán funcionales. U2-T4: Un método personalizado: Gauss 1. Karl F. Gauss. Im

Más detalles

Tema 7. Límites y continuidad de funciones

Tema 7. Límites y continuidad de funciones Matemáticas II (Bachillerato de Ciencias) Análisis: Límites y continuidad de funciones 55 Límite de una función en un punto Tema 7 Límites y continuidad de funciones Idea inicial Si una función f está

Más detalles

Tema 3: Variables aleatorias y vectores aleatorios bidimensionales

Tema 3: Variables aleatorias y vectores aleatorios bidimensionales Estadística 38 Tema 3: Variables aleatorias y vectores aleatorios bidimensionales El concepto de variable aleatoria surge de la necesidad de hacer más manejables matemáticamente los resultados de los experimentos

Más detalles

UNIDAD 1: LÍMITES DE FUNCIONES. CONTINUIDAD

UNIDAD 1: LÍMITES DE FUNCIONES. CONTINUIDAD UNIDAD : LÍMITES Y CONTINUIDAD UNIDAD : LÍMITES DE FUNCIONES CONTINUIDAD ÍNDICE DE LA UNIDAD - INTRODUCCIÓN - LÍMITE DE UNA FUNCIÓN EN UN PUNTO LÍMITES LATERALES - LÍMITES EN EL INFINITO 5 4- ÁLGEBRA DE

Más detalles

Tema 07. LÍMITES Y CONTINUIDAD DE FUNCIONES

Tema 07. LÍMITES Y CONTINUIDAD DE FUNCIONES Tema 07 LÍMITES Y CONTINUIDAD DE FUNCIONES Límite de una función en un punto Vamos a estudiar el comportamiento de las funciones f ( ) g ( ) ENT[ ] h ( ) i ( ) en el punto Para ello, damos a valores próimos

Más detalles

BRYAN GOODWIN: Así es. Es una buena descripción de la teoría de la complejidad.

BRYAN GOODWIN: Así es. Es una buena descripción de la teoría de la complejidad. BRYAN GOODWIN catedrático de Biología Teórica y reconocido experto sobre teoría de la complejidad de sistemas biológicos. Es autor, además, del libro Las manchas del leopardo, Colección Metatemas, Editorial

Más detalles

Teóricas de Análisis Matemático (28) - Práctica 4 - Límite de funciones. 1. Límites en el infinito - Asíntotas horizontales

Teóricas de Análisis Matemático (28) - Práctica 4 - Límite de funciones. 1. Límites en el infinito - Asíntotas horizontales Práctica 4 - Parte Límite de funciones En lo que sigue, veremos cómo la noción de límite introducida para sucesiones se etiende al caso de funciones reales. Esto nos permitirá estudiar el comportamiento

Más detalles

Muestreo. Introducción

Muestreo. Introducción Muestreo Introducción En este documento ofrecemos un resumen sobre el concepto de muestreo, y los tipos de muestreo existentes. Además, adjuntamos una hoja para el cálculo de tamaños muestrales en auditorías

Más detalles

Población, Unidad de Análisis, Criterios de Inclusión y Exclusión.

Población, Unidad de Análisis, Criterios de Inclusión y Exclusión. Población Población, Unidad de Análisis, Criterios de Inclusión y Exclusión. Muestra: Identificación y Reclutamiento. Nomenclatura En esta aproximación conceptual consideraremos a Población como sinónimo

Más detalles

Tema 2. Espacios Vectoriales. 2.1. Introducción

Tema 2. Espacios Vectoriales. 2.1. Introducción Tema 2 Espacios Vectoriales 2.1. Introducción Estamos habituados en diferentes cursos a trabajar con el concepto de vector. Concretamente sabemos que un vector es un segmento orientado caracterizado por

Más detalles

Capítulo 6. Asociaciones y Declaraciones.

Capítulo 6. Asociaciones y Declaraciones. Capítulo 6. Asociaciones y Declaraciones. Lenguajes de Programación Carlos Ureña Almagro Curso 2011-12 Contents 1 Asociaciones, entornos y ámbitos 2 2 Declaraciones y definiciones 6 3 Definiciones de valores,

Más detalles

T.1 CONVERGENCIA Y TEOREMAS LÍMITE

T.1 CONVERGENCIA Y TEOREMAS LÍMITE T.1 CONVERGENCIA Y TEOREMAS LÍMITE 1. CONVERGENCIA DE SUCESIONES DE VARIABLES ALEATORIA CONVERGENCIA CASI-SEGURA CONVERGENCIA EN PROBABILIDAD CONVERGENCIA EN MEDIA CUADRÁTICA CONVERGENCIA EN LEY ( O DISTRIBUCIÓN)

Más detalles

Selectividad Septiembre 2009 SEPTIEMBRE 2009. Opción A

Selectividad Septiembre 2009 SEPTIEMBRE 2009. Opción A SEPTIEMBRE 2009 Opción A 1.- Como cada año, el inicio del curso académico, una tienda de material escolar prepara una oferta de 600 cuadernos, 500 carpetas y 400 bolígrafos para los alumnos de un IES,

Más detalles

Curso de Estadística no-paramétrica

Curso de Estadística no-paramétrica Curso de Estadística no-paramétrica Sesión 1: Introducción Inferencia no Paramétrica David Conesa Grup d Estadística espacial i Temporal Departament d Estadística en Epidemiologia i Medi Ambient i Investigació

Más detalles

1. Introducción a la estadística 2. Estadística descriptiva: resumen numérico y gráfico de datos 3. Estadística inferencial: estimación de parámetros

1. Introducción a la estadística 2. Estadística descriptiva: resumen numérico y gráfico de datos 3. Estadística inferencial: estimación de parámetros TEMA 0: INTRODUCCIÓN Y REPASO 1. Introducción a la estadística 2. Estadística descriptiva: resumen numérico y gráfico de datos 3. Estadística inferencial: estimación de parámetros desconocidos 4. Comparación

Más detalles

Problemas de Probabilidad resueltos.

Problemas de Probabilidad resueltos. Problemas de Probabilidad resueltos. Problema 1 El profesor Pérez olvida poner su despertador 3 de cada 10 dias. Además, ha comprobado que uno de cada 10 dias en los que pone el despertador acaba no levandandose

Más detalles

Los números racionales

Los números racionales Los números racionales Los números racionales Los números fraccionarios o fracciones permiten representar aquellas situaciones en las que se obtiene o se debe una parte de un objeto. Todas las fracciones

Más detalles

Lección 22: Probabilidad (definición clásica)

Lección 22: Probabilidad (definición clásica) LECCIÓN 22 Lección 22: Probabilidad (definición clásica) Empezaremos esta lección haciendo un breve resumen de la lección 2 del libro de primer grado. Los fenómenos determinísticos son aquellos en los

Más detalles

Definición 2.1.1. Se llama suceso aleatorio a cualquier subconjunto del espacio muestral.

Definición 2.1.1. Se llama suceso aleatorio a cualquier subconjunto del espacio muestral. Capítulo 2 Probabilidades 2. Definición y propiedades Al realizar un experimento aleatorio nuestro interés es obtener información sobre las leyes que rigen el fenómeno sometido a estudio. El punto de partida

Más detalles

Diagnosis y Crítica del modelo -Ajuste de distribuciones con Statgraphics-

Diagnosis y Crítica del modelo -Ajuste de distribuciones con Statgraphics- Diagnosis y Crítica del modelo -Ajuste de distribuciones con Statgraphics- 1. Introducción Ficheros de datos: TiempoaccesoWeb.sf3 ; AlumnosIndustriales.sf3 El objetivo de esta práctica es asignar un modelo

Más detalles

Práctica 3 Distribuciones de probabilidad

Práctica 3 Distribuciones de probabilidad Práctica 3 Distribuciones de probabilidad Contenido 1 Objetivos 1 2 Distribuciones de variables aleatorias 1 3 Gráficas de funciones de distribución, densidad y probabilidad 6 4 Bibliografía 10 1 Objetivos

Más detalles

Lección 24: Lenguaje algebraico y sustituciones

Lección 24: Lenguaje algebraico y sustituciones LECCIÓN Lección : Lenguaje algebraico y sustituciones En lecciones anteriores usted ya trabajó con ecuaciones. Las ecuaciones expresan una igualdad entre ciertas relaciones numéricas en las que se desconoce

Más detalles

COLEGIO APUNTES ACCESS

COLEGIO APUNTES ACCESS COLEGIO APUNTES ACCESS Índice Introducción al Access... 3 Conocimientos básicos... 6 Tablas... 7 Formularios... 10 Consultas... 12 Consultas de eliminación... 15 Consulta de actualización... 15 Informes...

Más detalles

Capítulo 7: Distribuciones muestrales

Capítulo 7: Distribuciones muestrales Capítulo 7: Distribuciones muestrales Recordemos: Parámetro es una medida de resumen numérica que se calcularía usando todas las unidades de la población. Es un número fijo. Generalmente no lo conocemos.

Más detalles

T. 8 Estadísticos de asociación entre variables

T. 8 Estadísticos de asociación entre variables T. 8 Estadísticos de asociación entre variables. Concepto de asociación entre variables. Midiendo la asociación entre variables.. El caso de dos variables categóricas.. El caso de una variable categórica

Más detalles

Capítulo 9. Regresión lineal simple

Capítulo 9. Regresión lineal simple Capítulo 9. Regresión lineal simple 9.1 Introducción Uno de los aspectos más relevantes de la Estadística es el análisis de la relación o dependencia entre variables. Frecuentemente resulta de interés

Más detalles

Plan docente de la asignatura Bioestadística del Grado de Medicina de la Facultad de Ciencias de la Salud y de la Vida (FCSV)

Plan docente de la asignatura Bioestadística del Grado de Medicina de la Facultad de Ciencias de la Salud y de la Vida (FCSV) Plan docente de la asignatura Bioestadística del Grado de Medicina de la Facultad de Ciencias de la Salud y de la Vida (FCSV) 1. Descripción de la asignatura Materia: Estadística Carácter: Formación Básica

Más detalles

Fórmulas y funciones

Fórmulas y funciones 05... Fórmulas y funciones En este tema vamos a profundizar en el manejo de funciones ya definidas por Excel, con el objetivo de agilizar la creación de hojas de cálculo, estudiando la sintaxis de éstas

Más detalles

Estadística Descriptiva

Estadística Descriptiva Estadística Descriptiva Observamos datos provenientes de una o varias muestras de la población bajo estudio. El objetivo es obtener conclusiones sobre toda la población a partir de la muestra observada.

Más detalles

Tutorial - Parte 2: Scoring

Tutorial - Parte 2: Scoring Introducción Tutorial - Parte 2: Scoring En este segundo tutorial aprenderá lo que significa un modelo de Scoring, verá cómo crear uno utilizando Powerhouse Analytics y finalmente a interpretar sus resultados.

Más detalles

TABLAS DE CONTINGENCIA (CROSS-TAB): BUSCANDO RELACIONES DE DEPENDENCIA ENTRE VARIABLES CATEGÓRICAS 1

TABLAS DE CONTINGENCIA (CROSS-TAB): BUSCANDO RELACIONES DE DEPENDENCIA ENTRE VARIABLES CATEGÓRICAS 1 TABLAS DE CONTINGENCIA (CROSS-TAB): BUSCANDO RELACIONES DE DEPENDENCIA ENTRE VARIABLES CATEGÓRICAS 1 rafael.dearce@uam.es El objeto de las tablas de contingencia es extraer información de cruce entre dos

Más detalles

Universidad del CEMA Prof. José P Dapena Métodos Cuantitativos V - ESTIMACION PUNTUAL E INTERVALOS DE CONFIANZA. 5.1 Introducción

Universidad del CEMA Prof. José P Dapena Métodos Cuantitativos V - ESTIMACION PUNTUAL E INTERVALOS DE CONFIANZA. 5.1 Introducción V - ESTIMACION PUNTUAL E INTERVALOS DE CONFIANZA 5.1 Introducción En este capítulo nos ocuparemos de la estimación de caracteristicas de la población a partir de datos. Las caracteristicas poblacionales

Más detalles

Estabilidad dinámica Introducción

Estabilidad dinámica Introducción Figura 127: Varada Si el momento de asiento unitario del barco, en las condiciones de desplazamiento en las que se encuentra, es M u, tendremos que la alteración producida al bajar la marea de forma que

Más detalles

UNED. [TEMA 3] Análisis de datos para diseños de dos grupos. Muestras independientes.

UNED. [TEMA 3] Análisis de datos para diseños de dos grupos. Muestras independientes. 2009 UNED [TEMA 3] Análisis de datos para diseños de dos grupos. Muestras independientes. 1 ÍNDICE 3.1 Introducción 3.2 Objetivos 3.3 Muestras independientes o relacionadas 3.4 Contraste de hipótesis sobre

Más detalles

Tema 12: Contrastes Paramétricos

Tema 12: Contrastes Paramétricos Tema 1 Tema 1: Contrastes Paramétricos Presentación y Objetivos. Se comienza este tema introduciendo la terminología y conceptos característicos de los contrastes de hipótesis, típicamente a través de

Más detalles

La suma y la resta. Introducción. Capítulo

La suma y la resta. Introducción. Capítulo Capítulo II La suma y la resta Introducción En el capítulo anterior, vimos que los números permiten expresar la cantidad de objetos que tiene una colección. Juntar dos o más colecciones, agregar objetos

Más detalles

El concepto de asociación estadística. Tema 6 Estadística aplicada Por Tevni Grajales G.

El concepto de asociación estadística. Tema 6 Estadística aplicada Por Tevni Grajales G. El concepto de asociación estadística Tema 6 Estadística aplicada Por Tevni Grajales G. En gran medida la investigación científica asume como una de sus primera tareas, identificar las cosas (características

Más detalles

Capítulo 6. Modificar archivos de datos. Ordenar casos

Capítulo 6. Modificar archivos de datos. Ordenar casos Capítulo 6 Modificar archivos de datos Los archivos de datos no siempre están organizados de forma idónea. En ocasiones podemos desear cambiar el orden de los casos, o transponer las filas y las columnas,

Más detalles

Congruencias de Grado Superior

Congruencias de Grado Superior Congruencias de Grado Superior Capítulo 3 3.1 Introdución En el capítulo anterior vimos cómo resolver congruencias del tipo ax b mod m donde a, b y m son enteros m > 1, y (a, b) = 1. En este capítulo discutiremos

Más detalles

Arreglos. // Incluir E/S y Librerías Standard #include <stdlib.h> #include <stdio.h>

Arreglos. // Incluir E/S y Librerías Standard #include <stdlib.h> #include <stdio.h> Arreglos Introducción. En los temas anteriores se han estudiado los diferentes tipos de datos simples de C++, usados para representar valores simples como enteros, reales o caracteres. Sin embargo, en

Más detalles

TEMA UNIDAD III:INFERENCIA ESTADÍSTICA 11.1. INTRODUCCIÓN

TEMA UNIDAD III:INFERENCIA ESTADÍSTICA 11.1. INTRODUCCIÓN PRUEBA DE HIPÓTESIS TEMA..INTRODUCCIÓN..ELEMENTOS DE LAS PRUEBAS DE HIPÓTESIS.3.PRUEBA DE HIPÓTESIS PARA UNA MEDIA POBLACIONAL.3.. Caso: muestra grande.3.. Caso: muestra pequeña.4.prueba DE HIPÓTESIS PARA

Más detalles

Capítulo 17 Análisis de correlación lineal: Los procedimientos Correlaciones bivariadas y Correlaciones parciales

Capítulo 17 Análisis de correlación lineal: Los procedimientos Correlaciones bivariadas y Correlaciones parciales Capítulo 17 Análisis de correlación lineal: Los procedimientos Correlaciones bivariadas y Correlaciones parciales Cuando se analizan datos, el interés del analista suele centrarse en dos grandes objetivos:

Más detalles

MATEMÁTICAS aplicadas a las Ciencias Sociales II

MATEMÁTICAS aplicadas a las Ciencias Sociales II MATEMÁTICAS aplicadas a las Ciencias Sociales II UNIDAD 1: SISTEMAS DE ECUACIONES. MÉODO DE GAUSS Sistemas de ecuaciones lineales Sistemas equivalentes. Transformaciones que mantienen la equivalencia.

Más detalles

PRÁCTICA 4. Ingeniería Técnica Industrial (2º) - Mecánica.

PRÁCTICA 4. Ingeniería Técnica Industrial (2º) - Mecánica. PRÁCTICA 4. Ingeniería Técnica Industrial (2º) - Mecánica. Profesores: Javier Faulín y Francisco Ballestín 1. Introducción. El objetivo de esta parte es obtener resultados sobre contrastes de hipótesis

Más detalles

Resolución de problemas. Temas: VOR e ILS

Resolución de problemas. Temas: VOR e ILS Resolución de problemas. Temas: VOR e ILS Autor: Mario E. Casado García 3er Curso ITT ST Índice 1. Problema tema 5: VOR......3 2. Problema tema 7: ILS.....7 3. Referencias..12 2 1. Problema tema 5: VOR

Más detalles

03 ENERGÍA ALGUNOS COMENTARIOS Y CUESTIONES

03 ENERGÍA ALGUNOS COMENTARIOS Y CUESTIONES 03 ENERGÍA ALGUNOS COMENTARIOS Y CUESTIONES Feynman: Es importante darse cuenta que en la física actual no sabemos lo que la energía es 03.0 Le debe interesar al óptico la energía? 03.1 Fuerza por distancia.

Más detalles

Pero qué hacemos cuando no se cumple la normalidad o tenemos muy pocos datos?

Pero qué hacemos cuando no se cumple la normalidad o tenemos muy pocos datos? Capítulo. Métodos no paramétricos Los métodos presentados en los capítulos anteriores, se basaban en el conocimiento de las distribuciones muestrales de las diferencias de porcentajes o promedios, cuando

Más detalles

PRÁCTICA N 2 SISTEMAS DE NUMERACIÓN

PRÁCTICA N 2 SISTEMAS DE NUMERACIÓN PRÁCTICA N 2 SISTEMAS DE NUMERACIÓN Ejercicio 1. Diseñar una planilla EXCEL que tome como dato de entrada un número entero y devuelva la representación en base 2. Testearla con los números 23, 245, 673,

Más detalles

Inferencia Estadística

Inferencia Estadística Universidad Nacional de San Cristóbal de Huamanga Facultad de Ingeniería de Minas, Geología y Civil Departamento Académico de Matemática y Física Área de Estadística Inferencia Estadística Alejandro Guillermo

Más detalles

Algebra Relacional Jos e Ram on Param a Gab ıa

Algebra Relacional Jos e Ram on Param a Gab ıa Álgebra Relacional Ramón Paramá Gabía Capítulo 4 Algebra relacional Ya hemos visto la estructura y las restricciones del modelo relacional, ahora pasamos a abordar la parte del modelo relacional que nos

Más detalles

UNIDAD DIDÁCTICA 7 ANÁLISIS DE ÍTEMS Y BAREMACIÓN DE UN TEST

UNIDAD DIDÁCTICA 7 ANÁLISIS DE ÍTEMS Y BAREMACIÓN DE UN TEST UNIDAD DIDÁCTICA 7 ANÁLISIS DE ÍTEMS Y BAREMACIÓN DE UN TEST 7.1. ANÁLISIS DE LOS ÍTEMS Al comenzar la asignatura ya planteábamos que uno de los principales problemas a los que nos enfrentábamos a la hora

Más detalles

Regletas Cuisenaire. Alumno: Fecha. Regletas Cuisenaire (Números de color)

Regletas Cuisenaire. Alumno: Fecha. Regletas Cuisenaire (Números de color) Regletas Cuisenaire (Números de color) Las regletas de Cuisenaire, también conocidas como números de color, es un material didáctico que se emplea fundamentalmente en la E. Infantil y primer ciclo de E.

Más detalles

ESTIMACION DE INTERVALOS DE CONFIANZA

ESTIMACION DE INTERVALOS DE CONFIANZA pag 3. Prohibida su reproducción ESTIMACION DE INTERVALOS DE CONFIANZA Una muestra permite realizar estimaciones puntuales de los parámetros de la población. Utilizando las propiedades de las distribuciones

Más detalles

Tema 5. Variables aleatorias discretas

Tema 5. Variables aleatorias discretas Tema 5. Variables aleatorias discretas Resumen del tema 5.1. Definición de variable aleatoria discreta 5.1.1. Variables aleatorias Una variable aleatoria es una función que asigna un número a cada suceso

Más detalles

Métodos no paramétricos para la comparación de dos muestras

Métodos no paramétricos para la comparación de dos muestras Investigación Métodos no paramétricos para la comparación de dos muestras Métodos no paramétricos para la comparación de dos muestras Pértega Díaz, S. Unidad de Epidemiología Clínica y Bioestadística.

Más detalles

Examen de la asignatura "Estadística aplicada a las ciencias sociales" Profesor Josu Mezo. 9 de junio de 2008.

Examen de la asignatura Estadística aplicada a las ciencias sociales Profesor Josu Mezo. 9 de junio de 2008. Examen de la asignatura "Estadística aplicada a las ciencias sociales" Profesor Josu Mezo. 9 de junio de 2008. Pregunta nº 1 (5 puntos). En una base de datos sobre los países del mundo se incluyen una

Más detalles

Microsoft Excel 97 y 2000

Microsoft Excel 97 y 2000 Microsoft Excel 97 y 2000 Trucos para la hoja de cálculo de Office Formato a texto y datos 1 Cambio del tamaño y el tipo de letra por defecto Por defecto, Excel siempre sacará el mismo tipo de letra y

Más detalles

Universidad Simón Bolívar CO3121. Probabilidades para Ingenieros. Enero-Marzo 2010 Problemario I

Universidad Simón Bolívar CO3121. Probabilidades para Ingenieros. Enero-Marzo 2010 Problemario I Universidad Simón Bolívar CO3121. Probabilidades para Ingenieros. Enero-Marzo 2010 Problemario I 1. Supongamos que Ω = A B y P (A B) = 0.2. Hallar: (a) El máximo valor posible para P (B), de tal manera

Más detalles