Estadística teórica (aspectos formales y normativos) y aplicada (aplicación a un campo concreto)



Documentos relacionados
Tema 7 DISTRIBUCIONES CONTINUAS DE PROBABILIDAD. X- μ. f(x) = e para - < x < Z 2. . e para - < z <

TEMA 1. ESTADÍSTICA DESCRIPTIVA

T ema 8 ESTIMACIÓN. Conceptos previos. Población y muestra:

Trata de describir y analizar algunos caracteres de los individuos de un grupo dado, sin extraer conclusiones para un grupo mayor.

ESTADISTICA UNIDIMENSIONAL

Preguntas más Frecuentes: Tema 2

INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA.

T ema 6 DISTRIBUCIONES DISCRETAS DE PROBABILIDAD. x 1. x 2 = 1 = 2. x 3 = 3. x 4. Variable aleatoria: definición y tipos:

Tema 10 Cálculo de probabilidades Matemáticas CCSSII 2º Bachillerato 1

Qué es la estadística?

TEMA 6. INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA

TEMA 1. ESTADÍSTICA DESCRIPTIVA

Guía 1 Matemática: Estadística NM 4

UNIDAD 9. PROBABILIDAD Matemáticas II. Ies do Barral.Curso 2017/ Experimentos aleatorios

Intervalo de confianza para µ

ESTADÍSTICA. Estadística: Es una rama de la matemática que comprende Métodos y Técnicas que se emplean

OPCIÓN A EJERCICIO 1_A x 1 0 1

DISTRIBUCIONES DE PROBABILIDAD. DISTRIBUCIÓN DE PROBABILIDAD BINOMIAL.

Tema 6: Distribuciones Muestrales

EL CONTRASTE DE HIPOTESIS: Esquemas y ejemplos

4 Contrastes del Chi 2 de bondad del ajuste

MEDIDAS RESUMEN: Numéricas y Gráficas. Ejemplo.

8. INTERVALOS DE CONFIANZA

Medidas de Tendencia Central

Estadística Descriptiva

Estimador Es la regla o procedimiento, expresado en general por medio de una fórmula, que se utiliza para deducir la estimación.

TEMA IV. 1. Series Numéricas

DISTRIBUCIONES DE PROBABILIDAD.- DISTRIBUCIÓN BINOMIAL (BERNOULLI) DISTRIBUCIÓN NORMAL (GAUSS)

ORGANIZACIÓN DE LOS DATOS.

2.2. Estadísticos de tendencia central

Sobrantes de 2004 (Junio Modelo 5) Soluciones Germán-Jesús Rubio Luna OPCIÓN A

Tema 2. Medidas descriptivas de los datos

Muestreo. Mucho de las acciones y decisiones que se toman están basados en la información de una muestra.

Una sucesión es un conjunto infinito de números ordenados de tal forma que se puede decir cuál es el primero, cuál el segundo, el tercero, etc.

PROGRESIONES ARITMÉTICAS.-

Test de Kolmogorov Smirnov Patricia Kisbye El test chi-cuadrado en el caso continuo

OPCIÓN A EJERCICIO 1_A

Ingeniería Industrial. Curso Departamento de Matemática Aplicada II. Universidad de Sevilla. Lección 5. Series.

) se obtiene un valor específico del estimador que recibe el nombre de estimación del parámetro poblacional θ y lo notaremos por = g ( x 1

Pre-PAES 2016 Media aritmética, moda y mediana.

Importancia de las medidas de tendencia central.

Calificación= (0,4 x Aciertos) - (0,2 x Errores) No debe entregar los enunciados. Sexo

Tema 7 (IV). Aplicaciones de las derivadas (2). Representación gráfica de curvas y fórmula de Taylor

IES Fco Ayala de Granada Sobrantes de 2004 (Modelo 2) Solución Germán-Jesús Rubio Luna OPCIÓN A (A I 2 ) B = A A A = -

14. Técnicas de simulación mediante el método de Montecarlo

OPCIÓN A EJERCICIO 1 (A) -5 0

Estadística Aplicada a las ciencias Sociales Examen Febrero de 2008 segunda semana

3. Distribuciones de probabilidad

ESTADÍSTICA UNIDIMENSIONAL

Probabilidad FENÓMENOS ALEATORIOS

SEMANA 01. CLASE 01. MARTES 04/10/16

Señales en Tiempo Discreto

Análisis de datos en los estudios epidemiológicos II

ESTADÍSTICA DESCRIPTIVA

Repaso...Último Contenidos NM 4

Método de máxima verosimilitud. Curso de Estadística TAE,2005 J.J. Gómez Cadenas

ESTIMACIÓN POR INTERVALOS DE CONFIANZA

GUIAS ÚNICAS DE LABORATORIO DE FÍSICA I ASPECTOS PRELIMINARES INTRODUCCIÓN AL CÁLCULO DE INCERTIDUMBRE EN LAS MEDICIONES

GLOSARIO ESTADÍSTICO. Fuente: Murray R. Spiegel, Estadística,, McGraw Hill.

ESTADÍSTICA DESCRIPTIVA

Ejercicios y Talleres. puedes enviarlos a

INTRODUCCIÓN AL ANÁLISIS DE DATOS FEBRERO 2015 Código asignatura: EXAMEN TIPO TEST MODELO C DURACION: 2 HORAS. Soluciones

DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES ALEATORIAS DISCRETAS

CLAVES DE CORRECCIÓN GUÍA DE EJERCITACIÓN FACTORES Y PRODUCTOS PREGUNTA ALTERNATIVA Nivel

Slide 1. Slide 2. Slide 3. Universidad Diego Portales Facultad de Economía y Negocios. Capítulo 3 Estadística Descriptiva: Métodos Numéricos

Desigualdad de Tchebyshev

TEMA 7. ESTIMACIÓN Estimación puntual. Propiedades deseables de los estimadores Introducción y definiciones Estimadores Insegados

Técnicas experimentales de Física General 1/11

CAPÍTULO I. Conceptos Básicos de Estadística

EJERCICIOS RESUELTOS TEMA 8

Ejercicios y Talleres. puedes enviarlos a

Sucesiones. Se denomina sucesión a una función cuyo dominio es el conjunto de los números naturales.

MEDIDAS DE TENDENCIA CENTRAL

Estadístico. Parámetro

Inferencia Estadística

Licenciatura en Matemáticas Febrero x(1 x) θ 1 I [0,1] (x). (1)

ANEXO B. Se define como Regresión al estudio de la fuerza, consistencia o grado de asociación de la

Número de personas que se forman en una fila en 1 hora Número de águilas que se obtienen al lanzar una moneda 5 veces.

ÁLGEBRA ELEMENTAL. Un término es una expresión algebraica que sólo contiene productos y cocientes (es decir, no aparecen sumas o restas).

INFERENCIA ESTADÍSTICA Y ESTIMACIÓN

SOLUCIONES X X

Objetivos. 1. Inferencia Estadística. INFERENCIA ESTADÍSTICA Tema 3.1: Muestreo. M. Iniesta Universidad de Murcia

SESIÓN 8 DESCRIPCIONES DE UNA RELACIÓN

ESTIMACIÓN. TEMA 5: Estimación puntual I. Propiedades de los estimadores. TEMA 6: Estimación puntual II. Métodos de estimación puntual

Capítulo VARIABLES ALEATORIAS

ESTADÍSTICA. estadística. Recogida de datos. Las muestras de una población. Las variables estadísticas 03/06/2012

TEMA 19 Cálculo de límites de sucesiones*

Sistemas de Ecuaciones Lineales. M. en I. Gerardo Avilés Rosas

Calculamos los vértices del recinto resolviendo las ecuaciones las rectas de dos en dos.

INFERENCIA ESTADÍSTICA CONCEPTOS BÁSICOS

Tema 3: Introducción a la probabilidad. Tema 3: Introducción a la probabilidad. Tema 3: Introducción a la probabilidad. 3.

Calificación= (0,4 x Aciertos) - (0,2 x Errores) SOLUCIONES

3Soluciones a los ejercicios y problemas PÁGINA 79

EXAMEN DE MATEMÁTICAS APLICADAS I Temas 12 y 13

Técnicas Cuantitativas II Muestra y Estadísticos Muestrales. TC II Muestra y Estadísticos Muestrales 1 / 20

MEDIDAS DE TENDENCIA CENTRAL. _ xi

PROCESO DE POISSON Rosario Romera Febrero 2009

1 x 1 0,1666. sabiendo que 506, 508, 499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506, 502, 509, 496.

PRACTICA N 05 DETERMINACIÓN DEL TAMAÑO DE PARTÍCULA

PROBABILIDAD. El espacio muestral de un experimento aleatorio es el conjunto de todos los resultados posibles que pueden producirse.

Transcripción:

TEMA 1 - CONCEPTOS BÁSICOS Y ORGANIZACIÓN DE DATOS Estadística teórica (aspectos formales y ormativos) y aplicada (aplicació a u campo cocreto) Estadística aplicada o aálisis de datos: Niveles de medida 1.-omial 2.-ordial 3.-de itervalo 4.-de razó Método cietífico: dar razó sistemática, empírica y experimetal, de los feómeos Es sistemático porque tiee etapas defiidas Es replicable porque los datos obteidos puede ser replicados o refutados 1.- Defiició de problemas 2.- Deducció de hipótesis cotrastables 3.- Establecimieto de u procedimieto de recogida de datos 4.- Aálisis de datos 5.- Discusió de dichos resultados y búsqueda de coclusioes 6.- Elaboració del iforme de la ivestigació Estadística: se ocupa de sistematizació, recogida, ordeació y presetació de los datos referetes a u feómeo que preseta variabilidad o icertidumbre para su estudio metódico, co objeto de hacer previsioes sobre los mismos, tomar decisioes u obteer coclusioes. Estadística descriptiva Se orgaiza y resume cojutos de observacioes procedetes de ua muestra. Cuatitativa (tablas, gráficos, valores uméricos) Co 1 variable: Ídices para valores más habituales (ídices de tedecia cetral) Hasta que puto so similares o diferetes etre si (estadísticos de variabilidad) Gado e que las observacioes se represeta por ecima o debajo de la tedecia cetral (estadísticos de asimetría) Co 2 variables: Relacioar variables etre sí (coeficietes de correlació) Predecir el valor de ua variable e fució de otra (ecuacioes de regresió) Estadística Iferecial Iferecias a cerca de ua població basádose e datos obteidos de ua muestra. Se utiliza el cálculo de probabilidades. E ua ivestigació se pretede coocer u parámetro (ua característica) de ua població, y como es demasiado amplia, se realiza u muestreo co el que se obtiee ua muestra de elemetos que la represeta. Se estudia la característica deseada e la muestra mediate estadísticos que estima los parámetros de la població. Queremos coocer u parámetro porcetaje de idividuos que respode si (y como o es posible por lo extesa de la població) coocemos la estimació de ese parámetro el estadístico o porcetaje de la muestra que respode si. POBLACION cojuto de todos los elemetos que cumple ua determiada característica objeto de estudio. MUESTRA subcojuto cualquiera de ua població. Solo sirve para el total de la població si es represetativa. PARÁMETRO propiedad descriptiva (medida) de ua població ESTADÍSTICO propiedad descriptiva (medida) de ua muestra 1

Para que ua muestra sea represetativa se debe utilizar métodos de muestreo probabilística (ua muestra probabilística se elige mediate reglas matemáticas y ua muestra o probabilística o, ej. Muestras de coveiecia o icidetal (coformada por persoas de fácil acceso para el ivestigador, o la bola de ieve (u elemeto lleva a otro y así sucesivamete) MEDICIÓN Y ESCALAS DE MEDIDAS Medició: Proceso por el cual se asiga úmeros a objetos o características segú determiadas reglas Objetos físicos medició directa Variables o directamete observables?? Característica: cualquier propiedad de u objeto Modalidad: formas e las que se preseta la característica (se asiga u º a cada ua de las modalidades de ua característica) Se utiliza diferetes escalas (cojuto de reglas o modelos desarrollados para la asigació de º a los valores de las variables) e fució de la variable a medir (timidez e clase, tiempo e realizar ua tarea, acioalidades de u cojuto, etc.) Segú Steves (1946) Cuatro tipos de escalas de medidas: 1) Nomial (igualdad o desigualdad, etre 2 modalidades) 2) Ordial (además, se puede establecer u orde) 3) De itervalo (además, se usa ua uidad y tiee setido las diferecias) 4) De razó (además, se puede comparar dos medidas mediate u cociete) Escala omial Asigació arbitraria de úmeros o símbolos a cada ua de las diferetes modalidades de la característica. Relació de igualdad o desigualdad, que implica la perteecia o o a ua categoría determiada. Ej.: Religió (practicates, o practicates) Escala Ordial Asigació (o arbitraria, sio atediedo el orde existete etre las categorías) de úmeros a objetos para idicar la extesió relativa e que se posee ua característica. Se clasifica a las persoas, objetos o evetos e ua posició co relació a cierto atributo, pero si idicar la distacia etre las posicioes. Solo se idica el orde. Permite la idetificació, difereciació y el establecimieto de relacioes de tipo mayor que o meor que. Ej.: Estatus (alto, medio, bajo) Escala de itervalo Ordea los objetos o evetos segú la magitud del atributo que preseta y provee itervalos etre las uidades de medida. Orige arbitrario y o refleja la ausecia de la magitud que estamos midiedo. Se puede saber si u objeto es igual o diferete, si posee e mayor o e meor grado la característica de iterés y estos úmeros se puede restar y sumar y las diferecias etre esos úmeros se puede multiplicar y dividir. Su característica es la existecia de ua uidad de medició comú y costate, que permite asigar u º real a todos los pares de objetos del cojuto ordeado. Ej. Iteligecia (0,90, 160, etc.) Escala de razó Los úmeros asigados admite como válidas las relacioes de igualdad-desigualdad, orde, suma, resta, multiplicació y divisió. Tiee todas las características de la medida de itervalo y se suma que se le puede asigar u puto de orige verdadero, u valor absoluto (valor cero= ausecia de la magitud). Ej.: Altura NOMINAL Los úmeros idetifica y clasifica objetos Igual-desigual Sexo, estado civil, raza, ORDINAL +, los úmeros idica las posicioes relativas de los objetos mayor que- igual que Grado de satisfacció, dureza INTERVALO +, hay ua uidad de medició comú +, igualdad-desigualdad de diferecias Temperatura, iteligecia RAZÓN +, el puto cero es absoluto. +, igualdad-desigualdad de razoes Logitud, peso, altura 2

VARIABLE: CLASIFICACIÓN Y NOTACIÓN Característica co 1 sola modalidad costate Variable: Represetació umérica de ua característica que preseta más de ua modalidad (valor) de u cojuto determiado. Tres tipos: 1) Cualitativa (omiales) E fució del úmero de categorías o modalidades: Variable dicotómica: 2 categorías (Ej.: el sexo) Variable politómica: Más de 2 categorías (Ej.: acioalidades) 2) Cuasicuatitativa (ordiales) 3) Cuatitativa (de itervalo y de razó) E fució de los valores uméricos que puede asigarse: Variable cotiua: valores e cualquier puto de la escala (Ej.: peso) Variable discreta: valores aislados, si valores itermedios (Ej.: º de hijos) Variable idepediete suceso causa de otro Variable depediete efectos de la variable idepediete Variable extraña las que ifluye sobre la variable idepediete, pero que o se estudia. Notació de la variable Letras latias mayúsculas, co u subídice i Xi, siedo i=1, 2, 3,, (siedo, el úmero de elemetos que compoe la muestra) DISTRIBUCIÓN DE FRECUENCIAS Los datos co los que se trabaja puede proveir de la medició directa de las variables o de frecuecias que proviee de u proceso de coteo. Normalmete se orgaiza la iformació mediate ua distribució de frecuecias (represetació de la relació etre u cojuto de medidas exhaustivas y mutuamete excluyetes y la frecuecia de cada ua de ellas) Orgaiza los datos Da iformació para la represetació gráfica Facilita los cálculos para estadísticos muestrales Frecuecia absoluta (i) úmero de observacioes e cada categoría Frecuecia relativa o proporció de cada categoría (pi) se obtiee dividiedo la (i), etre el úmero total de observacioes. E porcetaje (Pi) multiplicado cada proporció por 100. Variable cualitativa (omial) X i pi Pi Hombres 24 0,6 60 Mujeres 16 0,4 40 = 40 1 100 Variable cuasicuatitativa (ordiales) Igual pero respetado el orde predetermiado. Y se añade la frecuecia absoluta acumulada (a), frecuecia relativa acumulada o proporció acumulada (pa) y el porcetaje acumulado (Pa), para cada ua de las categorías o modalidades de respuesta, y se obtiee acumulado (sumado) desde la categoría de meor valor de la variable a la de mayor valor, las frecuecias absolutas, proporcioes o porcetajes, de cada categoría de respuesta. 3

X i pi Pi a pa Pa Primaria 13 0,33 33 13 0,33 33 ESO 11 0,28 28 24 0,60 60 FP 7 0,18 18 31 0,78 78 Diplomatura 4 0,10 10 35 0,88 88 Liceciatura 5 0,13 13 40 1,00 100 = 40 1,00 100 Frecuecia absoluta (i) Nº de veces que se repite cada uo de los valores de ua variable. La suma de todas las frecuecias absolutas represeta el total de la muestra () Frecuecia relativa o proporció de cada categoría (pi) Cociete etre la frecuecia absoluta de cada variable (i) y Nº total de observacioes () (pi)= (i) / () Porcetaje (Pi) Valor de la frecuecia relativa multiplicado por 100. (Pi)= (pi).100 Frecuecia absoluta acumulada (a) Nº de veces que se repite cada modalidad o cualquiera de las modalidades iferiores Frecuecia relativa acumulada o proporció acumulada (pa) Cociete etre la frecuecia absoluta acumulada de cada clase y total de observacioes () (pa)= (a) / () Porcetaje acumulado (Pa), Valor de la frecuecia relativa acumulada multiplicado por 100. (Pa)= (pa).100 Variable cuatitativa (de itervalo y de orde) 1) Nº de valores de la variable reducido (Ej.: º de hijos) Igual que co variables ordiales 2) Nº de valores amplio (Ej.: edad, altura) agrupar e itervalos (grupos de valores cosecutivos) al establecer itervalos siempre se pierde iformació y se puede optar por la amplitud que más se ajuste al estudio (equilibrio etre la precisió que se ecesite y la maejabilidad de los datos. Limites de los itervalos: hay que tratar de que el límite superior exacto de u itervalo coicida co el límite iferior exacto del siguiete. Cuado o es así, se los llama: límites iformados o aparetes (Ej.: edades etre 26-35, debe ser etre 25,5-35,5) Limites exactos= valor iformado+- 0,5 x I (siedo I la uidad del istrumeto de medida) Puto medio: semisuma ((a+b)/2) del límite superior e iferior del itervalo de los límites exactos o de los aparetes Itervalo abierto: que o tiee límite iferior o superior (76 años o más) Itervalo cada uo de los grupos de valores que ocupa ua fila e ua distribució de frecuecia. Límites aparetes, virtuales o iformados valores mayor y meor de cada itervalo, teiedo e cueta el ivel de precisió del istrumeto de medida. Límites reales o exactos valores máximo y míimo que tedría cada itervalo si el istrumeto de medida fuera exacto. Puto medio del itervalo semisuma de los límites exactos o de los límites aparete. Amplitud del itervalo diferecia etre el límite exacto superior y el límite exacto iferior 4

REPRESENTACIONES GRÁFICAS Eje vertical ordeada (o eje de las Y) Eje horizotal abscisa (o eje de las X) 1º cuadrate: +x, +y 2º cuadrate: -x, +y 3º cuadrate: -x, -y 4º cuadrate: +x, -y a) Diagrama de barras (variables omiales, ordiales y cuatitativas discretas) Abscisa (X) valores de la variable Ordeada (Y) frecuecias E las ordiales y cuatitativas discretas, se puede utilizar tambié u diagrama de barras acumulativo. b) Diagrama de sectores (variables cualitativas (omial) y cuasicuatitativas (ordial)) Forma de círculo, cuya superficie es proporcioal a la frecuecia de la modalidad correspodiete. El águlo total represeta el º total de observacioes y para determiar el águlo de los sectores se multiplica la frecuecia relativa (proporció) por 360 c) Pictograma (variables cualitativas (omial)) Dibujos alusivos cuya área es proporcioal a la frecuecia de la modalidad que represeta. d) Histograma (variables cuatitativas cotiuas co datos agrupados e itervalos) Abscisa (X) itervalos co limites exactos (todos co la misma amplitud) o los putos medios y sobre ellos se levata rectágulos cuyas áreas sea proporcioales a la frecuecia correspodiete. Ordeada (Y) frecuecias e) Polígoo de frecuecias (variables discretas y cotiuas) Se ue los extremos superiores de lo que sería las barras (si se hubiera hecho u diagrama de barras) o de u histograma e los putos medios de las bases superiores (variable cotiua) REPRESENTACIONES GRÁFICAS DE DOS VARIABLES a) Diagrama de barras cojuto (al meos ua de las dos variables es cualitativa (omial)) Cuado las dos so cualitativas coviee orgaizar los datos e ua tabla de doble etrada. X Hombre Mujer Casado 12 12 24 Divorciado 4 2 6 Soltero 4 2 6 Viudo 4 0 4 24 16 40 Debe represetarse e el mismo gráfico ambas situacioes. Abscisa (X) estados civiles Ordeada (Y) porcetaje Es importate que el º de sujetos sea el mismo para utilizar las frecuecias absolutas, de lo cotrario es recomedable utilizar las frecuecias relativas o porcetajes. b) Diagramas de dispersió o ube de putos (dos variables cuatitativas) Dado idea de la relació que existe etre ambas variables. Abscisa (X) ua variable Ordeada (Y) la otra Para cada par de datos se localiza la itersecció y se marca co u puto Se puede establecer relacioes lieales etre variables. 5

PROPIEDADES DE LA DISTRIBUCIÓN DE FRECUENCIAS Tedecia geeral: Lugar dode se cetra ua distribució particular e la escala de valores. Variabilidad: Grado de cocetració de las observacioes e toro al promedio. Homogéea (poca variabilidad) si los valores estás cercaos al promedio. Heterogéea (mucha variabilidad) si los valores se dispersa mucho co respecto al promedio. Asimetría o sesgo: Grado e que los datos se reparte equilibradamete por ecima y por debajo de la tedecia geeral. Distribució simétrica: cuado al dividirla e dos a la altura de la media, las dos mitades se superpoe. Asimetría positiva: cuado la mayor cocetració está e la parte baja de la escala (test difíciles) Asimetría egativa: cuado la mayor cocetració está e la parte alta de la escala (test fáciles) 6

TEMA 2 MEDIDAS DE TENDENCIA CENTRAL Y POSICIÓN MEDIDAS DE TENDENCIA CENTRAL La tedecia cetral de ua distribució de frecuecias se puede resumir e u valor o putuació, las medidas o ídices de putuació de tedecia cetral idica sobre que putuació se cocetra las observacioes. Media aritmética Mediaa Moda. Media aritmética (X) Promedio o medio más coocido y usado. Valor cetral alrededor del cual está la mayoría de las observacioes. Solo para variables cuatitativas. _ X= suma de todos los valores (X1, X2, X3 +X) = E X i = º total de observacioes Cuado el º de observacioes es elevado: A partir de las Frecuecias absolutas ( i ): _ X= E i X i = E i X i E i = º total de observacioes X i = el valor i e la variable X (o puto medio del itervalo) i = frecuecia absoluta del valor o itervalo i. o de las Frecuecias relativas (p i ): _ X= E p i X i X i = el valor i e la variable X (o puto medio del itervalo) p i = frecuecia relativa o proporció de observacioes del valor o itervalo i. Propiedades matemáticas: 1) La suma de las desviacioes de cada valor co respecto a su media es igual a cero. _ E(X i -X)=0 i=1 2) Si a los valores de la variable X le aplicamos la siguiete trasformació lieal: Y i =bx i + a, la media de los uevos valores Y Y = bx + a Límites: a) Cuado los datos está agrupados e itervalos, la media o se puede calcular si el itervalo máximo o tiee límites superior o el itervalo míimo o tiee límite iferior b) Sesible a valores extremos (o se recomieda e distribucioes asimétricas) Mediaa (Md): Buea para represetacioes asimétricas. No es sesible a valores extremos porque e su cálculo o etra todos los valores (como e la media aritmética) sio úicamete los que ocupa las posicioes cetrales. E todo tipo de variables, meos e las cualitativas. Valor de la variable que divide la distribució de frecuecias e dos partes iguales, coteiedo u 50% de las observacioes. 1

Se ordea las putuacioes de mayor a meor, si es º impar, la mediaa es la observació que ocupa la posició cetral; si es º par la mediaa es la media aritmética de los dos valores cetrales. Cuado el º de observacioes es elevado: Itervalo e el que se ecuetra la mediaa itervalo crítico y correspode co aquel e el que la frecuecia absoluta es igual o superior a /2. _ d Md= L i + 2. I c L i = Limite exacto iferior del itervalo crítico = º de observacioes d =Frecuecia absoluta acumulada por debajo del itervalo crítico c = Frecuecia del itervalo crítico I = Amplitud del itervalo crítico Se asume que la distribució de las frecuecias detro de cada itervalo es homogéea. Ej.: sabemos que el º de observacioes totales es de 50 y por tato la media dividirá e 25 sujetos a esta observació, si el límite superior del itervalo crítico es de 22, falta 3 observacioes para llegar al 50% e el que se ecuetra la mediaa. Asumimos que estas putuacioes se reparte homogéeamete detro del itervalo. Si los datos o está ordeados e itervalos: Se geera u caso particular e el que I (amplitud del itervalo crítico) es =1 No se puede utilizar cuado el itervalo dode se ecuetra la mediaa es abierto. Moda (Mo): Se puede utilizar e variables cuatitativas y cualitativas. Cualitativa la moda es la categoría co la máxima frecuecia. Cuatitativa si itervalos la moda es el valor co mayor frecuecia absoluta ( i ) Cuatitativa co itervalos se localiza el itervalo modal que es el itervalo co la frecuecia máxima y la moda es el puto medio de dicho itervalo. Si u úico valor co la frecuecia máxima, ua moda uimodal So dos o más valores co la frecuecia máxima bimodal, trimodal, etc. Características: a) Cálculo secillo y de fácil iterpretació. b) Cuado la variable es cuatitativa co itervalo, la moda o se puede calcular si el itervalo modal está e u itervalo abierto. Elecció de ua medida de tedecia cetral Se recomieda la media aritmética (se desacoseja cuado la distribució de las frecuecias es muy asimétrica) y o se puede cuado el ivel de medida es omial u ordial i e datos agrupados co itervalos abiertos e sus extremos. La siguiete es la mediaa, resistete a los valores extremos, si se puede co iveles ordiales y e datos agrupados co itervalos abiertos. No e variables omiales, cuado la mediaa se ecuetra e el itervalo abierto. Moda, o se puede cuado la frecuecia sea amodal o el itervalo modal coicida co el itervalo abierto. 2

CUALITATIVA (omial) MODA CUASICUANTITATIVA (ordial) MODA, MEDIANA CUANTITATIVA ((de itervalo y de razó) MODA, MEDIANA Y MEDIA ARITMÉTICA (CUANTITATIVA, SIMETRICA Y UNIMODAL MEDIA, MEDIANA Y MODA= VALOR) MEDIDAS DE POSICIÓN Medidas o ídices de posició o cuatiles: Iforma acerca de la posició relativa de u sujeto co respecto a su grupo de referecia, detro de la distribució de frecuecias de la variable (situació de ua putuació co respecto a u grupo, utilizado a éste como referecia). Dividir la distribució e u º de partes o seccioes iguales etre sí e cuato al º de observacioes (la mediaa divide e dos partes, 50%) depediedo de cuatos valores utilicemos para dividir la distribució: Percetiles Cuarteles Deciles Percetiles (o cetiles) k (P k ) 99 valores que divide e 100 partes iguales la distribució de frecuecias. Ej.: percetil 50 (P 50 ): Divide a la distribució de frecuecia e 50%, igual que la mediaa. P 50 = Md Cálculo: Frecuecias absolutas ( i ) e itervalos Itervalo dode está el percetil k itervalo crítico Itervalo crítico =frecuecia absoluta acumulada ( a ) es igual o superior a.k 100.k _ d P k =L i + 100. I c d: Frecuecia absoluta acumulada por debajo del itervalo crítico c : Frecuecia absoluta del itervalo crítico L i : Límite iferior exacto del itervalo crítico I: Amplitud del itervalo Datos agrupados si itervalos: Misma formula co (I=0) Este método es para calcular el valor de cualquier de los 99 valores (valor de X, dado k) Para calcular que posició ocupa u valor de la variable X i (valor de k, dado X) (P k -L i ). c + d k= I. 100 d: Frecuecia absoluta acumulada por debajo del itervalo crítico c : Frecuecia absoluta del itervalo crítico L i : Límite iferior exacto del itervalo crítico I: Amplitud del itervalo Si el resultado es co decimales se toma la catidad etera más próxima. 3

Cuartiles (Q 1 ) (Q 2 ) (Q 3 ) 3 valores que divide e 4 partes iguales la distribució de frecuecias: Primer cuartil (Q 1 ) por debajo 25%, por ecima 75% Q 1= P 25 Segudo cuartil (Q 2 ) por debajo 50%, por ecima 50% Q 2 = P 50 = Md Tercer cuartil (Q 3 ) por debajo 75%, por ecima 25% Q 3= P 75 Igual forma de cálculo que los percetiles. Se utiliza para costruir ídices para el estudio de la variabilidad de ua distribució de frecuecias. Deciles (D 1 ) (D 2 ) (D 3 ) (D 4 ) (D 5 ) (D 6 ) (D 7 ) (D 8 ) (D 9 ) 9 valores que divide e 10 partes iguales la distribució de frecuecias: Primer decil (D 1 ) por debajo 10%, por ecima 90% Primer decil (D 2 ) por debajo 20%, por ecima 80% Primer decil (D 3 ) por debajo 30%, por ecima 70% Primer decil (D 9 ) por debajo 90%, por ecima 10% Igual forma de cálculo que los percetiles. 4

TEMA 3 MEDIDAS DE VARIABILIDAD Y ASIMETRÍA Dos uevas propiedades de ua distribució de frecuecias: Variedad o dispersió: grado e que las putuacioes se asemeja o diferecia etre sí, o se aproxima o se aleja de ua medida de tedecia cetral como la media aritmética. Ídices de medida: Amplitud total Variaza Desviació típica Amplitud semi- itercuartil Coeficiete de covariació: para comparar distitas distribucioes de frecuecias e térmios de su variabilidad Asimetría o sesgo de la distribució: Ídice de asimetría de Pearso: resultado umérico sobre el grado y tipo de asimetría de la distribució. Putuacioes directas: Para comparar a los sujetos etre sí y e diferetes variables. Putacioes difereciales Putacioes típicas Medidas de variabilidad Variabilidad o dispersió: grado de variació e u cojuto de putuacioes. Putuacioes muy próximas etre sí (cocetradas alrededor de la media) poca dispersió; putuacioes alejadas etre sí más dispersió = mayor variabilidad. Cuata meos variabilidad más homogéea es la muestra. Cuata más variabilidad más heterogéea es la muestra. Para cuatificarlo medidas o ídices de variabilidad: Amplitud total o de rago y la amplitud semi- itercuartil: Los que mide el grado e que las putuacioes se asemeja o diferecia etre si Variaza y desviació típica: Los que mide la dispersió co respecto a algua medida de tedecia cetral (media aritmética) Amplitud total (rago o recorrido) (A T ): Distacia que hay e la escala umérica etre los valores que represeta la putuació máxima (límite exacto superior del itervalo máximo) y la putuació míima (límite exacto iferior del itervalo míimo): A T = X máx X mí EJ. : A T = X máx X mí 9,5 4,5=5 X i i 5 135 6 66 7 45 8 36 9 18 Σ 300 Icoveietes: sesible úicamete a los calores extremos, por lo que o captura la poca o mucha dispersió etre los restates valores. 1

Variaza y desviació típica: Distacia etre las putuacioes y u valor cetral (media aritmética) Poca variabilidad: medidas muy cercaa a la media; mucha variabilidad: medidas alejadas de la media. _ Promedio de las desviacioes o diferecias de cada putuació respecto a su media (X d ): X d : Σ d i = Σ (X i X) Como se vio e la primera propiedad matemática de la media, el sumatorio del umerador siempre es igual a cero (Σ (X i X)), por lo que o sería ua buea medida para la variabilidad. Para poder utilizar u ídice co estas desviacioes evitado el cero: 1. Desviació media (DM): calcular el valor absoluto de cada desviació ates de realizar la suma: DM= (X 1 X) + (X 2 X) + + ( X X) = Σ(X i - X) 2 Se usa muy poco porque es poco maejable matemáticamete. 2. Variaza (S 2 x): otra alterativa para el problema del sigo es el promedio de los cuadrados de las desviacioes de las putuacioes respecto a la media S 2 x= (X 1 X) 2 + (X 2 X) 2 + + ( X X) 2 = S 2 x = Σ (X i - X) 2 Ó _ S 2 X= Σ X 2 i _ X 2 Primero de eleva al cuadrado las diferecias y luego se obtiee el promedio de esas desviacioes al cuadrado Datos e frecuecias agrupadas o si agrupar e itervalos: S 2 x = Σ i (X i - X) 2 = Σ i (X i - X) 2 Σ i Ó _ S 2 2 X= Σ i X i _ X 2 2 = Σ i X i _ X 2 Σ i = º total de observacioes X i = valor de i e la variable X o el puto medio del itervalo i = es la frecuecia absoluta del valor o itervalo i Datos e frecuecias relativas: _ S 2 2 X= Σ p i X i _ X 2 pi= frecuecia relativa o proporció de observacioes del valor o del itervalo i 2

3. La variaza al trabajar co º al cuadrado siempre es positiva que se expresa e las uidades de la variable al cuadrado, para lograr ua medida de dispersió e las mismas uidades que la variable, se calcula la raíz cuadrada de la variaza desviació típica. S x = Σ (X i - X) 2 La desviació típica se utiliza más que la variaza porque se expresa e las mismas uidades de medida que la variable objeto de estudio. Propiedades de la variaza y de la desviació típica.- Usa todas las putuacioes observadas.- Mide la variabilidad respecto a la media aritmética, solo debe utilizarse si se usa la media como medida de tedecia cetral..- Iguales o mayores (positivas) que cero. = 0 si todas las putuacioes so iguales etre sí (o hay variabilidad o dispersió). Nuca egativas..- Si a ua variable X se le suma o se le resta ua costate a, la variaza y la desviació típica de la variable origial o se ve afectadas, sigue siedo las mismas. Pero cuado multiplicamos los valores de las X por ua costate b, la variaza queda multiplicada por la costate b 2 y la desviació típica por b. 4. Cuasivariaza: se divide por - 1 e lugar de como e la variaza _ S 2-1= Σ (X i X) 2-1 5. Cuasi desviació típica: raíz cuadrada de la cuasivariaza S 2-1= Σ (X i X) 2-1 Coeficiete de variació: Comparació del grado de variabilidad o dispersió etre dos cojutos de putuacioes e ua misma o distitas variables. Por lo geeral, las variables se mide e uidades distitas y es ecesario defiir u ídice de variabilidad relativa que o depeda de las uidades de medida. CV = S x. 100 X Está defiido para variables co la media X > 0 y es recomedable que su resultado se acompañe de la media y de la desviació típica de la distribució a partir de las que se ha calculado. Solo se puede utilizar cuado la media de ambos grupos es la misma. Amplitud semi- itercuartil: Variaza, desviació típica, media aritmética Estadísticos para estudiar la variabilidad y la tedecia cetral. Distribució asimétrica mediaa y amplitud semi- itercuartil Distacia media etre el tercer y el primer cuartil Q = Q 3 Q 1 = P 75 P 25 2 2 Iforma sobre la variabilidad del 50 % de las putuacioes, precisamete las compredidas etre el percetil 25 y el 75 de la distribució. INDICE DE ASIMETRÍA DE PEARSON 3

Asimetría: Grado e que las putuacioes se reparte por debajo y por ecima de la medida de tedecia cetral mediate la represetació gráfica (positiva o egativa) Ídice umérico que lo cuatifica: Ídice de asimetría de Pearso: relació etre la media (X) y la moda (Mo) A s = X Mo S x Ídice adimesioal (o tiee uidades de medida) que se aplica a distribucioes uimodales. Distribució simétrica Media y Moda iguales y se aula A s = 0 Asimetría positiva Media mayor que la Moda A s > 0 Asimetría egativa Media meor que la Moda A s < 0 PUNTUACIONES TÍPICAS Las putuacioes directas (test, etc.) os ofrece poca iformació, coocida ua putuació directa o sabemos si se trata de u valor alto o bajo porque depede del promedio del grupo. Putuació diferecial (x i ) permite comparar las putuacioes de u sujeto e dos variables distitas. A ua putuació directa X le restamos la media de su grupo. x i = X i X Esta iformació os permite saber si la putuació coicide co la media de su grupo, es iferior o superior Propiedades: a) Su media es cero: x = 0 b) La variaza de las putuacioes difereciales es = a la variaza de las putuacioes directas Putuació típica (Z x ) permite comparar las putuacioes de u sujeto e dos variables distitas y comparar dos sujetos distitos e dos variables distitas. Al proceso de obteerlas se le llama tipificació. Idica el º de desviacioes típicas que se aparta de la media de ua determiada putuació. Z x = x = X X S x S x Propiedades: a) Su media es cero: Z = 0 b) Su variaza es 1 Refleja las relacioes etre las putuacioes co idepedecia de la uidad de medida. Permite comparacioes etre distitos grupos y etre distitas variables. 4

TEMA 4 ANÁLISIS CONJUNTO DE DOS VARIABLES Dos variables co dos medidas c/u, e ua muestra de 100 sujetos. Se obtiee ua lista de 4 columas y 100 filas Asociació o relació de dos variables Dos variables está relacioadas etre sí cuado ciertos valores de ua de las variables, se asocia co ciertos valores de la otra variable. ASOCIACION ENTRE DOS VARIABLEA CUALITATIVAS Variable cualitativa se mide e escala omial o de clasificació. Puede ser dicotómicas (dos categorías) O politómicas (más de dos categorías) Tambié so cualitativas variables que preseta u mayor ivel de medida 8itervalos o razó) pero ha sido categorizadas. Tabla de cotigecia co los datos de dos variables cualitativas para todos los sujetos de ua muestra. Frecuecias observadas o empíricas ( e ) e X e Y Que se represeta gráficamete e u diagrama de barras: Para poder saber si existe o o relació etre las variables, se utiliza el estadístico X 2, asociado a ua distribució de probabilidad (Chi cuadrado x 2 ). X 2 se defie e fució de las frecuecias empíricas ( e ) y de las frecuecias teóricas ( t ) que se calcula asumiedo que ambas variables so idepedietes o o relacioadas y so el producto del total de su fila por el total de su columa, dividido por la frecuecia total. Frecuecia teórica ( t ) = Total fila X Total columa N 1

Ej.: Y luego se elabora la diferecia etre las frecuecias empíricas ( e ) y las frecuecias teóricas ( t ) Que siempre tiee que dar cero. El valor -, os idica ua relació egativa. Cálculo del estadístico X 2 Σ ( e t ) 2 t Icoveietes: difícil iterpretació, ya que descoocemos su límite superior. Sabemos que tiee valor cero cuado o hay relació etre las variables (cuado las frecuecias empíricas y teóricas so iguales). Para resolver este problema se utiliza el ídice o Coeficiete de Cotigecia, C que toma valores 0 <= C < 1 C = X 2 X 2 + El valor obteido se puede comparar, dado que la tabla de cotigecia tiee igual º de filas que de columa (K) co ua C máximo defiido como: C máx = K - 1 K Ídem co dos variables cualitativas co más de dos categorías Característica del coeficiete C: 1. Valores mayores, iguales a 0y meores que 1. 0 cuado X 2 = 0 dos variables si relació (Frec. Empíricas = Frec. Teóricas) 1 cuado = 0 o hay observacioes (uca se puede dar) 2. A mayor valor de C, mayor es la relació etre las dos variables y al revés. Para usar el valor de C para comparar la relació etre dos variables de diferetes ivestigacioes es ecesario que tega el mismo º de filas, de columas y de datos. 3. Fudametar la causalidad e u coeficiete de cotigecia ( hay variables que se relacioa etre sí porque existe otra variable ajea que tiee ua relació clara co ambas 4. Se puede estimar u valor máximo de C si la tabla de cotigecia tiee el mismo º de filas que de columas. 2

CORRELACIÓN ENTRE DOS VARIABLES CUANTITATIVAS Requisitos: Muestra grade Represetacioes gráficas: Diagrama de depresió o ube de putos (se puede apreciar si existe ua relació lieal etre X e Y) Ídices para cuatificar la relació lieal: Covariaza: Variació cojuta de dos variables Cov (X, Y) ó S XY. Xi= Valor de la variable X e el caso i Yi= Valor de la variable Y e el caso i X = Media de la variable X Y = Media de la variable Y = úmero de casos de la muestra El sigo + - idica si la relació etre ambas variables es directa o iversa. Relació lieal directa mayores valores de X, mayores valores de Y; meores valores de X, meores valores de Y (y viceversa) (+/+; - /- ) Relació lieal iversa mayores valores de X, meores valores de Y; meores valores de X, mayores valores de Y (+/- ; - /+) Problemas (Igual que el coeficiete X2, e las cualitativas) Se descooce su rago, sus valores máximos y míimos, para evitar este problema Coeficiete de correlació de Pearso (r XY ) r XY = S XY S X S Y SX= Desviació típica de la variable X SY= Desviació típica de la variable Y SXY= Covariaza etre X e Y Cociete etre la covariaza etre X e Y, y el producto de la desviació típica de X y de la desviació típica de Y. Propiedades:.- Solo toma valores compredidos etre - 1 y 1. Cero: cuado o exista relació etre X e Y..- r XY = +_ 1 si ua variable es ua trasformació lieal de otra Fórmula alterativa: r XY = Σ (XY) ΣXΣY ΣX 2 (ΣX) 2 ΣY 2 (ΣY) 2 Para iterpretar los resultados hay que teer e cueta: a) Valor absoluto a mayor valor absoluto, relació lieal etre las dos variables más fuerte. b) Sigo positivo (+/+, - /- ) relació directa egativo (+/-, - /+) relació iversa 3

Problemas: a) Solo detecta relacioes lieales, u coeficiete de correlació lieal cercao a cero idica que o existe correlació, pero puede existir otro tipo de relacioes de carácter o lieal (relació curvilíea) b) No tiee ua comparació directa etre resultados de estudios diferetes rxy= 0, o hay relació y r XY =+_ 1, relació directa. c) Dificultad para fudametar la causalidad, cuado existe u coeficiete de correlació elevado etre dos variables, o se puede afirmar que ua variable sea la causate de la otra. REGRESIÓN LINEAL Recta de regresió, para efectuar proósticos de los valores de ua variable a partir de la otra variable Y=a + bx (b, pediete; a, ordeada) Putuacioes e Y a partir de putuacioes e X b= Σ (XY) ΣXΣY ΣX 2 (ΣX) 2 a= Y bx A las putuacioes de Y obteidas a través de esta ecuació Putuacioes proosticadas Propiedades: a) La media de los errores es cero. b) La media de las putuacioes proosticadas coicide co la media de las putuacioes reales de Y c) La variaza de las putuacioes e Y es igual a la suma de la variaza de los proósticos, más la variaza de los errores 4

TEMA 5 NOCIONES BÁSICAS DE PROBABILIDAD CONCEPTOS Experimeto aleatorio: Proceso que puede repetirse idefiidamete e las mismas codicioes, cuyo resultado o se puede predecir co certeza. Obteemos u resultado (experimeto) aleatorio (porque iterviee el azar) a) Todos los resultados posibles so coocidos co aterioridad b) No se puede predecir co certeza cuál será el resultado que se obtedrá c) Puede repetirse cuatas veces se desee. Espacio muestral (E) o suceso seguro: cojuto de todos los resultados posibles. Sucesos (A, B, ): Resultados del experimeto aleatorio o subcojutos del espacio muestral. Elemetales (simple) u solo resultado del espacio muestral Compuestos Dos o más resultados del espacio muestral Suceso Imposible (o) o cojuto vacío: Suceso que o puede ocurrir uca Operacioes co sucesos a) Uió AUB Subcojuto de E formado por los elemetos que perteece a A y perteece a B o a ambos a la vez. b) Itersecció A B Subcojuto de E formado solamete por los elemetos perteecietes a A y a B. Cuado la itersecció o cotiee igú elemeto, los sucesos so icompatibles o excluyetes, o puede verificarse simultáeamete. c) Complemetario A Subcojuto de E formado por los elemetos que o perteece al suceso A. se represeta co el Diagrama de Ve. DEFINICION DE PROBABILIDAD Calcular la probabilidad de la ocurrecia de u suceso. Cero Suceso imposible, Uo Suceso seguro, otro suceso etre 0 y 1 Clásica (Laplace): la probabilidad de u suceso es igual al cociete etre el º de casos favorables de que ocurra ese suceso y el º de casos posibles, e el supuesto de que todos los casos tega la misma oportuidad de ocurrir (sea igualmete probables) Probabilidad de suceso= Nº de casos favorables Nº de casos posibles Es ecesario que los sucesos sea equiprobables Estadística Si repetimos el experimeto aleatorio muchas veces y aotamos las frecuecias relativas (Frecuecia absoluta ( i ) de ua variable estadística X i, es el úmero de veces que aparece e el estudio este valor, Frecuecia relativa (f i ), es el cociete etre la frecuecia absoluta y el tamaño de la muestra (N))de u suceso, tiede a estabilizarse e u valor etre 0 y 1, que se deomia probabilidad de suceso el límite al que tiee la frecuecia relativa de aparició de u suceso A cuado el º de esayos, tiede a ifiito. P(A)=lim A Problema: Muchas veces o se puede o o es práctico, repetir el experimeto u gra º de veces. 1

Axiomática: Dado u espacio muestral E, se llama probabilidad de u suceso A, defiido e el espacio muestral E, que se desiga por P(A), a u º real que se asiga al suceso A, que cumpla las siguietes codicioes: a) 0= o < P(A) = o < 1 (propiedad cuatificable etre 0 y 1) b) P(E)=1 (Cero cuado o puede ocurrir uca y 1 cuado el suceso se produce co seguridad) c) P(A)=1 ( ) La probabilidad de A se puede obteer restado de uo la probabilidad de su complemetario,. d) Teorema de la suma: la probabilidad de que ocurra el suceso A o el suceso B es igual a la suma de la probabilidad de que ocurra el suceso A más la probabilidad de que ocurra el suceso B, meos la probabilidad de que ocurra ambos: P(AUB)= P(A) + P(B) P(A B) A y B icompatibles P(AUB)= P(A) + P(B) (ya que P(A B) = o. PROBABILIDAD CONDICIONADA Cuado la aparició de u suceso A, depede de la aparició de otro B. Los sucesos A y B so depedietes. P (A B) dode B es la codició requerida probabilidad de A codicioada a B : Es igual a la probabilidad de la itersecció dividido por la probabilidad de la codició B: P (A B)= P(A B) P(B) P (B A)= P(B A) P(A) siempre que P(B) 0 siempre que P(A) 0 Si A y B idepedietes P (A B)= P(A) y P(B A) = P(B) LA REGLA DEL PRODUCTO Y EL TEOREMA DE BAYES Varios experimetos simultáeos Probabilidad codicioada: P (B A)= P(A B) P(A) Si despejamos P(A B) P(A B)= P(A). P (A B) La probabilidad de que ocurra A y B es igual a la probabilidad de la ocurrecia de A por la probabilidad de la ocurrecia de B, dado que A ha ocurrido previamete P(A B) probabilidad de que ocurra B dado que ha ocurrido A Si A y B idepedietes P(A B)= P(A). P (B) Se represeta gráficamete co el diagrama del árbol, (da todo lo que puedes combiar) dode los º correspode a las probabilidades codicioadas al suceso que aparece ates. Se debe cumplir siempre que las sumas de las probabilidades que salga de u mismo puto debe sumar 1. Para calcular las posibilidades de itersecció de dos sucesos hay que ir multiplicado las probabilidades de cada rama, hasta que se llegue al extremo del árbol. 2

Teorema de Bayes: A partir de que ha ocurrido el suceso B (ha ocurrido u accidete) deducimos las probabilidades del suceso A ( estaba lloviedo o hacía bue tiempo?) P (A B)= P(A). P(B A) P(B) Su importacia radica e los trabajos que ha geerado y e la corriete deomiada bayesiaa. Parte de ua situació e la que es posible coocer las probabilidades de que ocurra ua serie de sucesos. A esta se añade u suceso B cuya ocurrecia proporcioa cierta iformació, porque las probabilidades de ocurrecia de B so distitas segú el suceso A que haya ocurrido. Coociedo que ha ocurrido el suceso B, la fórmula del teorema de Bayes os idica como modifica esta iformació las probabilidades de los sucesos A. 3

TEMA 6 DISTRIBUCIONES DISCRETAS DE PROBABILIDAD E experimetos e los que o se puede predecir los resultados. Variable aleatoria Fució que asiga u úmero real (y solo uo) a cada uo de los resultados de u experimeto aleatorio. Se puede defiir de la maera que cosideremos oportua. Ua vez defiida la variable y obteido el resultado, la fució asiga u valor umérico iequívoco a este resultado. El resultado es aleatorio o la variable o fució. Se represeta por letras mayúsculas: X; Y; Y letras miúsculas para referiros a los valores cocretos que toma esas variables: x 2, y 1, Discretas cuado solo puede tomar u cojuto ifiito y umerable de valores (Ej. º aturales) o fiito de valores (Ej. º de caras al lazar ua moeda) Cotiuas cuado puede tomar ifiitos y o umerable. Variables aleatorias discretas 1) Fució de probabilidad f(x) X viee dada por los valores que puede tomar la variable aleatoria Asocia a cada valor de la variable la probabilidad de que ésta adopte ese valor. f(x) = P (X = x) Represetació gráfica diagrama de barras. Propiedades fudametales: 1. Cualquier valor de x, siempre toma valores positivos o ulos. 2. La suma de todas las probabilidades es igual a 1. 2) Fució de distribució F(x) Idica cual es la probabilidad de que la variable aleatoria tome u valor meor o igual que u valor cocreto x. Asocia a cada valor de la variable la probabilidad de que ésta adopte ese valor u otro iferior. F(x) = P (X x) Si ordeamos de meor a mayor los valores x de la variable aleatoria discreta, se obtiee acumulado (sumado) los valores de la fució de probabilidad: F(x) = P (X x) = f(x1)+f(x2)+...+f(x) Represetació gráfica va dado saltos. Propiedades fudametales: 1. Todos los valores so positivos o ulos. 2. F (x) es ula (vale 0) para todo valor iferior al meor valor de la variaza aleatoria. F(x) = 0 si x < x 1 (represeta al meor valor) 3. F (x) es = 1 para todo valor igual o superior al mayor valor de la variable aleatoria. F(x) = 1 si x > x k (represeta al mayor valor) 4. La fució F(x) es o decreciete ya que es ua acumulació o suma de probabilidades que so siempre positivas o ulas. 1

5. La probabilidad, P, de que la variable aleatoria X, tome valores x compredidos etre x 1 y x 2 (x 1 < x < x 2 ) es la diferecia etre los valores de la fució de distribució correspodietes a su valor superior meos su valor iferior. P (x 1 < x < x 2 ) = F(x 2 ) F(x 1 ) Media y variaza de la variable aleatoria Media (μ) E(X), Esperaza matemática o Valor esperadosumatorio de cada uo de los valores que toma la variable por su fució de probabilidad: µ = Σ x. f(x) Promedio teórico que tomaría la variable aleatoria si se repitiese el experimeto aleatorio ifiitas veces. Variaza σ 2 V(X): Sumatorio del producto de cada uo de los valores que toma la variable meos su media elevada al cuadrado por su correspodiete valor de la fució de probabilidad. σ 2 = Σ (x µ) 2. f(x) o σ 2 = E(X 2 ) - [E(X)] 2 Dóde: E(X 2 ) = Σ x 2.f(x) [E(X)] 2= la media elevada al cuadrado. Desviació típica σ: raíz cuadrada de la variaza. σ = σ 2 DISTRIBUCIONES DISCRETAS DE PROBABILIDAD Distribució Biomial B(, p) Variables aleatorias discretas que toma solo dos valores (dicotómicas) represetados por 0 y 1. Experimetos Berouilli o biomial (éxito - fracaso) se repite veces y de forma idepediete. Ua variable aleatoria X sigue ua distribució biomial (co parámetros y p) si expresa el úmero de realizacioes idepedietes co la probabilidad p y por tato (1 p) de obteer fracaso. Se represeta por B(, p), dóde B idica biomial, el úmero de esayos y p la probabilidad de éxito. (Ej.: Ejemplo: Si tiramos tres veces la moeda al aire y defiimos X como el úmero de caras, esta variable seguirá los parámetros = 3 y p = 0,5. Lo mismo que B(3; 0,5)) Características Fudametales: 1. Fució de probabilidad: F(x) = P (X=x)= p x q -x x 2

2. Fució de distribució: F(x) = P (X x)= p x q -x 3. Media: µ = p 4. Variaza : σ = pq x Dóde x es el úmero de aciertos, el úmero de esayos, p la probabilidad de éxito de cada esayo, q la probabilidad de fracaso (1- p) y el úmero combiatorio que se lee sobre x es igual a : x! x! (- x)! Se utiliza las tablas II y III (e esta se preseta las probabilidades acumuladas) si teemos ua p 0,5, hay que itercambiar las codicioes de éxito y fracaso. Otras distribucioes discretas Existe otros modelos de distribucioes discretas. El modelo Poisso de los sucesos raros, que se utiliza e codicioes similares a las biomiales pero co u elevado úmero de esayos y u valor p muy pequeño. 3

TEMA 7 DISTRIBUCIONES CONTINUAS DE PROBABILIDAD Modelos e los que se ajusta las variables co las que trabajamos modelo ormal Modelos co implicació como istrumetos estadísticos Chi- cuadrado de Perso t de Sudet F de Sedecor La distribució ormal Variable aleatoria que toma ifiitos valores variable aleatoria cotiua y ya o se puede hablar de que la variable tome u valor e cocreto, sio que este detro de u determiado itervalo. Características y propiedades La siguiete fórmula recoge la fució: Para - < x < Dóde μ y σ (media y desviació típica) so sus parámetros, π = 3,1416 y e = 2,718 y (base de los logaritmos eperiao). Si ua variable X tiee ua distribució que se ajusta a la fórmula aterior, es ua distribució ormal y se expresa X N (µ y σ) idicado que tiee ua distribució ormal N co parámetros μ y σ. Forma ua campaa que es más aputada cuato meor es su desviació típica. Si ua variable X le aplicamos ua trasformació lieal Y = bx+a, la ueva variable Y se distribuirá ormalmete pero co media bµx+ a y la desviació típica b σ. Si restamos la media y dividimos por la desviació típica obteemos ua ueva variable z. Por tato: z N (0,1) Y su fució de probabilidad: Para - < x < Distribució ormal tipificada (Tablas III y IV) Propiedades fudametales: a. Simétrica etoro a su media, μ, que coicide co su mediaa y su moda. b. La curva ormal tiee dos putos de iflexió; dos putos dode la curva pasa de ser cócava a covexa, situados a ua desviació típica de la media. c. Es asitótica e el eje de abscisas, se extiede desde - hasta + si tocar uca el eje. Casos de utilizació de las tablas 1. E el supuesto que la tabla o recoja el valor, podemos utilizar el más próximo. 2. Cálculo de la probabilidad para valores meores o iguales que ua determiada putuació típica: se mira directamete e la tabla. 3. Cálculo de la probabilidad para valores mayores que ua determiada putuació: se mira e la tabla la probabilidad que esa putuació deja por debajo y se resta a 1. 1

4. Cálculo de la probabilidad etre dos putuacioes determiadas: se resta las probabilidades que deja por debajo de sí las dos putuacioes típicas. HISTOGRAMA Y DISTRIBUCION NORMAL Si dispoemos de los datos origiales de ua variable X, y su distribució es ormal, utilizaremos las tablas III y IV, pero ateriormete trasformaremos las putuacioes directas e putuacioes típicas: z i = X i - X S x Siedo S la desviació típica APROXIMACION DE LA BINOMIAL A LA NORMAL Cuado las distribucioes biomiales supera sus valores de 20 ( < 20) se puede aproximar la biomial a la ormal. Teiedo ua variable X, co distribució biomial, su media es = p y su desviació típica = pq Podemos realizar: P(X = x) = P (x 0,5) µ x-µ (x+0,5) µ σ σ σ P(X = x) = P (x 0,5) p z (x+0,5) p pq pq A medida que aumeta (itetos) mejora la aproximació. Sumar y restar el valor 0,5 se llama correcció por cotiuidad, permitiedo utilizar las putuacioes discretas como cotiuas. Se iterpreta cada putuació X como si fuera el puto medio de u itervalo, se iteta asegurar que el itervalo icluya los valores discretos de la biomial. DISTRIBUCION CHI- CUADRADO DE PERSON E la distribució de Chi cuadrado de Pearso ua variable X co distribució X 2 1, X 2 2..X 2 pasa a ser X = X 2 Su media y variaza valdrá µ = y σ 2 = 2 Esta distribució se usa para cotrastar si la distribució de ua variable se ajusta a ua distribució determiada. Propiedades 1. Nuca adopta valores meores de 0. 2. Es asimétrica positiva pero a medida que aumeta sus grados de libertad se va aproximado a la distribució ormal. 3. Para > 30 la podemos aproximar a ua distribució N(, 2). E la tabla V se halla alguos valores de las distribucioes X 2. 2

Ej.: E ua variable co 5 grados de libertad, X X 2 5, el valor 11,07 deja por debajo de sí ua proporció de 0,95, represetádose de la siguiete maera: 0,95 X 2 5 = 11,07 Ahora si quisiéramos calcular P (X > 11,07): P (X > 11,07) = 1 P (X < 11,07) = 1 0,95= 0,05 DISTRIBUCION t DE STUDENT Siedo X e Y dos variables aleatorias idepedietes, dode X sigue ua distribució N (0,1) e Y sigue ua distribució X 2. La variable aleatoria T= X, sigue ua distribució t co grados de libertad y se Y/ Expresa por T t Su media siempre vale 0 (µ=0) Su variaza σ 2 = -2 Cociete etre ua variable N(0,1) y la raíz cuadrada de ua variable X 2 dividida por sus grados de libertad Características: 1. Es simétrica, co μ = 0. Su forma es muy parecida a la N(0,1), auque meos aputada. 2. Puede tomar cualquier valor (- + ). 3. A medida que aumeta los grados de libertad, la distribució se aproxima más a ua distribució ormal. 4. La curva es asitótica al eje de abscisas. Se emplea e estadística iferecial e cotrastes. E la tabla VI se muestra los valores de esta distribució. DISTRIBUCION F DE SNEDECOR Si X 1 y X 2 so variables aleatorias idepedietes, co distribució chi- cuadrdado co 1 y 2 grados de libertad respectivamete, etoces ua ueva variable F= X 1 / 1 X 2 / 2 Sigue ua distribució F co 1 y 2 grados de libertad (F 1, 2 ). Siedo 1 los grados de libertad del umerados y 2 los grados de libertad del deomiador. Media: μ 2 para 2 > 2 2 2 Variaza: σ 2 2 2 2 ( 1 + 2-2) 1 ( 2 4) ( 2 2) 2 para 2 >4 Se emplea para el cotraste de hipótesis. Características: 1. Asimétrica positiva, uca toma valores meores que 0. 2. Propiedad recíproca: Si X es ua variable co distribució F co 1 y 2 grados de libertad, etoces la variable Y = 1/X es tambié ua variable co distribució F co 1 y 2 grados de libertad: 1- p F 1, 2 = 1 dode p es la probabilidad asociada al valor de la variable, p F 2, 1 Tabla VII sólo aparece la probabilidad de que X = 0,900; 0,950; 0,975 y 0,990. 3

TEMA 8 ESTIMACIÓN Coceptos previos Població se refiere al cojuto total de elemetos que se quiere estudiar ua o más características. Debe estar bie defiida. Llamaremos N al úmero total de elemetos de ua població. Tambié se suele utilizar los térmios idividuos, sujetos y casos para referiros a los elemetos de la població. Cuado se dispoe de u ceso (listado) de la població, se puede estudiar a todos ellos. No siempre es factible estudiar a la totalidad de ua població; por lo que se estudia u subcojuto de los elemetos totales; es decir, ua muestra. Llamaremos al úmero de los elemetos de ua muestra. El muestreo es u proceso de selecció co el fi de obteer ua muestra lo más semejate posible a la població y así obteer estimacioes precisas. El tamaño es ua característica esecial; ya que debe ser lo suficietemete amplia para represetar adecuadamete las propiedades de la població y reducida para que pueda ser examiada e la práctica. Probabilistico: se cooce la probabilidad asociada a ua muestra y cada elemeto de la població tiee ua probabilidad coocida de perteecer a la muestra Ua forma de obteer ua muestra de ua població homogéea es utilizar: 1) El muestreo aleatorio simple; por el cual se garatiza que cada elemeto de la població tega la misma probabilidad de formar parte de la muestra. Primero se asiga u úmero a cada elemeto y después mediate algú medio (sorteo, papeletas,...) se elige tatos elemetos como sea ecesario para la muestra. 2) Cuado los elemetos está ordeados o puede ordearse se utiliza el muestreo sistemático. Se seleccioa al azar etre los que ocupa los lugares N Ejemplo: N = 100; = 5; 100/5= 20; escogeríamos los elemetos situados e las posicioes 20. El riesgo de este muestreo es la falta de represetació; que se pudiese dar, del total de los elemetos. 3) Cuado topamos co ua població heterogéea, utilizamos el muestreo estratificado. Se emplea cuado dispoemos de iformació suficiete sobre algua característica y podemos elegir ua muestra e fució del úmero de elemetos segú estas características o estratos. 4) Ate poblacioes desordeadas y coglomeradas e grupos, se emplea el muestreo por coglomerados; dode se va seleccioado de todos los grupos, subgrupos, clases y fialmete de los elemetos restates la muestra. 5) De la uió del estratificado y del coglomerado, surge otro muestreo el polietápico. No probabilístico: se descooce, o o se tiee e cueta, la probabilidad asociada a cada muestra y se seleccioa la que más le parezca represetativa al ivestigador. 1