Qué es la estadística? La estadística tiee que ver co la recopilació, presetació, aálisis y uso de datos para tomar decisioes y resolver problemas.
Qué es la estadística? U agete recibe iformació e forma de datos a través de fuetes de iformació, como los periódicos, la televisió u otros medios; puede obteer algua coclusió a partir de la iformació coteida e los datos.
Qué es la estadística? Los métodos empleados para resumir y orgaizar datos se deomia estadística descriptiva; mietras que los métodos para tomar decisioes se deomia iferecia estadística.
Població y muestra El térmio població se refiere a los elemetos del uiverso respecto al cual se quiere obteer coclusioes o tomar decisioes. A cada elemeto se le puede asociar ua medició que bie puede ser umérica o cualitativa depediedo de la característica que se quiera estudiar. El térmio muestra se refiere al subcojuto de observacioes seleccioadas de la població de iterés.
Variables A cada característica de los elemetos de ua població se le llama variables. Nos ecotraremos co varios tipos de variables: cualitativas y cuatitativas. Las variables cualitativas so aquellas que se refiere a categorías o atributos de los elemetos (idividuos) estudiados. Las variables cuatitativas so aquellas cuyos datos so de tipo umérico.
Variables cualitativas Dicotómicas: Sólo hay dos categorías, que so excluyetes ua de la otra Ejemplo: efermo-sao, muerto-vivo, mujer-hombre Nomial: tiee mas de dos categorías y o hay orde etre ellas. Ejemplo: color de los ojos, grupo saguíeo Ordial: tiee varias categorías y hay orde etre ellas. Ejemplo: grado tumoral, calificació del riesgo e aestesia.
Variables cuatitativas Cotiuas: úmeros ifiito o umerables de elemetos. Tiee asociado el cocepto de medida Ejemplo: presió arterial, edad, peso. Discretas: úmeros fiitos o ifiitos umerables de elemetos. Se asocia co el cocepto de coteo. Ejemplo: N de hijos, N de casos de tuberculosis por estado.
Hay ocasioes e las que las medidas cuatitativas cotiuas so trasformadas e ordiales mediate la utilizació de uo o varios putos de corte. Ejemplo: la variable peso es codificada e varias categorías y se utiliza e térmios como: bajo-peso, peso-ormal, sobrepeso, obesidad
Las descripcioes uméricas de datos suele ser importates. Dado u cojuto de observacioes x x,..., x 1, 2 La estadística descriptiva os puede ayudar mediate resúmees uméricos, que so medidas de tedecia cetral, o tambié llamadas de posició y medidas de dispersió
Las medidas descriptivas más comues de tedecia cetral o localizació so: la media aritmética y la mediaa.
Media La media aritmética o simplemete promedio (tambié llamada media muestral ya que geeralmete se calcula co relació a ua muestra) se calcula de la siguiete forma: si las observacioes de ua muestra de tamaño so x 1, x 2,,x etoces X x 1 x 2... x i 1 x i
Es ituitiva y fácil de calcular. Su valor puede que o coicida co iguo de los valores de la muestra La suma de las diferecias de cada valor de la muestra co la media su resultado es cero, es decir, i 1 ( x i x) 0
Mediaa La mediaa se suele defiir como el valor más itermedio ua vez que los datos ha sido ordeados e forma creciete. Se suele deotar por Me. La forma más geeral de calcular la mediaa es la siguiete: x 1 2 si es impar Me x x 2 ( 2) 1 2 si es par
La mediaa es aquel valor que deja el cicueta por cieto de los datos por debajo y otro cicueta por ecima. Cabe destacar que es preferible el uso de la mediaa como medida descriptiva del cetro cuado se quiere reducir o elimiar el efecto de valores extremos e u cojuto de datos (muy grades o muy pequeños).
Moda Es ua medida de tedecia cetral que se puede utilizar sea cual sea el tipo de variable a estudiar. La moda de u cojuto de observacioes es el valor que más se repite, aquel cuya frecuecia absoluta es máxima. Puede ser úica, que haya más de ua, o que o exista.
Media geométrica Se defie como la raíz -ésima del producto de todos los valores uméricos, es decir, X G x1. x2... x ( xi ) i 1
Media armóica Se defie como el úmero de observacioes de la muestra dividido por la suma del iverso de cada ua de las observacioes, es decir, X A i 1 (1/ x i )
La localizació o tedecia cetral de u cojuto de datos o ecesariamete proporcioa iformació suficiete para describirlos adecuadamete. Debido a que o todos los valores so semejates, la variació etre ellos se cosidera importate. Se puede decir que u cojuto de datos tiee ua dispersió reducida si los mismos se aglomera estrechamete e toro a algua medida de localizació de iterés y se dice que tiee ua dispersió grade si se esparce ampliamete alrededor de algua medida de localizació de iterés.
Las medidas descriptivas más comues de dispersió so: el rago, la variaza, la desviació estádar y el rago itercuartílico.
Rago El rago de la muestra es la medida de variabilidad más secilla etre todas las mecioadas; y se defie como la diferecia etre la observació más grade y la más pequeña : r x max x mi
Auque es ua medida muy fácil de calcular, igora toda la iformació de la muestra etre las observacioes más grade y más pequeña. Si embargo, vale la pea resaltar que el rago se utiliza mucho e aplicacioes estadísticas al cotrol de calidad.
E geeral, se desea ua medida de variabilidad que depeda de todas las observacioes y o sólo de uas pocas; así que parece razoable medir la variació e térmios de las desviacioes relativas a algua medida de localizació (geeralmete esta medida es la media).
Para el cojuto de datos x 1, x 2,.,x Las diferecias x x),( x x),..., ( x ( 1 2 x Determia las desviacioes de la media. Dado que la suma de estas desviacioes es cero, se utiliza como medida de variabilidad el promedio de los cuadrados de tales desviacioes. )
s 2 i 1 ( x i x) 2 Si embargo, como sólo hay -1 desviacioes idepediete se coviee e dividir etre -1, es decir,
Variaza S 2 i 1 ( x i x 1 ) 2
Desviació estádar Esta medida de variabilidad se deomia variaza. Como S 2 o tiee las mismas uidades que los datos, se defie la desviació estádar como la raíz cuadrada (positiva) de la variaza a fi de teer ua medida e las mismas uidades de los datos. La desviació estádar es útil para comparar dispersió etre dos poblacioes, pero tambié lo es para calcular el porcetaje de la població que puede localizarse a meos de ua distacia específica de la media.
Cuartiles Los cuartiles divide a u cojuto de datos e cuatro partes iguales. Para explicarlo u poco mejor, piese e u cojuto de datos ordeados de meor a mayor. Al valor de e medio es la mediaa. Esto es, 50 por cieto de los datos so mayores que la mediaa y 50 por cieto so meores. De maera similar los cuartiles divide a u cojuto de datos e cuatro partes iguales.
El primer cuartil, al que se le llama Q 1, es el valor por debajo del cual se ecuetra el 25% de los datos, y el tercer cuartil usualmete llamado Q 3, es el valor por debajo de el se ecuetra el 75% de los datos. Q 2 es la mediaa. Los valores Q 1, Q 2 y Q 3 divide al cojuto de datos ordeados e cuatro partes iguales. Q 1 se puede eteder como la mediaa de la mitad iferior de los datos ordeados y Q 3 como la mediaa de la mitad superior de los datos ordeado.