INTRODUCCIÓN La estadística día a día esta ocupando un lugar importante en nuestra sociedad colaborando así al progreso humano y su bienestar. Aunque en sus comienzos era aplicada únicamente a asuntos del Estado de donde deriva su nombre, hoy día su aplicación cubre todos los campos del conocimiento entre otros; Medicina, Economía, Agricultura, Psicología, Negocios, Educación, ingeniería, Industria, Farándula y ciencia en general. Es una de las ciencias que mayor aplicación ha tenido en diversos campos de la investigación. Para ser un buen investigador es indispensable ser objetivos tanto en la aplicación de la estadística como en la interpretación de los resultados a los que se llega por intermedio de ésta. En el estudio del comportamiento social, estamos interesados en la estadística descriptiva, sin embargo en la mayoría de las investigaciones no nos podemos contentar con un estudio a este nivel; se debe realizar un análisis más profundo, para lo cual se hace necesario utilizar la inferencia estadística, cuya finalidad es obtener generalizaciones, hacer predicciones, estimaciones o determinar si una hipótesis dada se puede rechazar o no con algún grado de certidumbre. La probabilidad es la matemática del azar. Como rama de la matemática se originó en Francia a mediados del siglo XVII, cuando Fermat y Pascal analizaron algunos juegos de azar desde un punto de vista matemático. El cálculo de probabilidades es uno de los capítulos de la ciencia matemática que se ocupa del establecimiento de reglas generales para el análisis de los fenómenos caracterizados por su repetición múltiple. Sus métodos, por tanto, son los razonamientos exactos y sus herramientas las fórmulas, tablas y diagramas. El cálculo de probabilidades ha evolucionado notablemente en los últimos años, hasta convertirse en una de las disciplinas matemáticas más desarrolladas. Sus métodos y leyes se aplican a la Solución: de múltiples problemas concretos de la ciencia y la vida diaria. 1
CONCEPTOS ESTADÍSTICOS ESTADÍSTICA: Es la ciencia que se encarga de recolectar, tabular, describir e interpretar datos sobre algún tema específico con el fin de sacar conclusiones y tomar medidas al respecto. Ejemplo:s de temas estudiados estadísticamente: Costo del litro de leche en algunas zonas del país. Edad de estudiantes de secundaria en la ciudad capital. Estatura de los estudiantes de 14 años de un Colegio. Comida preferida por una población. Nivel académico de los empleados de una empresa. POBLACIÓN: Es el conjunto de individuos o cosas que se puede estudiar por tener características observables. Ejemplo:s de población: Cirujanos de Colombia Mujeres menores de 20 años Hombres menores de 0 años Árboles de un parque ecológico Águilas que habitan los Andes Zoológicos del país. Tumores extirpados en un hospital Automóviles particulares que transitan la ciudad. MUESTRA: Es un subconjunto representativo de la población. 2
Ejemplo: Si se quiere realizar una estadística sobre la asignatura preferida por los 1.500 estudiantes de un Colegio, la muestra a la cual se le aplicaría la encuesta podrían ser 150 estudiantes. VARIABLE: Es la característica que se desea estudiar en la población y puede ser: Cuantitativa: Cuando los datos son numéricos. Ejemplo: Edad, estatura, peso, costo. Cualitativa: Cuando los datos tomados son cualidades o atributos. Ejemplo: Color, textura, música preferida, equipo preferido, ciudad preferida. FRECUENCIA ABSOLUTA (f): Es el número de veces que se repite un dato. Ejemplo: Se le pregunta a una muestra de 2 niños la edad y 1 tenían 8 años por tanto la frecuencia absoluta para la edad de 8 años es 1. f = 1. FRECUENCIA RELATIVA (fr): Es el porcentaje correspondiente a la frecuencia absoluta. Ejemplo: Si en una muestra de hombres mayores de 20 años, se les preguntó sobre su nivel académico y la cuarta parte afirmó que eran bachilleres, podemos afirmar que la frecuencia relativa es del 25%. fr = 25% GRÁFICOS Y DIAGRAMAS: Son las formas de representar la información recogida (datos) y entre otros se tienen: Diagrama de barras, histograma y polígono de frecuencias, circulares, pictogramas, etc. DIAGRAMA DE BARRAS DIAGRAMA CIRCULAR 9 8 Edad (años) 6 5 4 2 1 2 4 25% CASADOS SOLTEROS 1 0 1 2 4 5% Grupos
PICTOGRAMA HISTOGRAMA Y POLÍGONO DE FRECUENCIA Frecuencia AZUL ROJO VERDE AMARILLO = 20% = 0% = 40% = 10% Polígono Histograma 5 8 11 14 1 Edad MEDIDAS DE TENDENCIA CENTRAL: Dan información respecto a la puntuación promedio de una distribución, entre ellas tenemos: MEDIA ARITMÉTICA ( X ): Es el parámetro de los datos dados. EJEMPLO: Las edades de los niños encuestados son: 5,,,,, 4, 9 Su media aritmética se halla sumando todos los valores y dividiendo el total entre el número de datos. Veamos. Por tanto la media aritmética es 6 X = 6 5 + + + + + 4 + 9 42 X = = = 6 Matemáticamente se acostumbra a escribir: X = n xi i= n para nuestro Ejemplo:, quedaría: n 4
X = n xi = n 5 + + + + + 4 + 9 = = 6 n i MODA (MO): El dato que más se repite en una distribución. Tomando en cuenta los datos 5,,,,, 4, 9, la moda en este caso sería, MO =. Por que es el dato que más se repite. MEDIANA (ME): Es el dato intermedio de una serie de datos o distribución. Ejemplo: Tomando los datos 5,,,, 4, 9. Para hallar la mediana organizamos los datos de menor a mayor así:, 4, 5,,,, 9 y escogemos como mediana el dato intermedio., 4, 5,,,, 9 MEDIANA ME = EJEMPLO: Con base en los siguientes datos que corresponden a las calificaciones obtenidas por 12 alumnos elaborar una distribución de frecuencias y hallar: Estadígrafos de tendencia central (media aritmética ( X ), Moda, (Mo) y Mediana (ME)). Estadígrafos de dispersión (desviación media absoluta (D.M.A.); varianza (s²) y desviación estándar (s)); Elaborar un histograma, polígono de frecuencias y diagrama circular. Teniendo en cuenta que son datos no agrupados. 5 5 8 9 9 5 5 5
SOLUCIÓN: 1. Se elabora una tabla denominada distribución de frecuencias en donde f es frecuencia absoluta; fr frecuencia relativa; F frecuencia acumulada y FR frecuencia acumulada relativa. Calificación F fr F FR 5 8 9 4 2 1 2 25 1 8 1 9 10 12 25 58 5 8 100 12 100 n = número de datos n = 12 f: Es el número de veces que se repite cada dato. fr: Es el porcentaje de la frecuencia absoluta. Se halla con la fórmula x 100 el primer valor que es. Su porcentaje sería: 12 valores se aplica la misma fórmula aproximando a valores enteros. Valor x 100 Total para = 25%. Con los demás F: Se halla sumando en forma acumulada los valores de f. Es decir, el primer valor será ; el segundo valor será + 4 = ; el tercer valor será + 2 = 9, etc. FR: Se halla de igual forma que F pero teniendo en cuenta los valores de fr. 2. Se hallan los estadígrados de tendencia central. a) Media aritmética ( X ): Basta sumar todos los datos y dividir el resultado por n. 69 X = = 5.5 12 6
b) Moda (MO): Es el valor que tiene mayor frecuencia absoluta. MO = 5 (porque se repite 4 veces) c) Mediana (ME): Se ordenan los datos de menor a mayor y se toma el dato intermedio si el número de datos es impar. Como en nuestro caso el número de datos es par (12) se toman los dos datos intermedios, se suman y el resultado se divide entre dos. 5 5 5 5 8 9 9 5 + 5 10 ME = = = 5 2 2. Para los estadígrafos de dispersión, para ello elaboramos la siguiente tabla: A B C D E F Xi Calificació Fi Xi - X fi Xi - X (Xi - X )² fi (Xi - X )² n 5,5 = 2,5 (2,5) = 8,25 (2,5)² =,5625 (,5625) = 22,685 5 4 5 5,5 = 4(0,5) = (0,5)² = 4(0,5625) = 2,25 0,5 0,5625 2 5,5 = 2(1,25) = (1,25)² = 2(1,5625) =,125 1,25 2,5 1,5625 8 1 8 5,5 = 1(2,25) = (2,25)² = 1(5,0625) = 5,0625 2,25 2,25 5,0625 9 2 9 5,5 =,25 2(,25) = 6,5 (,25)² = 10,5625 2(10,5625) = 21,125 n = 12 22,5 54,25 Explicación de la tabla anterior: fi = Corresponde a cada una de las frecuencias absolutas. Xi = Representa cada uno de los datos tomados. X = Es la media aritmética. En este caso se halló anteriormente y nos dio
69 X = = 5.5 12 La columna A llamada Xi corresponde a cada uno de los datos. La columna B llamada fi corresponde a cada una de las frecuencias absolutas. La columna C llamada Xi - X se denomina valor absoluto de Xi menos X ya que se resta el dato de la columna A llamado Xi y la media aritmética X = 5,5 y por tener las barras el valor siempre será positivo. La columna D: El resultado de esta columna llamada fi Xi - X, resulta de multiplicar cada valor de la columna B por cada valor respectivo de la columna C. La columna E: El resultado de esta columna llamada (Xi - X )², resulta de elevar al cuadrado cada valor de la columna C. La columna F: El resultado de esta columna llamada fi (Xi - X )² resulta de multiplicar cada valor de la columna B por su correspondiente valor de la columna E. a) Histogramas: Es una serie de rectángulos cuyas alturas representan la frecuencia. HISTOGRAMA DE FRECUENCIAS ABSOLUTAS Frecuencia f 5-4 - - 2-1 - Calificación 5 8 9 b) Polígonos de frecuencias: Es una serie de puntos unidos por rectas los cuales son determinados por cada dato o marca de clase y su respectiva frecuencia. 8
POLÍGONO DE FRECUENCIAS ABSOLUTAS 5-4 - - 2-1 - 5 8 9 c) Diagrama circular: Para el diagrama circular se toma la columna fr de la distribución de frecuencias y cada valor se multiplica por.6 para hallar los ángulos de los sectores circulares que corresponden a cada frecuencia. fr 25 x.6 = 90º x.6 = 119ª 1 x.6 = 61º 8 x.6 = 29º 1 x.6 = 61º 60º 8% 1% 1% 25% % Calificación de Calificación de 5 Calificación de Calificación de 8 Calificación de 9 9