Estadística y Probabilidad Breviario Académico Estadística: Es la ciencia que tiene por objetivo recolectar, escribir e interpretar datos, con la finalidad de efectuar una adecuada toma de decisiones en cualquier ámbito Se requiere: o Definir la situación o Emplear los métodos estadísticos o Obtener información precisa de los elementos o Resumir los datos o Obtener y comunicar conclusiones Ramas: o Estadística descriptiva Incluye desde la recolección, presentación y descripción de datos Son todos los cálculos necesarios y anticipatorios que se realizan de manera previa a la interpretación de datos y de la adecuada toma de decisiones o Estadística inferencial Se refiere a la técnica de interpretación de los valores resultantes Es el análisis posterior que se efectúa a las técnicas descriptivas para favorecer una adecuada toma de decisiones Herramientas usadas en cada rama: o Estadística descriptiva Distribución normal Distribución Distribución hipergeometrica binomial Análisis Bayesiano Distribución de Poisson o Términos básicos Estadística inferencial Distribución Chi Cuadrada Prueba de hipótesis 1 Hipótesis nula Hipótesis alterna Análisis de varianza Población (N): Colección o conjunto de individuos, objetos o eventos cuyas propiedades serán susceptibles a análisis, debe definirse cuidadosamente y se considera definida cuando se especifica el listado de elementos. Puede ser: o Población finita: Cuando se pueden contabilizar físicamente los elementos o Población infinita: Cuando los elementos son ilimitados y es muy difícil contabilizarlos o Censo: indagación completa de las características de todos los elementos que componen una población determinada
ANALIZA R DATOS ANALIZAR GRAFICAS RECOLECTAR Proyecto PropULSA: http://www.facebook.com/proyectopropulsa Muestra(n): Es un subconjunto de la población Dato: Es el valor de la variable asociada a un elemento de la población o muestra, puede ser un número, palabra o símbolo Experimento: Actividad planeada cuyos resultados producen un conjunto de datos. Existen 3 maneras de hacer experimentos: o Planeado.- Se elabora un listado de elementos que conforman a la población o muestra o Estratificado.- Una vez definido el listado previo se estudió de manera jerárquica cada etapa del proceso o Aleatorio.- Es una opción alterna y este no lleva ningún orden en específico Parámetro: Valor numérico asociado a una población completa Estadística: Valor numérico asociado a la muestra completa Variable: Características de interés sobre cada elemento individual de una población o muestra. Pueden ser: o Cualitativas (categorías) miden una cualidad o característica Nominales= Describe o identifica un elemento de la población. Ej: Color de cabello, ciudad Ordinales= Miden y presentan posiciones o calificaciones en orden de importancia. Ej: Este breviario es: excelente, bueno, regular o malo o Cuantitativas (numéricas) miden una cantidad numérica en un experimento, se presenta con la letra x Discretas= Adoptan un solo número contable o un valor finito de valores. Ej: # de personas en una familia Continuas: Adoptan cantidades infinitas de valores que corresponden a puntos de intervalos lineales (fracción o aproximación) Ej: Estatura (1.78m-1.80m) Estadística descriptiva Proceso estadístico: 1. Población estadística: Recolección de datos DETERMINAR 2. Objeto de análisis: Que es necesario conocer? Como se obtendrán los datos de la muestra? Que se espera? 4. Estadísticas muéstrales: Graficas numéricas LA PARTE MAS IMPORTANTE 2 3. Muestra: Datos recolectados de la población
Estadística inferencial Pruebas de hipótesis: Se pone a prueba un reclamo u objetivo sobre la naturaleza de una población a base de la información de una muestra. Existen 2 tipos de hipótesis dentro de los casos estadísticos: a) Hipótesis nula o hipótesis objetivo (, : deberá tener el principal objetivo o tópico a probar en el caso práctico [,.=] b) Hipótesis alterna o alternativa ( : Es la segunda opción que tenemos para probar si no se acepta la hipótesis nula será la opción a aceptar [>,=.<] A PRIMERA INSTANCIA SE DEBE ACEPTAR LA HIPOTESIS NULA SI NO SE ACEPTA SE ACEPTA LA ALTERNA SIEMPRE SE ACEPTA O RECHAZA ALGUNA DE LAS DOS Datos cualitativos: Con estos datos se utiliza el cuadro estadístico, que es la tabla que resume los datos cualitativos a través de las siguientes columnas: Categoría: En esta columna se especifica los datos cualitativos Frecuencia: Numero de elementos en cada categoría Frecuencia relativa: Frecuencia acumulada Porcentaje (proporción): FRx100% Gráficas: visualización de manera ágil algún comportamiento en alguna muestra. Pueden ser Gráfico de sectores (circular o de pastel) Gráfica de barras.- se crea del porcentaje Ojiva.- se crea de la FA Polígono de frecuencias: se crea a partir del porcentaje Gráfico de Paretto Datos cuantitativos: Con estos datos utilizaremos la tabla de distribución de frecuencias, que sirve para agrupar los valores de una variable. Los pasos son los siguientes: 1. Ordenar la muestra de manera ascendente (- a +) 3
2. Determinar el número de clase (SIEMPRE SE REDONDEA A UN ENTERO) Número de clase = n n= número total elementos de la muestra 3. Obtener la amplitud o ancho de clase (SIEMPRE SE DEJA A 2 DECIMALES) Amplitud (ancho de clase)= Valor máximo valor mínimo n no. de clase 4. Construir la tabla de distribución de frecuencias con las siguientes columnas a) Clase: es el número de renglones que va a tener la tabla b) Intervalos: Se calcula con el resultado de la formula de intervalo, siempre va a tener un límite inferior que es el valor con el que inicia un intervalo y un límite superior que es con el que termina un intervalo c) Frecuencia d) Frecuencia relativa e) Frecuencia acumulada f) Porcentaje g) Marca de clase (punto medio): Es el promedio de límite inferior y el límite superior y se representa Xi Marca de clase: Xi= Límite inferior+ límite superior 2 Clase Intervalos Frecuencia Frecuencia Frecuencia % Xi relativa acumulada DATOS NO AGRUPADOS Es la muestra sin agrupar en una tabla de distribución de frecuencias Las medidas de tendencia central describen el comportamiento típico o promedio de la población. Son: a) Media aritmética.- Resultado de la sumatoria ( ) de todos los elementos que contiene la muestra entre el número total de elementos b) Media ponderada.- En esta se considera a cada uno de los valores acuerdo a su importancia en el grupo (Se usa para promedio en porcentaje). El resultado SIEMPRE en % y a 2 decimales p= unidades x= porcentajes % c) Mediana.- Conjunto de un grupo de datos que ocupa un lugar de cuando se les agrupa a todos de manera ascendente. 4
a. En un grupo con número par de elementos, la mediana se supone que está a la mitad entre 2 valores adyacentes al centro b. Cuando el conjunto contiene un número grande de elementos es conveniente utilizar la fórmula: posición de la mediana c. Si el valor resultante termina en 2.5 sumar el número del entero con su sucesor y dividir el resultado entre 2, el resultante de la división es la mediana. d) Moda.- Valor que se presenta con mayor frecuencia en un conjunto de datos. Pueden ser: a. Unimodal: dentro de la distribución se presenta una sola moda b. Bimodal: se presentan 2 modas c. Multimodal: se presentan mas de 2 modas d. No hay moda: Es cuando ningún valor se repite Recuerda que esto NO garantiza tu calificación en el examen, no pretende ser una guía, sino un recurso de apoyo para que domines los contenidos de la materia) Indivisa Manent! Encuentra todos los breviarios académicos en: http://propulsa.weebly.com/ Por: Diana López 5