Statgraphics Centurión

Documentos relacionados
GUÍA DE STATGRAPHICS 5.1

Statgraphics Centurión

Estadística II Curso 2011/12

PRÁCTICA: ESTADÍSTICA DESCRIPTIVA CON SPSS 1

UNIVERSIDAD DE MANAGUA Al más alto nivel

Estadística básica con R Commander. María Eugenia Fernández de Luco

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.

TEMA 9 EL ANÁLISIS BÁSICO DE LA INFORMACIÓN EN LA INVESTIGACION DE MERCADOS

Práctica 5 ANÁLISIS DE UNA MUESTRA INTERVALOS DE CONFIANZA CONTRASTE DE HIPÓTESIS

Tema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0

PRUEBA CHI-CUADRADO. Para realizar un contraste Chi-cuadrado la secuencia es:

Distribuciones de Probabilidad.

INDICE Capitulo uno Introducción y estadísticas descriptiva Capitulo dos Conceptos en probabilidad Capitulo tres

PRÁCTICAS DE ESTADÍSTICA DESCRIPTIVA

INDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica

INTRODUCCIÓN AL MANEJO DE STATGRAPHICS

ANÁLISIS ESTADÍSTICO PRUEBA DE HIPOTESIS

INDICE. Prólogo a la Segunda Edición

Estadística descriptiva con Excel

Este programa estadístico está organizado en dos bloques: el editor de datos y el visor de resultados.

DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.

TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD

9.- Análisis estadísticos con R Commander

CM0244. Suficientable

PROGRAMA DE ESTADÍSTICA DESCRIPTIVA

Nota de los autores... vi

PRÁCTICA 8: CONTRASTES DE HIPÓTESIS PARAMÉTRICOS

CONTENIDO. Prólogo a la 3. a edición en español ampliada... Prólogo...

Tests de hipótesis. Técnicas de validación estadística Bondad de ajuste. Pruebas de bondad de ajuste. Procedimiento en una prueba de hipótesis

Intervalos de confianza con STATGRAPHICS

Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico

Información general. Fundamentos de Análisis de datos. Obligatoria básica o de fundamentación X. Obligatoria profesional

Comparación de dos Muestras - SnapStat

viii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...

Contrastes basados en el estadístico Ji Cuadrado

INDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos

Índice general. Pág. N. 1. Capítulo 1 ETAPAS DE UNA INVESTIGACIÓN. Diseño. Población. Muestra. Individuo (Observación, Caso, Sujeto) Variables

Tema 7. Introducción Metodología del contraste de hipótesis Métodos no paramétricos

ESTADÍSTICA CON EXCEL

GUIA DOCENTE ESTADISTICA

ESTIMACIONES INTERVALOS DE CONFIANZA CON VARIANZA DIFERENTE LI. MIGUEL CANO

ÍNDICE INTRODUCCIÓN... 21

Representaciones gráficas de las distribuciones bidimensionales de frecuencias... 74

ESTADÍSTICA, SISTEMAS DE INFORMACIÓN Y NUEVAS TECONOLOGÍAS Código de la Asignatura Créditos

Práctica 1: Introducción a SPSS 1

Práctica de variables aleatorias (modelos)

CORRELACION Y REGRESION

TEMA 10 COMPARAR MEDIAS

Prácticas SPSS MATERIAL DE APOYO SPSS v.15

1 Descripción de datos con gráficas 7. 2 Descripción de datos con medidas numéricas 47. Contenido. 2.1 Descripción de un conjunto de datos mediante

DISTRIBUCIONES UNIDIMENSIONALES:

478 Índice alfabético

Universidad Central del Este UCE Facultad de Ciencias de la Salud Escuela de Medicina

UNIVERSIDAD AUTÓNOMA DE BAJA CALIFORNIA

ANÁLISIS DE DATOS. L.A. y M.C.E. Emma Linda Diez Knoth

Ing. MSc. Luis Fernando Restrepo Gómez

Análisis de datos en CCSS: introducción al análisis descriptivo e inferencial

N T E N.. IDO. CAPíTULO 3 TABLAS Y GRÁFICAS: UNA IMAGEN DICE MÁS QUE MIL PALABRAS 78. CAPíTULO I LA IMAGINACiÓN ESTADíSTICA

CONTRASTES DE HIPÓTESES

ESTIMACIONES INTERVALOS DE CONFIANZA CON VARIANZA DIFERENTE LI. MIGUEL CANO

INDICE. 81 Operadores lógicos Funciones exponenciales y logarítmicas Funciones trigonométricas

INTRODUCCIÓN A LA ECONOMETRÍA (LE Y LADE, mañana) Prof. Magdalena Cladera APLICACIONES DE INFERENCIA ESTADÍSTICA DE EXCEL Y SPSS

FACULTAD DE RECURSOS NATURALES INGENIERÍA ZOOTECNISTA PROGRAMA DE ESTADÍSTICA Y BIOMETRÍA AÑO 2017

Departamento de Estadística y Econometría. UMA. EJERCICIOS DE ESTADÍSTICA II APLICADA A LA EMPRESA. L.A.D.E. TEMA 3

INDICE Prefacio Como usar este libro Capitulo 1. Introducción Capitulo 2. Análisis exploratorio de los datos

Estadística Descriptiva. Poblaciones y muestras.

Interface Gráfica R-Commander. José Enrique Martín García Universidad Politécnica de Gimialcón (Avila) (Copyright 2014)

Presentación del paquete estadístico Statgraphics. Estadística Descriptiva

Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación. Facultad de Ciencias Sociales, UdelaR

Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia

Práctica 4. Contrastes no paramétricos en una población

Valores de glucemia en 36 varones sanos

Gestión de los datos en Gretl

Sumario Prólogo Unidad didáctica 1. Introducción a la estadística. Conceptos preliminares Objetivos de la Unidad...

TABLAS DE CONTINGENCIA

Introducción a la Estadística Aplicada en la Química

Universidad de Managua. UdeM

TEMA 4 FASE ESTADÍSTICO-ANALÍTICA: RECURSOS PARA EL ANÁLISIS DE DATOS

Prueba de Hipótesis. Bondad de Ajuste. Tuesday, August 5, 14

INDICE 1. Introducción 2. Recolección de Datos Caso de estudio

PRÓLOGO Quimiometría Alimentaria, SPSS Editor de datos, Visor de datos Visor de variables; Visor de resultados SPSS

Transcripción:

Facultad de Ciencias Económicas y Empresariales. Universidad de Valladolid 1 Statgraphics Centurión I.- Nociones básicas El paquete Statgraphics Centurión es un programa para el análisis estadístico que trabaja bajo Windows, presentando una estructura común a la de todos los programas que trabajan en dicho entorno. Una vez que se ha accedido al programa, presionando sobre su icono en el Escritorio o por el Menú de Inicio, y tras los títulos, aparece la pantalla principal, Ventana de Aplicaciones, con los siguientes elementos: 1. En la parte superior se muestra la barra de menú con 14 encabezamientos (14 grupos de procedimientos) y a continuación aparece la Barra de Herramientas (iconos que permiten realizar con rapidez algunas de las operaciones más usuales). Mediante el ratón se activa cada uno de ellos, desplegándose una ventana con una serie de procedimientos; los señalados con el símbolo,, incluyen una segunda ventana desplegable. Los 14 encabezamientos son:

Facultad de Ciencias Económicas y Empresariales. Universidad de Valladolid 2 ARCHIVO Abrir, cerrar y salvar ficheros de datos, StatFolios, StatGallerys y StatReports, imprimir y salir del programa, entre otras operaciones. EDITAR Copiar, cortar, pegar y borrar textos y gráficos, cambiar el formato y modificar las columnas de la hoja de cálculo. GRAFICAR: Proporciona distintas representaciones gráficas de los datos y de las distribuciones teóricas

Facultad de Ciencias Económicas y Empresariales. Universidad de Valladolid 3 DESCRIBIR Métodos de análisis sobre una o más variables, cuantitativas o cualitativas: medidas descriptivas, intervalos y contrastes, correlación, tablas de contingencia, etc. COMPARAR Permite comparar dos o más muestras. RELACIONAR Procedimientos de análisis de regresión, con uno o más factores. Análisis discriminante, etc.

Facultad de Ciencias Económicas y Empresariales. Universidad de Valladolid 4 PRONÓSTICOS Permite hacer predicciones de series de tiempo. CEP Diversos procedimientos de control de calidad. DDE Procedimientos relacionados con el diseño de experimentos.

Facultad de Ciencias Económicas y Empresariales. Universidad de Valladolid 5 SNAP STATS Permite el análisis de una o más muestras. Ajuste y predicción. Herramientas Tamaños muestrales; Distribuciones en el muestreo; Simulación de Monte Carlo VER Activa o desactiva la visualización de distintos elementos de la pantalla, como la barra de herramientas y la barra de estado.

Facultad de Ciencias Económicas y Empresariales. Universidad de Valladolid 6 VENTANA Permite seleccionar ventanas visualizarlas diferentes formas. y de AYUDA Permite acceder a la ayuda del programa. 2. En la parte central de la pantalla aparece la Ventana de Datos que es una hoja de cálculo sobre la que se dispondrán los datos, en filas los individuos o casos y en columnas las características o variables. Seleccionando una columna y con el botón derecho del ratón se puede modificar la variable elegida, generar nuevos datos a partir de ella, o recodificarla.

Facultad de Ciencias Económicas y Empresariales. Universidad de Valladolid 7 3. En la parte izquierda y en la inferior aparecen sin desplegar distintas ventanas denominadas: Commentarios del Statfolio, ventana en la que se podrán introducir los comentarios acerca del análisis. StatAdvisor, ayudante estadístico que proporciona una interpretación estadística de los resultados obtenidos en los análisis. StatGallery, ventana organizada en cuadrícula en la que se pueden incorporar resultados de texto y gráficos. StatReporter, procesador de textos en el que se podrá realizar un informe final, pudiendo incorporar comentarios, resultados y gráficos. Además, tras elegir en la barra de herramientas un determinado procedimiento se abrirá un cuadro de diálogo denominado Tablas y Gráficos que muestra los procedimientos que se pueden realizar. Por ejemplo, al elegir Graficar Distribuciones de probabilidad y aceptando las opciones por defecto:

Facultad de Ciencias Económicas y Empresariales. Universidad de Valladolid 8 Una vez elegidas las opciones en la ventana anterior se abrirá una nueva ventana, Ventana de Análisis, con los resultados del mismo y que incorpora una barra de herramientas con distintos iconos. En principio esta nueva ventana aparecerá dividida en dos paneles. El de la izquierda contendrá resultados en texto, mientras que el de la derecha mostrará gráficos de apoyo para la interpretación de dichos resultados. A cada uno de los paneles se accederá haciendo un doble click en el botón izquierdo del ratón. Más adelante se describe el funcionamiento de la Ventana de Datos para procedimientos concretos. El primero de los iconos de esta ventana, el más a la izquierda, permite seleccionar otras variables o distribuciones para repetir el mismo análisis. El segundo, Opciones de Análisis, proporciona diferentes opciones del análisis a realizar. En el tercero, Tablas y Gráficos, se puede volver a la ventana de diálogo anterior para elegir distintos tipos de procedimientos, como ya hemos comentado anteriormente. En el cuarto, Opciones de Ventana, aparecen diferentes opciones para el procedimiento concreto que hayamos elegido y, por último, se pueden almacenar ciertos resultados en la ventana de datos en Guardar Resultados. Las distintas ventanas se pueden guardar para ser recuperadas posteriormente. La Ventana de Datos se almacena como un fichero con extensión.sgd, la StatGallery con extensión.sgg y la StatReport con extensión.rtf. También se puede guardar todo un entorno de trabajo, datos, análisis y comentarios, lo que constituye un StatFolio; en este caso, el fichero ha de tener una extensión.sgp.

Facultad de Ciencias Económicas y Empresariales. Universidad de Valladolid 9 II. Distribuciones de Probabilidad Para analizar las distintas distribuciones tipo, ver gráficamente sus funciones de distribución y de probabilidad o densidad, visualizar algunas de sus propiedades, calcular probabilidades y valores, y obtener una muestra de valores (números aleatorios), utilizaremos el procedimiento Distribuciones de Probabilidad. Para acceder al mismo se pueden seguir dos rutas: Describir Ajuste de Distribuciones Distribuciones de Probabilidad, o también desde Graficar Distribuciones de Probabilidad. Una vez se accede a este procedimiento, bien por Descripción o bien por Gráficar, un cuadro de diálogo permite seleccionar una de entre las 46 distribuciones tipo.

Facultad de Ciencias Económicas y Empresariales. Universidad de Valladolid 10 Realizada la selección, se abre otra ventana para fijar los parámetros asociados a la distribución escogida. Statgraphics permite estudiar dicha distribución con cinco combinaciones de parámetros distintas. A continuación se eligen en el panel de Tablas y Gráficos los procedimientos de interés TABLAS La opción Resumen del Análisis, muestra los parámetros de la distribución y la explicación que proporciona el StatAdvisor de este procedimiento. La opción Distribuciones Acumuladas, proporciona: la probabilidad que la distribución deja a la izquierda y a la derecha de un determinado valor y la probabilidad o densidad en dicho valor. En la ventana de resultados, presionando el botón derecho del ratón se abre un cuadro de diálogo que contiene, entre otras, las Opciones de Análisis, que nos permite cambiar los parámetros de la distribución, como hemos visto. Asimismo aparecen las Opciones de Ventana que permiten dar distintos valores según sea el procedimiento elegido.

Facultad de Ciencias Económicas y Empresariales. Universidad de Valladolid 11 Elegida la opción Distribuciones Acumuladas Inversas, en el panel de la izquierda aparecen los resultados del procedimiento inverso; esto es, dado un valor de probabilidad p, el procedimiento devuelve el valor x tal que p[x x]=p. Igual que en el procedimiento anterior, en la ventana de resultados las Opciones de Ventana y las Opciones de Análisis permiten introducir distintos valores de probabilidad y distintos parámetros, respectivamente. El último procedimiento, Números Aleatorios genera una muestra de números aleatorios de la distribución para unos parámetros determinados. En Opciones de Ventana se indica el tamaño de la muestra y en Opciones de Análisis, podremos cambiar los valores de los parámetros. Creada la muestra, se puede guardar presionando Guardar los Resultados; la muestra pasa a ser una variable, denominada por defecto RAND1, en la Ventana de Datos. GRÁFICOS De la misma forma se puede elegir entre diferentes opciones gráficas como la función de densidad o de distribución entre otras. En estas gráficas se pueden superponer hasta cinco funciones del mismo tipo. Las gráficas creadas se pueden copiar en StatGallery (o en StatReport) presionando el botón derecho del ratón sobre la gráfica y se selecciona Copiar Ventana a StatGallery; una vez en StatGallery, se presiona de nuevo sobre una de sus cuadrículas y se selecciona Pegar o Pegar Vinculo. Este procedimiento puede ser utilizado para superponer gráficas correspondientes a distintos tipos de función o a distintos tipos de distribución. Elegidos los procedimientos y gráficos, el programa crea una Ventana de Análisis, dividida, de entrada, en tantos paneles como procedimientos se hayan elegido. Si nos quedamos con las opciones marcadas por defecto, en el de la izquierda, aparecerá el resumen del análisis, así como la distribución acumulada y en el de la derecha, la función de probabilidad o de densidad y la de distribución para los parámetros elegidos. Los procedimientos englobados en Distribuciones de Probabilidad no requieren una base de datos previa.

Facultad de Ciencias Económicas y Empresariales. Universidad de Valladolid 12 Ejercicios: a) Obtener las gráficas de la función de probabilidad y de distribución de una variable discreta, por ejemplo Binomial; comprobar sus propiedades y la relación entre ambas funciones. Hacer lo mismo con una variable continua, por ejemplo, Gamma. b) Obtener las gráficas de la función de probabilidad o de densidad y de distribución de algunas de las distribuciones tipo, utilizando distintos valores de los parámetros para ver cómo influyen en su forma y en sus principales resúmenes (media, moda, mediana, varianza, ). c) Comprobar con alguna distribución tipo (Binomial, Poisson, Chi-cuadrado, etc.) cómo el aumento en alguno de sus parámetros conduce a distribuciones muy próximas a la normal. d) Calcular probabilidades y valores críticos de algunas de las distribuciones tipo con la ayuda del programa y comparar los resultados obtenidos en las tablas estadísticas. III. Intervalos de Confianza y Contrastes de Hipótesis Paramétricas Los estudiaremos trabajando con un ejemplo. 1.- Seleccionar el fichero de trabajo: la secuencia Archivo Abrir Abrir Datos abre un cuadro de dialogo en el que hay que elegir el tipo de fichero que se quiere abrir Una vez seleccionado elegimos el fichero 93cars.sgd y vemos el contenido del fichero en la ventana de datos, es decir, en la hoja de cálculo del programa. III.1. Poblaciones normales Los intervalos de confianza y los contrastes de hipótesis sobre los parámetros (media y desviación) de una población normal se obtienen siguiendo la secuencia Describir Datos Numéricos Análisis de una Variable, para introducir (con ) a continuación la variable a analizar en Datos. Por ejemplo, elegimos la variable MPGCity

Facultad de Ciencias Económicas y Empresariales. Universidad de Valladolid 13 En la opción de Tablas y Gráficos se eligen los procedimientos de Intervalos de Confianza y Prueba de Hipótesis. Dentro de cada ventana accionando el botón derecho del ratón en Opciones de Ventana, se puede elegir el nivel de confianza, en un caso, y el nivel de significación, el valor del parámetro en la hipótesis nula, el tipo de contraste y el sentido (bilateral o unilateral) de las hipótesis, en el otro. 2. En concreto, obtener una estimación puntual y por intervalo, al 95%, para el consumo medio de los automóviles en ciudad (MPG City), suponiendo que dicha variable sigue una distribución normal. Se puede afirmar, a nivel 0.05, que dicho consumo es de 23 millas por galón? En caso de rechazar dicha hipótesis, que podemos afirmar sobre dicho consumo medio?

Facultad de Ciencias Económicas y Empresariales. Universidad de Valladolid 14 Analizar, por un lado, el efecto que tiene sobre el intervalo una disminución en el nivel de confianza (90%) y, por otro, el efecto que tiene sobre el contraste de hipótesis exigir un nivel de significación menor (0.01). Intervalos de Confianza para MPG City Intervalos de confianza del 90,0% para la media: 22,3656 +/- 0,968286 [21,3973; 23,3339] Intervalos de confianza del 90,0% para la desviación estándar: [5,01802; 6,40249] El StatAdvisor Este panel muestra los intervalos de confianza del 90,0% para la media y la desviación estándar de MPG City. La interpretación clásica de estos intervalos es que, en muestreos repetidos, estos intervalos contendrán la media verdadera ó la desviación estándar verdadera de la población de la que fueron extraídas las muestras, el 90,0% de las veces. En términos prácticos, puede establecerse con 90,0% de confianza, que la media verdadera de MPG City se encuentra en algún lugar entre 21,3973 y 23,3339, en tanto que la desviación estándar verdadera está en algún lugar entre 5,01802 y 6,40249. Ambos intervalos asumen que la población de la cual proviene la muestra puede representarse por la distribución normal. Mientras que el intervalo de confianza para la media es bastante robusto y no muy sensible a violaciones de este supuesto, los intervalos de confianza para la desviación estándar son muy sensibles. Si los datos no provienen de una distribución normal, el intervalo para la desviación estándar puede ser incorrecto. Para verificar si los datos provienen de una distribución normal, seleccione Resumen Estadístico de la lista de Opciones Tabulares, ó escoja Gráfica de Probabilidad Normal de la lista de Opciones Gráficas. Prueba de Hipótesis para MPG City Media Muestral = 22,3656 Mediana Muestral = 21,0 Desviación Estándar de la Muestra = 5,61981 Prueba t Hipótesis Nula: media = 23,0 Alternativa: no igual Estadístico t = -1,08865 Valor-P = 0,279151 No se rechaza la hipótesis nula para alfa = 0,01. El StatAdvisor Esta ventana muestra los resultados de las pruebas relativas a la población de la cual procede la muestra de MPG City. La prueba-t evalúa la hipótesis de que la media de MPG City es igual a 23,0 versus la hipótesis alterna de que la media de MPG City es no igual a 23,0. Debido a que el valor-p para esta prueba es mayor o igual a 0,01, no se puede rechazar la hipótesis nula, con un nivel de confianza del 99,0% de confianza. Analizar los cambios en el p-valor para las distintas determinaciones de la hipótesis alternativa (Diferente de, Menor que, o Mayor que). Prueba de Hipótesis para MPG City Media Muestral = 22,3656 Mediana Muestral = 21,0 Desviación Estándar de la Muestra = 5,61981 Prueba t Hipótesis Nula: media = 23,0 Alternativa: menor que Estadístico t = -1,08865 Valor-P = 0,139576 No se rechaza la hipótesis nula para alfa = 0,01. El StatAdvisor Esta ventana muestra los resultados de las pruebas relativas a la población de la cual procede la muestra de MPG City. La prueba-t evalúa la hipótesis de que la media de MPG City es igual a 23,0 versus la hipótesis alterna de que la media de MPG City es menor que 23,0. Debido a que el valor-p para esta prueba es mayor o igual a 0,01, no se puede rechazar la hipótesis nula, con un nivel de confianza del 99,0% de confianza. Prueba de Hipótesis para MPG City Media Muestral = 22,3656 Mediana Muestral = 21,0 Desviación Estándar de la Muestra = 5,61981 Prueba t Hipótesis Nula: media = 23,0 Alternativa: mayor que Estadístico t = -1,08865 Valor-P = 0,860424 No se rechaza la hipótesis nula para alfa = 0,01. El StatAdvisor Esta ventana muestra los resultados de las pruebas relativas a la población de la cual procede la muestra de MPG City. La prueba-t evalúa la hipótesis de que la media de MPG City es igual a 23,0 versus la hipótesis alterna de que la media de MPG City es mayor que 23,0. Debido a que el valor-p para esta prueba es mayor o igual a 0,01, no se puede rechazar la hipótesis nula, con un nivel de confianza del 99,0% de confianza.

Facultad de Ciencias Económicas y Empresariales. Universidad de Valladolid 15 Los intervalos de confianza y los contrastes de hipótesis para la diferencia de medias y el cociente de varianzas en poblaciones normales independientes están disponibles siguiendo la secuencia Comparar Dos Muestras Muestras Independientes. Los datos se pueden introducir de dos formas, según cómo estén disponibles en el fichero: cada muestra en una columna o una columna con la variable cuantitativa y otra columna con la variable categórica que determina las dos muestras. Ejecutado el procedimiento, se selecciona Comparación de Medias y Comparación de Desviaciones Estándar en Tablas y Gráficos. Como siempre las Opciones de Ventana nos permiten elegir, en cada caso, el nivel de significación y las hipótesis a contrastar. Como opciones gráficas podemos visualizar los histogramas enfrentados y el diagrama de caja múltiple de los datos. 3. Podemos afirmar, para α=0.1, que los automóviles americanos tienen, por término medio, un consumo igual al del resto de los automóviles? Utilizar para ello un intervalo de confianza y un contraste suponiendo que la variable, en las dos situaciones, sigue una distribución normal. Con la secuencia Comparar Dos Muestras Muestras Independientes y elegida la opción Columna de Códigos y Datos, se seleccionará la variable MPG City, en Datos, y la variable Domestic, en Código de Muestra. Ojo: ver previamente que varianzas

Facultad de Ciencias Económicas y Empresariales. Universidad de Valladolid 16 Los intervalos de confianza y los contrastes de hipótesis para la diferencia de medias en poblaciones normales pareadas están disponibles siguiendo la secuencia Comparar Dos Muestras Muestras Pareadas. En datos se introducen las dos muestras y en Tablas y Gráficos se eligen los procedimientos Intervalos de Confianza y Prueba de Hipótesis. En Opciones de Ventana podemos elegir, en cada caso, el nivel de confianza, de significación y las hipótesis a contrastar. 4. Es aceptable que la diferencia de consumo en carretera frente al consumo en ciudad es de 5 MPG?

Facultad de Ciencias Económicas y Empresariales. Universidad de Valladolid 17 III.2. Poblaciones no necesariamente normales En Statgraphics Centurión se pueden obtener intervalos de confianza y contrastes de hipótesis además de para poblaciones normales (medias y desviaciones), para proporciones y para la media de una variable de Poisson (tasa), con una y dos muestras, utilizando como datos de entrada los resúmenes estadísticos de las muestras. Así, la secuencia Describir Datos Numéricos Pruebas de Hipótesis permite obtener contrastes de hipótesis sobre la media y la varianza de una población normal, sobre una proporción y sobre la media de una variable de Poisson. En estos casos se introducen como datos los resúmenes correspondientes (media y desviación muestral, proporción muestral o media muestral, según el caso) y el tamaño de la muestra. El procedimiento permite elegir el nivel de significación y las hipótesis. De la misma forma, en Comparar Dos Muestras Pruebas de Hipótesis se obtienen los contrastes de diferencia de medias y de razón de varianzas, para poblaciones normales, así como de diferencia de proporciones y diferencia de tasas de Poisson. Tanto para una muestra como para dos muestras los procedimientos permiten visualizar la función de potencia de los contrastes. 5. Se sospecha que hay más automóviles con cambio manual (Manual) que con cambio automático es cierta la sospecha para α=0.01? Previamente hacemos un análisis de la variable Manual para obtener los resúmenes que debemos introducir al hacer el contraste. Así, Resumen Estadístico para Manual Recuento 93 Promedio 0,655914 Desviación Estándar 0,477644 Coeficiente de Variación 72,8212% Mínimo 0 Máximo 1,0 Rango 1,0 Sesgo Estandarizado -2,62675 Curtosis Estandarizada -3,12896 El StatAdvisor Esta tabla muestra los estadísticos de resumen para Manual. Incluye medidas de tendencia central, medidas de variabilidad y medidas de forma. De particular interés aquí son el sesgo estandarizado y la curtosis estandarizada, las cuales pueden utilizarse para determinar si la muestra proviene de una distribución normal. Valores de estos estadísticos fuera del rango de -2 a +2 indican desviaciones significativas de la normalidad, lo que tendería a invalidar cualquier prueba estadística con referencia a la desviación estándar. En este caso, el valor de sesgo estandarizado no se encuentra dentro del rango esperado para datos provenientes de una distribución normal. El valor de curtosis estandarizada no se encuentra dentro del rango esperado para datos provenientes de una distribución normal. Con la secuencia Describir Datos Numéricos Pruebas de Hipótesis se selecciona Proporción binomial, hipótesis nula, proporción muestral (en este caso 0.655914) y tamaño muestral (en este caso 93)

Facultad de Ciencias Económicas y Empresariales. Universidad de Valladolid 18 6. Contrasta si la proporción de coches con cambio manual es la misma entre los coches americanos y los no americanos α=0.05. Previamente hacemos un análisis de la variable Manual según Domestic, así, Resumen Estadístico para Manual Domestic=0 Domestic=1 Recuento 45 48 Promedio 0,866667 0,458333 Desviación Estándar 0,343776 0,503534 Coeficiente de Variación 39,6664% 109,862% Mínimo 0 0 Máximo 1,0 1,0 Rango 1,0 1,0 Sesgo Estandarizado -6,11365 0,488448 Curtosis Estandarizada 4,27274-2,91012 El StatAdvisor Esta tabla contiene el resumen estadístico para las dos muestras de datos. Pueden utilizarse otras opciones tabulares, dentro de este análisis, para evaluar si las diferencias entre los estadísticos de las dos muestras son estadísticamente significativas. De particular interés son el sesgo estandarizado y la curtosis estandarizada que pueden usarse para comparar si las muestras provienen de distribuciones normales. Valores de estos estadísticos fuera del rango de -2 a +2 indican desviaciones significativas de la normalidad, lo que tendería a invalidar las pruebas que comparan las desviaciones estándar. En este caso, Domestic=0 tiene un valor de sesgo estandarizado fuera del rango normal. Ambas muestras tienen valores de curtosis estandarizada fuera del rango normal.

Facultad de Ciencias Económicas y Empresariales. Universidad de Valladolid 19 Con la secuencia Comparar Dos Muestras Pruebas de Hipótesis se selecciona Proporción binomial, hipótesis nula, proporción muestral (en este caso 0.866667 y 0.458333) y tamaño muestral (en este caso 45 y 48) III.3. Determinación del tamaño muestral Con la secuencia Herramientas Determinación del Tamaño de la Muestra Una Muestra se obtiene el tamaño muestral necesario para conseguir una precisión y una fiabilidad determinadas del intervalo de confianza o para conseguir un cierto valor de la potencia del contraste de hipótesis. 7. A cuantos individuos debo preguntar para estimar la proporción de fumadores en un grupo con un error de ± 4% y una confianza del 95%.

Facultad de Ciencias Económicas y Empresariales. Universidad de Valladolid 20 La secuencia Herramientas Determinación del Tamaño de la Muestra Dos Muestras permite obtener el tamaño muestral necesario para conseguir una precisión y una fiabilidad determinadas o para conseguir una cierta potencia en la comparación de poblaciones.

Facultad de Ciencias Económicas y Empresariales. Universidad de Valladolid 21 IV. Contrastes de Hipótesis No Paramétricas 1. Podemos aceptar, a un nivel de 0.05, que la variable MPGCity sigue una distribución Normal? Se trata de un contraste de bondad de ajuste que se puede realizar mediante el test de 2 bondad de ajuste χ (utilizando datos agrupados, con la consiguiente pérdida de información) o mediante el test de bondad de ajuste de Kolmogorov-Smirnov, más adecuado en este caso. Para ello, se sigue la secuencia Describir Ajuste de Distribuciones Ajuste de Datos no Censurados y después de introducir la variable a analizar y la distribución que queremos ajustar (la Normal), en Tablas y Gráficos se selecciona Pruebas de Bondad de Ajuste. El programa proporciona el test de Kolmogorov-Smirnov, calculando el valor muestral del estadístico D n y el p-valor. También pueden seleccionarse las opciones de gráficos para representar: a) el histograma junto con la función de densidad teórica; b) la función de distribución empírica junto con la función de distribución teórica; c) el Q-Q plot 2 Si además se desea realizar el el test de bondad de ajuste de la χ se debe escoger éste en Opciones de Ventana, eligiendo, si se quiere, las clases equiprobables o no. En esta misma ventana debe elegirse la opción calcular valores-p para distribuciones específicas para obtener el p-valor correspondiente al contraste específico de normalidad de Lilliefors

Facultad de Ciencias Económicas y Empresariales. Universidad de Valladolid 22 La salida muestra la tabla con las frecuencias observadas y esperadas, el valor muestral del 2 estadístico χ y correspondiente el p-valor. Además aparecen también los valores muestrales de los estadísticos D n y nd n de Kolmogorov-Smirnov y el p-valor señalado con * correspondiente a haber utilizado las tablas específicas del contraste de Normalidad de Lilliefors. 2. Si la suposición de normalidad sobre el consumo de los coches americanos y sobre el consumo del resto de los automóviles no se puede aceptar, contrastar mediante una prueba no paramétrica si existen diferencias en el consumo según el origen del automóvil. Una posible forma de resolver este contraste de igualdad de distribuciones es mediante el test de Kolmogorov-Smirnov para dos muestras, que se obtiene siguiendo la secuencia Comparar Dos Muestras/ Muestras Independientes. A continuación, se introduce la variable MPG City y en código de Muestra la variable Domestic y en Tablas y Gráficos se selecciona Prueba de Kolmogorov-Smirnov Test.

Facultad de Ciencias Económicas y Empresariales. Universidad de Valladolid 23 El procedimiento proporciona la salida con los valores muestrales de los estadísticos D n 1,n y 2 n1n n + 1 2 D n 1, n n2 para las dos muestras. 2 y el p-valor resultante. Como opción gráfica se pueden mostrar los cuantiles 3. Podemos afirmar, a un nivel de 0.01, que el nivel de consumo y el origen del automóvil son independientes? Agrupar la variable MPG City en cuatro niveles, consumo alto, MPG 20, consumo medioalto, 20<MPG 25, consumo medio-bajo, 25<MPG 35, y consumo bajo, MPG>35. Para ello, copiar la variable MPG con el nombre NIVMPG, seleccionarla, abrir una ventana con el botón derecho del ratón y elegir Recodificar Datos. Recodificar la variable NIVMPG especificando los límites de los intervalos: 0-20, nuevo valor 1, 20-25, nuevo valor 2, etc.

Facultad de Ciencias Económicas y Empresariales. Universidad de Valladolid 24 Para realizar el test de independencia de la χ 2 de Pearson se sigue la secuencia Describir Datos Categóricos Tabulación Cruzada, introduciendo la variable NIVMPG y la variable Domestic. En Tablas y Gráficos se selecciona Tabla de Frecuencias y Prueba de Independencia. En las ventanas de texto aparecen la tabla cruzada de las dos características (Opciones de Ventana permite incluir en la tabla los porcentajes por filas, por columnas, totales, valores 2 esperados, etc.), el valor muestral del estadístico χ y el p-valor correspondiente.