Además de la interfaz de los análisis estadísticos, SPSS para Windows proporciona:

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Además de la interfaz de los análisis estadísticos, SPSS para Windows proporciona:"

Transcripción

1 SPSS Descripción de SPSS... 3 Sintaxis de comandos... 3 Estructura interna de SPSS... 4 Módulo Base de SPSS... 5 Frecuencias... 5 Descriptivos... 5 Explorar... 5 Tablas de contingencia... 5 Resumir... 6 Medias... 6 Prueba T para muestras independientes... 6 Prueba T para muestras relacionadas... 6 Prueba T una muestra... 6 ANOVA de un factor...6 MLG Univariante... 7 Correlaciones bivariadas... 7 Correlaciones parciales... 7 Distancias... 7 Regresión lineal... 7 Estimación curvilínea... 7 Análisis discriminante... 8 Análisis factorial... 8 Análisis de conglomerados... 8 Prueba de chi-cuadrado... 9 Prueba binomial... 9 Prueba de rachas... 9 Prueba de Kolmogorov-Smirnov para una muestra... 9 Pruebas para dos muestras independientes... 9 Pruebas para dos muestras relacionadas Pruebas para varias muestras independientes Pruebas para varias muestras relacionadas Frecuencias de respuestas múltiples Tablas de contingencia de respuestas múltiples Análisis de fiabilidad Escalamiento multidimensional Estadísticos de la razón Módulo Modelos Avanzados Análisis MLG multivariante Análisis de Componentes de la Varianza Modelos lineales mixtos Análisis LogLineal Análisis loglineal general Análisis loglineal logit... 12

2 Regresión ordinal Tablas de mortalidad Análisis de supervivencia de Kaplan-Meier Regresión de Cox Módulo Modelos de Regresión Regresión logística Regresión logística multinomial Análisis probit Estimación ponderada Regresión por mínimos cuadrados en dos fases Módulo Categorías Escalamiento óptimo mediante mínimos cuadrados alternantes Regresión categórica Análisis de componentes principales categórico (CATPCA) Análisis de correlación canónica no lineal Análisis de correspondencias Análisis de homogeneidad Escalamiento multidimensional (PROXSCAL) Módulo Tablas Generación de tablas Conjuntos de respuestas múltiples Reglas básicas y limitaciones para generar una tabla Características generales del módulo BASE de SPSS Ventana del editor de datos de SPSS Tipos de ficheros Tipos de ventanas Iniciar una sesión con SPSS Ficheros de datos en SPSS

3 Descripción de SPSS SPSS para Windows proporciona un poderoso sistema de análisis estadístico y de gestión de datos en un entorno gráfico, utilizando menús descriptivos y cuadros de diálogo sencillos que realizan la mayor parte del trabajo. La mayoría de las tareas se pueden llevar a cabo simplemente situando el puntero del ratón en el lugar deseado y pulsando en el botón, aunque siempre es posible también la utilización de la sintaxis de SPSS que permite la programación de las órdenes que se desea que repita el programa. Además de la interfaz de los análisis estadísticos, SPSS para Windows proporciona: Editor de datos. Ventana similar a una hoja de cálculo, que permite definir, introducir, editar y presentar datos. Visor. Ventana mediante la cual es posible examinar los resultados, mostrarlos y ocultarlos de forma selectiva, modificar el orden de presentación y desplazar tablas y gráficos entre SPSS y otras aplicaciones. Tablas pivote multidimensionales. Gran parte de los resultados que proporciona SPSS vienen dados en forma de tabla. Las tablas pivote multidimensionales de SPSS permiten reorganizar filas, columnas y capas. Las capas en las tablas permiten la fácil comparación de resultados entre los diferentes grupos que se analicen. Gráficos de alta resolución. Como funciones básicas de SPSS se incluyen gráficos de sectores, gráficos de barras, histogramas, diagramas de dispersión y gráficos 3-D de alta resolución. Acceso a bases de datos. SPSS permite el acceso a cualquier base de datos. La utilización de esta importante característica del programa es inmediata gracias al Asistente para bases de datos implementado. Transformaciones de los datos. Las funciones de transformación permiten preparar los datos para el análisis. Estas funciones permiten crear subgrupos de datos, combinar categorías, añadir, agregar, fusionar, segmentar y transponer archivos, entre muchas otras posibilidades. Distribución electrónica. Se pueden enviar informes por correo electrónico pulsando en un botón o exportar tablas y gráficos en formato HTML para distribuirlos por Internet o dentro de una Intranet. Ayuda en pantalla. SPSS dispone de un importante sistema de ayuda. Durante la ejecución del programa la ayuda muestra una serie de cuadros de diálogo que permiten la ejecución de tareas específicas. Se dispone también de información referente a los resultados de las tablas pivote explicando términos estadísticos. Además, SPSS muestra una serie de ejemplos sobre el modo de utilizar los procedimientos estadísticos e interpretar los resultados. Sintaxis de comandos Como ya hemos indicado, es posible acceder a la mayoría de los comando desde los menús y cuadros de diálogo. No obstante, algunas órdenes sólo están disponibles mediante el uso del lenguaje de comandos. El lenguaje de comandos también permite guardar los trabajos en un archivo de sintaxis, con lo que es posible repetir los análisis 3

4 en otro momento o ejecutarlos en un trabajo automatizado con la Unidad de producción. Un archivo de sintaxis es simplemente un archivo de texto que contiene comandos. Aunque es posible abrir una ventana de sintaxis y escribir comandos, es más sencillo permitir que el programa ayude a construir un archivo de sintaxis mediante uno de los siguientes métodos: Pegando la sintaxis de comandos desde los cuadros de diálogo (opción pegar) Creando un archivo de sintaxis En los ficheros de ayuda en pantalla de un procedimiento determinado, siempre aparece el vínculo sintaxis de comandos en la lista de Temas relacionados. Esta opción permite acceder al diagrama de sintaxis correspondiente al comando en uso. También se dispone de una completa información sobre el lenguaje de comandos en el manual de referencia de sintaxis (SPSS Base Syntax Reference Guide). Estructura interna de SPSS SPSS está formado por cinco bloques, que reciben el nombre de módulos, cada uno de ellos especializado en una rama de la estadística: Módulo base, permite la generación y manipulación de datos y ficheros y la generación de gráficos de alta resolución. Con este módulo se llevan a cabo los análisis estadísticos elementales Módulo Modelos de Regresión, donde se consideran una gran parte de técnicas estadísticas de regresión Módulo Modelos Avanzados, se estudian los diferentes modelos de análisis de la varianza y diseño de experimentos así como tablas de mortalidad y análisis de supervivencia Módulo Categorías, dedicado a los análisis de componentes principales, de correlación canónica, de correspondencias, de homogeneidad y técnicas de Multidimensional Scaling Módulo Tablas, permite la generación de tablas Módulo Tendencias, utilizado para el análisis de series temporales Módulo Análisis Conjunto, para el diseño de experimentos Procedemos a continuación a describir brevemente los análisis implementados en los primeros 5 módulos: 4

5 Módulo Base de SPSS Frecuencias El procedimiento Frecuencias proporciona estadísticos y representaciones gráficas que resultan útiles para describir muchos tipos de variables. Es un buen procedimiento para una inspección inicial de los datos. Descriptivos El procedimiento Descriptivos muestra estadísticos descriptivos univariantes para el grupo de variables especificado en una única tabla y calcula valores tipificados (puntuaciones z). Explorar El procedimiento Explorar genera estadísticos de resumen y representaciones gráficas, bien para todos los casos o bien de forma separada para grupos de casos. En general, el Análisis Exploratorio de Datos permite para inspeccionar los datos, identificar valores atípicos, obtener descripciones, comprobar supuestos y caracterizar diferencias entre subpoblaciones (grupos de casos). La inspección de los datos puede mostrar que existen valores inusuales, valores extremos, discontinuidades en los datos u otras peculiaridades. Además, la aplicación de estas técnicas puede ayudar a determinar si son adecuadas los procedimentos estadísticos que se van a aplicar. La exploración puede indicar que necesita transformar los datos si la técnica necesita una distribución normal. O bien, el usuario puede decidir que necesita utilizar pruebas no paramétricas. Tablas de contingencia El procedimiento Tablas de contingencia crea tablas de clasificación doble y múltiple y proporciona una serie de pruebas y medidas de asociación para las tablas de doble vía. La estructura de la tabla y el hecho de que las categorías estén ordenadas o no, determinan las pruebas o medidas que se utilizan. Los estadísticos de tablas de contingencia y las medidas de asociación sólo se calculan para las tablas de doble vía. Si se especifica una fila, una columna y un factor de capa (variable de control), el procedimiento Tablas de contingencia crea un panel de medidas y estadísticos asociados a cada valor del factor de capa (o una combinación de valores para dos o más variables de control). Por ejemplo, si sexo es un factor de capa para una tabla de casado (sí, no) en función de vida (vida emocionante, rutinaria o aburrida), los resultados para una tabla de doble clasificación para las mujeres se calculan de forma independiente de los resultados de los hombres y se imprimen en paneles uno detrás del otro. 5

6 Resumir El procedimiento Resumir calcula estadísticos de subgrupo para las variables dentro de las categorías de una o más variables de agrupación, cruzando todos los niveles de las variables de agrupación. Es posible definir el orden en el que se mostrarán los estadísticos. También se muestran estadísticos de resumen para cada variable a través de todas las Medias El procedimiento Medias calcula medias de subgrupo y estadísticos para variables dependientes dentro de las categorías de una o más variables independientes. Prueba T para muestras independientes El procedimiento Prueba T para muestras independientes compara las medias de dos grupos de casos. Para esta prueba, idealmente los sujetos deben asignarse aleatoriamente a dos grupos, de forma que cualquier diferencia en la respuesta sea debida al tratamiento (o falta de tratamiento) y no a otros factores. Prueba T para muestras relacionadas El procedimiento Prueba T para muestras relacionadas compara las medias de dos variables de un solo grupo. Calcula las diferencias entre los valores de las dos variables de cada caso y contrasta si la media difiere de 0. Prueba T una muestra El procedimiento Prueba T para una muestra contrasta si la media de una sola variable difiere de una constante especificada. ANOVA de un factor El procedimiento ANOVA de un factor genera un análisis de varianza de un factor para una variable dependiente cuantitativa respecto a una única variable de factor (la variable independiente). El análisis de varianza se utiliza para contrastar la hipótesis de que varias medias son iguales. Esta técnica es una extensión de la prueba t para dos muestras. Además de determinar que existen diferencias entre las medias, es posible que desee saber qué medias difieren. Existen dos tipos de contrastes para comparar medias: a priori y post hoc. Los contrastes a priori se plantean antes de ejecutar el experimento y los contrastes post hoc se realizan después de haber llevado a cabo el experimento. También puede contrastar las tendencias existentes a través de las categorías. 6

7 MLG Univariante El procedimiento MLG Univariante proporciona un análisis de regresión y un análisis de varianza para una variable dependiente mediante uno o más factores o variables. Las variables de factor dividen la población en grupos. Con el procedimiento Modelo lineal general se pueden contrastar hipótesis nulas sobre los efectos de otras variables en las medias de varias agrupaciones de una única variable dependiente. Se pueden investigar las interacciones entre los factores así como los efectos de los factores individuales, algunos de los cuales pueden ser aleatorios. Además, se pueden incluir los efectos de las covariables y las interacciones de covariables con los factores. Para el análisis de regresión, las variables independientes (predictoras) se especifican como covariables. Correlaciones bivariadas El procedimiento Correlaciones bivariadas calcula el coeficiente de correlación de Pearson, la rho de Spearman y la tau-b de Kendall con sus niveles de significación. Las correlaciones miden cómo están relacionadas las variables o los órdenes de los rangos. Correlaciones parciales El procedimiento Correlaciones parciales calcula los coeficientes de correlación parcial, los cuales describen la relación lineal existente entre dos variables mientras se controlan los efectos de una o más variables adicionales. Distancias Este procedimiento calcula una variedad de estadísticos que miden las similaridades o disimilaridades (distancias), entre pares de variables o entre pares de casos. Estas medidas de similaridad o distancia se pueden utilizar después con otros procedimientos, como análisis factorial, análisis de conglomerados o escalamiento multidimensional, para ayudar en el análisis de conjuntos de datos complejos. Regresión lineal La regresión lineal estima los coeficientes de la ecuación lineal, con una o más variables independientes, que mejor prediga el valor de la variable dependiente. Estimación curvilínea El procedimiento Estimación Curvilínea genera estadísticos de estimación curvilínea por regresión y gráficos relacionados para 11 modelos diferentes de estimación curvilínea por regresión. Se produce un modelo diferente para cada variable dependiente. También se pueden guardar valores pronosticados, residuos e intervalos pronosticados como nuevas variables. 7

8 Análisis discriminante El análisis discriminante resulta útil para las situaciones en las que se desea construir un modelo predictivo para pronosticar el grupo de pertenencia de un caso a partir de las características observadas de cada caso. El procedimiento genera una función discriminante (o, para más de dos grupos, un conjunto de funciones discriminantes) basada en combinaciones lineales de las variables predictoras que proporcionan la mejor discriminación posible entre los grupos. Las funciones se generan a partir de una muestra de casos para los que se conoce el grupo de pertenencia; posteriormente, las funciones pueden ser aplicadas a nuevos casos que dispongan de medidas para las variables predictoras pero de los que se desconozca el grupo de pertenencia. Análisis factorial El análisis factorial intenta identificar variables subyacentes, o factores, que expliquen la configuración de las correlaciones dentro de un conjunto de variables observadas. El análisis factorial se suele utilizar en la reducción de los datos para identificar un pequeño número de factores que explique la mayoría de la varianza observada en un número mayor de variables manifiestas. También puede utilizarse para generar hipótesis relacionadas con los mecanismos causales o para inspeccionar las variables para análisis subsiguientes (por ejemplo, para identificar la colinealidad antes de realizar un análisis de regresión lineal). Análisis de conglomerados Análisis de conglomerados jerárquico Este procedimiento intenta identificar grupos relativamente homogéneos de casos (o de variables) basándose en las características seleccionadas, mediante un algoritmo que comienza con cada caso (o cada variable) en un conglomerado diferente y combina los conglomerados hasta que sólo queda uno. Es posible analizar las variables brutas o elegir de entre una variedad de transformaciones de estandarización. Las medidas de distancia o similaridad se generan mediante el procedimiento Proximidades. Los estadísticos se muestran en cada etapa para ayudar a seleccionar la mejor solución. Análisis de conglomerados de K-medias Este procedimiento intenta identificar grupos de casos relativamente homogéneos basándose en las características seleccionadas y utilizando un algoritmo que puede gestionar un gran número de casos. Sin embargo, el algoritmo requiere que el usuario especifique el número de conglomerados. Puede especificar los centros iniciales de los conglomerados si conoce de antemano dicha información. Se puede elegir uno de los dos métodos disponibles para clasificar los casos: la actualización de los centros de los conglomerado de forma iterativa o sólo la clasificación. Asimismo, se puede guardar la información relativa a la pertenencia a los conglomerados, la distancia y los centros de los conglomerados finales. Es posible etiquetar los resultados por casos mediante una variable. Además se pueden solicitar los estadísticos F de los análisis de varianza. 8

9 Selección de procedimientos para la conglomeración Los análisis de conglomerados se pueden realizar mediante los procedimientos de análisis de conglomerados en dos fases, jerárquico o de K-medias. Cada uno de estos procedimientos emplea un algoritmo distinto en la creación de conglomerados y contiene opciones que no están disponibles en los otros. Prueba de chi-cuadrado El procedimiento Prueba de chi-cuadrado tabula una variable en categorías y calcula un estadístico chi-cuadrado. Esta prueba de bondad de ajuste compara las frecuencias observadas y esperadas en cada categoría para contrastar si todas las categorías contienen la misma proporción de valores o si cada categoría contiene una proporción de valores especificada por el usuario. Prueba binomial El procedimiento Prueba binomial compara las frecuencias observadas de dos categorías de una variable dicotómica con las frecuencias esperadas en una distribución binomial con un parámetro de probabilidad especificado. Por defecto, el parámetro de probabilidad para ambos grupos es 0,5. Para cambiar las probabilidades, puede introducirse una proporción de prueba para el primer grupo. La probabilidad del segundo grupo será 1 menos la probabilidad especificada para el primer grupo. Prueba de rachas El procedimiento Prueba de rachas contrasta si es aleatorio el orden de aparición de dos valores de una variable. Una racha es una secuencia de observaciones similares. Una muestra con un número excesivamente grande o excesivamente pequeño de rachas sugiere que la muestra no es aleatoria. Prueba de Kolmogorov-Smirnov para una muestra El procedimiento Prueba de Kolmogorov-Smirnov para una muestra compara la función de distribución acumulada observada de una variable con una distribución teórica determinada, que puede ser la normal, la uniforme, la de Poisson o la exponencial. La Z de Kolmogorov-Smirnov se calcula a partir de la diferencia mayor (en valor absoluto) entre las funciones de distribución acumuladas teórica y observada. Esta prueba de bondad de ajuste contrasta si las observaciones podrían razonablemente proceder de la distribución especificada. Pruebas para dos muestras independientes El procedimiento Pruebas para dos muestras independientes compara dos grupos de casos existentes en una variable. 9

10 Pruebas para dos muestras relacionadas El procedimiento Pruebas para dos muestras relacionadas compara la igualdad entre las distribuciones de dos variables. Pruebas para varias muestras independientes El procedimiento Pruebas para varias muestras independientes compara dos o más grupos de casos respecto a una variable. Pruebas para varias muestras relacionadas El procedimiento Pruebas para varias muestras relacionadas compara las distribuciones de dos o más variables. Frecuencias de respuestas múltiples El procedimiento Frecuencias de respuestas múltiples produce tablas de frecuencias para conjuntos de respuestas múltiples. Tablas de contingencia de respuestas múltiples El procedimiento Tablas de contingencia de respuestas múltiples presenta en forma de tabla de contingencia conjuntos de respuestas múltiples, variables elementales o una combinación. También puede obtener porcentajes de casilla basados en casos o respuestas, modificar la gestión de los valores perdidos u obtener tablas de contingencia emparejadas. Análisis de fiabilidad El análisis de fiabilidad permite estudiar las propiedades de las escalas de medición y de los elementos que las constituyen. El procedimiento Análisis de fiabilidad calcula medidas de fiabilidad de escala utilizadas normalmente y proporciona información sobre las relaciones entre elementos individuales de la escala. Escalamiento multidimensional El escalamiento multidimensional trata de encontrar la estructura de un conjunto de medidas de distancia entre objetos o casos. Esto se logra asignando las observaciones a posiciones específicas en un espacio multidimensional de modo que las distancias entre los puntos en el espacio concuerden al máximo con las disimilaridades dadas. En muchos casos, las dimensiones de este espacio conceptual son interpretables y se pueden utilizar para comprender mejor de los datos. 10

11 Estadísticos de la razón El procedimiento Estadísticos de la razón proporciona una amplia lista de estadísticos de resumen para describir la razón entre dos variables de escala. Módulo Modelos Avanzados Análisis MLG multivariante. El procedimiento MLG Multivariante proporciona un análisis de regresión y un análisis de varianza para variables dependientes múltiples por una o más covariables o variables de factor. Las variables de factor dividen la población en grupos. Utilizando este procedimiento del modelo lineal general, es posible contrastar hipótesis nulas sobre los efectos de las variables de factor sobre las medias de varias agrupaciones de una distribución conjunta de variables dependientes. Asimismo, se pueden investigar las interacciones entre los factores y también los efectos individuales de los factores. Además, se pueden incluir los efectos de las covariables y las interacciones de covariables con los factores. Para el análisis de regresión, las variables independientes (predictoras) se especifican como covariables. Análisis de Componentes de la Varianza El procedimiento Componentes de la varianza, para modelos de efectos mixtos, estima la contribución de cada efecto aleatorio a la varianza de la variable dependiente. Este procedimiento resulta de particular interés para el análisis de modelos mixtos, como los diseños split-plot, los diseños de medidas repetidas univariados y los diseños de bloques aleatorios. Al calcular las componentes de la varianza, se puede determinar dónde centrar la atención para reducir la varianza. Modelos lineales mixtos El procedimiento Modelos lineales mixtos expande el modelo lineal general de modo que los datos puedan presentar variabilidad correlacionada y no constante. El modelo lineal mixto proporciona, por tanto, la flexibilidad necesaria para modelar no sólo las medias sino también las varianzas y covarianzas de los datos. El procedimiento Modelos lineales mixtos es asimismo una herramienta flexible para ajustar otros modelos que puedan ser formulados como modelos lineales mixtos. Dichos modelos incluyen los modelos multinivel, los modelos lineales jerárquicos y los modelos con coeficientes aleatorios. Análisis LogLineal El procedimiento de análisis loglineal de selección de modelo analiza tablas de contingencia de varios factores. Ajusta modelos loglineales jerárquicos a las tablas de contingencia multidimensionales utilizando un algoritmo de ajuste proporcional. Este procedimiento ayuda a encontrar qué variables categóricas están asociadas. 11

12 Análisis loglineal general El procedimiento Análisis loglineal general analiza las frecuencias de las observaciones incluidas en cada categoría de la clasificación cruzada de una tabla de contingencia. Cada una de las clasificaciones cruzadas de la tabla constituye una casilla y cada variable categórica se denomina factor. La variable dependiente es el número de casos (la frecuencia) en una casilla de la tabla de contingencia y las variables explicativas son los factores y las covariables. Este procedimiento estima los parámetros de máxima verosimilitud de modelos loglineales jerárquicos y no jerárquicos utilizando el método de Newton-Raphson. Es posible analizar una distribución multinomial o de Poisson. Análisis loglineal logit El procedimiento Análisis loglineal logit analiza la relación entre variables dependientes (o de respuesta) y variables independientes (o explicativas). Las variables dependientes siempre son categóricas, mientras que las variables independientes pueden ser categóricas (factores). Otras variables independientes, las covariables de casilla, pueden ser continuas pero no se aplican en forma de caso por caso. A una casilla dada se le aplica la media ponderada de la covariable para los casos de esa casilla. El logaritmo de las ventajas de las variables dependientes se expresa como una combinación lineal de parámetros. Se supone automáticamente una distribución multinomial; estos modelos se denominan a veces modelos logit multinomiales. Este procedimiento estima los parámetros de los modelos loglineales logit utilizando el algoritmo de Newton-Raphson. Regresión ordinal La regresión ordinal permite dar forma a la dependencia de una respuesta ordinal politómica sobre un conjunto de predictores, que pueden ser factores o covariables. El diseño de la regresión ordinal se basa en la metodología de McCullagh (1980, 1998) y en la sintaxis se hace referencia al procedimiento como PLUM. El análisis de regresión lineal ordinario implica minimizar las diferencias de la suma de los cuadrados entre una variable de respuesta (la dependiente) y una combinación ponderada de las variables predictoras (las independientes). Los coeficientes estimados reflejan cómo los cambios en los predictores afectan a la respuesta. Se considera que la respuesta es numérica, en el sentido en que los cambios en el nivel de la respuesta son equivalentes en todo el rango de la respuesta. Por ejemplo, la diferencia de altura entre una persona que mide 150 cm y una que mide 140 cm es de 10 cm, que tiene el mismo significado que la diferencia de altura entre una persona que mide 210 cm y una que mide 200 cm. Estas relaciones no se mantienen necesariamente con las variables ordinales, en las que la elección y el número de categorías de respuesta pueden ser bastante arbitrarios. Tablas de mortalidad Existen muchas situaciones en las se desea examinar la distribución de un período entre dos eventos, como la duración del empleo (tiempo transcurrido entre el contrato y el abandono de la empresa). Sin embargo, este tipo de datos suele incluir algunos 12

13 casos para los que no se registra el segundo evento; por ejemplo, la gente que todavía trabaja en la empresa al final del estudio. Las razones para que no se verifique el segundo evento pueden ser muy variadas: en algunos casos, el evento simplemente no tiene lugar antes de que finalice el estudio; en otros, el investigador puede haber perdido el seguimiento de su estado en algún momento anterior a que finalice el estudio; y existen además casos que no pueden continuar por razones ajenas al estudio (como el caso en que un empleado caiga enfermo y se acoja a una baja laboral). Estos casos se conocen globalmente como casos censurados y hacen que el uso de técnicas tradicionales como las pruebas t o la regresión lineal sea inapropiado para este tipo de estudio. Existe una técnica estadística útil para este tipo de datos llamada tabla de mortalidad de "seguimiento". La idea básica de la tabla de mortalidad es subdividir el período de observación en intervalos de tiempo más pequeños. En cada intervalo, se utiliza toda la gente que se ha observado como mínimo durante ese período de tiempo para calcular la probabilidad de que un evento terminal tenga lugar dentro de ese intervalo. Las probabilidades estimadas para cada intervalo se utilizan para estimar la probabilidad global de que el evento tenga lugar en diferentes puntos temporales. Análisis de supervivencia de Kaplan-Meier El procedimiento de Kaplan-Meier es un método de estimación de modelos hasta el evento en presencia de casos censurados. El modelo de Kaplan-Meier se basa en la estimación de las probabilidades condicionales en cada punto temporal cuando tiene lugar un evento y en tomar el límite del producto de esas probabilidades para estimar la tasa de supervivencia en cada punto temporal. Regresión de Cox Del mismo modo que las tablas de mortalidad y el análisis de supervivencia de Kaplan- Meier, la regresión de Cox es un método para crear modelos para datos de tiempos de espera hasta un evento con casos censurados presentes. Sin embargo, la regresión de Cox permite incluir en los modelos variables predictoras (covariables). Por ejemplo, podrá construir un modelo de la duración en el empleo como función del nivel educativo y de la categoría laboral. La regresión de Cox gestionará los casos censurados correctamente y proporcionará las estimaciones de los coeficientes para cada una de las covariables, permitiendo evaluar el impacto de múltiples covariables en el mismo modelo. Además, es posible utilizar la regresión de Cox para examinar el efecto de covariables continuas. Módulo Modelos de Regresión Regresión logística La regresión logística resulta útil para los casos en los que se desea predecir la presencia o ausencia de una característica o resultado según los valores de un conjunto de variables predictoras. Es similar a un modelo de regresión lineal pero está adaptado para modelos en los que la variable dependiente es dicotómica. Los coeficientes de regresión logística pueden utilizarse para estimar la razón de las ventajas (odds ratio) de cada variable independiente del modelo. La regresión logística 13

14 se puede aplicar a un rango más amplio de situaciones de investigación que el análisis discriminante. Regresión logística multinomial La opción Regresión logística multinomial resulta útil en aquellas situaciones en las que desee poder clasificar a los sujetos según los valores de un conjunto de variables predictoras. Este tipo de regresión es similar a la regresión logística, pero más general, ya que la variable dependiente no está restringida a dos categorías. Análisis probit Este procedimiento mide la relación entre la intensidad de un estímulo y la proporción de casos que presentan una cierta respuesta a dicho estímulo. Es útil para las situaciones en las que se dispone de una respuesta dicotómica que se piensa puede estar influenciada o causada por los niveles de alguna o algunas variables independientes, y es particularmente adecuada para datos experimentales. Este procedimiento permite estimar la intensidad necesaria para que un estímulo llegue a inducir una determinada proporción de respuestas, como la dosis efectiva para la mediana. Estimación ponderada Los modelos de regresión lineal típicos asumen que la varianza es constante en la población objeto de estudio. Cuando éste no es el caso (por ejemplo cuando los casos con puntuaciones mayores en un atributo muestran más variabilidad que los casos con puntuaciones menores en ese atributo), la regresión lineal mediante mínimos cuadrados ordinarios (MCO, OLS) deja de proporcionar estimaciones óptimas para el modelo. Si las diferencias de variabilidad se pueden pronosticar a partir de otra variable, el procedimiento Estimación ponderada permite calcular los coeficientes de un modelo de regresión lineal mediante mínimos cuadrados ponderados (MCP, WLS), de forma que se les dé mayor ponderación a las observaciones más precisas (es decir, aquéllas con menos variabilidad) al determinar los coeficientes de regresión. El procedimiento Estimación ponderada contrasta un rango de transformaciones de ponderación e indica cuál se ajustará mejor a los datos. Regresión por mínimos cuadrados en dos fases Los modelos de regresión lineal típica asumen que los errores de la variable dependiente no están correlacionados con la variable o variables independientes. Cuando éste no es el caso (por ejemplo, cuando las relaciones entre las variables son bidireccionales), la regresión lineal mediante mínimos cuadrados ordinarios (OLS) deja de proporcionar estimaciones óptimas del modelo. La regresión por mínimos cuadrados en dos fases utiliza variables instrumentales que no estén correlacionadas con los términos de error para calcular los valores estimados de los predictores problemáticos (en la primera fase) y después utiliza dichos valores calculados para estimar un modelo de regresión lineal para la variable dependiente (la segunda fase). Dado que los valores calculados se basan en variables que no están correlacionadas con los errores, los resultados del modelo en dos fases son óptimos. 14

15 Módulo Categorías Escalamiento óptimo mediante mínimos cuadrados alternantes La combinación del nivel de medida y el número de conjunto seleccionado en este cuadro de diálogo determina el procedimiento de escalamiento óptimo mediante mínimos cuadrados alternantes que realiza. Nivel de medida. Especifica el nivel para escalamiento óptimo correspondiente a las variables utilizadas en el análisis. Todas las variables son nominales múltiples. Todas las variables del análisis tienen cuantificaciones de categorías que pueden diferir para cada dimensión. Alguna variable no es nominal múltiple. Una o más variables en el análisis se escalan a un nivel diferente del nominal múltiple. Otros niveles de escala posibles son nominal simple, ordinal y numérica discreta. Número de conjuntos de variables. Especifica cuántos grupos de variables se van a comparar con otros grupos de variables. Un conjunto. Los datos contienen un grupo de variables. Múltiples conjuntos. Los datos contienen más de un grupo de variables. Si se selecciona esta opción, se elijirá Correlación canónica no-lineal (OVERALS). Análisis seleccionado. La combinación de opciones para Nivel de medida y Número de conjuntos de variables proporciona un análisis de homogeneidad, un análisis de componentes principales categóricos o un análisis de correlación canónica no-lineal. Las opciones para cada procedimiento son: Análisis de homogeneidad (HOMALS). Seleccione Todas las variables son nominales múltiples y Un conjunto. Análisis de componentes principales categóricos (CATPCA). Seleccione Alguna variable no es nominal múltiple y Un conjunto. Análisis de correlación canónica no lineal (OVERALS). Seleccione Múltiples conjuntos. Regresión categórica La regresión categórica cuantifica los datos categóricos mediante la asignación de valores numéricos a las categorías, obteniéndose una ecuación de regresión lineal óptima para las variables transformadas. La regresión categórica se conoce también por el acrónimo CATREG, del inglés categorical regression (regresión categórica). El análisis de regresión lineal ordinario implica minimizar las diferencias de la suma de los cuadrados entre una variable de respuesta (la dependiente) y una combinación ponderada de las variables predictoras (las independientes). Las variables son normalmente cuantitativas, con los datos categóricos (nominales) recodificados como variables binarias o de contraste. Como resultado, las variables categóricas sirven para separar grupos de casos y la técnica estima conjuntos separados de parámetros para cada grupo. Los coeficientes estimados reflejan cómo los cambios en los predictores 15

16 afectan a la respuesta. El pronóstico de la respuesta es posible para cualquier combinación de los valores predictores. Una aproximación alternativa incluye la regresión de la respuesta respecto a los propios valores predictores categóricos. Como consecuencia, se estima un coeficiente para cada variable. Sin embargo, para las variables categóricas, los valores categóricos son arbitrarios. La codificación de las categorías de diferentes maneras proporciona diferentes coeficientes, dificultando las comparaciones entre los análisis de las mismas variables. CATREG amplía la aproximación típica mediante un escalamiento de las variables nominales, ordinales y numéricas simultáneamente. El procedimiento cuantifica las variables categóricas de manera que las cuantificaciones reflejen las características de las categorías originales. El procedimiento trata a las variables categóricas cuantificadas como si fueran variables numéricas. La utilización de transformaciones no lineales permite a las variables ser analizadas en varios niveles para encontrar el modelo que más se ajusta. Análisis de componentes principales categórico (CATPCA) Este procedimiento cuantifica simultáneamente las variables categóricas a la vez que reduce la dimensionalidad de los datos. El análisis de componentes principales categórico se conoce también por el acrónimo CATPCA, del inglés CATegorical Principal Components Analysis. El objetivo de los análisis de componentes principales es la reducción de un conjunto original de variables en un conjunto más pequeño de componentes no correlacionados que representen la mayor parte de la información encontrada en las variables originales. La técnica es más útil cuando un extenso número de variables impide una interpretación eficaz de las relaciones entre los objetos (sujetos y unidades). Al reducir la dimensionalidad, se interpreta un pequeño número de componentes en lugar de un extenso número de variables. El análisis típico de componentes principales asume relaciones lineales entre las variables numéricas. Por otra parte, la aproximación por escalamiento óptimo permite escalar las variables a diferentes niveles. Las variables categóricas se cuantifican de forma óptima en la dimensionalidad especificada. Como resultado, se pueden modelar relaciones no lineales entre las variables. Análisis de correlación canónica no lineal El análisis de correlación canónica no lineal coincide con el análisis de correlación canónica categórico mediante escalamiento óptimo. El propósito de este procedimiento es determinar la similitud entre los conjuntos de variables categóricas. El análisis de correlación canónica no lineal se conoce también por el acrónimo OVERALS. El análisis de correlación canónica estándar es una extensión de la regresión múltiple, en la que el segundo conjunto no contiene una única variable de respuesta, sino varias. 16

17 El objetivo es explicar el máximo posible de la varianza sobre las relaciones existentes entre dos conjuntos de variables numéricas en un espacio de pocas dimensiones. Inicialmente, las variables de cada conjunto se combinan linealmente de forma que las combinaciones lineales tengan una correlación máxima entre sí. Una vez dadas estas combinaciones, se establece que las combinaciones lineales subsiguientes no estén correlacionadas con las combinaciones anteriores y que también tengan la mayor correlación posible. Análisis de correspondencias Uno de los objetivos del análisis de correspondencias es describir las relaciones existentes entre dos variables nominales, recogidas en una tabla de correspondencias, sobre un espacio de pocas dimensiones, mientras que al mismo tiempo se describen las relaciones entre las categorías de cada variable. Para cada variable, las distancias sobre un gráfico entre los puntos de categorías reflejan las relaciones entre las categorías, con las categorías similares representadas próximas unas a otras. La proyección de los puntos de una variable sobre el vector desde el origen hasta un punto de categoría de la otra variable describe la relación entre ambas variables. Análisis de homogeneidad El análisis de homogeneidad cuantifica los datos (categóricos) nominales mediante la asignación de valores numéricos a los casos (los objetos) y a las categorías. El análisis de homogeneidad se conoce también por el acrónimo HOMALS, del inglés homogeneity analysis alternating least squares (análisis de homogeneidad mediante mínimos cuadrados alternantes). El objetivo de HOMALS es describir las relaciones entre dos o más variables nominales en un espacio de pocas dimensiones que contiene las categorías de las variables así como los objetos pertenecientes a dichas categorías. Los objetos pertenecientes a la misma categoría se representan cerca los unos de los otros, mientras que los objetos de diferentes categorías se representan alejados los unos de los otros. Cada objeto se encuentra lo más cerca posible de los puntos de categoría para las categorías a las que pertenece dicho objeto. El análisis de homogeneidad es similar al análisis de correspondencias, pero no está limitado a dos variables. Es por ello que el análisis de homogeneidad se conoce también como el análisis de correspondencias múltiple. También se puede ver el análisis de homogeneidad como un análisis de componentes principales para datos nominales. El análisis de homogeneidad es más adecuado que el análisis de componentes principales típico cuando puede que no se conserven las relaciones lineales entre las variables, o cuando las variables se miden a nivel nominal. Además, la interpretación del resultado es mucho más sencilla en HOMALS que en otras técnicas categóricas, como pueden ser las tablas de contingencia y los modelos loglineales. Debido a que las categorías de las variables son cuantificadas, se pueden aplicar sobre las cuantificaciones técnicas que requieren datos numéricos, en análisis subsiguientes. 17

18 Escalamiento multidimensional (PROXSCAL) El escalamiento multidimensional trata de encontrar la estructura existente en un conjunto de medidas de proximidades entre objetos. Esto se logra asignando las observaciones a posiciones específicas en un espacio conceptual de pocas dimensiones, de modo que las distancias entre los puntos en el espacio concuerden al máximo con las similaridades (o disimilaridades) dadas. El resultado es una representación de mínimos cuadrados de los objetos en dicho espacio de pocas dimensiones que, en muchos casos, le ayudará a entender mejor los datos. Módulo Tablas Generación de tablas En la pestaña Tabla del generador de tablas, se seleccionan las variables y las medidas de resumen que aparecerán en la tabla. Listas de variables. En el panel superior izquierdo de la ventana se muestran las variables del archivo de datos. Tablas personalizadas distingue entre dos niveles de medida diferentes para las variables y trata de manera distinta las variables en función de su nivel de medida: Categórico. Datos con un número limitado de valores o categorías distintas (por ejemplo, sexo o religión). Las variables categóricas pueden ser variables de cadena (alfanuméricas) o variables numéricas que utilizan códigos numéricos para representar las categorías (por ejemplo, 0=hombre y 1=mujer). También se hace referencia a estos datos como datos cualitativos. Escala. Datos medidos en una escala de intervalo o de razón en los que los valores de los datos indican el orden de los valores y la distancia entre ellos. Por ejemplo, un salario de $ es superior a un salario de $ y la distancia entre ambos valores es $ También se hace referencia a estos datos como datos cuantitativos o continuos. Las variables categóricas definen categorías (filas, columnas y capas) en la tabla y el estadístico de resumen por defecto es el recuento (número de casos en cada categoría). Por ejemplo, una tabla por defecto de la variable categórica sexo sólo mostrará el número de hombres y el número de mujeres. Las variables de escala se resumen normalmente dentro de las categorías de las variables categóricas y el estadístico de resumen por defecto es la media. Por ejemplo, una tabla por defecto de los ingresos dentro de las categorías de sexo mostrará los ingresos medios de los hombres y los ingresos medios de las mujeres. También puede resumir las variables de escala por sí mismas, sin utilizar una variable categórica para definir grupos. Esto resulta especialmente útil para apilar resúmenes de varias variables de escala. 18

19 Conjuntos de respuestas múltiples Tablas personalizadas admite también un tipo especial de "variable" llamado conjunto de respuestas múltiples. En realidad, los conjuntos de respuestas múltiples no son, en sentido estricto, "variables". No aparecen en el Editor de datos y los demás procedimientos no los reconocen. Los conjuntos de respuestas múltiples utilizan varias variables para registrar respuestas a preguntas en las que el encuestado puede ofrecer más de una respuesta. Los conjuntos de respuestas múltiples se consideran variables categóricas y la mayor parte de las acciones que se pueden realizar con las variables categóricas se pueden realizar también con conjuntos de respuestas múltiples. Es posible cambiar el nivel de medida de una variable en el generador de tablas, pulsando con el botón derecho del ratón en ella y seleccionando Categórica o Escala en el menú contextual. Puede cambiar definitivamente el nivel de medida de una variable en la Vista de variables del Editor de datos. Tablas personalizadas considera como variables categóricas las variables definidas con la métrica nominal u ordinal. Reglas básicas y limitaciones para generar una tabla Para las variables categóricas, los estadísticos de resumen se basan en la variable más al interior de la dimensión origen de los estadísticos. Para las variables categóricas, la dimensión origen de los estadísticos por defecto (las filas o las columnas) depende del orden en el que se arrastren y coloquen las variables en el panel de lienzo. Por ejemplo, si arrastra una variable primero al panel de filas, la dimensión de las filas es la dimensión por defecto origen de los estadísticos. Las variables de escala sólo se pueden resumir dentro de las categorías de la variable más al interior de la dimensión de las filas o de las columnas. (Puede colocar la variable de escala en cualquier nivel de la tabla, pero se resume en el nivel más al interior). Las variables de escala no se pueden resumir dentro de otras variables de escala. Puede apilar resúmenes de varias variables de escala o resumir variables de escala dentro de las categorías de las variables categóricas. No puede anidar una variable de escala dentro de otra ni colocar una variable de escala en la dimensión de las filas y otra en la dimensión de las columnas. Características generales del módulo BASE de SPSS En el curso que nos ocupa, pretendemos dar una visión general del módulo BASE de SPSS, que como ya hemos indicado, contiene los siguientes subsistemas: Gestión y generación de datos y ficheros. Generación de gráficos de alta resolución. Análisis estadísticos básicos. 19

20 Ventana del editor de datos de SPSS Se trata de una típica ventana de una aplicación en Windows que, de arriba abajo, consta de los siguientes elementos: Barra de título, con el menú de control, el nombre de la ventana y los botones de minimizar, maximizar y cerrar. Barra de menús, con 10 menús diferentes: Archivo, Edición, Ver, Datos, Transformar, Estadística, Gráficos, Utilidades, Ventana y Ayuda. ARCHIVO. Mediante este menú se pueden abrir, crear o grabar los diferentes ficheros que SPSS emplea, ya sean de datos, instrucciones, resultados o procesos. Igualmente, es posible controlar las tareas de impresión. EDICIÓN. Permite realizar las tareas habituales de edición: modificar, borrar, copiar, pegar, seleccionar, etc. VER. Permite controlar diversos parámetros de visualización en pantalla. DATOS. Este menú permite definir variables, así como efectuar modificaciones en los ficheros de datos: seleccionar, añadir, ponderar, etc. TRANSFORMAR. Aquí se encuentran todas las opciones relativas a la modificación y generación de nuevas variables. Las funciones de este menú y del anterior son temporales, y sólo están vigentes durante la sesión, sin que afecten al fichero original de datos. Si se quieren convertir en permanentes, deben grabarse los cambios. ANALIZAR. Mediante este menú se accede a los diferentes análisis estadísticos que se hayan instalado. GRÁFICOS. Permite la creación y edición de diversos tipos de gráficos de alta resolución, algunos de ellos son también accesibles a través de determinadas técnicas estadísticas. UTILIDADES. Entre otras, posibilita mostrar información sobre los ficheros de SPSS, las variables o el tratamiento de conjuntos de variables. VENTANA. Dispone de las funciones habituales para controlar las ventanas.?. Proporciona ayuda al usuario en el formato típico de Windows. Barra de herramientas, donde, mediante botones con iconos, se representan algunas de las operaciones más habituales. Si pasamos el puntero del ratón por cualquiera de ellos, aparecerá en la pantalla un texto en amarillo indicando la función que se activa. Esta barra es personalizable. Línea de edición de datos, consistente en una matriz de datos, flanqueada por una primera fila en gris con los encabezamientos de las variables y por una primera columna, también en gris, con los números de los casos. Barra de estado, en la que el sistema proporciona diversos mensajes. Está dividida en varias zonas de avisos. La primera está reservada para informaciones de tipo general, y en la segunda aparece lo relativo al procesador de SPSS (nombre del comando que se esté ejecutando, número de casos almacenados...) 20

21 Barra de título Barra de menús Barra de herramientas Línea de edición de datos Matriz de datos Barras de desplazamiento Barra de estado Tipos de ficheros En SPSS se trabaja con dos tipos básicos de ficheros: los de datos y los de resultados. Los ficheros de datos propios de SPSS siempre tienen extensión.sav, y su contenido aparece en la ventana del editor de datos. Un fichero propio es aquel cuyo formato es el específico de SPSS y que contiene, no sólo los datos, sino también la información que el sistema necesita para procesarlos. Los ficheros de resultados tienen extensión.spo y contienen resultados estadísticos, habitualmente en formato de tablas, gráficos, o cualquier otro tipo. Al igual que ocurre con los ficheros de datos, los resultados también se pueden exportar en otros formatos: como ficheros de texto o ficheros *.html. Adicionalmente, los gráficos son asimismo exportables en diversos formatos de imagen: metaarchivo de Windows, mapa de bits de Windows, PosScript, JPEG, CGM, TIFF o PICT de Macintosh. Pero además de estos dos tipos básicos, SPSS es capaz de generar y leer ficheros de texto. Además de las posibilidades de importación y exportación de datos o resultados, en SPSS nos encontramos con los ficheros de sintaxis. Contienen instrucciones de SPSS escritas en el lenguaje de mandatos del propio sistema. Son tanto ficheros de entrada como de salida en la medida en que, si bien su uso más habitual es el de ser cargados y leídos por el sistema para ejecutar un programa completo en proceso por lotes, también son generados por el propio sistema cuando en los diferentes cuadros de diálogo, en vez de ejecutar el procedimiento directamente, se pega la instrucción subyacente. En este último caso se estará empleando SPSS para Windows como una 21

22 interfaz auxiliar de generación de programas. De una u otra manera, su extensión es *.sps y su contenido, escrito en ASCII, se muestra en la ventana de sintaxis. Tipos de ventanas En este programa, la operación con ventanas se realiza mediante los procedimientos habituales de cualquier aplicación que opere en entornos Windows. Ventana del editor de datos. Aparece el contenido del fichero de datos que en ese momento esté activo en el sistema. SPSS sólo puede tener cargado y residente en memoria un solo fichero de datos. Ventana del visor de resultados. Los resultados de los diferentes subprogramas, listados, tablas, gráficos, informe de las modificaciones efectuadas en los datos y los mensajes y avisos de errores se van mostrando y almacenando en esta ventana. Esta información se puede grabar posteriormente como fichero de resultados. Una ventana de este tipo se abre automáticamente en el momento en el que se genera el primer resultado de una sesión. Se pueden tener abiertas tantas como se quiera. Ventana del visor de resultados de borrador. Es posible mandar los resultados a este tipo de ventanas en vez de al visor preestablecido. En este visor, para los cuadros se utilizan caracteres ASCII y aquí los gráficos no son editables. Como contrapartida, en algunos casos simplifica la exportación. Ventana del editor de tablas pivote. Este tipo de ventanas permite editar y modificar las denominadas tablas pivote de SPSS. Se refiere a la posibilidad de editar el texto, intercambiar los datos mediante transposición de filas y columnas, añadir y modificar los colores, etc. Ventana del editor de gráficos. Todos los gráficos que SPSS genera son editables mediante modificaciones del estilo de cambios de colores, de fuentes y tamaños, intercambio de ejes, rotaciones, etc. Ventana del editor de resultados de texto. Aquellos resultados de texto que no aparezcan en las tablas pivote se pueden modificar con este editor. Las modificaciones son las habituales pare este tipo de información textual, centradas fundamentalmente en las características de las fuentes (tipo, estilo, color, tamaño). Ventana del editor de sintaxis. Es posible pegar en una ventana de sintaxis las especificaciones que se realicen en los cuadros de diálogo, con lo que las mismas aparecerán en forma de comandos. Este fichero de instrucciones es editable mediante esta ventana, lo cuál resulta muy útil en diversas situaciones: Sólo es posible acceder a determinadas posibilidades y opciones de los subprogramas mediante el lenguaje de instrucciones. 22

23 Cuando es previsible que una determinada secuencia de operaciones se vaya a ejecutar en repetidas ocasiones, parece lógico grabar el programa completo y procesarlo de corrido. Cuando el ordenador ha de ser compartido por muchos usuarios, el modo interactivo de operar de Windows consume mucho tiempo. Ventana del editor de procesos. Es posible personalizar y automatizar muchas tareas de SPSS mediante la tecnología OLE usando el lenguaje BASIC. Por último una cuestión relativa a las ventanas de SPSS cuando se tienen varias abiertas, es la distinción entre ventana activa y ventana designada. La ventana activa es la que está actualmente seleccionada. La ventana designada es aquella en la que en la barra de estado aparece un signo de exclamación (!) y es la ventana con la que trabaja SPSS. En cualquier momento se puede cambiar tal designación empleando el icono que con tal símbolo aparece en la barra de herramientas de este tipo de ventanas. También es posible cambiar la ventana designada activando la opción Designar ventana que aparece en el menú Utilidades de este tipo de ventanas. Iniciar una sesión con SPSS SPSS se abre pulsando en el botón de inicio del escritorio de Windows en la opción programas y seleccionando la versión instalada del programa o bien seleccionando en el icono de acceso directo a SPSS sobre el escritorio si dicho acceso directo ha sido creado 23

24 Al inicio del programa se abre una ventana sobre el editor de datos, preguntando con qué datos se va a trabajar Pasemos a ver con qué ficheros de datos permite trabajar SPSS y cómo definir nuevos datos. Ficheros de datos en SPSS Además de las posibilidades que SPSS brinda para generar y editar los que denominamos como ficheros de datos propios, SPSS puede manejar una gran variedad de otros tipos de ficheros de datos: Archivos de otros paquetes estadísticos, como SYSTAT. Archivos de hojas de cálculo, como LOTUS ó EXCEL. Archivos de sistemas de gestión de bases de datos, como dbase. Archivos de datos grabados en ASCII, con o sin tabulación. Ficheros de datos SPSS creados en otros entornos y sistemas operativos. Datos de ACCESS, EXCEL ó FOXPRO, mediante ODBC. Para abrir uno de estos ficheros, SPSS habilita un asistente que indica los pasos a seguir 24

25 INTRODUCCIÓN DE DATOS Tras abrir el programa, se selecciona la opción introducir datos: La definición de una variable para ser procesada por SPSS comporta una serie de tareas: Denominar la variable Definir el tipo de la misma Fijar un formato de columnas Fijar un formato para los datos 25

26 Asignar, si se desea, etiquetas significativas a variables y valores Definir códigos específicos para los valores ausentes o perdidos Determinar la alineación de los datos Especificar el nivel de medida El nombre se escribe en el cuadro de texto asociado al Nombre de la ventana de definición de variables, y al resto de las funciones se accede en las columnas respectivas. Por defecto, las variables se consideran numéricas, con formato 8.2, sin etiqueta ni código específico para valores ausentes, con alineamiento de los valores a la derecha de cada casilla y un nivel de medida de escala. Nombre de las variables En lo referente al nombre de las variables, hay que cumplir una serie de requisitos: 1. La extensión máxima de los nombres es de ocho caracteres. 2. El primero de ellos ha de ser una letra forzosamente. 3. Los restantes pueden ser cualquier combinación de letras, números y los caracteres siguientes: el punto (excepto si es el último #, $, o el guión bajo (aunque no es recomendable situarlo al final). 4. Otros signos o caracteres especiales no están permitidos, y sobre todo hay que poner especial cuidado en no introducir espacios en blanco. 5. Los nombres deben ser únicos, no estando permitida su repetición en el mismo fichero de datos. 6. Es indiferente que se usen mayúsculas o minúsculas, pues internamente el sistema opera siempre con mayúsculas, independientemente de la forma en que aparezcan los nombres. 7. Hay una serie de palabras clave que tienen un significado especial para SPSS, se emplean en diferentes procesos y subprogramas y por tanto, no se pueden usar como nombres de variables, son las siguientes: ALL, AND, BY, EQ, GE, GT, LE, NE, NOT, OR, TO, WITH Declaración del tipo de la variable Existe una importante distinción entre las variables que constituyen una matriz de datos: 26

27 Variables numéricas. Representan las variables estadísticas conocidas como cuantitativas. Sus valores son únicamente codificables mediante números. SPSS establece a priori todas las variables como numéricas, reales con dos decimales. A su vez, entre éstas podemos distinguir entre variables numéricas enteras y variables numéricas con parte decimal. Las variables numéricas admiten cualquier número como valor válido, pudiendo ir precedido del signo menos o no. Su longitud máxima es de 40 caracteres de los cuales 16 pueden ser cifras decimales. Los signos o los puntos decimales se contabilizan a la hora de definir la longitud de la variable. Variables con coma. Este formato de entrada de datos añade al anterior la coma como separador de los miles y el punto como separador de la parte entera y de la decimal. Variables con punto. Se emplea el punto como separador de los miles y la coma como separador de la parte decimal Variables numéricas en notación científica. Son valores aceptables todos los numéricos mas las letras D o E y los signos más o menos. 347E3, -12D-3... Variables tipo fecha. Desde una perspectiva estricta, estas variables son de tipo numérico. Si se quiere adoptar un punto de vista estadístico, hay que considerarlas como variables cuantitativas; sin embargo, su codificación y representación en el editor de datos puede realizarse de distintas maneras. Si se selecciona este tipo en el cuadro de diálogo, se abre una ventana con todos los formatos aceptables. En la lista desplegada aparecen formatos para variables de fecha y otros para las estrictamente temporales. Variables tipo dólar. A un valor numérico dado, se le añade el símbolo del dólar en los diferentes formatos que aparecen en la ventana que se despliega caso de elegir esta opción. El símbolo $ y las comas como separadores de los miles aparecen automáticamente. 27

28 Variables con formato de moneda personalizada. Si a través del menú de preferencias se han creado formatos específicos para variables, mediante esta opción se puede elegir uno de ellos. Una vez seleccionado el formato, la entrada de datos se realiza del modo habitual, con la salvedad de que los caracteres empleados para simbolizar la moneda no deben teclearse, sino que son introducidos por el sistema. Variables tipo cadena. En su codificación admiten cualquier carácter. Al definirlas únicamente debe especificarse su longitud máxima. Si la sucesión de caracteres introducida como valor de una variable de este tipo tiene una longitud menor que el máximo declarado, se completa, mientras no se especifique de otra manera, añadiendo espacios en blanco hacia la derecha. Con este tipo de variables sí hay diferencia entre emplear los caracteres en minúscula o mayúscula. Aunque la codificación alfanumérica es la más recomendable para las variables cualitativas, también es la más propensa a errores. Una alternativa viable es codificar numéricamente las variables cualitativas y asignar a los diferentes valores numéricos etiquetas ilustrativas, lo que disminuye la probabilidad de ocurrencia de errores. Además, el editor de datos permite visualizar la matriz con las etiquetas de los valores en vez de los valores originales. Etiquetado de variables y valores La declaración de las etiquetas de las variables se lleva a cabo en la caja de texto con epígrafe Etiqueta La etiqueta de la variable puede ser cualquier texto con una extensión máxima de 120 caracteres, aunque es recomendable limitar su longitud, pues en la mayoría de los listados de resultados el tamaño máximo es excesivo y la etiqueta se trunca. Un valor aconsejable puede estar entre 20 y 40 caracteres. Las etiquetas pueden escribirse con cualquier combinación de mayúsculas y minúsculas y van a aparecer siempre tal y como hayan sido declaradas. El procedimiento es similar para las etiquetas de valores. Esta operación sólo merece la pena para variables cualitativas en las que los códigos asignados a los valores no resulten claros, y muy especialmente cuando se haya realizado una codificación numérica de los mismos. 28

29 Las etiquetas de los valores pueden tener una extensión máxima de 60 caracteres, aunque aquí es aconsejable limitar su longitud a un valor cercano a 20. Para crear las etiquetas, el proceso es el siguiente: 1. Se teclea el código del valor de la variable. 2. Se teclea el texto de la etiqueta en su cuadro correspondiente. La correspondencia entre valor y etiqueta queda así incorporada al fichero de datos. Definición de códigos para los valores ausentes o perdidos Se entiende por valores ausentes o perdidos a aquellos casos en que no se dispone de información sobre el valor de una variable determinada. SPSS distingue dos tipos de valores ausentes: Los definidos por el propio sistema (system-missing values). Asignados automáticamente a todas las casillas vacías que aparezcan en una variable declarada como numérica. Se representan por una coma. Los definidos por el usuario (user-missing values). Para las variables alfanuméricas una casilla en blanco se considera un valor válido de la variable. Para definir este tipo de valores faltantes, ha de abrirse el correspondiente cuadro de diálogo, en el que se distinguen las siguientes opciones: 1. Ausencia de valores faltantes definidos por el usuario. Todos los valores, excepto los blancos, son considerados como válidos. 2. Valores perdidos discretos. Se pueden definir un máximo de tres valores ausentes por cada variable. 3. Intervalo de valores perdidos. Todos los valores comprendidos entre el máximo y el mínimo (ambos incluídos) son considerados como valores ausentes. 4. Un intervalo y un valor único. Se consideran como ausentes los valores pertenecientes al intervalo más el valor discreto declarado. 29

30 Especificación del nivel de medida SPSS permite seleccionar entre tres opciones mutuamente excluyentes: escala, ordinal y nominal, adaptándose a la propuesta clásica de Stevens en la que el nivel de intervalo se agrupa en la categoría de escala que podemos también identificar con las variables cuantitativas. 30

Tema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0

Tema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0 Ignacio Martín Tamayo 11 Tema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0 ÍNDICE ------------------------------------------------------------- 1. Introducción 2. Frecuencias 3. Descriptivos 4. Explorar

Más detalles

Estructura del SPSS. Favio Murillo García

Estructura del SPSS. Favio Murillo García Estructura del SPSS Favio Murillo García Introducción El programa SPSS (Statistical Product and Service Solutions) es un conjunto de potentes herramientas de tratamiento de datos y análisis estadístico.

Más detalles

Tema: Medidas de Asociación con SPSS

Tema: Medidas de Asociación con SPSS Tema: Medidas de Asociación con SPSS 1.- Introducción Una de las tareas habituales en el análisis de encuestas es la generación y análisis de tablas de contingencia, para las variables y categorías objetivo

Más detalles

INDICE. Prólogo a la Segunda Edición

INDICE. Prólogo a la Segunda Edición INDICE Prólogo a la Segunda Edición XV Prefacio XVI Capitulo 1. Análisis de datos de Negocios 1 1.1. Definición de estadística de negocios 1 1.2. Estadística descriptiva r inferencia estadística 1 1.3.

Más detalles

Estadística básica con R Commander. María Eugenia Fernández de Luco

Estadística básica con R Commander. María Eugenia Fernández de Luco Estadística básica con R Commander María Eugenia Fernández de Luco Facultad de Ciencias Exactas, Ingeniería y Agrimensura Universidad Nacional de Rosario 2014 ÍNDICE 1. Introducción... 2 2. Lectura de

Más detalles

El Análisis de Correspondencias tiene dos objetivos básicos:

El Análisis de Correspondencias tiene dos objetivos básicos: Tema 8 Análisis de correspondencias El Análisis de Correspondencias es una técnica de reducción de dimensión y elaboración de mapas percentuales. Los mapas percentuales se basan en la asociación entre

Más detalles

Nivel Intermedio. A comprender de forma activa conceptos fundamentales de estadística. Crear bases de datos estadísticos.

Nivel Intermedio. A comprender de forma activa conceptos fundamentales de estadística. Crear bases de datos estadísticos. Análisis de datos mediante el SPSS A comprender de forma activa conceptos fundamentales de estadística. Crear bases de datos estadísticos. Procesar eficientemente información estadística. Analizar con

Más detalles

Índice de contenidos. Primera parte Introducción al SPSS. 1. Estructura del SPSS

Índice de contenidos. Primera parte Introducción al SPSS. 1. Estructura del SPSS Índice de contenidos Primera parte Introducción al SPSS 1. Estructura del SPSS Tipos de ventanas SPSS Ventana designada versus ventana activa Cuadros de diálogo Subcuadros de diálogo Las barras de menús

Más detalles

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows. TEMA 13 REGRESIÓN LOGÍSTICA Es un tipo de análisis de regresión en el que la variable dependiente no es continua, sino dicotómica, mientras que las variables independientes pueden ser cuantitativas o cualitativas.

Más detalles

Microsoft Project 2013

Microsoft Project 2013 Microsoft Project 2013 SALOMÓN CCANCE Project 2013 Salomón Ccance www.ccance.net CCANCE WEBSITE ANEXO 2. MANEJO DE VISTAS Y TABLAS. 2.1. ELEMENTOS DE VISUALIZACIÓN DE MICROSOFT OFFICE PROJECT PROFESSIONAL

Más detalles

Este programa estadístico está organizado en dos bloques: el editor de datos y el visor de resultados.

Este programa estadístico está organizado en dos bloques: el editor de datos y el visor de resultados. Bases de Estadística Licenciatura en Ciencias Ambientales Curso 2oo3/2oo4 Introducción al SPSS/PC Este programa estadístico está organizado en dos bloques: el editor de datos y el visor de resultados.

Más detalles

ANÁLISIS CUANTITATIVO DE DATOS EN CIENCIAS SOCIALES CON EL SPSS (I)

ANÁLISIS CUANTITATIVO DE DATOS EN CIENCIAS SOCIALES CON EL SPSS (I) ANÁLISIS CUANTITATIVO DE DATOS EN CIENCIAS SOCIALES CON EL SPSS (I) Modalidad: Semipresencial Inicio del curso: 12 de junio de 2012 Sesiones presenciales: 12 y 13 de junio (de 17 a 20 hrs.). Lugar: Ala

Más detalles

ANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA

ANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA ANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA ANALISIS DE CLUSTER EN SPSS Opción: Analizar Clasificar ANALISIS DE CLUSTER EN SPSS Tres posibles OPCIONES 1.- Cluster en dos etapas 2.- K-means 3.- Jerárquicos

Más detalles

Y accedemos al cuadro de diálogo Descriptivos

Y accedemos al cuadro de diálogo Descriptivos SPSS: DESCRIPTIVOS PROCEDIMIENTO DE ANÁLISIS INICIAL DE DATOS: DESCRIPTIVOS A diferencia con el procedimiento Frecuencias, que contiene opciones para describir tanto variables categóricas como cuantitativas

Más detalles

ANÁLISIS DE DATOS. L.A. y M.C.E. Emma Linda Diez Knoth

ANÁLISIS DE DATOS. L.A. y M.C.E. Emma Linda Diez Knoth ANÁLISIS DE DATOS 1 Tipos de Análisis en función de la Naturaleza de los Datos Datos cuantitativos Datos cualitativos Análisis cuantitativos Análisis cuantitativos de datos cuantitativos (Estadística)

Más detalles

Estadísticos Descriptivos

Estadísticos Descriptivos ANÁLISIS EXPLORATORIO DE DATOS El análisis exploratorio tiene como objetivo identificar el modelo teórico más adecuado para representar la población de la cual proceden los datos muéstrales. Dicho análisis

Más detalles

ÍNDICE. Capítulo 1. Técnicas de segmentación. Conceptos y clasificación... 1

ÍNDICE. Capítulo 1. Técnicas de segmentación. Conceptos y clasificación... 1 ÍNDICE Capítulo 1. Técnicas de segmentación. Conceptos y clasificación... 1 Conceptos básicos... 1 Clasificación de las técnicas de segmentación... 1 Técnicas predictivas y descriptivas... 1 Técnicas Ad-Hoc

Más detalles

Análisis de correspondencias

Análisis de correspondencias Análisis de correspondencias utilizando el SPSS Vamos a realizar el Análisis de correspondencias sobre el mismo ejemplo (ejemplo 6.1 de los apuntes), sobre el que ya se obtuvo el análisis mediante el R,

Más detalles

ESTADÍSTICA CON EXCEL

ESTADÍSTICA CON EXCEL ESTADÍSTICA CON EXCEL 1. INTRODUCCIÓN La estadística es la rama de las matemáticas que se dedica al análisis e interpretación de series de datos, generando unos resultados que se utilizan básicamente en

Más detalles

MICROSOFT EXCEL 2010

MICROSOFT EXCEL 2010 MICROSOFT EXCEL 2010 1. AVANZADO Nº Horas:24 Objetivos: Descripción de funciones avanzadas de la hoja de cálculo Microsoft Excel 2010, viendo el uso de fórmulas, funciones y gráficos en los libros de Excel.

Más detalles

CM0244. Suficientable

CM0244. Suficientable IDENTIFICACIÓN NOMBRE ESCUELA ESCUELA DE CIENCIAS NOMBRE DEPARTAMENTO Ciencias Matemáticas ÁREA DE CONOCIMIENTO MATEMATICAS, ESTADISTICA Y AFINES NOMBRE ASIGNATURA EN ESPAÑOL ESTADÍSTICA GENERAL NOMBRE

Más detalles

INDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica

INDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica INDICE 1. Qué es la Estadística? 1 Introducción 2 Qué significa estadística? 2 Por qué se estudia la estadística? 4 Tipos de estadística 5 Estadística descriptiva 5 Estadística inferencial 6 Tipos de variables

Más detalles

Manual de usuario MetaTrader 4 TraderNovo:

Manual de usuario MetaTrader 4 TraderNovo: Manual de usuario MetaTrader 4 TraderNovo: Aquí está una foto que muestra la pantalla principal MT4: Menú principal (acceder al menú y los ajustes del programa); Barras de herramientas (acceso rápido a

Más detalles

Gráfico de Desgaste de Herramientas

Gráfico de Desgaste de Herramientas Gráfico de Desgaste de Herramientas Resumen El procedimiento Gráfico de Desgaste de Herramientas crea cuadros de control para una sola variable numérica donde se espera que cambien las cantidades en un

Más detalles

Profesor(a): Ing. Miriam Cerón Brito

Profesor(a): Ing. Miriam Cerón Brito Área Académica: Informática Tema: Hoja electrónica Profesor(a): Ing. Miriam Cerón Brito Periodo: Enero Junio 2014 Abstract: This presentation show the spreadsheet's characteristics and show the principals

Más detalles

Excel 2013 Completo. Duración: Objetivos: Contenido: 80 horas

Excel 2013 Completo. Duración: Objetivos: Contenido: 80 horas Excel 2013 Completo Duración: 80 horas Objetivos: Descripción del funcionamiento básico de la hoja de cálculo Microsoft Excel 2013, viendo las funciones disponibles en este programa a la hora de crear

Más detalles

INDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos

INDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos INDICE Prefacio VII 1. Introducción 1 1.1. Qué es la estadística moderna? 1 1.2. El crecimiento y desarrollo de la estadística moderna 1 1.3. Estudios enumerativos en comparación con estudios analíticos

Más detalles

Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia

Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia Estudio de Caso: Estudio Morfología Coeficiente de Correlación Considere el archivo Estudio Morfología.sav.

Más detalles

Operación de Microsoft Excel

Operación de Microsoft Excel Formato de datos y celdas Dar formato significa, en términos generales, fijar los parámetros que definirán el aspecto y la presentación de los datos contenidos en las hojas de trabajo. Excel ofrece muchas

Más detalles

Microsoft Excel 2003 (Completo)

Microsoft Excel 2003 (Completo) Página 1 Horas de teoría: 32 Horas de práctica: 29 Precio del Curso: 198 Curso para aprender a utilizar la hoja de cálculo Microsoft Excel 2003, explicando todas las funciones que la aplicación posee y

Más detalles

Análisis de Componentes de la Varianza

Análisis de Componentes de la Varianza Análisis de Componentes de la Varianza Resumen El procedimiento de Análisis de Componentes de Varianza está diseñado para estimar la contribución de múltiples factores a la variabilidad de una variable

Más detalles

Microsoft Excel 2003 (Completo)

Microsoft Excel 2003 (Completo) Microsoft Excel 2003 (Completo) Curso para aprender a utilizar la hoja de cálculo Microsoft Excel 2003, explicando todas las funciones que la aplicación posee y viendo el uso de este programa para crear

Más detalles

Guía docente 2007/2008

Guía docente 2007/2008 Guía docente 2007/2008 Plan 247 Lic.Investigación y Tec.Mercado Asignatura 43579 METODOS CUANTITATIVOS PARA LA INVESTIGACION DE MERCADOS Grupo 1 Presentación Métodos y técnicas cuantitativas de investigación

Más detalles

1. Cómo introducir datos en SPSS/PC? - Recordatorio

1. Cómo introducir datos en SPSS/PC? - Recordatorio 1 Taller de Estadística Curso 2oo5/2oo6 Descripción de datos bivariantes El objetivo de esta práctica es familiarizarse con las técnicas de descripción de datos bidimensionales y con algunas de las opciones

Más detalles

Práctica 1: Introducción a SPSS 1

Práctica 1: Introducción a SPSS 1 Estadística Aplicada Curso 2010/2011 Diplomatura en Nutrición Humana y Dietética Práctica 1: Introducción a SPSS 1 Este programa estadístico está organizado en dos bloques: el editor de datos y el visor

Más detalles

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS 1. INTRODUCCIÓN Este tema se centra en el estudio conjunto de dos variables. Dos variables cualitativas - Tabla de datos - Tabla de contingencia - Diagrama de barras - Tabla de diferencias entre frecuencias

Más detalles

A DISTANCIA / SEMIPRESENCIAL / PRESENCIAL / TELEFORMACIÓN

A DISTANCIA / SEMIPRESENCIAL / PRESENCIAL / TELEFORMACIÓN DENOMINACIÓN: OFIMATICA AVANZADA ACCESS XP DESTINATARIOS: TRABAJADORES/AS DEL SECTOR TECNOLOGICO MODALIDAD: A DISTANCIA / SEMIPRESENCIAL / PRESENCIAL / TELEFORMACIÓN OBJETIVO GENERAL: - El objetivo de

Más detalles

LA HOJA DE CÁLCULO HOJA DE CÁLCULO:

LA HOJA DE CÁLCULO HOJA DE CÁLCULO: LA HOJA DE CÁLCULO HOJA DE CÁLCULO: es una herramienta que permite realizar cálculos u operaciones matemáticas, estadísticas financieras y de tabla de base de datos. También se pueden crear y extraer gráficos

Más detalles

Capítulo 8. Análisis Discriminante

Capítulo 8. Análisis Discriminante Capítulo 8 Análisis Discriminante Técnica de clasificación donde el objetivo es obtener una función capaz de clasificar a un nuevo individuo a partir del conocimiento de los valores de ciertas variables

Más detalles

La última versión disponible cuando se redactó este manual era la 5 Beta (versión ), y sobre ella versa este manual.

La última versión disponible cuando se redactó este manual era la 5 Beta (versión ), y sobre ella versa este manual. Manual de Dev-C++ 4.9.9.2 Página 1 de 11 Introducción Dev-C++ es un IDE (entorno de desarrollo integrado) que facilita herramientas para la creación y depuración de programas en C y en C++. Además, la

Más detalles

30.- Generador de Consultas

30.- Generador de Consultas 30.- Generador de Consultas Este módulo permite realizar consultas no estructuradas sobre la base de datos de WinPer. Para realizar las consultas debe seleccionar las tablas desde las cuales tomará la

Más detalles

Análisis de datos Categóricos

Análisis de datos Categóricos Introducción a los Modelos Lineales Generalizados Universidad Nacional Agraria La Molina 2016-1 Introducción Modelos Lineales Generalizados Introducción Componentes Estimación En los capítulos anteriores

Más detalles

SESIÓN PRÁCTICA 3: TRANSFORMACIONES DE DATOS PROBABILIDAD Y ESTADÍSTICA. PROF. Esther González Sánchez. Departamento de Informática y Sistemas

SESIÓN PRÁCTICA 3: TRANSFORMACIONES DE DATOS PROBABILIDAD Y ESTADÍSTICA. PROF. Esther González Sánchez. Departamento de Informática y Sistemas SESIÓN PRÁCTICA 3: TRANSFORMACIONES DE DATOS PROBABILIDAD Y ESTADÍSTICA PROF. Esther González Sánchez Departamento de Informática y Sistemas Facultad de Informática Universidad de Las Palmas de Gran Canaria

Más detalles

METODOLOGÍA SEIS SIGMA A TRAVÉS DE EXCEL

METODOLOGÍA SEIS SIGMA A TRAVÉS DE EXCEL METODOLOGÍA SEIS SIGMA A TRAVÉS DE EXCEL María Pérez Marqués Metodología Seis Sigma a través de Excel María Pérez Marqués ISBN: 978-84-937769-7-8 EAN: 9788493776978 Copyright 2010 RC Libros RC Libros es

Más detalles

Manual del Usuario de Microsoft Access Formularios - Página 1. Tema V: Formularios. V.1. Creación de un Formulario

Manual del Usuario de Microsoft Access Formularios - Página 1. Tema V: Formularios. V.1. Creación de un Formulario Manual del Usuario de Microsoft Access Formularios - Página 1 Tema V: Formularios V.1. Creación de un Formulario Un formulario es un diseño que permite introducir, cambiar y ver los registros de una base

Más detalles

Operadores aritméticos: suma (+), resta (-), producto (*), cociente (/) y potencia (**).

Operadores aritméticos: suma (+), resta (-), producto (*), cociente (/) y potencia (**). TEMA 3 TRANSFORMACIÓN DE DATOS En ocasiones es necesario crear nuevas variables a partir de otras ya existentes o modificarlas para poder explotarlas de forma más adecuada. Esto se realiza mediante las

Más detalles

La Herramienta Redmine para la Administración de Proyectos

La Herramienta Redmine para la Administración de Proyectos La Herramienta Redmine para la Administración de Proyectos 13. Administración y utilización de la funcionalidad de seguimiento de peticiones en Redmine Mag. José Eduardo Rodríguez Esquivel jose.rodriguez@ecci.ucr.ac.cr

Más detalles

INFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón

INFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón Metodología de Investigación Tesifón Parrón Contraste de hipótesis Inferencia Estadística Medidas de asociación Error de Tipo I y Error de Tipo II α β CONTRASTE DE HIPÓTESIS Tipos de Test Chi Cuadrado

Más detalles

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA MODELO DE REGRESIÓN LOGÍSTICA Introducción A grandes rasgos, el objetivo de la regresión logística se puede describir de la siguiente forma: Supongamos que los individuos de una población pueden clasificarse

Más detalles

Tema 3: Análisis de datos bivariantes

Tema 3: Análisis de datos bivariantes Tema 3: Análisis de datos bivariantes 1 Contenidos 3.1 Tablas de doble entrada. Datos bivariantes. Estructura de la tabla de doble entrada. Distribuciones de frecuencias marginales. Distribución conjunta

Más detalles

Fundamentos de Estadística y Simulación Básica

Fundamentos de Estadística y Simulación Básica Fundamentos de Estadística y Simulación Básica TEMA 2 Estadística Descriptiva Clasificación de Variables Escalas de Medición Gráficos Tabla de frecuencias Medidas de Tendencia Central Medidas de Dispersión

Más detalles

Capítulo 13. Contrastes sobre medias: Los procedimientos Medias y Prueba T. Medias

Capítulo 13. Contrastes sobre medias: Los procedimientos Medias y Prueba T. Medias Capítulo 13 Contrastes sobre medias: Los procedimientos Medias y Prueba T La opción Comparar medias del menú Analizar contiene varios de los procedimientos estadísticos diseñados para efectuar contrastes

Más detalles

El ejemplo: Una encuesta de opinión

El ejemplo: Una encuesta de opinión El ejemplo: Una encuesta de opinión Objetivos Lo más importante a la hora de planificar una encuesta es fijar los objetivos que queremos lograr. Se tiene un cuestionario ya diseñado y se desean analizar

Más detalles

El botón inicio contiene los siguientes elementos:

El botón inicio contiene los siguientes elementos: TABLA DE CONTENIDO MICROSOFT WINDOWS... 2 1. EL ESCRITORIO... 2 2. BOTON INICIO:... 2 2.1 Apagar el sistema:... 2 2.2 Ejecutar:... 2 2.3 Ayuda:... 2 2.4 Buscar:... 3 2.5 Configuración:... 3 2.6 Documentos:...

Más detalles

Diplomado en Estadística Aplicada

Diplomado en Estadística Aplicada Diplomado en Estadística Aplicada Con el propósito de mejorar las habilidades para la toma de decisiones, la División de Estudios de Posgrado de la Facultad de Economía ha conjuntado a profesores con especialidad

Más detalles

IMPRESIÓN Y CONECTIVIDAD

IMPRESIÓN Y CONECTIVIDAD IMPRESIÓN Y CONECTIVIDAD INFORMES PREDEFINIDOS Una amplia colección de informes predefinidos permite imprimir todos los documentos necesarios, tanto para la presentación a terceros como para la gestión

Más detalles

MANUAL DE USO PROGRAMA SENSIBAR

MANUAL DE USO PROGRAMA SENSIBAR MANUAL DE USO PROGRAMA SENSIBAR ANALSIS DE SENSIBILIDAD Y SIMULACION DE MONTECARLO JOSE FUENTES VALDES FACEA - UNIVERSIDAD DE CONCEPCION Facultad de Economía Universidad de Concepción 1 SensiBar. ANALSIS

Más detalles

Prácticas de Introducción a los Computadores Curso Hoja Gráficos: Hoja Regresión: ESPESOR 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 ESPESOR COSTES fij

Prácticas de Introducción a los Computadores Curso Hoja Gráficos: Hoja Regresión: ESPESOR 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 ESPESOR COSTES fij Prácticas de Introducción a los Computadores Curso 2001-2002 1 EXCEL Introducción Excel es una hoja de cálculo. Su objetivo básico es proporcionar un entorno sencillo para generar tablas de números y aplicando

Más detalles

5.2. Combinar celdas Ajustar texto a la celda Insertar filas y columnas Insertar filas Insertar columnas. 5.5.

5.2. Combinar celdas Ajustar texto a la celda Insertar filas y columnas Insertar filas Insertar columnas. 5.5. BÀSICO SESIÒN 1: 1. Introducción a Excel 1.1. Conociendo la interface de usuario de Excel 2013. 1.2. La ventana del libro de trabajo. 1.3. La hoja de Cálculo. 1.4. Celdas. 1.5. Barra de herramientas de

Más detalles

ÍNDICE INTRODUCCIÓN... 21

ÍNDICE INTRODUCCIÓN... 21 INTRODUCCIÓN... 21 CAPÍTULO 1. ORGANIZACIÓN DE LOS DATOS Y REPRESENTACIONES GRÁFICAS... 23 1. ORGANIZACIÓN DE LOS DATOS... 23 1.1. La distribución de frecuencias... 24 1.2. Agrupación en intervalos...

Más detalles

Gestión de la tabla de calificaciones:

Gestión de la tabla de calificaciones: Gestión de la tabla de calificaciones Gestión de la tabla de calificaciones: Vista Configuración Autor Aula Virtual URJC online 1 Tabla de contenidos La tabla de calificaciones... 3 Pestaña Vista... 3

Más detalles

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO UNIVERSIDAD AUTONOMA DE SANTO DOMINGO FACULTAD DE CIENCIAS ECONOMICAS Y SOCIALES DEPARTAMENTO DE ESTADISITICA CATEDRA Estadística Especializada ASIGNATURA Estadística Industrial (EST-121) NUMERO DE CREDITOS

Más detalles

UNIVERSIDAD AUTONOMA DEL ESTADO DE MEXICO ESCUELA PREPARATORIA TEXCOCO

UNIVERSIDAD AUTONOMA DEL ESTADO DE MEXICO ESCUELA PREPARATORIA TEXCOCO UNIVERSIDAD AUTONOMA DEL ESTADO DE MEXICO ESCUELA PREPARATORIA TEXCOCO MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN PARA DATOS NO AGRUPADOS MATERIAL DIDACTICO SOLO VISION ASIGNATURA QUE CORRESPONDE: ESTADISTICA

Más detalles

Fase 2. Estudio de mercado: ESTADÍSTICA

Fase 2. Estudio de mercado: ESTADÍSTICA 1. CONCEPTO DE ESTADÍSTICA. ESTADÍSTICA DESCRIPTIVA 2. 3. TABLA DE FRECUENCIAS 4. REPRESENTACIONES GRÁFICAS 5. TIPOS DE MEDIDAS: A. MEDIDAS DE POSICIÓN B. MEDIDAS DE DISPERSIÓN C. MEDIDAS DE FORMA 1 1.

Más detalles

Figura 41: Ejemplo de una carta para combinar correspondencia

Figura 41: Ejemplo de una carta para combinar correspondencia 4. COMBINACIÓN DE CORRESPONDENCIA Cuando se requiera dirigir la misma carta a diferentes destinatarios se habla de Combinación de correspondencia. El nombre en inglés Mail Merge, proviene de la aplicación

Más detalles

Manual del Tablón de Noticias de la UPV para Windows (nueva versión enero 96)

Manual del Tablón de Noticias de la UPV para Windows (nueva versión enero 96) Manual del Tablón de Noticias de la UPV para Windows (nueva versión enero 96) página 1. El Tablón de Noticias de la UPV 1 2. El Programa de Noticias de la UPV para Windows 2 4. Leer y Eliminar Noticias

Más detalles

BREVE DESCRIPCIÓN DEL PROGRAMA

BREVE DESCRIPCIÓN DEL PROGRAMA BREVE DESCRIPCIÓN DEL PROGRAMA La aplicación de entorno Windows está organizada en menús; los principales son el menú Archivo, que entre otras opciones permite trabajar con los ficheros de datos (solamente

Más detalles

viii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos

viii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos Contenido Acerca de los autores.............................. Prefacio.... xvii CAPÍTULO 1 Introducción... 1 Introducción.............................................. 1 1.1 Ideas de la estadística.........................................

Más detalles

Tipos de gráficos disponibles

Tipos de gráficos disponibles Tipos de gráficos disponibles Microsoft Office Excel admite muchos tipos de gráficos para ayudarle a mostrar datos de forma comprensible para su audiencia. Cuando crea un gráfico o cambia el tipo de uno

Más detalles

MICROSOFT EXCEL 2013 (COMPLETO)

MICROSOFT EXCEL 2013 (COMPLETO) MICROSOFT EXCEL 2013 (COMPLETO) Curso para aprender a utilizar la hoja de cálculo Microsoft Excel 2013, perteneciente a la suite ofimática Microsoft Office 2013, explicando todas las funciones que la aplicación

Más detalles

INDICE. Introducción Capitulo uno. La idea nace un proyecto de investigación Como se originan las investigaciones? 2 Resumen Conceptos básicos

INDICE. Introducción Capitulo uno. La idea nace un proyecto de investigación Como se originan las investigaciones? 2 Resumen Conceptos básicos INDICE Introducción Capitulo uno. La idea nace un proyecto de investigación 1 1.1. Como se originan las investigaciones? 2 Resumen 6 Ejemplo 7 Capitulo dos. El planteamiento del problema objetivos, preguntas

Más detalles

GLOSARIO ESTADÍSTICO. Fuente: Murray R. Spiegel, Estadística, McGraw Hill.

GLOSARIO ESTADÍSTICO. Fuente: Murray R. Spiegel, Estadística, McGraw Hill. GLOSARIO ESTADÍSTICO Fuente: Murray R. Spiegel, Estadística, McGraw Hill. CONCEPTOS Y DEFINICIONES ESPECIALES Es el estudio científico de los métodos para recoger, organizar, resumir y analizar los datos

Más detalles

Índice general. Pág. N. 1. Capítulo 1 ETAPAS DE UNA INVESTIGACIÓN. Diseño. Población. Muestra. Individuo (Observación, Caso, Sujeto) Variables

Índice general. Pág. N. 1. Capítulo 1 ETAPAS DE UNA INVESTIGACIÓN. Diseño. Población. Muestra. Individuo (Observación, Caso, Sujeto) Variables Pág. N. 1 Índice general Capítulo 1 ETAPAS DE UNA INVESTIGACIÓN 1.1 Diseño 1.2 Descriptiva 1.3 Inferencia Diseño Población Muestra Individuo (Observación, Caso, Sujeto) Variables Ejercicios de Población

Más detalles

Contenido. Introducción Usando di Monitoring como un usuario normal Uso de di Monitoring como un operador de entrada de datos...

Contenido. Introducción Usando di Monitoring como un usuario normal Uso de di Monitoring como un operador de entrada de datos... 1 Contenido Introducción... 3 Características principales... 3 Los niveles de usuario... 4 El aprendizaje de di Monitoring... 4 Usando di Monitoring como un usuario normal... 5 Acceso a di Monitoring...

Más detalles

Histogramas. Para crear un histograma. Para crear un histograma podemos utilizar el procedimiento Generador de gráficos en el Menú: o Gráficos:

Histogramas. Para crear un histograma. Para crear un histograma podemos utilizar el procedimiento Generador de gráficos en el Menú: o Gráficos: SPSS: GRÁFICOS HISTOGRAMAS Histogramas Los histogramas son útiles para mostrar la distribución de una única variable de escala. Los datos se agrupan y se resumen utilizando el estadístico de porcentaje

Más detalles

Proyecto PropULSA: Estadística y Probabilidad Breviario Académico

Proyecto PropULSA:  Estadística y Probabilidad Breviario Académico Estadística y Probabilidad Breviario Académico Estadística: Es la ciencia que tiene por objetivo recolectar, escribir e interpretar datos, con la finalidad de efectuar una adecuada toma de decisiones en

Más detalles

ESTADÍSTICA SEMANA 2

ESTADÍSTICA SEMANA 2 ESTADÍSTICA SEMANA 2 ÍNDICE CUADROS DE DISTRIBUCIÓN DE FRECUENCIAS Y REPRESENTACIÓN GRÁFICA... 3 APRENDIZAJES ESPERADOS... 3 INTRODUCCIÓN... 3 REPRESENTACIÓN GRÁFICA... 3 MÉTODOS GRÁFICOS:... 3 DIAGRAMAS

Más detalles

CURSO VIRTUAL. Acceso a fuentes de información y manejo de redes sociales. Módulo 2

CURSO VIRTUAL. Acceso a fuentes de información y manejo de redes sociales. Módulo 2 CURSO VIRTUAL Acceso a fuentes de información y manejo de redes sociales Módulo 2 OBJETIVOS Conseguir que el alumno adquiera conocimientos estadísticos que le permitan una lectura comprensiva de la metodología

Más detalles

NOTAS DE ESTADISTICA DESCRIPTIVA CON AYUDA DE EXCEL 2003 y 2007

NOTAS DE ESTADISTICA DESCRIPTIVA CON AYUDA DE EXCEL 2003 y 2007 NOTAS DE ESTADISTICA DESCRIPTIVA CON AYUDA DE EXCEL 2003 y 2007 TABLA DE CONTENIDO Contenido 1 INTRODUCCIÓN... 1 2 PROCEDIMIENTO MODULO ANÁLISIS DE DATOS DE EXCEL... 2 2.1 PASOS SIGUIENTES PARA EXCEL 2003...

Más detalles

1. Introducción Hoja de cálculos Iniciar Excel 2013

1. Introducción Hoja de cálculos Iniciar Excel 2013 1. Introducción 1.1. Hoja de cálculos Una hoja de cálculo es un tipo de documento, que permite manipular datos numéricos y alfanuméricos dispuestos en forma de tablas compuestas por celdas. Son organizadas

Más detalles

ESTADÍSTICA, SISTEMAS DE INFORMACIÓN Y NUEVAS TECONOLOGÍAS Código de la Asignatura Créditos

ESTADÍSTICA, SISTEMAS DE INFORMACIÓN Y NUEVAS TECONOLOGÍAS Código de la Asignatura Créditos ESTADÍSTICA, SISTEMAS DE INFORMACIÓN Y NUEVAS TECONOLOGÍAS Código de la Asignatura 46497 Créditos 6 ECTS Carácter Básica Rama de Conocimiento Ciencias de la Salud Materia Fisiología Ubicación dentro del

Más detalles

Utilización de Funciones en OpenOffice.org Calc

Utilización de Funciones en OpenOffice.org Calc Utilización de Funciones en OpenOffice.org Calc Una función es un conjunto de instrucciones reunidas bajo un nombre que calculan un resultado o llevan a cabo una acción específica. Las funciones pueden

Más detalles

En esta lección vamos a ver más utilidades y opciones sobre la

En esta lección vamos a ver más utilidades y opciones sobre la 1. PEGADO ESPECIAL En esta lección vamos a ver más utilidades y opciones sobre la edición de hojas de cálculo de Excel que te pueden ayudar en tu trabajo. Ya sabes cómo cortar o copiar y pegar datos de

Más detalles

VECTORES EN EL PLANO CON DERIVE

VECTORES EN EL PLANO CON DERIVE VECTORES EN EL PLANO CON DERIVE En DERIVE los vectores se pueden introducir de dos formas distintas: (a) mediante la secuencia de comandos Introducir Vector EJEMPLO Definir el vector de componentes (1,2)

Más detalles

Análisis Multivariante de Datos en Psicología. Ana María López Curso

Análisis Multivariante de Datos en Psicología. Ana María López Curso Análisis Multivariante de Datos en Psicología Ana María López Curso 2006-2007 2007 Análisis Multivariante de Datos en Psicología Créditos teóricos: 2.5 Créditos prácticos: 2 PROGRAMA DE CONTENIDOS TEÓRICOS

Más detalles

CuadraTurnos (ios) Manual de usuario. (Guía rápida)

CuadraTurnos (ios) Manual de usuario. (Guía rápida) CuadraTurnos (ios) Manual de usuario (Guía rápida) Contenido 1.- Introducción... 3 2.- Configuración Básica... 4 2.1.- Establecer o modificar un turno en un día... 4 2.2.- Perfiles... 5 2.2.1.- Crear un

Más detalles

DISTRIBUCIONES BIDIMENSIONALES

DISTRIBUCIONES BIDIMENSIONALES La estadística unidimensional estudia los elementos de un conjunto de datos considerando sólo una variable o característica. Si ahora incorporamos, otra variable, y se observa simultáneamente el comportamiento

Más detalles

Análisis Probit. StatFolio de Ejemplo: probit.sgp

Análisis Probit. StatFolio de Ejemplo: probit.sgp STATGRAPHICS Rev. 4/25/27 Análisis Probit Resumen El procedimiento Análisis Probit está diseñado para ajustar un modelo de regresión en el cual la variable dependiente Y caracteriza un evento con sólo

Más detalles

ENLACE CON EL SISTEMA NOI

ENLACE CON EL SISTEMA NOI Enlace NOI 1 ENLACE CON EL SISTEMA NOI. El sistema NOI, es un programa de cálculo de Nómina, el cual permite realizar la importación de Faltas, percepciones y deducciones, así como la exportación de las

Más detalles

INSTITUCION EDUCATIVA MANUEL ANGEL ANACHURY AREA: TECNOLOGIA E INFORMATICA

INSTITUCION EDUCATIVA MANUEL ANGEL ANACHURY AREA: TECNOLOGIA E INFORMATICA BASES DE DATOS (ACCES 2007) OBJETIVO: Conocer el concepto de bases de datos y su funcionalidad además de crear destrezas en su creación y manipulación. Elementos básicos de Access 2007 Vamos a ver cuáles

Más detalles

Estadística Inferencial. Estadística Descriptiva

Estadística Inferencial. Estadística Descriptiva INTRODUCCIÓN Estadística: Ciencia que trata sobre la teoría y aplicación de métodos para coleccionar, representar, resumir y analizar datos, así como realizar inferencias a partir de ellos. Recogida y

Más detalles

Anexo I. Manual Crystal Ball

Anexo I. Manual Crystal Ball Anexo I. Manual Crystal Ball A1.1. Crystal Ball Este anexo presenta los conceptos básicos necesarios para comprender la simulación Monte Carlo, iniciar Crystal Ball, analizar los menús y las barras de

Más detalles

Estadísticas por Filas

Estadísticas por Filas Estadísticas por s Resumen El procedimiento Estadísticas por s calcula estadísticas para datos en filas de la hoa de datos. Esto contrasta con la mayoría de los procedimientos de STATGRAPHICS que esperan

Más detalles

ACCESS 2010 FÁCIL - ONLINE - EN LÍNEA

ACCESS 2010 FÁCIL - ONLINE - EN LÍNEA IMECAF México, S.C. Instituto Mexicano de Contabilidad, Administración y Finanzas Nombre del Curso ACCESS 2010 FÁCIL - ONLINE - EN LÍNEA Objetivo Objetivo general de este curso en línea: Adquirir las habilidades

Más detalles

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO UNIVERSIDAD AUTONOMA DE SANTO DOMINGO FACULTAD DE CIENCIAS ECONOMICAS Y SOCIALES DEPARTAMENTO DE ESTADISITICA CATEDRA Estadística Especializada ASIGNATURA Estadística Descriptiva Para Psicólogos (EST-225)

Más detalles

Vemos, pues, que esta forma de organizar los datos es mucho más potente que utilizando las tabulaciones u otros métodos.

Vemos, pues, que esta forma de organizar los datos es mucho más potente que utilizando las tabulaciones u otros métodos. Tablas Las tablas permiten organizar la información en filas y columnas, de forma que se pueden realizar operaciones y tratamientos sobre las filas y columnas. Por ejemplo, obtener el valor medio de los

Más detalles

MICROSOFT ACCESS 2003 (COMPLETO)

MICROSOFT ACCESS 2003 (COMPLETO) MICROSOFT ACCESS 2003 (COMPLETO) Descripción del funcionamiento del programa de gestión de bases de datos Microsoft Access XP, estudiando los conceptos fundamentales de las bases de datos y explicando

Más detalles

Categoría Área de conocimiento Ref. Unidad de Trabajo

Categoría Área de conocimiento Ref. Unidad de Trabajo Módulo Hojas de cálculo A continuación se describe el programa de estudio correspondiente al módulo Hojas de cálculo, el cual constituye la base para el examen teórico y práctico de este módulo. Objetivos

Más detalles

Análisis de estudios de cohortes en Ciencias de la P005/10. Salud (modelos regresión de Poisson y de Cox)

Análisis de estudios de cohortes en Ciencias de la P005/10. Salud (modelos regresión de Poisson y de Cox) Análisis de estudios de cohortes en Ciencias de la P005/10 Salud (modelos regresión de Poisson y de Cox) Fecha de aprobación de programa: Marzo 2012 Fechas curso: 4 y 5 de Junio de 2012 Horario: Mañana

Más detalles

UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN FACULTAD DE CIENCIAS BIOLÓGICAS SUBDIRECCIÓN DE POSGRADO

UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN FACULTAD DE CIENCIAS BIOLÓGICAS SUBDIRECCIÓN DE POSGRADO UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN FACULTAD DE CIENCIAS BIOLÓGICAS SUBDIRECCIÓN DE POSGRADO CONTENIDO DE CARTA DESCRIPTIVA 1.- IDENTIFICACIÓN Curso: Bioestadística Programa: Doctorado en Inmunobiología

Más detalles