Análisis de Regresión Lineal Múltiple
|
|
- Ramón Córdoba Henríquez
- hace 7 años
- Vistas:
Transcripción
1 Análisis de Regresión Lineal Múltiple El Análisis de Regresión es una técnica estadística para la detección y el modelado de relaciones entre dos o más variables. Incluye un conjunto de técnicas univariantes y multivariantes que permiten encontrar modelos descriptivos o predictivos, a partir de las relaciones observadas en una colección de datos que suele denominarse la muestra de aprendizaje o de entrenamiento. Una gran ventaja del análisis de regresión multivariante lo constituye que las variables sobre las cuales se deseen establecer relaciones pueden ser cuantitativas, categóricas o simultáneamente de ambos tipos (Pérez, 2004). Para el manejo de variables categóricas, nominales u ordinales, se requiere el uso de variables indicadoras o de diseño (dummy, en inglés) y, en algunos casos, de algunas transformaciones para realizar el análisis. En la Regresión Lineal Múltiple, se admite que un atributo o variable Y cualquiera puede ser o explicada por una combinación lineal de otras variables X. La forma general del modelo, es: Y 0 1X1 2 X 2... p1 X p1 (1) En (1), cada variable X j, para j desde 1 hasta p-1, representa una variable independiente o explicativa de Y, la variable respuesta o dependiente. Los j son los parámetros del modelo llamados coeficientes parciales de regresión. Cada j, significa el cambio en el valor esperado de la variable dependiente o explicada E(Y), por una unidad de incremento en X j, cuando las demás variables independientes incluidas en el modelo, permanecen constantes. Si el alcance del modelo admite que el valor para todas las variables independientes pueda ser cero, el parámetro 0 indica el valor esperado de Y cuando todas las X j toman ese valor. En caso contrario, no tiene significado como término separado en el modelo de regresión. En la ecuación, el término, está representando una componente aleatoria que representada la variabilidad en Y que no es explicada por las variables independientes consideradas y que puede ser debida a la naturaleza misma de la variable bajo estudio, por los errores cometidos en las mediciones o por cualquier otra fuente de imperfección en los datos observados. El Modelo de Regresión Múltiple, por su método de ajuste, está restringido al cumplimiento de los siguientes supuestos (Neter y otros, 2001): a) Las variables explicativas o predictivas del modelo deben ser linealmente independientes. Es decir, no debe ser posible que una variable independiente sea explicada por una combinación lineal de las otras. b) Los términos de error o las perturbaciones del modelo deben distribuirse con media cero, varianza constante y ser independientes entre sí. Es claro que el supuesto a) no es difícil de cumplir, por la minimalidad deseable en cualquier modelo. Tampoco lo es admitir que los errores se distribuyan de la manera especificada en el literal b). Si así no ocurriera, podría ser síntoma de que faltan variables independientes por incluir o que las incluidas no son muy apropiadas para explicar la variable respuesta. Por esto, siempre es Claudia Jiménez R Universidad Nacional de Colombia 1
2 recomendable verificar el cumplimiento de los supuestos del Modelo de Regresión Múltiple, mediante el análisis de los residuales y la detección de valores atípicos en ellos (outliers, en inglés) o mediante pruebas de independencia. Cuando los supuestos no se cumplen es posible aplicar medidas remediales, en la mayoría de los casos. El problema central del Análisis de Regresión Múltiple, como es de suponerse, consiste en encontrar la fórmula algebraica del modelo de regresión de un caso particular. Esto es, hallar las mejores estimaciones de los parámetros o coeficientes de regresión parcial, utilizando los datos observados (la muestra de entrenamiento). La fórmula matemática derivada en la minería de estos datos, es un modelo descriptivo que informa cómo pesan o influyen las variables independientes consideradas en la variable de respuesta, de manera cuantitativa. También, sirve para inferir o predecir cuál sería el valor esperado de la variable de respuesta, E(Y), para nuevos ejemplares o con distintos valores en las variables independientes. En el proceso de optimización para determinar los estimadores de los parámetros, se utiliza una función de pérdida como una medida de ajuste del modelo matemático a los datos reales. Se puede elegir entre estimadores de los parámetros que minimicen lo malo del ajuste o que maximicen la bondad del ajuste. Gauss propuso estimar los parámetros minimizando la suma de los cuadrados de las desviaciones o las diferencias entre los valores observados y los ajustados con el modelo de regresión, técnica que se conoce como el Método de Mínimos Cuadrados (Hair y otros, 1999). También podría maximizarse la suma de cuadrados debida a la regresión. Pero un modelo de regresión, donde los errores se distribuyan normalmente, estos dos métodos coinciden, por el teorema de Gauss-Markov, y los estimadores de los parámetros tienen las propiedades de ser insesgados (la media de las estimaciones para diferentes muestras tenderá hacia el parámetro desconocido), consistentes (conforme crece el tamaño muestral, la estimación se aproxima al parámetro desconocido) y suficientes (aprovechan toda la información que proporciona la muestra) (Placket, 1950). Para presentar los estimadores de los coeficientes de regresión parcial, por Mínimos Cuadrados, sea: 0, 1, 2,... p1 un vector de dimensión px1 que representa los coeficientes de regresión o parámetros., X1, X 2, X 3,... X p1 X 1 una matriz de dimensión n p con las constantes o valores de las p variables independientes en los objetos observados o medidos. Las filas de la matriz representan las n- tuplas o ejemplares en la muestra de aprendizaje. Y n Y Y Y, Y,... un vector de dimensión n 1 con los valores de la variable respuesta o 1, 2 3 dependiente, para cada tupla u observación. = ( 1, 2 n ) un vector de dimensión n 1 con los valores de las componentes o perturbaciones aleatorias de cada observación. Con esa notación matricial, la ecuación (1) se puede escribir, en forma resumida, así: Claudia Jiménez R Universidad Nacional de Colombia 2
3 Y = βx + ɛ (2) Como en el modelo de Regresión Lineal Múltiple se supone que el valor esperado de la distribución de los errores o residuales E( ) = 0, y tanto las variables X como los coeficientes de regresión son constantes conocidas, luego: E(Y) = βx Por lo tanto, es natural estimar la función Y=f(x) como: Y X Donde Y (leído Y gorro) es el valor de la función de regresión estimada considerando los valores o niveles de X en la colección de datos y dadas los estimaciones de los coeficientes ˆ' ˆ, ˆ, ˆ,... ˆ. Los estimadores, por mínimos cuadrados, se calculan así: p1 ˆ 1 ' ( X ' X ) X ' Y Después de derivar un modelo de regresión múltiple particular, se debe validar la bondad del ajuste con el fin de poderlo utilizar para describir o predecir valores no sólo futuros, sino para otros valores en las variables independientes no observados o medidos. Cuando hay suficientes datos, se utiliza un subconjunto de ellos, no considerados en el ajuste, para evaluar la capacidad predictiva del modelo. En otros casos, sólo es posible verificar el grado de cumplimiento de los supuestos impuestos al modelo de Regresión Lineal Múltiple para luego determinar la significación estadística de las variables explicativas, de manera global y parcial. Para determinar la significación estadística de manera global de todas las variables se utiliza como estadístico de la prueba a Fc que se distribuye teóricamente como una F con n-1 y p-1 grados de libertad. Para las pruebas de significación de variables independientes de manera marginal se utiliza como estadístico el estadístico Zc. Debe señalarse que un modelo de regresión múltiple es lineal, no por una restricción impuesta sobre las variables que pueden explicar a Y, sino por la linealidad en los parámetros o coeficientes del modelo de regresión; por eso éstos deben aparecer en su primera potencia. Los paquetes estadísticos ofrecen, varias alternativas de transformación de las variables independientes, como x 2, x o e x para ser aplicables antes de realizar un análisis de regresión, si es el caso. Análisis de Regresión Simple en Matlab En el siguiente ejemplo, para hacer el análisis de regresión simple, se carga el archivo de datos llamado carsmall que contiene algunas características de 100 autos. Al cargar el archivo, el sistema crea la variable de tipo matriz X con las variables Horsepower (potencia o caballos de fuerza) y Cylinders (el número de Claudia Jiménez R Universidad Nacional de Colombia 3
4 cilindros). Se trata entonces de explicar el rendimiento del vehiculo (MPG) por medio del potencia del vehículo. Primero queremos visualizar gráficamente la relación entre estas variables: load carsmall X= Horsepower Y = MPG plot(x,y, 'o') -- la o entre comillas simples sirve para que el diagrama no muestre líneas entre los puntos Cuando damos el último comando se abre la interfaz de la Figura 1. En ella vemos que existe una relación inversa entre la potencia con el rendimiento de los autos. Esto significa que a medida que aumenta la potencia, disminuye el renidimiento o las millas por galón. Para el ajuste de los datos a un modelo particular, del menú Tools se escoge la opción Basic fitting. Figura 1. Resultado del comando plot En la Figura 2, vemos dos modelos ajustados a los datos: el modelo lineal y el cuadrático o de segundo orden en la variable X. Alli se observa que se ha chuleado la opción de mostrar las ecuaciones en la gráfica. En el menú tools de la gráfica también es posible editar la figura para agregar las leyendas y títulos apropiados. En la interfaz del ajuste básico, es posible continuar con la presentación de más información, incluida la norma de los residuales, un indicador de la calidad del ajuste. En nuestro ejemplo, de acuerdo con este indicador, el modelo que mejor se ajusta es el cuadrático, como se muestra en la Figura 3. Claudia Jiménez R Universidad Nacional de Colombia 4
5 Figura 2. Ajuste básico de modelos Figura 3. Ajuste básico de modelos Análisis de Regresión Múltiple en Matlab En el siguiente ejemplo, para hacer el análisis de regresión, se carga el archivo de datos llamado carsmall que contiene algunas características de 100 autos. Al cargar el archivo, el sistema crea la variable de tipo matriz X con las variables Horsepower (potencia o caballos de fuerza) y Cylinders (el número de cilindros). Claudia Jiménez R Universidad Nacional de Colombia 5
6 Se trata entonces de explicar el rendimiento del vehiculo (MPG) por medio del cilindraje y la potencia con el método regress : load carsmall X = [ones(size(horsepower)) Horsepower Cylinders]; --la primera componente es para --agregar una columna de unos betagorro = regress(mpg,x) - devuelve los coeficientes estimados betagorro = (Intercepto o Beta cero La función regstats también permite realizar un análisis de regresión lineal múltiple y calcula más estadísticas de regresión. De forma predeterminada, regstats agrega automáticamente una primera columna de unos a la matriz de diseño (necesaria para calcular la estadística F y el valor-p de la prueba), por lo que no se debe incluir de forma explícita un término constante como en la función regress. Por ejemplo: X1 = [Horsepower Cylinders]; stats = regstats(mpg,x1); Crea una variable de tipo estructura, con las estadísticas de regresión. Por tanto, en el área de trabajo se encontrarán los siguientes ítems calculados: Un argumento de entrada opcional a la función regstats permite especificar cuáles estadísticas se deben calcular, en lugar de todas las anteriores. Para especificar de forma interactiva las estadísticas calculadas, se invoca a regstats sin argumentos de salida, como aparece a continuación. regstats(mpg,x1) Abre la interfaz siguiente: Claudia Jiménez R Universidad Nacional de Colombia 6
7 En esta interfaz, se seleccionan las casillas correspondientes a las estadísticas que desean calcular. Las estadísticas seleccionadas se retornan mediante variables al área de trabajo (Workspace) de MATLAB. Los nombres de las variables para las estadísticas que aparecen en la parte derecha de la interfaz, se puede cambiar a cualquier nombre de variable válida en MATLAB. El mensaje después de dar el anterior comando es: Variables have been created in the current workspace. Por lo tanto, ya podemos consultar los valores de esas variables, por ejemplo: >> beta beta = Tabulación de estadísticas de diagnóstico en el análisis de regresión La función regstats calcula las estadísticas que se utilizan normalmente en el diagnóstico de la regresión. Las estadísticas pueden presentarse en formato tabular, de una gran variedad de maneras. Por ejemplo, el campo tstat de la estructura de regstats es en sí mismo una estructura que contiene las estadísticas relacionadas con Claudia Jiménez R Universidad Nacional de Colombia 7
8 los coeficientes estimados de la regresión. El tipo de datos conocido como arreglos de conjuntos de datos (Dataset Arrays) proporcionan un formato tabular natural para la información: >> TablaCoef = dataset({tstat.beta,'coef'},{ tstat.se,'errstd'},{ tstat.t,'tstat'},{tstat.pval,'valor_p'}) TablaCoef = Coef ErrStd tstat Valor_p e e-006 Interpretando estos resultados podemos decir que por el valor p de las pruebas marginales que se basan en la estadística t calculada (y que se distribuye como un t de Student con 97= grados de libertad) se puede rechazar la hipótesis nula. Esto es, todos los coeficientes son estadísticamente significativos y por lo tanto, las millas por galón si pueden ser explicadas por el modelos de regresión. Cuál es la estimación del coeficiente de determinación múltiple? >> rsquare rsquare = Este último resultado significa que aproximadamente un 72% de la variabilidad en las millas por galón (MPG) es explicada por la inclusión del cilindraje y la potencia en el modelo de regresión. La función fprintf de MATLAB, similar a la del lenguaje C, permite cambiar al formato de tabla. Por ejemplo, el campo fstat de la estructura de regstats es una estructura con las estadísticas relacionadas con el análisis de varianza (ANOVA) de la regresión. Los siguientes comandos producen la tabla ANOVA de una regresión estándar: fprintf('tabla de Análisis de la Varianza (ANOVA)'); fprintf('\n\n') fprintf('%6s','fuente'); fprintf('%10s','gdl','sc','cm','f','valor P'); fprintf('\n') fprintf('%6s','regr'); fprintf('%10.4f',fstat.dfr,fstat.ssr,fstat.ssr/fstat.dfr,fstat.f,fstat.pval); fprintf('\n') fprintf('%6s','error'); fprintf('%10.4f', fstat.dfe, fstat.sse, fstat.sse/ fstat.dfe); fprintf('\n') fprintf('%6s','total'); fprintf('%10.4f', fstat.dfe+ fstat.dfr, fstat.sse+ fstat.ssr); fprintf('\n') Para mostrar los datos, así: Tabla de Análisis de la Varianza (ANOVA) Claudia Jiménez R Universidad Nacional de Colombia 8
9 Fuente gdl SC CM F Valor P Regr Error Total Análisis de Correlación en Rattle El análisis de correlación indica si dos variables están relacionadas en forma lineal. Este análisis sólo es para variables numéricas. Hay tres métodos disponibles para hallar la correlación: Pearson, Spearman, Kendall. En este caso se utilizará el de Pearson y se activará la opción Organizado para que organice las variables según la fortaleza de correlación. El resultado se muestra a continuación en la Figura 3. Figura 3. Resultado de un análisis correlación. Si el coeficiente es igual a 1 existe una correlación positiva perfecta, es decir hay una relación lineal perfecta, entre las variables. Cuando una de ellas aumenta la otra también lo hace, en proporción constante. Si 0 < coeficiente < 1, existe una correlación positiva. Si es igual a cero, no existe relación lineal. Si -1 < coeficiente < 0, existe una correlación negativa. Si es igual a -1, existe una correlación negativa perfecta, es decir hay una relación inversa entre las variables, cuando una de ellas aumenta la otra disminuye en proporción constante. El resultado del análisis de correlación también viene acompañado de una gráfica, la cual se muestra a continuación en la Figura 4. Claudia Jiménez R Universidad Nacional de Colombia 9
10 Figura 4. Gráfico de correlación. El grado de correlación se interpreta según la forma y el color de los elementos en la gráfica. Si el elemento es un círculo perfecto no hay correlación entre las variables. Cada variable está perfectamente correlacionada con ella misma, la perfecta correlación se representa con una línea diagonal. El color rojo indica correlación negativa, el azul positiva y entre más intenso sea el color es mayor la correlación. [3] Análisis de Regresión en Rattle Rattle ofrece la posibilidad de generar diferentes tipos de regresión, a continuación se hará una breve descripción de cada uno de las opciones ofrecidas por este paquete. Cada una de estas regresiones se acompaña de un diagrama. Figura 5. Interfaz para realizar regresiones. Numérica: este es el tipo regresión lineal tradicional y es apropiado cuando la variable de destino es numérica y continua. Claudia Jiménez R Universidad Nacional de Colombia 10
Análisis de Regresión
Análisis de Regresión por Universidad Nacional de Colombia, Sede Medellín 202 Tipos de gráficos para el análisis residuales Percen nt Normal Probability Plot of the Residuals 99 90 50 0-3.0 -.5 0.0.5 3.0
Más detallesMétodo de cuadrados mínimos
REGRESIÓN LINEAL Gran parte del pronóstico estadístico del tiempo está basado en el procedimiento conocido como regresión lineal. Regresión lineal simple (RLS) Describe la relación lineal entre dos variables,
Más detallesINTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión
INTERPRETACIÓN DE LA REGRESIÓN Este gráfico muestra el salario por hora de 570 individuos. 1 Interpretación de la regresión. regresión Salario-Estudios Source SS df MS Number of obs = 570 ---------+------------------------------
Más detallesINDICE. Prólogo a la Segunda Edición
INDICE Prólogo a la Segunda Edición XV Prefacio XVI Capitulo 1. Análisis de datos de Negocios 1 1.1. Definición de estadística de negocios 1 1.2. Estadística descriptiva r inferencia estadística 1 1.3.
Más detallesTeoría de la decisión
1.- Un problema estadístico típico es reflejar la relación entre dos variables, a partir de una serie de Observaciones: Por ejemplo: * peso adulto altura / peso adulto k*altura * relación de la circunferencia
Más detallesTercera práctica de REGRESIÓN.
Tercera práctica de REGRESIÓN. DATOS: fichero practica regresión 3.sf3 1. Objetivo: El objetivo de esta práctica es aplicar el modelo de regresión con más de una variable explicativa. Es decir regresión
Más detallesAnálisis de Componentes de la Varianza
Análisis de Componentes de la Varianza Resumen El procedimiento de Análisis de Componentes de Varianza está diseñado para estimar la contribución de múltiples factores a la variabilidad de una variable
Más detallesVARIABLES ESTADÍSTICAS BIDIMENSIONALES
VARIABLES ESTADÍSTICAS BIDIMENSIONALES 1.- En una variable estadística bidimensional, el diagrama de dispersión representa: a) la nube de puntos. b) las varianzas de las dos variables. c) los coeficientes
Más detallesRegresión lineal SIMPLE MÚLTIPLE N A Z IRA C A L L E J A
Regresión lineal REGRESIÓN LINEAL SIMPLE REGRESIÓN LINEAL MÚLTIPLE N A Z IRA C A L L E J A Qué es la regresión? El análisis de regresión: Se utiliza para examinar el efecto de diferentes variables (VIs
Más detallesPronósticos, Series de Tiempo y Regresión. Capítulo 4: Regresión Lineal Múltiple
Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple Temas Modelo de regresión lineal múltiple Estimaciones de Mínimos Cuadrados Ordinarios (MCO); estimación puntual y predicción
Más detalles2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...
Contenidos 1 Introducción al paquete estadístico S-PLUS 19 1.1 Introducción a S-PLUS............................ 21 1.1.1 Cómo entrar, salir y consultar la ayuda en S-PLUS........ 21 1.2 Conjuntos de datos..............................
Más detallesTema 2. Regresión Lineal
Tema 2. Regresión Lineal 3.2.1. Definición Mientras que en el apartado anterior se desarrolló una forma de medir la relación existente entre dos variables; en éste, se trata de esta técnica que permite
Más detallesESTADÍSTICA. Tema 4 Regresión lineal simple
ESTADÍSTICA Grado en CC. de la Alimentación Tema 4 Regresión lineal simple Estadística (Alimentación). Profesora: Amparo Baíllo Tema 4: Regresión lineal simple 1 Estructura de este tema Planteamiento del
Más detallesProceso de análisis de regresión múltiple
Proceso de análisis de regresión múltiple Recolección de datos Chequeo de la calidad de los datos Diagnóstico de relaciones o interacciones fuertes entre las variables Xs Aplicación de medidas remediales
Más detallesRESUMEN DE ALGUNOS CONCEPTOS ESTADÍSTICOS ELEMENTALES Y NOTACIÓN EMPLEADA EN EL CURSO
RESUMEN DE ALGUNOS CONCEPTOS ESTADÍSTICOS ELEMENTALES Y NOTACIÓN EMPLEADA EN EL CURSO 1 rojo 1 2 3 4 5 6 Supongamos que tenemos dos dados, uno rojo y otro verde, cada uno de los cuales toma valores entre
Más detallesCM0244. Suficientable
IDENTIFICACIÓN NOMBRE ESCUELA ESCUELA DE CIENCIAS NOMBRE DEPARTAMENTO Ciencias Matemáticas ÁREA DE CONOCIMIENTO MATEMATICAS, ESTADISTICA Y AFINES NOMBRE ASIGNATURA EN ESPAÑOL ESTADÍSTICA GENERAL NOMBRE
Más detallesINDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos
INDICE Prefacio VII 1. Introducción 1 1.1. Qué es la estadística moderna? 1 1.2. El crecimiento y desarrollo de la estadística moderna 1 1.3. Estudios enumerativos en comparación con estudios analíticos
Más detallesMulticolinealidad. Universidad de Granada. RSG Incumplimiento de las hipótesis básicas en el modelo lineal uniecuacional múltiple 1 / 17
Román Salmerón Gómez Universidad de Granada RSG Incumplimiento de las hipótesis básicas en el modelo lineal uniecuacional múltiple 1 / 17 exacta: aproximada: exacta: aproximada: RSG Incumplimiento de las
Más detallesPronósticos Automáticos
Pronósticos Automáticos Resumen El procedimiento de Pronósticos Automáticos esta diseñado para pronosticar valores futuros en datos de una serie de tiempo. Una serie de tiempo consiste en un conjunto de
Más detalles4.1 Análisis bivariado de asociaciones
4.1 Análisis bivariado de asociaciones Los gerentes posiblemente estén interesados en el grado de asociación entre dos variables Las técnicas estadísticas adecuadas para realizar este tipo de análisis
Más detallesExactitud y Linearidad del Calibrador
Exactitud y Linearidad del Calibrador Resumen El procedimiento Exactitud y Linearidad del Calibrador fue diseñado para estimar la exactitud del sistema de medición. En contraste con los procedimientos
Más detallesEl ejemplo: Una encuesta de opinión
El ejemplo: Una encuesta de opinión Objetivos Lo más importante a la hora de planificar una encuesta es fijar los objetivos que queremos lograr. Se tiene un cuestionario ya diseñado y se desean analizar
Más detallesMétodos Estadísticos Multivariados
Métodos Estadísticos Multivariados Victor Muñiz ITESM Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre 2011 1 / 20 Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre
Más detallesTema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0
Ignacio Martín Tamayo 11 Tema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0 ÍNDICE ------------------------------------------------------------- 1. Introducción 2. Frecuencias 3. Descriptivos 4. Explorar
Más detallesDepartamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.
TEMA 13 REGRESIÓN LOGÍSTICA Es un tipo de análisis de regresión en el que la variable dependiente no es continua, sino dicotómica, mientras que las variables independientes pueden ser cuantitativas o cualitativas.
Más detallesAnálisis Probit. StatFolio de Ejemplo: probit.sgp
STATGRAPHICS Rev. 4/25/27 Análisis Probit Resumen El procedimiento Análisis Probit está diseñado para ajustar un modelo de regresión en el cual la variable dependiente Y caracteriza un evento con sólo
Más detallesEstadísticos Descriptivos
ANÁLISIS EXPLORATORIO DE DATOS El análisis exploratorio tiene como objetivo identificar el modelo teórico más adecuado para representar la población de la cual proceden los datos muéstrales. Dicho análisis
Más detallesINFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón
Metodología de Investigación Tesifón Parrón Contraste de hipótesis Inferencia Estadística Medidas de asociación Error de Tipo I y Error de Tipo II α β CONTRASTE DE HIPÓTESIS Tipos de Test Chi Cuadrado
Más detallesTeorema Central del Límite (1)
Teorema Central del Límite (1) Definición. Cualquier cantidad calculada a partir de las observaciones de una muestra se llama estadístico. La distribución de los valores que puede tomar un estadístico
Más detallesAgro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos
Agro 6998 Conferencia Introducción a los modelos estadísticos mixtos Los modelos estadísticos permiten modelar la respuesta de un estudio experimental u observacional en función de factores (tratamientos,
Más detallesUNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE ESTUDIOS SUPERIORES CUAUTITLÁN PLAN DE ESTUDIOS DE LA LICENCIATURA EN QUÍMICA INDUSTRIAL
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE ESTUDIOS SUPERIORES CUAUTITLÁN PLAN DE ESTUDIOS DE LA LICENCIATURA EN QUÍMICA INDUSTRIAL PROGRAMA DE LA ASIGNATURA DE: IDENTIFICACIÓN DE LA ASIGNATURA
Más detallesFormulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico
Formulario. Estadística Administrativa Módulo 1. Introducción al análisis estadístico Histogramas El número de intervalos de clase, k, se elige de tal forma que el valor 2 k sea menor (pero el valor más
Más detalles3. Correlación. Introducción. Diagrama de dispersión
1 3. Correlación Introducción En los negocios, no todo es el producto, pueden existir factores relacionados o externos que modifiquen cómo se distribuye un producto. De igual manera, la estadística no
Más detalles5. Regresión Lineal Múltiple
1 5. Regresión Lineal Múltiple Introducción La regresión lineal simple es en base a una variable independiente y una dependiente; en el caso de la regresión línea múltiple, solamente es una variable dependiente
Más detallesRegresión Lineal. Dra. Noemí L. Ruiz Limardo 2008 Derechos Reservados, Rev 2010
Regresión Lineal Dra. Noemí L. Ruiz Limardo 008 Derechos Reservados, Rev 010 Objetivos de la Lección Conocer el significado de la regresión lineal Determinar la línea de regresión cuando ha correlación
Más detallesSe permite un folio escrito por las dos caras. Cada problema se realiza en hojas diferentes y se entregan por separado.
NORMAS El examen consta de dos partes: 0.0.1. Diez Cuestiones: ( tiempo: 60 minutos) No se permite ningún tipo de material (libros, apuntes, calculadoras,...). No se permite abandonar el aula una vez repartido
Más detallesDos matrices son iguales cuando tienen la misma dimensión y los elementos que ocupan el mismo lugar en ambas son iguales
Introducción Las matrices aparecen por primera vez hacia el año 1850, introducidas por J.J. Sylvester. El desarrollo inicial de la teoría se debe al matemático W.R. Hamilton en 1853. En 1858, A. Cayley
Más detalles1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA
MODELO DE REGRESIÓN LOGÍSTICA Introducción A grandes rasgos, el objetivo de la regresión logística se puede describir de la siguiente forma: Supongamos que los individuos de una población pueden clasificarse
Más detallesTécnicas de Investigación Social
Licenciatura en Sociología Curso 2006/07 Técnicas de Investigación Social Medir la realidad social (4) La regresión (relación entre variables) El término REGRESIÓN fue introducido por GALTON en su libro
Más detallesADMINISTRACION DE OPERACIONES
Sesión4: Métodos cuantitativos ADMINISTRACION DE OPERACIONES Objetivo específico 1: El alumno conocerá y aplicara adecuadamente los métodos de pronóstico de la demanda para planear la actividad futura
Más detallesCORRELACIÓN Y REGRESIÓN. Juan José Hernández Ocaña
CORRELACIÓN Y REGRESIÓN Juan José Hernández Ocaña CORRELACIÓN Muchas veces en Estadística necesitamos saber si existe una relación entre datos apareados y tratamos de buscar una posible relación entre
Más detallesSOLUCIÓN A LOS EJERCICIOS DEL SPSS Bivariante
SOLUCIÓ A LOS EJERCICIOS DEL SPSS Bivariante. a). La media y la varianza de las variables estatura y peso en la escala de medida norteamericana. Peso Peso: Transformar -> Calcular: Libras.4536 Peso libras
Más detallesEstadísticas Elemental Tema 3: Describir la relación entre dos variables: Correlación y regresión 3.1-1
Estadísticas Elemental Tema 3: Describir la relación entre dos variables: Correlación y regresión 3.1-1 Relación entre dos variables Al estudiar conjuntos de variables con más de una variable, una pregunta
Más detallesRepaso de estadística básica. Juan D. Barón Santiago de Chile, 8 de abril de 2013
Repaso de estadística básica Juan D. Barón Santiago de Chile, 8 de abril de 2013 1 I. CONCEPTOS ESTADÍSTICOS BÁSICOS 2 Las decisiones se toman bajo incertidumbre Las decisiones se basan en información
Más detallesY accedemos al cuadro de diálogo Descriptivos
SPSS: DESCRIPTIVOS PROCEDIMIENTO DE ANÁLISIS INICIAL DE DATOS: DESCRIPTIVOS A diferencia con el procedimiento Frecuencias, que contiene opciones para describir tanto variables categóricas como cuantitativas
Más detallesESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua
ESTADÍSTICA Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal Cuantitativa discreta continua DISTRIBUCIÓN DE FRECUENCIAS Frecuencia absoluta: fi Frecuencia relativa:
Más detalles2 = 1 0,5 + = 0,5 c) 3 + = = 2
Trabajo Práctico N : SISTEMAS DE ECUACIONES LINEALES Ejercicio : Resuelva los siguientes sistemas de ecuaciones lineales empleando cuando sea posible: i) Método matricial. ii) Regla de Cramer. Interprete
Más detallesUNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO. Facultad de Medicina Veterinaria y Zootecnia. Licenciatura en Medicina Veterinaria y Zootecnia
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO Facultad de Medicina Veterinaria y Zootecnia Licenciatura en Medicina Veterinaria y Zootecnia Clave 1212 Modalidad del curso: Carácter Métodos estadísticos en medicina
Más detallesTema 8. Análisis de dos variables Ejercicios resueltos 1
Tema 8. Análisis de dos variables Ejercicios resueltos 1 Ejercicio resuelto 8.1 La siguiente tabla muestra la distribución del gasto mensual en libros y el gasto mensual en audiovisual en euros en los
Más detallesPOBLACIÓN Y MUESTRAS EN LA INVESTIGACIÓN
POBLACIÓN Y MUESTRAS EN LA INVESTIGACIÓN Adela del Carpio Rivera Doctor en Medicina UNIVERSO Conjunto de individuos u objetos de los que se desea conocer algo en una investigación Población o universo
Más detalles1. Cómo introducir datos en SPSS/PC? - Recordatorio
1 Taller de Estadística Curso 2oo5/2oo6 Descripción de datos bivariantes El objetivo de esta práctica es familiarizarse con las técnicas de descripción de datos bidimensionales y con algunas de las opciones
Más detallesÍNDICE INTRODUCCIÓN... 21
INTRODUCCIÓN... 21 CAPÍTULO 1. ORGANIZACIÓN DE LOS DATOS Y REPRESENTACIONES GRÁFICAS... 23 1. ORGANIZACIÓN DE LOS DATOS... 23 1.1. La distribución de frecuencias... 24 1.2. Agrupación en intervalos...
Más detallesPREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2
PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2 Preg. 1. Para comparar la variabilidad relativa de la tensión arterial diastólica y el nivel de colesterol en sangre de una serie de individuos, utilizamos
Más detallesINSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016
ANEXO ESTADÍSTICO 1 : COEFICIENTES DE VARIACIÓN Y ERROR ASOCIADO AL ESTIMADOR ENCUESTA NACIONAL DE EMPLEO (ENE) INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 9 de Abril de 016 1 Este anexo estadístico es una
Más detallesTEMA 1. MATRICES, DETERMINANTES Y APLICACIÓN DE LOS DETERMINANTES. CONCEPTO DE MATRIZ. LA MATRIZ COMO EXPRESIÓN DE TABLAS Y GRAFOS.
TEMA 1. MATRICES, DETERMINANTES Y APLICACIÓN DE LOS DETERMINANTES. 1. MATRICES. CONCEPTO DE MATRIZ. LA MATRIZ COMO EXPRESIÓN DE TABLAS Y GRAFOS. DEFINICIÓN: Las matrices son tablas numéricas rectangulares
Más detallesEconometría II Grado en finanzas y contabilidad
Econometría II Grado en finanzas y contabilidad Variables aleatorias y procesos estocásticos. La FAC y el correlograma Profesora: Dolores García Martos E-mail:mdgmarto@est-econ.uc3m.es Este documento es
Más detalles1: INTRODUCCIÓN AL USO DE LA HOJA DE CALCULO EXCEL COMO HERRAMIENTA PARA DESARROLLAR PROBLEMAS EN INGENIERÍA. SOLVER, REGRESION LINEAL MULTIPLE
Practica 1: INTRODUCCIÓN AL USO DE LA HOJA DE CALCULO EXCEL COMO HERRAMIENTA PARA DESARROLLAR PROBLEMAS EN INGENIERÍA. SOLVER, REGRESION LINEAL MULTIPLE I. INTRODUCCION Las planillas de cálculo se han
Más detallesTema 2 Datos multivariantes
Aurea Grané Máster en Estadística Universidade Pedagógica 1 Aurea Grané Máster en Estadística Universidade Pedagógica 2 Tema 2 Datos multivariantes 1 Matrices de datos 2 Datos multivariantes 2 Medias,
Más detallesPROPIEDADES DE LOS CAMPOS. Cada campo de una tabla dispone de una serie de características que proporcionan un control
PROPIEDADES DE LOS CAMPOS Cada campo de una tabla dispone de una serie de características que proporcionan un control adicional sobre la forma de funcionar del campo. Las propiedades aparecen en la parte
Más detallesRegresión y Correlación
Relación de problemas 4 Regresión y Correlación 1. El departamento comercial de una empresa se plantea si resultan rentables los gastos en publicidad de un producto. Los datos de los que dispone son: Beneficios
Más detallesEstadís5ca. María Dolores Frías Domínguez Jesús Fernández Fernández Carmen María Sordo. Tema 2. Modelos de regresión
Estadís5ca Tema 2. Modelos de regresión María Dolores Frías Domínguez Jesús Fernández Fernández Carmen María Sordo Departamento de Matemá.ca Aplicada y Ciencias de la Computación Este tema se publica bajo
Más detallesUnidad IV: Distribuciones muestrales
Unidad IV: Distribuciones muestrales 4.1 Función de probabilidad En teoría de la probabilidad, una función de probabilidad (también denominada función de masa de probabilidad) es una función que asocia
Más detallesRegresión en Cadena. StatFolio de Ejemplo: ridge reg.sgp
Regresión en Cadena Resumen El procedimiento Regresión en Cadena está diseñado para ajustar un modelo de regresión múltiple cuando las variables independientes exhiben multicolinealidad. Multicolinealidad
Más detallesSelección de fuentes de datos y calidad de datos
Selección de fuentes de datos y calidad de datos ESCUELA COMPLUTENSE DE VERANO 2014 MINERIA DE DATOS CON SAS E INTELIGENCIA DE NEGOCIO Juan F. Dorado José María Santiago . Valores atípicos. Valores faltantes.
Más detallesINTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)
TEMA Nº 7 DISTRIBUCIONES CONTINUAS DE PROBABILIDAD OBJETIVOS DE APRENDIZAJE: Conocer las características de la distribución normal como distribución de probabilidad de una variable y la aproximación de
Más detallesGUÍA 5 : EFECTO DEL ESTRÉS EN EL PESO DE RECIÉN NACIDOS
GUÍA 5 : EFECTO DEL ESTRÉS EN EL PESO DE RECIÉN NACIDOS Se realizó un estudio a partir de una muestra aleatoria de mujeres atendidas por el departamento de obstetricia y ginecología de cierta clínica particular.
Más detallesDISTRIBUCIONES BIDIMENSIONALES
La estadística unidimensional estudia los elementos de un conjunto de datos considerando sólo una variable o característica. Si ahora incorporamos, otra variable, y se observa simultáneamente el comportamiento
Más detalles1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN MÚLTIPLE Julián de la Horra Departamento de Matemáticas U.A.M.
MODELO DE REGRESIÓN MÚLTIPLE Julián de la Horra Departamento de Matemáticas U.A.M. 1 Introducción Abordaremos en este capítulo el modelo de regresión lineal múltiple, una vez que la mayor parte de las
Más detallesDoc. Juan Morales Romero
Análisis de Correlación y Regresión Lineal ANALISIS DE CORRELACION Conjunto de técnicas estadísticas empleadas para medir la intensidad de la asociación entre dos variables DIAGRAMA DE DISPERSION Gráfica
Más detallesUNIVERSIDAD AUTONOMA DE SANTO DOMINGO
UNIVERSIDAD AUTONOMA DE SANTO DOMINGO FACULTAD DE CIENCIAS ECONOMICAS Y SOCIALES DEPARTAMENTO DE ESTADISITICA CATEDRA Estadística Especializada ASIGNATURA Estadística Descriptiva Para Psicólogos (EST-225)
Más detallesTema 3. Relación entre dos variables cuantitativas
Tema 3. Relación entre dos variables cuantitativas Resumen del tema 3.1. Diagrama de dispersión Cuando sobre cada individuo de una población se observan simultáneamente dos características cuantitativas
Más detallesEl Análisis de Correspondencias tiene dos objetivos básicos:
Tema 8 Análisis de correspondencias El Análisis de Correspondencias es una técnica de reducción de dimensión y elaboración de mapas percentuales. Los mapas percentuales se basan en la asociación entre
Más detallesFila: Es un conjunto de varias celdas dispuestas en sentido horizontal.
Que Es Excel? Excel es un programa que permite la manipulación de libros y hojas de calculo. En Excel, un libro es el archivo en que se trabaja y donde se almacenan los datos. Como cada libro puede contener
Más detallesTEMA 3: Contrastes de Hipótesis en el MRL
TEMA 3: Contrastes de Hipótesis en el MRL Econometría I M. Angeles Carnero Departamento de Fundamentos del Análisis Económico Curso 2011-12 Econometría I (UA) Tema 3: Contrastes de Hipótesis Curso 2011-12
Más detallesCURSO VIRTUAL. Acceso a fuentes de información y manejo de redes sociales. Módulo 2
CURSO VIRTUAL Acceso a fuentes de información y manejo de redes sociales Módulo 2 OBJETIVOS Conseguir que el alumno adquiera conocimientos estadísticos que le permitan una lectura comprensiva de la metodología
Más detallesMicrosoft Project 2013
Microsoft Project 2013 SALOMÓN CCANCE Project 2013 Salomón Ccance www.ccance.net CCANCE WEBSITE ANEXO 2. MANEJO DE VISTAS Y TABLAS. 2.1. ELEMENTOS DE VISUALIZACIÓN DE MICROSOFT OFFICE PROJECT PROFESSIONAL
Más detallesINDICE Capítulo I: Conceptos Básicos Capitulo II: Estadística Descriptiva del Proceso
INDICE Capítulo I: Conceptos Básicos 1.- Introducción 3 2.- Definición de calidad 7 3.- Política de calidad 10 4.- Gestión de la calidad 12 5.- Sistema de calidad 12 6.- Calidad total 13 7.- Aseguramiento
Más detallesY = ßo + ß1X + ε. La función de regresión lineal simple es expresado como:
1 Regresión Lineal Simple Cuando la relación funcional entre las variables dependiente (Y) e independiente (X) es una línea recta, se tiene una regresión lineal simple, dada por la ecuación donde: Y =
Más detalles4. Regresión Lineal Simple
1 4. Regresión Lineal Simple Introducción Una vez conociendo las medidas que se utilizan para expresar la fuerza y la dirección de la relación lineal entre dos variables, se tienen elementos base para
Más detallesEstadística: Conceptos Básicos, Tablas y Gráficas. Dra. Noemí L. Ruiz Limardo Revisado 2011 Derechos de Autor Reservados
Estadística: Conceptos Básicos, Tablas y Gráficas Dra. Noemí L. Ruiz Limardo Revisado 2011 Derechos de Autor Reservados Objetivos de la Lección Conocer el significado de los términos: Estadística Estadística
Más detallesMedidas de Tendencia Central. Dra. Noemí L. Ruiz Limardo Derechos de Autor Reservados Revisado 2010
Medidas de Tendencia Central Dra. Noemí L. Ruiz Limardo Derechos de Autor Reservados Revisado 2010 Objetivos de Lección Conocer cuáles son las medidas de tendencia central más comunes y cómo se calculan
Más detallesSistem as de ecuaciones lineales
Sistem as de ecuaciones lineales. Concepto, clasificación y notación Un sistema de m ecuaciones lineales con n incógnitas se puede escribir del siguiente modo: a x + a 2 x 2 + a 3 x 3 + + a n x n = b a
Más detallesAlgebra lineal y conjuntos convexos
Apéndice A Algebra lineal y conjuntos convexos El método simplex que se describirá en el Tema 2 es de naturaleza algebraica y consiste en calcular soluciones de sistemas de ecuaciones lineales y determinar
Más detallesINFERENCIA ESTADISTICA
1 INFERENCIA ESTADISTICA Es una rama de la Estadística que se ocupa de los procedimientos que nos permiten analizar y extraer conclusiones de una población a partir de los datos de una muestra aleatoria,
Más detallesTema 5. Muestreo y distribuciones muestrales
1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras aleatorias simples. Distribución de la media muestral: Esperanza y varianza. Distribución exacta en el caso normal. Distribución
Más detallesMinisterio de Educación Pública Dirección de Gestión y Evaluación de la Calidad Departamento de Evaluación Académica y Certificación.
Matemáticas Distribución de ítems para la prueba nacional Modalidad Académica (Diurnos Nocturnos) Convocatorias 016 ESTIMADO DOCENTE: En la modalidad de colegios académico, la Prueba de Bachillerato 016
Más detallesPráctica 9 REGRESION LINEAL Y CORRELACIÓN
Práctica 9. Regresión lineal y Correlación 1 Práctica 9 REGRESION LINEAL Y CORRELACIÓN Objetivos: En esta práctica utilizaremos el paquete SPSS para estudiar la regresión lineal entre dos variables y la
Más detallesEstadística aplicada a la comunicación
Estadística aplicada a la comunicación Tema 5: Análisis de datos cuantitativos I: estadística descriptiva b. Análisis bivariante OpenCourseWare UPV/EHU Unai Martín Roncero Departamento de Sociología 2
Más detalles3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS
1. INTRODUCCIÓN Este tema se centra en el estudio conjunto de dos variables. Dos variables cualitativas - Tabla de datos - Tabla de contingencia - Diagrama de barras - Tabla de diferencias entre frecuencias
Más detallesResumen teórico de los principales conceptos estadísticos
Temas de Estadística Práctica Antonio Roldán Martínez Proyecto http://www.hojamat.es/ Muestreo aleatorio simple Resumen teórico Resumen teórico de los principales conceptos estadísticos Muestreo aleatorio
Más detallesCURSO-TALLER DE ANÁLISIS ESTADÍSTICO BÁSICO CON EXCEL Y SPSS Instructor: Mario Alberto Barajas Malacara
CURSO-TALLER DE ANÁLISIS ESTADÍSTICO BÁSICO CON EXCEL Y SPSS Instructor: Mario Alberto Barajas Malacara Descripción: Los temas de estadística propuestos corresponden con los conocimientos mínimos que un
Más detallesEs mínima la suma de los cuadrados de dichas desviaciones. Ninguna otra recta daría una suma menor de las desviaciones elevadas al cuadrado:
Orígenes El día de Año Nuevo de 1801, el astrónomo italiano Giuseppe Piazzi descubrió el planeta menor Ceres, siendo capaz de seguir su órbita durante 40 días. Durante el curso de ese año, muchos científicos
Más detallesTema 7 : DATOS BIVARIADOS. CORRELACION Y REGRESION.
Tema 7 : DATOS BIVARIADOS. CORRELACION Y REGRESION. Distribuciones uni- y pluridimensionales. Hasta ahora se han estudiado los índices y representaciones de una sola variable por individuo. Son las distribuciones
Más detallesPruebas de Hipótesis-ANOVA. Curso de Seminario de Tesis Profesor QF Jose Avila Parco Año 2016
Pruebas de Hipótesis-ANOVA Curso de Seminario de Tesis Profesor Q Jose Avila Parco Año 2016 Análisis de la Varianza de un factor (ANOVA) El análisis de la varianza (ANOVA) es una técnica estadística paramétrica
Más detallesRepaso de conceptos de álgebra lineal
MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN Manuel Sánchez-Montañés Luis Lago Ana González Escuela Politécnica Superior Universidad Autónoma de Madrid Repaso
Más detallesMANEJO DE VARIABLES EN INVESTIGACIÓN CLÍNICA Y EXPERIMENTAL
MANEJO DE VARIABLES EN INVESTIGACIÓN CLÍNICA Y EXPERIMENTAL Israel J. Thuissard David Sanz-Rosa IV JORNADAS INVESTIGACIÓN COEM UNIVERSIDADES 4 de marzo de 2016 Escuela de Doctorado e Investigación. Vicerrectorado
Más detallesRegresión con variables independientes cualitativas
Regresión con variables independientes cualitativas.- Introducción...2 2.- Regresión con variable cualitativa dicotómica...2 3.- Regresión con variable cualitativa de varias categorías...6 2.- Introducción.
Más detalles15. Regresión lineal. Te recomiendo visitar su página de apuntes y vídeos:
15. Regresión lineal Este tema, prácticamente íntegro, está calacado de los excelentes apuntes y transparencias de Bioestadística del profesor F.J. Barón López de la Universidad de Málaga. Te recomiendo
Más detallesMatrices, Determinantes y Sistemas Lineales.
12 de octubre de 2014 Matrices Una matriz A m n es una colección de números ordenados en filas y columnas a 11 a 12 a 1n f 1 a 21 a 22 a 2n f 2....... a m1 a m2 a mn f m c 1 c 2 c n Decimos que la dimensión
Más detallesEstadística y sus aplicaciones en Ciencias Sociales 7. El modelo de regresión simple. Facultad de Ciencias Sociales - UdelaR
Estadística y sus aplicaciones en Ciencias Sociales 7. El modelo de regresión simple Facultad de Ciencias Sociales - UdelaR Índice 7.1 Introducción 7.2 Análisis de regresión 7.3 El Modelo de Regresión
Más detalles