1. Distribución Normal estándar



Documentos relacionados
D.2 ANÁLISIS ESTADÍSTICO DE LAS TEMPERATURAS DE VERANO

Distribución de Probabilidad Normal

REGRESIÓN LINEAL CON SPSS

SESIÓN PRÁCTICA 7: REGRESION LINEAL SIMPLE PROBABILIDAD Y ESTADÍSTICA. PROF. Esther González Sánchez. Departamento de Informática y Sistemas

3. VARIABLES ALEATORIAS

TRABAJO PRÁCTICO ESTADISTICA APLICADA (746)

Estadística II Tema 4. Regresión lineal simple. Curso 2010/11

Comparación de Líneas de Regresión

Capitulo. Describir la relación entre dos variables Pearson Prentice Hall. All rights reserved

Teoría de la decisión Estadística

7. Distribución normal

DOCUMENTO 3: DISTRIBUCIÓN DE PROBABILIDAD DE V. A. CONTINUA: LA DISTRIBUCIÓN NORMAL

5 Relaciones entre variables.

Distribución muestral de proporciones. Algunas secciones han sido tomadas de: Apuntes de Estadística Inferencial Instituto Tecnológico de Chiuhuahua

P (X 5) = P (x = 5) + P (X = 6) + P (X = 7) + P (X = 8) = =

Análisis de regresión lineal simple

EJERCICIOS RESUELTOS TEMA 7

Ejercicios resueltos de funciones

PROBABILIDAD Y ESTADÍSTICA. Sesión 5 (En esta sesión abracamos hasta tema 5.8)

Una sucesión infinita es una función cuyo dominio es el conjunto de los enteros positivos. Podemos denotar una sucesión como una lista

La distribución normal o gaussiana es la distribución. Definición 42 Se dice que una variable X se distribuye como normal con parámetros µ y σ si

Probabilidades y la curva normal

peso edad grasas Regresión lineal simple Los datos

SnapStat: Análisis de Una Muestra

Regresión Lineal. Dra. Noemí L. Ruiz Limardo 2008 Derechos Reservados, Rev 2010

Estadistica II Tema 1. Inferencia sobre una población. Curso 2009/10

DISTRIBUCIONES DE PROBABILIDAD

MODELO DE RESPUESTAS Objetivos del 1 al 9

La distribución t de student. O lo que es lo mismo: La relación entre la cerveza y los estudios de estadística

DISTRIBUCIONES DE PROBABILIDAD (RESUMEN)

1. Límites normales de tolerancia: estos límites asumen que los datos son una muestra aleatoria de una distribución normal.

Y = ßo + ß1X + ε. La función de regresión lineal simple es expresado como:

Análisis de Regresión y Correlación Lineal

Ec. rectas notables en un triángulo

3. Resolver triángulos rectángulos utilizando las definiciones de las razones trigonométricas.

Representación gráfica de funciones. De la fórmula a la tabla. Resolución de problemas

RELACIÓN DE EJERCICIOS DE REPASO DE MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I

LA DISTRIBUCIÓN NORMAL

1.- DATOS DE LA ASIGNATURA. Nombre de la asignatura: Probabilidad y Estadística. Carrera: Ingeniería en Materiales. Clave de la asignatura: MAM 0524

TEMA 4: DERIVADAS. En símbolos, la pendiente de la curva en P = lim Q P (pendiente de P Q).

Matrices escalonadas y escalonadas reducidas

Capítulo 2. Desigualdades y valor absoluto

Estadística II Examen Final - Enero Responda a los siguientes ejercicios en los cuadernillos de la Universidad.

CUADERNO DE EJERCICIOS

Análisis esquemático simplificado de una torre de enfriamiento.

ÍNDICE CAPITULO UNO CAPITULO DOS. Pág.

RIESGO Y RENDIMIENTO RIESGO Y RENDIMIENTO RIESGO Y RENDIMIENTO RIESGO Y RENDIMIENTO RIESGO Y RENDIMIENTO RIESGO Y RENDIMIENTO. M.Sc. Roberto Solé M.

Cómo describir e interpretar los resultados de un estudio de investigación quirúrgica? Variables cuantitativas

Series y sucesión lineal

Derivadas. Contenido Introducción. ( α) Definición de Derivada. (α) Pendiente de la recta tangente. (α) Funciones diferenciables.

Curso Propedéutico de Cálculo Sesión 2: Límites y Continuidad

Estadísticas Elemental Tema 3: Describir la relación entre dos variables: Correlación y regresión 3.1-1

El resultado se expresa mediante una cantidad seguida de la unidad elegida. La cantidad representa el número de veces que se repite la unidad.

Distribuciones bidimensionales. Regresión.

TALLER DE INTRODUCCIÓN A LOS NEGOCIOS

VALOR ABSOLUTO. Definición.- El valor absoluto de un número real, x, se define como:

Profr. Efraín Soto Apolinar. Forma general

Distribución Normal. Universidad Diego Portales Facultad de Economía y Empresa. Estadística I Profesor: Carlos R. Pitta

FUERZAS DE UN FLUIDO EN REPOSO SOBRE SUPERFICIES PLANAS

ESTADISTICA POR REGLA DE TRES

Matemáticas Nivel Medio Matemáticas Ap.CC.SS.II

2.5. Asimetría y apuntamiento

ESTADÍSTICA APLICADA. Tema 4: Regresión lineal simple

El conjunto de los complejos. Escritura cartesiana y binómica. Representación gráfica.

21. Círculo y recta Matemáticas II, 2012-II. Por qué el círculo y la recta son tan importantes?

Tema 5: Principales Distribuciones de Probabilidad

UNIDAD 4.- INECUACIONES Y SISTEMAS (tema 4 del libro)

FUNCIONES CUADRÁTICAS. PARÁBOLAS

ALGEBRA Y GEOMETRÍA II 2º semestre Año: Guía de Estudio y Ejercitación propuesta

Sucesiones (páginas )

INTRODUCCIÓN DIAGRAMA DE DISPERSIÓN. Figura1

Explorando la ecuación de la recta pendiente intercepto

Resolución. Resolución gráfica de problemas de optimización

Tema 1. Cálculo diferencial

Método de fórmula general

MATEMÁTICA MÓDULO 1 Eje temático: Números y proporcionalidad

Los fenómenos psicológicos (por ejemplo, la comunicación verbal) se puede analizar desde distintos puntos de vista:

( x) ( ) Modelos No Lineales. µ β β β

Estadística Descriptiva. SESIÓN 12 Medidas de dispersión

CAPÍTULO. 1 Conceptos básicos

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10

Desde la secundaria estamos acostumbrados a trabajar con polinomios, los cuales identificamos con expresiones de la forma

Tabla de Derivadas. Función Derivada Función Derivada. f (x) n+1. f (x) y = f (x) y = ln x. y = cotg f (x) y = ( 1 cotg 2 f (x)) f (x) = f (x)

TEMA 2: DISTRIBUCIONES BIDIMENSIONALES

6 EXPRESIONES FRACCIONARIAS Y RADICALES

Polinomios. 1.- Funciones cuadráticas

6. ESTIMACIÓN DE PARÁMETROS

1 Ecuaciones y propiedades de la recta

CÁLCULO DIFERENCIAL E INTEGRAL I EVALUACIÓN DE RECUPERACIÓN E1300, 29-OCTUBRE (1) 2x 3 > 4.

2.4. Números complejos

Unidad 1. Las fracciones.

Probabilidad y Estadística

Integration of Informatics and Quantitative Concepts in Biology at UPR

Definición de la matriz inversa

Unidad Temática 3: Estadística Analítica. Unidad 9 Regresión Lineal Simple Tema 15

Transcripción:

Distribución Normal estándar y cuadrados mínimos Universidad de Puerto Rico ESTA 3041 Prof. Héctor D. Torres Aponte 1. Distribución Normal estándar En efecto, todas las distribuciones Normales son lo mismo si usamos las unidades de medida σ alrededor de su media µ que es el centro. El proceso para cambiar nuestra distribución a estas variables se le conoce como estandarización. Definición 1.1. Si x es una observación de una distribución con media µ y desviación estándar σ, el valor estandar de x lo es z = x µ σ Este valor estándar también se le conoce como valor-z. El valor-z nos indica cuantas desviaciones estándares está la observación original de si media y en que dirección. Las observaciones mayores que su media toman valores posítivos cuando se estandarizan mientras los valores que son menores a su media toman valores negativos. Ejemplo 1.1. El peso de una bolsa de papitas cuya etiqueta indica que es de 9oz es aproximadamente Normal con µ = 9.12oz y σ = oz. El peso estándar es z = weight 9.12 Por ejemplo una bolsa que pese 9.3oz, su peso estandarizado lo es z = 9.3 9.12 = 1.2 o simplemente 1.2 desviaciones estándar por encima de la media. Similarmente una bolsa que pese 8.7oz tiene un peso estandarizado de z = o 2.8 desviaciones por debajo de la media. 8.7 9.12 = 2.8 Si las variables originales (antes de aplicar el proceso de estandarización) tenían una distribución normal, el proceso de estandarización no brinda una nueva escala (común) y esta distribución sigue siendo una Normal conocida como distribución Normal estándar. 1

Definición 1.2. La distribución Normal estándar es la distribución Normal N (0, 1) que tiene media 0 y desviación estándar 1. Si una variable x tiene una distribución Normal N (µ, σ) entonces la variable estándar lo es y tiene una distribución Normal. z = x µ σ Ejemplo 1.2. Cual es la proporción de todas las bolsas de papitas (cuya etiqueta indica que su peso es de 9oz) que pesan menos de 9.3oz? Utilizando los datos del Ejemplo 1, podemos decir que esta proporción es el área bajo curva N (9.12, ) a la izquierda del punto 9.3. Como el peso estándar correspondiente a 9.3 onzas lo es z = x µ σ = 9.3 9.12 = 1.2 el área es la misma que el área bajo la curva de la distribución Normal estándar a la izquierda del punto z = 1.2. Table entry = 0.8849 z = 1.2 Figura 1: El área bajo la curva Normal estándar a la izquierda del punto z = 1.2. Para encontrar este resultado de forma matemática necesitamos cálculo diferencial. Pero, como no tenemos esa herramienta podemos utilizar unas tablas de valores llamada probabilidades normales estándares. Definición 1.3 (Proceso para utilizar la tabla Normal estándar). en términos de la variable observada x. 1. Escriba el problema 2. Estandarizamos a x para re-escribir el problemas en términos de variables Normales estándares z. Dibujamos un diagrama para mostrar el área bajo la curva que queremos encontrar. 3. En contramos el área bajo la curva requerida utilizando la tabla Normal estándar que se encuentra en la contraportada del libro. Note que el área total de esta curva siempre es 1. 2

Ejemplo 1.3. La tasa de rendimiento anual de ciertas acciones se distribuye aproximadamente Normal. Desde el 1945, la bolsa de valores Standard & Poor s 500 tiene un rendimiento anual promedio de 12 % con una desviación estándar de %. Se toma esta distribución Normal para el rendimiento anual por largos periodos. En que proporción de años el mercado baja? 1. Establecer el problema: Sea x la tasa de rendimiento anual de Standard & Poor s 500. La variable x tiene una distribución Normal N (12, ). Queremos saber la proporción cuando x < 0. 2. Estandarizamos: Restando la media de x y dividiendo por la desviación estándar, obtenemos: x < 0 x 12 < 0 z < 0.73 3. Usamos la tabla: Utilizando la tabla para la distribución Normal estándar podemos ver que el área es 0.2327. El mercado va bajar anualmente un 23.27 % del tiempo. Note que el área a la derecha de 0.73 es 1 0.2327 = 0.7673. Lo que nos indica que la bolsa va a estar por encima un 76.73 % del tiempo (Ver Figura 2). Table entry = 0.2327 Area = 0.7673 z = 0.73 Figura 2: Área bajo la curva en una curva Normal estandar Ejemplo 1.4. Que porciento de años tendría un rendimiento anual entre un 12 % y 50 %? 1. Queremos la proporción de los años entre 12 x 50. 2. Estandarizamos 12 x 50 12 12 x 12 50 12 0 z 2.30 3

3. Usando la tabla, el área entre 0 y 2.30 es el área por dejabo de 2.30 menos el área por debajo de 0 Ver Figura 3. De la tabla de distribución obtenemos: área entre 0 y 2.30 = área debajo de 2.30 área debajo de 0.00 = 0.9893 0.5000 = 0.4893 Alrededor de 40 % de los años tienen un rendimiento anual entre 12 % y 50 %. Area = 0.5 Area = 0.4893 z = 0 z = 2.3 Area = 0.9893 Figura 3: Área bajo la curva Normal estándar para el ejemplo 1.4 4

2. Regresión lineal y cuadrados mínimos Definición 2.1. Una linea de regresión es una linea recta que describe como la variable respuesta y cambia respecto a la variable explicativa x. Usamos la linea de regresión para predecir los valores de y dado un valor x. Average amount of gas consumed per day in hundreds of cubic feet 12 11 10 9 8 7 6 5 4 3 2 1 0 0 5 10 15 20 25 30 35 40 45 50 55 Average number of heating degree-days per day Figura 4: Regresión lineal para el consumo de gas natural de cierta familia. La fígura 4 es un diagrama de disperción para el consumo de gas natural. Vemos que los datos tienen una relación lineal muy fuerte entre la temperatura y la cantidad promedio de gas consumido. La correlación es r = 0.9953, vemos que esta es muy cercano a r = 1. La linea de regresión dibujada en la Figura 4 representa muy bien los datos obtenidos en el diagrama de dispersión. Si queremos prenosticar cuanto gas podemos consumir cuando la temperatora está en 20 grados por día entonces tenemos que localizar cuando x = 20, luego nos movemos hacía la linea y vemos el valor de y el cual es aproximadamente 4.9 miles de piés cúbicos de gas en ese mes. Obviamente como es una predicción, probablemente tenemos un error. Supongamos que en el mes que se hizo la predicción realmente consumieron 5.1 miles de piés cúbicos de gas natural, entonces nuestro error de predicción fue: error = observación y predicción y = 5.1 4.9 = 0.2 Es por eso que queremos saber cual es la distancia mínima entre los puntos observados y la linea. La Figura 5 ilustra esta idea. Definición 2.2. La linea de regresión lineal de cuadrados mínimos de y respecto a x es la linea que representa la suma de los cuadrados de las distancias verticales de los puntos de la data hasta la linea haciendolos lo mas pequeño posible. 5

7.0 Average amount of gas consumed per day in hundreds of cubic feet 6.5 6.0 5.5 5.0 4.5 predicted ŷ distance y yˆ observed y 20 22 24 26 28 30 32 Average number of heating degree-days per day Definición 2.3. Suponga que tenemos data sobre una variable explicativa x y una variable respuesta y para n individuos. De esta data calculamos la media x y ȳ y las desviaciones estándares s x y s y de las dos variables y su correlación r. La regresion lineal (cuadrados mínimos) es la linea definida por: ŷ = b 0 + b 1 x con pendiente e intercepto b 1 = r s y s x b 0 = ȳ b 1 x Ejemplo 2.1. La linea de la Figura 4 es en efecto una regresión linear de cuadrados mínimos. Esta linea tiene una ecuación definida como: ŷ = 1.0892 + 0.1890x La pendiente de la regresión lineal es siempre importante para interpretar la data. La pendiente es la tasa de cambio de la cantidad de cambio en ŷ cuando x incrementa por 1. En este ejemplo b 1 = 0.1890 lo que implica a que grado de temperatura adicional aumenta el consumo por 0.19 miles de piés cúbicos de gas natural. El intercepto de la regresión lineal es el valor ŷ cuando x = 0. Para la predicción es bastante sencillo. Si queremos predecir para 20 grados en el día, sustituimos x = 20: ŷ = 1.0892 + (0.1890) (20) = 1.0892 + 3.78 = 4.869 6

Datos sobre la regresión lineal 1. La identificación de la variable explicativa y la variable respuesta es algo escencial al momento de establecer nuestra regresión. 2. Existe una relación entre la correlación y la pendiente de la regresión. La pendiente es b 1 = r s y s x. Esta ecuación nos indica el cambio a travez de la linea de regresión, hay un cambio de una desviación in x respecto a r desviaciones estándares en y. 3. La linea de regresión siempre pasa por el punto ( x, ȳ). 7