ESTADÍSTICA DESCRIPTIVA

Documentos relacionados
INTRODUCCIÓN. Técnicas estadísticas

Medidas de centralización

Descripción de una variable

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.

Tema 3. Estadísticos univariados: tendencia central, variabilidad, asimetría y curtosis

Histogramas: Es un diagrama de barras pero los datos son siempre cuantitativos agrupados en clases o intervalos.

Tema 1: Estadística Descriptiva Unidimensional Unidad 2: Medidas de Posición, Dispersión y de Forma

1. Concepto y origen de la estadística Conceptos básicos Tablas estadísticas: recuento Representación de graficas...

Tema 8 - Estadística - Matemáticas CCSSI 1º Bachillerato 1

Problemas donde intervienen dos o más variables numéricas

Media es la suma de todas las observaciones dividida por el tamaño de la muestra.

TEMA 10: ESTADÍSTICA

3. VARIABLES ALEATORIAS.

Tema 4: Variables aleatorias

Medidas de Tendencia Central y de Variabilidad

Cálculo y EstadísTICa. Primer Semestre.

Organización y resumen de datos cuantitativos

LECTURA 07: MEDIDAS DE TENDENCIA CENTRAL (PARTE II) LA MEDIANA Y LA MODA TEMA 17: LA MEDIANA Y LA MODA

Relaciones entre variables

Además podemos considerar diferentes tipos de medidas de resumen. Entre ellas tenemos:

EJERCICIOS RESUELTOS TEMA 2

Maestría en Administración. Medidas Descriptivas. Formulario e Interpretación. Dr. Francisco Javier Cruz Ariza

Tema 1.3_A La media y la desviación estándar

MATEMÁTICAS para estudiantes de primer curso de facultades y escuelas técnicas

ESTADÍSTICA (GRUPO 12)

TRABAJO 1: Variables Estadísticas Unidimensionales (Tema 1).

LECTURA 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) LA MEDIA ARITMÉTICA TEMA 15: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION

CAPITULO 3.- ANÁLISIS CONJUNTO DE DOS VARIABLES. 3.1 Presentación de los datos. Tablas de doble entrada.

TÉCNICAS AUXILIARES DE LABORATORIO

ESTADÍSTICA DESCRIPTIVA Métodos Estadísticos Aplicados a las Auditorías Sociolaborales

Estadística Empresarial I

4 E.M. Curso: NOMBRE: 4º. Colegio SSCC Concepción - Depto. de Matemáticas. Guía N. Unidad de Aprendizaje: Estadísticas

4ºB ESO Capítulo 12: Estadística LibrosMareaVerde.tk

PREGUNTAS TIPO TEST Y EJERCICIOS PRÁCTICOS PROPUESTOS EN EXÁMENES DE LOS CAPÍTULOS 2, 3 Y 4 (DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES )

Correlación y regresión lineal simple

ANÁLISIS EXPLORATORIO DE DATOS

Bloque 5. Probabilidad y Estadística Tema 2. Estadística descriptiva Ejercicios resueltos

Estadística Descriptiva Análisis de Datos

REGRESION LINEAL SIMPLE

Análisis de error y tratamiento de datos obtenidos en el laboratorio

REGRESION Y CORRELACION

TEMA. Contenidos UNIDAD I: ESTADÍSTICA DESCRIPTIVA

IES Menéndez Tolosa (La Línea) Física y Química - 1º Bach - Gráficas

CARTAS DE CONTROL. Han sido difundidas exitosamente en varios países dentro de una amplia variedad de situaciones para el control del proceso.

EXPERIMENTACIÓN COMERCIAL(I)

Regresión Lineal Simple y Correlación

Matemáticas aplicadas a las ciencias sociales Estadística y Probabilidad 1º de bachillerato

CAPÍTULO 5 REGRESIÓN CON VARIABLES CUALITATIVAS

Análisis de Regresión y Correlación

PROBABILIDAD Y ESTADÍSTICA

Apéndice A: Metodología para la evaluación del modelo de pronóstico meteorológico

TEMA III EL ANÁLISIS DE REGRESIÓN LINEAL MÚLTIPLE

UNIVERSIDAD DE SONORA

Capítulo III Medidas de posición y de dispersión

Efectos fijos o aleatorios: test de especificación

T. 9 El modelo de regresión lineal

Glosario básico. de términos estadísticos

Ejercicio nº 1. a) Elabora una tabla de frecuencias. b) Representa gráficamente la distribución.

12-16 de Noviembre de Francisco Javier Burgos Fernández

VARIABLE ALEATORIA DISCRETA. DISTRIBUCIÓN BINOMIAL.

Facultad de Ingeniería División de Ciencias Básicas Coordinación de Ciencias Aplicadas Departamento de Probabilidad y Estadística

INSTITUTO DE FÍSICA FACULTAD DE INGENIERÍA

TEORÍA DE MEDIDAS INTRODUCCIÓN

ENCUESTA ESTRUCTURAL DE TRANSPORTE POR CARRETERA AÑO CONTABLE 2011 INSTITUTO NACIONAL DE ESTADÍSTICAS

ESTADÍSTICA poblaciones

Pruebas Estadísticas de Números Pseudoaleatorios

Procesamiento Digital de Imágenes. Pablo Roncagliolo B. Nº 17

Dicha tabla adopta la forma del diagrama de árbol del dibujo. En éste, a cada uno de los sucesos A y A c se les ha asociado los sucesos B y B c.

Econometría. Ayudantía # 01, Conceptos Generales, Modelo de Regresión. Profesor: Carlos R. Pitta 1

Capítulo 12 CONTRASTES NO PARAMÉTRICOS

Tratamiento de datos experimentales. Teoría de errores

7ª SESIÓN: Medidas de concentración

1. Lección 7 - Rentas - Valoración (Continuación)

Investigación y Técnicas de Mercado. Previsión de Ventas TÉCNICAS CUANTITATIVAS ELEMENTALES DE PREVISIÓN UNIVARIANTE. (IV): Ajustes de Tendencia

CAPITULO 4 MEDIDAS DE TENDENCIA CENTRAL

Regresión y Correlación

-.GEOMETRÍA.- a) 37 cm y 45 cm. b) 16 cm y 30 cm. En estos dos, se dan la hipotenusa y un cateto, y se pide el otro cateto:

Disoluciones. Disolución ideal. Disolución ideal. Disolución ideal. Disolución ideal

Materiales Industriales, Ingeniería Técnica Industrial Mecánica Profesor: Dr. María Jesús Ariza, Departamento de Física Aplicada, CITE II-A, 2.

ESTADISTICA APLICADA A LA EDUCACIÓN

Análisis de Weibull. StatFolio de Muestra: Weibull analysis.sgp

4. REPRESENTACIONES GRÁFICAS PARA DATOS CATEGÓRICOS.

De factores fijos. Mixto. Con interacción Sin interacción. No equilibrado. Jerarquizado

UNA FORMA GRÁFICA DE ENSEÑANZA: APLICACIÓN AL DUOPOLIO DE. Dpto. de Métodos Cuantitativos e Informáticos. Universidad Politécnica de Cartagena.

Cuaderno de actividades 4º ESO

Modelos triangular y parabólico

CESMA BUSINESS SCHOOL

Estimación del consumo del consumo diario de gas a partir de lecturas periódicas de medidores

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO ESCUELA NACIONAL COLEGIO DE CIENCIAS Y HUMANIDADES PLANTEL SUR ACADEMIA DE MATEMÁTICAS

Vectores VECTORES 1.- Magnitudes Escalares y Magnitudes Vectoriales. Las Magnitudes Escalares: Las Magnitudes Vectoriales:

PROPUESTAS PARA LA DETERMINACIÓN DE LOS PARÁMETROS DEL GRÁFICO DE CONTROL MEWMA

a) Qué población (la de hombres o la de mujeres) presenta un salario medio mayor? b) Qué porcentaje de varones gana más de 900?

TEMA 6 AMPLIFICADORES OPERACIONALES

TEMA 4. TRABAJO Y ENERGIA.

Modelos unifactoriales de efectos aleatorizados

3.3 Caracterización de grupos: Estadísticos de forma de la distribución

GUÍA 5. Roberto Fabián Retrepo A., M. Sc. en Física Profesor Asociado Escuela de Física Universidad Nacional de Colombia

E-Book ISBN Fecha de catalogación: 04/04/2014. INTRODUCCION

PRUEBAS DE ACCESO A LAS UNIVERSIDADES DE ANDALUCÍA PARA MAYORES DE 25 AÑOS MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES

Capítulo 3. SISTEMAS DE PARTÍCULAS

Transcripción:

Estadístca www.aulatecnologa.com 1 ETADÍTICA DECRIPTIVA Lo prmero que buscamos con la Estadístca es el tratamento matemátco a partr de una nformacón epermental. Cuando queremos observar la evolucón de una enfermedad ante una determnada tratamento, lo prmero, es tratar de reducr la nformacón hasta hacerla manejable. Ante la mposbldad de trabajar con toda la poblacón, etraemos muestras de la msma, que sean representatvas. Cuando hablamos de poblacón nos refermos a todos los elementos que pueden ser objetos del estudo realzado, mentras que s hablamos de muestra nos estamos refrendo a una parte de esa poblacón, a un subconjunto de la msma. Otra característca de la Estadístca es la medcón por la observacón de las característcas de personas u objetos, así como la adjudcacón de números a esas característcas que nos faclten posterores comparacones. Las característcas que varían de ndvduo a ndvduo se conocen con el nombre de varables y se clasfcan en tres grandes grupos, según el nvel de medcón de las msmas: Cualtatvas.- Indcan cualdades. omnal.- Es el nvel más smple, que permte clasfcar los ndvduos u objetos en clases o categorías meramente descrptvas. Ordnal.- Es el nvel nmedatamente superor, además de clasfcar ordena la característca que se quere medr. Intervalo.- Además de clasfcar y ordenar, las varables, las agrupa en categorías. Tambén podemos realza una clasfcacón de las varables en: Cuanttatvas.- Indcan medcón y pueden ser: Contnuas. Toman cualquer valor de R. Dscretas. ólo toman valores enteros. Al tomar una muestra aleatora en una poblacón, lo prmero es el conteo, ndcar cuántos ndvduos presentan las msmas característcas. De modo que obtendremos: Frecuenca absoluta.- úmero de veces que aparece una determnada característca o varable en esa muestra. e representa por n. Frecuenca relatva.- Cada frecuenca absoluta dvdda entre el tamaño muestral. os faclta la comparacón entre dstntas poblacones, al estar trabajando en tantos por uno. Frecuenca absoluta acumulada.- uma de las dferentes frecuencas absolutas. e representa por e verfca Σ = Frecuenca relatva acumulada.- uma de las dferentes frecuencas relatvas. F = Σf =1. aulatecnologa@yahoo.es

Estadístca REPREETACIOE GRÁFICA www.aulatecnologa.com on otro nstrumento para reducr la nformacón orgnal obtenda en el estudo de dstntas muestras, de modo que pueda obtenerse una dea rápda de los resultados obtendos en el estudo. Este método permte establecer dferencas entre las dstntas característcas a smple vsta aunque conlleva una pérdda de nformacón. egún el tpo de muestra, hay dstntos tpos de representacones gráfcas: Para una varable no agrupada: Pctograma.- e realza un dbujo que representa a la varable, cuyo área concde con la frecuenca absoluta Dagrama de barras.- Representamos en el eje X los valores de la varable y en el eje Y las frecuencas absolutas o relatvas con que aparecen. 100 50 0 1er 3er Este Oeste orte Polígono de frecuencas.- e construye unendo los etremos de las dstntas barras del dagrama anteror. 100 50 0 Este Oeste orte 1er trm. 3er trm. Dagrama de sectores.- Ahora la varable la representamos en un círculo sendo la frecuenca de cada varable el ángulo que forma, y que vene dado por la fórmula α= 360.f 1er 1er trm trm.. do do trm trm.. 3er trm. Hasta ahora hemos trabajado con varables estadístcas undmensonales no agrupadas en ntervalos, cuando por la cantdad de valores que toma la varable decdmos agruparla en ntervalos a pesar de la pérdda de nformacón que este conlleva, las representacones gráfcas tambén sufren varacones. Así: Varables agrupadas.- Los valores que puede tomar la varable están agrupados en ntervalos. aulatecnologa@yahoo.es

Estadístca www.aulatecnologa.com Hstograma de frecuencas.- En el eje X representamos los ntervalos de la varable, y en el eje Y 3 la frecuenca absoluta o relatva. n Polígono de frecuencas.- Es gual que en varables no agrupadas, sólo que al trabajar con ntervalos, para unr las dferentes barras, debemos calcular la marca de clase, punto medo de cada ntervalo. Al unr las dferentes marcas de clase se perde área de frecuenca, y para recuperarlo unmos la marca de clase del prmer ntervalo con la marca de clase de un ntervalo a la zquerda de gual ampltud que el prmero. Con el últmo ntervalo haremos lo msmo. Para dos varables sn agrupar: Dagrama de barras.- Trabajamos en el espaco y por tanto con los tres ejes X, Y, Z. En los ejes X e Y colocamos los valores de las varables en estudo y en el eje Z las frecuencas de cada par (,y). 100 50 0 1e d 3e 4t Este Oeste orte En estos casos tambén debemos consderar el que las varables estén o no agrupadas lo que supone un cambo en el tpo de representacón más compleja al trabajar en el espaco trdmensonal. MEDIDA DE ETUDIO grandes grupos: Para facltar el estudo de las dstntas muestras hay una sere de parámetros que se agrupan en dos Meddas de tendenca central.- on estadístcos, meddas que de forma más precsa nos dan nformacón sobre el valor central de la varable haca el que tende la dstrbucón. Entre las más mportantes tenemos: aulatecnologa@yahoo.es

Estadístca www.aulatecnologa.com A) Meda artmétca.- os nforma sobre la concentracón del número de casos. n = 4 B) Medana.- Es el valor de la varable que dvde a la dstrbucón en dos partes guales. Para su cálculo hay que ordenar los valores de la varable de menor a mayor. todas las varables tenen la msma frecuenca y el número de datos es mpar será el valor central. el número de varables es par tomaremos los dos valores centrales y los dvdmos entre dos. Tambén debemos dstngur entre varables no agrupadas y agrupadas, de modo que: sn agrupar.- Calculamos / y el valor obtendo lo buscamos en la frecuenca acumulada absoluta, sendo la medana el valor de la varable con esa o mayor que esa frecuenca acumulada. agrupadas..- para Volvemos a calcular /, encontrar el ntervalo que contene a la medana, y aplcamos la fórmula: Me = l + a n C) Moda.- Es el valor de la varable que más se repte. aparecen varos datos con la msma frecuenca máma, hablaremos de dstrbucón multmodal. Tambén debemos dferencar entre muestras con datos agrupados y sn agrupar: sn agrupar.- buscamos la varable con mayor frecuenca. agrupadas.- buscamos el ntervalo con mayor frecuenca y aplcamos la fórmula 1 Mo = d1 l + a d + d 1 d 1 = n - n -1 d = n - n +1 ota: cuando los ntervalos tenen dstnta ampltud, debemos hacer un cambo de varable y trabajar gual pero con la nueva varable: h = n / a Meddas de poscón: Cuartles, decles y percentles.-lo cuartles dvden a la dstrbucón en cuatro partes guales, los decles en dez y los percentles en cen. Para su cálculo como sempre hay que dferencar entre varables agrupadas y sn agrupar. Cuartles para buscar el valor de la varable o el ntervalo que contene ese cuartl calculamos a./4 sendo a=1,,3,4, los dstntos cuartles. La fórmula para los ntervalos es práctcamente gual que la de la medana eceptuando el térmno que nos ndca el cuartl: c Q 4 c = l + a n 1 aulatecnologa@yahoo.es

Estadístca www.aulatecnologa.com Para los decles y percentles lo msmo, sólo que ahora tendremos los térmnos d./10 y 5 p./100, respectvamente. D d d = l 10 + a n 1 P p d = l 100 + a n 1 La meda es la medda más representatva, a no ser que los datos estén más o menos agrupados y haya alguno/os muy alejados del resto, en cuyo caso será la medana la medda más representatva, junto con los cuartles decles y percentles. Lo msmo ocurre s tenemos ntervalos y alguno de ellos no está perfectamente acotado. En estos casos la meda y todo lo relaconado con la meda no es representatvo. Cuando en un problema nos mandan descrbr la varable en estudo debemos recordar que hay una sere de valores que calculan lo msmo y por tanto van a tomar el msmo valor, así s calculamos la medana, tambén habremos calculado el cuartl dos, el decl cnco y el percentl cncuenta. Me = Q = D 5 = P 50 Meddas de dspersón.- os muestran la dspersón delos datos obtendos en el estudo estadístco, es decr s están todos más o menos agrupados o prómos a un valor. Entre los más utlzados tenemos: Rango o recorrdo.- Es la dferenca de los valores etremos que toma la varable. Recorrdo ntercuartílco.- Es la dferenca entre el cuartl tres y el cuartl uno. Recorrdo semntercuartílco.- Es el recorrdo ntercuartílco dvddo entre dos. Desvacón típca.- es la más mportante de las meddas de dspersón, y nos ndca la mayor o menor promdad o unformdad de los datos respecto a la meda. Es la raíz cuadrada de la varanza. La varanza tene como fórmula: ( ) n = = Coefcente de varacón.- e utlza para comparar los resultados obtendos en dos muestras dstntas y conocer cuál es mejor tenendo en cuenta la muestra a partr de la cual se obtene. e calcula por la fórmula: C.V = Meddas de forma.- os ndcan como son las curvas que representan la muestra en estudo (smétrcas o asmétrcas). Entre estos parámetros destacan: A) Asmetría.- os ndcan el carácter más o menos smétrco de las dstrbucones en estudo. Entre las más utlzadas tenemos: Medda de Pearson.- e basa en las meddas de tendenca central y se calcula por la fórmula: Mo < 0 = 0 > 0 asmétrca a la zquerda smétrca asmétrca a la derecha aulatecnologa@yahoo.es

Estadístca www.aulatecnologa.com Coefcente de asmetría de Fsher.- Calcula el promedo en los ndvduos de la 6 dferenca en cada valor de la varable. Vene dado por la fórmula: ( ) 3 n <<<< 0 asmétrca a la zquerda = 0 smétrca >>>> 0 asmétrca a la derecha B) metría.- Kurtoss Intenta medr la unformdad de la densdad de ndvduos, o ben el apuntamento de la dstrbucón, tomando como referenca la dstrbucón normal. e calcula: ( ) 4 4 n < 0 platcúrtca 3 = 0 mesocúrtca > 0 leptocúrtca Todos estos parámetros se utlzan para varables cuanttatvas. C) Momentos.- Los momentos se calculan para conocer la poscón de una determnada varable ya sea respecto al orgen o a la meda. o suelen utlzarse ya que su cálculo es muy laboroso. Los veremos más adelante al trabajar con varables estadístcas bdmensonales. ETADÍTICA BIDIMEIOAL Cuando estudamos dos varables conjuntamente, hablamos de estadístca descrptva de datos bdmensonales. El motvo del estudo de datos bdmensonales, que provenen del estudo smultáneo de dos característcas, de los ndvduos de una muestra, es que la consderacón de estos datos permte por un lado obtener al menos tanta nformacón como el estudo separado de ambas varables, y además eamnar relacones de dependenca estadístca o funconal entre ambas. Varable estadístca bdmensonal.- Es una magntud, cuyos valores no necesaramente numércos, son los pares (, y j ) donde, es un únco valor de la característca X, e y j, es un únco valor de la característca Y. Dato bdmensonal.- Cada par (a 1, b 1 ), correspondente a la observacón de una varable estadístca bdmensonal sobre un msmo ndvduo, es decr, a sería el valor de la varable estadístca undmensonal X en ese ndvduo, y b la varable estadístca undmensonal Y en ese msmo ndvduo. Frecuenca de un valor bdmensonal.- La forma más senclla de descrbr el conjunto de datos bdmensonales proporconados por una muestra de ndvduos es a través del estudo de las frecuencas de los valores de la medda undmensonal. consderamos una muestra de tamaño n etraída de la poblacón y suponemos que se observa una v.e.b (, y), sobre los ndvduos de esta muestra, dstnguremos entre: Frecuenca absoluta del valor (a, b).- número de ndvduos de la muestra, para los que X toma el valor a e Y, toma el valor b, smultáneamente. La notacón utlzada es n j. aulatecnologa@yahoo.es

Estadístca www.aulatecnologa.com 7 Frecuenca relatva del valor (a, b).- es la frecuenca absoluta dvdda entre el número total de ndvduos. La notacón utlzada es f j =n j /. Característcas de la frecuenca absoluta y relatva: n j =, y, f j = 1 La frecuenca absoluta está entre 1 y, mentras que la relatva está entre o y uno. A la sucesón de todos los posbles valores de una varable bdmensonal, con sus frecuencas correspondentes se le llama dstrbucón bdmensonal, bvarante, o conjunta de frecuencas de la varable (X, Y). Las dos tablas de frecuencas, epresones tabulares de la dstrbucón de frecuencas, más utlzadas son: Tabla de doble entrada.- se usa cuando aparecen muchos datos bdmensonales repetdos. Y 1 Y Y 3 y n X 1 n 11 n 1 n 13 n 1n X n 1 n n 13 n 1n X 3 n 31 n 3 n 34 n 3n n n n1 n n n n3 n nn Tabla de datos apareados.- se utlza cuando aparecen datos bdmensonales no repetdos o muy poco repetdos. X 1 3 n y y 1 y y 3 y n Dstrbucones margnales.- Corresponden a las dstrbucones de cada una de las varables estadístcas undmensonales estudadas separadamente. Llamaremos frecuenca absoluta margnal de de X, al número de ndvduos de la muestra para los que X toma el valor. La notacón utlzada es n., de modo que: n. = n 1 + n + n 3 +... + n k = n j = Llamamos frecuenca margnal del valor y j de Y, al número de ndvduos de la muestra, para los que Y toma el valor y j. La notacón empleada es n.j, y como antes: n.j = n 1j + n j + n 3j +... + n nj = n j = Las dstrbucones margnales relatvas, son las absolutas dvddas por el número total de ndvduos de la muestra. Dstrbucones condconadas.- Llamaremos frecuencas (relatvas), condconadas del valor a la proporcón de ndvduos de la muestra para los que X= de entre los ndvduos para los que Y=y j. La notacón utlzada es: f( / y j ) = n j / n.j = f j / f.j aulatecnologa@yahoo.es

Estadístca www.aulatecnologa.com 8 Independenca estadístca entre dos v.e.b..- ea (,y) una v.e.b, suponendo conocda la dstrbucón bvarante de frecuencas de todos los pares (,y)., así como las dstrbucones condconadas. Dremos que la varable es ndependente de la varable y, s para todo valor de X se verfca que la frecuenca de ese valor no depende del valor que haya tomado Y, es decr s para todo valor de :, se verfca: n j n nj = Momentos.- on parámetros que descrben la dstrbucón de dos varables bdmensonales, aunque su cálculo es bastante pesado sendo su utlzacón escasa. Dentro de los momentos más utlzados, tenemos dos grandes grupos: respecto al orgen, trabajamos con ambas varables estudando su poscón conjunta respecto al orgen. e calculan por la fórmula: a wz w z yj = n j Los momentos más característcos son el momento de orden 10, que se corresponde con la meda de X, el de orden 01 que concde con la meda de Y. respecto a la meda, nos ndca las poscones de cada par de valores de la varable respecto a la meda. La fórmula que nos permte su cálculo es: m wz = w ( ) ( y y) Los momentos respecto a la meda más característcos son, el momento de orden 0 que concde con la varanza de X, el momento de orden 0 que concde con la varanza de Y, y el momento de orden 11 que concde con el valor de la covaranza:: j z n j y =. y. n j j y RECTA DE REGREIÓ La regresón entre dos varables estadístcas X e Y, trata de buscar la relacón de certo tpo prefjado, lneal, eponencal o potencal, que mejor se ajuste o ben que mejor eprese Y respecto a X. La correlacón srve de complemento de la regresón ndcándonos hasta que punto la mejor relacón encontrada en la regresón descrbe ben la verdadera relacón entre las dos varables. En la práctca, el tpo de relacón funconal que se estuda, vene dado como modelo de epermentos anterores smlares al consderado. Vamos a ver los dstntos tpos de regresón: Lneal: sea (X;Y), una varable estadístca bdmensonal, con dstrbucón de frecuencas conjunta f j, en una muestra dada. Vamos a buscar la relacón lneal y = a + b que más se ajusta a la nube de puntos que resulta de la representacón de los datos: Para deducr las ecuacones de regresón, se utlzó el crtero de los mínmos cuadrados, basado en aceptar en el error cometdo para cada par (, y j ), al consderar como válda la relacón lneal y = a + b. Este error puede medrse mdendo el valor absoluto de la dferenca: y = y j (a + b) esta dferenca es el resduo que se comete con cada valor de la varable y camba de unos datos a otros, dependendo su mayor o menor promdad a la recta. En prncpo sería mposble encontrar un valor a y b reales que hagan mínmos los errores para todos los datos bdmensonales a un tempo, sendo lo más lógco será aulatecnologa@yahoo.es

Estadístca www.aulatecnologa.com usar una medda representatva de ese error en toda la muestra. El crtero de mínmos cuadrados consste en mnmzar la meda de esos errores al cuadrado, lo que gráfcamente equvale a buscar los valores a y b que hagan mínma la meda de las dstancas al cuadrado de los puntos del dagrama de dspersón respecto a la recta. Cuando estas meddas se mden vertcalmente, por este método deducmos la ecuacón de la recta de X sobre Y, (X/Y): y y y = ( ) Cuando estas dstancas se mden horzontalmente se deduce la recta de X sobre Y, (X/Y). y = ( y y ) y La pendente de las rectas de regresón y se conocen con el nombre de coefcentes de regresón. 9 100 80 60 40 0 Es te Oe s te o r te 0 0 4 6 Para saber s las rectas calculadas son buenas o malas calculamos el coefcente de correlacón de Pearson : y r = u valor está comprenddo entre -1 y 1, de modo que cuanto más cerca estemos de los etremos mejor será la relacón estudada, mentras que cuanto más cerca estemos de cero peor será la relacón obtenda, y por tanto los resultados obtendos a partr de ella no tendrán valdez. Tambén se puede utlzar el coefcente de determnacón, R, comprenddo entre 0 y 1. Es gual al producto de las pendentes de ambas rectas de regresón. La varacón no eplcada por la varacón lneal será: = (y y ) + r. y Esta fórmula equvale a decr: la varanza total de Y, es gual a la varanza debda a que la varable Y no es lneal, más la varanza eplcada por la relacón lneal. Tpo no lneal.- En la regresón no lneal, no podremos calcular el coefcente de correlacón antes que la funcón como ocurría en la regresón lneal. Vamos a ver dos tpos fundamentales de regresón no lneal, que por dferentes cambos podemos transformar en lneales: A) Eponencales.- on funcones de la forma: y = a. e b modo que: y.para transformarla en una relacón lneal tomamos logartmos neperanos en ambos térmnos, de Lny = Lna + Lne b Lny = Lna + b y = a + b De todos los pares (X,Y) que teníamos, ahora pasamos a tener pares (X,Y ), transformando la varable Y en LnY, de modo que ya podemos calcular una recta de regresón, y tras deshacer los cambos, obtendremos la relacón eponencal que buscamos. B) Potencales o alométrcas.- on funcones de la forma: y = a. b. e corresponde con parábolas, snusodales,...para consegur una recta, volvemos a tomar logartmos neperanos en ambos térmnos, de modo que: aulatecnologa@yahoo.es

Estadístca www.aulatecnologa.com Lny = Lna + Ln b Lny = Lna + b.ln y = a + b. Ahora de los valores (X,Y), pasamos a los valores (X,Y ), obtenendo la relacón lneal ndcada, que al deshacer los cambos utlzados nos da la relacón funconal buscada.. La medda del grado de bondad de una relacón óptma respecto a otra relacón óptma de otro tpo dferente, debe realzarse medante un coefcente que cuantfque lo msmo en ambos casos. para comparar dos relacones dstntas y de dferente tpo, es más adecuado utlzar el coefcente de bondad de ajuste, en lugar del coefcente de correlacón de Pearson. Este coefcente de bondad de ajuste Z, vene dado por: 1 Z = ( y j G( ) ). f j / y En partcular cuando G(), es una relacón lneal, z = r. En la práctca es frecuente que z, esté prómo al valor que tomaría el coefcente de relacón de los datos transformados en una relacón no lneal. [ 1 z y G( ) ] = y Aquí G(X), es la mejor relacón de tpo no lneal. El valor de Z, al gual que el coefcente de correlacón de Pearson, está comprenddo entre [-1, 1]. Otro coefcente de correlacón utlzado, es el correlacón por rangos de pearman, que se usa cuando una de las varables no es ordnal, al menos una de ellas es cualtatva. El rango de una puntuacón, es la poscón que ocupa en la muestra ordenada de menor a mayor. Cuando las puntuacones se repten se les asgna el rango medo. 10 aulatecnologa@yahoo.es