Fundamentos de Estadística descriptiva

Save this PDF as:
 WORD  PNG  TXT  JPG

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Fundamentos de Estadística descriptiva"

Transcripción

1 Fundamentos de Estadística descriptiva COCEPTOS GEERALES Llamaremos población estadística al conjunto de referencia sobre el cual van a recaer las observaciones. Se llama individuo a cada uno de los elementos que componen la población y muestra a un subconjunto de individuos de la población. Se suelen tomar muestras cuando es difícil o costosa la observación de todos los elementos de la población. Decimos que realizamos un censo cuando se observa a la población completa. Toda población viene definida por un conjunto delimitado y bien definido de caracteres, es decir una cualidad o propiedad inherente en el individuo. A los posibles aspectos de un carácter se les denominan modalidades, que deben ser exhaustivas e incompatibles. Los caracteres pueden ser clasificados en caracteres cualitativos, en las se recogen modalidades que no son números (color del pelo, por ejemplo) y caracteres cuantitativos, en las que todas las modalidades son números (por ejemplo, el peso o la estatura). Una variable estadística es un conjunto de números que representan a un carácter (o más) cuantitativo. Éstas pueden ser discretas o continuas, según que las modalidades sean números naturales o intervalos de IR, respectivamente. Se considera una población formada por individuos, descrita por un carácter que posee k modalidades x 1, x 2,..., x k, pero donde cada uno de ellos puede aparecer repetido más de una vez. Se denomina frecuencia absoluta, n i, asociada a la modalidad x i al número de elementos de la población que poseen dicha modalidad. De esta forma, la suma de todas las frecuencias absolutas debe ser el número de elementos de la población, es decir k n i =. La frecuencia relativa, f i, asociada a una modalidad x i es la proporción de individuos de la población que presenta la modalidad x i, por tanto es el cociente entre la frecuencia absoluta de x i y el número de elementos de la población: f i = n i. Se satisface entonces que k f i = 1. La frecuencia acumulada absoluta, i (respect. relativa, F i ) asociada a la modalidad x i es la suma de las frecuencias absolutas (respect. relativas) de las modalidades x 1, x 2,..., x i 1, x i. Con estas definiciones, se tiene que la frecuencia acumulada absoluta de la última modalidad x k coincide con el número de elementos de la población y la frecuencia acumulada relativa coincide con 1. Con estos datos se construye una llamada tabla estadística de frecuencias en la que se recogen las modalidades de un carácter y sus respectivas frecuencias: modalidad frec. abs. frec. rel. frec. abs. acum. frec. acum. rel. x i n i f i i F i x 1 n 1 f 1 = n 1 1 = n 1 F 1 = f 1 x 2 n 2 f 2 = n 2 2 = n 1 + n 2 F 2 = f 1 + f x k n k f k = n k k = F k = 1 En relación a las observaciones realizadas en una muestra o población se nos pueden presentar los siguientes casos: 1. Que se hayan hecho pocas observaciones y, por tanto, la variable estadística tome pocos valores. Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 1

2 2. Que se hayan hecho muchas observaciones y, sin embargo, la variable estadística tome muy pocos valores distintos, incidiendo de una manera considerable el estudio de las repeticiones de cada valor. 3. Que se hayan hechos muchas observaciones y la variable estadística tome muchos valores distintos. Los dos primeros casos caerán dentro del estudio de una variable estadística discreta, mientras que en el caso tercero, trataremos de agrupar los valores de la variable estadística en intervalos adecuadamente elegidos para no perder mucha información, lo cual va a suponer una simplificación en nuestro trabajo. A la diferencia entre el extremo superior y el extremo inferior de cada intervalo la llamaremos amplitud del intervalo. Por comodidad, los intervalos de amplitud constante son los más aconsejables, salvo que las condiciones específicas del problema no lo aconsejen. Los intervalos de clase suelen ser semiabiertos y se tomarán tantos intervalos solapados como sean necesarios para recubrir todo el recorrido de la variable. Definimos la marca de clase como el punto medio de cada intervalo. Es, en definitiva, el valor que nos representa la información que contiene un intervalo. Tabla de frecuencias de una variable agrupada en intervalos intervalos marcas de clase n i f i i F i (a 0, a 1 ] x 1 n 1 f 1 1 F 1 (a 1, a 2 ] x 2 n 2 f 2 2 F (a k 1, a k ] x k n k f k k F k REPRESETACIOES GRÁFICAS Para representar por medio de un gráfico los datos observados en una población, deben tenerse en cuenta los siguientes puntos: Las gráficas deben explicarse por sí mismas.los títulos de pie deben dar información sobre los sujetos a estudio y la materia objeto de experimentación, qué observaciones se han efectuado y las restricciones que se han impuesto. Se deberán indicar las unidades de escala de los ejes. Deberán dar una visión general del conjunto de datos. o deberán abarcar mucha información en un mismo gráfico. Entre los tipos de gráficas que representan variables cualitativas están los diagramas de sectores y los diagramas de rectángulos. Para las variables cuantitativas, debido a a que las modalidades son números, las representaciones se realizan sobre los ejes de coordenadas, aunque puede resultar necesario que se tomen distintas escalas. Los más representativos son los diagramas de barras, para variables discretas, que consisten en trazar para cada valor del carácter, barras verticales de longitud la frecuencia absoluta o relativa asociada a cada valor. Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 2

3 Para variables continuas, el más utilizado es el histograma que es similar al diagrama de barras,pero como las modalidades son intervalos, se representan rectángulos cuyas áreas son proporcionales (o igual) a la frecuencia absoluta o relativa de cada clase. Cuando la amplitud de clase es la misma para cada intervalo, es frecuente tomar rectángulos cuya altura coincide con la frecuencia absoluta o relativa. Uniendo los puntos medios del lado superior de cada rectángulo, se obtienen los llamados polígonos de frecuencia. MEDIDAS DE POSICIÓ A veces es conveniente reducir la información obtenida a un solo valor o a un número pequeño de valores para facilitar la comparación entre las distintas muestras o poblaciones. Estos valores, que de alguna forma centralizan la información reciben el nombre de medidas de posición, de tendencia central o de posición central. Media: Sea X una variable estadística que toma valores distintos {x 1, x 2,..., x k } con frecuencias absolutas {n 1, n 2,..., n k } siendo n n i =. Se define la media como la suma ponderada de los valores de la variable por sus frecuencias relativas: X = x i f i = x i n i Para calcular la media de una variable continua, se realiza la suma ponderada de las marcas de clase por la frecuencia relativa asociada a cada clase. Mediana: es el valor de la variable que deja a su derecha y a su izquierda el cincuenta por ciento de la población. Se denota por M e (X). Si, debido al tamaño de la población,, se tienen las observaciones sin agrupar en una tabla de frecuencias, la mediana será: para impar, la modalidad que se encuentra en la mitad del conjunto de datos ordenados si es par, el punto medio de los dos valores centrales. Cuando los datos están organizados en una tabla de frecuencias, se divide el número de observaciones entre 2 y si /2 no se encuentra en la tabla de frecuencias absolutas acumuladas, estará comprendido entre dos números de la citada tabla, con lo cual la mediana será aquel valor de la variable que corresponde al mayor; si el valor /2 está en la columnas de las i es que coincide con la frecuencia absoluta acumulada para algún valor x j, en este caso, se toma el punto medio del intervalo, es decir M e = x j + x j+1. 2 Para variables estadísticas continuas, se divide el número de observaciones entre 2 y si /2 no se encuentra en la tabla de frecuencias absolutas acumuladas estará comprendido entre dos valores j y j+1 de la citada tabla, que corresponderán a las frecuencias absolutas acumuladas de dos intervalos [a j 1, a j ) y [a j, a j+1 ) respectivamente, con lo cual la mediana se va a encontrar en el intervalo [a j, a j+1 ), al que se denomina intervalo mediano. Es frecuente tomar como mediana la marca de clase del intervalo mediano. Si el valor /2 está en la columnas de las i es que coincide con la frecuencia absoluta acumulada de un cierto intervalo de clase [a j, a j+1 ) y, por tanto, la mediana será el extremo superior del mismo. Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 3

4 Moda: es el valor de la variable que tiene máxima frecuencia. La moda no tiene por qué ser única. Cuando la variable es continua, hablaremos de intervalo modal. Se denota por M d o Mod(X). Cuartiles: se definen los cuartiles como tres valores de la variable que dividen las observaciones en cuatro partes iguales. El primer cuartil es el valor que deja la cuarta parte de las observaciones menores o iguales a él y las tres cuartas partes superiores a él. Para su cálculo se hace el mismo razonamiento que en el cálculo de la mediana, pero considerando /4. El segundo cuartil es la mediana y el tercer cuartil es el valor que deja las tres cuartas partes de las observaciones menores o iguales a él y la cuarta parte superior a él. Para su cálculo se hace el mismo razonamiento que en el cálculo de la mediana, pero considerando 3/4. Deciles: se define el decil K-ésimo como el valor de la variable que deja inferiores o iguales a él las K/10 partes de las observaciones. Los denotamos por D k. Centiles o percentiles: se define el percentil K-ésimo como el valor de la variable que deja inferiores o iguales a él las K/100 partes de las observaciones. Los denotamos por P k. MEDIDAS DE DISPERSIÓ La media aritmética se emplea como valor representativo de la población, sin embargo, según la dispersión de los datos, la representa mejor o peor. Si las modalidades de la variable están todas próximas a la media (y, por tanto, próximas entre sí) ésta nos dará una idea bastante aproximada de los valores que toma la variable, mientras que si los datos están muy dispersos (o con que haya uno solo que se aleje de todos los demás), la media no será un buen representante del colectivo de modalidades. El problema que se plantea es encontrar una medida de la dispersión de los datos respecto de la media. Sea X una variable estadística que toma valores distintos {x 1, x 2,..., x k } con frecuencias absolutas {n 1, n 2,..., n k }. Se puede pensar en definir la dispersión de cada modalidad respecto de la media y sumar: (x i X)n i = (x 1 X)n 1 + (x 2 X)n (x k X)n k = nx nx = 0 Ésto ocurre porque las desviaciones por exceso y por defecto respecto de la media se van compensando unas con otras al sumar. Para evitar ésto, se pueden elevar al cuadrado las desviaciones (de esta forma se consigue que todas sean positivas) y se promedia con el tamaño de la población. Varianza: k σx 2 (x i X) 2 n k i x 2 i n i = = X 2 Desviación típica: es la raíz cuadrada positiva de la varianza de la variable. Se designa por σ X. Coeficiente de variación: es el cociente entre la desviación típica y la media. CV (X) = σ X X La media, como promedio de un conjunto de datos, tiene la misma unidad de medida que éstos. La varianza estará expresada en las unidades de los datos al cuadrado, mientras que Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 4

5 las desviación típica tiene las mismas unidades que los datos y la media. Cuando se trata de comparar la dispersión de variables expresadas en distintas medidas se puede utilizar el coeficiente de variación, que se suele expresar en %, ya que no tiene unidades. Para la comparación de las modalidades de dos variables distintas se utiliza la variable tipificada que mide la desviación de la variable respecto de la media en términos de la desviación típica. Dada una variable estadística X que toma valores {x 1, x 2,..., x k } com media X y desviación típica σ, se define la variable tipificada Z = X X σ X Rango intercuartílico: es la diferencia entre el cuartil de tercer orden y el de primer orden: R = Q 3 Q 1 Momentos centrales (respecto de la media): Se define el momento central de orden r por µ r = (x i X) r f i Obsérvese que µ 0 = 1, µ 1 = 0 y µ 2 coincide con la varianza. Momentos no centrales (respecto al origen): Se define el momento no central de orden r por m r = x r i f i Obsérvese que m 0 = 1, m 1 = X y que m 2 = σ 2 X + X 2. MEDIDAS DE ASIMETRÍA Y APUTAMIETO Diremos que una distribución de frecuencias es simétrica cuando valores de la variable equidistantes de un valor máximo central tienen las mismas frecuencias. Es importante destacar en este caso X = M e = M d. Se denominan distribuciones asimétricas a aquellas distribuciones que no son simétricas. La asimetría puede presentarse a la derecha o a la izquierda. Coeficiente de asimetría de Pearson A P = X M d σ X Si A P > 0, la distribución es asimétrica a la derecha y si A P < 0 es asimétrica a la izquierda. Coeficiente de asimetría de Fisher A F = γ 1 = µ 3 σ 3 X Si A F > 0, la distribución es asimétrica a la derecha y si A F < 0 es asimétrica a la izquierda. Si A P = 0 = A F, la distribución es simétrica. Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 5

6 Coeficiente de apuntamiento o curtosis: γ 2 = µ 4 σ 4 X Este coeficiente indica cuál es el apuntamiento de forma de la distribución, comparándola con la campana de Gauss (distribución normal). Si γ 2 > 3, tiene más apuntamiento que la normal (leptocúrtica). Si γ 2 = 3, tiene igual apuntamiento que la normal (mesocúrtica). Si γ 2 < 3, tiene menos apuntamiento que la normal (platicúrtica). VARIABLES ESTADÍSTICAS BIDIMESIOALES En esta sección se considerarán aquellas situaciones en las que se realiza la observación simultánea de dos caracteres en el individuo, obteniéndose, por tanto, pares de resultados. Por ejemplo, observar en una persona su peso y su edad. Los dos caracteres observados no tienen por qué ser de la misma clase. Así, se pueden presentar dos caracteres cualitativos, dos cuantitativos o uno cualitativo y otro cuantitativo. En el caso de dos caracteres cuantitativos las variables que representan sus valores pueden ser ambas discretas, ambas continuas o una discreta y otra continua. Se considera una población con individuos descrita por dos caracteres: X con modalidades {x 1, x 2,..., x k } Y con modalidades {y 1, y 2,..., y p } En estos casos, las modalidades son pares (x i, y j ) para i {1, 2,..., k}, j {1, 2,..., p}. Se define la frecuencia absoluta asociada al par (x i, y j ), n ij, como el número de elementos de la población que tienen la modalidad x i de X e y j de Y. Las frecuencias relativas se definen como en el caso de una sola variable f ij = n ij. Las tablas estadísticas correspondientes a una variable bidimensional son de la forma X\Y y 1 y 2 y p x 1 n 11 n 12 n 1p x 2 n 21 n 22 n 2p..... x k n k1 n k2 n kp Distribuciones marginales La distribución marginal de X viene dada por {x i, n i. } k siendo n i. el número total de individuos que poseen la modalidad x i de X, independientemente de la modalidad de Y que posean, a la que se denomina frecuencia marginal absoluta asociada a la modalidad x i de X.Es decir, p n i. = n ij j=1 Se define la frecuencia relativa marginal como el cociente f i. = n i. Análogamente, se define la distribución marginal de Y con las frecuencias marginales absolutas n.j y la relativas f.j. Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 6

7 Para las distribuciones marginales se puede determinar (como ya se vió en el epígrafe anterior de variables estadísticas unidimensionales) cualquier medida de centralización y dispersión. Por ejemplo, se definen las medias marginales como X = k,p x i f ij = x i f i. i,j=1 y las varianzas marginales por Y = k,p p y j f ij = y j f.j i,j=1 j=1 σx 2 k,p = (x i X) 2 f ij = (x i X) 2 f i. i,j=1 σy 2 k,p p = (y j Y ) 2 f ij = (y j Y ) 2 f.j i,j=1 j=1 Distribuciones condicionadas La distribución de X cuando Y = y j, que se denota por X Y = y j, viene dada por {x i, n j i } k siendo n j i el número de individuos que poseen la modalidad x i de X e y j de Y, es decir, la misma n ij. Se construyen tablas de la forma X x 1 x 2. x k La frecuencia relativa de x i condicionada a que Y = y j es la proporción de individuos que presentan la modalidad x i, entre los que presentan la modalidad y j de Y, O sobre el total de la población (ésta sería la frecuencia relativa marginal de x i ). Por tanto, n j i n 1j n 2j. n kj f j i = n ij n.j Obsérvese que si nos fijamos en la tabla de frecuencias correspondiente a la variable unidimensional de X Y = y j, para calcular las frecuencias relativas en dicha tabla, se hace lo habitual: dividir cada frecuencia absoluta entre la suma de todas ellas, que en este caso sería n 1j + n 2j + + n kj = n.j Análogamente, se construyen las tablas correspondientes a las distribuciones de la variable Y condicionadas a algún valor de X, Y X = x i. Como tablas estadísticas de variables unidimensionales que son, se les pueden calcular cualquiera de las medidas ya conocidas. Así, se definen las medias condicionadas por X j = x i f j i Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 7

8 es decir que es la media de la distribución X Y = y j (luego se pueden definir p medias condicionadas). Análogamente, se definen k medias condicionadas, para cada valor de X: p Y i = y j fj i j=1 Se definen las varianzas condicionadas como las varianzas de las variables condicionadas: p σx 2 j = (x i X j ) 2 f j i σy 2 i = (y j Y i ) 2 fj i j=1 ASOCIACIÓ ESTADÍSTICA DE DOS VARIABLES Una de las aspiraciones de la Ciencia ha sido establecer relaciones entre diferentes variables, para, por ejemplo poder predecir el valor de una de ellas, conociendo el valor de la otra. A veces estas relaciones son deterministas (por ejemplo, se puede determinar con exactitud el tiempo que empleará un móvil en recorrer cierta distancia si se sabe la velocidad que lleva) pero en multitud de ocasiones las magnitudes no guardan una relación causal a pesar de que guardan una fuerte conexión. Por ejemplo, el coeficiente de inteligencia, medido con los tests adecuados, se relaciona fuertemente con el rendimiento escolar en Matemáticas. Una parte importante de la Estadística es el análisis de la relación que puede establecerse entre distintas variables, según un conjunto de datos observados. Los distintos grados de asociación pueden ir desde la total independencia hasta una relación tan estrecha que se pueda considerar determinista. Independencia estadística Decimos que una variable X es estadísticamente independiente del carácter Y cuando la frecuencia relativa de x i no depende del valor y j, que condiciona. Es lo mismo que decir que f j i = f i. para todo i, j. En este caso, la frecuencia relativa conjunta se puede expresar como el producto de las marginales. Se puede definir el concepto análogo de ser Y independiente de X, pero se deduce de forma inmediata que son conceptos equivalentes. Dependencia funcional Se dice que X depende funcionalmente de Y si para cada modalidad y j de Y existe una única modalidad x i de X. Si se mira la tabla correspondiente a la variable bidimensional, lo que ocurre es que en cada columna sólo hay un valor no nulo para X. Ésto siempre se da cuando ambas variables están relacionadas por una expresión matemática y, por tanto, existe una relación determinista entre ellas. Covarianza Parece intuitivo pensar que para cuantificar el tipo de asociación estadística entre dos variables a partir de los datos observados en una población, será necesario comparar la variación conjunta de las dos. Ésto supone tener en cuenta los valores que toman cada una de ellas individuo a individuo de la población estudiada. Cuando según los datos registrados, se observa que el crecimiento en los valores de una variable parece favorecer el crecimiento de la otra (por ejemplo, un coeficiente intelectual alto suele llevar a un rendimiento alto en Matemáticas, aunque no se excluye que una persona de coeficiente intelectual mayor que otra tenga un rendimiento más bajo en Matemáticas), se habla de asociación Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 8

9 positiva. Mientras que en caso contrario, es decir, si el crecimiento de una variable conduce a una disminución de la otra (por ejemplo, a mayor número de depredadores en un ecosistema, menor número de presas) se habla de asociación negativa. Para cuantificar la variación conjunta de dos variables, lo que podría denominarse covariación, se mide la desviación respecto de la media que ambas variables presentan en cada individuo de la población. De esta forma, para variables asociadas positivamente, cuando una variable presente un valor grande (esto quiere decir un valor alejado de la media), la otra tenderá a tomar un valor grande, mientras que si la asociación es negativa, ocurrirá al revés. Así, una estimación de la asociación entre variables la proporciona la covarianza: p p σ XY = (x i X)(y j Y )f ij = x i y j f ij X Y j=1 j=1 Obsérvese que si las variables están asociadas positivamente las diferencias (x i X) e (y j Y ) tenderán a tener con frecuencia el mismo signo, mientras que si están asociadas de manera negativa, las diferencias serán con frecuencia de signo contrario, dando lugar a un valor negativo de la covarianza. Por tanto, el signo de la covarianza puede darnos una idea de la asociación entre variables. REGRESIÓ Y CORRELACIÓ Se considera una población de individuos en la cual se estudian dos caracteres cuantitativos X e Y. Supongamos que se observa en cada individuo de la población ambas variables, obteniéndose pares de valores {(x i, y i )}. Si el tamaño de la población fuera elevado y las modalidades de ambas variables se repitieran, se organizarían los datos en una tabla bidimensional de frecuencias, considerando entonces pares {(x i, y j )} k,p i,j=1 con frecuencias relativas asociadas {f ij } k,p i,j=1. En cualquier caso, si se representa en unos ejes cartesianos los valores que toma la variable, se obtiene lo que se conoce como nube de puntos o diagrama de dispersión. El problema general de regresión se plantea en el intento de ajustar una función de ecuación conocida a la nube en cuestión, con el interés de poder obtener una estimación aproximada de una de las variables a partir de la otra. aturalmente que entre todas las funciones que se pueden elegir para ajustarlas a la nube de puntos hemos de seleccionar la óptima, esto es, la que mejor encaje sobre los puntos que tenemos, para lo cual recurriremos al método de los mínimos cuadrados. La función que pretendemos obtener será una línea que llamaremos línea de regresión, cuya ecuación puede ser una recta, una función exponencial, una parábola, una función cúbica o polinómica de cualquier grado, una hipérbola, etc. La regresión adoptará un nombre distinto, dependiendo de la función elegida para el ajuste. Regresión lineal mínimo cuadrática En el supuesto de que sea una recta la función que se quiera ajustar a la nube de puntos, estaremos ante un problema de regresión lineal y distinguiremos entre 1. Recta de regresión de Y sobre X 2. Recta de regresión de X sobre Y Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 9

10 Si se pretende hacer una estimación de los valores que toma Y, sabiendo el valor que toma X, entonces, la ecuación de la recta será y = a + bx y lo que se tiene que hacer es estimar los parámetros a y b, partiendo de los datos observados. Por simplicidad, se considera una variable bidimensional (X, Y ) que al valor observado x i le corresponde un valor observado y i. Llamaremos valor teórico y i al que le correspondería en la recta como función, es decir a+bx i = y i. El método de los mínimos cuadrados consiste en tomar las distancias al cuadrado (para que no se puedan contrarrestar los signos positivos y negativos) entre los valores teóricos y los observados y hacer mínima su suma. Hemos de hacer, por tanto, mínima la expresión F (a, b) = (y i (a + bx i )) 2 Para ello hay que derivar la función F respecto de las variables a y b e igualar a cero. De esta forma se obtiene el siguiente sistema de dos ecuaciones, cuyas incógnitas son a y b: y i = a + b x i x i y i = a x i + b x 2 i que al resolverse proporciona los valores buscados, que son a = Y σ XY σ 2 X X b = σ XY σ 2 X Se obtiene por tanto,la recta y Y = σ XY (x X) σx 2 a la que se denomina recta de regresión de Y sobre X ajustada mediante el método de mínimos cuadrados y se representa por R Y X. Análogamente, se puede calcular por el mismo método, la recta de regresión de X Y que permite hacer una estimación del valor que toma X, sabiendo el valor de Y. Se designa por R X Y y es x X = σ XY σ 2 Y Ajustes que se reducen al caso lineal (y Y ) Supongamos que por la forma de la nube de puntos, se piensa que la línea que mejor encaja es una función polinómica de la forma y = a + bx n. uestro objetivo es, de nuevo, estimar los parámetros a y b. Para ello, podemos ajustar una recta de regresión de Y sobre X n, es decir, se calculan los correspondientes coeficientes a y b, utilizando como datos los pares de valores {(x n i, y i )}. En determinados experimentos, en su mayoría biológicos, la dependencia entre las variables X e Y es de forma exponencial. En este caso interesa ajustar a la nube de puntos la función y = K 1 A K 2x, donde A nos viene dado (en particular, puede ser el número e), y los parámetros a estimar serían K 1 y K 2. Si se toman logaritmos neperianos se obtiene Lny = LnK 1 + K 2 xlna Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 10

11 De esta forma, llamando y = Lny, α = LnK 1 y β = K 2 LnA se tiene y = α + βx con lo que el problema se nos ha convertido en uno de regresión lineal, puesto que la función y = α+βx es una recta. Procediendo como ya se ha descrito con las parejas de valores {(x i, Lny i )} se obtienen α y β. Por último sólo resta deshacer el cambio, de manera que K 1 = e α y K 2 = β LnA. Puede ocurrir que en lugar de fijar la base de la función exponencial, sea necesario buscarla para que el ajuste sea bueno. Es decir, si se pretende ajustar una función de la forma y = Ka x, donde lo que se pretende encontrar son los valores de K y a apropiados, también podemos aprovechar el caso lineal. Tomando logaritmos neperianos, Lny = LnK + xlna Por tanto, si se calcula la recta de regresión de Y = Lny sobre X, con los pares de valores {(x i, Lny i )}, llamémosle y = α + βx, entonces, deshaciendo el cambio anterior, se obtiene K = e α y a = e β Si nos interesa ajustar una función del tipo y = K 1 x K 2, introducimos logaritmos neperianos en ambos miembros Lny = LnK 1 + K 2 Lnx y = α + βx Se ajusta una recta de regresión Y X con los pares de valores {(Lnx i, Lny i )} y se deshace después el cambio, de manera que K 1 = e α y K 2 = β. Para ajustes hiperbólicos, esto es, la línea de regresión es una hipérbola de ecuación y = 1 a + bx, se ajusta un recta y = α + βx para los pares de valores {(x i, y i = 1 y i ), de forma que Correlación a = α y b = β. Una vez resuelto el problema de cómo ajustar una curva a la nube de puntos, se pretende ahora determinar con qué precisión se describe la relación entre las dos variables y qué tipo de curva es la más adecuada. Así como la teoría de la regresión estudia la posible predicción de los valores de una variable a partir de otra, la correlación estudia el tipo de dependencia que existe entre ambas variables. Se considera una variable bidimensional (X, Y ) que al valor observado x i le corresponde un valor observado y i. Para cada i, llamaremos valor teórico yi al que le correspondería a x i en la función que ajustamos, es decir f(x i ) = yi. Recordemos que el método de los mínimos cuadrados se basa en buscar los parámetros necesarios para minimizar el valor de (y i yi ) 2 Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 11

12 Por tanto, si se ajustan dos curvas de regresión distintas, y = f(x) e y = g(x) a una misma nube de puntos, la curva que mejor describa la relación entre ambas variables será aquélla para la que el valor de (y i yi ) 2 sea más pequeño. Se denomina varianza residual a V r = (y i yi ) 2 Por tanto, a menor varianza residual, mejor es el ajuste. Obsérvese que la varianza residual es cero, cuando cada y i = y i, es decir, el ajuste es perfecto, ya que todos los puntos se encuentran sobre la curva de regresión. Según acabámos de ver, la varianza residual se emplea para comparar dos curvas de regresión. Vamos ahora a dar una medida que nos permita conocer la bondad de una recta de regresión. Para el caso en que el ajuste sea lineal, se define el coeficiente de correlación lineal como ρ = σ XY σ X σ Y La relación entre la varianza residual para rectas de regresión y este coeficiente viene dada por por tanto V r = σ 2 Y (1 ρ 2 ) 0 ρ 2 = 1 V r σ 2 Y Obsérvese que cuando ρ 2 = 1, es decir para valores extremos ρ = ±1, se tiene que la varianza residual es cero, por tanto el ajuste es perfecto. En tal caso, se dice que X e Y están correladas de forma exacta. Cuando ρ 2 = 0, la varianza residual toma el mayor valor posible y se dice que las variables X e Y están incorreladas. Cuanto más cercano esté ρ a 1 o 1 (ρ 2 cercano a 1), mejor es el ajuste lineal. Para ajustes no lineales, se puede considerar el coeficiente de determinación, definido como 1 R 2 = 1 V r σ 2 Y 1 Cuánto más próximo a 1 esté el coeficiente de determinación, mejor es el ajuste, puesto que para ajustes perfectos (varianza residual cero) el coeficiente de determinación vale 1. Para ciertos modelos de curvas de regresión, entre las que se incluyen las de tipo polinómico, se puede demostrar que el coeficiente de determinación es un número comprendido entre 0 y 1. De hecho, obsérvese que por la propia definición, el coeficiente de determinación para una recta de regresión coincide con el cuadrado del coeficiente de correlación lineal, es decir, R 2 = ρ 2. Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 12

U.D.1: Análisis estadístico de una variable Consideraciones iniciales: Propuesta: 1.1 Distribución de frecuencias. Variables Cualitativas: Ejemplo

U.D.1: Análisis estadístico de una variable Consideraciones iniciales: Propuesta: 1.1 Distribución de frecuencias. Variables Cualitativas: Ejemplo U.D.1: Análisis estadístico de una variable Consideraciones iniciales: - Población: Es el conjunto de todos los elementos que cumplen una determinada característica. Ej.: Alumnos del colegio. - Individuo:

Más detalles

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2 PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2 Preg. 1. Para comparar la variabilidad relativa de la tensión arterial diastólica y el nivel de colesterol en sangre de una serie de individuos, utilizamos

Más detalles

ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA Definición de Estadística: La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer

Más detalles

Estadística Inferencial. Estadística Descriptiva

Estadística Inferencial. Estadística Descriptiva INTRODUCCIÓN Estadística: Ciencia que trata sobre la teoría y aplicación de métodos para coleccionar, representar, resumir y analizar datos, así como realizar inferencias a partir de ellos. Recogida y

Más detalles

Variables estadísticas bidimensionales

Variables estadísticas bidimensionales Variables estadísticas bidimensionales BEITO J GOZÁLEZ RODRÍGUEZ (bjglez@ulles) DOMIGO HERÁDEZ ABREU (dhabreu@ulles) MATEO M JIMÉEZ PAIZ (mjimenez@ulles) M ISABEL MARRERO RODRÍGUEZ (imarrero@ulles) ALEJADRO

Más detalles

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada. ANEXO 1. CONCEPTOS BÁSICOS Este anexo contiene información que complementa el entendimiento de la tesis presentada. Aquí se exponen técnicas de cálculo que son utilizados en los procedimientos de los modelos

Más detalles

Estadística. Análisis de datos.

Estadística. Análisis de datos. Estadística Definición de Estadística La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un

Más detalles

Un estudio estadístico consta de las siguientes fases: Recogida de datos. Organización y representación de datos. Análisis de datos.

Un estudio estadístico consta de las siguientes fases: Recogida de datos. Organización y representación de datos. Análisis de datos. La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un estudio estadístico consta de las siguientes

Más detalles

Teoría de la decisión

Teoría de la decisión 1.- Un problema estadístico típico es reflejar la relación entre dos variables, a partir de una serie de Observaciones: Por ejemplo: * peso adulto altura / peso adulto k*altura * relación de la circunferencia

Más detalles

Módulo de Estadística

Módulo de Estadística Módulo de Estadística Tema 2: Estadística descriptiva Tema 2: Estadísticos 1 Medidas La finalidad de las medidas de posición o tendencia central (centralización) es encontrar unos valores que sinteticen

Más detalles

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua ESTADÍSTICA Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal Cuantitativa discreta continua DISTRIBUCIÓN DE FRECUENCIAS Frecuencia absoluta: fi Frecuencia relativa:

Más detalles

CORRELACIÓN Y REGRESIÓN. Raúl David Katz

CORRELACIÓN Y REGRESIÓN. Raúl David Katz CORRELACIÓN Y REGRESIÓN Raúl David Katz 1 Correlación y regresión Introducción Hasta ahora hemos visto el modo de representar la distribución de frecuencias de los datos correspondientes a una variable

Más detalles

Regresión y Correlación

Regresión y Correlación Relación de problemas 4 Regresión y Correlación 1. El departamento comercial de una empresa se plantea si resultan rentables los gastos en publicidad de un producto. Los datos de los que dispone son: Beneficios

Más detalles

UNIDAD 7 Medidas de dispersión

UNIDAD 7 Medidas de dispersión UNIDAD 7 Medidas de dispersión UNIDAD 7 MEDIDAS DE DISPERSIÓN Al calcular un promedio, por ejemplo la media aritmética no sabemos su representatividad para ese conjunto de datos. La información suministrada

Más detalles

478 Índice alfabético

478 Índice alfabético Índice alfabético Símbolos A, suceso contrario de A, 187 A B, diferencia de los sucesos A y B, 188 A/B, suceso A condicionado por el suceso B, 194 A B, intersección de los sucesos A y B, 188 A B, unión

Más detalles

MEDIDAS DE TENDENCIA CENTRAL

MEDIDAS DE TENDENCIA CENTRAL MEDIDAS DE TENDENCIA CENTRAL Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro

Más detalles

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7) TEMA Nº 7 DISTRIBUCIONES CONTINUAS DE PROBABILIDAD OBJETIVOS DE APRENDIZAJE: Conocer las características de la distribución normal como distribución de probabilidad de una variable y la aproximación de

Más detalles

Tema 7 : DATOS BIVARIADOS. CORRELACION Y REGRESION.

Tema 7 : DATOS BIVARIADOS. CORRELACION Y REGRESION. Tema 7 : DATOS BIVARIADOS. CORRELACION Y REGRESION. Distribuciones uni- y pluridimensionales. Hasta ahora se han estudiado los índices y representaciones de una sola variable por individuo. Son las distribuciones

Más detalles

UNIDAD 12.- Estadística. Tablas y gráficos (tema12 del libro)

UNIDAD 12.- Estadística. Tablas y gráficos (tema12 del libro) UNIDAD 12.- Estadística. Tablas y gráficos (tema12 del libro) 1. ESTADÍSTICA: CLASES Y CONCEPTOS BÁSICOS En sus orígenes históricos, la Estadística estuvo ligada a cuestiones de Estado (recuentos, censos,

Más detalles

TEMA IV PERCENTIL Y ESTADIGRAFOS DE POSICION

TEMA IV PERCENTIL Y ESTADIGRAFOS DE POSICION TEMA IV PERCENTIL Y ESTADIGRAFOS DE POSICION 1. Percentiles, cuartiles y deciies. 2. Estadígrafos de Posición. 3. Sesgo y curtosis o de pastel. Pictogramas. OBJETIVOS DE UNIDAD GENERALES. Que el futuro

Más detalles

Tema Contenido Contenidos Mínimos

Tema Contenido Contenidos Mínimos 1 Estadística unidimensional - Variable estadística. - Tipos de variables estadísticas: cualitativas, cuantitativas discretas y cuantitativas continuas. - Variable cualitativa. Distribución de frecuencias.

Más detalles

2.- Tablas de frecuencias

2.- Tablas de frecuencias º BACHILLERATO MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES II TEMA 3.- ESTADÍSTICA DESCRIPTIVA PROFESOR: RAFAEL NÚÑEZ -----------------------------------------------------------------------------------------------------------------------------------------------------------------

Más detalles

Transformaciones de variables

Transformaciones de variables Transformaciones de variables Introducción La tipificación de variables resulta muy útil para eliminar su dependencia respecto a las unidades de medida empleadas. En realidad, una tipificación equivale

Más detalles

ANÁLISIS DE DATOS UNIDIMENSIONALES

ANÁLISIS DE DATOS UNIDIMENSIONALES ANÁLISIS DE DATOS UNIDIMENSIONALES TABLAS DE FRECUENCIAS Y REPRESENTACIONES GRÁFICAS MEDIDAS DE POSICIÓN MEDIDAS DE TENDENCIA CENTRAL MEDIA ARITMÉTICA OTRAS MEDIAS: GEOMÉTRICA.ARMÓNICA.MEDIA GENERAL MEDIANA

Más detalles

Z i

Z i Medidas de Variabilidad y Posición. Jesús Eduardo Pulido Guatire, marzo 010 Cuando trabajamos el aspecto denominado Medidas de Tendencia Central se observó que tanto la media como la mediana y la moda

Más detalles

ESTADISTICA Y PROBABILIDAD ESTADÍSTICA

ESTADISTICA Y PROBABILIDAD ESTADÍSTICA ESTADÍSTICA La estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comprobaciones y sacar conclusiones. Un estudio estadístico consta

Más detalles

VARIABLES ESTADÍSTICAS BIDIMENSIONALES

VARIABLES ESTADÍSTICAS BIDIMENSIONALES VARIABLES ESTADÍSTICAS BIDIMENSIONALES 1.- En una variable estadística bidimensional, el diagrama de dispersión representa: a) la nube de puntos. b) las varianzas de las dos variables. c) los coeficientes

Más detalles

Fase 2. Estudio de mercado: ESTADÍSTICA

Fase 2. Estudio de mercado: ESTADÍSTICA 1. CONCEPTO DE ESTADÍSTICA. ESTADÍSTICA DESCRIPTIVA 2. 3. TABLA DE FRECUENCIAS 4. REPRESENTACIONES GRÁFICAS 5. TIPOS DE MEDIDAS: A. MEDIDAS DE POSICIÓN B. MEDIDAS DE DISPERSIÓN C. MEDIDAS DE FORMA 1 1.

Más detalles

MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN. Lic. Esperanza García Cribilleros

MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN. Lic. Esperanza García Cribilleros MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN Lic. Esperanza García Cribilleros ANÁLISIS EXPLORATORIO DE DATOS Diagrama de tallo y hojas Diagrama de caja DESCRIPCIÓN N DE LOS DATOS Tablas

Más detalles

Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va

Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va Jesús Fernández Fernández Carmen María Sordo García DEPARTAMENTO DE MATEMÁTICA APLICADA Y CIENCIAS DE LA COMPUTACIÓN UNIVERSIDAD DE CANTABRIA

Más detalles

Matemáticas. Selectividad ESTADISTICA COU

Matemáticas. Selectividad ESTADISTICA COU Matemáticas Selectividad ESTADISTICA COU 1. Un dentista observa el Nº de Caries en cada uno de los 100 niños de cierto colegio. La información obtenida aparece resumida en la siguiente tabla. Nº Caries

Más detalles

ESTADÍSTICA CON EXCEL

ESTADÍSTICA CON EXCEL ESTADÍSTICA CON EXCEL 1. INTRODUCCIÓN La estadística es la rama de las matemáticas que se dedica al análisis e interpretación de series de datos, generando unos resultados que se utilizan básicamente en

Más detalles

Bioestadística: Estadística Descriptiva

Bioestadística: Estadística Descriptiva Bioestadística: M. González Departamento de Matemáticas. Universidad de Extremadura Bioestadística 1 2 Bioestadística 1 2 Coneptos Básicos ESTADÍSTICA Ciencia que estudia el conjunto de métodos y procedimientos

Más detalles

Variables estadísticas bidimensionales: problemas resueltos

Variables estadísticas bidimensionales: problemas resueltos Variables estadísticas bidimensionales: problemas resueltos BENITO J. GONZÁLEZ RODRÍGUEZ (bjglez@ull.es) DOMINGO HERNÁNDEZ ABREU (dhabreu@ull.es) MATEO M. JIMÉNEZ PAIZ (mjimenez@ull.es) M. ISABEL MARRERO

Más detalles

Jesús Eduardo Pulido Guatire, marzo Diagrama de Dispersión y Correlación Lineal Simple

Jesús Eduardo Pulido Guatire, marzo Diagrama de Dispersión y Correlación Lineal Simple Jesús Eduardo Pulido Guatire, marzo 0 Diagrama de Dispersión y Correlación Lineal Simple Hasta el momento el trabajo lo hemos centrado en resumir las características de una variable mediante la organización

Más detalles

UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO

UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO CENTRO UNIVERSITARIO UAEM ZUMPANGO LICENCIATURA EN TURISMO UNIDAD DE APRENDIZAJE: ESTADISTICA TEMA 1.5 : ESTADISTICA DESCRIPTIVA M. EN C. LUIS ENRIQUE KU MOO FECHA:

Más detalles

Tema 5. Variables Aleatorias

Tema 5. Variables Aleatorias Tema 5. Variables Aleatorias Presentación y Objetivos. En este tema se estudia el concepto básico de Variable Aleatoria así como diversas funciones fundamentales en su desarrollo. Es un concepto clave,

Más detalles

1.- Diagrama de barras

1.- Diagrama de barras 1.- Diagrama de barras Un diagrama de barras se utiliza para de presentar datos cualitativos o datos cuantitativos de tipo discreto (variables tipo II). Se representan sobre unos ejes de coordenadas, en

Más detalles

Temas de Estadística Práctica

Temas de Estadística Práctica Temas de Estadística Práctica Antonio Roldán Martínez Proyecto http://www.hojamat.es/ Tema 2: Medidas de tipo paramétrico Resumen teórico Medidas de tipo paramétrico Medidas de tendencia central Medidas

Más detalles

ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA DESCRIPTIVA Medidas de tendencia central y de dispersión Giorgina Piani Zuleika Ferre 1. Tendencia Central Son un conjunto de medidas estadísticas que determinan un único valor que define el

Más detalles

En este caso la variable X es el n de hijos, es por tanto una variable discreta. Veamos todas las frecuencias.

En este caso la variable X es el n de hijos, es por tanto una variable discreta. Veamos todas las frecuencias. ESTADÍSTICA DESCRIPTIVA Concepto v finalidad En los municipios existen unos censos de los ciudadanos con datos de su edad, sexo, residencia, trabajo, etc. Pero si se desea conocer, para lanzar un producto

Más detalles

Ejemplos y ejercicios de. Estadística Descriptiva. yanálisis de Datos. 2 Descripción estadística de una variable. Ejemplos y ejercicios.

Ejemplos y ejercicios de. Estadística Descriptiva. yanálisis de Datos. 2 Descripción estadística de una variable. Ejemplos y ejercicios. ESTADÍSTICA DESCRIPTIVA Y ANÁLISIS DE DATOS Ejemplos y ejercicios de Estadística Descriptiva yanálisis de Datos Diplomatura en Estadística Curso 007/08 Descripción estadística de una variable. Ejemplos

Más detalles

RELACIÓN DE EJERCICIOS TEMA 2

RELACIÓN DE EJERCICIOS TEMA 2 1. Sea una distribución estadística que viene dada por la siguiente tabla: Calcular: x i 61 64 67 70 73 f i 5 18 42 27 8 a) La moda, mediana y media. b) El rango, desviación media, varianza y desviación

Más detalles

Método de cuadrados mínimos

Método de cuadrados mínimos REGRESIÓN LINEAL Gran parte del pronóstico estadístico del tiempo está basado en el procedimiento conocido como regresión lineal. Regresión lineal simple (RLS) Describe la relación lineal entre dos variables,

Más detalles

Tema 2. Descripción Conjunta de Varias Variables

Tema 2. Descripción Conjunta de Varias Variables Tema 2. Descripción Conjunta de Varias Variables Cuestiones de Verdadero/Falso 1. La covarianza mide la relación lineal entre dos variables, pero depende de las unidades de medida utilizadas. 2. El análisis

Más detalles

Tema 3. Relación entre dos variables cuantitativas

Tema 3. Relación entre dos variables cuantitativas Tema 3. Relación entre dos variables cuantitativas Resumen del tema 3.1. Diagrama de dispersión Cuando sobre cada individuo de una población se observan simultáneamente dos características cuantitativas

Más detalles

Y accedemos al cuadro de diálogo Descriptivos

Y accedemos al cuadro de diálogo Descriptivos SPSS: DESCRIPTIVOS PROCEDIMIENTO DE ANÁLISIS INICIAL DE DATOS: DESCRIPTIVOS A diferencia con el procedimiento Frecuencias, que contiene opciones para describir tanto variables categóricas como cuantitativas

Más detalles

ESTADÍSTICA DESCRIPTIVA PARA EL TURISMO

ESTADÍSTICA DESCRIPTIVA PARA EL TURISMO ESTADÍSTICA DESCRIPTIVA PARA EL TURISMO RELACIÓN DE PROBLEMAS PROPUESTOS DE UNA VARIABLE Curso académico 2004-2005 DPTO. ECONOMÍA APLICADA I 1. Obtener las frecuencias acumuladas, las frecuencias relativas

Más detalles

II. ORGANIZACIÓN N Y PRESENTACIÓN N DE DATOS

II. ORGANIZACIÓN N Y PRESENTACIÓN N DE DATOS UNIVERSIDAD INTERAMERICANA PARA EL DESARROLLO ORGANIZACIÓN N Y PRESENTACIÓN N DE DATOS Contenido II. ORGANIZACIÓN N Y PRESENTACIÓN N DE DATOS II. Tablas de frecuencia II. Gráficos: histograma, ojiva, columna,

Más detalles

Medidas de centralización

Medidas de centralización 1 1. Medidas de centralización Medidas de centralización Hemos visto cómo el estudio del conjunto de los datos mediante la estadística permite realizar representaciones gráficas, que informan sobre ese

Más detalles

Repaso Estadística Descriptiva

Repaso Estadística Descriptiva Grado en Fisioterapia, 2010/11 Cátedra de Bioestadística Universidad de Extremadura 13 de octubre de 2010 Índice Descriptiva de una variable 1 Descriptiva de una variable 2 Índice Descriptiva de una variable

Más detalles

15. Regresión lineal. Te recomiendo visitar su página de apuntes y vídeos:

15. Regresión lineal. Te recomiendo visitar su página de apuntes y vídeos: 15. Regresión lineal Este tema, prácticamente íntegro, está calacado de los excelentes apuntes y transparencias de Bioestadística del profesor F.J. Barón López de la Universidad de Málaga. Te recomiendo

Más detalles

INTERVALOS Y SEMIRRECTAS.

INTERVALOS Y SEMIRRECTAS. el blog de mate de aida CSI: Inecuaciones pág 1 INTERVALOS Y SEMIRRECTAS La ordenación de números permite definir algunos conjuntos de números que tienen una representación geométrica en la recta real

Más detalles

Medidas de dispersión

Medidas de dispersión Medidas de dispersión Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la distribución. Las medidas de dispersión son: Rango o recorrido El rango es la diferencia

Más detalles

1. Dado el siguiente volumen de ventas de una empresa y su gasto en I+D en miles. Prediga las ventas de este empresario para un gasto en I+D de 7.

1. Dado el siguiente volumen de ventas de una empresa y su gasto en I+D en miles. Prediga las ventas de este empresario para un gasto en I+D de 7. MODELO A Examen de Estadística Económica (2407) 20 de junio de 2009 En cada pregunta sólo existe UNA respuesta considerada más correcta. Si hay dos correctas deberá escoger aquella respuesta que tenga

Más detalles

SESIÓN N 07 III UNIDAD RELACIONES Y FUNCIONES

SESIÓN N 07 III UNIDAD RELACIONES Y FUNCIONES SESIÓN N 07 III UNIDAD RELACIONES Y FUNCIONES RELACIONES BINARIAS PAR ORDENADO Es un arreglo de dos elementos que tienen un orden determinado donde a es llamada al primera componente y b es llamada la

Más detalles

Tema 8. Análisis de dos variables Ejercicios resueltos 1

Tema 8. Análisis de dos variables Ejercicios resueltos 1 Tema 8. Análisis de dos variables Ejercicios resueltos 1 Ejercicio resuelto 8.1 La siguiente tabla muestra la distribución del gasto mensual en libros y el gasto mensual en audiovisual en euros en los

Más detalles

ESTADISTICA APLICADA A LA EDUCACIÒN CODIGO: HOC220 EJERCICIOS SOBRE MEDIDAS DE TENDENCIA CENTRAL, POSICIONAL Y DE DISPERSIÓN

ESTADISTICA APLICADA A LA EDUCACIÒN CODIGO: HOC220 EJERCICIOS SOBRE MEDIDAS DE TENDENCIA CENTRAL, POSICIONAL Y DE DISPERSIÓN ESTADISTICA APLICADA A LA EDUCACIÒN CODIGO: HOC220 EJERCICIOS SOBRE MEDIDAS DE TENDENCIA CENTRAL, POSICIONAL Y DE DISPERSIÓN COMPILADOR San Cristóbal, Abril 2011 CODIGO: HOC220 Página 1 1. A un conjunto

Más detalles

Medidas de tendencia central

Medidas de tendencia central Medidas de tendencia central Medidas de tendencia central Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de

Más detalles

M i. Los datos vendrán en intervalos en el siguiente histograma de frecuencias acumuladas se ilustra la mediana.

M i. Los datos vendrán en intervalos en el siguiente histograma de frecuencias acumuladas se ilustra la mediana. Medidas de tendencia central y variabilidada para datos agrupados Media (media aritmética) ( X ) Con anterioridad hablamos sobre la manera de determinar la media de la muestra. Si hay muchos valores u

Más detalles

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS 1. INTRODUCCIÓN Este tema se centra en el estudio conjunto de dos variables. Dos variables cualitativas - Tabla de datos - Tabla de contingencia - Diagrama de barras - Tabla de diferencias entre frecuencias

Más detalles

Límites y continuidad de funciones reales de variable real

Límites y continuidad de funciones reales de variable real Límites y continuidad de funciones reales de variable real Álvarez S., Caballero M.V. y Sánchez M. a M. salvarez@um.es, m.victori@um.es, marvega@um.es Índice 1. Definiciones 3 2. Herramientas 10 2.1. Funciones

Más detalles

Variable Estadística Bidimensional

Variable Estadística Bidimensional Capítulo 2 Variable Estadística Bidimensional 21 Distribución de Frecuencias Bidimensional Sea una población de n individuos donde estudiamos, simultáneamente, dos variables X e Y Seanx 1,x 2,,x k las

Más detalles

Medidas de tendencia central y dispersión

Medidas de tendencia central y dispersión Estadística Aplicada a la Investigación en Salud Medwave. Año XI, No. 3, Marzo 2011. Open Access, Creative Commons. Medidas de tendencia central y dispersión Autor: Fernando Quevedo Ricardi (1) Filiación:

Más detalles

Distribuciones bidimensionales. Regresión.

Distribuciones bidimensionales. Regresión. Temas de Estadística Práctica Antonio Roldán Martínez Proyecto http://www.hojamat.es/ Tema 5: Distribuciones bidimensionales. Regresión. Resumen teórico Resumen teórico de los principales conceptos estadísticos

Más detalles

Relación 2: CARACTERÍSTICAS DE UNA DISTRIBUCIÓN DE FRECUENCIAS

Relación 2: CARACTERÍSTICAS DE UNA DISTRIBUCIÓN DE FRECUENCIAS INTRODUCCIÓN A LA ESTADÍSTICA Relación 2: CARACTERÍSTICAS DE UNA DISTRIBUCIÓN DE FRECUENCIAS 1.- Obtener las medias aritmética, geométrica, armónica para la siguiente distribución: SOL: 2,74; 2,544; 2,318

Más detalles

3. ANÁLISIS DE DATOS DE PRECIPITACIÓN.

3. ANÁLISIS DE DATOS DE PRECIPITACIÓN. 3. ANÁLISIS DE DATOS DE PRECIPITACIÓN. Teniendo en cuenta que la mayoría de procesos estadísticos se comportan de forma totalmente aleatoria, es decir, un evento dado no está influenciado por los demás,

Más detalles

Probabilidad y Estadística, EIC 311

Probabilidad y Estadística, EIC 311 Probabilidad y Estadística, EIC 311 Medida de resumen 1er Semestre 2016 1 / 105 , mediana y moda para datos no Una medida muy útil es la media aritmética de la muestra = Promedio. 2 / 105 , mediana y moda

Más detalles

INDICE. Prólogo a la Segunda Edición

INDICE. Prólogo a la Segunda Edición INDICE Prólogo a la Segunda Edición XV Prefacio XVI Capitulo 1. Análisis de datos de Negocios 1 1.1. Definición de estadística de negocios 1 1.2. Estadística descriptiva r inferencia estadística 1 1.3.

Más detalles

ÍNDICE CAPÍTULO 1. INTRODUCCIÓN

ÍNDICE CAPÍTULO 1. INTRODUCCIÓN ÍNDICE CAPÍTULO 1. INTRODUCCIÓN 1.1. OBJETO DE LA ESTADÍSTICA... 17 1.2. POBLACIONES... 18 1.3. VARIABLES ALEATORIAS... 19 1.3.1. Concepto... 19 1.3.2. Variables discretas y variables continuas... 20 1.3.3.

Más detalles

REGRESIÓN LINEAL SIMPLE, COEFICIENTE DE DETERMINACIÓN Y CORRELACIONES (EJERCICIOS RESUELTOS)

REGRESIÓN LINEAL SIMPLE, COEFICIENTE DE DETERMINACIÓN Y CORRELACIONES (EJERCICIOS RESUELTOS) 1 REGRESIÓN LINEAL SIMPLE, COEFICIENTE DE DETERMINACIÓN Y CORRELACIONES (EJERCICIOS RESUELTOS) 1. EN LA REGIÓN DE DRAKUL DE LA REPÚBLICA DE NECROLANDIA, LAS AUTORIDADES ECONÓMICAS HAN REALIZADO UNA REVISIÓN

Más detalles

4. Medidas de tendencia central

4. Medidas de tendencia central 4. Medidas de tendencia central A veces es conveniente reducir la información obtenida a un solo valor o a un número pequeño de valores, las denominadas medidas de tendencia central. Sea X una variable

Más detalles

Derivadas e integrales

Derivadas e integrales Derivadas e integrales Álvarez S., Caballero M.V. y Sánchez M a M salvarez@um.es, m.victori@um.es, marvega@um.es ÍNDICE Matemáticas Cero Índice. Definiciones 3. Herramientas 4.. Reglas de derivación.......................

Más detalles

Una población es el conjunto de todos los elementos a los que se somete a un estudio estadístico.

Una población es el conjunto de todos los elementos a los que se somete a un estudio estadístico. Introducción a la Melilla Definición de La trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un estudio estadístico

Más detalles

EVALUACIÓN EXTRAORDINARIA DE SEPTIEMBRE CURSO Contenidos para la Prueba de Septiembre MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I.

EVALUACIÓN EXTRAORDINARIA DE SEPTIEMBRE CURSO Contenidos para la Prueba de Septiembre MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I. EVALUACIÓN EXTRAORDINARIA DE SEPTIEMBRE CURSO 2013-2014. Contenidos para la Prueba de Septiembre MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I. UNIDAD 3: POLINOMIOS Y FRACCIONES ALGEBRAICAS Operaciones

Más detalles

Algebra lineal y conjuntos convexos

Algebra lineal y conjuntos convexos Apéndice A Algebra lineal y conjuntos convexos El método simplex que se describirá en el Tema 2 es de naturaleza algebraica y consiste en calcular soluciones de sistemas de ecuaciones lineales y determinar

Más detalles

Tema 2: Estadística Descriptiva Bivariante.

Tema 2: Estadística Descriptiva Bivariante. Estadística 24 Tema 2: Estadística Descriptiva Bivariante. Se va a estudiar la situación en la que los datos representan observaciones, correspondientes a dos variables o caracteres, efectuadas en los

Más detalles

Medidas de Tendencia Central.

Medidas de Tendencia Central. Medidas de Tendencia Central www.jmontenegro.wordpress.com MEDIDAS DE RESUMEN MDR MEDIDAS DE TENDENCIA CENTRAL MEDIA MEDIANA MODA CUARTILES,ETC. MEDIDAS DE DISPERSIÓN RANGO DESVÍO EST. VARIANZA COEFIC.

Más detalles

Universidad de Sonora Departamento de Matemáticas Área Económico Administrativa

Universidad de Sonora Departamento de Matemáticas Área Económico Administrativa Universidad de Sonora Departamento de Matemáticas Área Económico Administrativa Materia: Estadística I Maestro: Dr. Francisco Javier Tapia Moreno Semestre: 015- Hermosillo, Sonora, a 14 de septiembre de

Más detalles

Medidas descriptivas I. Medidas de tendencia central A. La moda

Medidas descriptivas I. Medidas de tendencia central A. La moda Medidas descriptivas I. Medidas de tendencia central A. La moda Preparado por: Roberto O. Rivera Rodríguez Coaching de matemática Escuela Eduardo Neuman Gandía 1 Introducción En muchas ocasiones el conjunto

Más detalles

La desviación típica y otras medidas de dispersión

La desviación típica y otras medidas de dispersión La desviación típica y otras medidas de dispersión DISPERSIÓN O VARIACIÓN La dispersión o variación de los datos intenta dar una idea de cuan esparcidos se encuentran éstos. Hay varias medidas de tal dispersión,

Más detalles

ESTADÍSTICA SEMANA 3

ESTADÍSTICA SEMANA 3 ESTADÍSTICA SEMANA 3 ÍNDICE MEDIDAS DESCRIPTIVAS... 3 APRENDIZAJES ESPERADOS... 3 DEFINICIÓN MEDIDA DESCRIPTIVA... 3 MEDIDAS DE POSICIÓN... 3 MEDIDAS DE TENDENCIA CENTRAL... 4 MEDIA ARITMÉTICA O PROMEDIO...

Más detalles

Estadística Descriptiva. SESIÓN 11 Medidas de dispersión

Estadística Descriptiva. SESIÓN 11 Medidas de dispersión Estadística Descriptiva SESIÓN 11 Medidas de dispersión Contextualización de la sesión 11 En la sesión anterior se explicaron los temas relacionados con la dispersión, una de las medidas de dispersión,

Más detalles

TEST ESTADÍSTICA DESCRIPTIVA. Profesores Ana I. González Martín Dolores Jano Salagre Rocío Marco Crespo Salvador Ortiz Serrano Francisco Soto Ortego

TEST ESTADÍSTICA DESCRIPTIVA. Profesores Ana I. González Martín Dolores Jano Salagre Rocío Marco Crespo Salvador Ortiz Serrano Francisco Soto Ortego TEST ESTADÍSTICA DESCRIPTIVA Profesores Ana I. González Martín Dolores Jano Salagre Rocío Marco Crespo Salvador Ortiz Serrano Francisco Soto Ortego temas 1 y 2: VARIABLES, ATRIBUTOS Y DISTRIBUCIONES DE

Más detalles

ESTADÍSTICA. Tema 4 Regresión lineal simple

ESTADÍSTICA. Tema 4 Regresión lineal simple ESTADÍSTICA Grado en CC. de la Alimentación Tema 4 Regresión lineal simple Estadística (Alimentación). Profesora: Amparo Baíllo Tema 4: Regresión lineal simple 1 Estructura de este tema Planteamiento del

Más detalles

UNIDAD 6. Estadística

UNIDAD 6. Estadística Matemática UNIDAD 6. Estadística 2 Medio GUÍA N 1 MEDIDAS DE DISPERSIÓN PARA DATOS NO AGRUPADOS ACTIVIDAD Consideremos los siguientes conjuntos de valores referidos a las edades de los jugadores de dos

Más detalles

Fundamentos de Estadística y Simulación Básica

Fundamentos de Estadística y Simulación Básica Fundamentos de Estadística y Simulación Básica TEMA 2 Estadística Descriptiva Clasificación de Variables Escalas de Medición Gráficos Tabla de frecuencias Medidas de Tendencia Central Medidas de Dispersión

Más detalles

2. Recolección de información - Medidas de posición: moda, media aritmética, mínimo, máximo - Frecuencia absoluta, relativa y porcentual

2. Recolección de información - Medidas de posición: moda, media aritmética, mínimo, máximo - Frecuencia absoluta, relativa y porcentual Prueba Escrita de matemática / Nivel: Sétimo año 1. Estadística - Unidad estadística - Características - Datos u observaciones - Población - Muestra - Variabilidad de los datos - Variables cuantitativas

Más detalles

MEDIDAS DE TENDENCIA CENTRAL

MEDIDAS DE TENDENCIA CENTRAL UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS (Universidad del Perú, DECANA DE AMERICA) MEDIDAS DE TENDENCIA CENTRAL 20/05/2008 Ing. SEMS 2.1 INTRODUCCIÓN En el capítulo anterior estudiamos de qué manera los

Más detalles

Tema 1.- Correlación Lineal

Tema 1.- Correlación Lineal Tema 1.- Correlación Lineal 3.1.1. Definición El término correlación literalmente significa relación mutua; de este modo, el análisis de correlación mide e indica el grado en el que los valores de una

Más detalles

Pregunta 1. Pregunta 2. Pregunta 3. Pregunta 4. Pregunta 5. Pregunta 6. Pregunta 7. Comenzado el lunes, 25 de marzo de 2013, 17:24

Pregunta 1. Pregunta 2. Pregunta 3. Pregunta 4. Pregunta 5. Pregunta 6. Pregunta 7. Comenzado el lunes, 25 de marzo de 2013, 17:24 Comenzado el lunes, 25 de marzo de 2013, 17:24 Estado Finalizado Finalizado en sábado, 30 de marzo de 2013, 17:10 Tiempo empleado 4 días 23 horas Puntos 50,00/50,00 Calificación 10,00 de un máximo de 10,00

Más detalles

UNIDAD 8 INECUACIONES. Objetivo general.

UNIDAD 8 INECUACIONES. Objetivo general. 8. 1 UNIDAD 8 INECUACIONES Objetivo general. Al terminar esta Unidad resolverás inecuaciones lineales y cuadráticas e inecuaciones que incluyan valores absolutos, identificarás sus conjuntos solución en

Más detalles

Curso de Estadística Básica

Curso de Estadística Básica Curso de SESION 3 MEDIDAS DE TENDENCIA CENTRAL Y MEDIDAS DE DISPERSIÓN MCC. Manuel Uribe Saldaña MCC. José Gonzalo Lugo Pérez Objetivo Conocer y calcular las medidas de tendencia central y medidas de dispersión

Más detalles

Unidad Nº 3. Medidas de Dispersión

Unidad Nº 3. Medidas de Dispersión Unidad Nº 3 Medidas de Dispersión 1.-Definición.- Las medidas de tendencia central nos enseñaban a localizar el centro de la información en una serie de observaciones o distribución, pero no a realizar

Más detalles

EJERCICIOS RESUELTOS TEMA 1.

EJERCICIOS RESUELTOS TEMA 1. EJERCICIOS RESUELTOS TEMA 1. 1.1. El proceso por el cual se asignan números a objetos o características según determinadas reglas se denomina: A) muestreo; B) estadística; C) medición. 1.2. Mediante la

Más detalles

CORPORACION UNIFICADA NACIONAL DE EDUCACION SUPERIOR CUN DEPARTAMENTO DE CIENCIAS BASICAS: MATEMATICAS

CORPORACION UNIFICADA NACIONAL DE EDUCACION SUPERIOR CUN DEPARTAMENTO DE CIENCIAS BASICAS: MATEMATICAS ACTIVIDAD ACADEMICA: ESTADISTICA DESCRIPTIVA DOCENTE: LIC- ING: ROSMIRO FUENTES ROCHA UNIDAD N 1: CONCEPTOS BASICOS DEFINICIÓN DE ESTADÍSTICA La Estadística trata del recuento, ordenación y clasificación

Más detalles

1 ÁLGEBRA DE MATRICES

1 ÁLGEBRA DE MATRICES 1 ÁLGEBRA DE MATRICES 1.1 DEFINICIONES Las matrices son tablas numéricas rectangulares. Se dice que una matriz es de dimensión m n si tiene m filas y n columnas. Cada elemento de una matriz se designa

Más detalles

EJERCICIOS TEMA 1. Clasifica los siguientes caracteres estadísticos según sean cualitativos, variables discretas o variables continuas:

EJERCICIOS TEMA 1. Clasifica los siguientes caracteres estadísticos según sean cualitativos, variables discretas o variables continuas: Ejercicio 1. Clasifica los siguientes caracteres estadísticos según sean cualitativos, variables discretas o variables continuas: a) Marca de los coches. b) Peso de los coches. c) Número de coches vendidos

Más detalles

Unidad IV: Distribuciones muestrales

Unidad IV: Distribuciones muestrales Unidad IV: Distribuciones muestrales 4.1 Función de probabilidad En teoría de la probabilidad, una función de probabilidad (también denominada función de masa de probabilidad) es una función que asocia

Más detalles

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos Agro 6998 Conferencia Introducción a los modelos estadísticos mixtos Los modelos estadísticos permiten modelar la respuesta de un estudio experimental u observacional en función de factores (tratamientos,

Más detalles