Fundamentos de Estadística descriptiva

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Fundamentos de Estadística descriptiva"

Transcripción

1 Fundamentos de Estadística descriptiva COCEPTOS GEERALES Llamaremos población estadística al conjunto de referencia sobre el cual van a recaer las observaciones. Se llama individuo a cada uno de los elementos que componen la población y muestra a un subconjunto de individuos de la población. Se suelen tomar muestras cuando es difícil o costosa la observación de todos los elementos de la población. Decimos que realizamos un censo cuando se observa a la población completa. Toda población viene definida por un conjunto delimitado y bien definido de caracteres, es decir una cualidad o propiedad inherente en el individuo. A los posibles aspectos de un carácter se les denominan modalidades, que deben ser exhaustivas e incompatibles. Los caracteres pueden ser clasificados en caracteres cualitativos, en las se recogen modalidades que no son números (color del pelo, por ejemplo) y caracteres cuantitativos, en las que todas las modalidades son números (por ejemplo, el peso o la estatura). Una variable estadística es un conjunto de números que representan a un carácter (o más) cuantitativo. Éstas pueden ser discretas o continuas, según que las modalidades sean números naturales o intervalos de IR, respectivamente. Se considera una población formada por individuos, descrita por un carácter que posee k modalidades x 1, x 2,..., x k, pero donde cada uno de ellos puede aparecer repetido más de una vez. Se denomina frecuencia absoluta, n i, asociada a la modalidad x i al número de elementos de la población que poseen dicha modalidad. De esta forma, la suma de todas las frecuencias absolutas debe ser el número de elementos de la población, es decir k n i =. La frecuencia relativa, f i, asociada a una modalidad x i es la proporción de individuos de la población que presenta la modalidad x i, por tanto es el cociente entre la frecuencia absoluta de x i y el número de elementos de la población: f i = n i. Se satisface entonces que k f i = 1. La frecuencia acumulada absoluta, i (respect. relativa, F i ) asociada a la modalidad x i es la suma de las frecuencias absolutas (respect. relativas) de las modalidades x 1, x 2,..., x i 1, x i. Con estas definiciones, se tiene que la frecuencia acumulada absoluta de la última modalidad x k coincide con el número de elementos de la población y la frecuencia acumulada relativa coincide con 1. Con estos datos se construye una llamada tabla estadística de frecuencias en la que se recogen las modalidades de un carácter y sus respectivas frecuencias: modalidad frec. abs. frec. rel. frec. abs. acum. frec. acum. rel. x i n i f i i F i x 1 n 1 f 1 = n 1 1 = n 1 F 1 = f 1 x 2 n 2 f 2 = n 2 2 = n 1 + n 2 F 2 = f 1 + f x k n k f k = n k k = F k = 1 En relación a las observaciones realizadas en una muestra o población se nos pueden presentar los siguientes casos: 1. Que se hayan hecho pocas observaciones y, por tanto, la variable estadística tome pocos valores. Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 1

2 2. Que se hayan hecho muchas observaciones y, sin embargo, la variable estadística tome muy pocos valores distintos, incidiendo de una manera considerable el estudio de las repeticiones de cada valor. 3. Que se hayan hechos muchas observaciones y la variable estadística tome muchos valores distintos. Los dos primeros casos caerán dentro del estudio de una variable estadística discreta, mientras que en el caso tercero, trataremos de agrupar los valores de la variable estadística en intervalos adecuadamente elegidos para no perder mucha información, lo cual va a suponer una simplificación en nuestro trabajo. A la diferencia entre el extremo superior y el extremo inferior de cada intervalo la llamaremos amplitud del intervalo. Por comodidad, los intervalos de amplitud constante son los más aconsejables, salvo que las condiciones específicas del problema no lo aconsejen. Los intervalos de clase suelen ser semiabiertos y se tomarán tantos intervalos solapados como sean necesarios para recubrir todo el recorrido de la variable. Definimos la marca de clase como el punto medio de cada intervalo. Es, en definitiva, el valor que nos representa la información que contiene un intervalo. Tabla de frecuencias de una variable agrupada en intervalos intervalos marcas de clase n i f i i F i (a 0, a 1 ] x 1 n 1 f 1 1 F 1 (a 1, a 2 ] x 2 n 2 f 2 2 F (a k 1, a k ] x k n k f k k F k REPRESETACIOES GRÁFICAS Para representar por medio de un gráfico los datos observados en una población, deben tenerse en cuenta los siguientes puntos: Las gráficas deben explicarse por sí mismas.los títulos de pie deben dar información sobre los sujetos a estudio y la materia objeto de experimentación, qué observaciones se han efectuado y las restricciones que se han impuesto. Se deberán indicar las unidades de escala de los ejes. Deberán dar una visión general del conjunto de datos. o deberán abarcar mucha información en un mismo gráfico. Entre los tipos de gráficas que representan variables cualitativas están los diagramas de sectores y los diagramas de rectángulos. Para las variables cuantitativas, debido a a que las modalidades son números, las representaciones se realizan sobre los ejes de coordenadas, aunque puede resultar necesario que se tomen distintas escalas. Los más representativos son los diagramas de barras, para variables discretas, que consisten en trazar para cada valor del carácter, barras verticales de longitud la frecuencia absoluta o relativa asociada a cada valor. Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 2

3 Para variables continuas, el más utilizado es el histograma que es similar al diagrama de barras,pero como las modalidades son intervalos, se representan rectángulos cuyas áreas son proporcionales (o igual) a la frecuencia absoluta o relativa de cada clase. Cuando la amplitud de clase es la misma para cada intervalo, es frecuente tomar rectángulos cuya altura coincide con la frecuencia absoluta o relativa. Uniendo los puntos medios del lado superior de cada rectángulo, se obtienen los llamados polígonos de frecuencia. MEDIDAS DE POSICIÓ A veces es conveniente reducir la información obtenida a un solo valor o a un número pequeño de valores para facilitar la comparación entre las distintas muestras o poblaciones. Estos valores, que de alguna forma centralizan la información reciben el nombre de medidas de posición, de tendencia central o de posición central. Media: Sea X una variable estadística que toma valores distintos {x 1, x 2,..., x k } con frecuencias absolutas {n 1, n 2,..., n k } siendo n n i =. Se define la media como la suma ponderada de los valores de la variable por sus frecuencias relativas: X = x i f i = x i n i Para calcular la media de una variable continua, se realiza la suma ponderada de las marcas de clase por la frecuencia relativa asociada a cada clase. Mediana: es el valor de la variable que deja a su derecha y a su izquierda el cincuenta por ciento de la población. Se denota por M e (X). Si, debido al tamaño de la población,, se tienen las observaciones sin agrupar en una tabla de frecuencias, la mediana será: para impar, la modalidad que se encuentra en la mitad del conjunto de datos ordenados si es par, el punto medio de los dos valores centrales. Cuando los datos están organizados en una tabla de frecuencias, se divide el número de observaciones entre 2 y si /2 no se encuentra en la tabla de frecuencias absolutas acumuladas, estará comprendido entre dos números de la citada tabla, con lo cual la mediana será aquel valor de la variable que corresponde al mayor; si el valor /2 está en la columnas de las i es que coincide con la frecuencia absoluta acumulada para algún valor x j, en este caso, se toma el punto medio del intervalo, es decir M e = x j + x j+1. 2 Para variables estadísticas continuas, se divide el número de observaciones entre 2 y si /2 no se encuentra en la tabla de frecuencias absolutas acumuladas estará comprendido entre dos valores j y j+1 de la citada tabla, que corresponderán a las frecuencias absolutas acumuladas de dos intervalos [a j 1, a j ) y [a j, a j+1 ) respectivamente, con lo cual la mediana se va a encontrar en el intervalo [a j, a j+1 ), al que se denomina intervalo mediano. Es frecuente tomar como mediana la marca de clase del intervalo mediano. Si el valor /2 está en la columnas de las i es que coincide con la frecuencia absoluta acumulada de un cierto intervalo de clase [a j, a j+1 ) y, por tanto, la mediana será el extremo superior del mismo. Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 3

4 Moda: es el valor de la variable que tiene máxima frecuencia. La moda no tiene por qué ser única. Cuando la variable es continua, hablaremos de intervalo modal. Se denota por M d o Mod(X). Cuartiles: se definen los cuartiles como tres valores de la variable que dividen las observaciones en cuatro partes iguales. El primer cuartil es el valor que deja la cuarta parte de las observaciones menores o iguales a él y las tres cuartas partes superiores a él. Para su cálculo se hace el mismo razonamiento que en el cálculo de la mediana, pero considerando /4. El segundo cuartil es la mediana y el tercer cuartil es el valor que deja las tres cuartas partes de las observaciones menores o iguales a él y la cuarta parte superior a él. Para su cálculo se hace el mismo razonamiento que en el cálculo de la mediana, pero considerando 3/4. Deciles: se define el decil K-ésimo como el valor de la variable que deja inferiores o iguales a él las K/10 partes de las observaciones. Los denotamos por D k. Centiles o percentiles: se define el percentil K-ésimo como el valor de la variable que deja inferiores o iguales a él las K/100 partes de las observaciones. Los denotamos por P k. MEDIDAS DE DISPERSIÓ La media aritmética se emplea como valor representativo de la población, sin embargo, según la dispersión de los datos, la representa mejor o peor. Si las modalidades de la variable están todas próximas a la media (y, por tanto, próximas entre sí) ésta nos dará una idea bastante aproximada de los valores que toma la variable, mientras que si los datos están muy dispersos (o con que haya uno solo que se aleje de todos los demás), la media no será un buen representante del colectivo de modalidades. El problema que se plantea es encontrar una medida de la dispersión de los datos respecto de la media. Sea X una variable estadística que toma valores distintos {x 1, x 2,..., x k } con frecuencias absolutas {n 1, n 2,..., n k }. Se puede pensar en definir la dispersión de cada modalidad respecto de la media y sumar: (x i X)n i = (x 1 X)n 1 + (x 2 X)n (x k X)n k = nx nx = 0 Ésto ocurre porque las desviaciones por exceso y por defecto respecto de la media se van compensando unas con otras al sumar. Para evitar ésto, se pueden elevar al cuadrado las desviaciones (de esta forma se consigue que todas sean positivas) y se promedia con el tamaño de la población. Varianza: k σx 2 (x i X) 2 n k i x 2 i n i = = X 2 Desviación típica: es la raíz cuadrada positiva de la varianza de la variable. Se designa por σ X. Coeficiente de variación: es el cociente entre la desviación típica y la media. CV (X) = σ X X La media, como promedio de un conjunto de datos, tiene la misma unidad de medida que éstos. La varianza estará expresada en las unidades de los datos al cuadrado, mientras que Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 4

5 las desviación típica tiene las mismas unidades que los datos y la media. Cuando se trata de comparar la dispersión de variables expresadas en distintas medidas se puede utilizar el coeficiente de variación, que se suele expresar en %, ya que no tiene unidades. Para la comparación de las modalidades de dos variables distintas se utiliza la variable tipificada que mide la desviación de la variable respecto de la media en términos de la desviación típica. Dada una variable estadística X que toma valores {x 1, x 2,..., x k } com media X y desviación típica σ, se define la variable tipificada Z = X X σ X Rango intercuartílico: es la diferencia entre el cuartil de tercer orden y el de primer orden: R = Q 3 Q 1 Momentos centrales (respecto de la media): Se define el momento central de orden r por µ r = (x i X) r f i Obsérvese que µ 0 = 1, µ 1 = 0 y µ 2 coincide con la varianza. Momentos no centrales (respecto al origen): Se define el momento no central de orden r por m r = x r i f i Obsérvese que m 0 = 1, m 1 = X y que m 2 = σ 2 X + X 2. MEDIDAS DE ASIMETRÍA Y APUTAMIETO Diremos que una distribución de frecuencias es simétrica cuando valores de la variable equidistantes de un valor máximo central tienen las mismas frecuencias. Es importante destacar en este caso X = M e = M d. Se denominan distribuciones asimétricas a aquellas distribuciones que no son simétricas. La asimetría puede presentarse a la derecha o a la izquierda. Coeficiente de asimetría de Pearson A P = X M d σ X Si A P > 0, la distribución es asimétrica a la derecha y si A P < 0 es asimétrica a la izquierda. Coeficiente de asimetría de Fisher A F = γ 1 = µ 3 σ 3 X Si A F > 0, la distribución es asimétrica a la derecha y si A F < 0 es asimétrica a la izquierda. Si A P = 0 = A F, la distribución es simétrica. Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 5

6 Coeficiente de apuntamiento o curtosis: γ 2 = µ 4 σ 4 X Este coeficiente indica cuál es el apuntamiento de forma de la distribución, comparándola con la campana de Gauss (distribución normal). Si γ 2 > 3, tiene más apuntamiento que la normal (leptocúrtica). Si γ 2 = 3, tiene igual apuntamiento que la normal (mesocúrtica). Si γ 2 < 3, tiene menos apuntamiento que la normal (platicúrtica). VARIABLES ESTADÍSTICAS BIDIMESIOALES En esta sección se considerarán aquellas situaciones en las que se realiza la observación simultánea de dos caracteres en el individuo, obteniéndose, por tanto, pares de resultados. Por ejemplo, observar en una persona su peso y su edad. Los dos caracteres observados no tienen por qué ser de la misma clase. Así, se pueden presentar dos caracteres cualitativos, dos cuantitativos o uno cualitativo y otro cuantitativo. En el caso de dos caracteres cuantitativos las variables que representan sus valores pueden ser ambas discretas, ambas continuas o una discreta y otra continua. Se considera una población con individuos descrita por dos caracteres: X con modalidades {x 1, x 2,..., x k } Y con modalidades {y 1, y 2,..., y p } En estos casos, las modalidades son pares (x i, y j ) para i {1, 2,..., k}, j {1, 2,..., p}. Se define la frecuencia absoluta asociada al par (x i, y j ), n ij, como el número de elementos de la población que tienen la modalidad x i de X e y j de Y. Las frecuencias relativas se definen como en el caso de una sola variable f ij = n ij. Las tablas estadísticas correspondientes a una variable bidimensional son de la forma X\Y y 1 y 2 y p x 1 n 11 n 12 n 1p x 2 n 21 n 22 n 2p..... x k n k1 n k2 n kp Distribuciones marginales La distribución marginal de X viene dada por {x i, n i. } k siendo n i. el número total de individuos que poseen la modalidad x i de X, independientemente de la modalidad de Y que posean, a la que se denomina frecuencia marginal absoluta asociada a la modalidad x i de X.Es decir, p n i. = n ij j=1 Se define la frecuencia relativa marginal como el cociente f i. = n i. Análogamente, se define la distribución marginal de Y con las frecuencias marginales absolutas n.j y la relativas f.j. Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 6

7 Para las distribuciones marginales se puede determinar (como ya se vió en el epígrafe anterior de variables estadísticas unidimensionales) cualquier medida de centralización y dispersión. Por ejemplo, se definen las medias marginales como X = k,p x i f ij = x i f i. i,j=1 y las varianzas marginales por Y = k,p p y j f ij = y j f.j i,j=1 j=1 σx 2 k,p = (x i X) 2 f ij = (x i X) 2 f i. i,j=1 σy 2 k,p p = (y j Y ) 2 f ij = (y j Y ) 2 f.j i,j=1 j=1 Distribuciones condicionadas La distribución de X cuando Y = y j, que se denota por X Y = y j, viene dada por {x i, n j i } k siendo n j i el número de individuos que poseen la modalidad x i de X e y j de Y, es decir, la misma n ij. Se construyen tablas de la forma X x 1 x 2. x k La frecuencia relativa de x i condicionada a que Y = y j es la proporción de individuos que presentan la modalidad x i, entre los que presentan la modalidad y j de Y, O sobre el total de la población (ésta sería la frecuencia relativa marginal de x i ). Por tanto, n j i n 1j n 2j. n kj f j i = n ij n.j Obsérvese que si nos fijamos en la tabla de frecuencias correspondiente a la variable unidimensional de X Y = y j, para calcular las frecuencias relativas en dicha tabla, se hace lo habitual: dividir cada frecuencia absoluta entre la suma de todas ellas, que en este caso sería n 1j + n 2j + + n kj = n.j Análogamente, se construyen las tablas correspondientes a las distribuciones de la variable Y condicionadas a algún valor de X, Y X = x i. Como tablas estadísticas de variables unidimensionales que son, se les pueden calcular cualquiera de las medidas ya conocidas. Así, se definen las medias condicionadas por X j = x i f j i Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 7

8 es decir que es la media de la distribución X Y = y j (luego se pueden definir p medias condicionadas). Análogamente, se definen k medias condicionadas, para cada valor de X: p Y i = y j fj i j=1 Se definen las varianzas condicionadas como las varianzas de las variables condicionadas: p σx 2 j = (x i X j ) 2 f j i σy 2 i = (y j Y i ) 2 fj i j=1 ASOCIACIÓ ESTADÍSTICA DE DOS VARIABLES Una de las aspiraciones de la Ciencia ha sido establecer relaciones entre diferentes variables, para, por ejemplo poder predecir el valor de una de ellas, conociendo el valor de la otra. A veces estas relaciones son deterministas (por ejemplo, se puede determinar con exactitud el tiempo que empleará un móvil en recorrer cierta distancia si se sabe la velocidad que lleva) pero en multitud de ocasiones las magnitudes no guardan una relación causal a pesar de que guardan una fuerte conexión. Por ejemplo, el coeficiente de inteligencia, medido con los tests adecuados, se relaciona fuertemente con el rendimiento escolar en Matemáticas. Una parte importante de la Estadística es el análisis de la relación que puede establecerse entre distintas variables, según un conjunto de datos observados. Los distintos grados de asociación pueden ir desde la total independencia hasta una relación tan estrecha que se pueda considerar determinista. Independencia estadística Decimos que una variable X es estadísticamente independiente del carácter Y cuando la frecuencia relativa de x i no depende del valor y j, que condiciona. Es lo mismo que decir que f j i = f i. para todo i, j. En este caso, la frecuencia relativa conjunta se puede expresar como el producto de las marginales. Se puede definir el concepto análogo de ser Y independiente de X, pero se deduce de forma inmediata que son conceptos equivalentes. Dependencia funcional Se dice que X depende funcionalmente de Y si para cada modalidad y j de Y existe una única modalidad x i de X. Si se mira la tabla correspondiente a la variable bidimensional, lo que ocurre es que en cada columna sólo hay un valor no nulo para X. Ésto siempre se da cuando ambas variables están relacionadas por una expresión matemática y, por tanto, existe una relación determinista entre ellas. Covarianza Parece intuitivo pensar que para cuantificar el tipo de asociación estadística entre dos variables a partir de los datos observados en una población, será necesario comparar la variación conjunta de las dos. Ésto supone tener en cuenta los valores que toman cada una de ellas individuo a individuo de la población estudiada. Cuando según los datos registrados, se observa que el crecimiento en los valores de una variable parece favorecer el crecimiento de la otra (por ejemplo, un coeficiente intelectual alto suele llevar a un rendimiento alto en Matemáticas, aunque no se excluye que una persona de coeficiente intelectual mayor que otra tenga un rendimiento más bajo en Matemáticas), se habla de asociación Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 8

9 positiva. Mientras que en caso contrario, es decir, si el crecimiento de una variable conduce a una disminución de la otra (por ejemplo, a mayor número de depredadores en un ecosistema, menor número de presas) se habla de asociación negativa. Para cuantificar la variación conjunta de dos variables, lo que podría denominarse covariación, se mide la desviación respecto de la media que ambas variables presentan en cada individuo de la población. De esta forma, para variables asociadas positivamente, cuando una variable presente un valor grande (esto quiere decir un valor alejado de la media), la otra tenderá a tomar un valor grande, mientras que si la asociación es negativa, ocurrirá al revés. Así, una estimación de la asociación entre variables la proporciona la covarianza: p p σ XY = (x i X)(y j Y )f ij = x i y j f ij X Y j=1 j=1 Obsérvese que si las variables están asociadas positivamente las diferencias (x i X) e (y j Y ) tenderán a tener con frecuencia el mismo signo, mientras que si están asociadas de manera negativa, las diferencias serán con frecuencia de signo contrario, dando lugar a un valor negativo de la covarianza. Por tanto, el signo de la covarianza puede darnos una idea de la asociación entre variables. REGRESIÓ Y CORRELACIÓ Se considera una población de individuos en la cual se estudian dos caracteres cuantitativos X e Y. Supongamos que se observa en cada individuo de la población ambas variables, obteniéndose pares de valores {(x i, y i )}. Si el tamaño de la población fuera elevado y las modalidades de ambas variables se repitieran, se organizarían los datos en una tabla bidimensional de frecuencias, considerando entonces pares {(x i, y j )} k,p i,j=1 con frecuencias relativas asociadas {f ij } k,p i,j=1. En cualquier caso, si se representa en unos ejes cartesianos los valores que toma la variable, se obtiene lo que se conoce como nube de puntos o diagrama de dispersión. El problema general de regresión se plantea en el intento de ajustar una función de ecuación conocida a la nube en cuestión, con el interés de poder obtener una estimación aproximada de una de las variables a partir de la otra. aturalmente que entre todas las funciones que se pueden elegir para ajustarlas a la nube de puntos hemos de seleccionar la óptima, esto es, la que mejor encaje sobre los puntos que tenemos, para lo cual recurriremos al método de los mínimos cuadrados. La función que pretendemos obtener será una línea que llamaremos línea de regresión, cuya ecuación puede ser una recta, una función exponencial, una parábola, una función cúbica o polinómica de cualquier grado, una hipérbola, etc. La regresión adoptará un nombre distinto, dependiendo de la función elegida para el ajuste. Regresión lineal mínimo cuadrática En el supuesto de que sea una recta la función que se quiera ajustar a la nube de puntos, estaremos ante un problema de regresión lineal y distinguiremos entre 1. Recta de regresión de Y sobre X 2. Recta de regresión de X sobre Y Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 9

10 Si se pretende hacer una estimación de los valores que toma Y, sabiendo el valor que toma X, entonces, la ecuación de la recta será y = a + bx y lo que se tiene que hacer es estimar los parámetros a y b, partiendo de los datos observados. Por simplicidad, se considera una variable bidimensional (X, Y ) que al valor observado x i le corresponde un valor observado y i. Llamaremos valor teórico y i al que le correspondería en la recta como función, es decir a+bx i = y i. El método de los mínimos cuadrados consiste en tomar las distancias al cuadrado (para que no se puedan contrarrestar los signos positivos y negativos) entre los valores teóricos y los observados y hacer mínima su suma. Hemos de hacer, por tanto, mínima la expresión F (a, b) = (y i (a + bx i )) 2 Para ello hay que derivar la función F respecto de las variables a y b e igualar a cero. De esta forma se obtiene el siguiente sistema de dos ecuaciones, cuyas incógnitas son a y b: y i = a + b x i x i y i = a x i + b x 2 i que al resolverse proporciona los valores buscados, que son a = Y σ XY σ 2 X X b = σ XY σ 2 X Se obtiene por tanto,la recta y Y = σ XY (x X) σx 2 a la que se denomina recta de regresión de Y sobre X ajustada mediante el método de mínimos cuadrados y se representa por R Y X. Análogamente, se puede calcular por el mismo método, la recta de regresión de X Y que permite hacer una estimación del valor que toma X, sabiendo el valor de Y. Se designa por R X Y y es x X = σ XY σ 2 Y Ajustes que se reducen al caso lineal (y Y ) Supongamos que por la forma de la nube de puntos, se piensa que la línea que mejor encaja es una función polinómica de la forma y = a + bx n. uestro objetivo es, de nuevo, estimar los parámetros a y b. Para ello, podemos ajustar una recta de regresión de Y sobre X n, es decir, se calculan los correspondientes coeficientes a y b, utilizando como datos los pares de valores {(x n i, y i )}. En determinados experimentos, en su mayoría biológicos, la dependencia entre las variables X e Y es de forma exponencial. En este caso interesa ajustar a la nube de puntos la función y = K 1 A K 2x, donde A nos viene dado (en particular, puede ser el número e), y los parámetros a estimar serían K 1 y K 2. Si se toman logaritmos neperianos se obtiene Lny = LnK 1 + K 2 xlna Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 10

11 De esta forma, llamando y = Lny, α = LnK 1 y β = K 2 LnA se tiene y = α + βx con lo que el problema se nos ha convertido en uno de regresión lineal, puesto que la función y = α+βx es una recta. Procediendo como ya se ha descrito con las parejas de valores {(x i, Lny i )} se obtienen α y β. Por último sólo resta deshacer el cambio, de manera que K 1 = e α y K 2 = β LnA. Puede ocurrir que en lugar de fijar la base de la función exponencial, sea necesario buscarla para que el ajuste sea bueno. Es decir, si se pretende ajustar una función de la forma y = Ka x, donde lo que se pretende encontrar son los valores de K y a apropiados, también podemos aprovechar el caso lineal. Tomando logaritmos neperianos, Lny = LnK + xlna Por tanto, si se calcula la recta de regresión de Y = Lny sobre X, con los pares de valores {(x i, Lny i )}, llamémosle y = α + βx, entonces, deshaciendo el cambio anterior, se obtiene K = e α y a = e β Si nos interesa ajustar una función del tipo y = K 1 x K 2, introducimos logaritmos neperianos en ambos miembros Lny = LnK 1 + K 2 Lnx y = α + βx Se ajusta una recta de regresión Y X con los pares de valores {(Lnx i, Lny i )} y se deshace después el cambio, de manera que K 1 = e α y K 2 = β. Para ajustes hiperbólicos, esto es, la línea de regresión es una hipérbola de ecuación y = 1 a + bx, se ajusta un recta y = α + βx para los pares de valores {(x i, y i = 1 y i ), de forma que Correlación a = α y b = β. Una vez resuelto el problema de cómo ajustar una curva a la nube de puntos, se pretende ahora determinar con qué precisión se describe la relación entre las dos variables y qué tipo de curva es la más adecuada. Así como la teoría de la regresión estudia la posible predicción de los valores de una variable a partir de otra, la correlación estudia el tipo de dependencia que existe entre ambas variables. Se considera una variable bidimensional (X, Y ) que al valor observado x i le corresponde un valor observado y i. Para cada i, llamaremos valor teórico yi al que le correspondería a x i en la función que ajustamos, es decir f(x i ) = yi. Recordemos que el método de los mínimos cuadrados se basa en buscar los parámetros necesarios para minimizar el valor de (y i yi ) 2 Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 11

12 Por tanto, si se ajustan dos curvas de regresión distintas, y = f(x) e y = g(x) a una misma nube de puntos, la curva que mejor describa la relación entre ambas variables será aquélla para la que el valor de (y i yi ) 2 sea más pequeño. Se denomina varianza residual a V r = (y i yi ) 2 Por tanto, a menor varianza residual, mejor es el ajuste. Obsérvese que la varianza residual es cero, cuando cada y i = y i, es decir, el ajuste es perfecto, ya que todos los puntos se encuentran sobre la curva de regresión. Según acabámos de ver, la varianza residual se emplea para comparar dos curvas de regresión. Vamos ahora a dar una medida que nos permita conocer la bondad de una recta de regresión. Para el caso en que el ajuste sea lineal, se define el coeficiente de correlación lineal como ρ = σ XY σ X σ Y La relación entre la varianza residual para rectas de regresión y este coeficiente viene dada por por tanto V r = σ 2 Y (1 ρ 2 ) 0 ρ 2 = 1 V r σ 2 Y Obsérvese que cuando ρ 2 = 1, es decir para valores extremos ρ = ±1, se tiene que la varianza residual es cero, por tanto el ajuste es perfecto. En tal caso, se dice que X e Y están correladas de forma exacta. Cuando ρ 2 = 0, la varianza residual toma el mayor valor posible y se dice que las variables X e Y están incorreladas. Cuanto más cercano esté ρ a 1 o 1 (ρ 2 cercano a 1), mejor es el ajuste lineal. Para ajustes no lineales, se puede considerar el coeficiente de determinación, definido como 1 R 2 = 1 V r σ 2 Y 1 Cuánto más próximo a 1 esté el coeficiente de determinación, mejor es el ajuste, puesto que para ajustes perfectos (varianza residual cero) el coeficiente de determinación vale 1. Para ciertos modelos de curvas de regresión, entre las que se incluyen las de tipo polinómico, se puede demostrar que el coeficiente de determinación es un número comprendido entre 0 y 1. De hecho, obsérvese que por la propia definición, el coeficiente de determinación para una recta de regresión coincide con el cuadrado del coeficiente de correlación lineal, es decir, R 2 = ρ 2. Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 12

TEMA 1: ESTADISTICA DESCRIPTIVA

TEMA 1: ESTADISTICA DESCRIPTIVA ESTADÍSTICA, CURSO 008 009 1 TEMA 1: ESTADISTICA DESCRIPTIVA 1 FUDAMETOS 11 VARIABLES ESTADISTICAS Población: conjunto completo de elementos, con alguna característica común, objeto del estudio estadístico

Más detalles

U.D.1: Análisis estadístico de una variable Consideraciones iniciales: Propuesta: 1.1 Distribución de frecuencias. Variables Cualitativas: Ejemplo

U.D.1: Análisis estadístico de una variable Consideraciones iniciales: Propuesta: 1.1 Distribución de frecuencias. Variables Cualitativas: Ejemplo U.D.1: Análisis estadístico de una variable Consideraciones iniciales: - Población: Es el conjunto de todos los elementos que cumplen una determinada característica. Ej.: Alumnos del colegio. - Individuo:

Más detalles

FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- BLOQUE ESTADÍSTICA: ESTADÍSTICA VARIABLE UNIDIMENSIONAL. Estadística variable unidimensional

FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- BLOQUE ESTADÍSTICA: ESTADÍSTICA VARIABLE UNIDIMENSIONAL. Estadística variable unidimensional FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- Estadística variable unidimensional 1. Conceptos de Estadística 2. Distribución de frecuencias 2.1. Tablas de valores con variables continuas 3. Parámetros

Más detalles

3 ANALISIS DESCRIPTIVO DE LOS DATOS

3 ANALISIS DESCRIPTIVO DE LOS DATOS 3 ANALISIS DESCRIPTIVO DE LOS DATOS 3.1 La tabulación de los datos 3.1.1 Tabla de distribución de frecuencias. 3.1.2 El histograma. 3.2 Medidas de tendencia central 3.2.1 La media. 3.2.2 La mediana. 3.2.3

Más detalles

Estadística Inferencial. Estadística Descriptiva

Estadística Inferencial. Estadística Descriptiva INTRODUCCIÓN Estadística: Ciencia que trata sobre la teoría y aplicación de métodos para coleccionar, representar, resumir y analizar datos, así como realizar inferencias a partir de ellos. Recogida y

Más detalles

ESTADÍSTICA UNIDIMENSIONAL

ESTADÍSTICA UNIDIMENSIONAL ESTADÍSTICA UNIDIMENSIONAL DEFINICIÓN DE VARIABLE Una variable estadística es cada una de las características o cualidades que poseen los individuos de una población. TIPOS DE VARIABLE ESTADÍSTICAS Ø Variable

Más detalles

ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA Definición de Estadística: La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer

Más detalles

Variables estadísticas bidimensionales

Variables estadísticas bidimensionales Variables estadísticas bidimensionales BEITO J GOZÁLEZ RODRÍGUEZ (bjglez@ulles) DOMIGO HERÁDEZ ABREU (dhabreu@ulles) MATEO M JIMÉEZ PAIZ (mjimenez@ulles) M ISABEL MARRERO RODRÍGUEZ (imarrero@ulles) ALEJADRO

Más detalles

Tema 3: Estadística Descriptiva

Tema 3: Estadística Descriptiva Tema 3: Estadística Descriptiva Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 3: Estadística Descriptiva Curso 2008-2009 1 / 27 Índice

Más detalles

1, 2, 2, 3, 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 2, 1, 1, 4, 1

1, 2, 2, 3, 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 2, 1, 1, 4, 1 8 Estadística 81 Distribuciones unidimensionales Tablas de frecuencias En este tema nos ocuparemos del tratamiento de datos estadísticos uestro objeto de estudio será pues el valor de una cierta variable

Más detalles

ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL. 30/09/2004 Proyecto MaMaEuSch 1

ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL. 30/09/2004 Proyecto MaMaEuSch 1 ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL 0/09/2004 Proyecto MaMaEuSch Estadística Ciencia que trata sobre los métodos científicos para: Recoger, organizar, resumir y analizar datos Sacar conclusiones relevantes

Más detalles

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2 PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2 Preg. 1. Para comparar la variabilidad relativa de la tensión arterial diastólica y el nivel de colesterol en sangre de una serie de individuos, utilizamos

Más detalles

Un estudio estadístico consta de las siguientes fases: Recogida de datos. Organización y representación de datos. Análisis de datos.

Un estudio estadístico consta de las siguientes fases: Recogida de datos. Organización y representación de datos. Análisis de datos. La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un estudio estadístico consta de las siguientes

Más detalles

Estadística. Análisis de datos.

Estadística. Análisis de datos. Estadística Definición de Estadística La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un

Más detalles

Tema 9: Estadística en dos variables (bidimensional)

Tema 9: Estadística en dos variables (bidimensional) Tema 9: Estadística en dos variables (bidimensional) 1. Distribución de frecuencias bidimensional En el tema anterior se han estudiado las distribuciones unidimensionales obtenidas al observar sólo un

Más detalles

Tema 1: Estadística descriptiva. Probabilidad y Estadística (Ing. Informática). Tema 1: Estadística descriptiva 1

Tema 1: Estadística descriptiva. Probabilidad y Estadística (Ing. Informática). Tema 1: Estadística descriptiva 1 Tema 1: Estadística descriptiva Probabilidad y Estadística (Ing. Informática). Tema 1: Estadística descriptiva 1 Introducción Objetivo: estudiar una característica o variable en una población. Ejemplos:

Más detalles

Estadística para el análisis de los Mercados S2_A1.1_LECV1

Estadística para el análisis de los Mercados S2_A1.1_LECV1 5. Parámetros estadísticos. 5.1. Parámetros de centralización. Estos parámetros nos indican en torno a que puntos se encuentran los valores de la variable cuantitativa en estudio. Es la forma de representar

Más detalles

D I S T R I B U C I O N E S B I D I M E N S I O N A L E S

D I S T R I B U C I O N E S B I D I M E N S I O N A L E S D I S T R I B U C I O N E S B I D I M E N S I O N A L E S 1 INTRODUCCIÓN: Variables estadísticas bidimensionales En numerosas ocasiones interesa estudiar simultáneamente dos (o más) caracteres de una población

Más detalles

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada. ANEXO 1. CONCEPTOS BÁSICOS Este anexo contiene información que complementa el entendimiento de la tesis presentada. Aquí se exponen técnicas de cálculo que son utilizados en los procedimientos de los modelos

Más detalles

Tema 2: Estadísticos. Bioestadística. U. Málaga. Tema 2: Estadísticos 1

Tema 2: Estadísticos. Bioestadística. U. Málaga. Tema 2: Estadísticos 1 Bioestadística Tema 2: Estadísticos Tema 2: Estadísticos 1 Parámetros y estadísticos Parámetro: Es una cantidad numérica calculada sobre una población La altura media de los individuos de un país La idea

Más detalles

478 Índice alfabético

478 Índice alfabético Índice alfabético Símbolos A, suceso contrario de A, 187 A B, diferencia de los sucesos A y B, 188 A/B, suceso A condicionado por el suceso B, 194 A B, intersección de los sucesos A y B, 188 A B, unión

Más detalles

Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va

Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va Jesús Fernández Fernández Carmen María Sordo García DEPARTAMENTO DE MATEMÁTICA APLICADA Y CIENCIAS DE LA COMPUTACIÓN UNIVERSIDAD DE CANTABRIA

Más detalles

Módulo de Estadística

Módulo de Estadística Módulo de Estadística Tema 2: Estadística descriptiva Tema 2: Estadísticos 1 Medidas La finalidad de las medidas de posición o tendencia central (centralización) es encontrar unos valores que sinteticen

Más detalles

ESTADÍSTICA. Individuo. Es cada uno de los elementos que forman la población o muestra.

ESTADÍSTICA. Individuo. Es cada uno de los elementos que forman la población o muestra. ESTADÍSTICA La estadística tiene por objeto el desarrollo de técnicas para el conocimiento numérico de un conjunto de datos empíricos (recogidos mediante experimentos o encuestas). Según el colectivo a

Más detalles

Tema 3: Análisis de datos bivariantes

Tema 3: Análisis de datos bivariantes Tema 3: Análisis de datos bivariantes 1 Contenidos 3.1 Tablas de doble entrada. Datos bivariantes. Estructura de la tabla de doble entrada. Distribuciones de frecuencias marginales. Distribución conjunta

Más detalles

Tema 1: Análisis de datos univariantes

Tema 1: Análisis de datos univariantes Tema 1: Análisis de datos univariantes 1 En este tema: Conceptos fundamentales: muestra y población, variables estadísticas. Variables cualitativas o cuantitativas discretas: Distribución de frecuencias

Más detalles

Cuaderno de actividades 1º

Cuaderno de actividades 1º Cuaderno de actividades 1º 1 ITRODUCCIÓ: Variables estadísticas bidimensionales En numerosas ocasiones interesa estudiar simultáneamente dos (o más) caracteres de una población En el caso de dos (o más)

Más detalles

Guía de Matemática Cuarto Medio

Guía de Matemática Cuarto Medio Guía de Matemática Cuarto Medio Aprendizaje Esperado: 1. Conocen distintas maneras de organizar y presentar información incluyendo el cálculo de algunos indicadores estadísticos, la elaboración de tablas

Más detalles

Regresión y Correlación

Regresión y Correlación Relación de problemas 4 Regresión y Correlación 1. El departamento comercial de una empresa se plantea si resultan rentables los gastos en publicidad de un producto. Los datos de los que dispone son: Beneficios

Más detalles

ANÁLISIS DE DATOS UNIDIMENSIONALES

ANÁLISIS DE DATOS UNIDIMENSIONALES ANÁLISIS DE DATOS UNIDIMENSIONALES TABLAS DE FRECUENCIAS Y REPRESENTACIONES GRÁFICAS MEDIDAS DE POSICIÓN MEDIDAS DE TENDENCIA CENTRAL MEDIA ARITMÉTICA OTRAS MEDIAS: GEOMÉTRICA.ARMÓNICA.MEDIA GENERAL MEDIANA

Más detalles

CUESTIONES Y PROBLEMAS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES PROPUESTOS EN EXÁMENES

CUESTIONES Y PROBLEMAS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES PROPUESTOS EN EXÁMENES TUTORÍA DE INTRODUCCIÓN A LA ESTADÍSTICA (º A.D.E.) CUESTIONES Y PROBLEMAS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES PROPUESTOS EN EXÁMENES 1º) Qué ocurre cuando r = 1: a) Los valores teóricos no

Más detalles

UNIDAD 7 Medidas de dispersión

UNIDAD 7 Medidas de dispersión UNIDAD 7 Medidas de dispersión UNIDAD 7 MEDIDAS DE DISPERSIÓN Al calcular un promedio, por ejemplo la media aritmética no sabemos su representatividad para ese conjunto de datos. La información suministrada

Más detalles

Libro de ejercicios de refuerzo de matemáticas. María de la Rosa Sánchez

Libro de ejercicios de refuerzo de matemáticas. María de la Rosa Sánchez Libro de ejercicios de refuerzo de matemáticas María de la Rosa Sánchez Estadística bidimensional Tema 0 2 Índice general 1. Estadística unidimensional 5 2. Estadística bidimensional 11 3 Tema 1 Estadística

Más detalles

Tema 5. Variables Aleatorias

Tema 5. Variables Aleatorias Tema 5. Variables Aleatorias Presentación y Objetivos. En este tema se estudia el concepto básico de Variable Aleatoria así como diversas funciones fundamentales en su desarrollo. Es un concepto clave,

Más detalles

En este caso la variable X es el n de hijos, es por tanto una variable discreta. Veamos todas las frecuencias.

En este caso la variable X es el n de hijos, es por tanto una variable discreta. Veamos todas las frecuencias. ESTADÍSTICA DESCRIPTIVA Concepto v finalidad En los municipios existen unos censos de los ciudadanos con datos de su edad, sexo, residencia, trabajo, etc. Pero si se desea conocer, para lanzar un producto

Más detalles

Bioestadística: Estadística Descriptiva

Bioestadística: Estadística Descriptiva Bioestadística: M. González Departamento de Matemáticas. Universidad de Extremadura Bioestadística 1 2 Bioestadística 1 2 Coneptos Básicos ESTADÍSTICA Ciencia que estudia el conjunto de métodos y procedimientos

Más detalles

Análisis de datos y gestión n veterinaria. Tema 1 Estadística descriptiva. Prof. Dr. José Manuel Perea Muñoz

Análisis de datos y gestión n veterinaria. Tema 1 Estadística descriptiva. Prof. Dr. José Manuel Perea Muñoz Análisis de datos y gestión n veterinaria Tema 1 Estadística descriptiva Prof. Dr. José Manuel Perea Muñoz Departamento de Producción Animal Facultad de Veterinaria Universidad de Córdoba Córdoba, de Septiembre

Más detalles

Temas de Estadística Práctica

Temas de Estadística Práctica Temas de Estadística Práctica Antonio Roldán Martínez Proyecto http://www.hojamat.es/ Tema 2: Medidas de tipo paramétrico Resumen teórico Medidas de tipo paramétrico Medidas de tendencia central Medidas

Más detalles

UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO

UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO CENTRO UNIVERSITARIO UAEM ZUMPANGO LICENCIATURA EN TURISMO UNIDAD DE APRENDIZAJE: ESTADISTICA TEMA 1.5 : ESTADISTICA DESCRIPTIVA M. EN C. LUIS ENRIQUE KU MOO FECHA:

Más detalles

ESTADISTICA Y PROBABILIDAD ESTADÍSTICA

ESTADISTICA Y PROBABILIDAD ESTADÍSTICA ESTADÍSTICA La estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comprobaciones y sacar conclusiones. Un estudio estadístico consta

Más detalles

Cátedra: Estadística Técnica Facultad de Ingeniería UNCuyo. Índice D. Fernández & M. Guitart TABLA DE CONTENIDOS

Cátedra: Estadística Técnica Facultad de Ingeniería UNCuyo. Índice D. Fernández & M. Guitart TABLA DE CONTENIDOS Cátedra: TABLA DE CONTENIDOS INTRODUCCIÓN Qué es la Probabilidad? Qué es la Estadística? La evolución histórica de la Estadística Algunos conceptos imprescindibles Fuentes de datos Tipos de datos y escalas

Más detalles

+ f 2. + f 3. p i. =h i 100. F i. = f i. H i. = h i. P i. = p i

+ f 2. + f 3. p i. =h i 100. F i. = f i. H i. = h i. P i. = p i OCIOES de ESTADÍSTICA En las tablas estadísticas se pueden tabular, entre otros, los siguientes aspectos: La frecuencia absoluta ( f i ), es decir, el número de veces que aparece un determinado valor en

Más detalles

Tabla de frecuencias agrupando los datos Cuando hay muchos valores distintos, los agruparemos en intervalos (llamados clases) de la misma amplitud.

Tabla de frecuencias agrupando los datos Cuando hay muchos valores distintos, los agruparemos en intervalos (llamados clases) de la misma amplitud. 1. TABLAS Y GRÁFICOS ESTADÍSTICOS Estadística Es la ciencia que estudia conjunto de datos obtenidos de la realidad. Estos datos son interpretados mediante tablas, gráficas y otros parámetros tales como

Más detalles

TEMA IV PERCENTIL Y ESTADIGRAFOS DE POSICION

TEMA IV PERCENTIL Y ESTADIGRAFOS DE POSICION TEMA IV PERCENTIL Y ESTADIGRAFOS DE POSICION 1. Percentiles, cuartiles y deciies. 2. Estadígrafos de Posición. 3. Sesgo y curtosis o de pastel. Pictogramas. OBJETIVOS DE UNIDAD GENERALES. Que el futuro

Más detalles

Teoría de la decisión

Teoría de la decisión 1.- Un problema estadístico típico es reflejar la relación entre dos variables, a partir de una serie de Observaciones: Por ejemplo: * peso adulto altura / peso adulto k*altura * relación de la circunferencia

Más detalles

Part I. Variables aleatorias unidimensionales. Estadística I. Mario Francisco. Definición de variable aleatoria. Variables aleatorias discretas

Part I. Variables aleatorias unidimensionales. Estadística I. Mario Francisco. Definición de variable aleatoria. Variables aleatorias discretas Part I unidimensionales de s de s Definición Dado un experimento aleatorio, con espacio muestral asociado Ω, una es cualquier función, X, X : Ω R que asocia a cada suceso elemental un número real, verificando

Más detalles

CORRELACIÓN Y REGRESIÓN. Raúl David Katz

CORRELACIÓN Y REGRESIÓN. Raúl David Katz CORRELACIÓN Y REGRESIÓN Raúl David Katz 1 Correlación y regresión Introducción Hasta ahora hemos visto el modo de representar la distribución de frecuencias de los datos correspondientes a una variable

Más detalles

Medidas de variabilidad (dispersión)

Medidas de variabilidad (dispersión) Medidas de posición Las medidas de posición nos facilitan información sobre la serie de datos que estamos analizando. Estas medidas permiten conocer diversas características de esta serie de datos. Las

Más detalles

Tema 10: Introducción a los problemas de Asociación y Correlación

Tema 10: Introducción a los problemas de Asociación y Correlación Tema 10: Introducción a los problemas de Asociación y Correlación Estadística 4 o Curso Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 10: Asociación y Correlación

Más detalles

Guía de actividad Independiente No 5. Estadística Descriptiva. Nombre del estudiante: Fecha:

Guía de actividad Independiente No 5. Estadística Descriptiva. Nombre del estudiante: Fecha: Guía de actividad Independiente No 5. NOMBRE DE LA ASIGNATURA: Estadística Descriptiva TUTOR: Deivis Galván Cabrera Nombre del estudiante: Fecha: 1. Al comenzar el curso se pasó una encuesta a los alumnos

Más detalles

PROBABILIDAD. Unidad I Ordenamiento de la Información

PROBABILIDAD. Unidad I Ordenamiento de la Información 1 PROBABILIDAD Unidad I Ordenamiento de la Información 2 Captura de datos muestrales Conceptos básicos de la estadística 3 Población (o universo): Totalidad de elementos o cosas bajo consideración Muestra:

Más detalles

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua ESTADÍSTICA Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal Cuantitativa discreta continua DISTRIBUCIÓN DE FRECUENCIAS Frecuencia absoluta: fi Frecuencia relativa:

Más detalles

II. ORGANIZACIÓN N Y PRESENTACIÓN N DE DATOS

II. ORGANIZACIÓN N Y PRESENTACIÓN N DE DATOS UNIVERSIDAD INTERAMERICANA PARA EL DESARROLLO ORGANIZACIÓN N Y PRESENTACIÓN N DE DATOS Contenido II. ORGANIZACIÓN N Y PRESENTACIÓN N DE DATOS II. Tablas de frecuencia II. Gráficos: histograma, ojiva, columna,

Más detalles

Tema 7 : DATOS BIVARIADOS. CORRELACION Y REGRESION.

Tema 7 : DATOS BIVARIADOS. CORRELACION Y REGRESION. Tema 7 : DATOS BIVARIADOS. CORRELACION Y REGRESION. Distribuciones uni- y pluridimensionales. Hasta ahora se han estudiado los índices y representaciones de una sola variable por individuo. Son las distribuciones

Más detalles

Temas de Estadística Práctica Antonio Roldán Martínez

Temas de Estadística Práctica Antonio Roldán Martínez Temas de Estadística Práctica Antonio Roldán Martínez Proyecto http://www.hojamat.es/ Tema 3: Medidas típicas. Índices Resumen teórico Medidas típicas. Índices Clases de puntuaciones Índices de posición

Más detalles

Tema 6. Variables aleatorias continuas

Tema 6. Variables aleatorias continuas Tema 6. Variables aleatorias continuas Resumen del tema 6.1. Definición de variable aleatoria continua Identificación de una variable aleatoria continua X: es preciso conocer su función de densidad, f(x),

Más detalles

Distribuciones bidimensionales. Correlación.

Distribuciones bidimensionales. Correlación. Temas de Estadística Práctica Antonio Roldán Martínez Proyecto http://www.hojamat.es/ Tema 4: Distribuciones bidimensionales. Correlación. Resumen teórico Resumen teórico de los principales conceptos estadísticos

Más detalles

Apuntes y ejercicios de Estadística para 2º E.S.O

Apuntes y ejercicios de Estadística para 2º E.S.O Apuntes y ejercicios de Estadística para 2º E.S.O 1 Introducción La Estadística es la ciencia que se encarga de recoger, organizar, describir e interpretar datos referidos a distintos fenómenos para, posteriormente,

Más detalles

Estadística Descriptiva y Probabilidad FORMULARIO

Estadística Descriptiva y Probabilidad FORMULARIO Estadística Descriptiva y Probabilidad FORMULARIO Departament d Estadística i Investigació Operativa Universitat de València Angel Corberán Francisco Montes 2 3 Capítulo 1 Estadística Descriptiva 1.1.

Más detalles

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7) TEMA Nº 7 DISTRIBUCIONES CONTINUAS DE PROBABILIDAD OBJETIVOS DE APRENDIZAJE: Conocer las características de la distribución normal como distribución de probabilidad de una variable y la aproximación de

Más detalles

Estadística Inga Patricia Juárez, 2017 MEDIDAS DE TENDENCIA CENTRAL

Estadística Inga Patricia Juárez, 2017 MEDIDAS DE TENDENCIA CENTRAL MEDIDAS DE TENDENCIA CENTRAL Las medidas de tendencia central nos proporcionan la descripción significativa de un conjunto de observaciones. Como su nombre lo indica, son datos de una variable que tienden

Más detalles

El ejemplo: Una encuesta de opinión

El ejemplo: Una encuesta de opinión El ejemplo: Una encuesta de opinión Objetivos Lo más importante a la hora de planificar una encuesta es fijar los objetivos que queremos lograr. Se tiene un cuestionario ya diseñado y se desean analizar

Más detalles

TEMA 3 REGRESIÓN Y CORRELACIÓN

TEMA 3 REGRESIÓN Y CORRELACIÓN TEMA 3 REGRESIÓN Y CORRELACIÓN Regresión mínimo-cuadrática bidimensional Planteamiento del problema Dadas dos variables aleatorias X e Y definidas sobre un mismo espacio de probabilidad (asociadas a un

Más detalles

TEMA 7 EL MODELO DE LA CURVA NORMAL. CONCEPTO Y APLICACIONES

TEMA 7 EL MODELO DE LA CURVA NORMAL. CONCEPTO Y APLICACIONES TEMA 7 EL MODELO DE LA CURVA NORMAL. CONCEPTO Y APLICACIONES 1. Puntuaciones diferenciales y puntuaciones típicas 2. La curva normal 3. Cálculo de áreas bajo la curva normal 3.1. Caso 1: Cálculo del número

Más detalles

Estadís5ca. María Dolores Frías Domínguez Jesús Fernández Fernández Carmen María Sordo. Tema 2. Modelos de regresión

Estadís5ca. María Dolores Frías Domínguez Jesús Fernández Fernández Carmen María Sordo. Tema 2. Modelos de regresión Estadís5ca Tema 2. Modelos de regresión María Dolores Frías Domínguez Jesús Fernández Fernández Carmen María Sordo Departamento de Matemá.ca Aplicada y Ciencias de la Computación Este tema se publica bajo

Más detalles

X Y

X Y Capítulo 2 Distribuciones bivariantes Hasta ahora hemos estudiado herramientas que nos permiten describir las características de un único carácter Sin embargo, en muchos casos prácticos, es necesario estudiar

Más detalles

DISTRIBUCIONES DE PROBABILIDAD

DISTRIBUCIONES DE PROBABILIDAD DISTRIBUCIONES DE PROBABILIDAD VARIABLE ALEATORIA Una variable x valuada numéricamente varía o cambia, dependiendo del resultado particular del experimento que se mida. Por ejemplo, suponga que se tira

Más detalles

Estadística Descriptiva

Estadística Descriptiva Estadística Descriptiva 1 Qué veremos 1. OBJECTIVOS DEL CURSO. DEFINICIONES IMPORTANTES 2. TIPOS DE VARIABLES 3 5 1. Estadísticos de tendencia central 2. Estadísticos de posición 3. Estadísticos de variabilidad/dispersión

Más detalles

MEDIDAS DE TENDENCIA CENTRAL

MEDIDAS DE TENDENCIA CENTRAL MEDIDAS DE TENDENCIA CENTRAL Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro

Más detalles

MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN. Lic. Esperanza García Cribilleros

MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN. Lic. Esperanza García Cribilleros MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN Lic. Esperanza García Cribilleros ANÁLISIS EXPLORATORIO DE DATOS Diagrama de tallo y hojas Diagrama de caja DESCRIPCIÓN N DE LOS DATOS Tablas

Más detalles

Gobierno de La Rioja MATEMÁTICAS CONTENIDOS

Gobierno de La Rioja MATEMÁTICAS CONTENIDOS CONTENIDOS MATEMÁTICAS 1.- Números reales Distintas ampliaciones de los conjuntos numéricos: números enteros, números racionales y números reales. Representaciones de los números racionales. Forma fraccionaria.

Más detalles

Z i

Z i Medidas de Variabilidad y Posición. Jesús Eduardo Pulido Guatire, marzo 010 Cuando trabajamos el aspecto denominado Medidas de Tendencia Central se observó que tanto la media como la mediana y la moda

Más detalles

ÍNDICE CAPÍTULO 1. INTRODUCCIÓN

ÍNDICE CAPÍTULO 1. INTRODUCCIÓN ÍNDICE CAPÍTULO 1. INTRODUCCIÓN 1.1. OBJETO DE LA ESTADÍSTICA... 17 1.2. POBLACIONES... 18 1.3. VARIABLES ALEATORIAS... 19 1.3.1. Concepto... 19 1.3.2. Variables discretas y variables continuas... 20 1.3.3.

Más detalles

Matemáticas. Bioestadística. Correlación y Regresión Lineales

Matemáticas. Bioestadística. Correlación y Regresión Lineales Matemáticas Bioestadística Correlación y Regresión Lineales En una distribución bidimensional puede ocurrir que las dos variables guarden algún tipo de relación entre si. Por ejemplo, si se analiza la

Más detalles

Bachillerato Internacional. Matemáticas Nivel Medio. Programa para el curso 1º ( )

Bachillerato Internacional. Matemáticas Nivel Medio. Programa para el curso 1º ( ) 1 Bachillerato Internacional. Matemáticas Nivel Medio. Programa para el curso 1º (2015-2016) Tema 1: NÚMEROS REALES Conjuntos numéricos. Números naturales. Números enteros. Números racionales. Números

Más detalles

Fase 2. Estudio de mercado: ESTADÍSTICA

Fase 2. Estudio de mercado: ESTADÍSTICA 1. CONCEPTO DE ESTADÍSTICA. ESTADÍSTICA DESCRIPTIVA 2. 3. TABLA DE FRECUENCIAS 4. REPRESENTACIONES GRÁFICAS 5. TIPOS DE MEDIDAS: A. MEDIDAS DE POSICIÓN B. MEDIDAS DE DISPERSIÓN C. MEDIDAS DE FORMA 1 1.

Más detalles

CORRELACION Y REGRESIÓN LINEAL

CORRELACION Y REGRESIÓN LINEAL LECCION Nº 5 CORRELACION Y REGRESIÓN LINEAL OBJETIVOS ESPECIFICOS Diferenciar los conceptos de correlación lineal, y regresión lineal. Determinar el índice o coeficiente de correlación en una distribución

Más detalles

x i = n = 35 5 =7 MEDIDAS DE CENTRALIZACIÓN Media aritmética: variables cuantitativas , x 2 Datos no agrupados: x 1 ,...,x n x= x 1 +x

x i = n = 35 5 =7 MEDIDAS DE CENTRALIZACIÓN Media aritmética: variables cuantitativas , x 2 Datos no agrupados: x 1 ,...,x n x= x 1 +x MEDIDAS DE CENTRALIZACIÓN Media aritmética: variables cuantitativas Datos no agrupados: x 1, x 2,...,x n x= x 1 +x 2 +... x n n n i=1 = n Ejemplo: dados los valores: X = 1, 4, 16, 11, 3, 6, su media es

Más detalles

ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA DESCRIPTIVA Medidas de tendencia central y de dispersión Giorgina Piani Zuleika Ferre 1. Tendencia Central Son un conjunto de medidas estadísticas que determinan un único valor que define el

Más detalles

Variables estadísticas bidimensionales: problemas resueltos

Variables estadísticas bidimensionales: problemas resueltos Variables estadísticas bidimensionales: problemas resueltos BENITO J. GONZÁLEZ RODRÍGUEZ (bjglez@ull.es) DOMINGO HERNÁNDEZ ABREU (dhabreu@ull.es) MATEO M. JIMÉNEZ PAIZ (mjimenez@ull.es) M. ISABEL MARRERO

Más detalles

Índice general. Pág. N. 1. Capítulo 1 ETAPAS DE UNA INVESTIGACIÓN. Diseño. Población. Muestra. Individuo (Observación, Caso, Sujeto) Variables

Índice general. Pág. N. 1. Capítulo 1 ETAPAS DE UNA INVESTIGACIÓN. Diseño. Población. Muestra. Individuo (Observación, Caso, Sujeto) Variables Pág. N. 1 Índice general Capítulo 1 ETAPAS DE UNA INVESTIGACIÓN 1.1 Diseño 1.2 Descriptiva 1.3 Inferencia Diseño Población Muestra Individuo (Observación, Caso, Sujeto) Variables Ejercicios de Población

Más detalles

ESTADÍSTICA CON EXCEL

ESTADÍSTICA CON EXCEL ESTADÍSTICA CON EXCEL 1. INTRODUCCIÓN La estadística es la rama de las matemáticas que se dedica al análisis e interpretación de series de datos, generando unos resultados que se utilizan básicamente en

Más detalles

Técnicas de Investigación Social

Técnicas de Investigación Social Licenciatura en Sociología Curso 2006/07 Técnicas de Investigación Social Medir la realidad social (4) La regresión (relación entre variables) El término REGRESIÓN fue introducido por GALTON en su libro

Más detalles

Tema Contenido Contenidos Mínimos

Tema Contenido Contenidos Mínimos 1 Estadística unidimensional - Variable estadística. - Tipos de variables estadísticas: cualitativas, cuantitativas discretas y cuantitativas continuas. - Variable cualitativa. Distribución de frecuencias.

Más detalles

VARIABLES ESTADÍSTICAS BIDIMENSIONALES

VARIABLES ESTADÍSTICAS BIDIMENSIONALES VARIABLES ESTADÍSTICAS BIDIMENSIONALES 1.- En una variable estadística bidimensional, el diagrama de dispersión representa: a) la nube de puntos. b) las varianzas de las dos variables. c) los coeficientes

Más detalles

UNIDAD Nº4. Ejemplo.- Dados los Gastos de publicidad en los meses enero a julio, los cuales generan los sgts. Ingresos:

UNIDAD Nº4. Ejemplo.- Dados los Gastos de publicidad en los meses enero a julio, los cuales generan los sgts. Ingresos: UNIDAD Nº4 TEORÍA DE REGRESIÓN Y CORRELACIÓN 1.- Teoría de Regresión.- En términos de estadística los conceptos de regresión y ajuste con líneas paralelas son sinónimos lo cual resulta estimar los valores

Más detalles

ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA DESCRIPTIVA TEMA 2: ESTADÍSTICA DESCRIPTIVA Objetivos: En esta práctica utilizaremos el paquete SPSS para calcular estadísticos descriptivos de una muestra. Se representarán gráficamente conjuntos de datos utilizando

Más detalles

2.- Tablas de frecuencias

2.- Tablas de frecuencias º BACHILLERATO MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES II TEMA 3.- ESTADÍSTICA DESCRIPTIVA PROFESOR: RAFAEL NÚÑEZ -----------------------------------------------------------------------------------------------------------------------------------------------------------------

Más detalles

MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I Y II CONTENIDOS BACHILLERATO

MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I Y II CONTENIDOS BACHILLERATO MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I Y II CONTENIDOS BACHILLERATO BLOQUE 1. PROCESOS, MÉTODOS Y ACTITUDES EN MATEMÁTICAS Los contenidos de este bloque se desarrollan de forma simultánea al resto

Más detalles

La amplitud del intervalo ( ) se determina considerando un número dado de intervalos ( ) y el rango obtenido, esto es:

La amplitud del intervalo ( ) se determina considerando un número dado de intervalos ( ) y el rango obtenido, esto es: La estadística es una materia dedicada a la recopilación, organización, estudio y análisis de datos de un hecho en particular. La estadística descriptiva tabula, representa y describe una serie de datos

Más detalles

Tema 7: Estadística y probabilidad

Tema 7: Estadística y probabilidad Tema 7: Estadística y probabilidad En este tema revisaremos: 1. Representación de datos e interpretación de gráficas. 2. Estadística descriptiva. 3. Probabilidad elemental. Representaciones de datos Cuatro

Más detalles

(Se corresponde con el tema 14 del libro de Oxford de 4ºESO Opc. B)

(Se corresponde con el tema 14 del libro de Oxford de 4ºESO Opc. B) Estadística (Se corresponde con el tema 14 del libro de Oxford de 4ºESO Opc. B) 1. Conceptos Básicos La Estadística es la ciencia que se encarga de recopilar y ordenar datos referidos a diversos fenómenos

Más detalles

MATEMÁTICAS I aplicadas a las Ciencias Sociales

MATEMÁTICAS I aplicadas a las Ciencias Sociales MATEMÁTICAS I aplicadas a las Ciencias Sociales UNIDAD 1: NÚMEROS REALES Distintos tipos de números Los números enteros, racionales e irracionales. El papel de los números irracionales en el proceso de

Más detalles

Jesús Eduardo Pulido Guatire, marzo Diagrama de Dispersión y Correlación Lineal Simple

Jesús Eduardo Pulido Guatire, marzo Diagrama de Dispersión y Correlación Lineal Simple Jesús Eduardo Pulido Guatire, marzo 0 Diagrama de Dispersión y Correlación Lineal Simple Hasta el momento el trabajo lo hemos centrado en resumir las características de una variable mediante la organización

Más detalles

Bioestadística. En una distribución bidimensional puede ocurrir que las dos variables guarden algún tipo de relación entre si.

Bioestadística. En una distribución bidimensional puede ocurrir que las dos variables guarden algún tipo de relación entre si. 1 de 5 15/10/2006 06:04 a.m. Bioestadística. Correlación y regresión lineales. En una distribución bidimensional puede ocurrir que las dos variables guarden algún tipo de relación entre si. Por ejemplo,

Más detalles

Matemáticas. Selectividad ESTADISTICA COU

Matemáticas. Selectividad ESTADISTICA COU Matemáticas Selectividad ESTADISTICA COU 1. Un dentista observa el Nº de Caries en cada uno de los 100 niños de cierto colegio. La información obtenida aparece resumida en la siguiente tabla. Nº Caries

Más detalles

TEST ESTADÍSTICA DESCRIPTIVA. Profesores Ana I. González Martín Dolores Jano Salagre Rocío Marco Crespo Salvador Ortiz Serrano Francisco Soto Ortego

TEST ESTADÍSTICA DESCRIPTIVA. Profesores Ana I. González Martín Dolores Jano Salagre Rocío Marco Crespo Salvador Ortiz Serrano Francisco Soto Ortego TEST ESTADÍSTICA DESCRIPTIVA Profesores Ana I. González Martín Dolores Jano Salagre Rocío Marco Crespo Salvador Ortiz Serrano Francisco Soto Ortego temas 1 y 2: VARIABLES, ATRIBUTOS Y DISTRIBUCIONES DE

Más detalles

REPASO DE ESTADÍSTICA DESCRIPTIVA

REPASO DE ESTADÍSTICA DESCRIPTIVA ÍNDICE: 1.- Tipos de variables 2.- Tablas de frecuencias 3.- Gráficos estadísticos 4.- Medidas de centralización 5.- Medidas de dispersión REPASO DE ESTADÍSTICA DESCRIPTIVA 1.- Tipos de variables La estadística

Más detalles

Tema 2: Estadística Descriptiva Bivariante.

Tema 2: Estadística Descriptiva Bivariante. Estadística 24 Tema 2: Estadística Descriptiva Bivariante. Se va a estudiar la situación en la que los datos representan observaciones, correspondientes a dos variables o caracteres, efectuadas en los

Más detalles

Repaso Estadística Descriptiva

Repaso Estadística Descriptiva Grado en Fisioterapia, 2010/11 Cátedra de Bioestadística Universidad de Extremadura 13 de octubre de 2010 Índice Descriptiva de una variable 1 Descriptiva de una variable 2 Índice Descriptiva de una variable

Más detalles