Fundamentos de Estadística descriptiva

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Fundamentos de Estadística descriptiva"

Transcripción

1 Fundamentos de Estadística descriptiva COCEPTOS GEERALES Llamaremos población estadística al conjunto de referencia sobre el cual van a recaer las observaciones. Se llama individuo a cada uno de los elementos que componen la población y muestra a un subconjunto de individuos de la población. Se suelen tomar muestras cuando es difícil o costosa la observación de todos los elementos de la población. Decimos que realizamos un censo cuando se observa a la población completa. Toda población viene definida por un conjunto delimitado y bien definido de caracteres, es decir una cualidad o propiedad inherente en el individuo. A los posibles aspectos de un carácter se les denominan modalidades, que deben ser exhaustivas e incompatibles. Los caracteres pueden ser clasificados en caracteres cualitativos, en las se recogen modalidades que no son números (color del pelo, por ejemplo) y caracteres cuantitativos, en las que todas las modalidades son números (por ejemplo, el peso o la estatura). Una variable estadística es un conjunto de números que representan a un carácter (o más) cuantitativo. Éstas pueden ser discretas o continuas, según que las modalidades sean números naturales o intervalos de IR, respectivamente. Se considera una población formada por individuos, descrita por un carácter que posee k modalidades x 1, x 2,..., x k, pero donde cada uno de ellos puede aparecer repetido más de una vez. Se denomina frecuencia absoluta, n i, asociada a la modalidad x i al número de elementos de la población que poseen dicha modalidad. De esta forma, la suma de todas las frecuencias absolutas debe ser el número de elementos de la población, es decir k n i =. La frecuencia relativa, f i, asociada a una modalidad x i es la proporción de individuos de la población que presenta la modalidad x i, por tanto es el cociente entre la frecuencia absoluta de x i y el número de elementos de la población: f i = n i. Se satisface entonces que k f i = 1. La frecuencia acumulada absoluta, i (respect. relativa, F i ) asociada a la modalidad x i es la suma de las frecuencias absolutas (respect. relativas) de las modalidades x 1, x 2,..., x i 1, x i. Con estas definiciones, se tiene que la frecuencia acumulada absoluta de la última modalidad x k coincide con el número de elementos de la población y la frecuencia acumulada relativa coincide con 1. Con estos datos se construye una llamada tabla estadística de frecuencias en la que se recogen las modalidades de un carácter y sus respectivas frecuencias: modalidad frec. abs. frec. rel. frec. abs. acum. frec. acum. rel. x i n i f i i F i x 1 n 1 f 1 = n 1 1 = n 1 F 1 = f 1 x 2 n 2 f 2 = n 2 2 = n 1 + n 2 F 2 = f 1 + f x k n k f k = n k k = F k = 1 En relación a las observaciones realizadas en una muestra o población se nos pueden presentar los siguientes casos: 1. Que se hayan hecho pocas observaciones y, por tanto, la variable estadística tome pocos valores. Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 1

2 2. Que se hayan hecho muchas observaciones y, sin embargo, la variable estadística tome muy pocos valores distintos, incidiendo de una manera considerable el estudio de las repeticiones de cada valor. 3. Que se hayan hechos muchas observaciones y la variable estadística tome muchos valores distintos. Los dos primeros casos caerán dentro del estudio de una variable estadística discreta, mientras que en el caso tercero, trataremos de agrupar los valores de la variable estadística en intervalos adecuadamente elegidos para no perder mucha información, lo cual va a suponer una simplificación en nuestro trabajo. A la diferencia entre el extremo superior y el extremo inferior de cada intervalo la llamaremos amplitud del intervalo. Por comodidad, los intervalos de amplitud constante son los más aconsejables, salvo que las condiciones específicas del problema no lo aconsejen. Los intervalos de clase suelen ser semiabiertos y se tomarán tantos intervalos solapados como sean necesarios para recubrir todo el recorrido de la variable. Definimos la marca de clase como el punto medio de cada intervalo. Es, en definitiva, el valor que nos representa la información que contiene un intervalo. Tabla de frecuencias de una variable agrupada en intervalos intervalos marcas de clase n i f i i F i (a 0, a 1 ] x 1 n 1 f 1 1 F 1 (a 1, a 2 ] x 2 n 2 f 2 2 F (a k 1, a k ] x k n k f k k F k REPRESETACIOES GRÁFICAS Para representar por medio de un gráfico los datos observados en una población, deben tenerse en cuenta los siguientes puntos: Las gráficas deben explicarse por sí mismas.los títulos de pie deben dar información sobre los sujetos a estudio y la materia objeto de experimentación, qué observaciones se han efectuado y las restricciones que se han impuesto. Se deberán indicar las unidades de escala de los ejes. Deberán dar una visión general del conjunto de datos. o deberán abarcar mucha información en un mismo gráfico. Entre los tipos de gráficas que representan variables cualitativas están los diagramas de sectores y los diagramas de rectángulos. Para las variables cuantitativas, debido a a que las modalidades son números, las representaciones se realizan sobre los ejes de coordenadas, aunque puede resultar necesario que se tomen distintas escalas. Los más representativos son los diagramas de barras, para variables discretas, que consisten en trazar para cada valor del carácter, barras verticales de longitud la frecuencia absoluta o relativa asociada a cada valor. Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 2

3 Para variables continuas, el más utilizado es el histograma que es similar al diagrama de barras,pero como las modalidades son intervalos, se representan rectángulos cuyas áreas son proporcionales (o igual) a la frecuencia absoluta o relativa de cada clase. Cuando la amplitud de clase es la misma para cada intervalo, es frecuente tomar rectángulos cuya altura coincide con la frecuencia absoluta o relativa. Uniendo los puntos medios del lado superior de cada rectángulo, se obtienen los llamados polígonos de frecuencia. MEDIDAS DE POSICIÓ A veces es conveniente reducir la información obtenida a un solo valor o a un número pequeño de valores para facilitar la comparación entre las distintas muestras o poblaciones. Estos valores, que de alguna forma centralizan la información reciben el nombre de medidas de posición, de tendencia central o de posición central. Media: Sea X una variable estadística que toma valores distintos {x 1, x 2,..., x k } con frecuencias absolutas {n 1, n 2,..., n k } siendo n n i =. Se define la media como la suma ponderada de los valores de la variable por sus frecuencias relativas: X = x i f i = x i n i Para calcular la media de una variable continua, se realiza la suma ponderada de las marcas de clase por la frecuencia relativa asociada a cada clase. Mediana: es el valor de la variable que deja a su derecha y a su izquierda el cincuenta por ciento de la población. Se denota por M e (X). Si, debido al tamaño de la población,, se tienen las observaciones sin agrupar en una tabla de frecuencias, la mediana será: para impar, la modalidad que se encuentra en la mitad del conjunto de datos ordenados si es par, el punto medio de los dos valores centrales. Cuando los datos están organizados en una tabla de frecuencias, se divide el número de observaciones entre 2 y si /2 no se encuentra en la tabla de frecuencias absolutas acumuladas, estará comprendido entre dos números de la citada tabla, con lo cual la mediana será aquel valor de la variable que corresponde al mayor; si el valor /2 está en la columnas de las i es que coincide con la frecuencia absoluta acumulada para algún valor x j, en este caso, se toma el punto medio del intervalo, es decir M e = x j + x j+1. 2 Para variables estadísticas continuas, se divide el número de observaciones entre 2 y si /2 no se encuentra en la tabla de frecuencias absolutas acumuladas estará comprendido entre dos valores j y j+1 de la citada tabla, que corresponderán a las frecuencias absolutas acumuladas de dos intervalos [a j 1, a j ) y [a j, a j+1 ) respectivamente, con lo cual la mediana se va a encontrar en el intervalo [a j, a j+1 ), al que se denomina intervalo mediano. Es frecuente tomar como mediana la marca de clase del intervalo mediano. Si el valor /2 está en la columnas de las i es que coincide con la frecuencia absoluta acumulada de un cierto intervalo de clase [a j, a j+1 ) y, por tanto, la mediana será el extremo superior del mismo. Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 3

4 Moda: es el valor de la variable que tiene máxima frecuencia. La moda no tiene por qué ser única. Cuando la variable es continua, hablaremos de intervalo modal. Se denota por M d o Mod(X). Cuartiles: se definen los cuartiles como tres valores de la variable que dividen las observaciones en cuatro partes iguales. El primer cuartil es el valor que deja la cuarta parte de las observaciones menores o iguales a él y las tres cuartas partes superiores a él. Para su cálculo se hace el mismo razonamiento que en el cálculo de la mediana, pero considerando /4. El segundo cuartil es la mediana y el tercer cuartil es el valor que deja las tres cuartas partes de las observaciones menores o iguales a él y la cuarta parte superior a él. Para su cálculo se hace el mismo razonamiento que en el cálculo de la mediana, pero considerando 3/4. Deciles: se define el decil K-ésimo como el valor de la variable que deja inferiores o iguales a él las K/10 partes de las observaciones. Los denotamos por D k. Centiles o percentiles: se define el percentil K-ésimo como el valor de la variable que deja inferiores o iguales a él las K/100 partes de las observaciones. Los denotamos por P k. MEDIDAS DE DISPERSIÓ La media aritmética se emplea como valor representativo de la población, sin embargo, según la dispersión de los datos, la representa mejor o peor. Si las modalidades de la variable están todas próximas a la media (y, por tanto, próximas entre sí) ésta nos dará una idea bastante aproximada de los valores que toma la variable, mientras que si los datos están muy dispersos (o con que haya uno solo que se aleje de todos los demás), la media no será un buen representante del colectivo de modalidades. El problema que se plantea es encontrar una medida de la dispersión de los datos respecto de la media. Sea X una variable estadística que toma valores distintos {x 1, x 2,..., x k } con frecuencias absolutas {n 1, n 2,..., n k }. Se puede pensar en definir la dispersión de cada modalidad respecto de la media y sumar: (x i X)n i = (x 1 X)n 1 + (x 2 X)n (x k X)n k = nx nx = 0 Ésto ocurre porque las desviaciones por exceso y por defecto respecto de la media se van compensando unas con otras al sumar. Para evitar ésto, se pueden elevar al cuadrado las desviaciones (de esta forma se consigue que todas sean positivas) y se promedia con el tamaño de la población. Varianza: k σx 2 (x i X) 2 n k i x 2 i n i = = X 2 Desviación típica: es la raíz cuadrada positiva de la varianza de la variable. Se designa por σ X. Coeficiente de variación: es el cociente entre la desviación típica y la media. CV (X) = σ X X La media, como promedio de un conjunto de datos, tiene la misma unidad de medida que éstos. La varianza estará expresada en las unidades de los datos al cuadrado, mientras que Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 4

5 las desviación típica tiene las mismas unidades que los datos y la media. Cuando se trata de comparar la dispersión de variables expresadas en distintas medidas se puede utilizar el coeficiente de variación, que se suele expresar en %, ya que no tiene unidades. Para la comparación de las modalidades de dos variables distintas se utiliza la variable tipificada que mide la desviación de la variable respecto de la media en términos de la desviación típica. Dada una variable estadística X que toma valores {x 1, x 2,..., x k } com media X y desviación típica σ, se define la variable tipificada Z = X X σ X Rango intercuartílico: es la diferencia entre el cuartil de tercer orden y el de primer orden: R = Q 3 Q 1 Momentos centrales (respecto de la media): Se define el momento central de orden r por µ r = (x i X) r f i Obsérvese que µ 0 = 1, µ 1 = 0 y µ 2 coincide con la varianza. Momentos no centrales (respecto al origen): Se define el momento no central de orden r por m r = x r i f i Obsérvese que m 0 = 1, m 1 = X y que m 2 = σ 2 X + X 2. MEDIDAS DE ASIMETRÍA Y APUTAMIETO Diremos que una distribución de frecuencias es simétrica cuando valores de la variable equidistantes de un valor máximo central tienen las mismas frecuencias. Es importante destacar en este caso X = M e = M d. Se denominan distribuciones asimétricas a aquellas distribuciones que no son simétricas. La asimetría puede presentarse a la derecha o a la izquierda. Coeficiente de asimetría de Pearson A P = X M d σ X Si A P > 0, la distribución es asimétrica a la derecha y si A P < 0 es asimétrica a la izquierda. Coeficiente de asimetría de Fisher A F = γ 1 = µ 3 σ 3 X Si A F > 0, la distribución es asimétrica a la derecha y si A F < 0 es asimétrica a la izquierda. Si A P = 0 = A F, la distribución es simétrica. Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 5

6 Coeficiente de apuntamiento o curtosis: γ 2 = µ 4 σ 4 X Este coeficiente indica cuál es el apuntamiento de forma de la distribución, comparándola con la campana de Gauss (distribución normal). Si γ 2 > 3, tiene más apuntamiento que la normal (leptocúrtica). Si γ 2 = 3, tiene igual apuntamiento que la normal (mesocúrtica). Si γ 2 < 3, tiene menos apuntamiento que la normal (platicúrtica). VARIABLES ESTADÍSTICAS BIDIMESIOALES En esta sección se considerarán aquellas situaciones en las que se realiza la observación simultánea de dos caracteres en el individuo, obteniéndose, por tanto, pares de resultados. Por ejemplo, observar en una persona su peso y su edad. Los dos caracteres observados no tienen por qué ser de la misma clase. Así, se pueden presentar dos caracteres cualitativos, dos cuantitativos o uno cualitativo y otro cuantitativo. En el caso de dos caracteres cuantitativos las variables que representan sus valores pueden ser ambas discretas, ambas continuas o una discreta y otra continua. Se considera una población con individuos descrita por dos caracteres: X con modalidades {x 1, x 2,..., x k } Y con modalidades {y 1, y 2,..., y p } En estos casos, las modalidades son pares (x i, y j ) para i {1, 2,..., k}, j {1, 2,..., p}. Se define la frecuencia absoluta asociada al par (x i, y j ), n ij, como el número de elementos de la población que tienen la modalidad x i de X e y j de Y. Las frecuencias relativas se definen como en el caso de una sola variable f ij = n ij. Las tablas estadísticas correspondientes a una variable bidimensional son de la forma X\Y y 1 y 2 y p x 1 n 11 n 12 n 1p x 2 n 21 n 22 n 2p..... x k n k1 n k2 n kp Distribuciones marginales La distribución marginal de X viene dada por {x i, n i. } k siendo n i. el número total de individuos que poseen la modalidad x i de X, independientemente de la modalidad de Y que posean, a la que se denomina frecuencia marginal absoluta asociada a la modalidad x i de X.Es decir, p n i. = n ij j=1 Se define la frecuencia relativa marginal como el cociente f i. = n i. Análogamente, se define la distribución marginal de Y con las frecuencias marginales absolutas n.j y la relativas f.j. Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 6

7 Para las distribuciones marginales se puede determinar (como ya se vió en el epígrafe anterior de variables estadísticas unidimensionales) cualquier medida de centralización y dispersión. Por ejemplo, se definen las medias marginales como X = k,p x i f ij = x i f i. i,j=1 y las varianzas marginales por Y = k,p p y j f ij = y j f.j i,j=1 j=1 σx 2 k,p = (x i X) 2 f ij = (x i X) 2 f i. i,j=1 σy 2 k,p p = (y j Y ) 2 f ij = (y j Y ) 2 f.j i,j=1 j=1 Distribuciones condicionadas La distribución de X cuando Y = y j, que se denota por X Y = y j, viene dada por {x i, n j i } k siendo n j i el número de individuos que poseen la modalidad x i de X e y j de Y, es decir, la misma n ij. Se construyen tablas de la forma X x 1 x 2. x k La frecuencia relativa de x i condicionada a que Y = y j es la proporción de individuos que presentan la modalidad x i, entre los que presentan la modalidad y j de Y, O sobre el total de la población (ésta sería la frecuencia relativa marginal de x i ). Por tanto, n j i n 1j n 2j. n kj f j i = n ij n.j Obsérvese que si nos fijamos en la tabla de frecuencias correspondiente a la variable unidimensional de X Y = y j, para calcular las frecuencias relativas en dicha tabla, se hace lo habitual: dividir cada frecuencia absoluta entre la suma de todas ellas, que en este caso sería n 1j + n 2j + + n kj = n.j Análogamente, se construyen las tablas correspondientes a las distribuciones de la variable Y condicionadas a algún valor de X, Y X = x i. Como tablas estadísticas de variables unidimensionales que son, se les pueden calcular cualquiera de las medidas ya conocidas. Así, se definen las medias condicionadas por X j = x i f j i Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 7

8 es decir que es la media de la distribución X Y = y j (luego se pueden definir p medias condicionadas). Análogamente, se definen k medias condicionadas, para cada valor de X: p Y i = y j fj i j=1 Se definen las varianzas condicionadas como las varianzas de las variables condicionadas: p σx 2 j = (x i X j ) 2 f j i σy 2 i = (y j Y i ) 2 fj i j=1 ASOCIACIÓ ESTADÍSTICA DE DOS VARIABLES Una de las aspiraciones de la Ciencia ha sido establecer relaciones entre diferentes variables, para, por ejemplo poder predecir el valor de una de ellas, conociendo el valor de la otra. A veces estas relaciones son deterministas (por ejemplo, se puede determinar con exactitud el tiempo que empleará un móvil en recorrer cierta distancia si se sabe la velocidad que lleva) pero en multitud de ocasiones las magnitudes no guardan una relación causal a pesar de que guardan una fuerte conexión. Por ejemplo, el coeficiente de inteligencia, medido con los tests adecuados, se relaciona fuertemente con el rendimiento escolar en Matemáticas. Una parte importante de la Estadística es el análisis de la relación que puede establecerse entre distintas variables, según un conjunto de datos observados. Los distintos grados de asociación pueden ir desde la total independencia hasta una relación tan estrecha que se pueda considerar determinista. Independencia estadística Decimos que una variable X es estadísticamente independiente del carácter Y cuando la frecuencia relativa de x i no depende del valor y j, que condiciona. Es lo mismo que decir que f j i = f i. para todo i, j. En este caso, la frecuencia relativa conjunta se puede expresar como el producto de las marginales. Se puede definir el concepto análogo de ser Y independiente de X, pero se deduce de forma inmediata que son conceptos equivalentes. Dependencia funcional Se dice que X depende funcionalmente de Y si para cada modalidad y j de Y existe una única modalidad x i de X. Si se mira la tabla correspondiente a la variable bidimensional, lo que ocurre es que en cada columna sólo hay un valor no nulo para X. Ésto siempre se da cuando ambas variables están relacionadas por una expresión matemática y, por tanto, existe una relación determinista entre ellas. Covarianza Parece intuitivo pensar que para cuantificar el tipo de asociación estadística entre dos variables a partir de los datos observados en una población, será necesario comparar la variación conjunta de las dos. Ésto supone tener en cuenta los valores que toman cada una de ellas individuo a individuo de la población estudiada. Cuando según los datos registrados, se observa que el crecimiento en los valores de una variable parece favorecer el crecimiento de la otra (por ejemplo, un coeficiente intelectual alto suele llevar a un rendimiento alto en Matemáticas, aunque no se excluye que una persona de coeficiente intelectual mayor que otra tenga un rendimiento más bajo en Matemáticas), se habla de asociación Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 8

9 positiva. Mientras que en caso contrario, es decir, si el crecimiento de una variable conduce a una disminución de la otra (por ejemplo, a mayor número de depredadores en un ecosistema, menor número de presas) se habla de asociación negativa. Para cuantificar la variación conjunta de dos variables, lo que podría denominarse covariación, se mide la desviación respecto de la media que ambas variables presentan en cada individuo de la población. De esta forma, para variables asociadas positivamente, cuando una variable presente un valor grande (esto quiere decir un valor alejado de la media), la otra tenderá a tomar un valor grande, mientras que si la asociación es negativa, ocurrirá al revés. Así, una estimación de la asociación entre variables la proporciona la covarianza: p p σ XY = (x i X)(y j Y )f ij = x i y j f ij X Y j=1 j=1 Obsérvese que si las variables están asociadas positivamente las diferencias (x i X) e (y j Y ) tenderán a tener con frecuencia el mismo signo, mientras que si están asociadas de manera negativa, las diferencias serán con frecuencia de signo contrario, dando lugar a un valor negativo de la covarianza. Por tanto, el signo de la covarianza puede darnos una idea de la asociación entre variables. REGRESIÓ Y CORRELACIÓ Se considera una población de individuos en la cual se estudian dos caracteres cuantitativos X e Y. Supongamos que se observa en cada individuo de la población ambas variables, obteniéndose pares de valores {(x i, y i )}. Si el tamaño de la población fuera elevado y las modalidades de ambas variables se repitieran, se organizarían los datos en una tabla bidimensional de frecuencias, considerando entonces pares {(x i, y j )} k,p i,j=1 con frecuencias relativas asociadas {f ij } k,p i,j=1. En cualquier caso, si se representa en unos ejes cartesianos los valores que toma la variable, se obtiene lo que se conoce como nube de puntos o diagrama de dispersión. El problema general de regresión se plantea en el intento de ajustar una función de ecuación conocida a la nube en cuestión, con el interés de poder obtener una estimación aproximada de una de las variables a partir de la otra. aturalmente que entre todas las funciones que se pueden elegir para ajustarlas a la nube de puntos hemos de seleccionar la óptima, esto es, la que mejor encaje sobre los puntos que tenemos, para lo cual recurriremos al método de los mínimos cuadrados. La función que pretendemos obtener será una línea que llamaremos línea de regresión, cuya ecuación puede ser una recta, una función exponencial, una parábola, una función cúbica o polinómica de cualquier grado, una hipérbola, etc. La regresión adoptará un nombre distinto, dependiendo de la función elegida para el ajuste. Regresión lineal mínimo cuadrática En el supuesto de que sea una recta la función que se quiera ajustar a la nube de puntos, estaremos ante un problema de regresión lineal y distinguiremos entre 1. Recta de regresión de Y sobre X 2. Recta de regresión de X sobre Y Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 9

10 Si se pretende hacer una estimación de los valores que toma Y, sabiendo el valor que toma X, entonces, la ecuación de la recta será y = a + bx y lo que se tiene que hacer es estimar los parámetros a y b, partiendo de los datos observados. Por simplicidad, se considera una variable bidimensional (X, Y ) que al valor observado x i le corresponde un valor observado y i. Llamaremos valor teórico y i al que le correspondería en la recta como función, es decir a+bx i = y i. El método de los mínimos cuadrados consiste en tomar las distancias al cuadrado (para que no se puedan contrarrestar los signos positivos y negativos) entre los valores teóricos y los observados y hacer mínima su suma. Hemos de hacer, por tanto, mínima la expresión F (a, b) = (y i (a + bx i )) 2 Para ello hay que derivar la función F respecto de las variables a y b e igualar a cero. De esta forma se obtiene el siguiente sistema de dos ecuaciones, cuyas incógnitas son a y b: y i = a + b x i x i y i = a x i + b x 2 i que al resolverse proporciona los valores buscados, que son a = Y σ XY σ 2 X X b = σ XY σ 2 X Se obtiene por tanto,la recta y Y = σ XY (x X) σx 2 a la que se denomina recta de regresión de Y sobre X ajustada mediante el método de mínimos cuadrados y se representa por R Y X. Análogamente, se puede calcular por el mismo método, la recta de regresión de X Y que permite hacer una estimación del valor que toma X, sabiendo el valor de Y. Se designa por R X Y y es x X = σ XY σ 2 Y Ajustes que se reducen al caso lineal (y Y ) Supongamos que por la forma de la nube de puntos, se piensa que la línea que mejor encaja es una función polinómica de la forma y = a + bx n. uestro objetivo es, de nuevo, estimar los parámetros a y b. Para ello, podemos ajustar una recta de regresión de Y sobre X n, es decir, se calculan los correspondientes coeficientes a y b, utilizando como datos los pares de valores {(x n i, y i )}. En determinados experimentos, en su mayoría biológicos, la dependencia entre las variables X e Y es de forma exponencial. En este caso interesa ajustar a la nube de puntos la función y = K 1 A K 2x, donde A nos viene dado (en particular, puede ser el número e), y los parámetros a estimar serían K 1 y K 2. Si se toman logaritmos neperianos se obtiene Lny = LnK 1 + K 2 xlna Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 10

11 De esta forma, llamando y = Lny, α = LnK 1 y β = K 2 LnA se tiene y = α + βx con lo que el problema se nos ha convertido en uno de regresión lineal, puesto que la función y = α+βx es una recta. Procediendo como ya se ha descrito con las parejas de valores {(x i, Lny i )} se obtienen α y β. Por último sólo resta deshacer el cambio, de manera que K 1 = e α y K 2 = β LnA. Puede ocurrir que en lugar de fijar la base de la función exponencial, sea necesario buscarla para que el ajuste sea bueno. Es decir, si se pretende ajustar una función de la forma y = Ka x, donde lo que se pretende encontrar son los valores de K y a apropiados, también podemos aprovechar el caso lineal. Tomando logaritmos neperianos, Lny = LnK + xlna Por tanto, si se calcula la recta de regresión de Y = Lny sobre X, con los pares de valores {(x i, Lny i )}, llamémosle y = α + βx, entonces, deshaciendo el cambio anterior, se obtiene K = e α y a = e β Si nos interesa ajustar una función del tipo y = K 1 x K 2, introducimos logaritmos neperianos en ambos miembros Lny = LnK 1 + K 2 Lnx y = α + βx Se ajusta una recta de regresión Y X con los pares de valores {(Lnx i, Lny i )} y se deshace después el cambio, de manera que K 1 = e α y K 2 = β. Para ajustes hiperbólicos, esto es, la línea de regresión es una hipérbola de ecuación y = 1 a + bx, se ajusta un recta y = α + βx para los pares de valores {(x i, y i = 1 y i ), de forma que Correlación a = α y b = β. Una vez resuelto el problema de cómo ajustar una curva a la nube de puntos, se pretende ahora determinar con qué precisión se describe la relación entre las dos variables y qué tipo de curva es la más adecuada. Así como la teoría de la regresión estudia la posible predicción de los valores de una variable a partir de otra, la correlación estudia el tipo de dependencia que existe entre ambas variables. Se considera una variable bidimensional (X, Y ) que al valor observado x i le corresponde un valor observado y i. Para cada i, llamaremos valor teórico yi al que le correspondería a x i en la función que ajustamos, es decir f(x i ) = yi. Recordemos que el método de los mínimos cuadrados se basa en buscar los parámetros necesarios para minimizar el valor de (y i yi ) 2 Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 11

12 Por tanto, si se ajustan dos curvas de regresión distintas, y = f(x) e y = g(x) a una misma nube de puntos, la curva que mejor describa la relación entre ambas variables será aquélla para la que el valor de (y i yi ) 2 sea más pequeño. Se denomina varianza residual a V r = (y i yi ) 2 Por tanto, a menor varianza residual, mejor es el ajuste. Obsérvese que la varianza residual es cero, cuando cada y i = y i, es decir, el ajuste es perfecto, ya que todos los puntos se encuentran sobre la curva de regresión. Según acabámos de ver, la varianza residual se emplea para comparar dos curvas de regresión. Vamos ahora a dar una medida que nos permita conocer la bondad de una recta de regresión. Para el caso en que el ajuste sea lineal, se define el coeficiente de correlación lineal como ρ = σ XY σ X σ Y La relación entre la varianza residual para rectas de regresión y este coeficiente viene dada por por tanto V r = σ 2 Y (1 ρ 2 ) 0 ρ 2 = 1 V r σ 2 Y Obsérvese que cuando ρ 2 = 1, es decir para valores extremos ρ = ±1, se tiene que la varianza residual es cero, por tanto el ajuste es perfecto. En tal caso, se dice que X e Y están correladas de forma exacta. Cuando ρ 2 = 0, la varianza residual toma el mayor valor posible y se dice que las variables X e Y están incorreladas. Cuanto más cercano esté ρ a 1 o 1 (ρ 2 cercano a 1), mejor es el ajuste lineal. Para ajustes no lineales, se puede considerar el coeficiente de determinación, definido como 1 R 2 = 1 V r σ 2 Y 1 Cuánto más próximo a 1 esté el coeficiente de determinación, mejor es el ajuste, puesto que para ajustes perfectos (varianza residual cero) el coeficiente de determinación vale 1. Para ciertos modelos de curvas de regresión, entre las que se incluyen las de tipo polinómico, se puede demostrar que el coeficiente de determinación es un número comprendido entre 0 y 1. De hecho, obsérvese que por la propia definición, el coeficiente de determinación para una recta de regresión coincide con el cuadrado del coeficiente de correlación lineal, es decir, R 2 = ρ 2. Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 12

TEMA 1: ESTADISTICA DESCRIPTIVA

TEMA 1: ESTADISTICA DESCRIPTIVA ESTADÍSTICA, CURSO 008 009 1 TEMA 1: ESTADISTICA DESCRIPTIVA 1 FUDAMETOS 11 VARIABLES ESTADISTICAS Población: conjunto completo de elementos, con alguna característica común, objeto del estudio estadístico

Más detalles

Distribución bidimensional. Marginales. Correlación lineal. Rectas de regresión.

Distribución bidimensional. Marginales. Correlación lineal. Rectas de regresión. REGRESIÓN LINEAL. Distribución bidimensional. Marginales. Correlación lineal. Rectas de regresión. Dada una población, hasta ahora hemos estudiado cómo a partir de una muestra extraída de ella podemos

Más detalles

Part I. Descripción estadística de una variable. Estadística I. Mario Francisco. Conceptos generales. Distribuciones de frecuencias.

Part I. Descripción estadística de una variable. Estadística I. Mario Francisco. Conceptos generales. Distribuciones de frecuencias. Part I Descripción estadística de una variable El objeto de cualquier investigación estadística es la toma de información acerca de los individuos de cierto colectivo llamado población estadística. Cada

Más detalles

Julio Deride Silva. 18 de agosto de 2010

Julio Deride Silva. 18 de agosto de 2010 Estadística Descriptiva Julio Deride Silva Área de Matemática Facultad de Ciencias Químicas y Farmcéuticas Universidad de Chile 18 de agosto de 2010 Tabla de Contenidos Estadística Descriptiva Julio Deride

Más detalles

ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL. 30/09/2004 Proyecto MaMaEuSch 1

ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL. 30/09/2004 Proyecto MaMaEuSch 1 ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL 0/09/00 Proyecto MaMaEuSch Estadística Ciencia que trata sobre los métodos científicos para: Recoger, organizar, resumir y analizar datos Sacar conclusiones relevantes

Más detalles

Técnicas Cuantitativas para el Management y los Negocios

Técnicas Cuantitativas para el Management y los Negocios Técnicas Cuantitativas para el Management y los Negocios Contador Público Módulo I: ESTADÍSTICA DESCRIPTIVA Contenidos Módulo I Unidad 1. Introducción y conceptos básicos Conceptos básicos de Estadística.

Más detalles

Tema 9: Estadística descriptiva

Tema 9: Estadística descriptiva Tema 9: Estadística descriptiva Matemáticas específicas para maestros Grado en Educación Primaria Matemáticas específicas para maestros Tema 9: Estadística descriptiva Grado en Educación Primaria 1 / 47

Más detalles

U.D.1: Análisis estadístico de una variable Consideraciones iniciales: Propuesta: 1.1 Distribución de frecuencias. Variables Cualitativas: Ejemplo

U.D.1: Análisis estadístico de una variable Consideraciones iniciales: Propuesta: 1.1 Distribución de frecuencias. Variables Cualitativas: Ejemplo U.D.1: Análisis estadístico de una variable Consideraciones iniciales: - Población: Es el conjunto de todos los elementos que cumplen una determinada característica. Ej.: Alumnos del colegio. - Individuo:

Más detalles

TEMA 5 Estadística descriptiva. Análisis de datos

TEMA 5 Estadística descriptiva. Análisis de datos TEMA 5 Estadística descriptiva. Análisis de datos Florence Nightingale (1820-1910) 1. Introducción. Modelos matemáticos 2. Métodos numéricos. Resolución de sistemas lineales y ecuaciones no lineales 3.

Más detalles

Part I. Descripción estadística de dos variables. Estadística I. Mario Francisco. Variable. bidimensional. Distribuciones de frecuencias

Part I. Descripción estadística de dos variables. Estadística I. Mario Francisco. Variable. bidimensional. Distribuciones de frecuencias Part I Descripción de dos variables Introducción Si para un mismo individuo observamos simultáneamente k obtendremos como resultado una variable k-dimensional. Nos ocuparemos del estudio de las variables

Más detalles

1, 2, 2, 3, 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 2, 1, 1, 4, 1

1, 2, 2, 3, 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 2, 1, 1, 4, 1 8 Estadística 81 Distribuciones unidimensionales Tablas de frecuencias En este tema nos ocuparemos del tratamiento de datos estadísticos uestro objeto de estudio será pues el valor de una cierta variable

Más detalles

Variables estadísticas bidimensionales

Variables estadísticas bidimensionales Variables estadísticas bidimensionales BEITO J GOZÁLEZ RODRÍGUEZ (bjglez@ulles) DOMIGO HERÁDEZ ABREU (dhabreu@ulles) MATEO M JIMÉEZ PAIZ (mjimenez@ulles) M ISABEL MARRERO RODRÍGUEZ (imarrero@ulles) ALEJADRO

Más detalles

3 ANALISIS DESCRIPTIVO DE LOS DATOS

3 ANALISIS DESCRIPTIVO DE LOS DATOS 3 ANALISIS DESCRIPTIVO DE LOS DATOS 3.1 La tabulación de los datos 3.1.1 Tabla de distribución de frecuencias. 3.1.2 El histograma. 3.2 Medidas de tendencia central 3.2.1 La media. 3.2.2 La mediana. 3.2.3

Más detalles

FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- BLOQUE ESTADÍSTICA: ESTADÍSTICA VARIABLE UNIDIMENSIONAL. Estadística variable unidimensional

FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- BLOQUE ESTADÍSTICA: ESTADÍSTICA VARIABLE UNIDIMENSIONAL. Estadística variable unidimensional FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- Estadística variable unidimensional 1. Conceptos de Estadística 2. Distribución de frecuencias 2.1. Tablas de valores con variables continuas 3. Parámetros

Más detalles

Estadística ESTADÍSTICA

Estadística ESTADÍSTICA ESTADÍSTICA La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un estudio estadístico consta

Más detalles

MEDIDAS DE POSICIÓN CUANTILES CUARTILES DECILES CARLOS DARIO RESTREPO

MEDIDAS DE POSICIÓN CUANTILES CUARTILES DECILES CARLOS DARIO RESTREPO MEDIDAS DE POSICIÓN Las Medidas de Posición, también conocidas como Otras Medidas de Dispersión, son otras medidas o métodos que resultan ser más prácticos para precisar ciertas situaciones en las que

Más detalles

Tema 3: Estadística Descriptiva

Tema 3: Estadística Descriptiva Tema 3: Estadística Descriptiva Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 3: Estadística Descriptiva Curso 2008-2009 1 / 27 Índice

Más detalles

ESTADÍSTICA UNIDIMENSIONAL

ESTADÍSTICA UNIDIMENSIONAL ESTADÍSTICA UNIDIMENSIONAL DEFINICIÓN DE VARIABLE Una variable estadística es cada una de las características o cualidades que poseen los individuos de una población. TIPOS DE VARIABLE ESTADÍSTICAS Ø Variable

Más detalles

TEMA 14 ESTADÍSTICA. Cuantitativa: si puede medirse y expresarse con números (es una variable), por ejemplo la talla de calzado.

TEMA 14 ESTADÍSTICA. Cuantitativa: si puede medirse y expresarse con números (es una variable), por ejemplo la talla de calzado. Objetivos / Criterios de evaluación TEMA 14 ESTADÍSTICA O.15.1 Conocer el significado y saber calcular los parámetros de centralización y dispersión O.15.2 Interpretar y utilizar los parámetros de dispersión.

Más detalles

y = 2, entonces: a) x es más dispersa que y. b) son igual de dispersas. 9.- Sean dos variables estadísticas x e y con los siguientes valores x = 5, σ

y = 2, entonces: a) x es más dispersa que y. b) son igual de dispersas. 9.- Sean dos variables estadísticas x e y con los siguientes valores x = 5, σ VARIABLES ESTADÍSTICAS 1.- Sea X una variable estadística de media 2 metros y desviación típica 5 metros. Sea Y una variable estadística de media 24 cm y desviación típica 60 centímetros. a) Y es más dispersa

Más detalles

Estadística Inferencial. Estadística Descriptiva

Estadística Inferencial. Estadística Descriptiva INTRODUCCIÓN Estadística: Ciencia que trata sobre la teoría y aplicación de métodos para coleccionar, representar, resumir y analizar datos, así como realizar inferencias a partir de ellos. Recogida y

Más detalles

ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA Definición de Estadística: La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer

Más detalles

Conceptos de Estadística

Conceptos de Estadística Definición de Estadística La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Conceptos de Estadística

Más detalles

ESTADÍSTICA. 1. Introducción. 2. Frecuencias

ESTADÍSTICA. 1. Introducción. 2. Frecuencias ESTADÍSTICA Jesús García de Jalón de la Fuente 1. Introducción La Estadística trata de describir colectividades formadas por un gran número de objetos. El conjunto de los objetos que se estudian se denomina

Más detalles

ESTADÍSTICA DESCRIPTIVA EN POCAS PALABRAS (por jmd matetam.com)

ESTADÍSTICA DESCRIPTIVA EN POCAS PALABRAS (por jmd matetam.com) ESTADÍSTICA DESCRIPTIVA EN POCAS PALABRAS (por jmd matetam.com) ESTADÍSTICA DESCRIPTIVA EN POCAS PALABRAS... 1 DEFINICIONES BÁSICAS... 1 Estadística... 1 Estadística descriptiva... 1 Estadística inferencial...

Más detalles

ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL. 30/09/2004 Proyecto MaMaEuSch 1

ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL. 30/09/2004 Proyecto MaMaEuSch 1 ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL 0/09/2004 Proyecto MaMaEuSch Estadística Ciencia que trata sobre los métodos científicos para: Recoger, organizar, resumir y analizar datos Sacar conclusiones relevantes

Más detalles

INTRODUCCIÓN. Fenómeno Real. Aprendizaje sobre el fenómeno. Análisis Estadístico. Datos Observados

INTRODUCCIÓN. Fenómeno Real. Aprendizaje sobre el fenómeno. Análisis Estadístico. Datos Observados ESTADÍSTICA INTRODUCCIÓN Qué es la estadística?. - Es la rama de las matemáticas que estudia la recolección, análisis e interpretación de datos. Por qué estudiamos estadística? - Aprender sobre fenómenos

Más detalles

ESTADÍSTICA. A su vez, las variables pueden ser :

ESTADÍSTICA. A su vez, las variables pueden ser : ESTADÍSTICA La ESTADÍSTICA es una rama de las Matemáticas que recoge, ordena, analiza e interpreta datos relativos a un conjunto de personas o cosas ( POBLACIÓN ). La población es FINITA cuando lo es el

Más detalles

UNIDAD 8. ESTADÍSTICA

UNIDAD 8. ESTADÍSTICA UNIDAD 8. ESTADÍSTICA La Estadística es la rama de las Matemáticas que se ocupa de la recopilación y ordenación de datos para su posterior análisis. 1. Población y muestra. Población. Es el conjunto de

Más detalles

Tema 9: Estadística en dos variables (bidimensional)

Tema 9: Estadística en dos variables (bidimensional) Tema 9: Estadística en dos variables (bidimensional) 1. Distribución de frecuencias bidimensional En el tema anterior se han estudiado las distribuciones unidimensionales obtenidas al observar sólo un

Más detalles

Tema 8: Distribuciones Unidimensionales y Distribuciones Bidimensionales. Consideraciones iniciales:

Tema 8: Distribuciones Unidimensionales y Distribuciones Bidimensionales. Consideraciones iniciales: Tema 8: Distribuciones Unidimensionales y Distribuciones Bidimensionales. Consideraciones iniciales: - Población: Es el conjunto de todos los elementos que cumplen una determinada característica. Ej.:

Más detalles

Estadística de dos variables

Estadística de dos variables Versión: Estadística de dos variables 19 de septiembre de 013 1 Introducción En el Tema 1 se consideran las variables estadísticas unidimensionales, es decir, cada individuo de la muestra se describe de

Más detalles

Estadística Descriptiva en R: Parámetros y estadísticos. José Enrique Martín García Universidad Politécnica de Gimialcón (Copyright 2016)

Estadística Descriptiva en R: Parámetros y estadísticos. José Enrique Martín García Universidad Politécnica de Gimialcón (Copyright 2016) Estadística Descriptiva en R: Parámetros y estadísticos José Enrique Martín García Universidad Politécnica de Gimialcón (Copyright 2016) Parámetros y Estadísticos Parámetro: Es una cantidad numérica calculada

Más detalles

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2 PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2 Preg. 1. Para comparar la variabilidad relativa de la tensión arterial diastólica y el nivel de colesterol en sangre de una serie de individuos, utilizamos

Más detalles

Sumario Prólogo Unidad didáctica 1. Introducción a la estadística. Conceptos preliminares Objetivos de la Unidad...

Sumario Prólogo Unidad didáctica 1. Introducción a la estadística. Conceptos preliminares Objetivos de la Unidad... ÍNDICE SISTEMÁTICO PÁGINA Sumario... 5 Prólogo... 7 Unidad didáctica 1. Introducción a la estadística. Conceptos preliminares... 9 Objetivos de la Unidad... 11 1. Población y muestra... 12 2. Parámetro

Más detalles

TEMA 8: ESTADÍSTICA. 8.1 Elementos de la Estadística. 8.2 Parámetros estadísticos. 8.3 Parámetros de posición para datos aislados.

TEMA 8: ESTADÍSTICA. 8.1 Elementos de la Estadística. 8.2 Parámetros estadísticos. 8.3 Parámetros de posición para datos aislados. TEMA 8: ESTADÍSTICA 8.1 Elementos de la Estadística. 8.2 Parámetros estadísticos. 8.3 Parámetros de posición para datos aislados. 8.1 Elementos de la Estadística. Es la parte de las Matemáticas que estudia

Más detalles

1. Caracteres estadísticos

1. Caracteres estadísticos http://www.cepamarm.es ACFGS - Matemáticas ESG - 03/2013 Pág. 2 de 14 1. Caracteres estadísticos 1.1. Carácter estadístico Es una propiedad que se estudia en los individuos de una población. Puede ser:

Más detalles

Apuntes de Estadística

Apuntes de Estadística Apuntes de Estadística La Estadística es la ciencia que se encarga de recoger, organizar, describir e interpretar datos referidos a distintos fenómenos para, posteriormente, analizarlos e interpretarlos.

Más detalles

Estadística. Análisis de datos.

Estadística. Análisis de datos. Estadística Definición de Estadística La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un

Más detalles

Un estudio estadístico consta de las siguientes fases: Recogida de datos. Organización y representación de datos. Análisis de datos.

Un estudio estadístico consta de las siguientes fases: Recogida de datos. Organización y representación de datos. Análisis de datos. La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un estudio estadístico consta de las siguientes

Más detalles

Estadística Descriptiva

Estadística Descriptiva Ignacio Cascos Fernández Departamento de Estadística Universidad Carlos III de Madrid Estadística Descriptiva Estadística I curso 2008 2009 1. Definiciones fundamentales La Estadística Descriptiva se ocupa

Más detalles

ESTADÍSTICA. Rincón del Maestro:

ESTADÍSTICA. Rincón del Maestro: ESTADÍSTICA Definición de Estadística La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Conceptos

Más detalles

Distribuciones Bidimensionales.

Distribuciones Bidimensionales. Distribuciones Bidimensionales. 1.- Variables Estadísticas Bidimensionales. Las variables estadísticas bidimensionales se representan por el par (X, Y) donde, X es una variable unidimensional, e Y es otra

Más detalles

Tema 1: Estadística descriptiva. Probabilidad y Estadística (Ing. Informática). Tema 1: Estadística descriptiva 1

Tema 1: Estadística descriptiva. Probabilidad y Estadística (Ing. Informática). Tema 1: Estadística descriptiva 1 Tema 1: Estadística descriptiva Probabilidad y Estadística (Ing. Informática). Tema 1: Estadística descriptiva 1 Introducción Objetivo: estudiar una característica o variable en una población. Ejemplos:

Más detalles

Estadística unidimensional

Estadística unidimensional Estadística unidimensional Población y muestra Población Se llama población al conjunto bien delimitado de unidades (elementos), ya sean individuos u objetos, del que se interesa observar o medir alguna

Más detalles

Estadística Descriptiva en SPSS

Estadística Descriptiva en SPSS Estadística Descriptiva en SPSS Marcelo Rodríguez Ingeniero Estadístico - Magister en Estadística Universidad Católica del Maule Facultad de Ciencias Básicas Pedagogía en Matemática Estadística I 22 de

Más detalles

Estadística Descriptiva 2da parte

Estadística Descriptiva 2da parte Universidad Nacional de Mar del Plata Facultad de Ingeniería Estadística Descriptiva 2da parte 2 Cuatrimestre 2018 COMISIÓN :1. Prof. Dr. Juan Ignacio Pastore. Qué es la estadística? El contenido de la

Más detalles

1. Conceptos de Regresión y Correlación. 2. Variables aleatorias bidimensionales. 3. Ajuste de una recta a una nube de puntos

1. Conceptos de Regresión y Correlación. 2. Variables aleatorias bidimensionales. 3. Ajuste de una recta a una nube de puntos TEMA 10 (curso anterior): REGRESIÓN Y CORRELACIÓN 1 Conceptos de Regresión y Correlación 2 Variables aleatorias bidimensionales 3 Ajuste de una recta a una nube de puntos 4 El modelo de la correlación

Más detalles

Estadística Estadística descriptiva bivariante

Estadística Estadística descriptiva bivariante Estadística Estadística descriptiva bivariante Vamos a medir dos características (variables) sobre cada individuo. Las variables pueden ser cuantitativas o cualitativas combinadas de todas las formas posibles

Más detalles

COLEGIO CALASANCIO. MADRID. ESTADÍSTICA UNIDIMENSIONAL. 4º E.S.O.

COLEGIO CALASANCIO. MADRID. ESTADÍSTICA UNIDIMENSIONAL. 4º E.S.O. Repasa de cursos anteriores: Estadística. Población. Muestra. Carácter estadístico: cualitativo (modalidad) y cuantitativo (variable estadística), que puede ser (discreta y continua] Frecuencias: absolutas

Más detalles

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 4)

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 4) OBJETIVOS DE APRENDIZAJE: TEMA Nº ANÁLISIS CONJUNTO DE DOS VARIABLES Distinguir entre variables cualitativas y cuantitativas, y saber elegir los métodos en cada caso. Conocer métodos gráficos y cuantitativos

Más detalles

Estadística para el análisis de los Mercados S2_A1.1_LECV1

Estadística para el análisis de los Mercados S2_A1.1_LECV1 5. Parámetros estadísticos. 5.1. Parámetros de centralización. Estos parámetros nos indican en torno a que puntos se encuentran los valores de la variable cuantitativa en estudio. Es la forma de representar

Más detalles

IMADIL /10/2014

IMADIL /10/2014 TEMA 3: Características estadísticas fundamentales (Segunda parte: Dispersión y forma) Ignacio Martín y José Luis Padilla IMADIL 2014-2015 2 POSICIÓN DISPERSIÓN ESTADÍSTICOS SIMETRÍA APUNTAMIENTO 3. ESTADÍSTICOS

Más detalles

ESTADÍSTICA 1.- NOCIONES GENERALES

ESTADÍSTICA 1.- NOCIONES GENERALES ESTADÍSTICA 1.- NOCIONES GENERALES : Conjunto de elementos cuyo conocimiento es objeto de estudio. Ejemplo: Jóvenes de Laguna de Duero. : Parte de la población cuyo estudio sirve para inferir características

Más detalles

Estadística aplicada al Periodismo

Estadística aplicada al Periodismo Estadística aplicada al Periodismo Temario de la asignatura Introducción. Análisis de datos univariantes. Análisis de datos bivariantes. Series temporales y números índice. Probabilidad y Modelos probabilísticos.

Más detalles

ESTADÍSTICA. Individuo. Es cada uno de los elementos que forman la población o muestra.

ESTADÍSTICA. Individuo. Es cada uno de los elementos que forman la población o muestra. ESTADÍSTICA La estadística tiene por objeto el desarrollo de técnicas para el conocimiento numérico de un conjunto de datos empíricos (recogidos mediante experimentos o encuestas). Según el colectivo a

Más detalles

Tablas estadísticas bidimensionales. Regresión y correlación lineal. Coe ciente de correlación. Signi cado y aplicaciones

Tablas estadísticas bidimensionales. Regresión y correlación lineal. Coe ciente de correlación. Signi cado y aplicaciones Tema 62 Tablas estadísticas bidimensionales Regresión y correlación lineal Coe ciente de correlación Signi cado y aplicaciones 621 Introducción Consideremos una población de n individuos descritos simultáneamente

Más detalles

Muestra Una muestra es una parte de la población que elegimos para estudiar la población.

Muestra Una muestra es una parte de la población que elegimos para estudiar la población. 1.- TERMINOLOGÍA ESTADÍSTICA. TÉCNICAS DE SELECCIÓN DE MUESTRAS Estadística descriptiva Es la ciencia que estudia conjuntos de datos obtenidos de la realidad. Estos datos son interpretados mediante tablas,

Más detalles

478 Índice alfabético

478 Índice alfabético Índice alfabético Símbolos A, suceso contrario de A, 187 A B, diferencia de los sucesos A y B, 188 A/B, suceso A condicionado por el suceso B, 194 A B, intersección de los sucesos A y B, 188 A B, unión

Más detalles

1 POBLACIÓN Y MUESTRA

1 POBLACIÓN Y MUESTRA 1 POBLACIÓN Y MUESTRA Estadística.- es la rama de las matemáticas que se encarga de describir y analizar datos de un estudio, y obtener consecuencias válidas del estudio. Población.- es el conjunto de

Más detalles

Estadística Administrativa Diplomatura en Gestión y Administración Pública Curso Segundo Facultad de Derecho Universidad de Sevilla

Estadística Administrativa Diplomatura en Gestión y Administración Pública Curso Segundo Facultad de Derecho Universidad de Sevilla Estadística Administrativa Diplomatura en Gestión y Administración Pública Curso Segundo Facultad de Derecho Universidad de Sevilla Tema 8 Regresión y correlación de dos variables Versión 2006-2007α José

Más detalles

M Dolores Redondas Curso

M Dolores Redondas Curso M Dolores Redondas dolores.redondas@upm.es E.U. Arquitectura Técnica U.P.M. Curso 2009-2010 2 Problemas básicos de la estadística aplicada Algunos problemas básicos que suelen presentarse en la investigación

Más detalles

Medidas Descriptivas Numéricas

Medidas Descriptivas Numéricas Percentiles, Deciles y Cuartiles Además de las medidas de tendencia central, dispersión y forma, también existen algunas medidas interesantes de posición que se utilizan al resumir y analizar las características

Más detalles

TEMA 14: ESTADÍSTICA 1. CONCEPTOS ESTADÍSTICOS

TEMA 14: ESTADÍSTICA 1. CONCEPTOS ESTADÍSTICOS 1. CONCEPTOS ESTADÍSTICOS TEMA 14: ESTADÍSTICA Población: conjunto formado por todos los individuos sobre los que se realiza un estudio. (ejercicio 1 cuestionario) Muestra: subconjunto de la población

Más detalles

SELECCIÓN Y SECUENCIACIÓN DE CONTENIDOS PARA MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I. BLOQUE 1 : ARITMÉTICA Y ÁLGEBRA

SELECCIÓN Y SECUENCIACIÓN DE CONTENIDOS PARA MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I. BLOQUE 1 : ARITMÉTICA Y ÁLGEBRA SELECCIÓN Y SECUENCIACIÓN DE CONTENIDOS PARA MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I. BLOQUE 1 : ARITMÉTICA Y ÁLGEBRA Se comenzará el curso, si el profesor lo considera necesario, con un pequeño

Más detalles

Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va

Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va Jesús Fernández Fernández Carmen María Sordo García DEPARTAMENTO DE MATEMÁTICA APLICADA Y CIENCIAS DE LA COMPUTACIÓN UNIVERSIDAD DE CANTABRIA

Más detalles

Regresión y Correlación

Regresión y Correlación Relación de problemas 4 Regresión y Correlación 1. El departamento comercial de una empresa se plantea si resultan rentables los gastos en publicidad de un producto. Los datos de los que dispone son: Beneficios

Más detalles

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada. ANEXO 1. CONCEPTOS BÁSICOS Este anexo contiene información que complementa el entendimiento de la tesis presentada. Aquí se exponen técnicas de cálculo que son utilizados en los procedimientos de los modelos

Más detalles

En este caso la variable X es el n de hijos, es por tanto una variable discreta. Veamos todas las frecuencias.

En este caso la variable X es el n de hijos, es por tanto una variable discreta. Veamos todas las frecuencias. ESTADÍSTICA DESCRIPTIVA Concepto v finalidad En los municipios existen unos censos de los ciudadanos con datos de su edad, sexo, residencia, trabajo, etc. Pero si se desea conocer, para lanzar un producto

Más detalles

MEDIDAS DE DISPERSIÓN Y ASIMETRÍA DE UNA DISTRIBUCIÓN DE FRECUENCIAS

MEDIDAS DE DISPERSIÓN Y ASIMETRÍA DE UNA DISTRIBUCIÓN DE FRECUENCIAS MEDIDAS DE DISPERSIÓN Y ASIMETRÍA DE UNA DISTRIBUCIÓN DE FRECUENCIAS www.cedicaped.com MEDIDAS DE DISPERSIÓN En clases anteriores se definieron algunas medidas de centralización, entre ellas, la más utilizada:

Más detalles

Análisis de datos y gestión n veterinaria. Tema 1 Estadística descriptiva. Prof. Dr. José Manuel Perea Muñoz

Análisis de datos y gestión n veterinaria. Tema 1 Estadística descriptiva. Prof. Dr. José Manuel Perea Muñoz Análisis de datos y gestión n veterinaria Tema 1 Estadística descriptiva Prof. Dr. José Manuel Perea Muñoz Departamento de Producción Animal Facultad de Veterinaria Universidad de Córdoba Córdoba, de Septiembre

Más detalles

MÓDULO III. MEDIDAS DE TENDENCIA CENTRAL, DISPERSIÓN Y ASIMETRÍA

MÓDULO III. MEDIDAS DE TENDENCIA CENTRAL, DISPERSIÓN Y ASIMETRÍA 1 UNIVERSIDAD NACIONAL EXPERIMENTAL DE LOS LLANOS OCCIDENTALES EZEQUIEL ZAMORA VICE-RECTORADO DE PLANIFICACIÓN Y DESARROLLO SOCIAL PROGRAMA CIENCIAS SOCIALES Y JURIDICAS SUBPROGRAMA ADMINISTRACIÓN SUBPROYECTO:

Más detalles

TEMA 4 CUESTIONARIO DE AUTOEVALUACIÓN

TEMA 4 CUESTIONARIO DE AUTOEVALUACIÓN 4.5.- En cuál de los siguientes casos se podría utilizar la varianza residual en lugar del coeficiente de determinación para medir la calidad del ajuste? Con el mismo conjunto de datos y dos ajustes distintos.

Más detalles

DISTRIBUCIONES BIDIMENSIONALES

DISTRIBUCIONES BIDIMENSIONALES RESUMEN DISTRIBUCIONES BIDIMENSIONALES J. Vega RELACIONES LABORALES ESTADÍSTICA 15 de noviembre de 2008 RESUMEN 1 DISTRIBUCIONES BIDIMENSIONALES DISTRIBUCIÓN CONJUNTA DISTRIBUCIONES MARGINALES DISTRIBUCIONES

Más detalles

2. ESTADÍSTICAS BIDIMENSIONALES

2. ESTADÍSTICAS BIDIMENSIONALES TEMA. ESTADÍSTICAS BIDIMENSIONALES.... Definición. Objetivos.... Coeficiente de Correlación. Lineal... 4 3. Rectas de regresión.... 7 . Definición. Objetivos En el tema anterior hemos estudiado las distribuciones

Más detalles

ANÁLISIS DE DATOS UNIDIMENSIONALES

ANÁLISIS DE DATOS UNIDIMENSIONALES ANÁLISIS DE DATOS UNIDIMENSIONALES TABLAS DE FRECUENCIAS Y REPRESENTACIONES GRÁFICAS MEDIDAS DE POSICIÓN MEDIDAS DE TENDENCIA CENTRAL MEDIA ARITMÉTICA OTRAS MEDIAS: GEOMÉTRICA.ARMÓNICA.MEDIA GENERAL MEDIANA

Más detalles

TEMA 2: DISTRIBUCIONES BIDIMENSIONALES

TEMA 2: DISTRIBUCIONES BIDIMENSIONALES TEMA : DISTRIBUCIONES BIDIMENSIONALES 1.- DISTRIBUCIONES BIDIMENSIONALES Cuando estudiamos un solo carácter estadístico, los datos que obtenemos forman una variable estadística unidimensional. También

Más detalles

Tabla de frecuencias Los datos obtenidos en estadística se organizan en una tabla, llamada tabla de frecuencias.

Tabla de frecuencias Los datos obtenidos en estadística se organizan en una tabla, llamada tabla de frecuencias. 1º BACHILLERATO D MATEMÁTICAS CC SS TEMA 5.- ESTADÍSTICA DESCRIPTIVA PROFESOR: RAFAEL NÚÑEZ NOGALES -------------------------------------------------------------------------------------------------------------

Más detalles

Tema 3: Análisis de datos bivariantes

Tema 3: Análisis de datos bivariantes Tema 3: Análisis de datos bivariantes 1 Contenidos 3.1 Tablas de doble entrada. Datos bivariantes. Estructura de la tabla de doble entrada. Distribuciones de frecuencias marginales. Distribución conjunta

Más detalles

Estadística Administrativa Diplomatura en Gestión y Administración Pública Test de autocomprobación COMP. RESUELTO. Parámetros y complementos

Estadística Administrativa Diplomatura en Gestión y Administración Pública Test de autocomprobación COMP. RESUELTO. Parámetros y complementos Estadística Administrativa Diplomatura en Gestión y Administración Pública Test de autocomprobación 04-06-06-COMP. RESUELTO. Parámetros y complementos José A. Mayor Gallego Departamento de Estadística

Más detalles

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA 2)

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA 2) OBJETIVOS DE APRENDIZAJE: TEMA 2 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN Conocer las características de las principales medidas de tendencia central (media aritmética, mediana y moda) y de posición

Más detalles

Universidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL

Universidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL Universidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL OBJETIVO Analizar las Diferentes formas de Describir la Relación entre dos variables numéricas Trazar un diagrama de dispersión

Más detalles

Tema 1. Estadística Unidimensional

Tema 1. Estadística Unidimensional Tema 1. Estadística Unidimensional 1. Conceptos Básicos. Gráfcas estadísticas 3. Medidas de centralización y dispersión: media, rango, desviación típica, coefciente de variación 4. Medidas de posición:

Más detalles

UNIDAD 7 Medidas de dispersión

UNIDAD 7 Medidas de dispersión UNIDAD 7 Medidas de dispersión UNIDAD 7 MEDIDAS DE DISPERSIÓN Al calcular un promedio, por ejemplo la media aritmética no sabemos su representatividad para ese conjunto de datos. La información suministrada

Más detalles

Qué es? Primer paso Representación en un sistema de coordenadas. numéricos Cada punto muestra el valor de cada pareja de datos (X e Y)

Qué es? Primer paso Representación en un sistema de coordenadas. numéricos Cada punto muestra el valor de cada pareja de datos (X e Y) Gráfico de dispersión Qué es? Primer paso Representación en un sistema de coordenadas cartesianas de los datos numéricos Cada punto muestra el valor de cada pareja de datos (X e Y) Gráfico de dispersión

Más detalles

Cuaderno de actividades 1º

Cuaderno de actividades 1º Cuaderno de actividades 1º 1 ITRODUCCIÓ: Variables estadísticas bidimensionales En numerosas ocasiones interesa estudiar simultáneamente dos (o más) caracteres de una población En el caso de dos (o más)

Más detalles

Tema 1: Análisis de datos univariantes

Tema 1: Análisis de datos univariantes Tema 1: Análisis de datos univariantes 1 En este tema: Conceptos fundamentales: muestra y población, variables estadísticas. Variables cualitativas o cuantitativas discretas: Distribución de frecuencias

Más detalles

Tabla de frecuencias agrupando los datos Cuando hay muchos valores distintos, los agruparemos en intervalos (llamados clases) de la misma amplitud.

Tabla de frecuencias agrupando los datos Cuando hay muchos valores distintos, los agruparemos en intervalos (llamados clases) de la misma amplitud. 1. TABLAS Y GRÁFICOS ESTADÍSTICOS Estadística Es la ciencia que estudia conjunto de datos obtenidos de la realidad. Estos datos son interpretados mediante tablas, gráficas y otros parámetros tales como

Más detalles

Medidas de dispersión. Rango o recorrido. Desviación media. Medidas de dispersión

Medidas de dispersión. Rango o recorrido. Desviación media. Medidas de dispersión Inicio Aritmética Álgebra Geometría Cálculo Estadística Trigonometría A B C D E F G H I J K L M N O P Q R S T U V W X Y Z Medidas de dispersión Las medidas de dispersión nos informan sobre cuánto se alejan

Más detalles

CUESTIONES Y PROBLEMAS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES PROPUESTOS EN EXÁMENES

CUESTIONES Y PROBLEMAS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES PROPUESTOS EN EXÁMENES TUTORÍA DE INTRODUCCIÓN A LA ESTADÍSTICA (º A.D.E.) CUESTIONES Y PROBLEMAS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES PROPUESTOS EN EXÁMENES 1º) Qué ocurre cuando r = 1: a) Los valores teóricos no

Más detalles

Tema 2: Estadísticos. Bioestadística. U. Málaga. Tema 2: Estadísticos 1

Tema 2: Estadísticos. Bioestadística. U. Málaga. Tema 2: Estadísticos 1 Bioestadística Tema 2: Estadísticos Tema 2: Estadísticos 1 Parámetros y estadísticos Parámetro: Es una cantidad numérica calculada sobre una población La altura media de los individuos de un país La idea

Más detalles

Temas de Estadística Práctica

Temas de Estadística Práctica Temas de Estadística Práctica Antonio Roldán Martínez Proyecto http://www.hojamat.es/ Tema 2: Medidas de tipo paramétrico Resumen teórico Medidas de tipo paramétrico Medidas de tendencia central Medidas

Más detalles

RELACIÓN 1. DESCRIPTIVA

RELACIÓN 1. DESCRIPTIVA RELACIÓN 1. DESCRIPTIVA 1. En un estudio sobre el número de bacterias que aparecen en determinados cultivos se tomaron 1 de estos cultivos y se contó el número de bacterias que aparecieron en cada uno

Más detalles

D I S T R I B U C I O N E S B I D I M E N S I O N A L E S

D I S T R I B U C I O N E S B I D I M E N S I O N A L E S D I S T R I B U C I O N E S B I D I M E N S I O N A L E S 1. VARIABLES ESTADÍSTICAS BIDIMENSIONALES En numerosas ocasiones interesa estudiar simultáneamente dos (o más) caracteres de una población. En

Más detalles

TEMA 7. ESTADÍSTICA. INDIVÍDUO: Es cada uno de los elementos que forman la población o la muestra.

TEMA 7. ESTADÍSTICA. INDIVÍDUO: Es cada uno de los elementos que forman la población o la muestra. TEMA 7. ESTADÍSTICA ACCESO CICLO SUPERIOR En esta sociedad resulta imprescindible disponer de técnicas que permitan obtener, de forma sencilla y fiable, información de los diferentes conjuntos de datos

Más detalles

Cátedra: Estadística Técnica Facultad de Ingeniería UNCuyo. Índice D. Fernández & M. Guitart TABLA DE CONTENIDOS

Cátedra: Estadística Técnica Facultad de Ingeniería UNCuyo. Índice D. Fernández & M. Guitart TABLA DE CONTENIDOS Cátedra: TABLA DE CONTENIDOS INTRODUCCIÓN Qué es la Probabilidad? Qué es la Estadística? La evolución histórica de la Estadística Algunos conceptos imprescindibles Fuentes de datos Tipos de datos y escalas

Más detalles

Programa Oficial de Asignatura. Ficha Técnica. Presentación. Competencias y/o resultados del aprendizaje. Estadística

Programa Oficial de Asignatura. Ficha Técnica. Presentación. Competencias y/o resultados del aprendizaje. Estadística Ficha Técnica Titulación: Grado en Administración y Dirección de Empresas Plan BOE: BOE número 67 de 19 de marzo de 2014 Asignatura: Módulo: Métodos cuantitativos de la empresa Curso: 1º Créditos ECTS:

Más detalles

El Método Científico. Metodología de Investigación. Te sifón Parrón

El Método Científico. Metodología de Investigación. Te sifón Parrón El Método Científico Metodología de Investigación Te sifón Parrón Bioestadística Para qué sirve la Bioestadística? DESCRIPTIVA Sistematización, recogida, ordenación y presentación de los datos referentes

Más detalles

UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO

UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO CENTRO UNIVERSITARIO UAEM ZUMPANGO LICENCIATURA EN TURISMO UNIDAD DE APRENDIZAJE: ESTADISTICA TEMA 1.5 : ESTADISTICA DESCRIPTIVA M. EN C. LUIS ENRIQUE KU MOO FECHA:

Más detalles