Tema 1: Estadística Descriptiva

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Tema 1: Estadística Descriptiva"

Transcripción

1 Estadística 4 Tema : Estadística Descriptiva Definición Población es cualquier conjunto de datos, objetivo de nuestro interés que caracteriza un fenómeno que nos interesa Definición 2 Muestra es un subconjunto de una población determinada Interesan aquellas muestras que representan fielmente a la población En ocasiones se utilizan las palabras población y muestra para representar los objetos que se someten a medición Definición La Estadística Descriptiva es la rama de la Estadística dedicada a la recogida, recopilación y reducción de unos datos a unas pocas medidas descriptivas y gráficos, permitiendo conocer las características existentes en la población o conjunto de datos Definición 4 La Inferencia Estadística tiene por objeto obtener conocimientos sobre ciertas poblaciones a partir de las observaciones relativas a una muestra Su instrumento matemático es el Cálculo de Probabilidades Variables estadísticas Se va a trabajar con conjuntos de datos asociados al carácter o característica objeto de estudio, que denominaremos variable estadística y se representará por una letra mayúscula: X, Y, Z,A partir de ahora nos referiremos a los conjuntos de datos como variables Como en esta parte se va a tratar de describir y analizar estas variables, debemos distinguir los distintos tipos de variables que hay, lo cual nos va a permitir utilizar las herramientas estadísticas apropiadas Tipos de variables Las variables estadísticas pueden ser de dos tipos: Variables cualitativas o atributos: describen cualidades y no toman valores numéricos Ejemplos: Provincias españolas, países de la U E, nivel de estudios, meses del año, clasificar una pieza como aceptable o defectuosa, 2 Variables cuantitativas: toman valores numéricos A su vez pueden ser: Discretas: Sólo toman un número finito o infinito numerable de valores distintos (generalmente números naturales o enteros) Ejemplos: número de compras de un producto en un mes, el año de fabricación de un vehículo, número de entradas de cine vendidas en un intervalo de tiempo, resultado de lanzar un dado, número de hijos,

2 Estadística 5 Continuas: Toman valores en un intervalo de IR Generalmente corresponden a medir magnitudes continuas, por ejemplo, peso, altura, temperatura, intensidad de corriente, el tiempo entre dos llamadas telefónicas, el tiempo de servicio o de operación de una máquina, etc Una característica esencial de este tipo de variables es que sus valores nunca son observables con exactitud, sino que dependen (las observaciones) de la precisión del instrumento de medida Se va a suponer que el orden en que se recogen los datos es irrelevante Cuando los datos se observan con una pauta fija (cada hora, semana, etc), constituyen una serie temporal, y su análisis requiere otras técnicas especiales, que tengan en cuenta que el orden de los datos influye A los distintos resultados que pueden presentar las variables estadísticas los denominaremos modalidades Ejemplo: Si la característica es el gusto, puede presentar cuatro modalidades: dulce, amargo, salado y ácido Si es el sexo: hombre y mujer 2 Presentación de datos La forma más elemental de presentar los datos es por medio de una matriz en la que aparecen en la primera columna los individuos, representados de alguna forma (en muchas ocasiones se suele prescindir de esta columna) y en las restantes columnas las observaciones de las distintas variables (o características) en estudio para cada uno de los individuos Se la conoce como matriz de datos (Presentación típica de hoja de cálculo) Ejemplo: edad especialidad sexo Individuo 2 Estructuras mujer Individuo 2 9 Construcción de Maqu hombre Individuo 9 Construcción de Maqu hombre Individuo 4 8 Estructuras mujer Individuo 5 20 Construcción de Maqu hombre ormalmente se reserva el nombre de matriz de datos a la obtenida de la anterior, eliminando la primera columna Cuando se estudia una sola variable, otra forma usual de presentar los datos es por medio de una matriz en la que cada valor corresponde a un individuo de la población Ejemplo: Edades de 40 individuos encuestados:

3 Estadística 6 Agrupación en clases En ocasiones, y con objeto de facilitar la toma o presentación de datos cuantitativos, estos se agrupan en intervalos o clases Por ejemplo, es más sencillo anotar cuántos individuos hay en una muestra con una estatura entre 70 y 80, que anotar exactamente la estatura de todos o obstante, siempre se producirá una pérdida de información al agrupar los datos en intervalos, y dado que el uso de ordenadores y programas de cálculo suelen ser corriente, se suelen tratar los datos sin agrupar salvo para algunos resúmenes gráficos, cuando el número de valores distintos que toma una variable discreta sea grande, o cuando ésta sea continua La primera cuestión que se nos plantea es elegir el número de clases y la longitud de cada clase Si es posible, es recomendable que todas las clases tengan la misma longitud En cuanto al número de clases, en general, se recomienda utilizar entre 5 y 20 ó 25 clases, de forma que ninguna contenga menos de 5 datos Existen distintos criterios, para determinar un número adecuado de clases, todos ellos en función del número de datos osotros utilizaremos para obtener una aproximación al número de clases k a utilizar la fórmula de Sturges donde k es el entero más próximo a + 0 log 0 siendo el número de datos o individuos Existen otros criterios, por ejemplo tomar k el entero más próximo a En general, el número de clases debe ser suficientemente grande para que no se pierda excesiva información, pero no tanto que se pierda la simplicidad de la representación Las clases o intervalos en que se agrupen los datos deben cumplir: Ser disjuntas: un dato no puede estar en dos clases a la vez Ser exhaustivas: es decir, abarcar todo el rango de posibles valores de la variable Estar ordenadas de menor a mayor En general, la forma de las clases que utilizaremos será: (L 0,L ], (L,L 2 ], (L k,l k ] Elementos asociados a las clases o intervalos: Límites: L i,l i (límite inferior y límite superior, respectivamente) Amplitud de la clase: b i = L i L i Marca de la clase: c i = L i+l i 2 Observación La marca de clase se considera el valor representativo de todos los valores de su intervalo Por ello, deben elegirse los intervalos de forma que la marca sí sea un valor representativo Puede ocurrir que la marca de clase tenga más cifras decimales que los datos (es decir, que no corresponda a un valor realmente observable) y lo mismo puede ocurrir con los límites de clase A veces, el primer y último intervalo, tienen respectivamente, el extremo inferior y superior indeterminados, con objeto de incluir observaciones poco frecuentes Ejemplo de agrupación en clases: Edades de 40 individuos encuestados:

4 Estadística 7 Agrupación en clases: Clases o de datos (0,5] 7 (5,20] 8 (20,25] 6 (25,0] 5 (0,5] 8 (5,40] 6 En este caso el número de clases es 6, los límites son 0, 5, 20, 25, 0, 5 y 40; la amplitud es en todas las clases es 5 y las marcas son, respectivamente: 25, 75, 225, 275, 25 y 75 2 Distribuciones univariantes A partir de ahora, vamos a considerar que tenemos datos correspondientes a una sola variable estadística, que denominaremos X (Se corresponderá a tratar con una de las columnas de la matriz de datos ya vista) Definición 5 Elementos que utilizaremos para resumir la información que ofrecen nuestros datos: Se denomina frecuencia total al número total de individuos observados o número total de datos, Se denomina frecuencia absoluta de la modalidad M i (valor x i o intervalo I i ), al número de individuos o número de datos que presentan esta modalidad, n i Se denomina frecuencia relativa de la modalidad M i (valor x i o intervalo I i ), al cociente f i = n i Si la variable considerada es cuantitativa, se pueden definir además: Se denomina frecuencia absoluta acumulada hasta la modalidad M i, (valor x i o intervalo I i ) al número de individuos o número de datos, i, que presentan una modalidad menor o igual que ésta; se define como i = n +n 2 + +n i = i j= n j Se denomina frecuencia relativa acumulada hasta la modalidad M i, (valor x i o intervalo I i ) al cociente: F i = i o F i = f +f 2 + +f i = i j= f j Definición 6 Se dice que se ha dado la distribución de frecuencias (absolutas, relativas, absolutas acumuladas o relativas acumuladas) de la variable estadística X si se dan las distintas modalidades de la variable y las correspondientes frecuencias (absolutas, relativas, absolutas acumuladas o relativas acumuladas, respectivamente) de cada modalidad En ese caso, hablaremos de datos agrupados por frecuencias

5 Estadística 8 La forma de dar estos valores es por medio de tablas, en las que aparecen una primera columna con las distintas modalidades de la variable (ordenadas de menor a mayor, si la variable es cuantitativa) y columnas correspondientes a las frecuencias absolutas, relativas, absolutas acumuladas y relativas acumuladas (estas dos últimas cuando tengan sentido) M i n i f i i F i M n f F M 2 n 2 f 2 2 F 2 M k n k f k k = F k = Propiedades Propiedades de las tablas: - - k n i = k f i = - k = - F k = - Las frecuencias relativas y las frecuencias relativas acumuladas pueden interpretarse como porcentajes (tantos por ciento) de la siguiente forma: f i 00% es el tanto por ciento de datos o individuos que están en la modalidad M i F i 00% es el tanto por ciento de datos o individuos que están en las modalidades M,M 2,M i Tablas para datos agrupados: Cuando los datos aparecen agrupados por clases, se habla de frecuencias absolutas, relativas, absolutas acumuladas y relativas acumuladas de cada clase En este caso, las tablas de frecuencias tienen la forma: En el ejemplo anterior: (L i L i ] c i n i f i i F i (L 0,L ] c n f F (L,L 2 ] c 2 n 2 f 2 2 F 2 (L k,l k ] c k n k f k k F k (L i L i ] c i n i f i i F i (0, 5] (5, 20] (20, 25] (25, 0] (0, 5] (5, 40] Seobserva cómo en este caso, la marca declase puedeno ser unvalor posibledela variable, peroconserva su significado de valor representativo de todos los datos del intervalo

6 Estadística 9 Observación 2 Al escribir una tabla es conveniente tener en cuenta los siguientes convenios para evitar ambigüedades: Indicar la unidad de medida de cada variable Indicar con un 0 los valores con frecuencia 0 (Evitar las rayas, cuya interpretación es de falta de información sobre la frecuencia del valor) Escribir todos los datos con igual número de decimales Representación gráfica de variables estadísticas unidimensionales La representación gráfica de una distribución de frecuencias va a depender del tipo de variable considerada Representación gráfica de variables cualitativas y de variables cuantitativas con pocos valores distintos Para ilustrar las principales representaciones gráficas, vamos a utilizar los datos del tipo de vehículos: Diagrama de barras TIPO frecuencias deportivo 4 furgoneta 9 gran turismo monovolumen 6 pequeño 2 tamaño medio Esta representación gráfica consiste en construir tantos rectángulos como modalidades presente la variable cualitativa en estudio, todos ellos con base de igual amplitud (la que sea) y la altura se toma proporcional a la frecuencia absoluta o relativa (según cuál estemos representando), obteniendo rectángulos con áreas proporcionales a las frecuencias que se quieran representar Diagrama de Pareto Es un diagrama de barras en el que los rectángulos se presentan en orden decreciente de altura Se utilizan para variables cualitativas y son muy frecuentes en control de calidad y procesos, donde las alturas de los rectángulos a menudo representan frecuencias de problemas en el proceso de producción Como los rectángulos están dispuestos en orden decreciente por altura, resulta fácil identificar las cuestiones con el mayor número de problemas

7 Estadística 0 Diagrama de sectores Esta representación consiste en dividir un círculo en tantos sectores circulares como modalidades presente la variable cualitativa, donde cada sector circular tendrá un área proporcional a la frecuencia absoluta (o relativa) 2 Representación gráfica de variables cuantitativas que toman muchos valores distintos Histograma Es la representación gráfica más frecuente y se realiza a partir de una agrupación de los datos en intervalos Consiste en un conjunto de rectángulos construidos de la siguiente forma: - Tiene como eje horizontal una escala de valores de la variable que se mide Se marcan los límites de las clases sobre la escala - Como eje vertical, tiene una escala de alturas SobrecadaclaseseelevaunrectángulotalquesuáreaA i = base altura = (L i L i )h i seaproporcional a la frecuencia absoluta (o relativa) de la clase, es decir, λn i ; entonces, despejando tenemos que la altura es h i = λn i L i L i Ejemplo: En el ejemplo de las edades de 40 individuos:

8 Estadística Ejemplo: El siguiente ejemplo corresponde a clases no equiespaciadas: Si la distribución de la variable es: (L i L i ] c i n i (5, 5] 25 (5, 65] 5 4 un histograma correcto tendría un primer rectángulo de altura 2λ y un segundo rectángulo de altura 4 λ, dónde λ es un número real positivo cualquiera Por ejemplo, para λ = 6, el histograma sería: Polígono de frecuencias acumuladas Se construye de la siguiente forma: -Tiene como eje horizontal una escala de valores de la variable que se mide Sobre él se marcan los límites de las clases - La escala vertical es una escala de frecuencias acumuladas (absolutas o relativas) En este plano, partiendo desde el punto sobre el eje OX que corresponde al límite inferior del primer intervalo, se sitúan los pares formados por el límite superior de clase y la correspondiente frecuencia acumuladadelaclaseylos puntosseunenpormediodesegmentos, dandolugaraunagráficacreciente, que termina en una meseta de altura, si se utilizan frecuencias acumuladas absolutas, o altura 00 si se utilizan porcentajes acumulados Esta gráfica se conoce como ojiva de frecuencias

9 Estadística 2 Diagrama de tallo-hojas (Stem and leaf) Se trata de un procedimiento semi-gráfico de presentar la información de variables cuantitativas, útil cuando el número de datos es pequeño(menor que 50), aunque con los ordenadores es posible utilizarlo con más datos Los pasos para su construcción son: Expresar los datos en unidades convenientes, redondearlos a dos o tres cifras significativas y ordenarlos de menor a mayor 2 Colocarlos en una tabla con dos columnas separadas por una línea como sigue: - Para los datos con dos dígitos, escribir a la izquierda de la línea los dígitos de las decenas (que forman el tallo) y a la derecha los de las unidades (que forman las hojas) - Para datos con tres dígitos, el tallo estará formado por las centenas y decenas, escritos a la izquierda, y las hojas serán las unidades Cada tallo define una clase y se escribe una sola vez; el número de hojas representa la frecuencia de la clase correspondiente al tallo Ejemplo: Para el ejemplo de las edades, el diagrama de tallo-hojas sería: () Los valores que aparecen a la izquierda se llaman profundidades e indican las frecuencias acumuladas, comenzando por arriba (de menor a mayor) y por abajo (de mayor a menor), hasta llegar al tallo en el que se encuentra el valor que ocupa la posición central; en este tallo, el valor aparece entre paréntesis e indica solo la frecuencia de ese tallo Observación Para facilitar la construcción del diagrama, para una cantidad numerosa de datos, puede ser conveniente escribir en primer lugar un diagrama desordenado anotando los tallos y las hojas sin ordenar de menor a mayor, y a partir de esta primera aproximación, construir el diagrama

10 Estadística A veces conviene subdividir los tallos para obtener mayor claridad, colocando por una parte las hojas del 0 al 4 y por otra las hojas de 5 a 9, en otros casos, las hojas 0 y, las 2 y, las 4 y 5, las 6 y 7 y, por último, las 8 y 9; por ejemplo: (6) Puede observarse que si se gira el diagrama, se obtiene una apariencia similar a la del histograma correspondiente 4 Medidas características de una distribución unidimensional Vamos a definir en esta sección algunos valores numéricos que proporcionan información sobre cómo se distribuye un conjunto de datos homogéneo Estas medidas además, permiten comparar distribuciones y en la tercera parte de la asignatura nos serán de utilidad para obtener conclusiones sobre la población cuando se trabaja con una muestra Algunos de estos valores dependen de la posición de los datos, cuando se ha ordenado estos de menor a mayor; denotaremos por x (i) el dato que ocupa el lugar i-ésimo una vez ordenados los datos de esta forma 4 Medidas de posición o localización Proporcionan uno o varios valores en torno a los cuales tienden a agruparse los datos Entre ellas destacaremos las medidas de tendencia central Medidas de tendencia central Vamos a estudiar tres: media aritmética, mediana y moda Media o media aritmética Definición 7 Si x,,x son los datos directos de la variable, se define la media como: Observación 4 Si los datos vienen dados por medio de una tabla de frecuencias: x = x i entonces x i n i f i x n f x 2 n 2 f 2 x k n k f k k x i n i k x = = x i f i

11 Estadística 4 Propiedades 2 (a) La media es el valor que equilibra las desviaciones positivas y negativas de los datos directos respecto a su valor: (x i x) = 0 En ese sentido, se la puede considerar como centro de gravedad o centro geométrico de los datos (b) Utiliza toda la información contenida en los datos (pues utiliza todos los datos) Mediana Definición 8 Llamaremos mediana y la denotaremos por M e al valor numérico que verifica que ordenados los datos de menor a mayor, el 50% son menores o iguales que este valor y el 50% son mayores o iguales Cálculo de la mediana: Para calcular la mediana de un conjunto de datos, en primer lugar hay que ordenarlos de menor a mayor Si el número de datos,, es par, el valor mediana es x (/2)+x ((/2)+) 2, mientras que si el número de datos es impar, el valor mediana es x ((+)/2), supuestos los datos ordenados de menor a mayor Moda Definición 9 La moda, se define como el valor o los valores más frecuentes de la variable, es decir, a los que corresponde la mayor frecuencia Cuando los datos están agrupados por clases, no puede determinarse qué valor es la moda; en este caso llamaremos clase modal a aquella a la que corresponde la mayor altura en el histograma (que no tiene porqué coincidir con la clase de mayor frecuencia) Comparación entre las medidas de tendencia central Como ya hemos señalado al definirla, la media es una medida que utiliza toda la información disponible, pues tiene en cuenta el valor de todos los datos En cambio, la mediana es, en ese sentido, menos informativa, pues sólo tiene en cuenta la posición y no el valor Por esa misma razón, la media es muy sensible a valores extremos Por ello, un error en los datos puede modificarla por completo Ejemplo: Para los datos 0, 5, 2, 50, la media es 24, desplazada hacia el valor 50 que es un valor extremo Si los datos correctos hubiesen sido 0, 5, 2, 20, la media sería 65 Sin embargo, la mediana queda menos afectada por ese dato extremo: en el primer caso sería 8 y en el segundo, 75 Observación 5 A veces, el conjunto de datos está dividido en subgrupos, por ejemplo, los individuos de una clase divididos en hombres y mujeres, y se conoce la media de una característica en cada subgrupo A partir de esta información se puede obtener la media del conjunto total de datos: si x, x 2,, x s son las medias en s subgrupos (disjuntos) con n,n 2,,n s individuos cada uno, la media total será: x = n x +n 2 x 2 ++n s x s n +n 2 ++n s

12 Estadística 5 2 Otras medidas de posición: Percentiles Definición 0 Para cada valor p (0,), se denomina p-percentil y se denota por q p, al valor de la variable que divide a la distribución de frecuencias en dos partes, de forma que al menos el 00p% de los datos son menores o iguales que q p Cálculo de los percentiles: x ([p]+) q p = x (p) +x (p+) 2 donde [p] denota la parte entera de p si p no es entero si p es entero, Definición Se denominan cuartiles a los percentiles que dividen a la distribución en 4 partes iguales, es decir, - el 025-percentil, llamado primer cuartil, y denotado por Q - el 05-percentil, que es la mediana Se denota, también, por Q 2 - el 075-percentil, llamado tercer cuartil, y denotado por Q Definición 2 Se denominan deciles a los percentiles que dividen a la distribución en 0 partes i iguales Se denotan por d,d 2,,d 9, siendo d i el 0-percentil, i =,2,,9 Observación 6 A veces solo disponemos de la información de los datos agrupados en clases y no el valor de los datos, en esos casos se calculan valores aproximados de los percentiles, tomando como valor q p el valor del eje X en el que el polígono de frecuencias relativas acumuladas tiene por altura p: Si F,F 2,,F k son las frecuencias relativas acumuladas de las clases en que se agrupan los datos, existe i {,2,k} con F i p < F i ( Se considera F 0 = 0) El p-percentil será: 42 Medidas de dispersión q p = L i + p F i b i f i Estas medidas indican lo próximos o alejados que están los datos, bien entre sí, o respecto a alguna medida de centralización Rango o recorrido Definición Si x (),x (2),,x (k) son los datos, ordenados de menor a mayor, se denomina recorrido a x (k) x (), es decir, a la diferencia entre el mayor y el menor dato El recorrido es fácil de calcular, lo que hace que sea una medida muy utilizada, por ejemplo en control de calidad Además tiene idénticas unidades que la variable Sin embargo, presenta el inconveniente de ser una medida muy sensible a valores extremos

13 Estadística 6 Varianza Definición 4 Se define la varianza de los datos directos x,x 2,,x, y se denota por s 2, al valor: s 2 = (x i x) 2 ( = x 2 i ) x 2 Observación 7 Si los datos vienen dados por medio de una tabla de frecuencias, entonces s 2 = k (x i x) 2 n i k = (x i x) 2 f i La varianza tiene en cuenta todos los datos, es fácil de calcular, pero no tiene las mismas unidades que la variable; este inconveniente se salva considerando su raíz cuadrada, que se denomina desviación típica Observación 8 Por razones que veremos más adelante, en muchos casos se utiliza otra medida, llamada cuasivarianza, y que a la hora de hacer inferencias, tiene mejores propiedades que la varianza Se define la cuasivarianza de los datos directos x,x 2,,x, y se denota por s 2 c al valor: s 2 c = (x i x) 2 otar que s 2 = ( )s 2 c, y que si es grande, la diferencia entre ambas medidas (varianza y cuasivarianza) es pequeña Observación 9 En muchos programas de software estadístico, se llama varianza a la cuasivarianza (entre ellos el programa de Statgraphics) Desviación típica Definición 5 Se define la desviación típica o estándar de los datos directos x,x 2,,x, y se denota por s, al valor: s = (x i x) 2 Observación 0 Si los datos vienen dados por medio de una tabla de frecuencias, entonces s = k (x i x) 2 n i = k (x i x) 2 f i Observación Se define también la cuasidesviación típica como: s c = (x i x) 2

14 Estadística 7 La desviación estándar se expresa en las mismas unidades que la variable, dando una idea más precisa de la variabilidad respecto de la media, como veremos en el teorema siguiente Teorema (Desigualdad de Chebychev) Sea X una variable estadística y k IR con k Entonces, en el intervalo [ x ks, x+ks] se halla más del ( k 2 )00% de las observaciones (Expresándolo de otra forma: la frecuencia relativa del intervalo [ x ks, x+ks] es mayor que ( k 2 )) Demostración: Vamos a denotar por f r la frecuencia relativa de un conjunto de datos y por x,x 2,,x los valores directos de la variable X Sean A = {x i : x i x > ks} y A 2 = {x i : x i x ks} A partir de la definición de varianza, se obtienen las siguientes desigualdades: s 2 (x i x) 2 = = (x i x)2 x i A + (x i x)2 x i A 2 (x i x)2 x i A > (ks)2 = (ks)2 f r (A ) x i A Despejando, f r (A ) < k 2 Como f r (A )+f r (A 2 ) =, se tiene que f r (A 2 ) = f r ({x i : x i x ks}) > k 2 y teniendo en cuenta la interpretación de la frecuencia relativa como tanto por ciento, se obtiene el resultado Observación 2 Tomando k = 2, en el intervalo [ x 2s, x+2s] se encuentra como mínimo el 75% de los datos Tomando k =, en el intervalo [ x s, x+s] se encuentra como mínimo el 89% de los datos Rango intercuartílico Definición 6 Se define el rango intercuartílico, y se denota por IQR, a: IQR = Q Q El rango intercuartílico es una medida de dispersión utilizada en relación con la mediana e indica la dispersión del 50% central de los datos

15 Estadística 8 4 Medidas de posición y de variación utilizadas para comparar conjuntos de datos Valores o puntuaciones z Los valores z indican la posición relativa de un dato, respecto del conjunto Definición 7 Se define el valor z del dato x i como el valor x i x s os indica cuántas desviaciones típicas se aleja el dato respecto del valor de la media Coeficiente de variación Definición 8 Para datos todos positivos o todos negativos, se define el coeficiente de variación de Pearson de la variable estadística X como: CV = s x Es una medida adimensional de la variabilidad relativa, pues considera la variabilidad de los datos en relación al tamaño de su media ( no es lo mismo una variabilidad de 200 euros en ganacias del orden de 000 euros, que en ganancias del orden de millón) Por ello, es la medida adecuada para comparar la variabilidad de dos conjuntos de datos distintos Se puede interpretar el CV como el promedio del error de medida 44 Otras características observables de una distribución de datos Asimetría Diremos que una distribución es simétrica si al considerar la representación gráfica de la distribución de frecuencias y trazar una perpendicular al eje de abcisas por x ocurre lo siguiente: Hay el mismo número de valores a ambos lados de la perpendicular, equidistantes de x dos a dos y tales que cada par de valores equidistantes a x tienen la misma frecuencia En este caso, la mediana coincide con x Las medidas de asimetría existentes son válidas para las denominadas distribuciones con forma de campana o campaniformes (distribuciones unimodales simétricas o con cierta asimetría) y para las distribuciones en forma de U Indicar que las distribuciones en forma de campana son las más usuales Cuando la distribución de los datos es campaniforme, las distribuciones asimétricas se clasifican en distribuciones asimétricas con cola a la derecha y distribuciones asimétricas con cola a la izquierda; el valor de x Me proporciona información del tipo de asimetría: asimetría a la derecha simétrica asimetría a la izquierda

16 Estadística 9 2 Apuntamiento o curtosis Llamamos curtosis o apuntamiento al grado de concentración de los datos alrededor de la media Las medidas de curtosis se aplican a distribuciones campaniformes y para estudiarlas es necesario definir previamente una distribución tipo, que vamos a tomar como modelo de referencia Esta distribución va a ser la llamada distribución normal, que corresponde a fenómenos muy corrientes en la naturaleza y cuya representación gráfica es una campana de Gauss, dada por la fórmula: f(x) = σ 2π e (x µ) 2 2 σ 2, donde µ y σ son respectivamente la media y la desviación típica A esta distribución se le llama normal porquese presenta en numerosos casos, e implica que la mayoría de los valores de la variable están cerca de la media, y aquellos que se encuentran muy distanciados de ella, a ambos lados, son poco numerosos Tomando esta distribución como referencia diremos que una distribución puede ser más apuntada que la normal, es decir, leptocúrtica o menos apuntada, es decir, platicúrtica A la distribución normal, desde el punto de vista de la curtosis, se le llama mesocúrtica platicúrtica mesocúrtica leptocúrtica En definitiva, aquí lo que se estudia es la deformación, en sentido vertical, respecto de la normal, de una distribución 5 Diagramas de caja o Box-Plot Este tipo de diagramas son una representación semigráfica de la distribución, que permite observar las características principales de la distribución y detectar posibles valores atípicos Son especialmente útiles para comparar la distribución de una variable en distintas poblaciones Se ha pospuesto su estudio hasta ahora pues para su construcción son necesarias algunas de las medidas características de la distribución, definidas en el apartado anterior Construcción del Box-Plot Los pasos para su construcción son: Ordenar los datos de menor a mayor y obtener los cuartiles Q, Q 2 y Q Se obtienen también otros dos valores, llamados límite inferior (LI) y límite superior (LS), dados por: LI = Q 5IQR LS = Q +5IQR

17 Estadística 20 2 A continuación se sitúan en un eje graduado estos 5 valores y tomando como base el segmento [Q,Q ] se dibuja un rectángulo con altura arbitraria; en él se indica la posición de la mediana, mediante una línea vertical que divida al rectángulo 4 Desde el centro de los lados verticales del rectángulo se dibujan sendas líneas hasta el menor dato mayor o igual que LI y el mayor dato menor o igual que LS (es decir, los datos más extremos del intervalo [LI, LS]) 5 Los datos que queden fuera del intervalo [LI, LS] se marcan con un punto o un asterisco, a la altura de las dos líneas dibujadas Se denominan datos atípicos y se clasifican en próximos y lejanos, según estén en [Q IQR, Q +IQR] o aún más alejados Ejemplo: Para los datos de la edad, los cinco valores son: Q = 7, Q =, M e = 24, LI = 65 y LS = 45, y el gráfico: Ejemplo: distancia de frenado en metros, en automóviles conducidos sobre una pista húmeda (mismo automóvil y velocidad en todos los casos) Para los datos de la distancia de frenado, los cinco valores son: Q = 59, Q = 92, M e = 7, LI = 095 y LS = 445, y el gráfico:

18 Estadística 2 Observación El Box-Plot permite ver fácilmente características como asimetría, apuntamiento, variabilidad y puesto que se basa en la mediana y los cuartiles, medidas poco influenciables por datos extremos, proporciona en general una imagen adecuada de la distribución También permite hacer comparaciones entre conjuntos distintos de datos, o subgrupos Los datos siguientes corresponden al tiempo en segundos en pasar de 0 a 00 Km/h en un conjunto de vehículos subdivididos en cuanto al tipo de vehículo Es fácil observar en el gráfico, por ejemplo, que las furgonetas son las que presentan menor variabilidad y los de tamaño pequeño son los de mayor variación 6 Datos atípicos en distribuciones univariantes Son datos que se alejan del conjunto global de datos, por ser inusualmente grandes o pequeños Pueden ser datos reales, como una puntuación de 0 en un examen en el que la mayoría de las puntuaciones están entre y 6, o la estatura de un individuo que mide 2m 0cm, en una clase de individuos con estaturas normales También en ocasiones, aparecen como consecuencia de haber registrado de forma incorrecta un dato o existe un criterio único para determinar qué datos son o no atípicos; dos de los criterios más usuales son: El proporcionado por el diagrama de caja: considerar como atípicos todos los datos fuera del intervalo [LI, LS] En el ejemplo de la distancia de frenado, sería el dato 0,5 El criterio de s: considerar como atípico todo dato que se aleje más de s de la media de los datos (recordar que según la desigualdad de Chebysev, al menos el 8889% de los datos está en el intervalo [ x s, x+s]) En el ejemplo de la distancia de frenado, con este criterio no existirían datos atípicos 7 Transformaciones de una variable El objetivo de la descripción de datos es obtener una visión lo más clara posible de los datos, por ello, en muchas ocasiones será necesario hacer traslaciones o cambios de escala para obtener datos lo más simples y manejables posible En otras ocasiones, como los principales métodos estadísticos son aplicables sólo a distribuciones simétricas, nos interesará transformar unos datos asimétricos en otros que no lo sean tanto Vamos a distinguir entre dos tipos de transformaciones: Transformaciones lineales: SondeltipoY=aX+b, con a,b IR; a 0, esdecir, traslaciones ycambios deescala; portanto, producen cambios en cuanto a posición y dispersión, pero no varían la forma de la distribución: si x,,x son los datos directos de la variable X, sus transformados serán los datos y,,y, con y i = ax i +b

19 Estadística 22 Propiedades En efecto: ȳ = a x+b ȳ = = a y i = x i ax i +b = +b = a x+b 2 s 2 Y = a2 s 2 X En efecto: s 2 Y = (y i ȳ) 2 = (ax i +b (a x+b)) 2 = = a 2 (x i x) 2 = a 2 s 2 X s Y = a s X 4 M e (Y) = am e (X)+b En efecto, si a > 0, los datos conservan su orden y por tanto, la mediana de la variable X se transforma en la mediana de la variable Y Si a < 0, entonces los datos invierten su orden, pero entonces, la transformada de la mediana sigue dejando un 50% de los datos a cada lado 5 Si a > 0 entonces Q (Y) = aq (X) + b y Q (Y) = aq (X) + b Si a < 0 entonces Q (Y) = aq (X)+b y Q (Y) = aq (X)+b (Se razona de igual forma que en la propiedad anterior) 6 Moda(Y) = amoda(x) +b 7 IQR(Y) = a IQR(X) Transformaciones no lineales Las transformaciones no lineales más usuales son: Y =X 2, Y = X, Y =lnx e Y = X Producen, además de cambios en la posición y dispersión, cambios en la forma Se utilizan principalmente para promover simetría 8 Estadística Descriptiva Bivariante Se va a estudiar la situación en la que los datos representan observaciones, correspondientes a dos variables o caracteres, efectuadas en los individuos de una determinada población Su estudio conjunto nos va a permitir determinar las relaciones entre ellas Ambas variables pueden ser cuantitativas, una cualitativa y la otra cuantitativa, o las dos cualitativas Vamos a denotar por X e Y las variables estadísticas objeto de estudio; A, A 2,, A l serán las modalidades de la variable X, B, B 2,, B k las modalidades de la variable Y El par (x i,y i ) denotará, en general, el valor de las variables X e Y sobre el elemento i-ésimo de la población

20 Estadística 2 8 Tablas de doble entrada Una primera forma de resumir la información contenida en los datos es por medio de tablas de frecuencias Definición 9 de datos, i Se denomina frecuencia total al número total de individuos observados o número total ii Se denomina frecuencia absoluta del par (A i,b j ), al número de individuos, n ij, de entre los, que poseen la modalidad A i de X, y la modalidad B j de Y a la vez iii Se denomina frecuencia relativa del par (A i,b j ), al cociente f ij = n ij Definición 20 Se dice que se ha dado la distribución conjunta de las variables estadísticas X e Y si se dan las modalidades de las variables y las correspondientes frecuencias (absolutas o relativas) con que aparece cada par La forma de dar estos valores es por medio de tablas en las que aparecen las distintas modalidades de las variables (ordenadas de menor a mayor, si la variable es cuantitativa) En la tabla pueden aparecer frecuencias relativas en lugar de absolutas y en ocasiones, se indican ambas X\Y B B 2 B k A n n 2 n k A 2 n 2 n 22 n 2k A l n l n l2 n lk Si las dos variables X e Y son cualitativas, la tabla correspondiente recibe el nombre de tabla de contingencia Propiedades 4 l k n ij = j= 2 l k f ij = j= Ejemplo: Distribución de alumnos de 2 o de ITI por titulación y sexo:

21 Estadística 24 Titulación\Sexo Hombre Mujer Eléctrico Electrónico Mecánico Químico Distribuciones marginales A partir de una distribución conjunta de dos variables es posible estudiar la distribución de cada una de las variables aisladamente (es decir, independientemente de los valores que tome la otra variable) Los valores de las frecuencias para las variables X e Y se obtienen a partir de la tabla conjunta, anotando en los márgenes de la tabla la suma de los valores de cada fila y de cada columna: X\Y B B 2 B k A n n 2 n k n A 2 n 2 n 22 n 2k n 2 A l n l n l2 n lk n l n n 2 n k Propiedades 5 Las frecuencias relativas y absolutas, respectivamente, de la modalidad A i de la variable X son: k k f i = f ij n i = j= n ij j= 2 Las frecuencias relativas y absolutas, respectivamente, de la modalidad B j de la variable Y son: l f j = f ij l n j = n ij Observación 4 Las distribuciones marginales de X e Y son distribuciones univariantes; en este sentido, puede aplicárseles todo lo estudiado en el tema anterior En particular, si son variables cuantitativas, tendrán asociada media, varianza, etc Ejemplo: Distribución de alumnos de 2 o de ITI por titulación y sexo:

22 Estadística 25 La distribución marginal de Titulación es: Titulación\Sexo Hombre Mujer Eléctrico Electrónico Mecánico Químico Titulación Eléctrico Electrónico Mecánico Químico Frecuencia Frecuencia relativa Y la de Sexo: Sexo Hombre Mujer Frecuencia Frecuencia relativa 8 Distribuciones condicionadas Definición 2 Se define la distribución condicionada de Y cuando X=A i (respectivamente, de X condicionada ab j ), que se denota por Y/(X = A i ) (respectivamente X/(Y = B j )) como la distribución de la variable Y (respectivamente X) sobre los elementos de la población que tienen la característica A i (respectivamente, B j ) Observación 5 Un aspecto importante de las distribuciones condicionadas es que la población objeto de estudio no es la misma que la de partida Los valores de las frecuencias para la variables Y/(X = A i ) y X/(Y = B j ) se obtienen a partir de la tabla conjunta: Las frecuencias absolutas de la variable Y cuando X = A i son las de la línea correspondiente a A i Las frecuencias relativas de la variable Y cuando X = A i son: f j/i = fij f i (también se representan por f(b j /(X = A i ))) En efecto, f j/i = n ij n i = n ij/ n i / = f ij f i Las frecuencias absolutas de la variable X cuando Y = B j son las de la columna correspondiente a B j Las frecuencias relativas de la variable X cuando Y =B j son: f i/j = f ij f j (también se representan por f(a i /(Y = B j )))

23 Estadística 26 Ejemplo: La distribución condicionada de Titulación a Mujer es: Titulación/(Mujer) Eléctrico Electrónico Mecánico Químico Frecuencia Frecuencia relativa Y la de Sexo a Mecánico: Sexo/(Mecánico) Hombre Mujer Frecuencia Frecuencia relativa Proposición Dadas las distribuciones condicionadas de la variable X a cada modalidad de la variable Y, y dada la distribución marginal de Y (respectivamente, de Y a cada modalidad de X, y la marginal de X), queda determinada la distribución conjunta de (X,Y) En efecto, basta observar que f ij = f i/j f j = f j/i f i Definición 22 Se dice que las variables estadísticas X e Y son estadísticamente independientes si se verifica: f i/j = f i para i =,2,,l, j =,2,,k Se dice que dos modalidades A i y B j son estadísticamente independientes si se verifica: f i/j = f i La definición anterior significa que la distribución de la variable X no depende de los valores que tome la variable Y, y recíprocamente Proposición 2 Las siguientes condiciones son equivalentes: Las variables estadísticas X e Y son independientes, 2 f ij = f i f j, para i =,2,,l, j =,2,,k f j/i = f j para i =,2,,l, j =,2,,k Ejemplo: Variables no independientes: X\Y B B 2 B A 0 0 A A 0 0 Variables independientes: X/Y B B 2 B A 9 A 2 9 A

24 Estadística 27 9 Representaciones gráficas de las distribuciones bidimensionales de frecuencias Las distribuciones marginales y condicionadas son distribuciones unidimensionales, como ya se ha indicado y, por tanto, sus representaciones gráficas se ajustarán a las vistas en la sección de distribuciones unidimensionales de frecuencias Se van a considerar sólo representaciones gráficas de distribuciones bidimensionales: Diagrama de Mosaico Sobre el eje Y se representan las modalidades de una de las variables y sobre cada una se levanta un rectángulo con área proporcional a la frecuencia marginal de la modalidad Cada rectángulo se subdivide en subrectángulos de base proporcional a la frecuencia condicionada de cada valor de la otra variable a esta modalidad De esa manera se da también una imagen gráfica de la distribución conjunta de ambas variables (proporcionada por el área de cada subrectángulo) En el ejemplo de la distribución de alumnos por titulación y sexo: Diagramas de barras Se utiliza para representar la distribución cuando ambas variables tienen pocas modalidades Consiste en dibujar para cada par (A i,b j ) una barra de longitud proporcional a la frecuencia (relativa o absoluta) Las barras se pueden disponer de diversas formas Damos dos ejemplos: Histograma tridimensional Se utiliza para representar la distribución cuando ambas variables son continuas y agrupadas en intervalos Consiste en representar las clases de cada variable en un plano y levantar sobre cada rectángulo un paralelepípedo de volumen proporcional a la frecuencia relativa o absoluta Si los rectángulos base de todas las clases son iguales, los paralelepípedos que se levantan, y que tienen que verificar que su volumen sea proporcional a la frecuencia de la clase, tendrán como altura un valor proporcional a las frecuencias (relativas o absolutas)

25 Estadística 28 Diagrama de dispersión o nube de puntos Se utiliza para variables cuantitativas sin agrupar en clases y en las que no existen pares de valores repetidos Consiste en representar cada par de puntos (x i,y j ) en un plano Permite obtener también una representación gráfica de las distribuciones marginales de X e Y, si se proyectan los puntos sobre cada eje (se obtiene así el diagrama de puntos para cada variable) En el siguiente gráfico están representados, para una población de cereales de uso común en el desayuno, el contenido de carbohidratos y de calorías para 00gr de producto: 0 Dependencia lineal Una de las formas de dependencia de más interés entre variables continuas es la dependencia lineal, por varias razones: En muchos problemas prácticos la relación entre las variables es lineal Aún cuando la relación no sea lineal, frecuentemente es linealizable, mediante transformaciones Si el rango de valores es pequeño, la aproximación lineal puede ser válida Vamos a introducir a continuación medidas de la relación lineal entre las variables: Covarianza Definición 2 Sea (X,Y) una distribución bidimensional, se define la covarianza de (X,Y) y se representa por Cov(X,Y) ó s XY como: l k Cov(X,Y) = (x i x)(y j ȳ)f ij j= Observación 6 La fórmula anterior es válida cuando se tiene la distribución de frecuencias de (X,Y) Si lo que se tiene son los pares de datos en la forma (x i,y i ) i =,2,, la expresión anterior queda de la forma: (x i x)(y i ȳ) Cov(X,Y) =

26 Estadística 29 Si los datos están agrupados en frecuencias absolutas, entonces Cov(X,Y) = l,k i,j= (x i x)(y j ȳ)n ij Vamos a ver una forma de expresar la covarianza, útil a la hora de hacer cálculos: Usando la expresión anterior y desarrollando: = Cov(X,Y) = (x i x)(y i ȳ) = (x i y i x i ȳ xy i + xȳ) = ( ) x i y i ȳ x i x y i + xȳ = x i y i ȳ x xȳ + xȳ = x i y i ȳ x Observación 7 El valor de la covarianza proporciona información sobre la posible relación lineal entre dos variables; cuando los datos parecen disponerse entorno a una recta de pendiente positiva, la covarianza es positiva; si parecen disponerse en torno a una recta de pendiente negativa, la covarianza es negativa; si no parece haber relación lineal, la covarianza es próxima a cero: Propiedades 6 Sean X e Y dos variables estadísticas Si X e Y son independientes, entonces Cov(X,Y) = 0 (El recíproco no es en general cierto) En efecto, si X e Y son independientes, para cada i,j se tiene que f ij = f i f j y por tanto, l k l k Cov(X,Y) = x i y i f ij xȳ = x i y i f i f j xȳ = j= j=

27 Estadística 0 ( ) l k = x i f i y j f j xȳ = 0 j= 2 Si a,b,c,d IR, y U = ax +b, V = cy +d, entonces Cov(U,V) = accov(x,y) Ejemplo: Cov(U,V) = Cov(aX+b,cY+d) = = (ax i +b (a x+b))(cy i +d (cȳ +d)) = (ax i a x)(cy i cȳ) = accov(x,y) Las variables X e Y cuya distribución viene dada por la siguiente tabla conjunta, tienen Cov(X,Y) = 0, pero no son independientes, es fácil observar que Y = X 2 2 Coeficiente de correlación X\Y Uno de los principales inconvenientes de la covarianza es que depende de las unidades de medida de las variables El coeficiente de correlación es una medida adimensional Definición 24 Se define el coeficiente de correlación lineal entre dos variables X e Y y se denota por r, como: r = Cov(X,Y) s X s Y Propiedades 7 Es un coeficiente adimensional 2 El valor de r no varía si multiplicamos X por a e Y por b con a y b números reales del mismo signo r 4 r = si, y sólo si, existe relación lineal exacta entre las variables, es decir, si existen a,b IR tales que y i = ax i +b, i =,, Además, si a > 0, es r= y si a < 0 es r = 4 Si X e Y son estadísticamente independientes, entonces r = 0 Observación 8 De las propiedades anteriores se deduce que si r es próximo a ± se puede sospechar la existencia de relación lineal entre las variables y que si r es próximo a 0, se puede sospechar la inexistencia de tal relación En cualquier caso, el coeficiente de correlación es una medida resumen de la estructura de un diagrama de dispersión, y por tanto siempre conviene dibujar el diagrama que es el que contiene toda la información

Tema 2: Estadística Descriptiva Bivariante.

Tema 2: Estadística Descriptiva Bivariante. Estadística 24 Tema 2: Estadística Descriptiva Bivariante. Se va a estudiar la situación en la que los datos representan observaciones, correspondientes a dos variables o caracteres, efectuadas en los

Más detalles

Tema 1: Estadística Descriptiva.

Tema 1: Estadística Descriptiva. Estadística 4 Tema 1: Estadística Descriptiva. Definición 1 Población es cualquier conjunto de datos, objetivo de nuestro interés que caracteriza un fenómeno que nos interesa. Definición 2 Muestra es un

Más detalles

Part I. Descripción estadística de una variable. Estadística I. Mario Francisco. Conceptos generales. Distribuciones de frecuencias.

Part I. Descripción estadística de una variable. Estadística I. Mario Francisco. Conceptos generales. Distribuciones de frecuencias. Part I Descripción estadística de una variable El objeto de cualquier investigación estadística es la toma de información acerca de los individuos de cierto colectivo llamado población estadística. Cada

Más detalles

Tema 1: Análisis de datos univariantes

Tema 1: Análisis de datos univariantes Tema 1: Análisis de datos univariantes 1 En este tema: Conceptos fundamentales: muestra y población, variables estadísticas. Variables cualitativas o cuantitativas discretas: Distribución de frecuencias

Más detalles

INTRODUCCIÓN. Fenómeno Real. Aprendizaje sobre el fenómeno. Análisis Estadístico. Datos Observados

INTRODUCCIÓN. Fenómeno Real. Aprendizaje sobre el fenómeno. Análisis Estadístico. Datos Observados ESTADÍSTICA INTRODUCCIÓN Qué es la estadística?. - Es la rama de las matemáticas que estudia la recolección, análisis e interpretación de datos. Por qué estudiamos estadística? - Aprender sobre fenómenos

Más detalles

Julio Deride Silva. 18 de agosto de 2010

Julio Deride Silva. 18 de agosto de 2010 Estadística Descriptiva Julio Deride Silva Área de Matemática Facultad de Ciencias Químicas y Farmcéuticas Universidad de Chile 18 de agosto de 2010 Tabla de Contenidos Estadística Descriptiva Julio Deride

Más detalles

Tema 1: Estadística descriptiva. Probabilidad y Estadística (Ing. Informática). Tema 1: Estadística descriptiva 1

Tema 1: Estadística descriptiva. Probabilidad y Estadística (Ing. Informática). Tema 1: Estadística descriptiva 1 Tema 1: Estadística descriptiva Probabilidad y Estadística (Ing. Informática). Tema 1: Estadística descriptiva 1 Introducción Objetivo: estudiar una característica o variable en una población. Ejemplos:

Más detalles

Estadística Descriptiva 2da parte

Estadística Descriptiva 2da parte Universidad Nacional de Mar del Plata Facultad de Ingeniería Estadística Descriptiva 2da parte 2 Cuatrimestre 2018 COMISIÓN :1. Prof. Dr. Juan Ignacio Pastore. Qué es la estadística? El contenido de la

Más detalles

UNIDAD 8. ESTADÍSTICA

UNIDAD 8. ESTADÍSTICA UNIDAD 8. ESTADÍSTICA La Estadística es la rama de las Matemáticas que se ocupa de la recopilación y ordenación de datos para su posterior análisis. 1. Población y muestra. Población. Es el conjunto de

Más detalles

Estadística Descriptiva en R: Parámetros y estadísticos. José Enrique Martín García Universidad Politécnica de Gimialcón (Copyright 2016)

Estadística Descriptiva en R: Parámetros y estadísticos. José Enrique Martín García Universidad Politécnica de Gimialcón (Copyright 2016) Estadística Descriptiva en R: Parámetros y estadísticos José Enrique Martín García Universidad Politécnica de Gimialcón (Copyright 2016) Parámetros y Estadísticos Parámetro: Es una cantidad numérica calculada

Más detalles

U.D.1: Análisis estadístico de una variable Consideraciones iniciales: Propuesta: 1.1 Distribución de frecuencias. Variables Cualitativas: Ejemplo

U.D.1: Análisis estadístico de una variable Consideraciones iniciales: Propuesta: 1.1 Distribución de frecuencias. Variables Cualitativas: Ejemplo U.D.1: Análisis estadístico de una variable Consideraciones iniciales: - Población: Es el conjunto de todos los elementos que cumplen una determinada característica. Ej.: Alumnos del colegio. - Individuo:

Más detalles

Técnicas Cuantitativas para el Management y los Negocios

Técnicas Cuantitativas para el Management y los Negocios Técnicas Cuantitativas para el Management y los Negocios Contador Público Módulo I: ESTADÍSTICA DESCRIPTIVA Contenidos Módulo I Unidad 1. Introducción y conceptos básicos Conceptos básicos de Estadística.

Más detalles

Tema 9: Estadística descriptiva

Tema 9: Estadística descriptiva Tema 9: Estadística descriptiva Matemáticas específicas para maestros Grado en Educación Primaria Matemáticas específicas para maestros Tema 9: Estadística descriptiva Grado en Educación Primaria 1 / 47

Más detalles

Tema 3: Estadística Descriptiva

Tema 3: Estadística Descriptiva Tema 3: Estadística Descriptiva Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 3: Estadística Descriptiva Curso 2008-2009 1 / 27 Índice

Más detalles

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2 PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2 Preg. 1. Para comparar la variabilidad relativa de la tensión arterial diastólica y el nivel de colesterol en sangre de una serie de individuos, utilizamos

Más detalles

ESTADÍSTICA DESCRIPTIVA EN POCAS PALABRAS (por jmd matetam.com)

ESTADÍSTICA DESCRIPTIVA EN POCAS PALABRAS (por jmd matetam.com) ESTADÍSTICA DESCRIPTIVA EN POCAS PALABRAS (por jmd matetam.com) ESTADÍSTICA DESCRIPTIVA EN POCAS PALABRAS... 1 DEFINICIONES BÁSICAS... 1 Estadística... 1 Estadística descriptiva... 1 Estadística inferencial...

Más detalles

ESTADÍSTICA. A su vez, las variables pueden ser :

ESTADÍSTICA. A su vez, las variables pueden ser : ESTADÍSTICA La ESTADÍSTICA es una rama de las Matemáticas que recoge, ordena, analiza e interpreta datos relativos a un conjunto de personas o cosas ( POBLACIÓN ). La población es FINITA cuando lo es el

Más detalles

Estadística Inferencial. Estadística Descriptiva

Estadística Inferencial. Estadística Descriptiva INTRODUCCIÓN Estadística: Ciencia que trata sobre la teoría y aplicación de métodos para coleccionar, representar, resumir y analizar datos, así como realizar inferencias a partir de ellos. Recogida y

Más detalles

Las técnicas para resumir la información ió contenida en un conjunto de datos x 1, x 2,,x n son: Tablas de frecuencias: por columnas, disponemos los

Las técnicas para resumir la información ió contenida en un conjunto de datos x 1, x 2,,x n son: Tablas de frecuencias: por columnas, disponemos los Las técnicas para resumir la información ió contenida en un conjunto de datos x 1, x 2,,x n son: Tablas de frecuencias: por columnas, disponemos los datos (si hay pocos distintos) o los intervalos (si

Más detalles

TEMA 14 ESTADÍSTICA. Cuantitativa: si puede medirse y expresarse con números (es una variable), por ejemplo la talla de calzado.

TEMA 14 ESTADÍSTICA. Cuantitativa: si puede medirse y expresarse con números (es una variable), por ejemplo la talla de calzado. Objetivos / Criterios de evaluación TEMA 14 ESTADÍSTICA O.15.1 Conocer el significado y saber calcular los parámetros de centralización y dispersión O.15.2 Interpretar y utilizar los parámetros de dispersión.

Más detalles

Estadística. Análisis de datos.

Estadística. Análisis de datos. Estadística Definición de Estadística La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un

Más detalles

TEMA 5 Estadística descriptiva. Análisis de datos

TEMA 5 Estadística descriptiva. Análisis de datos TEMA 5 Estadística descriptiva. Análisis de datos Florence Nightingale (1820-1910) 1. Introducción. Modelos matemáticos 2. Métodos numéricos. Resolución de sistemas lineales y ecuaciones no lineales 3.

Más detalles

Estadística ESTADÍSTICA

Estadística ESTADÍSTICA ESTADÍSTICA La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un estudio estadístico consta

Más detalles

Medidas Descriptivas Numéricas

Medidas Descriptivas Numéricas Percentiles, Deciles y Cuartiles Además de las medidas de tendencia central, dispersión y forma, también existen algunas medidas interesantes de posición que se utilizan al resumir y analizar las características

Más detalles

El Método Científico. Metodología de Investigación. Te sifón Parrón

El Método Científico. Metodología de Investigación. Te sifón Parrón El Método Científico Metodología de Investigación Te sifón Parrón Bioestadística Para qué sirve la Bioestadística? DESCRIPTIVA Sistematización, recogida, ordenación y presentación de los datos referentes

Más detalles

1, 2, 2, 3, 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 2, 1, 1, 4, 1

1, 2, 2, 3, 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 2, 1, 1, 4, 1 8 Estadística 81 Distribuciones unidimensionales Tablas de frecuencias En este tema nos ocuparemos del tratamiento de datos estadísticos uestro objeto de estudio será pues el valor de una cierta variable

Más detalles

FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- BLOQUE ESTADÍSTICA: ESTADÍSTICA VARIABLE UNIDIMENSIONAL. Estadística variable unidimensional

FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- BLOQUE ESTADÍSTICA: ESTADÍSTICA VARIABLE UNIDIMENSIONAL. Estadística variable unidimensional FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- Estadística variable unidimensional 1. Conceptos de Estadística 2. Distribución de frecuencias 2.1. Tablas de valores con variables continuas 3. Parámetros

Más detalles

Estadística Descriptiva

Estadística Descriptiva Ignacio Cascos Fernández Departamento de Estadística Universidad Carlos III de Madrid Estadística Descriptiva Estadística I curso 2008 2009 1. Definiciones fundamentales La Estadística Descriptiva se ocupa

Más detalles

Un estudio estadístico consta de las siguientes fases: Recogida de datos. Organización y representación de datos. Análisis de datos.

Un estudio estadístico consta de las siguientes fases: Recogida de datos. Organización y representación de datos. Análisis de datos. La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un estudio estadístico consta de las siguientes

Más detalles

Análisis Exploratorio de Datos Resumen gráfico y numérico

Análisis Exploratorio de Datos Resumen gráfico y numérico INSTITUTO DE MATEMÁTICA Y FIsiCA Análisis Exploratorio de Datos Resumen gráfico y numérico DOCENTE Gloria Correa Beltrán Etapas del Método Científico Pasos a seguir en el Análisis Exploratorio de Datos

Más detalles

IMADIL /10/2014

IMADIL /10/2014 TEMA 3: Características estadísticas fundamentales (Segunda parte: Dispersión y forma) Ignacio Martín y José Luis Padilla IMADIL 2014-2015 2 POSICIÓN DISPERSIÓN ESTADÍSTICOS SIMETRÍA APUNTAMIENTO 3. ESTADÍSTICOS

Más detalles

Apuntes de Estadística

Apuntes de Estadística Apuntes de Estadística La Estadística es la ciencia que se encarga de recoger, organizar, describir e interpretar datos referidos a distintos fenómenos para, posteriormente, analizarlos e interpretarlos.

Más detalles

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 5) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 5) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 5) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía VIDEOCLASE: Medidas de Tendencia Central y Variabilidad

Más detalles

Estadística I Tema 2: Análisis de datos univariantes

Estadística I Tema 2: Análisis de datos univariantes Estadística I Tema 2: Análisis de datos univariantes Tema 2: Análisis de datos univariantes Contenidos Gráficas para datos categóricos (diagrama de barras, diagrama de sectores). Gráficas para datos numéricos

Más detalles

ESTADÍSTICA UNIDIMENSIONAL

ESTADÍSTICA UNIDIMENSIONAL ESTADÍSTICA UNIDIMENSIONAL DEFINICIÓN DE VARIABLE Una variable estadística es cada una de las características o cualidades que poseen los individuos de una población. TIPOS DE VARIABLE ESTADÍSTICAS Ø Variable

Más detalles

ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA Definición de Estadística: La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer

Más detalles

TEMA IV PERCENTIL Y ESTADIGRAFOS DE POSICION

TEMA IV PERCENTIL Y ESTADIGRAFOS DE POSICION TEMA IV PERCENTIL Y ESTADIGRAFOS DE POSICION 1. Percentiles, cuartiles y deciies. 2. Estadígrafos de Posición. 3. Sesgo y curtosis o de pastel. Pictogramas. OBJETIVOS DE UNIDAD GENERALES. Que el futuro

Más detalles

Tema 8: Distribuciones Unidimensionales y Distribuciones Bidimensionales. Consideraciones iniciales:

Tema 8: Distribuciones Unidimensionales y Distribuciones Bidimensionales. Consideraciones iniciales: Tema 8: Distribuciones Unidimensionales y Distribuciones Bidimensionales. Consideraciones iniciales: - Población: Es el conjunto de todos los elementos que cumplen una determinada característica. Ej.:

Más detalles

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 5) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 5) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 5) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía VIDEOCLASE: Medidas de Tendencia Central y Variabilidad

Más detalles

Estadística Descriptiva

Estadística Descriptiva Estadística Descriptiva 1 Qué veremos 1. OBJECTIVOS DEL CURSO. DEFINICIONES IMPORTANTES 2. TIPOS DE VARIABLES 3 5 1. Estadísticos de tendencia central 2. Estadísticos de posición 3. Estadísticos de variabilidad/dispersión

Más detalles

3 ANALISIS DESCRIPTIVO DE LOS DATOS

3 ANALISIS DESCRIPTIVO DE LOS DATOS 3 ANALISIS DESCRIPTIVO DE LOS DATOS 3.1 La tabulación de los datos 3.1.1 Tabla de distribución de frecuencias. 3.1.2 El histograma. 3.2 Medidas de tendencia central 3.2.1 La media. 3.2.2 La mediana. 3.2.3

Más detalles

Estadística unidimensional

Estadística unidimensional Estadística unidimensional Población y muestra Población Se llama población al conjunto bien delimitado de unidades (elementos), ya sean individuos u objetos, del que se interesa observar o medir alguna

Más detalles

y = 2, entonces: a) x es más dispersa que y. b) son igual de dispersas. 9.- Sean dos variables estadísticas x e y con los siguientes valores x = 5, σ

y = 2, entonces: a) x es más dispersa que y. b) son igual de dispersas. 9.- Sean dos variables estadísticas x e y con los siguientes valores x = 5, σ VARIABLES ESTADÍSTICAS 1.- Sea X una variable estadística de media 2 metros y desviación típica 5 metros. Sea Y una variable estadística de media 24 cm y desviación típica 60 centímetros. a) Y es más dispersa

Más detalles

Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va

Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va Jesús Fernández Fernández Carmen María Sordo García DEPARTAMENTO DE MATEMÁTICA APLICADA Y CIENCIAS DE LA COMPUTACIÓN UNIVERSIDAD DE CANTABRIA

Más detalles

ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA DESCRIPTIVA Universidad Técnica de Babahoyo ESTADÍSTICA DESCRIPTIVA MEDIDAS DE POSICIÓN Y DE TENDENCIA CENTRAL OBJETIVO Analizar y Describir las Características de una Muestra a través de sus estadísticos ó estadígrafos

Más detalles

ESTADÍSTICA. 1. Introducción. 2. Frecuencias

ESTADÍSTICA. 1. Introducción. 2. Frecuencias ESTADÍSTICA Jesús García de Jalón de la Fuente 1. Introducción La Estadística trata de describir colectividades formadas por un gran número de objetos. El conjunto de los objetos que se estudian se denomina

Más detalles

TEMA 1: ESTADISTICA DESCRIPTIVA

TEMA 1: ESTADISTICA DESCRIPTIVA ESTADÍSTICA, CURSO 008 009 1 TEMA 1: ESTADISTICA DESCRIPTIVA 1 FUDAMETOS 11 VARIABLES ESTADISTICAS Población: conjunto completo de elementos, con alguna característica común, objeto del estudio estadístico

Más detalles

Estadística Descriptiva en SPSS

Estadística Descriptiva en SPSS Estadística Descriptiva en SPSS Marcelo Rodríguez Ingeniero Estadístico - Magister en Estadística Universidad Católica del Maule Facultad de Ciencias Básicas Pedagogía en Matemática Estadística I 22 de

Más detalles

M Dolores Redondas Curso

M Dolores Redondas Curso M Dolores Redondas dolores.redondas@upm.es E.U. Arquitectura Técnica U.P.M. Curso 2009-2010 2 Problemas básicos de la estadística aplicada Algunos problemas básicos que suelen presentarse en la investigación

Más detalles

INGENIERO EN COMPUTACION TEMA 1.2: PRESENTACIÓN GRÁFICA DE DATOS

INGENIERO EN COMPUTACION TEMA 1.2: PRESENTACIÓN GRÁFICA DE DATOS UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO CENTRO UNIVERSITARIO UAEM ZUMPANGO INGENIERO EN COMPUTACION TEMA 1.2: PRESENTACIÓN GRÁFICA DE DATOS ELABORÓ: M. EN C. LUIS ENRIQUE KU MOO FECHA: Agosto de 2016

Más detalles

Nombre: Curso: Fecha:

Nombre: Curso: Fecha: REPASO Y APOYO RECONOCER Y DIFERENCIAR LOS CONCEPTOS DE POBLACIÓN Y MUESTRA OBJETIVO 1 La Estadística es la ciencia encargada de recoger, analizar e interpretar los datos relativos a un conjunto de elementos.

Más detalles

Módulo de Estadística

Módulo de Estadística Módulo de Estadística Tema 2: Estadística descriptiva Tema 2: Estadísticos 1 Medidas La finalidad de las medidas de posición o tendencia central (centralización) es encontrar unos valores que sinteticen

Más detalles

Estadística I Tema 2: Análisis de datos univariantes Descripción numérica de datos

Estadística I Tema 2: Análisis de datos univariantes Descripción numérica de datos Estadística I Tema 2: Análisis de datos univariantes Descripción numérica de datos Descripción numérica de datos: medidas descriptivas Centro Posición Variación Forma media cuartiles rango coef. asimetría

Más detalles

GLOSARIO ESTADÍSTICO. Fuente: Murray R. Spiegel, Estadística, McGraw Hill.

GLOSARIO ESTADÍSTICO. Fuente: Murray R. Spiegel, Estadística, McGraw Hill. GLOSARIO ESTADÍSTICO Fuente: Murray R. Spiegel, Estadística, McGraw Hill. CONCEPTOS Y DEFINICIONES ESPECIALES Es el estudio científico de los métodos para recoger, organizar, resumir y analizar los datos

Más detalles

NIVELACIÓN DE ESTADISTICA. Carlos Darío Restrepo

NIVELACIÓN DE ESTADISTICA. Carlos Darío Restrepo NIVELACIÓN DE ESTADISTICA Qué es la estadística? CONCEPTOS BASICOS Es una rama de las matemáticas que se ocupa de recopilar datos, de ordenarlos para una mejor comprensión del fenómeno que se desea estudiar

Más detalles

Tema 12: Introducción a la Estadística.

Tema 12: Introducción a la Estadística. MOLEDO GUGLIOTTA VICTOR Tratamiento de los datos Tema 12: Introducción a la Estadística. Al intentar interpretar la realidad a través de las herramientas que nos aporta la Estadística, lo primero que se

Más detalles

MEDIDAS DE POSICIÓN CUANTILES CUARTILES DECILES CARLOS DARIO RESTREPO

MEDIDAS DE POSICIÓN CUANTILES CUARTILES DECILES CARLOS DARIO RESTREPO MEDIDAS DE POSICIÓN Las Medidas de Posición, también conocidas como Otras Medidas de Dispersión, son otras medidas o métodos que resultan ser más prácticos para precisar ciertas situaciones en las que

Más detalles

Tabla de frecuencias agrupando los datos Cuando hay muchos valores distintos, los agruparemos en intervalos (llamados clases) de la misma amplitud.

Tabla de frecuencias agrupando los datos Cuando hay muchos valores distintos, los agruparemos en intervalos (llamados clases) de la misma amplitud. 1. TABLAS Y GRÁFICOS ESTADÍSTICOS Estadística Es la ciencia que estudia conjunto de datos obtenidos de la realidad. Estos datos son interpretados mediante tablas, gráficas y otros parámetros tales como

Más detalles

Análisis de datos y gestión n veterinaria. Tema 1 Estadística descriptiva. Prof. Dr. José Manuel Perea Muñoz

Análisis de datos y gestión n veterinaria. Tema 1 Estadística descriptiva. Prof. Dr. José Manuel Perea Muñoz Análisis de datos y gestión n veterinaria Tema 1 Estadística descriptiva Prof. Dr. José Manuel Perea Muñoz Departamento de Producción Animal Facultad de Veterinaria Universidad de Córdoba Córdoba, de Septiembre

Más detalles

CLASIFICACIÓN DE LA ESTADÍSTICA

CLASIFICACIÓN DE LA ESTADÍSTICA Estadística aplicada a la Investigación Docente: BC. Aníbal Espínola Cano CLASIFICACIÓN DE LA ESTADÍSTICA 1 ESTADÍSTICA DESCRIPTIVA Ordenando la Información Al ordenar datos muy numerosos, es usual agruparlos

Más detalles

ESTADÍSTICA 1.- NOCIONES GENERALES

ESTADÍSTICA 1.- NOCIONES GENERALES ESTADÍSTICA 1.- NOCIONES GENERALES : Conjunto de elementos cuyo conocimiento es objeto de estudio. Ejemplo: Jóvenes de Laguna de Duero. : Parte de la población cuyo estudio sirve para inferir características

Más detalles

Estadística con R. Nivel Básico

Estadística con R. Nivel Básico Estadística con R. Nivel Básico Vanesa Jordá Departamento de Economía Universidad de Cantabria 11 de octubre de 2017 jordav@unican.es 1 Índice: Estadística descriptiva u Datos univariantes: I. Medidas

Más detalles

MÓDULO III. MEDIDAS DE TENDENCIA CENTRAL, DISPERSIÓN Y ASIMETRÍA

MÓDULO III. MEDIDAS DE TENDENCIA CENTRAL, DISPERSIÓN Y ASIMETRÍA 1 UNIVERSIDAD NACIONAL EXPERIMENTAL DE LOS LLANOS OCCIDENTALES EZEQUIEL ZAMORA VICE-RECTORADO DE PLANIFICACIÓN Y DESARROLLO SOCIAL PROGRAMA CIENCIAS SOCIALES Y JURIDICAS SUBPROGRAMA ADMINISTRACIÓN SUBPROYECTO:

Más detalles

Tema 5. Variables Aleatorias

Tema 5. Variables Aleatorias Tema 5. Variables Aleatorias Presentación y Objetivos. En este tema se estudia el concepto básico de Variable Aleatoria así como diversas funciones fundamentales en su desarrollo. Es un concepto clave,

Más detalles

MEDIDAS DE DISPERSIÓN Y ASIMETRÍA DE UNA DISTRIBUCIÓN DE FRECUENCIAS

MEDIDAS DE DISPERSIÓN Y ASIMETRÍA DE UNA DISTRIBUCIÓN DE FRECUENCIAS MEDIDAS DE DISPERSIÓN Y ASIMETRÍA DE UNA DISTRIBUCIÓN DE FRECUENCIAS www.cedicaped.com MEDIDAS DE DISPERSIÓN En clases anteriores se definieron algunas medidas de centralización, entre ellas, la más utilizada:

Más detalles

Medidas de variabilidad (dispersión)

Medidas de variabilidad (dispersión) Medidas de posición Las medidas de posición nos facilitan información sobre la serie de datos que estamos analizando. Estas medidas permiten conocer diversas características de esta serie de datos. Las

Más detalles

Parámetros Estadísticos básicos, Resumen y Presentación de datos. Jhon Jairo Padilla, PhD.

Parámetros Estadísticos básicos, Resumen y Presentación de datos. Jhon Jairo Padilla, PhD. Parámetros Estadísticos básicos, Resumen y Presentación de datos Jhon Jairo Padilla, PhD. Motivación Los resúmenes y las representaciones de datos son esenciales porque: Enfocan al ingeniero en características

Más detalles

Estadística. Conceptos de Estadística Descriptiva

Estadística. Conceptos de Estadística Descriptiva Estadística Conceptos de Estadística Descriptiva Estadística Descriptiva Recordemos que : Es la rama de la Estadística que trata básicamente sobre la recolección, organización, presentación, descripción,

Más detalles

Instrumentos y matriz de datos

Instrumentos y matriz de datos Curso: Estadística Instrumentos y matriz de datos Medidas descriptivas de Tendencia Central y Posición Estadística Descriptiva Profesor: Gonzalo Fernández Fecha: 19/09/2017 LOGRO DE LA SESIÓN Al finalizar

Más detalles

REPASO DE ESTADÍSTICA DESCRIPTIVA

REPASO DE ESTADÍSTICA DESCRIPTIVA ÍNDICE: 1.- Tipos de variables 2.- Tablas de frecuencias 3.- Gráficos estadísticos 4.- Medidas de centralización 5.- Medidas de dispersión REPASO DE ESTADÍSTICA DESCRIPTIVA 1.- Tipos de variables La estadística

Más detalles

2º GES T.5 - ESTADÍSTICA TEMA 5. ESTADÍSTICA

2º GES T.5 - ESTADÍSTICA TEMA 5. ESTADÍSTICA TEMA 5. ESTADÍSTICA La estadística, a nivel primario, es una actividad que todo el mundo hace desde muy pequeño. El mero hecho de contar y/o clasificar tus juguetes (tus coches, muñecas/os, canicas, videojuegos,

Más detalles

Estadística Descriptiva o deductiva Inferencial o inductiva Población: Variable: Variable cualitativa: Variable cuantitativa: Variable discreta

Estadística Descriptiva o deductiva Inferencial o inductiva Población: Variable: Variable cualitativa: Variable cuantitativa: Variable discreta Estadística La Estadística es la ciencia que trata de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar datos, así como de realizar inferencias a partir de

Más detalles

Conceptos de Estadística

Conceptos de Estadística Definición de Estadística La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Conceptos de Estadística

Más detalles

10/02/2015. Ángel Serrano Sánchez de León

10/02/2015. Ángel Serrano Sánchez de León Ángel Serrano Sánchez de León 1 Índice Introducción Variables estadísticas Distribuciones de frecuencias Introducción a la representación gráfica de datos Medidas de tendencia central: media (aritmética,

Más detalles

UNIDAD 7 Medidas de dispersión

UNIDAD 7 Medidas de dispersión UNIDAD 7 Medidas de dispersión UNIDAD 7 MEDIDAS DE DISPERSIÓN Al calcular un promedio, por ejemplo la media aritmética no sabemos su representatividad para ese conjunto de datos. La información suministrada

Más detalles

Estadís-ca. María Dolores Frías Domínguez Jesús Fernández Fernández Carmen María Sordo. Tema 1. Estadís-ca descrip-va

Estadís-ca. María Dolores Frías Domínguez Jesús Fernández Fernández Carmen María Sordo. Tema 1. Estadís-ca descrip-va Estadís-ca Tema 1. Estadís-ca descrip-va María Dolores Frías Domínguez Jesús Fernández Fernández Carmen María Sordo Departamento de Matemá.ca Aplicada y Ciencias de la Computación Este tema se publica

Más detalles

ESTADISTICA Y PROBABILIDAD ESTADÍSTICA

ESTADISTICA Y PROBABILIDAD ESTADÍSTICA ESTADÍSTICA La estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comprobaciones y sacar conclusiones. Un estudio estadístico consta

Más detalles

OARI CLASE 19/05/2015. DESCRIPCIÓN CUANTITATIVA DE LOS DATOS. MEDIDAS RESUMEN

OARI CLASE 19/05/2015. DESCRIPCIÓN CUANTITATIVA DE LOS DATOS. MEDIDAS RESUMEN OARI CLASE 19/05/2015. DESCRIPCIÓN CUANTITATIVA DE LOS DATOS. MEDIDAS RESUMEN Licenciatura en Gestión Ambiental 2015 Estimación de estadísticos descriptivos Una descripción cuantitativa de datos incluye:

Más detalles

En todo proceso de investigación se generan datos y es la Estadística la disciplina encargada de :

En todo proceso de investigación se generan datos y es la Estadística la disciplina encargada de : En todo proceso de investigación se generan datos y es la Estadística la disciplina encargada de : Organizarlos y resumir Estadística la información Descriptiva Extraer conclusiones acerca de hipótesis

Más detalles

MEDIDAS. necesita de ciertas medidas (números) representativas que puedan resumirlos. distribuciones de frecuencias de datos univariados:

MEDIDAS. necesita de ciertas medidas (números) representativas que puedan resumirlos. distribuciones de frecuencias de datos univariados: MEDIDAS O Para describir los datos, se necesita de ciertas medidas (números) representativas que puedan resumirlos. O Sirven para caracterizar las distribuciones de frecuencias de datos univariados: O1-

Más detalles

ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA DESCRIPTIVA 1. Conceptos Generales Población estadística.- Conjunto de todos los elementos sobre el que recaen las observaciones. Las poblaciones pueden ser: infinitas, p.e. extracciones con

Más detalles

Muestra Una muestra es una parte de la población que elegimos para estudiar la población.

Muestra Una muestra es una parte de la población que elegimos para estudiar la población. 1.- TERMINOLOGÍA ESTADÍSTICA. TÉCNICAS DE SELECCIÓN DE MUESTRAS Estadística descriptiva Es la ciencia que estudia conjuntos de datos obtenidos de la realidad. Estos datos son interpretados mediante tablas,

Más detalles

Asimetría Coeficiente de Asimetría de Fisher

Asimetría Coeficiente de Asimetría de Fisher Asimetría Si los valores de la serie de datos presenta la misma forma a izquierda y derecha de un valor central (media aritmética) se dice que es simétrica de lo contrario será asimétrica. Para medir el

Más detalles

+ f 2. + f 3. p i. =h i 100. F i. = f i. H i. = h i. P i. = p i

+ f 2. + f 3. p i. =h i 100. F i. = f i. H i. = h i. P i. = p i OCIOES de ESTADÍSTICA En las tablas estadísticas se pueden tabular, entre otros, los siguientes aspectos: La frecuencia absoluta ( f i ), es decir, el número de veces que aparece un determinado valor en

Más detalles

Unidad VIII: DATOS Y AZAR. CLASE 1: Recordando algunos conceptos previos de Estadística

Unidad VIII: DATOS Y AZAR. CLASE 1: Recordando algunos conceptos previos de Estadística Unidad VIII: DATOS Y AZAR CLASE 1: Recordando algunos conceptos previos de Estadística Medidas de t. central Media Mediana Moda Estadística Tablas Gráficos Frecuencias Otras medidas de posición Marca de

Más detalles

ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL. 30/09/2004 Proyecto MaMaEuSch 1

ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL. 30/09/2004 Proyecto MaMaEuSch 1 ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL 0/09/00 Proyecto MaMaEuSch Estadística Ciencia que trata sobre los métodos científicos para: Recoger, organizar, resumir y analizar datos Sacar conclusiones relevantes

Más detalles

II. ORGANIZACIÓN N Y PRESENTACIÓN N DE DATOS

II. ORGANIZACIÓN N Y PRESENTACIÓN N DE DATOS UNIVERSIDAD INTERAMERICANA PARA EL DESARROLLO ORGANIZACIÓN N Y PRESENTACIÓN N DE DATOS Contenido II. ORGANIZACIÓN N Y PRESENTACIÓN N DE DATOS II. Tablas de frecuencia II. Gráficos: histograma, ojiva, columna,

Más detalles

1. Estadística. 2. Seleccionar el número de clases k, para agrupar los datos. Como sugerencia para elegir el k

1. Estadística. 2. Seleccionar el número de clases k, para agrupar los datos. Como sugerencia para elegir el k 1. Estadística Definición: La estadística es un ciencia inductiva que permite inferir características cualitativas y cuantitativas de un conjunto mediante los datos contenidos en un subconjunto del mismo.

Más detalles

ANÁLISIS DE DATOS UNIDIMENSIONALES

ANÁLISIS DE DATOS UNIDIMENSIONALES ANÁLISIS DE DATOS UNIDIMENSIONALES TABLAS DE FRECUENCIAS Y REPRESENTACIONES GRÁFICAS MEDIDAS DE POSICIÓN MEDIDAS DE TENDENCIA CENTRAL MEDIA ARITMÉTICA OTRAS MEDIAS: GEOMÉTRICA.ARMÓNICA.MEDIA GENERAL MEDIANA

Más detalles

Tablas de contingencia Las tablas de frecuencia pueden organizar datos de sólo una variable a la vez.

Tablas de contingencia Las tablas de frecuencia pueden organizar datos de sólo una variable a la vez. Tablas de contingencia Las tablas de frecuencia pueden organizar datos de sólo una variable a la vez. Si se desea examinar o comparar dos variables, una tabla de contingencia resulta de mucha utilidad.

Más detalles

PROBABILIDAD. Unidad I Ordenamiento de la Información

PROBABILIDAD. Unidad I Ordenamiento de la Información 1 PROBABILIDAD Unidad I Ordenamiento de la Información 2 Captura de datos muestrales Conceptos básicos de la estadística 3 Población (o universo): Totalidad de elementos o cosas bajo consideración Muestra:

Más detalles

MEDIDAS. necesita de ciertas medidas (números) representativas que puedan resumirlos. distribuciones de frecuencias de datos univariados:

MEDIDAS. necesita de ciertas medidas (números) representativas que puedan resumirlos. distribuciones de frecuencias de datos univariados: MEDIDAS O Para describir los datos, se necesita de ciertas medidas (números) representativas que puedan resumirlos. O Sirven para caracterizar las distribuciones de frecuencias de datos univariados: O1-

Más detalles

ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA DESCRIPTIVA 1.- DISTRIBUCIONES UNIDIMENSIONALES. CONCEPTOS GENERALES. La estadística se puede dividir en dos partes: Estadística descriptiva o deductiva. Estadística inferencial o inductiva.

Más detalles

TEMA 2.- VARIABLES ALEATORIAS UNIDIMENSIONALES.- CURSO 17/18

TEMA 2.- VARIABLES ALEATORIAS UNIDIMENSIONALES.- CURSO 17/18 TEMA 2.- VARIABLES ALEATORIAS UNIDIMENSIONALES.- CURSO 17/18 2.1. Concepto de variable aleatoria. Tipos de variables aleatorias: discretas y continuas. 2.2. Variables aleatorias discretas. Diagrama de

Más detalles

1 POBLACIÓN Y MUESTRA

1 POBLACIÓN Y MUESTRA 1 POBLACIÓN Y MUESTRA Estadística.- es la rama de las matemáticas que se encarga de describir y analizar datos de un estudio, y obtener consecuencias válidas del estudio. Población.- es el conjunto de

Más detalles

TEMA 7. ESTADÍSTICA. INDIVÍDUO: Es cada uno de los elementos que forman la población o la muestra.

TEMA 7. ESTADÍSTICA. INDIVÍDUO: Es cada uno de los elementos que forman la población o la muestra. TEMA 7. ESTADÍSTICA ACCESO CICLO SUPERIOR En esta sociedad resulta imprescindible disponer de técnicas que permitan obtener, de forma sencilla y fiable, información de los diferentes conjuntos de datos

Más detalles

COLEGIO INTERNACIONAL SEK ALBORÁN. Middle Years Programme [PROGRAMA DE AÑOS INTERMEDIOS] CURSO ACADÉMICO

COLEGIO INTERNACIONAL SEK ALBORÁN. Middle Years Programme [PROGRAMA DE AÑOS INTERMEDIOS] CURSO ACADÉMICO COLEGIO INTERNACIONAL SEK ALBORÁN Departamento de MATEMÁTICAS Middle Years Programme [PROGRAMA DE AÑOS INTERMEDIOS] CURSO ACADÉMICO 2012-2013 2º ESO Apuntes de estadística y probabilidad 3. ESTADÍSTICA.

Más detalles