Universidad de Salamanca - Escuela de Educación y Turismo
! "
# $ % $ & ' ( ) * ( +(, +
' -. '. ' - % $ / %.!
'. " # $ % & & $ % #
# $( #. 0 # (/ $.
# % 0 1 # % ( # 0 # 0 1
# 0. (, (! " # # #. $ ($
' 0 - $ % $ % # % ' & &- 2 ( ( & ( ) & " ' ( ) "( * +, -.
/ ' 0 34. 4 " '! # % 1 ' 23, *- *- *) *4 ** *5 *- -* *. -) 5
' $ # $. $ 5( ( % 5 2$- ( $$ - ( / (/
! " #
1 '6 $ 0 $(/ $. &( 5 % $. $$ # / 6. $
% 5 "! % ( ) 74.8'.9 44 5 5 7'.82.9 '4 *. *5 72.85.9 24 *' :) 75.8,.9 54 *) )5 7,.8*..9,4 *. 45 7*..8**.9 **. 4 ': 7**.8*-.9 **4 - '4 '4
1 ; 0 6
'$. #$ % ( #.4%7 8 #< ) Media aritmética La media es el valor promedio de la distribución. Mediana La mediana es la puntación de la escala que separa la mitad superior de la distribución y la inferior, es decir divide la serie de datos en dos partes iguales. # #. $
# " "= #> "? #?? #? 0% $ 1 )
# "" 5. 4 ; # # # 6 $ *+ ; -0 $$ $ $!$!$!$"$"#@4 :0 9$:$;$2$$ #@,A4
$ # (& 5. %.!B* B* #
#+" #. ; 0 # 0 & 1 ) $$$ $ $ $!$!# @) 0 (& 1$ $ $ $$$ $ $!$!$!$9$:$;$;$;# @*848, ( $& $$$$"$"$;$; 0; $0$ 2$$$$!$!$9$:#@)
$! B* BB* BC* 34. 0 4)
* # % - ( / % 6. 4 ; # ) # # % < / # %
D"=! # %. % E * 8E - ;E : % -4F84.F;24F E - $ *+ ; -< (. 1 $!$$"$9$ $ ; $!$$ $"$9$$;
$ 5 ( $
! #. < # % 2=$2=;2= 4 $ 5 ( $
/=! #,,. *.. # % =$=;;= / 4. % #
# - % # ) = 5 ; #? < #<? # < <
="&++=+== + *( - % = A > *.?@A@
" G# " # %? @0B0 #? #
0% ( $ 1 )
"= "H" #<? #% <
6 $<%( 1..% <
" GI/ " # << 5 $ % #
6 %( 1..% %(
+, =!" GD +"! % 1 1 % ( =!" G"I " % 1 1 % ( "= "(!"I "( # +"! ' %. % $JK8L9 5 %. 1 $ % % % = (D +( # +"! 0.. % % % $ 71 $ 8 0 % $ - 0. - - $
+"= "H" #< % 4 % % % #< 0; 0; #< % 0 0; M. 0 0; N. % #< % $ & &. % ( - 5 $<% 1 34 % 1
+==!" G #. 1 %. % 5 $ % 5. $. %. & *3 # % #
-3 # % % # :3 # & (/ % 5. %
& 5 1. & 0 ) *A # 4 -A? # 4 4
:A # & (/ % 5. % 5 < % 5 1
/ *A5 %& 5 $ 1 % -A5(. < 0% %$ 0% (%$ % 0% $ 1 :A5 / *OO*
)A0 % $ 1 4A0 % ;$ 1 'A0 % 2$? 2A0? $ 5 % &
="=&= G #. - - # = LK # ( B C % B C # %% % C = KL # C B % C B # %% % B 0 $?2$ ( $ ) B? C?
Ejercicio resuelto nº1: Si en la E.U. de Turismo están matriculados 1.000 alumnos, en la de Economía 3.000 y en la de Ingeniería 6.000 y se quiere obtener una muestra estratificada de tamaño 100. Cuantos alumnos han de seleccionarse en cada una de las carreras anteriores, si aceptamos la proporcionalidad para realizar el muestreo: Solución: Si denominamos n T, n E y n I a los tamaños muestrales de Turismo, Economía e Ingeniería, se tiene que verificar que: n T + n E + n I =100 y como hemos admitido proporcionalidad entonces: n I n T n E ------ = ------= ------ 1000 3000 6000 Resolviendo el sistema de ecuaciones llegamos a n T =10, n E =30 y n I =60
Ejercicio resuelto nº 2.- Si disponemos de los siguientes datos de una estadística de saldos de cuentas bancarias por ciudades, se necesita conocer, media, moda, varianza y desviación típica. Intervalos Número de ciudades Saldos en MM De 20 a 39 MM 5 29,5 De 40 a 54 MM 7 47,0 De 55 a 89 MM 17 72,0 De 90 a 179 MM 20 134,5 De 180 a 359 MM 4 269,5 De 361 a 600 MM 2 480,5 Más de 600 MM 1 1.800,0 Totales 56 2.833,0
Intervalos (L) Número de ciudades (f) Saldos en MM (x) x por f F De 20 a 39 MM 5 29,5 147,5 5 De 40 a 54 MM 7 47,0 329,0 12 De 55 a 89 MM 17 72,0 1.224,0 29 De 90 a 179 M 20 134,5 2.690,0 49 De 180 a 359 4 269,5 1.078,0 53 De 361 a 600 2 480,5 961,0 55 Más de 600 M 1 1.800,0 1.800,0 56 Totales 56 2.833,0 8.229,5 Media 8.229,5/56 = 147,0 Mediana Li-1 + (N/2-Fi-1)*ai/fi= 87,0 donde: Li-1 = 55 N/2= 28 Fi-1= 12 ai= 34 fi= 17 Moda Li-1 + [fi+1/(fi+1 + fi-1)]*ai= 107,0 donde: Li-1 = 90 fi+1= 4 fi-1= 17 ai= 89
Intervalos (L) Número de ciudades (f) Saldos en MM (x) x por f F Sum (xi) 2 fi De 20 a 39 MM 5 29,5 147,5 5 4.351,3 De 40 a 54 MM 7 47,0 329,0 12 15.463,0 De 55 a 89 MM 17 72,0 1.224,0 29 88.128,0 De 90 a 179 M 20 134,5 2.690,0 49 361.805,0 De 180 a 359 4 269,5 1.078,0 53 290.521,0 De 361 a 600 2 480,5 961,0 55 461.760,5 Más de 600 M 1 1.800,0 1.800,0 56 3.240.000,0 Totales 56 2.833,0 8.229,5 4.462.028,8 Varianza [Sum (xi) 2 fi/n]-media 2 = 58.083,2 donde Sum (xi) 2 fi = 4.462.028,8 N= 56 Media 2 = 21.595,9 Desviación típica Raíz cuadrada de la varianza 241,0 Tarea.- Porqué la desviación típica tiene un valor tan elevado en relación a la media aritmética?
Ejercicio resuelto nº 3.- Calcule los cuartiles con los datos de la serie anterior. Intervalos (L) Número de ciudades (f) Saldos en MM (x) x por f F Sum (xi) 2 fi De 20 a 39 M 5 29,5 147,5 5 4.351,3 De 40 a 54 M 7 47,0 329,0 12 15.463,0 De 55 a 89 M 17 72,0 1.224,0 29 88.128,0 De 90 a 179 M 20 134,5 2.690,0 49 361.805,0 De 180 a 359 4 269,5 1.078,0 53 290.521,0 De 361 a 600 2 480,5 961,0 55 461.760,5 Más de 600 M 1 1.800,0 1.800,0 56 3.240.000,0 Totales 56 2.833,0 8.229,5 4.462.028,8 Mediana Li-1 + (N/2-Fi-1)*ai/fi= 87,0 Segundo cuartil Coincide con la Mediana = 87,0 donde: Li-1 = 55 N/2= 28 Fi-1= 12 ai= 34 fi= 17 Primer cuartil Li-1 + (N/4-Fi-1)*ai/fi= 59,0 donde: Li-1 = 55 N/4= 14 Fi-1= 12 ai= 34 fi= 17 Tercer cuartil Li-1 + (3N/4-Fi-1)*ai/fi= 147,9 donde: Li-1 = 90 3N/4= 42 Fi-1= 29 ai= 89 fi= 20 Tarea.- Calcule Vd., 5 deciles y 5 percentiles con esta serie de datos.
Ejercicio resuelto nº 4.- Disponemos de los datos de renta personal disponible de 50 personas y el saldo depositado en cuentas corrientes en entidades financieras (en miles de ). Se pide: a) Representar la nube de puntos b) Estimar una ecuación de regresión lineal simple de Y sobre X. c) Explicar económicamente los resultados obtenidos. Nota.- Este ejercicio debe desarrollarse en una hoja de cálculo.
Datos: Personas Renta (X) Saldos (Y) Persona nº 1 22 11 Persona nº 2 22 7 Persona nº 3 85 26 Persona nº 4 28 6 Persona nº 5 12 6 Persona nº 6 42 4 Persona nº 7 60 23 Persona nº 8 152 82 Persona nº 9 27 15 Persona nº 10 27 8 Persona nº 11 64 13 Persona nº 12 34 6 Persona nº 13 34 5 Persona nº 14 50 11 Persona nº 15 75 22 Persona nº 16 15 3 Persona nº 17 42 22 Persona nº 18 48 10 Persona nº 19 10 3 Persona nº 20 69 39 Persona nº 21 26 4 Persona nº 22 17 6 Persona nº 23 42 7 Persona nº 24 41 9 Persona nº 25 33 12 Personas Renta (X) Saldos (Y) Persona nº 26 20 10 Persona nº 27 23 6 Persona nº 28 158 17 Persona nº 29 65 18 Persona nº 30 63 10 Persona nº 31 44 16 Persona nº 32 31 18 Persona nº 33 88 16 Persona nº 34 13 1 Persona nº 35 46 9 Persona nº 36 63 22 Persona nº 37 23 4 Persona nº 38 42 5 Persona nº 39 40 8 Persona nº 40 9 4 Persona nº 41 103 10 Persona nº 42 6 2 Persona nº 43 40 14 Persona nº 44 9 4 Persona nº 45 34 6 Persona nº 46 172 46 Persona nº 47 35 4 Persona nº 48 118 48 Persona nº 49 14 0 Persona nº 50 68 32
a) Nube de puntos: Por la forma que toma esta nube de puntos intuimos que puede existir una correlación fuerte entre ambas variables.
b) Estimar una ecuación de regresión lineal simple de Y sobre X. Para proceder a estimar la recta de regresión simple o ecuación que toma la forma: Y= a + b.x, donde los coeficientes a y b son: b= Covarianzaxy/Varianza x= donde la covarianza xy=sumx.y/n Y md.x md y la varianza de x =SumX 2 /N- X md 2 a=y md -b.x md, donde Y md,x md, son las medias aritméticas de cada una de las variables X e Y. También debemos hallar el coeficiente de correlación (Pearson) para ver el grado de dependencia de las variables.
Personas Renta (X) Saldos (Y) SumX.Y SumX 2 SumY 2 Y estimado Persona nº 1 22 11 242 484 121 6,1 Persona nº 2 22 7 154 484 49 6,1 Persona nº 3 85 26 2.210 7.225 676 24,7 Persona nº 4 28 6 168 784 36 7,9 Persona nº 5 12 6 72 144 36 3,2 Persona nº 6 42 4 168 1.764 16 12,0 Persona nº 7 60 23 1.380 3.600 529 17,3 Persona nº 8 152 82 12.464 23.104 6.724 44,5 Persona nº 9 27 15 405 729 225 7,6 Persona nº 10 27 8 216 729 64 7,6 Persona nº 11 64 13 832 4.096 169 18,5 Persona nº 12 34 6 204 1.156 36 9,6 Persona nº 13 34 5 170 1.156 25 9,6 Persona nº 14 50 11 550 2.500 121 14,4 Persona nº 15 75 22 1.650 5.625 484 21,7 Persona nº 16 15 3 45 225 9 4,0 Persona nº 17 42 22 924 1.764 484 12,0 Persona nº 18 48 10 480 2.304 100 13,8 Persona nº 19 10 3 30 100 9 2,6 Persona nº 20 69 39 2.691 4.761 1.521 20,0 Persona nº 21 26 4 104 676 16 7,3 Persona nº 22 17 6 102 289 36 4,6 Persona nº 23 42 7 294 1.764 49 12,0 Persona nº 24 41 9 369 1.681 81 11,7 Persona nº 25 33 12 396 1.089 144 9,4
Personas Renta (X) Saldos (Y) SumX.Y SumX 2 SumY 2 Y estimado Persona nº 26 20 10 200 400 100 5,5 Persona nº 27 23 6 138 529 36 6,4 Persona nº 28 158 17 2.686 24.964 289 46,2 Persona nº 29 65 18 1.170 4.225 324 18,8 Persona nº 30 63 10 630 3.969 100 18,2 Persona nº 31 44 16 704 1.936 256 12,6 Persona nº 32 31 18 558 961 324 8,8 Persona nº 33 88 16 1.408 7.744 256 25,6 Persona nº 34 13 1 13 169 1 3,4 Persona nº 35 46 9 414 2.116 81 13,2 Persona nº 36 63 22 1.386 3.969 484 18,2 Persona nº 37 23 4 92 529 16 6,4 Persona nº 38 42 5 210 1.764 25 12,0 Persona nº 39 40 8 320 1.600 64 11,4 Persona nº 40 9 4 36 81 16 2,3 Persona nº 41 103 10 1.030 10.609 100 30,0 Persona nº 42 6 2 12 36 4 1,4 Persona nº 43 40 14 560 1.600 196 11,4 Persona nº 44 9 4 36 81 16 2,3 Persona nº 45 34 6 204 1.156 36 9,6 Persona nº 46 172 46 7.912 29.584 2.116 50,4 Persona nº 47 35 4 140 1.225 16 9,9 Persona nº 48 118 48 5.664 13.924 2.304 34,4 Persona nº 49 14 0 0 196 0 3,7 Persona nº 50 68 32 2.176 4.624 1.024 19,7 Totales 2.404 690 54.019 186.224 19.944 690,0
N= 50 Medias aritméticas Variable X = 48,1 =X md Variable Y = 13,8 =Y md Varianzas, covarianzas y desviaciones típicas Coeficiente de correlación (Pearson) = 0,77 (Covarianza xy / Desviación típica x. Desviación típica y) Coeficiente b=covarianzaxy/varianza x= 0,30 Coeficiente a=y md -b.x md = -0,39 Ecuación de regresión lineal : Y=-0,39+0,30.X Varianza x=sumx 2 /N- X md 2 = 1.412,8 Varianza y=sumy 2 /N- Y md 2 = 208,4 Covarianza xy=sumx.y/n Y md.x md = 416,9 Desviación típica x = 37,6 Desviación típica y = 14,4
En rojo, podemos observar la ecuación de regresión que hemos estimado anteriormente.
c) Explicar económicamente los resultados obtenidos. Hemos relacionado dos variables, considerándola la independiente la renta personal de las personas y como variable dependiente los saldos en cuenta. En los datos iniciales ya se puede intuir una fuerte correlación al estar la nube de puntos con una tendencia muy definida. Los resultados obtenidos mediante el coeficiente de correlación nos corroboran nuestra hipótesis inicial y proseguimos por tanto, para estimar una ecuación de regresión teórica que nos indique el ahorro de las familias. Esto nos lleva a aproximarnos a la propensión marginal del ahorro e indirectamente también a la propensión marginal al consumo de las familias.
Ejercicio resuelto nº 5.- Partimos de una serie de datos anuales que contienen el incremento del PIB mundial y el incremento de número de turistas internacionales en España. Se pide: a) Calcular el grado de correlación con el coeficiente de Pearson. b) En base a los datos anteriores, proceder ( o no) a estimar una recta de regresión. c) Explicación económica en base a los resultados estadísticos encontrados.
Datos de la serie: Año % Incremento % Incremento del PIB Mundial nº turistas 1981 1,92 0,2 1982 0,82-0,6 1983 2,81 1,8 1984 4,4 8,9 1985 3,54 4,3 1986 3,17 3,2 1987 3,44 8,9 1988 4,57 7 1989 3,92 6,5 1990 0,03 7,2 1991 1,4 0,7 1992 1,93 8,4 1993 1,51 3,3 1994 3,22 4,9 1995 2,92 4 Año % Incremento % Incremento del PIB Mundial nº turistas 1996 3,25 6,4 1997 3,62 4,1 1998 2,41 3 1999 3,27 3,7 2000 4,16 7,4 2001 1,71 0 2002 1,94 5 2003 2,77 3,8 2004 3,99 4,4 2005 3,5 7,7 2006 5,6 3,9 2007 3,8 2,9 2008 2-1,1 P2009-2,9-9,7
a) Calcular el grado de correlación con el coeficiente de Pearson. =0,676956125 (Correlación positiva) En probabilidad y estadística, la correlación indica la fuerza y la dirección de una relación lineal entre dos variables aleatorias. Se considera que dos variables cuantitativas están correlacionadas cuando los valores de una de ellas varían sistemáticamente con respecto a los valores homónimos de la otra: si tenemos dos variables (A y B) existe correlación si al aumentar los valores de A lo hacen también los de B y viceversa. La correlación entre dos variables no implica, por sí misma, ninguna relación de causalidad
El coeficiente de correlación de Pearson es un índice estadístico que mide la relación lineal entre dos variables cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables. El cálculo del coeficiente de correlación lineal se realiza dividiendo la covarianza por el producto de las desviaciones estándar de ambas variables: Siendo: XY la covarianza de (X,Y) X y Y las desviaciones típicas de las distribuciones marginales. El valor del índice de correlación varía en el intervalo [-1, +1]
* Si r = 0, no existe ninguna correlación. El índice indica, por tanto, una independencia total entre las dos variables, es decir, que la variación de una de ellas no influye en absoluto en el valor que pueda tomar la otra. * Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total entre las dos variables denominada relación directa: cuando una de ellas aumenta, la otra también lo hace en idéntica proporción. * Si 0 < r < 1, existe una correlación positiva. * Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia total entre las dos variables llamada relación inversa: cuando una de ellas aumenta, la otra disminuye en idéntica proporción. * Si -1 < r < 0, existe una correlación negativa.
b) En base a los datos anteriores, proceder ( o no) a estimar una recta de regresión Hemos visto por tanto con el coeficiente de Pearson que existe una correlación positiva, por tanto podemos estimar una recta de regresión. La relación entre dos variables cuantitativas queda representada mediante la línea de mejor ajuste, trazada a partir de la nube de puntos. Los principales componentes elementales de una línea de ajuste y, por lo tanto, de una correlación, son la fuerza, el sentido y la forma:
* La fuerza mide el grado en que la línea representa a la nube de puntos: si la nube es estrecha y alargada, se representa por una línea recta, lo que indica que la relación es fuerte; si la nube de puntos tiene una tendencia elíptica o circular, la relación es débil. * El sentido mide la variación de los valores de B con respecto a A: si al crecer los valores de A lo hacen los de B, la relación es positiva; si al crecer los valores de A disminuyen los de B, la relación es negativa. * La forma establece el tipo de línea que define el mejor ajuste: la línea recta, la curva monotónica o la curva no monotónica.
Relación entre el incremento del GDP y el incremento del número de turistas internacionales 10 5 0-4 -2 0 2 4 6 8-5 -10-15 nº turistas Lineal (nº turistas) c) Explicación económica: De acuerdo con la serie de datos que hemos analizado, observamos una relación directa entre el crecimiento (o decrecimiento) del PIB mundial y la llegada de turistas internacionales. Al estar el turismo vinculado a las actividades de ocio, resulta extraordinariamente sensible a las variaciones del PIB, o de otra manera, a las variaciones de renta de cada persona (este ejercicio se desarrolla en una hoja excel).