Facultad de Ciencias Sociales y Jurídicas

Documentos relacionados
Solución Ejercicio 7.

MODELO ECONOMÉTRICO. José María Cara Carmona. Adrián López Ibáñez. Explicación del desempleo

Ejercicio Heterocedasticidad_2

SEMINARIO ECONOMETRIA 14 DE MAYO DEL CASO: Determinando un éstandar de productividad comercial en banca

Modelo Econométrico sobre el Turismo

Modelo 1: MCO, usando las observaciones 1994: :03 (T = 218) Variable dependiente: INFLACION

Información sobre Gastos de Consumo Personal y Producto Interno Bruto ( ) en miles de millones de dólares de 1992.

D to de Economía Aplicada Cuantitativa I Basilio Sanz Carnero

T5. Ampliación del modelo lineal básico

Econometría. Examen 02/02/2015. La respuesta que no sea claramente interpretable se considerará incorrecta.

PARTICIPACIÓN DE LOS BENEFICIOS Y SALARIOS EN EL PRODUCTO INTERNO BRUTO: LA FUNCIÓN DE PRODUCCIÓN COBB-DOUGLAS VS EL SISTEMA DE CUENTAS NACIONALES

Guía breve de análisis de series temporales unidimensionales con Gretl

Tema 6. Multicolinealidad. Contenido Multicolinealidad perfecta Multicolinealidad de grado alto

FACTORES INFLUYENTES EN EL EMPLEO. Econometría II GECO Marina Calvillo Fuentes Rocío Crespo Roldán

D to de Economía Aplicada Cuantitativa I Basilio Sanz Carnero

Contenido. vii. Prólogo... i Presentación... iii Grupo de trabajo...v. 1. Introducción y conceptos preliminares...1

Modelos de elección discreta Aplicaciones en ordenador

El Modelo de Regresión Lineal

Econometría de Económicas Ejercicios para el tema 2 y 3

Econometría. Examen 24/06/2015. La respuesta que no sea claramente interpretable se considerará incorrecta.

T3. El modelo lineal básico

DEMANDA DE AUTOMOVILES EN ESPAÑA

T2. El modelo lineal simple

Prácticas Tema 5. Ampliaciones del Modelo lineal básico

Herramientas para el Estudio de Mercado. Técnicas de Predicción.

EXAMEN ECONOMETRÍA I GRUPO 31 LADE Prof. Rafael de Arce 3 de septiembre de Nombre y Apellidos:

CAPÍTULO 5. Proyecciones de las Fuentes de Empleo Características Generales del Modelo de Regresión Lineal Múltiple de las Fuentes

Econometría I (LADE). Curso 2001/2002 PRÁCTICA 08

Taller 7: Problemas Econométricos Econometría

CALIFICACION: - P C: precio medio de los productos sustitutivos existentes en el mercado en euros.

con los supuestos clásicos, uno de ellos es que ninguna de las variables X 1, X 2,, X K es

Generalmente, el objetivo de cualquier estudio de econometría es la. búsqueda de relaciones matemáticas que permitan explicar el comportamiento

Métodos Estadísticos para Economía y Gestión IN 540 Clase 7

Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)

BATA. Tabla: Resumen de Resultados. Turismo Resto de España.

Turistas españoles en Andalucía. Total, andaluces y resto de España. Años 2005 y 2006

ECONOMETRÍA I LICENCIATURA EN ECONOMÍA, Curso PRÁCTICA 1 (LECCIÓN 1): EN BUSCA DE ESPECIFICACIÓN Por Beatriz González López-Valcárcel

Modelos con Datos de Panel

ESTADISTICA AVANZADA MODULO I

T4. Modelos con variables cualitativas

El turismo alemán en Andalucía

EXAMEN DE ECONOMETRÍA

Ejercicios propuestos

7. Turismo deportivo PRINCIPALES RESULTADOS. Vivienda alquilada 8,4% Vacaciones de Navidad. Resto de mercado 10,9% Vivienda propia 5,2%

ÍNDICE PRESENTACIÓN 1 I. INTRODUCCIÓN A LA ECONOMETRÍA... 4 CURRICULUM I.1. 4 Definición... I.2

EXAMEN ECONOMETRÍA II GRUPO DADE Prof. Rafael de Arce 3 de septiembre de Nombre y Apellidos:

14.419,4. Europa (sin España) 29,7% Vivienda propia / multipropiedad 1,4% Vivienda de familiares o amigos 11,3% Resto no de.

EXAMEN ECONOMETRÍA I GRUPO 53 - DADE 8 de septiembre de 2005 Prof. Rafael de Arce

1. Materia objeto de la investigación estadística. 3. Principales conceptos. 2. Fuentes de información

4.023,6. Europa (sin España) 15,9% Resto 0,5% Vivienda de familiares o amigos 15,1% Resto no de mercado 5,6% Fin de semana 61,0%

MÓDULO X. LA DINÁMICA DE LA ECONOMÍA MUNDIAL PROGRAMA OPERATIVO MATEMÁTICAS ECONOMETRÍA I. Profesor: Noé Becerra Rodríguez.

Fundamentos del Análisis Econométrico. Dante A. Urbina

T6. Modelos multiecuacionales

El Modelo de Regresión Lineal General Estimación

Grado en Finanzas y Contabilidad

Estadística para la Economía y la Gestión IN 3401 Clase 5

1. EL TEJIDO EMPRESARIAL TURÍSTICO REGIONAL

PROBLEMA 1: Nivel nutricional de los menores de 6 años

EVOLUCIÓN DEL TURISMO EN ESPAÑA DURANTE EL AÑO

Tema 4. Regresión lineal simple

Gráfico 1: Evolución del exceso de rentabilidad de la empresa y de la cartera de mercado

Región de Murcia. Consejería de Cultura y Turismo. Elaboración: Secretaría General Unidad de Estudios y Estadística

CUESTIONES Y PROBLEMAS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES PROPUESTOS EN EXÁMENES

Para hacer predicciones de una serie temporal se debe estimar la tendencia por el método de los

y x Estimar por MCO un modelo lineal entre la variable explicada (y) y las

Curso de nivelación Estadística y Matemática

Tema 4: Cuestiones importantes en el Modelo Lineal General (MLG) Universidad Complutense de Madrid Febrero de 2012

El número de viajes de los residentes en España baja un 8,5% en el segundo trimestre y se sitúa en 42,8 millones

NOMBRE: I. TEST (debe marcar sólo un resultado como válido en cada pregunta)

Capítulo 3: Metodología y variables

Turismo del resto de España en Andalucía Año Demanda Turística de Andalucía. Mercados Turísticos

1.- Enumere las hipótesis básicas del modelo básico de regresión lineal

El número de viajes de los residentes en España baja un 2,6% en el primer trimestre 1 y se sitúa en 39,3 millones

Turismo extranjero en Andalucía Año Demanda Turística en Andalucía. Mercados turísticos

CURSO: ECONOMETRÍA Y ANÁLISIS DE POLÍTICAS FISCALES INSTRUCTOR: HORACIO CATALÁN ALONSO. Especificación de los modelos VAR

Consejería de Agricultura, Pesca y Desarrollo Rural. Estudio de la elasticidad de la demanda de aceite de oliva virgen en los hogares españoles

Evolución de las principales variables turísticas en el mercado extranjero. Trimestres

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10

UNIVERSIDAD NACIONAL DE TRUJILLO ESCUELA PROFESIONAL DE ECONOMÍA APUNTES DE CLASE ECUACIONES SIMULTÁNEAS: EJERCICIO 19.

MODELO DE RESPUESTAS Objetivos 2, 3, 4, 5, 6, 7, Y 8.

Análisis Estadístico

El número de viajes de los residentes en España aumenta un 1,0% en el segundo trimestre de y se sitúa en 50,9 millones

TRABAJO ECONOMETRIA (ETAPAS 1,2 Y 3)

El número de viajes de los residentes en España crece un 5,7% en el cuarto trimestre de 2017 y supera los 40 millones

OBSERVATORIO TURÍSTICO DE LA CIUDAD DE CÓRDOBA DATOS POSITIVOS PARA EL PRIMER TRIMESTRE DEL AÑO

Encuesta de ocupación en alojamientos hoteleros INE. Análisis de resultados - Junio 2016

El turismo como actividad estratégica de la economía andaluza. Año Economía del turismo en Andalucía

TEMA 4 Modelo de regresión múltiple

GUÍA PARA LAS SOLUCIONES DE LA PRÁCTICA 2 DE ECONOMETRÍA T.A: MªDolors Navarro Bergas. VARIABLE COEFICIENTE DESV.TÍP. ESTAD.

El número de viajes de los residentes en España aumenta un 2,6% en el tercer trimestre de 2018 y se sitúa en 65,6 millones

ECONOMÍA ANDALUZA. CUARTO TRIMESTRE DE 2015

TM 4. PROBLEMAS FRECUENTES PROVOCADOS POR LOS DATOS ECONOMICOS. 1. MULTICOLINEALIDAD: CONCEPTO Y TIPOS.

El número de viajes de los residentes en España se incrementa un 4,9% en el tercer trimestre y roza los 64,0 millones

REGRESIÓN LINEAL SIMPLE

TODO ECONOMETRIA TEMA 1: MODELO BASICO DE REGRESIÓN LINEAL MULTIPLE (MBRL)

El turismo como actividad estratégica de la economía andaluza. Año Economía del turismo en Andalucía

Contenido I. POBREZA II. DESIGUALDAD III. PET, PEI Y PEA EN CONDICIONES DE POBREZA IV. RESUMEN DE INDICADORES V. INDICADORES MACRO Y MERCADO LABORAL

El número de viajes de los residentes en España aumenta un 4,6% en el tercer trimestre y alcanza los 61,0 millones

Transcripción:

Facultad de Ciencias Sociales y Jurídicas Trabajo Fin de Grado ANÁLISIS DEL TURISMO EN ANDALUCÍA Y EN ESPAÑA MEDIANTE UN MODELO ECONOMÉTRICO Alumno: Silvia Sánchez Sánchez Enero, 2018

RESUMEN. La principal finalidad que persigue este Trabajo Fin de Grado es poder establecer una comparación, a través de los respectivos modelos econométricos, entre el sector turístico de Andalucía y de España, representado por la variable endógena número de viajeros que realizan una o más pernoctaciones de forma seguida en el mismo alojamiento hotelero, en la Comunidad Autónoma de Andalucía y en España, respectivamente. Para ello se va a obtener un modelo adecuado para cada supuesto que cumpla con todas las hipótesis básicas, mediante la aplicación de las diferentes fases del método econométrico. ABSTRACT. The principal purpose that chases this final degree projectis is to be able to stablish a comparison, across the respective models econometrics, between the tourist sector of Andalusia and Spain, represented by the endogenous variable number of travelers who stay to sleep in the same hotel for one or more days, in the Autonomous Community called Andalucia and in Spain, respectively. For it, there is going to be obtained a model adapted for every supposition which expires with all the basic hypotheses, through the application of the different phases of the method econometric. 1

ÍNDICE. 1. INTRODUCCIÓN 3 2. FASES DEL MODELO ECONOMÉTRICO 4 2.1. ESPECIFICACIÓN.. 4 2.2. ESTIMACIÓN DEL MODELO 1 PARA ANDALUCÍA...10 2.2.1. Estudio de la especificación del modelo 1 12 2.2.2. Análisis de multicolinealidad del modelo 1.13 2.2.3. Regresión por pasos hacia atrás y estimación del modelo 2..16 2.2.3.1. Análisis de multicolinealidad del modelo 2.18 2.2.3.2. Estudio de la especificación del modelo 2...19 2.2. 4. Comparación de ambos modelos 19 2.2.5. Análisis de homocedasticidad del modelo 2 20 2.2.6. Análisis de autocorrelación de orden 1...23 2.2.7. Análisis de normalidad de los residuos..25 2.3. ESTIMACIÓN DEL MODELO 1 PARA ESPAÑA 26 2.3.1. Estudio de la especificación del modelo 1...28 2.3.2. Análisis de multicolinealidad del modelo 1.28 2.3.3. Regresión por pasos hacia atrás y estimación del modelo 2..29 2.3.3.1. Análisis de multicolinealidad del modelo 2.31 2.3.3.2. Estudio de la especificación del modelo 2...32 2.3. 4. Comparación de ambos modelos 32 2.3.5. Análisis de homocedasticidad del modelo 2 33 2.3.6. Análisis de autocorrelación de orden 1...36 2.3.7. Análisis de normalidad de los residuos..38 3. COMPARACIÓN DE LOS MODELOS FINALES PARA ANDALUCÍA Y PARA ESPAÑA.38 4. CONCLUSIONES..40 5. BIBLIOGRAFÍA 42 2

1. INTRODUCCIÓN. El presente trabajo versa sobre el turismo tanto en Andalucía como en España, el cual es, según la definición que da la Organización Mundial de Turismo (OMT): un fenómeno social, cultural y económico relacionado con el movimiento de las personas (denominadas visitantes) a lugares que se encuentran fuera de su lugar de residencia habitual por motivos personales o de negocios/profesionales, dando lugar a una serie de actividades, de las cuales algunas implican un gasto turístico. El principal objetivo de la realización de este trabajo es el poder ofrecer una explicación sobre el comportamiento de la demanda turística en ambos destinos, influenciada por diversas variables como pueden ser, por ejemplo, el Producto Interior Bruto, el Índice de Precios Hoteleros, el Índice de Precios de Consumo, el gasto de las familias en ocio, etc. Para ello, se va a proceder a la construcción y análisis de un modelo econométrico tanto para el supuesto andaluz como para el español, que relacione la variable endógena o dependiente de cada uno de los modelos con las distintas variables exógenas o independientes, a través de las diversas etapas del método econométrico. Estas etapas van a ir desde la especificación, identificando las variables que intervienen y estableciendo la relación existente entre las mismas mediante una forma funcional adecuada; pasando por la estimación de los parámetros del modelo para la cuantificación de la relación entre dichas variables; y llegando hasta la diagnosis, para comprobar si el modelo estimado es o no adecuado, dependiendo de si el mismo cumple o no las hipótesis básicas de partida, respectivamente. Estas hipótesis básicas de partida más relevantes son que la esperanza de las perturbaciones aleatorias o errores es igual a cero o nula, que las perturbaciones aleatorias son homocedásticas y no tienen autocorrelación (hipótesis de homocedastidad y de ausencia de autocorrelación, conocidas ambas conjuntamente como esfericidad), que los errores se distribuyen según una Normal, y que todas las variables explicativas son linealmente independientes (hipótesis de ausencia de multicolinealidad). Finalmente, se va a proceder a realizar una comparación entre los modelos finales obtenidos para España y para Andalucía para que se puedan apreciar las diferencias y las similitudes entre ambos lugares con respecto al turismo. La muestra de datos utilizada para ambos modelos es trimestral, debido a que el turismo presenta una gran estacionalidad, como se justificará posteriormente, y abarca desde el primer trimestre del año 2010 hasta el último trimestre del año 2017. 3

Para llevar a cabo el estudio econométrico mencionado se va a utilizar el software econométrico Gretl (GnuRegression, Econometrics and Time-series Library), el cual es libre y de código abierto. En cuanto a la estructura del trabajo, señalar que consta de varias partes diferenciadas, ya que se realiza un análisis de forma separada del sector turístico de Andalucía y de España con las diferentes etapas mencionadas, llegando finalmente a la realización de una comparación entre los modelos finales obtenidos para cada uno de estos dos destinos turísticos, y a la exposición de unas conclusiones finales. 2. FASES DEL MODELO ECONOMÉTRICO. 2.1. ESPECIFICACIÓN. La variable dependiente que voy a utilizar es el número de viajeros en la Comunidad Autónoma de Andalucía (en el supuesto andaluz) y el total nacional de viajeros (en el caso de España), que son todas aquellas personas que realizan una o más pernoctaciones de forma seguida en el mismo alojamiento hotelero 1. Los viajeros se clasifican en función de su país de residencia, y para los residentes en España, por la comunidad autónoma donde residen habitualmente. La mencionada variable ha sido extraída de la Encuesta de Ocupación Hotelera del Instituto Nacional de Estadística. Por su parte, las variables independientes que voy a considerar para la elaboración del modelo econométrico más adecuado para el análisis que nos ocupa, debido a que considero que presentan relevancia e influencia sobre el turismo, y más concretamente sobre la variable viajeros, que es nuestra variable dependiente, son las siguientes: - Índice de Precios al Consumo (IPC): el Índice de Precios de Consumo (IPC) es una medida estadística de la evolución del conjunto de precios de los bienes y servicios que consume la población residente en viviendas familiares en España 2. Al tratarse de un índice no tiene unidad de medida. Esta variable ha sido extraída del Instituto Nacional de Estadística y en el presente trabajo vamos a utilizar el promedio trimestral de la misma, debido a que solamente se podían obtener datos mensuales. 1 INE. 2 INE. 4

- Tasa de Actividad: la Tasa de Actividad es un índice que mide el nivel de actividad en el empleo de un país. Se calcula como el cociente entre la población activa (PA) y la población en edad de trabajar o mayor de 16 años 3 y se mide en porcentaje. Los datos referidos a esta variable se han cogido del Instituto Nacional de Estadística, en concreto en la Encuesta de Población Activa (EPA). Esta encuesta es una investigación continua y de periodicidad trimestral dirigida a las familias con la finalidad de obtener datos de la población en relación con el mercado de trabajo: ocupados, activos, parados e inactivos 4. - Tasa de Paro: la tasa de desempleo, también conocida como tasa de paro, mide el nivel de desocupación en relación a la población activa. En otras palabras, es la parte de la población que estando en edad, condiciones y disposición de trabajar -población activano tiene puesto de trabajo. La tasa de desempleo es muy útil para conocer las personas que no están trabajando. Su fórmula de cálculo es la población de 16 años y más que no está trabajando y busca trabajo, dividido entre la población económicamente activa de 16 años y más, esto es, ocupados más desocupados 5 y se mide en porcentaje igualmente. Los datos relativos a esta variable han sido extraídos del INE. - Índice de Precios Hoteleros (IPH): este índice permite conocer la evolución temporal de los precios recibidos por los empresarios hoteleros considerando todos sus clientes (hogares, empresas, touroperadores y agencias de viajes). La Encuesta de Ocupación Hotelera proporciona la información necesaria para construir este indicador, que se elabora de forma continua cada mes 6. Por tanto, en este trabajo se va a utilizar el índice promedio trimestral y al ser un índice no presenta unidad de medida. Los datos de esta variable han sido cogidos del INE. - Producto Interior Bruto (PIB): el PIB es el valor monetario de los bienes y servicios finales producidos por una economía en un período determinado, es un indicador representativo que ayuda a medir el crecimiento o decrecimiento de la producción de bienes y servicios de las empresas de cada país, únicamente dentro de su territorio y un claro reflejo de la competitividad de las empresas 7. Variable extraída del Instituto de Estadística y Cartografía de Andalucía (IECA) y medida en millones de euros. - Gasto medio por hogar en ocio y cultura: el gasto medio por hogar en ocio y cultura constituyen gastos de consumo, los cuales se refieren al flujo monetario que destina cada 3 http://economipedia.com/?s=tasa+de+actividad 4 Información sacada del INE. 5 http://economipedia.com/definiciones/tasa-de-desempleo-paro.html 6 INE. 7 https://www.economia.com.mx/producto_interno_bruto.htm 5

hogar por término medio al pago de determinados bienes y servicios de consumo final y al valor de los bienes percibidos en concepto de autoconsumo, sobre todo los relacionados con cine, espectáculos, teatro, museos y todos los referentes a actividades culturales y de ocio. etc. Los datos han sido extraídos de la Encuesta de Presupuestos Familiares (EPF), publicada por el Instituto Nacional de Estadística, que suministra información anual sobre la naturaleza y destino de los gastos de consumo, así como sobre diversas características relativas a las condiciones de vida de los hogares. La mencionada variable está medida en euros. - Gasto medio por hogar en restaurante y hoteles: también constituyen gastos de consumo, al igual que los anteriores, pero en este caso se refieren al flujo monetario que destina cada hogar por término medio al pago de determinados bienes y servicios de consumo final y al valor de los bienes percibidos en concepto de autoconsumo, sobre todo los relacionados con hoteles y restaurantes. Por tanto, los datos también han sido extraídos de la Encuesta de Presupuestos Familiares (EPF), publicada por el Instituto Nacional de Estadística. Dicha variable está medida en euros igualmente. - Transporte urbano por autobús en Andalucía: representa el número de viajeros transportados en transporte urbano (autobús) en la Comunidad Autónoma de Andalucía, por tanto su unidad de medida es el número de personas que han utilizado el mencionado transporte. El transporte por autobús se investiga mediante una encuesta por muestreo. Esta variable ha sido sacada del INE. - Dq1, dq2 y dq4: son variables estacionales. Se van a tomar logaritmos en las variables Producto Interior Bruto, gasto medio por hogar en ocio y cultura y gasto medio por hogar en restaurantes y hoteles porque hacen referencia a cantidades monetarias positivas. También se han añadido logaritmos a las variables transporte urbano por autobús en Andalucía y viajeros debido a que se trata de variables que toman valores positivos muy elevados. Por otro lado, señalar además que se han añadido las variables estacionales al modelo debido a que la estacionalidad siempre ha sido uno de los aspectos característicos del turismo en muchas partes del mundo. Butler (1994, p. 332) la define como un desequilibrio temporal que puede expresarse en términos del número de visitantes, del tráfico en las calles y otras formas de transporte, en los empleos y en las entradas a atracciones turísticas. 6

La estacionalidad turística es un fenómeno que se registra en los destinos turísticos cuando la oferta está sujeta a demanda irregular, dadas las variaciones de los volúmenes de demanda que se registran a lo largo del año, produciendo lapsos de bajas y altas demandas. Los de alta demanda coinciden con los periodos vacacionales y con aquellos con clima extremoso en países o regiones de los que proviene el turista 8. Desde el punto de vista de la economía, cuando una actividad productiva evidencia estacionalidad implica la existencia de dos períodos diferentes de demanda: el período pico, que constituye la fase de más alto nivel de consumo, y el período valle, la etapa de menor demanda de ese producto o servicio. Cada uno de estos períodos se repite de un año a otro, en la misma época del año; mientras que en algunos casos la frecuencia es trimestral, en otros puede ser mensual, semanal, o incluso diaria. Por ejemplo, pueden existir variaciones en el flujo de pasajeros de una semana a otra, como en semanas en las que hay días festivos o fiestas conmemorativas, como la época navideña. Por tanto, es un fenómeno que se produce cuando existe una gran concentración de viajeros en un mismo destino turístico en cierto periodo del año, por alguna circunstancia como los periodos vacacionales, y que puede repetirse periódicamente. La variación en la demanda tiene un gran impacto sobre varios aspectos del comportamiento por el lado de la oferta. Así, en lo que respecta a las empresas, que ofrecen al demandante de turismo una variedad de bienes y servicios que le permiten conformar su experiencia turística, la parte económica se ve afectada, debido a la variación en los ingresos, en los precios y en las oportunidades de atraer inversiones. Para proveer estos servicios se encuentran con la necesidad de realizar grandes inversiones de capital tanto físico como financiero para el manejo de operaciones y con funciones de producción de coeficientes fijos. Esto hace que las empresas estén sujetas a restricciones de capacidad y a altos costos fijos de operación (Sinclair, 1997). Dadas estas características, las empresas del sector deben hacer frente a las siguientes consecuencias provocadas por la estacionalidad de la demanda: imposibilidad de sostener beneficios positivos a lo largo de todo el año, debido a que durante el período valle, disminuyen las cantidades transadas en los mercados y los altos costos fijos no pueden ser solventados; desincentiva futuros proyectos de Inversión; la existencia de flujos de ingresos irregulares implican menores tasas de rentabilidad previstas a largo plazo; congestión espaciotemporal, ya que en los momentos de mayor afluencia turística la infraestructura y la provisión de servicios públicos y privados llegan a saturarse y congestionarse por los excesos 8 Godinez, R., Calderón, A. (2009). Breve Diccionario de Turismo. Editorial Umbral. Zapopan, México. 7

de demanda, y hasta, en ciertas circunstancias, se agota la capacidad de la atracción turística del lugar y, sin embargo, en los períodos de demanda valle, las grandes dotaciones en infraestructura y servicios provocan sobredimensionamiento, lo que dificulta potenciales iniciativas de inversión (Baidal y Martínez, 1998). Por su parte, en lo que se refiere al mercado de trabajo, señalar que el Turismo incrementa la demanda de trabajadores altamente calificados como así también de baja calificación. En el primer caso, los salarios son elevados y los puestos de empleo tienden a ser permanentes, que es lo opuesto a lo que sucede con la demanda de trabajadores de baja calificación. Los efectos más negativos de la existencia de empleos estacionales son la incapacidad de construir ocupaciones permanentes con trabajadores especializados, aumentan los costos de búsqueda y de contratación del personal así como también de capacitación y deterioran la calidad de los servicios de turismo. Con frecuencia se emplea mano de obra temporal para atender el pico de visitantes, lo que hace que la calidad y la habilidad de estos trabajadores no sean siempre las adecuadas si no están debidamente capacitados. En cuanto al marketing de las empresas, son varios los aspectos afectados, tales como la distribución, los precios y los tipos de paquetes ofrecidos. Según Butler (2000), las variables que explican la estacionalidad turística son las que se exponen a continuación, que suelen ser factores naturales y factores institucionales. Por un lado, el clima, que constituye el principal causante natural de las fluctuaciones en la demanda para determinados tipos de turismo. Las condiciones climáticas específicas que se requieren para llevar a cabo la actividad no se presentan en todas las estaciones y esto es lo que genera la estacionalidad en la demanda del destino. Es el caso del turismo de sol y playa, del turismo basado en deportes de invierno y del turismo de salud. Las variaciones climáticas y las estaciones del año hacen que las personas tengan una mayor tendencia a tomar vacaciones en época de verano, aunque también se observan picos menores en invierno (practicar algún deporte como el esquí). Por este motivo es por lo que he eliminado la variable estacional dq3 del modelo, referida a los meses de verano (julio, agosto y septiembre), en los cuales suele haber una mejor temperatura y, además, los trabajadores y estudiantes suelen disfrutar de sus periodos vacacionales a lo largo de esos meses, porque en dicho periodo suele ser mayor el turismo que se realiza en la mayor parte de lugares y entre ellos Andalucía, por sus condiciones climáticas. De esta forma, podré realizar una comparación de la variación del turismo, medido por el número de viajeros entre los distintos trimestres que componen el año. 8

También forman parte de dichas variables los factores de decisión humana, que constituyen una causa institucional y se refieren a las vacaciones institucionalizadas, como las vacaciones escolares y las de los trabajadores asalariados, que generalmente son en verano, debido a que los períodos de descanso están condicionados por las obligaciones laborales y escolares de los individuos, limitando la realización de las actividades turísticas en determinadas épocas del año. Otras variables son la presión social y la moda, como por ejemplo los adolescentes que van a Disney en las vacaciones de medio año. También hay que tener en cuenta las estaciones deportivas, por ejemplo cuando hay juegos olímpicos, mundiales de fútbol, etc. Por último, hay que señalar otra variable institucional, la inercia y la tradición, teniendo en cuenta la realización de eventos sociales, culturales, religiosos y de negocios, los cuales se suelen repetir año tras año aproximadamente en la misma fecha por tradición, lo que genera estacionalidad en el turismo. Es el caso de fiestas culturales, fiestas patrias, fiestas nacionales, festivales cinematográficos, las celebraciones de Semana Santa y Navidad. También es conveniente mencionar las realizaciones de convenciones, exposiciones, ferias, congresos y reuniones destinadas a la difusión e intercambio de información en relación a una actividad productiva específica o a un área del conocimiento científico. Los tipos de turismo que pueden estar condicionados por estos factores institucionales pueden ser el turismo cultural, que se basa en el conocimiento de productos culturales o productos relacionados con el arte como puede ser la visita a museos y monumentos históricos. Otro es el turismo de negocios relacionado con la realización de eventos especiales o con la actividad económica. Dado que los mismos no necesitan de condiciones climáticas especiales y pueden ser demandados a lo largo de todo el año. Además, se hace necesario destacar que la estacionalidad se ve influida por factores espaciales y está más acentuada en zonas rurales y en regiones remotas que en los grandes centros urbanos. Estos últimos presentan más atracciones no estacionales, además de más viajes de negocios y, en muchos casos, son menos vulnerables a los cambios climáticos. En suma, las causas que originan la estacionalidad de la demanda de turismo pueden clasificarse en endógenas, que pueden ser modificadas por las preferencias de la sociedad 9

levantando restricciones legales, sociales y/o culturales y en exógenas, las que escapan del accionar humano y, por tanto, nos vienen dadas. A pesar de todo, la estacionalidad puede resultar benéfica en algunos aspectos. Con respecto al medio ambiente, la estación no turística permite que la flora y la fauna se recuperen de la época en la que existe una demanda turística muy elevada. En el caso de los habitantes locales, los periodos sin turistas permiten que estos tengan una vida más tranquila y relajada durante una parte del año, aunque la disminución del número de turistas puede provocar, en función de la falta de demanda, la reducción o descontinuación de determinados servicios. Aunque en un principio he seleccionado todas las variables mencionadas anteriormente, el análisis de los modelos nos va a servir para determinar la relevancia o irrelevancia de cada una para los mismos, pudiendo eliminar en todo caso las que no resulten relevantes. Por tanto, aunque partimos de unos modelos iniciales formados por estas variables, puede ocurrir que los modelos seleccionados finalmente sean otros diferentes que no incluyan alguna de estas variables. 2.2. ESTIMACIÓN DEL MODELO 1 PARA ANDALUCÍA. Modelo 1: MCO, usando las observaciones 2010:1-2016:4 (T = 28) Variable dependiente: l_viajeros Coeficiente Desv. Estadístico P-valor Típica t Const 33.5075 18.7384 1.788 0.0927 * IPC 0.0248191 0.00918364 2.703 0.0157 ** TasaActividad 0.0355908 0.0352697 1.009 0.3279 TasaParo 0.0155643 0.0118931 1.309 0.2091 IPH 0.00059661 0.00713178 0.08366 0.9344 0 l_pib 2.50634 1.09914 2.280 0.0366 ** l_gastoocio 1.03832 1.50283 0.6909 0.4995 l_gastohotelesy 0.0109432 0.323065 0.03387 0.9734 10

rest l_transporteaut 0.0229227 0.218921 0.1047 0.9179 obus dq1 0.517662 0.0475369 10.89 <0.0001 *** dq2 0.140435 0.0623942 2.251 0.0388 ** dq4 0.517428 0.0462066 11.20 <0.0001 *** Fuente: Elaboración propia a través de Gretl. Media dela vble. dep. 15.13454 D.T. de la vble. dep. 0.283078 Suma de cuad. Residuos 0.026577 D.T. de la regresión 0.040756 R-cuadrado 0.987716 R-cuadrado corregido 0.979272 F(11, 16) 116.9599 Valor p (de F) 4.00e-13 Log-verosimilitud 57.70876 Criterio de Akaike 91.41752 Criterio de Schwarz 75.43106 Crit. de Hannan-Quinn 86.53030 Rho 0.013417 Durbin-Watson 1.957557 Fuente: Elaboración propia a través de Gretl. La expresión del modelo viene dada por: Ln (viajeros)= β 0 + β 1 IPC + β 2 TasaActividad + β 3 TasaParo + β 4 IPH + β 5 ln (PIB) + β 6 ln (Gastoocio) + β 7 ln (Gastohotelesyrest) + β 8 ln (Transporteautobus) + β 9 dq1 + β 10 dq2 + β 11 dq4 + u, donde u representa la perturbación aleatoria. La expresión del modelo ajustado la siguiente: = 33.5075 0.0248191 IPC 0.0355908 TasaActividad + 0.0155643 TasaParo + 0.000596610 IPH + 2.50634 ln (PIB) + 1.03832 ln (Gastoocio) + 0.0109432 ln (Gastohotelesyrest) 0.0229227 ln (Transporteautobus) 0.517662 dq1 0.140435 dq2 0.517428 dq4 Se puede observar que el modelo es globalmente significativo, al poseer un p-valor inferior a cualquier nivel de significación, y también cuenta con una gran capacidad explicativa al tener un coeficiente de determinación muy elevado (98,77%). Sin embargo, casi ninguna variable explicativa del modelo es individualmente significativa, lo que puede dar indicios de presencia de multicolinealidad en el modelo. Por ello, aún no vamos a realizar una interpretación de los parámetros del modelo hasta comprobar si existen problemas de 11

multicolinealidad, por lo que en primer lugar se va a realizar un estudio de multicolinealidad en el modelo, pero antes de ello, se va a comprobar si el modelo está correctamente especificado. 2.2.1. ESTUDIO DE LA ESPECIFICACIÓN DEL MODELO 1. Para analizar si el modelo está bien especificado, se va a utilizar el Test RESET de Ramsey, estableciendo los correspondientes contrastes de significación de la siguiente forma: H 0: El modelo está bien especificado H 1: El modelo está mal especificado Contraste de especificación RESET (cuadrados y cubos). Estadístico de contraste: F = 3.620410, con p-valor = P (F(2,14) > 3.62041) = 0.054. Contraste de especificación RESET (cuadrados sólo). Estadístico de contraste: F = 7.381586, con p-valor = P (F(1,15) > 7.38159) = 0.0159. Contraste de especificación RESET (cubos sólo). Estadístico de contraste: F = 7.403448, con p-valor = P (F(1,15) > 7.40345) = 0.0158. Si consideramos un nivel de significación del 1%, comparando el valor de alfa con el del p- valor de cada contraste, en los tres contrastes se aceptaría la hipótesis nula al resultar el p- valor mayor que el nivel de significación, por lo que según dichos contrastes el modelo estaría bien especificado. En cambio, no se llegaría a la misma conclusión si se considerara un nivel de significación del 5% o del 10%, ya que en el primer caso del valor de alfa del 5%, dos de los contrastes apuntarían que el modelo no está bien especificado al ser el p-valor inferior al nivel de significación, con lo cual se rechazaría la hipótesis nula, estableciéndose que el modelo estaría mal especificado, y en el caso del nivel de significación del 10% los tres contrastes indicarían la mala especificación del modelo. A pesar de ello, vamos a utilizar el alfa del 1%, que indica que el modelo está bien especificado. Por ello, al parecer que el modelo no presenta problemas de especificación, vamos a pasar al análisis de 12

multicolinealidad en dicho modelo, ya que como se ha señalado anteriormente, existen indicios de que pueden darse problemas de este tipo en el modelo. 2.2.2. ANÁLISIS DE MULTICOLINEALIDAD DEL MODELO 1. Para llevar a cabo un análisis de la posible multicolinealidad que puede presentar el modelo, voy a emplear algunos de los indicadores que ayudan a su detección. En primer lugar voy a utilizar la matriz de correlación por pares de variables explicativas y, posteriormente, el factor de inflación de la varianza. Matriz de correlación por pares de variables explicativas. La matriz de correlaciones muestra las relaciones que existen entre las variables que se van a incluir en el modelo. Dichas variables se relacionan de manera independiente, pero hay que prestar mayor atención a aquellas parejas de variables que presenten una correlación más cercana a 1, debido a que la mencionada matriz puede tomar valores dentro de un intervalo de (-1,1). Su interpretación depende del valor del signo que tome y de las características de las variables analizadas. Un coeficiente de correlación muy cercano a uno (valor absoluto), indica que la relación entre las variables es muy fuerte, mientras que si es muy cercano a cero, indica que la relación es muy débil. Coeficientes de correlación, usando las observaciones 2010:1-2016:4 valor crítico al 5% (a dos colas) = 0.3739 para n = 28 IPC TasaActividad TasaParo IPH l_pib 1.0000 0.1694-0.0777-0.2287 0.0039 IPC 1.0000 0.5334-0.7214-0.5257 TasaActividad 1.0000-0.7376-0.7577 TasaParo 1.0000 0.7916 IPH 1.0000 l_pib 13

l_gastoocio l_gastohotelesyrest l_transportea utobus dq1 dq2-0.3138-0.4234-0.3036-0.0418-0.0188 IPC -0.3977-0.5460 0.0559 0.0746 0.1269 TasaActividad -0.0065-0.0262 0.0398 0.0178-0.0683 TasaParo 0.5704 0.6169 0.0669-0.3379-0.0445 IPH 0.3415 0.4516 0.3160-0.5265 0.3846 l_pib 1.0000 0.8935-0.0410-0.6252-0.2655 l_gastoocio 1.0000 0.1172-0.5900 0.0088 l_gastohotelesyrest 1.0000-0.2540 0.4289 l_transporteautobus 1.0000-0.3333 dq1 1.0000 dq2 dq4 0.0386 IPC -0.0087 TasaActividad -0.0094 TasaParo 0.1704 IPH 0.2050 l_pib 0.3011 l_gastoocio 0.1444 l_gastohotelesyrest 0.4987 l_transporteautobus -0.3333 dq1-0.3333 dq2 1.0000 dq4 Observando esta matriz calculada con ayuda de Gretl resulta evidente que entre las variables Gasto de ocio y cultura y Gasto en hoteles y restaurantes existe una elevada correlación positiva, por lo que son estas variables son colineales. En segundo lugar, también se puede extraer la conclusión de que las variables relativas al Índice de Precios Hoteleros (IPH) y al Producto Interior Bruto (PIB) son colineales, presentando igualmente una elevada correlación positiva. 14

En tercer lugar, la variable Tasa de Paro está fuertemente correlacionada con las variables relativas al PIB y al IPH y, a su vez, la variable IPH es colineal con las variables Tasa de Paro y Tasa de Actividad. Factores de inflación de varianza (VIF). IPC 2.929 TasaActividad 3.799 TasaParo 22.803 IPH 12.271 l_pib 24.499 l_gastoocio 22.062 l_gastohotelesyrest 24.644 l_transporteautobus 6.219 dq1 7.142 dq2 12.305 dq4 6.748 Fuente: Elaboración propia a través de Gretl. Siendo VIF(j) = 1/(1 - R(j)^2), donde R(j) es el coeficiente de correlación múltiple entre la variable j y las demás variables independientes. Según este indicador, el menor valor posible es 1, y los valores mayores de 10 pueden indicar la existencia de un problema de colinealidad. En este caso se puede observar que las variables Tasa de Paro, IPH, PIB, Gasto de ocio, Gasto en hoteles y restaurantes y dq2 presentan unos VIF por encima de 10, lo que parece ser indicativo de que estas variables están muy correlacionadas con las demás, es decir, que son colineales. De esta forma, para intentar corregir este problema de multicolinealidad presente en las variables del modelo, se va a realizar una regresión por pasos hacia atrás, para ver si con ello quedan eliminadas del modelo las variables colineales. 15

2.2.3. REGRESIÓN POR PASOS HACIA ATRÁS Y ESTIMACIÓN DEL MODELO 2. Así pues, tras la regresión hacia atrás, mediante la cual se ha procedido a una eliminación secuencial de las variables no significativas para el modelo, utilizando un alfa del 0.01 a dos colas (en primer lugar se ha eliminado el gasto en hoteles y restaurantes, después el IPH, posteriormente el transporte urbano en autobús, luego el gasto de ocio y, por último la tasa de actividad), nos queda el modelo que sigue a continuación, en el que todas las variables son individualmente significativas. El contraste de hipótesis realizado por Gretl al realizar la regresión por pasos hacia atrás ha sido el siguiente: Hipótesis nula: los parámetros de regresión son cero para las variables TasaActividad, IPH, l_gastoocio, l_gastohotelesyrest, l_transporteautobus, siendo el estadístico de contraste: F(5, 16) = 0.756617 y el p-valor de 0.593674. Por tanto, al ser el p-valor mayor que el nivel de significación, no se rechaza la hipótesis nula. Gretl señala que al omitir dichas variables mejoraron 3 de 3 criterios de información. Modelo 2: MCO, usando las observaciones 2010:1-2016:4 (T = 28) Variable dependiente: l_viajeros Coeficiente Desv. Estadístico valor p Típica t Const 50.4908 11.4796 4.398 0.0003 *** IPC 0.0318322 0.00534802 5.952 <0.0001 *** TasaParo 0.0218726 0.00589114 3.713 0.0013 *** l_pib 3.74822 0.649114 5.774 <0.0001 *** dq1 0.548308 0.0287504 19.07 <0.0001 *** dq2 0.221432 0.0252389 8.773 <0.0001 *** dq4 0.557027 0.0228116 24.42 <0.0001 *** Fuente: Elaboración propia a través de Gretl. Media de la vble. dep. 15.13454 D.T. de la vble. dep. 0.283078 Suma de cuad. 0.032860 D.T. de la regresión 0.039557 Residuos R-cuadrado 0.984812 R-cuadrado corregido 0.980473 16

F(6, 21) 226.9472 Valor p (de F) 5.63e-18 Log-verosimilitud 54.73742 Criterio de Akaike 95.47484 Criterio de Schwarz 86.14940 Crit. de Hannan-Quinn 92.62396 Rho 0.085362 Durbin-Watson 2.105047 Fuente: Elaboración propia a través de Gretl. La expresión del modelo sería la siguiente: Ln (viajeros)= β 0 + β 1 IPC + β 2 TasaParo + β 3 ln (PIB) + β 4 dq1 + β 5 dq2 + β 6 dq4 + u, quedando la expresión del modelo ajustado de la siguiente manera: = 50.4908 0.0318322 IPC + 0.0218726 TasaParo + 3.74822 ln (PIB) 0.548308 dq1 0.221432 dq2 0.557027dq4 En cuanto a la interpretación de los parámetros: β 0 no se suele interpretar. El valor estimado de β 1 indica que cuando el IPC se incrementa en una unidad, el número de viajeros en Andalucía se reduce, en promedio, en un 3,18322%, manteniéndose constantes el resto de variables explicativas. El valor estimado de β 2 quiere decir que ante el aumento de una unidad en la tasa de paro, el número de viajeros en Andalucía aumenta en un 2,18726%, en promedio, si se mantienen constantes el resto de variables. El valor obtenido en β 3 significa que si el PIB se incrementa en un 1%, el número de viajeros en Andalucía aumenta en un 3,74822%, en promedio, manteniéndose constantes las demás variables. Los valores estimados relativos a las variables estacionales, es decir, β 4, β 5 y β 6, al ser negativos indican que en el primero, en el segundo y en el cuarto trimestre el número de viajeros en Andalucía es inferior al del tercer trimestre, alcanzando sus menores valores en los trimestres primero y cuarto, permaneciendo las demás variables constantes, lo que resulta totalmente coherente y evidente debido a que el número de viajeros suele ser mayor normalmente en los meses de verano (tercer trimestre). En concreto, β 4 indica que el número de viajeros en el primer trimestre es, aproximadamente, un 54,8308% inferior al de los viajeros en el tercer trimestre, siendo el valor exacto de 73,0322%. Por su parte, β 5 indica que el número de viajeros en el segundo trimestre es, aproximadamente, un 22,1432% inferior al 17

de los viajeros en el tercer trimestre, siendo exactamente un 24,7862% inferior. Finalmente, el valor de β 6 indica que el número de viajeros en el cuarto trimestre es, aproximadamente, un 55,7027% inferior al de los viajeros en el tercer trimestre, siendo de forma exacta un 74,5475% inferior. Además, se puede observar que este modelo también es globalmente significativo, al poseer un p-valor inferior a cualquier nivel de significación, y también cuenta con una gran capacidad explicativa al presentar un coeficiente de determinación muy elevado (98,48%), aunque un poco menos elevada que la del modelo anterior que era de un 98,77%. A pesar de ello, el coeficiente de determinación ajustado es mayor en este modelo que en el anterior (98,04% frente al 97,92% del modelo 1). Para analizar de nuevo si continúan existiendo problemas de mulicolinealidad, voy a utilizar el indicador de Factores de inflación de varianza (VIF), el cual nos da los resultados que se muestran a continuación. 2.2.3.1. ANÁLISIS DE MULTICOLINEALIDAD DEL MODELO 2. Factores de inflación de varianza (VIF). IPC 1.054 TasaParo 5.939 l_pib 9.070 dq1 2.773 dq2 2.137 dq4 1.746 Fuente: Elaboración propia a través de Gretl. En este nuevo modelo, al no ser ninguno de los factores de inflación de varianza mayor que 10, se entiende que las variables que quedan en el modelo no presentan problemas de multicolinealidad, esto es, no son colineales. Ahora bien, para comprobar si el modelo continúa estando bien especificado, se va a proceder de nuevo a la aplicación del Test RESET de Ramsey, con todas sus variantes. 18

2.2.3.2. ESTUDIO DE LA ESPECIFICACIÓN DEL MODELO 2. H 0: El modelo está bien especificado H 1: El modelo está mal especificado Contraste de especificación RESET (cuadrados y cubos). Estadístico de contraste: F = 2.126372, con p-valor = P (F(2,19) > 2.12637) = 0.147. Contraste de especificación RESET (cuadrados sólo). Estadístico de contraste: F = 4.471082, con p-valor = P (F(1,20) > 4.47108) = 0.0472. Contraste de especificación RESET (cubos sólo) Estadístico de contraste: F = 4.472496, con p-valor = P (F(1,20) > 4.4725) = 0.0472. Para el 1% de significación, se puede concluir que el modelo está bien especificado, ya que el p-valor de los tres tipos de contrastes es mayor a dicho nivel de significación y, por tanto, no se rechaza la hipótesis nula que establece que el modelo está correctamente especificado. Ahora bien, vamos a comparar ambos modelos mediante la utilización de diversos criterios de selección de modelos para asegurarnos de que el segundo es mejor. 2.2.4. COMPARACIÓN DE AMBOS MODELOS. Modelo 1 Modelo 2 Criterio de Akaike 91.41752 95.47484 Criterio de Schwarz 75.43106 86.14940 Criterio de Hannan-Quinn 86.53030 92.62396 Fuente: Elaboración propia. Según los tres criterios, es preferible el segundo modelo, debido a que estos criterios indican que el mejor modelo es el que presente menor valor para cada uno de los criterios, y en este caso es el modelo 2 el que tiene menores valores para los tres criterios. 19

Además, si comparamos los coeficientes de determinación ajustados, al ser modelos anidados, también es preferible el modelo 2, ya que presenta un coeficiente más elevado (98.0473%) que el del primer modelo (97.9272%). Por tanto, elegimos el modelo 2 como modelo econométrico más apropiado para el trabajo que nos ocupa, y que nos va a permitir explicar el comportamiento e influencia de las variables explicativas sobre la dependiente, que es el número de viajeros. Pero antes es necesario comprobar si el modelo cumple las hipótesis básicas del modelo lineal general, siendo una de estas hipótesis la de esfericidad, que establece que las perturbaciones aleatorias son esféricas, lo que equivale a su vez a las hipótesis de homocedasticidad y de ausencia de autocorrelación. 2.2.5. ANÁLISIS DE HOMOCEDASTICIDAD DEL MODELO 2. En primer lugar, para comprobar si el modelo es homocedástico o, por el contrario, heterocedástico, vamos a plantear el siguiente contraste de hipótesis: H 0: El modelo es homocedástico H 1: El modelo es heterocedástico Para resolver dicho contraste vamos a emplear los contrastes que tiene implementados Gretl para la detección de heterocedasticidad. Así, en primer lugar, utilizamos el contraste de White: Contraste de heterocedasticidad de White. MCO, usando las observaciones 2010:1-2016:4 (T = 28) Variable dependiente: uhat^2 Coeficiente Desv. Típica Estadístico t P-valor ---------------------------------------------------------------------------------------- const 1633.90 2421.57 0.6747 0.5250 IPC 1.26938 1.82147 0.6969 0.5120 TasaParo 1.55865 2.14805 0.7256 0.4954 20

l_pib 184.950 274.027 0.6749 0.5249 dq1 0.0231035 11.2768 0.002049 0.9984 dq2 6.09270 4.89388 1.245 0.2596 dq4 4.91077 7.98201 0.6152 0.5610 sq_ipc 0.000346069 0.000487248 0.7103 0.5042 X2_X3 0.000731580 0.000927370 0.7889 0.4602 X2_X4 0.0715676 0.102913 0.6954 0.5128 X2_X5 8.37325e-05 0.00232945 0.03595 0.9725 X2_X6 0.00193520 0.00252936 0.7651 0.4732 X2_X7 0.000765218 0.00180904 0.4230 0.6870 sq_tasaparo 0.000260683 0.000424293 0.6144 0.5615 X3_X4 0.0886564 0.121739 0.7283 0.4939 X3_X5 0.000594172 0.00547148 0.1086 0.9171 X3_X6 0.00265641 0.00235292 1.129 0.3020 X3_X7 0.00251534 0.00381270 0.6597 0.5339 sq_l_pib 5.23345 7.75210 0.6751 0.5248 X4_X5 0.00252793 0.637836 0.003963 0.9970 X4_X6 0.344897 0.276810 1.246 0.2592 X4_X7 0.277267 0.451028 0.6147 0.5613 Fuente: Gretl. La matriz de datos es casi singular. R-cuadrado = 0.860142. Estadístico de contraste: TR^2 = 24.083972, con p-valor = P (Chi-cuadrado(21) > 24.083972) = 0.289008. Como el p-valor (0.289008) es mayor que el nivel de significación (1%), no se rechaza la hipótesis nula, con lo cual se puede concluir que el modelo no es heterocedástico o, lo que es lo mismo, que es homocedástico. En segundo lugar, vamos a emplear el contraste de Breusch-Pagan. 21

Contraste de heterocedasticidad de Breusch-Pagan. MCO, usando las observaciones 2010:1-2016:4 (T = 28). Variable dependiente: uhat^2 escalado. Coeficiente Desv. Típica Estadístico t P-valor --------------------------------------------------------------------------- const 130.151 536.247 0.2427 0.8106 IPC 0.374496 0.249823 1.499 0.1487 TasaParo 0.0179967 0.275194 0.06540 0.9485 l_pib 7.59498 30.3222 0.2505 0.8047 dq1 0.822977 1.34303 0.6128 0.5466 dq2 0.848569 1.17899 0.7197 0.4796 dq4 0.658272 1.06560 0.6177 0.5434 Fuente: Gretl. Suma de cuadrados explicada = 17.3285. Estadístico de contraste: LM = 8.664232, con p-valor = P (Chi-cuadrado(6) > 8.664232) = 0.193361. Como con este contraste, el p-valor (0.193361) también es mayor que el nivel de significación (1%), se acepta la hipótesis nula, con lo cual se puede concluir que el modelo es homocedástico. Finalmente, vamos a aplicar el contraste de Koenker, que es la variante robusta del contraste de Breusch-Pagan. Contraste de heterocedasticidad de Koenker. MCO, usando las observaciones 2010:1-2016:4 (T = 28). Variable dependiente: uhat^2 escalado (variante robusta de Koenker). 22

Coeficiente Desv. Típica Estadístico t P-valor ------------------------------------------------------------------------------ const 0.153917 0.629331 0.2446 0.8092 IPC 0.000439502 0.000293189 1.499 0.1487 TasaParo 2.11206e-05 0.000322964 0.06540 0.9485 l_pib 0.00891335 0.0355857 0.2505 0.8047 dq1 0.000965833 0.00157615 0.6128 0.5466 dq2 0.000995867 0.00138364 0.7197 0.4796 dq4 0.000772538 0.00125058 0.6177 0.5434 Fuente: Gretl. Suma de cuadrados explicada = 2.38665e-005. Estadístico de contraste: LM = 5.449574, con p-valor = P (Chi-cuadrado(6) > 5.449574) = 0.487572. Como con este contraste, el p-valor (0.487572) también es mayor que el nivel de significación (1%), no se puede rechazar la hipótesis nula, por lo que el modelo es homocedástico. Por tanto, debido a que con los tres contrastes utilizados se puede concluir que el modelo es homocedástico, descartamos la presencia de problemas de heterocedasticidad. 2.2.6. ANÁLISIS DE AUTOCORRELACIÓN DE ORDEN 1. Para comprobar si el modelo presenta problemas de autocorrelación de orden 1 vamos aplicar varios procedimientos formales de detección de autocorrelación, en concreto diversos contrastes. Así pues, vamos a comenzar aplicando el contraste de Durbin- Watson. Contraste de Durbin- Watson. H 0 : ρ = 0 H 0 : Ausencia de autocorrelación H 1 : ρ 0 H 1 : Problema de autocorrelación 23

Estadístico de Durbin-Watson = 2.10505, con p-valor = 0.443786. Como el p-valor del contraste (0.443786) es mayor que el nivel de significación del 1%, no se rechaza la hipótesis nula, por lo que según este contraste en el modelo hay ausencia de autocorrelación. Contraste Breusch-Godfrey de autocorrelación de primer orden. H 0 : ø 1 = = ø p = 0 H 0 : Ausencia de autocorrelación H 1 : Algún ø j 0, j =1,, p H 1 : Problema de autocorrelación MCO, usando las observaciones 2010:1-2016:4 (T = 28). Variable dependiente: uhat. Coeficiente Desv. Típica Estadístico t P-valor --------------------------------------------------------------------------------- const 0.731846 11.8692 0.06166 0.9514 IPC 0.000324581 0.00552302 0.05877 0.9537 TasaParo 0.000442798 0.00612093 0.07234 0.9430 l_pib 0.0412224 0.671081 0.06143 0.9516 dq1 0.000649590 0.0293974 0.02210 0.9826 dq2 0.000837643 0.0258550 0.03240 0.9745 dq4 0.000486308 0.0233208 0.02085 0.9836 uhat_1 0.0926132 0.238300 0.3886 0.7016 Fuente: Gretl. R-cuadrado = 0.007496 Estadístico de contraste: LMF = 0.151042, con p-valor = P(F(1,20) > 0.151042) = 0.702 Estadístico alternativo: TR^2 = 0.209874, con p-valor = P(Chi-cuadrado(1) > 0.209874) = 0.647 Ljung-Box Q' = 0.203785, con p-valor = P(Chi-cuadrado(1) > 0.203785) = 0.652 24

Teniendo en cuenta este contraste, no se rechaza la hipótesis nula, debido a que el nivel de significación utilizado es menor que el p-valor (0.702). Por tanto, se puede considerar que no existen problemas de autocorrelación en el modelo. Por ello, en definitiva se puede considerar que se cumplen las hipótesis básicas de homocedasticidad y de ausencia de autocorrelación del modelo lineal general. 2.2.7. ANÁLISIS DE NORMALIDAD DE LOS RESIDUOS. Para analizar la normalidad de la perturbación aleatoria, vamos a aplicar los contrastes de normalidad que tiene implementados Gretl sobre los residuos del modelo final. Estos contrastes son los de Doornik-Hansen, Shapiro-Wilk, Lilliefors y Jarque-Bera. Contraste de normalidad de Residuos: H 0 : La perturbación aleatoria se distribuye según una Normal H 1 : La perturbación aleatoria no se distribuye según una Normal Contraste de Doornik-Hansen = 4.96695, con p-valor 0.0834526. W de Shapiro-Wilk = 0.963033, siendo el p-valor 0.410387. Contraste de Lilliefors = 0.125756, con p-valor ~= 0.3. Contraste de Jarque-Bera = 3.63416, con un p-valor de 0.162499. En todos estos contrastes se ha obtenido un p-valor mayor que el 1% de significación de nuestro modelo, por lo que no se rechaza la hipótesis nula, lo que quiere decir que la perturbación aleatoria se distribuye según una Normal, es decir, que los residuos del modelo final tienen una distribución normal. Además de las hipótesis de homocedasticidad, ausencia de autocorrelación y de normalidad de los residuos, hay otras hipótesis del modelo que también se cumplen, las cuales voy a mencionar seguidamente. Una de ellas es que los coeficientes son constantes a lo largo de toda la muestra y aparecen de forma lineal. 25

Otra de las hipótesis es que la esperanza de las perturbaciones es nula, es decir, la media de todos los errores es 0. Por tanto, se puede deducir que las perturbaciones aleatorias se distribuyen normalmente con media cero y desviación típica (varianza) constante (homocedasticidad) en todos los periodos considerados, y que las n perturbaciones aleatorias están incorrelacionadas (hipótesis de no autocorrelación). Como consecuencia de estas dos hipótesis: la perturbación aleatoria sigue una N n (0, σ 2 I). De todas estas hipótesis deriva que finalmente la variable dependiente (en nuestro caso el número de viajeros) sea también una variable aleatoria con distribución normal. Por tanto, podemos decir finalmente que el modelo 2 que ha sido seleccionado es idóneo al cumplirse las hipótesis básicas. 2.3.ESTIMACIÓN DEL MODELO 1 PARA ESPAÑA. Modelo 1: MCO, usando las observaciones 2010:1-2016:4 (T = 28) Variable dependiente: l_viajeros Coeficiente Desv. Estadístico P-valor Típica t Const 10.8889 17.5052 0.6220 0.5427 IPC 0.00091494 0.0104354 0.08768 0.9312 4 TasaActividad 0.0025285 0.0342640 0.07379 0.9421 0 TasaParo 0.00582227 0.00769385 0.7567 0.4602 IPH 0.00371066 0.00380052 0.9764 0.3434 l_pib 1.23865 0.834842 1.484 0.1573 l_gastoocio 0.137411 0.178345 0.7705 0.4522 l_gastohotelesy 0.271119 0.151674 1.788 0.0928 * rest l_transporteaut 0.0541423 0.141144 0.3836 0.7063 obus dq1 0.656586 0.0218785 30.01 <0.0001 *** 26

dq2 0.237308 0.0279577 8.488 <0.0001 *** dq4 0.589335 0.0428410 13.76 <0.0001 *** Fuente: Elaboración propia a través de Gretl. Media de la vble. dep. 16.86540 D.T. de la vble. dep. 0.286558 Suma de cuad. residuos 0.010497 D.T. de la regresión 0.025613 R-cuadrado 0.995266 R-cuadrado corregido 0.992011 F(11, 16) 305.7738 Valor p (de F) 2.01e-16 Log-verosimilitud 70.71425 Criterio de Akaike 117.4285 Criterio de Schwarz 101.4420 Crit. de Hannan-Quinn 112.5413 Rho 0.030921 Durbin-Watson 1.896718 Fuente: Elaboración propia a través de Gretl. La expresión del modelo viene dada por: Ln (viajeros)= β 0 + β 1 IPC + β 2 TasaActividad + β 3 TasaParo + β 4 IPH + β 5 ln (PIB) + β 6 ln (Gastoocio) + β 7 ln (Gastohotelesyrest) + β 8 ln (Transporteautobus) + β 9 dq1 + β 10 dq2 + β 11 dq4 + u, siendo la expresión del modelo ajustado la siguiente: = 10.8889 + 0.000914944 IPC 0.00252850 TasaActividad + 0.00582227 TasaParo + 0.00371066 IPH + 1.23865 ln (PIB) + 0.137411 ln (Gastoocio) + 0.271119 ln (Gastohotelesyrest) + 0.0541423 ln (Transporteautobus) 0.656586 dq1 0.237308 dq2 0.589335 dq4 En este caso del modelo español, nos encontramos con un modelo globalmente significativo, ya que cuenta con un p-valor inferior a cualquier nivel de significación, y tiene también una elevada capacidad explicativa, debido a que su coeficiente de determinación es muy elevado (99,52%). Sin embargo, al igual que ocurría en el primer modelo para Andalucía, en este casi ninguna variable explicativa es individualmente significativa, lo cual puede dar indicios de multicolinealidad en el modelo. Por ello, al igual que en el supuesto anterior, aún no vamos a realizar una interpretación de los parámetros del modelo hasta comprobar si existen problemas de multicolinealidad, por lo que se va a llevar a cabo un análisis de multicolinealidad en el modelo como hemos hecho en el caso andaluz, estudiando también la especificación del modelo. 27

2.3.1. ESTUDIO DE LA ESPECIFICACIÓN DEL MODELO 1. Como se ha realizado anteriormente, vamos a utilizar el Test RESET de Ramsey, estableciendo los correspondientes contrastes de significación de la misma forma: H 0: El modelo está bien especificado H 1: El modelo está mal especificado Contraste de especificación RESET (cuadrados y cubos). Estadístico de contraste: F = 0.421681, con p-valor = P (F(2,14) > 0.421681) = 0.664. Contraste de especificación RESET (cuadrados sólo). Estadístico de contraste: F = 0.713934, con p-valor = P (F(1,15) > 0.713934) = 0.411. Contraste de especificación RESET (cubos sólo). Estadístico de contraste: F = 0.718085, con p-valor = P (F(1,15) > 0.718085) = 0.41. Al realizar una comparación entre el valor del alfa del 1% de significación y el de los p- valores de cada contraste, como los p-valores son más elevados que el nivel de significación, en ninguno de los contrastes se rechaza la hipótesis nula, por lo que se puede concluir que el modelo está bien especificado. 2.3.2. ANÁLISIS DE MULTICOLINEALIDAD DEL MODELO 1. En este caso voy a utilizar el indicador de los factores de inflación de la varianza para analizar si existe multicolinealidad en el modelo. Factores de inflación de varianza (VIF). 8.424 IPC TasaActividad 8.767 TasaParo 11.766 28

IPH 7.632 l_pib 47.126 l_gastoocio 14.076 l_gastohotelesyrest 8.806 l_transporteautobus 1.582 dq1 3.831 dq2 6.255 dq4 14.687 Fuente: Elaboración propia a través de Gretl. Tras su análisis resulta evidente que las variables relativas a la Tasa de Paro, PIB, Gasto de ocio y dq4 son colineales al tener unos VIF por encima de 10, por lo que se va a llevar a cabo la regresión por pasos hacia atrás para intentar corregir este problema. 2.3.3. REGRESIÓN POR PASOS HACIA ATRÁS Y ESTIMACIÓN DEL MODELO 2. De esta forma, tras la eliminación secuencial de las variables no significativas para el modelo, con un alfa del 0.01 a dos colas nos queda el modelo que sigue a continuación, en el que todas las variables son individualmente significativas. El contraste de hipótesis establecido por Gretl al llevar a cabo la regresión por pasos hacia atrás ha sido el siguiente: Hipótesis nula: los parámetros de regresión son cero para las variables IPC, TasaActividad, TasaParo, l_gastoocio y l_transporteautobus, siendo el estadístico de contraste: F (5, 16) = 0.257703 y el p-valor= 0.929618. Por tanto, al ser el p-valor mayor que el nivel de significación, no se rechaza la hipótesis nula. Según Gretl al realizar la omisión de variables mejoraron 3 de 3 criterios de información. Modelo 2: MCO, usando las observaciones 2010:1-2016:4 (T = 28) Variable dependiente: l_viajeros Coeficiente Desv. Típica Estadístico t P-valor Const 4.90800 3.14871 1.559 0.1340 29