MINISTERIO DE EDUCACIÓN NACIONAL COLOMBIA APRENDE HíBRIDO ENTRE UNA RED NEURONAL Y UN MODELO ARIMA PARA LA ESTIMACIÓN DE PRECIOS DE LOS VEHíCULOS EN COLOMBIA DICIEMBRE 2006 AGRADECIMIENTOS FUNDACIÓN UNIVERSITARIA KONRAD LORENZ PARTICIPACIÓN ECONÓMICA SIMPOSIO INTERNACIONAL EN ACTUARÍA AGOSTO 25 28 /2006 SUBSIDIÓ LA INVESTIGACIÓN CONFERENCIA INVESTIGACIÓN CONFERENCIA INVESTIGACIÓN USO DEL APLICATIVO SUGERENCIAS 1
GERARDO ARDILA DUARTE LC. Matemáticas UPN ESP. Análisis de datos USALLE ESP. Docencia Universitaria U San Buenaventura Mg. Estadística UNAL Profesor Investigador Fukl Docente U Militar U Libre Estadístico Seguros del Estado Estadístico Colserauto Fasecolda Agradecimientos Ing. Pervys Rengifo Profesor investigador Fukl Fis. Juan Fernando Jaramillo Actuario Colseguros CONCEPTOS BÁSICOS Neurona Artificial : Es un paradigma de aprendizaje y procesamiento automático inspirado en la forma en que funciona el sistema nervioso de los animales. Consiste en simular las propiedades observadas en los sistemas neuronales biológicos a través de modelos matemáticos creados mediante mecanismos artificiales Funcionamiento de la red neuronal: se compone de unidades llamadas neuronas. Cada neurona recibe una serie de entradas a través de interconexiones y emite una salida. Esta salida viene dada por una función de propagación o excitación, que por lo general consiste en la sumatoria de cada entrada multiplicada por el peso de su interconexión. Si el peso es positivo, la conexión se denomina excitatoria; si es negativo, inhibitoria. Un perceptrón se refiere a una neurona artificial y también como a la unidad básica de inferencia en forma de discriminador lineal, que suele formar parte de una RNA. 2
PERCEPTRÓN SENCILLO DE ESTE HIBRIDO ES DE LA FORMA X1 W1 Función de transferencia Entrada de la función Y Híbrido X2 W2 Ø umbral Pesos, determinan el conocimiento de la red Entradas APLICACIÓN DE LA REGLA DE APRENDIZAJE La solución del siguiente caso se aplica, sobre cada modelo y sobre cada vehículo: Caso de un Sprint modelo 1996 S(t) = j wj xj(t) xi : es la señal producida por la unidad i (la unidad de salida) Wj: Son los pesos calculados bajo un estudio de mercados, de más de 10.000 individuos investigados mensualmente. x1: Revista Motor, x2: Otras Revistas, x3: Clasificados, x4: Concesionarios, x5: Fasecolda valores: X(t) x1: 12.2 x2: 14.4 x3: 12 x4: 13.2 x5:12.7 pesos: (Wj) w1: 0.6 w2: 0.25 w3: 0.05 w4: 0.05 w5:0.05 S(t)=w1x1w2x2w3x3w4x4w5x5 S(t)=12.5 Señal emitida por variación con información significativa. El modelo utiliza la moda y/o mediana, obtenida en la investigación de mercados, como si fuese la señal deseada, con el objeto de medir la variación y aceptación. Aplicamos el ARIMA y/o un suavizamiento exponencial con los valores hallados para cada uno de los modelos y calcular un modelo al que se le desconoce le valor. 3
Construcción de la Red Neuronal PERCEPTRÒN SIMPLE Capa de entrada pesos Motor Otras revistas 0.6 0.25 Entrada de la función Función de transferencia Entrada de la función caso de un vehiculo importado Ø Concesionarios 0.05 S(t) Fasecolda 0.05 j wj xj(t) Potencial pos sináptico Yt=S(t)S(t)*Ø Clasificados 0.05 Aplicación del ARIMA Generador de pesos Colserauto Estudio del mercado Ejemplo Sprint SEÑAL EMITIDA POR DATOS DE ENTRADA Fuente 2004 2003 2002 2001 2000 1999 1998 1997 1996 1995 1994 1993 1992 1991 1990 Motor 21,3 19,8 18,3 17,1 15,9 14,8 13,8 12,8 12,2 10,8 10 9,5 8,8 8,3 7,5 Concesiona rio 23,1 21,2 19,4 17,8 16,2 15,2 14,7 13,8 13,2 11,4 10,9 10,4 9,9 9,5 9 Clasificados 21 19,3 17,9 16,6 15,5 14,3 13,2 12,5 12 10,3 9,4 8,8 8,2 7,6 7 Otras rev. 24,4 22,5 21,5 20,2 19,1 17,9 17 15,1 14,4 13,6 12,9 12,3 11,6 11,2 10,5 Fasecolda 21,8 20,3 18,6 17,6 16,4 15,3 14,3 13,6 12,7 11,5 10,5 9,9 9,3 8,8 8,1 4
Ejemplo Sprint SEÑAL EMITIDA POR INFORMACIÓN SIGNIFICATIVA W Fuen te 2004 2003 2002 2001 2000 1999 1998 1997 1996 1995 1994 60% Motor 12,78 11,88 10,98 10,26 9,54 8,88 8,28 7,68 7,32 6,48 6 5% Co ncesio nario 1,155 1,06 0,97 0,89 0,81 0,76 0,735 0,69 0,66 0,57 0,545 5% Clas ificados 1,05 0,965 0,895 0,83 0,775 0,715 0,66 0,625 0,6 0,515 0,47 25% Otras rev. 6,1 5,625 5,375 5,05 4,775 4,475 4,25 3,775 3,6 3,4 3,225 Señal 5% emitid Faseco a lda x 1,09 1,015 0,93 0,88 0,82 0,765 0,715 0,68 0,635 0,575 0,525 Info rmac ión Significativa 22,2 20,5 19,2 17,9 16,7 15,6 14,6 13,5 12,8 11,5 10,8 Ejemplo Sprint MODA, MEDIANA Y/O VALOR DESEADO PESO POS SINÀPTICO 2004 2003 2002 2001 2000 1999 1998 1997 1996 1995 1994 (1)Moda, mediana y/o valor más deseado de los m áximos 22,4 20,7 19,5 18 16,9 15,8 14,8 13,9 12,9 11,6 10,8 (2)Señal emitida por información significativa 22,2 20,5 19,2 17,9 16,7 15,6 14,6 13,5 12,8 11,5 10,8 Difrencia (1) (2) 0,2 0,2 0,3 0,1 0,2 0,2 0,2 0,4 0,1 0,1 0 Peso pos sináptico (**) 0,04 0,04 0,06 0,02 0,04 0,04 0,04 0,09 0,02 0,02 0,00 Variacion entre modelos 1,08 1,06 1,08 1,07 1,07 1,07 1,06 1,08 1,11 1,07 Tasa Geometrica Factor sde suavización esperado 1,07 0,04 (*) Moda, mediana y/o valor más frecuente se toma de la investigación de mercados es el valor más frecuente por el cliente en el momento de la venta de su vehículo (**) Se calcula como el producto entre la tasa de crecimiento geométrico, la diferencia observada y el peso de activación inicial (0.2) para cada fuente. 5
COMPORTAMIENTO DEL MODELO PARA UN SPRINT 35 30 VALOR EN MILLONES 25 20 15 10 Intervalo de confianza 10% 5 0 0 10 20 30 40 50 60 70 80 73 PERIODOS EJEMPLO: AUDI A3 2P 1.8 MECÁNICO SEÑAL EMITIDA POR DATOS DE ENTRADA Fuente 2004 2003 2002 2001 2000 1999 1998 1997 Motor 63 56 55 52 49 46 43 40 Concesionarios 66,5 59,5 58,5 55,5 52,5 49,5 46,5 43,5 Clasificados 60,5 53,5 52,5 49,5 46,5 43,5 40,5 37,5 Otras Rev. 66 59 58 55 52 49 46 43 Fasecolda 64,8 57,8 56,8 53,8 50,8 47,8 44,8 41,8 6
Ejemplo: AUDI A3 1.8 2P MEC SEÑAL EMITIDA POR INFORMACIÓN SIGNIFICATIVA W Fuente 2004 2003 2002 2001 2000 1999 1998 1997 60% Motor 37,8 33,6 33,0 31,2 29,4 27,6 25,8 24,0 5% Concesionarios 3,3 3,0 2,9 2,8 2,6 2,5 2,3 2,2 5% Clasificados 3,0 2,7 2,6 2,5 2,3 2,2 2,0 1,9 25% Otras Rev. 16,5 14,8 14,5 13,8 13,0 12,3 11,5 10,8 5% Fasecolda 3,2 2,9 2,8 2,7 2,5 2,4 2,2 2,1 Señal emitida x información significativa 63,9 56,9 55,9 52,9 49,9 46,9 43,9 40,9 Variación TRM ( 0,01) prm. Mensual Yt=S(t)S(t)*Ø 63,2 56,3 55,3 52,3 49,3 46,4 43,4 40,4 Ejemplo A3 1.8 2P MEC MODA, MEDIANA Y/OVALOR DESEADO PESO POS SINÀPTICO Fuente 2004 2003 2002 2001 2000 1999 1998 1997 (1)Moda, mediana y/o valor más deseado de los m áx imos (*) 63,5 57 56 53 50 47 44 41 (2)Yt=S(t)S(t)*Ø 63,2 56,3 55,3 52,9 49,9 46,9 43,9 40,9 Diferencia (1) (2) 0,3 0,7 0,7 0,1 0,1 0,1 0,1 0,1 Peso Sináptico (**) 0,06 0,15 0,15 0,02 0,02 0,02 0,02 0,02 Variacion entre m odelos 1,11 1,02 1,06 1,06 1,06 1,07 1,07 Tasa de ccrecimiento geométrico Factor de suavización esperado 1,06 0,06 (*) Moda, mediana y/o valor más frecuente se toma de la investigación de mercados es el valor más frecuente por el cliente en el momento de la venta de su vehículo (**) Se calcula como el producto entre la tasa de crecimiento geométrico, la diferencia observada y el peso de activación inicial (0.2 para cada fuente. 7
PROCEDIMIENTO DE LA RED PRECIO MODELO VEHICULO MARCA (Todas) (Todas) (Todas) (Todas) Cuenta de FUENTE FUENTE Total CLASIFICADOS 44 CONSECIONARIOS 49 FASECOLDA 54 MOTOR 595 OTRAS REVISTAS 258 Total general 1000 La tabla dinámica, posee la base de datos de un día de trabajo en Colserauto, con ella se observa el mecanismo de cálculo de pesos, precios por modelo, cálculo de la mediana y elementos básicos para la ejecución de la Red. MUCHAS GRACIAS 8