UNIVERSIDAD DE CHILE

Tamaño: px
Comenzar la demostración a partir de la página:

Download "UNIVERSIDAD DE CHILE"

Transcripción

1 UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS ESCUELA DE POSTGRADO PLAN PARA ENFOCAR LAS CAMPAÑAS BANCARIAS UTILIZANDO DATAMINING MAURICIO PASCUAL DE LUCA VENEGAS MIEMBROS DE LA COMISIÓN EVALUADORA SR. LUIS ZAVIEZO SCHWARTZMAN : PROFESOR GUÍA SR. DANIEL ESPARZA CARRASCO SR. MANUEL VERGARA TRINCADO TESIS PARA OPTAR AL GRADO DE MAGISTER EN GESTIÓN Y DIRECCIÓN DE EMPRESAS SANTIAGO DE CHILE JULIO, 2006

2 RESUMEN El objetvo últmo de la tess consste en demosta que medante datamnng es posble elaboa un plan paa enfoca la estatega comecal en los poductos de cédtos de consumo, tajetas y líneas de cédto de un Banco pequeño que caece de un datawaehouse. La hpótess consste en el supuesto de que el conjunto de bases de datos opeaconales que fozosamente cualque Banco debe posee poveen nfomacón sufcente paa elaboa un plan de datamnng como el que se desea constu. El desaollo de la tess, en tanto, consste en detalla paso a paso con una metodología de datamnng (CRISP-DM) como fomula un plan paa enfoca las campañas bancaas medante una segmentacón de esgo y entabldad basada en modelos pedctvos geneados a pat de los datos de las bases opeaconales antes menconadas. Fnalmente, la pncpal conclusón que se obtene como esultado de la nvestgacón consste en que la tess planteada en un comenzo es válda, po cuanto es posble constu un plan como el deseado. La nvestgacón desaollada no ha petenddo elaboa modelos pedctvos específcos, puesto que paa ello hubese sdo necesao dspone de datos concetos de un conjunto masvo de clentes, nfomacón cuyo acceso está seveamente estngdo po la ley de seceto bancao. Po lo tanto, las ndcacones que se entegan en este nfome son genécas, puamente conceptuales, no están dgdas a nngún Banco específco y no se basan en nngún conjunto de datos de nngún gupo de pesonas. Se ha empleado la metodología CRISP-DM paa la elaboacón del plan de datamnng po coesponde a un estánda amplamente utlzado en poyectos de mneía de datos. Po oto lado, dado que hubese sdo mposble lusta el plan de datamnng sn ecu a alguna heamenta de datamnng específca, se ha usado Clementne de SPSS po hace posble la epesentacón de flujos de datos de manea gáfca y po su gan capacdad paa tabaja con una ampla gama de bases de datos opeaconales de dstntos poveedoes.

3 AGRADECIMIENTOS Qusea dedca este tabajo a m made, Isolna Venegas, quen a tavés de su ejemplo de enome geneosdad haca sus hjos me enseñó a enfenta la vda con esfuezo, bondad y sencllez. Qusea tambén agadece al MBA de la Unvesdad de Chle po tansmtme un deseo genuno de contbu a la socedad con todo m talento, ceatvdad y enegía, puesto que en dcho deseo he encontado la fuente de un ldeazgo auténtco y oentado en m vda pofesonal.

4 INDICE 1 INTRODUCCIÓN DIAGNÓSTICO DEL PROBLEMA Los poductos Cédtos de consumo Tajetas de cédto Líneas de cédto El mecado La ndusta La tecnología Enfoques de las campañas bancaas Oentacón opeaconal Oentacón estatégca OBJETIVOS DE LA INVESTIGACIÓN DEFINICIONES PREVIAS El témno datamnng o mneía de datos El témno modelo Defncón del concepto de técnca de modelamento Defncón del concepto de poyecto de datamnng Defncón del concepto de plan de datamnng HIPÓTESIS DE TRABAJO Supuestos sobe dsponbldad de nfomacón Supuestos tecnológcos Supuestos sobe el maco egulatoo Supuestos de negocos Supuestos opeaconales METODOLOGÍA DE TRABAJO Metodologías de datamnng Metodología SEMMA Metodología CRISP-DM Razones paa utlza CRISP-DM...57

5 7 PRIMERA FASE DEL PLAN: COMPRENSIÓN DEL NEGOCIO Detemna los objetvos de negocos (taea 1a) Backgound (output 1a.1) Objetvos de negocos: focalzase en nchos y cece sujeto a un nvel mínmo de esgo (output 1a.2) Cteos de éxto de negocos: pocentaje de aumento en los montos ofecdos en las campañas y monto de pédda espeada de éstas (output 1a.3) Evalua la stuacón (taea 1b) Inventao de ecusos (output 1b.1) Requementos, suposcones y estccones (output 1b.2) Resgos y contngencas (output 1b.3) Temnología (output 1b.4) Defncón de clente malo desde un punto de vsta cedtco Defncón de entabldad potencal de un clente Defncón de clente sn gan entabldad potencal Defncón de caga fnancea Costos y benefcos (output 1b.5) Detemna los objetvos de datamnng (taea 1c) Objetvos de datamnng: estma el esgo cedtco y la entabldad potencal de los clentes (output 1c.1) Cteos de éxto de datamnng: eoes tpo I y tpo II (output 1c.2) Poduc el plan del poyecto (taea 1d) Plan del poyecto (output 1d.1) Evaluacón ncal de heamentas y técncas (output 1d.2) SEGUNDA FASE DEL PLAN: COMPRENSIÓN DE LOS DATOS Recolecta datos ncales (taea 2a) Repote de ecoleccón de datos ncales (output 2a.1) Datos necesaos paa el poyecto: lsta de atbutos de los clentes Gupo de vaables demogáfcas (A) Gupo de vaables de enta (B) Gupo de vaables de vínculo con el clente (C)...85

6 Gupo de vaables de ngesos contables geneados po clente (D) Gupo de vaables de compotamento (E) Gupo de vaables de deudas (F) Fuentes de datos dsponbles y sufcentes paa el poyecto Descb los datos (taea 2b) Repote de descpcón de datos (output 2b.1) Exploa los datos (taea 2c) Repote de exploacón de datos (output 2c.1) Vefca la caldad de los datos (taea 2d) Repote de caldad de los datos (output 2d.1) TERCERA FASE DEL PLAN: PREPARACIÓN DE LOS DATOS Conjunto de datos (output 3z.1) Obtencón automatzada del conjunto de datos en Clementne Símbolos usados en Clementne paa pocesa datos Flujo de datos que obtene base de vaables pedctvas Descpcón del conjunto de datos (output 3z.2) Seleccona los datos (taea 3a) Razones paa la nclusón o exclusón de datos (output 3a.1) Lmpa los datos (taea 3b) Repote de lmpeza de los datos (output 3b.1) Constu datos (taea 3c) Atbutos devados (output 3c.1) Estmacón de las deudas con otas nsttucones fnanceas Regstos geneados (output 3c.2) Intega los datos (taea 3d) Datos mezclados (output 3d.1) Fomatea los datos (taea 3e) Datos efomateados (output 3e.1) CUARTA FASE DEL PLAN: MODELAMIENTO Seleccona la técnca de modelamento (taea 4a) Técnca de modelamento (output 4a.1) Regesón logístca...124

7 Repesentacón de modelos medante egesón logístca Refnamento teatvo de los modelos de egesón logístca Redes neuonales Repesentacón de modelos medante edes neuonales Refnamento teatvo de los modelos de edes neuonales Cálculo con ed neuonal de pobabldad de que un clente sea malo Áboles de decsón Repesentacón de modelos medante áboles de decsón Refnamento de los modelos de áboles de decsón Compaacón de las técncas de modelamento Supuestos de modelamento (output 4a.2) Genea el dseño de las puebas (taea 4b) Dseño de las puebas (output 4b.1) Constu un modelo (taea 4c) Establece los paámetos (output 4c.1) Modelos (output 4c.2) Geneacón automatzada de modelos en Clementne Símbolos usados en Clementne paa genea modelos Descpcón del dagama en Clementne que genea un modelo Descpcón del modelo (output 4c.3) Modelo de esgo especfcado usando egesón logístca Modelo de entabldad especfcado usando egesón logístca Modelo de esgo especfcado usando edes neuonales Modelo de entabldad especfcado usando edes neuonales Modelo de esgo especfcado usando áboles de decsón Modelo de entabldad especfcado usando áboles de decsón Vaables váldas en los tes tpos de modelos antes explcados Evalua el modelo técncamente (taea 4d) Evaluacón técnca del modelo y de los objetvos de datamnng de estma el esgo cedtco y la entabldad potencal de los clentes (output 4d.1) Pncpales meddas estadístcas paa evalua modelos técncamente..182

8 Dvegenca Estadístco de Kolmogoov-Smnov (K-S) Cuva ROC o de Tade-off Receve Opeatng Chaactestc (ROC) Razón Odds/Scoe Evaluacón técnca automatzada de modelos utlzando Clementne Establece los paámetos evsados (output 4d.2) QUINTA FASE DEL PLAN: EVALUACIÓN DE NEGOCIOS Evalua los esultados de negocos (taea 5a) Evaluacón de negocos de esultados de datamnng y de los objetvos de negocos de focalzase en nchos y cece sujeto a un nvel mínmo de esgo (output 5a.1) Modelos apobados (output 5a.2) Revsa el poceso de datamnng (taea 5b) Revsón del poceso de datamnng (output 5b.1) Detemna los póxmos pasos (taea 5c) Lsta de las accones posbles (output 5c.1) Decsón (output 5c.2) SEXTA FASE DEL PLAN: DESPLIEGUE DE LOS RESULTADOS Planfca el desplegue (taea 6a) Plan de desplegue (output 6a.1) Automatzacón de la fase de desplegue utlzando Clementne Planfca el montoeo y la mantencón (taea 6b) Plan de montoeo y mantencón (output 6b.1) Poduc el epote fnal (taea 6c) Repote fnal (output 6c.1) Pesentacón fnal (output 6c.2) Revsa el poyecto (taea 6d) Documentacón de la expeenca (output 6d.1) CONCLUSIÓN BIBLIOGRAFÍA...212

9 INDICE DE FIGURAS Fgua 1.1 Tema de tess planteado en foma edonda en cuanto a objetvo, desaollo y conclusones...15 Fgua 2.1 Cecmento de los poductos de consumo bancaos, Fgua 2.2 Fgua 2.3 Fgua 2.4 Fgua 2.5 Fgua 2.6 Fgua 2.7 Fgua 2.8 Fgua 2.9 Fgua 2.10 Fgua 2.11 Fgua 2.12 Pocentaje de patcpacón de las colocacones de los dstntos Bancos del sstema fnanceo chleno, Julo del Compaacón ente Bancos gandes y pequeños de la azón de efcenca (gastos de apoyo ope. / esultado ope.), Compaacón ente Bancos medanos y pequeños de la azón de efcenca (gastos de apoyo ope. / esultado ope.), Evolucón del magen de nteeses del sstema fnanceo chleno como un todo, peodo Compaacón ente Bancos gandes y pequeños de la azón de magen de nteeses / colocacones, peodo Compaacón ente Bancos medanos y pequeños de la azón de magen de nteeses / colocacones, peodo Compaacón del magen de nteeses sobe colocacones ente Bancos de clentes pefeencales y Bancos pequeños, peodo Compaacón de la entabldad sobe patmono de Bancos gandes y pequeños, peodo Compaacón de la entabldad sobe patmono de Bancos medanos y pequeños, peodo Evolucón de las colocacones totales del sstema fnanceo chleno, desglosadas po tpo, peodo Compaacón del cecmento anual de colocacones de los Bancos medanos y pequeños, peodo

10 Fgua 2.13 Fgua 2.14 Fgua 2.15 Fgua 2.16 Matz de cecmento-patcpacón de las colocacones de los dstntos Bancos en Chle, Julo 2004-Julo Tasas de cédtos de consumo, hpotecaos y comecales, peodo Composcón del magen opeaconal buto de los dstntos Bancos, Julo Pocentaje de los dstntos tpos de cédtos sobe el total de colocacones de cada Banco, Febeo Fgua 2.17 Rankng de Bancos po colocacones de consumo, Febeo Fgua 2.18 Enfoque opeaconal de comuncacón en un poyecto de datamnng...39 Fgua 6.1 Fases y Taeas del Modelo CRISP-DM...55 Fgua 7.1 Fgua 7.2 Fgua 8.1 Fgua 8.2 Fgua 9.1 Fgua 9.2 Fgua 9.3 Taeas y outputs de la fase de compensón del negoco, pmea fase del poyecto de datamnng según metodología CRISP-DM...59 Ganancas extas obtendas po cada tansaccón de la tajeta de cédto de un clente, cuando éste tene vaos años de antgüedad...71 Taeas y outputs de la fase de compensón de los datos, segunda fase del poyecto de datamnng según metodología CRISP-DM...81 Ses gupos de vaables canddatas a se consdeadas en los modelos (nótese que sólo un gupo coesponde a vaables de deudas)...84 Taeas y outputs de la fase de pepaacón de los datos, tecea fase del poyecto de datamnng según metodología CRISP-DM...95 Flujo de datos en Clementne que obtene la base de datos fnal paa constu un modelo pedctvo...99 Gan flujo de datos de Clementne mostando la obtencón de una base de vaables pedctvas a pat de dstntas fuentes de datos...102

11 Fgua 9.4 Fgua 9.5 Fgua 9.6 Fgua 9.7 Fgua 9.8 Fgua 9.9 Fgua 9.10 Fgua 9.11 Fgua 9.12 Fgua 9.13 Fgua 10.1 Flujo de datos en Clementne que obtene las deudas de los clentes con el Banco y que fueon nfomadas a la SBIF hace dos meses Flujo de datos en Clementne que estma las deudas de un clente con teceos Flujo de datos en Clementne que obtene los saldos actuales de las cuentas, tanto antes como después del envío del D01 hace dos meses Flujo de datos en Clementne que obtene los saldos actualzados de las cuentas epotadas hace dos meses en el D01 envado a la SBIF Flujo de datos en Clementne que obtene las deudas actualzadas de los clentes con el Banco Flujo de datos en Clementne que sepaa los clentes nuevos (de hace menos de dos meses) de los clentes antguos Flujo de datos en Clementne que estma las deudas con teceos de los clentes nuevos (de menos de dos meses de antgüedad) Flujo de datos en Clementne que obtene las deudas de los clentes tanto con el Banco como con teceos Flujo de datos en Clementne que mezcla los datos de las deudas de los clentes, de su enta y de sus caacteístcas demogáfcas Flujo de datos en Clementne que obtene la base de vaables pedctvas Taeas y outputs de la fase de modelamento, cuata fase del poyecto de datamnng según metodología CRISP-DM Fgua 10.2 Clentes buenos y malos vesus caga fnancea Fgua 10.3 Popocón de clentes malos po clase de caga fnancea Fgua 10.4 Un modelo matemátco smple paa una neuona...132

12 Fgua 10.5 Fgua 10.6 Fgua 10.7 Fgua 10.8 Fgua 10.9 Funcones de actvacón de una neuona: funcón escalonada (a) y funcón sgmodal (b) Undades con una funcón de actvacón escalonada que pueden epesenta dstntas puetas lógcas Una ed neuonal con dos nputs, un nvel oculto de dos undades y una salda Gáfco del output de un peceptón con dos undades de entada y una funcón de actvacón sgmodal El esultado de combna dos funcones sgmodales paa obtene una codllea Fgua El esultado de combna dos codlleas paa poduc un ceo Fgua Peceptón con una undad de salda Fgua Red neuonal con un nvel oculto y dos undades de salda Fgua Ejemplo de ábol de decsón que pemte clasfca a los clentes en buenos y malos Fgua Ejemplos de clentes clasfcados como buenos o malos Fgua Clasfcacón de conjunto de datos de entenamento medante el atbuto de comuna Fgua Clasfcacón de conjunto de datos de entenamento medante atbutos de enta y otacón de empleo Fgua Ábol de decsón geneado po algotmo a pat de los ejemplos del conjunto de datos de entenamento Fgua Funcón nfomacón y pomedo geométco ente la popocón de ejemplos postvos y negatvos en un conjunto de datos Fgua Flujo de datos en Clementne que genea modelos y pedccones a pat de una base fnal paa almenta el modelo pedctvo Fgua Flujo de datos en Clementne que obtene un conjunto de datos de entenamento...166

13 Fgua Flujo de Datos en Clementne que genea modelos a pat de un conjunto de datos de entenamento Fgua Factoes consdeados en la dvegenca de un modelo de puntaje: cuanto se sepaan y se supeponen las dstbucones de buenos y malos Fgua Estadígafo K-S, calculado como la máxma dstanca ente las dstbucones de buenos y malos de un modelo de puntaje Fgua Cuvas de tade-off de dos modelos de puntaje Fgua Estadígafo ROC de un modelo de puntaje, calculado como el áea bajo la cuva de tade-off Fgua Razón de Odds/Scoe de un modelo de puntaje Fgua Flujo de datos en Clementne que obtene un conjunto de datos de pueba paa valda un modelo Fgua Flujo de datos en Clementne que entega notas y pedccones de de esgo y entabldad potencal paa un conjunto de clentes Fgua 11.1 Taeas y outputs de la fase de evaluacón de negocos, qunta fase del poyecto de datamnng según metodología CRISP-DM Fgua 11.2 Segmentos de esgo y entabldad Fgua 11.3 Fgua 11.4 Fgua 12.1 Fgua 12.2 Fgua 12.3 Oentacón opeaconal de las campañas bancaas Funcones contnua y escalonada que descben el aumento del esgo de los clentes al aumenta su caga fnancea Taeas y outputs de la fase de desplegue, sexta y últma fase del poyecto de datamnng según metodología CRISP-DM Flujo de datos en Clementne que obtene una base de clentes con notas de esgo y entabldad a pat de una base de vaables pedctvas Flujo de datos en Clementne que obtene una base de ofetas comecales a pat de una base con notas de esgo y entabldad...206

14 1 INTRODUCCIÓN El pesente documento descbe como medante datamnng es posble enfoca las campañas de un Banco pequeño que no cuenta con un datawaehouse. Todo ello paa los poductos de cédtos de consumo, tajetas y líneas de cédto. Se descbe cómo a pat de cetas bases opeaconales de un Banco es posble constu modelos de datamnng capaces de calcula puntajes de esgo y entabldad de sus clentes, y cómo a pat de tales puntajes pueden dentfcase dstntos segmentos susceptbles de se atacados con ofetas dfeencadas. El objetvo del auto del pesente tabajo 1 no ha sdo elaboa modelos pedctvos de la entabldad de los clentes n de su desempeño cedtco, puesto que paa ello hubese sdo necesao dspone de los datos de los clentes de algún Banco, cosa que ha escapado totalmente al ámbto de defncón de la nvestgacón. El objetvo, en cambo, ha sdo elata cómo es posble elaboa un plan paa que un Banco pequeño constuya e mplemente modelos de datamnng que le ayuden a enfocase en nchos de mecado específcos. Po ende, el foco de la tess no se encuenta en la descpcón de modelos pedctvos específcos, sno que en la foma de elaboa un plan paa constu tales modelos. Po lo tanto, las ndcacones que se entegan en este nfome son genécas, puamente conceptuales, no están dgdas a nngún Banco específco y no se basan en nngún conjunto de datos de nngún gupo de pesonas. En consecuenca no se ha peddo n obtendo autozacón de nnguna nsttucón n pesona paa utlza en este nfome datos confdencales, tales como nfomacón sujeta a seceto bancao. El pesente nfome se ha planteado en foma edonda en cuanto a objetvos, desaollo y conclusones, en el sentdo de cea un cclo que pate de un objetvo, consstente en demosta la valdez de una tess, paa fnalmente aba a la conclusón de que la tess es válda. En efecto, en foma smla a la demostacón de un teoema geométco la nvestgacón se ha dvddo en cuato pasos, como se lustan en la fgua 1.1 dada abajo: fomulacón de la tess a demosta, fomulacón de las hpótess que se empleaán en la demostacón, desaollo de la demostacón popamente dcha, y fnalmente la conclusón con especto a la valdez de la tess. Po lo tanto, el desaollo apunta específcamente a alcanza el objetvo planteado en la tess. Las conclusones, 1 Mauco De Luca, ngeneo cvl de ndustas y dploma académco en la especaldad de ngeneía en computacón de la Pontfca Unvesdad Católca de Chle ([email protected]) 14

15 po su pate, establecen s la tess es válda o falsa, y se devan dectamente del desaollo de la demostacón. Fgua 1.1 Tema de tess planteado en foma edonda en cuanto a objetvo, desaollo y conclusones 2 La tess que se petende demosta es la sguente: medante heamentas de datamnng puede elaboase un plan paa enfoca las campañas en un Banco pequeño que caece de un datawaehouse, de manea de pemt a la nsttucón segmenta a sus clentes y cece. El objetvo últmo y pncpal de esta nvestgacón no es oto que demosta dcha tess. El capítulo 3 entega objetvos secundaos que pemten alcanza dcho objetvo pncpal. La pncpal hpótess de tabajo, po su pate, consste en el supuesto de que exste un conjunto de bases de datos opeaconales que fozosamente cualque Banco debe 2 Fuente: elaboacón popa 15

16 posee y que poveen nfomacón necesaa y sufcente paa ealza estudos de datamnng. Exsten tambén otas hpótess de tabajo que son necesaas paa pode satsface el objetvo de la tess y las cuales se detallan en el capítulo 5. El desaollo de la tess, en tanto, consste en detalla paso a paso con una metodología de datamnng (CRISP-DM) como fomula un plan paa enfoca las campañas, constuyendo modelos pedctvos de esgo y entabldad a pat de datos de bases opeaconales. El desaollo de la tess es dvddo en los capítulos 7 al 12, coespondendo cada uno a las dstntas fases en las que se dvde un poyecto de datamnng en la metodología CRISP-DM. La pncpal conclusón, po lo tanto, consste en que la tess planteada en un comenzo de la nvestgacón es válda, po cuanto en el desaollo se demuesta que es efectvamente posble constu un plan paa enfoca las campañas bancaas medante heamentas de datamnng. El capítulo 13 entega tambén otas conclusones mpotantes que se deducen de la nvestgacón. El esto del documento está dvddo como sgue: el capítulo 2 ofece un dagnóstco del poblema de las campañas bancaas, el capítulo 3 defne los objetvos de la nvestgacón (lo cual calza con la pmea etapa de fomulacón de la tess dada en la fgua 1.1). El capítulo 4 entega defncones pevas que se utlzaán en el esto del documento. El capítulo 5 detalla las hpótess de tabajo (lo cual coesponde a la segunda etapa de la tess dada en la fgua 1.1). El capítulo 6 se efee a la metodología que se utlza en la fomulacón del plan de datamnng, junto a las azones paa su eleccón. El desaollo de la tess, tecea etapa en el esquema entegado en la fgua 1.1, se entega en los capítulos 7 al 12. El capítulo 13 coesponde a la cuata y últma etapa de la fgua 1.1 y esume las conclusones de la nvestgacón. Fnalmente el capítulo 14 entega la bblogafía. 16

17 2 DIAGNÓSTICO DEL PROBLEMA A contnuacón se entega la descpcón del negoco de las campañas bancaas en los poductos de líneas de cédto, tajetas de cédto y cédtos de consumo. 2.1 Los poductos Las campañas de consumo bancaas contemplan la pomocón de múltples poductos dgdos a dstntos tpos de mecado. Tes de dchos poductos seán abodados en el pesente estudo: los cédtos de consumo, las tajetas de cédto y las líneas de cédto. Los análss se enfocaán solamente en el mecado de las pesonas natuales sn go, y los cédtos no ncluán péstamos paa pepaga otas deudas. El sguente gáfco muesta el cecmento de los menconados poductos duante los últmos años. Puede obsevase como las cuentas coentes y los cédtos de consumo han mostado un sostendo cecmento, en tanto que el númeo de las tajetas de cédto ha caído: Fgua 2.1 Cecmento de los poductos de consumo bancaos, A contnuacón se descbe el panoama de cada poducto. 3 Fuente: EL DIARIO FINANCIERO, Bancos Salen a la Caza de Nuevos Segmentos paa Rentablza su Negoco, 28/03/

18 2.1.1 Cédtos de consumo Los Bancos utlzan paa coloca sus cédtos de consumo canales tales como el contacto telefónco y el maketng decto, al msmo tempo que medos de publcdad como los avsos en daos, ado y televsón. Algunos Bancos, nvtan a sus clentes a eta en sucusales un péstamo que ya está autozado. Otos, en cambo, han llegado ncluso a hace uso de las llamadas peapobacones automátcas, en vtud de las cuales los ejecutvos llaman a sus clentes paa ofeceles deposta en su cuenta coente un cédto que ya está apobado. Las campañas de cédtos de consumo ncluyen tasas pefeencales, pemos y benefcos Tajetas de cédto Las tajetas de cédto bancaas han enfentado una cecente y dua competenca po pate de las tajetas de etal. Ello queda de manfesto po el hecho de que el númeo total de tajetas bancaas es menos de un teco de los ocho mllones de tajetas emtdas po las multtendas y cadenas de supemecados. Como esultado de dcha competenca el númeo de tajetas de cédto se ha estancado desde el 2003 y los Bancos en espuesta se han vsto oblgados a ealza agesvas campañas. Las colocacones po tajetas de cédto en juno del 2004 epesentaban un nada despecable 23% de los péstamos de consumo totales del sstema fnanceo 4. El objetvo fundamental de los Bancos detás de las campañas de tajetas es el de fdelza al clente. La dea que subyace al concepto de fdelzacón es que el clente utlce en foma más ntensva las tajetas, a la vez que el esto de los poductos bancaos. Como consecuenca de las campañas de fdelzacón ente 1999 y el 2004 el númeo pomedo de tansaccones anuales po tajeta pasó de 16 a Las tajetas bancaas genean ngesos po múltples conceptos, ente ellos la tafa mensual po mantencón que debe paga el clente, al gual que las comsones que debe paga el comecante po cada tansaccón. Genean tambén el cobo de nteeses po dos causas: los montos utlzados de la tajeta, y los montos de las líneas de cédto que son empleadas con el popósto de paga las tajetas. Ello explca po qué exste tanto nteés po pate de los Bancos en ofece ebajas de nteeses o de 4 Fuente: EL DIARIO FINANCIERO, La Nueva Ofensva de los Bancos po Fdelza y Capta Clentes, 20/01/ Fuente: Infome de Establdad Fnancea, Banco Cental, pme semeste

19 pecos con tal de fomenta el uso de las tajetas. Al fn de cuentas los ngesos geneados po mantencones, comsones e nteeses supean las ebajas Líneas de cédto Son un poducto estechamente lgado a las cuentas coentes, las cuales consttuyen el pncpal gancho paa ofece otos poductos bancaos, como las tajetas de cédto o los cédtos de consumo. El sstema fnanceo aumentó su númeo de cuentas coentes sólo 5,25% duante el , cecmento povocado en su mayo pate po la eactvacón en el consumo de la economía. La patcpacón que cada Banco posee sobe el númeo total de cuentas coentes ha sufdo pocas vaacones los últmos años debdo al escaso cecmento del númeo de cuentas coentes y a la fuete competenca en los segmentos de mecado bancazados El 24% de las cuentas coentes las posee el Banco de Chle, poscón seguda muy de ceca po el Banco Santande y po el BCI, que detentan un 16%. Bastante más atás les sguen el Banco Estado, con un 10% y el BBVA, con un 5,5% El mecado En Chle exste un gan númeo de pesonas no bancazadas. De los sete mllones de pesonas que componen la fueza laboal en Chle, sólo 1,3 mllones tenen cuenta coente 8. Chle es uno de los países menos bancazados de Latnoaméca. Es así como mentas en el país exsten 0,1 cuentas coentes po habtante, en Méxco ellas supean las 0,28 y en Basl las 0,45 9. Chle pesenta 0,38 tajetas de débto y cédto po habtante, mentas que Agentna tene un índce el doble mayo, al tempo que Basl alcanza un índce de 0,8 10. En este panoama los Bancos se han esfozado po cece haca los segmentos de menoes ngesos y po compet en ellos con las casas comecales. Con ese popósto han abeto dvsones especalzadas, como es el caso del Santande, el BCI, el BBVA, el Chle, Copbanca, Ctbank y el Banco del Desaollo. Adconalmente los Bancos han hecho alanzas con casas comecales. Tal es el caso 6 Fuente: EL DIARIO FINANCIERO, La Nueva Ofensva de los Bancos po Fdelza y Capta Clentes, 20/01/ Fuente: dem. a la anteo 8 Fuente: dem. a la anteo 9 Fuente: dem. a la anteo 10 Fuente: dem. a la anteo 19

20 del Santande con el Banco Pas, del BancoEstado con D&S, del BCI con Falabella y del Banco Chle con Falabella y Rpley. Es posble dstngu vaos mecados objetvo a los que pueden dgse las campañas de cédtos de consumo, tajetas o líneas de cédto. El pmeo es el conjunto de clentes que poseen cédtos de consumo con el Banco póxmos a expa, o que han sdo pagados en su mayo pate. El segundo mecado está confomado po los clentes que son deudoes del Banco en algún poducto, peo que caecen de alguno de los otos poductos consdeados en este estudo. El tece mecado está consttudo po las pesonas que no son clentes del Banco y que no poseen cédtos de consumo, tajetas n líneas de éste. Exsten, no obstante, muchas dstncones que es posble pecb en los clentes y que los dfeencan pofundamente del esto. Exsten, po ejemplo, clentes que tenen sólo depóstos a plazo en el Banco, otos que tenen cédtos hpotecaos, otos que son empesas o pesonas con go, pofesonales jóvenes, etc. El pesente estudo se ha enfocado sólo en los clentes que son deudoes del Banco en algún poducto y que son pesonas natuales sn go. Po oto lado, se supondá que las campañas a las cuales se aplque el plan descto en este documento no contemplaán cédtos destnados a pepaga otas deudas. Po lo tanto, el estudo se concentaá sólo en los clentes con capacdad paa adqu deudas adconales a aquellas que ya poseen. 2.3 La ndusta Exsten tes gandes Bancos que concentan más de la mtad del total de las colocacones del sstema: el Santande, el Chle y el Estado. Los sguen tes Bancos medanos: el BCI, el BBVA y Copbanca, que en conjunto tenen más de la cuata pate de las colocacones totales. El esto de los Bancos, que pueden con popedad clasfcase como pequeños, tenen en total una cuata pate de las colocacones. Como se mostaá a contnuacón, los gastos opeaconales, las entabldades y las tasas de cecmento de los Bancos dependen fuetemente de su tamaño. El sguente gáfco muesta la patcpacón de mecado sobe las colocacones totales de los dstntos Bancos que componen el sstema fnanceo naconal: 20

21 Fgua 2.2 Pocentaje de patcpacón de las colocacones de los dstntos Bancos del sstema fnanceo chleno, Julo del La sguente fgua compaa los gastos opeaconales de Bancos gandes y pequeños: Fgua 2.3 Compaacón ente Bancos gandes y pequeños de la azón de efcenca (gastos de apoyo ope. / esultado ope.), Fuente: tabla del anexo A, la cual contene datos extaídos de los volúmenes de Julo de los años 2004 y 2005 de la evsta Infomacón Fnancea de la SBIF 12 Fuente: tabla del anexo B, la cual contene datos extaídos de los volúmenes de Julo de los años 2000 al 2005 de la evsta Infomacón Fnancea de la SBIF 21

22 El gáfco anteo ha mostado cómo los Bancos gandes, a excepcón del Banco del Estado, obtenen gastos opeaconales pemanentemente po debajo del pomedo de la ndusta, en tanto que los Bancos pequeños tenen gastos muy supeoes. Ello se explca po las fuetes economías de escala pesentes en el negoco Bancao, lo cual queda eafmado po el hecho de que aun los Bancos medanos pesentan gastos opeaconales consstentemente po debajo de los bancos pequeños, como puede apecase en el sguente gáfco: Fgua 2.4 Compaacón ente Bancos medanos y pequeños de la azón de efcenca (gastos de apoyo ope. / esultado ope.), Tal vez el BBVA escapa un poco a la tendenca de los Bancos medanos, sn embago ello puede explcase po una oentacón patcula haca el negoco hpotecao. Po oto lado, en la ndusta bancaa naconal los mágenes de nteeses, que se genean po la dfeenca ente los nteeses que los Bancos coban po las colocacones y los nteeses que pagan po las captacones, han caído debdo a la fuete competenca, como se evela en el sguente gáfco: 13 Fuente: tabla del anexo B, la cual contene datos extaídos de los volúmenes de Julo de los años 2000 al 2005 de la evsta Infomacón Fnancea de la SBIF 22

23 Fgua 2.5 Evolucón del magen de nteeses del sstema fnanceo chleno como un todo, peodo Ente julo del 2000 y julo del 2005 el magen de nteeses sobe el esultado opeaconal buto bajó desde 80,8% a 73,8% 15, pesentando, po lo tanto, una educcón de un 7% del esultado opeaconal buto. Ello fue más que compensado po la dsmnucón en los gastos opeaconales, que bajaon de un 60,2% a un 51,7% del esultado opeaconal buto (vale dec un 8,5% del esultado opeaconal buto) 16. Esto se ha taducdo en un aumento de la entabldad paa el sstema fnanceo como un todo. No obstante, mentas los Bancos gandes y medanos han bajado sus gastos opeaconales, ese no ha sdo el caso de los Bancos pequeños. La dsmnucón de los mágenes de nteeses tampoco ha afectado a todos los Bancos po gual. El sguente gáfco muesta como los Bancos gandes han bajado en foma constante sus mágenes de nteeses, convegendo haca los mágenes de nteeses de los Bancos pequeños, que no han vaado sgnfcatvamente: 14 Fuente: tabla del anexo C, la cual contene datos extaídos de los volúmenes de Julo de los años 2000 al 2005 de la evsta Infomacón Fnancea de la SBIF 15 Fuente: Revsta Infomacón Fnancea, SBIF, julo del 2000 y julo del Fuente: Revsta Infomacón Fnancea, SBIF, julo del 2000 y julo del

24 Fgua 2.6 Compaacón ente Bancos gandes y pequeños de la azón de magen de nteeses / colocacones, peodo El nvel consstentemente nfeo de los mágenes de nteeses de los Bancos pequeños hace pensa que éstos no son capaces de compet sno ofecendo tasas nfeoes. Ello es estatégcamente peocupante paa los Bancos pequeños po dos motvos: 1.- Claamente los Bancos pequeños no pueden compet po peco (magen de nteeses) con los Bancos gandes, que dsponen de mayoes economías de escala. 2.- Los Bancos gandes muestan una tendenca cecente a dsmnu sus mágenes de nteeses, acecándose a aquellos de los Bancos pequeños, lo que puede ntepetase como una dsmnucón genealzada de los pecos de la ndusta. De esa foma, la dfeencacón po peco de los Bancos pequeños es algo que está en vías de desapaece. Contastando los mágenes de nteeses de los Bancos pequeños y medanos es posble obseva las msmas tendencas anteoes, como se lusta en la fgua 2.7: 17 Fuente: tabla del anexo D, la cual contene datos extaídos de los volúmenes de Julo de los años 2000 al 2005 de la evsta Infomacón Fnancea de la SBIF 24

25 Fgua 2.7 Compaacón ente Bancos medanos y pequeños de la azón de magen de nteeses / colocacones, peodo Una clave paa sobevv pueden dala el BankBoston y el Ctbank, que a pesa de tene un tamaño educdo cuentan con mágenes de nteeses muy po sobe aquellos que pesentan el esto de los Bancos pequeños. Los altos mágenes de nteeses de los dos Bancos antes menconados pueden explcase po su oentacón a un segmento de clentes pefeencales que están dspuestos a paga un peco mayo al de mecado po ecb un sevco dfeencado. De ahí suge un agumento pesente en las hpótess de tabajo sobe las que se basa esta nvestgacón: los Bancos pequeños paa pode compet se ven enfentados a dos posbldades, una de las cuales calza con lo que han logado el BankBoston y el Ctbank, y que consste en focalzase en un ncho de mecado específco donde es posble alcanza mágenes de nteeses (pecos) po sobe los de un mecado compettvo. La ota posbldad paa compet es bastante obva y consste en cece y alcanza po esa vía mayoes economías de escala. La sguente fgua pemte contasta los mágenes de nteeses del Ctbank y del BankBoston con los del esto de los bancos pequeños: 18 Fuente: tabla del anexo D, la cual contene datos extaídos de los volúmenes de Julo de los años 2000 al 2005 de la evsta Infomacón Fnancea de la SBIF 25

26 Fgua 2.8 Compaacón del magen de nteeses sobe colocacones ente Bancos de clentes pefeencales y Bancos pequeños, peodo Las economías de escala paecen afecta no sólo gastos opeaconales y mágenes de nteeses, sno que tambén las entabldades de las nsttucones. En efecto, los gandes Bancos, a excepcón del Banco del Estado, obtenen pemanentemente en el tempo entabldades sobe captal y esevas muy supeoes a aquellas que consguen los Bancos pequeños. El caso del Banco del Estado, sn embago, es enteamente explcable po su ol socal, po lo que sus esultados no nvaldan la obsevacón antes ealzada. En efecto, la baja entabldad del BancoEstado puede explcase debdo a una masva patcpacón en el negoco hpotecao paa la vvenda socal, y en una enome catea de clentes de bajos ngesos, ente otas caacteístcas. S se compaa la entabldad sobe captal y esevas de los Bancos gandes y pequeños, po un lado, y de los Bancos medanos y pequeños, po oto, es posble obseva un patón smla que efueza la convccón de que exsten fuetes economías de escala en el negoco. Los sguentes gáfcos compaan las entabldades sobe captal y esevas de los Bancos pequeños con las de los Bancos gandes y medanos. 19 Fuente: tabla del anexo D, la cual contene datos extaídos de los volúmenes de Julo de los años 2000 al 2005 de la evsta Infomacón Fnancea de la SBIF 26

27 Fgua 2.9 Compaacón de la entabldad sobe patmono de Bancos gandes y pequeños, peodo Fgua 2.10 Compaacón de la entabldad sobe patmono de Bancos medanos y pequeños, peodo Fuente: tabla del anexo E, la cual contene datos extaídos de los volúmenes de Julo de los años 2000 al 2005 de la evsta Infomacón Fnancea de la SBIF 21 Fuente: dem. a la anteo 27

28 Po oto lado, es pecso nota que el sstema fnanceo chleno como un todo ha cecdo duante el peodo , y ello tanto en los poductos hpotecaos, como en las colocacones paa empesas o de consumo, como lo muesta la sguente fgua: Fgua 2.11 Evolucón de las colocacones totales del sstema fnanceo chleno, desglosadas po tpo, peodo No obstante, dcho cecmento no ha sdo homogéneo. No es posble vefca, sn embago, que los Bancos gandes cecean más que los pequeños debdo al apovechamento de sus fuetes economías de escala, po cuanto su cecmento fue mpactado po las gandes fusones ente el Banco Edwads y el Chle, po un lado, y el Banco Santande y el Santago, po oto. A pesa de ello, es posble deduc tal apovechamento de las economías de escala al compaa los Bancos medanos con los pequeños, puesto que el cecmento de los medanos fue mayo duante el peodo En efecto, exceptuando el Secuty, todos los demás Bancos pequeños mostaon un compotamento eátco en el cecmento de sus colocacones, fente a 22 Fuente: tabla del anexo G, la cual contene datos extaídos del volumen de Febeo del 2005 de la evsta Infomacón Fnancea de la SBIF 28

29 un avance sostendo de los Bancos medanos que fnalzó el peodo con tasas po sobe el 10% anual. El cecmento, po lo tanto, tambén muesta evdencas de la exstenca de fuetes economías de escala. La fgua 2.12 pemte constata este hecho: Fgua 2.12 Compaacón del cecmento anual de colocacones de los Bancos medanos y pequeños, peodo Es posble obseva el vínculo que exste ente tamaño y cecmento utlzando una matz del Boston Consultng Goup, en la cual los Bancos se clasfcan en cuato gupos de acuedo a su patcpacón de mecado y a su pocentaje de cecmento. Todos los Bancos gandes pueden clasfcase como vacas lecheas, po cuanto pesentan una alta patcpacón de mecado, supeo al 6%, y un bajo cecmento, nfeo al 15% anual. La totaldad de los Bancos medanos, en tanto, pueden clasfcase como estellas, con un cecmento po sobe el 15% y un pocentaje de patcpacón sobe el total de las colocacones supeo al 6%. Los Bancos pequeños, po su pate, pueden se dvddos en dos gupos: los poco atactvos (BICE, Ctbank y Scotabank), con tasas de cecmento nfeoes al 15% al año; y las ncógntas 23 Fuente: tabla del anexo F, la cual contene datos extaídos de los volúmenes de Julo de los años 1999 al 2005 de la evsta Infomacón Fnancea de la SBIF 29

30 (Secuty, BankBoston y Bco. del Desaollo), con tasas de cecmento sobe el 15%. El sguente gáfco lusta la matz: Fgua 2.13 Matz de cecmento-patcpacón de las colocacones de los dstntos Bancos en Chle, Julo 2004-Julo Hasta el momento se había poddo constata que los Bancos pequeños ean consstentemente menos atactvos que los Bancos medanos o gandes, no obstante ha sugdo una nueva dstncón ente los Bancos pequeños: las ncógntas y los poco atactvos. Paa pode explca las dfeencas en el desempeño ente estos dos gupos de Bancos es pecso nota que estas nsttucones no sólo dfeen po su tamaño, sno que tambén po sus oentacones a dstntos tpos de negocos, mecados y poductos. Dchas oentacones juegan un papel fundamental en las dfeencas de cecmento y de entabldad obsevadas ente los Bancos pequeños. Algunos Bancos están oentados pefeentemente a las pequeñas y medanas empesas, otos, a las colocacones de consumo paa pesonas, y aun otos a los cédtos hpotecaos paa la vvenda. Dchas dfeencas de oentacón se taducen 24 Fuente: tabla del anexo A, la cual contene datos extaídos de los volúmenes de Julo de los años 2004 y 2005 de la evsta Infomacón Fnancea de la SBIF 30

31 dectamente en dfeencas en ngesos, po cuanto cada negoco opea con tasas de nteés muy dstntas. Po oto lado, paa la mayoía de los Bancos naconales el magen de nteeses contbuye al esultado opeaconal buto en más de un 70% 25. El sguente gáfco lusta como las tasas de nteés de las colocacones de consumo paa pesonas natuales (tajetas de cédto, líneas de cédto y cédtos de consumo) supean en mucho a las tasas hpotecaas y a las tasas de los cédtos comecales. Fgua Tasas de cédtos de consumo, hpotecaos y comecales, peodo Es po esta azón que las colocacones de consumo, que epesentan menos del 25% del total de las colocacones del sstema fnanceo 27, contbuyen a los ngesos bancaos en un pocentaje mucho mayo. Es posble clasfca tambén a los Bancos de acuedo a los pocentajes de los ngesos opeaconales que son geneados po nteeses, po comsones o po otos ngesos opeaconales. El sguente dagama lusta esa clasfcacón, pudendo obsevase como los Bancos que muestan los mayoes ngesos pocentuales po concepto de nteeses son aquellos con oentacón a clentes pefeencales (vale dec el 25 Fuente: Revsta Infomacón Fnancea, SBIF, Julo Fuente: tabla del anexo H, la cual contene datos extaídos de los volúmenes del 2005 del Infome de las Tasas de los Pncpales Poductos de Consumo de la SBIF y del Infome de Mutuos Hpotecaos Endosables de la SBIF 27 Fuente: Revsta Infomacón Fnancea, SBIF, Julo

32 BankBoston y el Ctbank). Po oto lado, los Bancos más oentados a los cédtos hpotecaos, vale dec el BBVA y el BancoEstado, son aquellos con menoes contbucones de los nteeses al esultado opeaconal. Fgua 2.15 Julo Composcón del magen opeaconal buto de los dstntos Bancos, En la fgua 2.16 dada más adelante se gafcan los pocentajes que epesentan los dvesos tpos de cédto sobe el total de colocacones de cada Banco. Los Bancos pueden clasfcase en cuato gupos en base a dcha fgua: A, B, C y D. Las nsttucones del gupo A, que no son otas que los Bancos de las casas comecales, se oentan pefeentemente a las colocacones de consumo. El gupo B, en tanto, aglutna fundamentalmente a los Bancos gandes y medanos, y en él las colocacones de consumo epesentan menos del 25% del total, al tempo que las colocacones paa empesas se ubcan ente el 50% y el 70%. El gupo C ncluye a pequeños Bancos 28 Fuente: tabla del anexo I, la cual contene datos extaídos del volumen de Julo del 2005 de la evsta Infomacón Fnancea de la SBIF 32

33 oentados a las colocacones de consumo, que supean el 25% del total. El gupo D ncluye a la mayoía de los Bancos pequeños, los cuales se enfocan fundamentalmente en ofece cédtos a las empesas. Fgua 2.16 Pocentaje de los dstntos tpos de cédtos sobe el total de colocacones de cada Banco, Febeo Cabe nota que los Bancos del gupo C calzan cas pefectamente con los Bancos poco atactvos de la matz de cecmento/patcpacón. Ello debea se patculamente peocupante, puesto que los Bancos de las casas comecales son especalstas en cédtos de consumo, y su mpotanca y patcpacón en el negoco se ncementa día a día. Ante tal escenao el futuo paa los Bancos del gupo C se augua poco auspcoso, a menos que se enfoquen en nchos de mecado específcos, como lo ha hecho el Ctbank. 29 Fuente: tabla del anexo J, la cual contene datos extaídos del volumen de febeo del 2005 del Infome de Colocacones po Actvdad Económca de la SBIF, y del volumen del 2005 del Infome de Mutuos Hpotecaos Endosables de la SBIF 33

34 Como la sguente fgua lo consgna, la oentacón de cetos Bancos los hace apaece ente los Bancos medanos en el ankng de colocacones de consumo, a pesa de tatase sólo de Bancos pequeños en témnos de colocacones totales. Tal es el caso del Scotabank y del Ctbank. Resulta notoa tambén la pesenca en el ankng de los Bancos de las casas comecales, que ya supean a muchos Bancos pequeños en cuanto a colocacones de consumo. Claamente se avecnan días dfícles paa los Bancos del gupo C que no consgan dfeencase, poducto de una pevsble dua competenca po pate de los Bancos de las casas comecales. Fgua 2.17 Rankng de Bancos po colocacones de consumo, Febeo Las dfeencas ente los Bancos gandes y pequeños muestan que el negoco bancao está domnado po fuetes economías de escala. Ante dcho escenao esulta 30 Fuente: volumen de febeo del 2005 del Infome de Colocacones po Actvdad Económca de la SBIF 34

35 mpescndble paa los Bancos pequeños cece o enfocase en nchos de mecado susceptbles de se atacados con sevcos dfeencados. 2.4 La tecnología Fente a la dua competenca los Bancos naconales están nvtendo mllones de dólaes en sstemas computaconales capaces de dentfca las necesdades de los clentes y elaboa lo que se conoce como segmentacón ntelgente. El objetvo de la segmentacón ntelgente no es el de entega más poductos y sevcos, sno que de entega lo que necesta cada clente. El Banco de Chle ha nvetdo US$ 50 mllones en el poyecto Plan Neos, platafoma tecnológca que compatblzaá mayoes tmos de cecmento con mejo caldad de sevco, además de mayo apdez paa cea poductos nuevos y dsmnucones en los costos. La segmentacón ntelgente pemtá aumenta la poductvdad paa enfenta la caída de los mágenes de nteeses en la ndusta. Los Bancos BBVA y Santande ya cambaon sus platafomas tecnológcas paa enta a la smat customzaton, mentas que el Secuty y el Ctbank están tabajando en ello. Páctcamente nngún banco chleno sgue segmentando a sus clentes bajo el cteo de enta y pomedo de opeacones sn atende a las eales necesdades fnanceas de las pesonas. Exsten dsponbles en el mecado heamentas de datamnng ofecdas po gandes poveedoes de softwae, como son el IBM DB2 Intellgent Mne, el Oacle Data Mnng, y el Compute Assocates ClevePath Pedctve Analyss Seve 3.0. No obstante, las heamentas lídees de datamnng son el Entepse Mne 5.1 de SASS y Clementne 8.5 de SPSS 31. En el pesente estudo se lusta cómo es posble constu modelos de datamnng utlzando Clementne. 2.5 Enfoques de las campañas bancaas La alta competenca ente los bancos naconales los ha mpulsado a mplementa CRMs analítcos capaces de oenta las campañas de consumo en foma altamente sofstcada haca las necesdades de los clentes. Al msmo tempo, sstemas de nfomacón conectados a datawaehouses han hecho posble detemna hasta qué punto pueden extendese en foma entable las condcones de las ofetas. Ello ha dado 31 Fuente: Data Mnng Tools, METAspectum Maket Summay, META Goup, Septembe 2004, 35

36 luga a campañas bancaas concebdas como una heamenta estatégca clave, y puede hablase con popedad de que en su dseño exste una oentacón o un enfoque estatégco. No obstante, dcho enfoque convve con otos que poseen Bancos caentes de foco y ldeazgo, nsttucones abocadas pncpalmente a cumpl los compomsos del día a día. Los enfoques asocados a tales nsttucones pueden denomnase opeaconales. La entada al mecado bancao de las multtendas, con la consguente masfcacón de los sevcos bancaos haca el segmento soco-económco C3 ha tansfomado el negoco fnanceo en una actvdad donde las economías de escala son claves paa establece una ventaja compettva sostenble en el tempo. A pesa de lo antes menconado, junto a los gandes Bancos convven en la ndusta naconal nsttucones que poseen una pequeña patcpacón de mecado, y que po su tamaño no pueden compet en el negoco masvo. Como se ha menconado al fnal de la seccón 2.3, es mpescndble paa dchos Bancos cece o escoge un ncho de mecado patcula. No obstante, y paadójcamente, el tamaño de tales nsttucones no justfca una nvesón en un datawaehouse, n en costosos CRMs analítcos. Como esultado, el Áea Comecal de tales empesas al ntenta focalzase no se ve apoyada po sstemas nfomátcos, y ante la pesón po cumpl metas debe enunca po completo a cumpl dcho objetvo. Adconalmente, un tamaño lmtado en el negoco bancao oblga a educ los costos al máxmo, destnando los ecusos pefeentemente a las actvdades esencales en el coto plazo, vale dec, las actvdades opeaconales de otogamento de cédto. Es así como suge en los bancos pequeños el pelgo de aboda su gestón con un enfoque más opeaconal que estatégco. A contnuacón se dan mayoes detalles sobe ambos enfoques u oentacones, el estatégco y el opeaconal: Oentacón opeaconal El enfoque opeaconal juega en conta de la defncón e mplementacón de una estatega comecal focalzada, en la medda que hace que la oganzacón se estanque en la esolucón de opeacones del día a día y en la dscusón de pequeños temas que consumen todo su tempo. Po oto lado, un esquema de comuncacón con un enfoque opeaconal está dseñado paa evta faudes, po lo que establece un gan númeo de 36

37 nveles jeáqucos, cada uno con atbucones de otogamento de montos de cédto mayoes. Bajo tal esquema la comuncacón ente pesonas de dfeentes nveles jeáqucos es dfícl o nexstente. Dcha foma de tabaja, deal paa contola el péstamo de dneo, dfculta la comuncacón ente áeas y la nnovacón, mpescndbles paa mplementa campañas efcaces. Es posble que un Banco pequeño caga en la tampa de ealza sus campañas con un enfoque opeaconal, en cuyo caso el Áea Comecal y el Áea de Resgo de Cédto ealzaán su labo descoodnadamente. Es pobable que el Áea Comecal defna su popo plan paa oenta las campañas, sn tene pesente consdeacones de esgo. A su vez, es tambén pobable que el Áea de Resgo de Cédto defna cteos de esgo aceptables, peo sn mezclalos con los cteos del Áea Comecal. Bajo un enfoque opeaconal es pobable que las campañas opeen de una foma descta po los sguentes puntos: 1.- El Áea Comecal defne paámetos comecales paa cada uno de los poductos (como la edad de los clentes que seán consdeados, los montos mínmos y máxmos de las ofetas, el segmento socoeconómco y en geneal el pefl de los clente-objetvo desde un punto de vsta comecal). 2.- Luego de defndos dchos paámetos, el Áea Comecal solcta al Áea de Resgo de Cédto la geneacón de una base de campañas con montos peapobados. 3.- La labo del Áea de Resgo de Cédto es la de aplca fltos sobe los clentes potencales de manea de descata aquellos que no cumplen con cetas polítcas de esgo (tales como edad mayo a 70 años; posee deuda moosa, vencda o castgada en el egsto de deudas de la SBIF; posee cheques u otos documentos potestados en el Boletín de Infomes Comecales; posee un ngeso nfeo a un valo detemnado; tene un Dcom scoe nfeo a un mínmo; tene índces de endeudamento hpotecao y no hpotecao acodes con los límtes máxmos defndos, etc.). 4.- El Áea de Resgo de Cédto calcula paa cada clente el monto que es posble ofece en confomdad a las polítcas de cédto. En dcho cálculo en nngún momento se consdea la pédda espeada asocada al péstamo ofecdo a cada clente, po 37

38 cuanto bajo un esquema opeaconal no exsten fomas de calcula la pobabldad de pédda de los péstamos dgdos a cada clente ndvdual. Como esultado de los cuato puntos anteoes, y de la descoodnacón exstente ente el Áea Comecal y el Áea de Resgo de Cédto, las campañas bancaas se ealzaían sn segmenta a los clentes po cteos de esgo y entabldad potencal. Así, se entegaía una ofeta estánda a todos los clentes que cumplesen con los cteos de esgo defndos po el Áea de Resgo de Cédto. Se ha menconado que un Banco que ealza sus campañas con un enfoque opeaconal no dspone de fomas de estma la pobabldad de pédda de los péstamos asocados a cada clente. Ello obedece a que nomalmente los Bancos utlzan las povsones paa estma dchas pobabldades. No obstante, las povsones se calculan a pat de las péddas espeadas de gupos en vedad muy gandes de clentes, y en consecuenca consttuyen malas estmacones de las pobabldades de pédda vnculadas a cada clente ndvdual. De esa foma, un Banco que ealza sus campañas con un enfoque opeaconal no puede calcula apopadamente la pédda total espeada de una campaña, y en consecuenca tampoco puede calcula el nvel de esgo que asume al ealza una. Sn dspone de una foma de med en foma cetea el nvel de esgo de una campaña, malamente un Banco podá aumenta los montos ofecdos a sus clentes sujeto todo ello a la satsfaccón de un ceto nvel de esgo. Un enfoque opeaconal consttuye una foma pensa, de enfenta los poblemas y de toma decsones, y suge como consecuenca de años de expeenca en el manejo de opeacones que deben se esueltas en cuestón de mnutos. Dcho enfoque ofece una vsón bastante lmtada de los poblemas, al ntenta enconta solucones nmedatas, sn asgna tempo a descub y esolve las causas de fondo. Bajo un enfoque opeaconal exste una dvsón del tabajo en la cual hay quenes toman las decsones y defnen la estatega, y quenes son smples entes ejecutoes de dchas decsones y estategas. En tal escenao un pofesonal que tate de ealza datamnng puede vese del todo ncapactado, s no se le hace patícpe de las decsones, n de los motvos de dchas decsones. La sguente fgua muesta como un esquema de comuncacón opeaconal, deal paa contola el péstamo de dneo, se vuelve napopado en un poyecto de datamnng, al mped a un pofesonal que 38

39 ntenta desaolla mneía de datos el accede a la nfomacón necesaa paa dcha labo: Fgua 2.18 Enfoque opeaconal de comuncacón en un poyecto de datamnng 32 La labo comecal y de maketng es ntínsecamente no opeaconal, puesto que exge conoce las necesdades de los clentes, ponostca su compotamento futuo y detecta opotundades de negocos a pat de señales. Todo ese conocmento, valoso en extemo, es dfícl de se tansmtdo de ota foma que medante la nteaccón caa a caa del pofesonal que tata de ealza datamnng con los pofesonales del Áea Comecal. No obstante, el esquema de comuncacón del enfoque opeaconal mpde dcha nteaccón. Al vv en un ambente de ápdos cambos tecnológcos la foma de esolve poblemas no necesaamente debe se la msma que en el pasado. No obstante, la costumbe adquda a lo lago de años de tata temas opeaconales de una detemnada foma 32 Fuente: elaboacón popa 39

40 consttuye una fuente mpotante de neca. Es posble ncluso agumenta que las cosas deben hacese de un modo patcula poque la expeenca dce que deben hacese así, sn atende a mayo azonamento n análss. El enfoque opeaconal conduce a una ceta foma de aoganca en mateas de conocmento. En efecto, al no se capaz de ve más allá de los poblemas nmedatos, las causas nmedatas y las solucones nmedatas, exste la tendenca a cee que todo lo que se ve es todo lo que es necesao sabe. Dcha ceenca de sabelo todo consttuye una enome baea al apendzaje, a la nnovacón y al espítu cítco, apttudes que son todas fundamentales paa pode mejoa cualque poceso de negocos. El enfoque opeaconal nace del tabajo con pocedmentos defndos, con estándaes de espuesta claos, como en una cadena de ensamblaje donde cada opeao sabe ben qué debe hace y le coesponde hace exactamente eso, n un ápce más n un ápce menos. El enfoque opeaconal no se ajusta ben a pocesos que vven una etapa de gandes cambos, donde los estándaes del pasado ya no son váldos, o dónde los pasos a segu no están claos y deben se edefndos. Efectos anexos del enfoque opeaconal son el concenta un númeo excesvo de funcones en unas pocas pesonas, al cea ncentvos paa que algunos acumulen conocmento clave del negoco sn compatlo con otos, y sn que nade pueda ejecuta dchas funcones salvo ellos. El enfoque opeaconal, deal paa evta faudes y paa contola el esgo de los péstamos de dneo, puede mped la ealzacón de datamnng y con ello puede dfculta a un Banco cece y ealza buenos negocos Oentacón estatégca Bajo un enfoque estatégco debea se posble dg ofetas dstntas a dfeentes segmentos de esgo y entabldad potencal. Con una oentacón estatégca tambén debea obsevase coodnacón y comuncacón fluda ente el Áea Comecal y el Áea de Resgo de Cédto, po lo que ambas áeas debean tabaja undas en la defncón conjunta de una segmentacón de los clentes en base a cteos de esgo y entabldad. Paa mplementa dcha segmentacón seía necesao conta con fomas de estma el nvel de esgo de los clentes y su entabldad potencal. Dchas estmacones claamente no debean basase en defncones abtaas de puntajes, 40

41 sno que en pobabldades de que los clentes se tansfomaan en el futuo en malos en témnos cedtcos, o en pesonas sn gan entabldad potencal. Una segmentacón semejante utlzaía el conocmento que el Banco posee sobe las caacteístcas de sus clentes en mejo foma que el enfoque opeaconal. 41

42 3 OBJETIVOS DE LA INVESTIGACIÓN El objetvo pncpal de la nvestgacón es da un ejemplo de cómo medante heamentas de datamnng puede elaboase un plan paa enfoca las campañas en un Banco pequeño que caece de un datawaehouse, de manea de pemt a la nsttucón segmenta a sus clentes y cece. Se petende mosta como a pat de bases de datos opeaconales de un Banco es posble constu modelos pedctvos del compotamento de esgo de los clentes y de su entabldad potencal, y cómo dchos modelos pueden calcula puntajes de esgo y de entabldad paa los dstntos clentes. Se desea mosta cómo es posble a pat de dchos puntajes clasfca a los clentes en dstntos segmentos de esgo y entabldad y cómo es posble enfoca las campañas bancaas dgendo ofetas dfeencadas a cada uno de aquellos segmentos. Del msmo modo, se desea lusta como medante los modelos pedctvos antes menconados un Banco puede cece satsfacendo un nvel mínmo de esgo. Po lo tanto, objetvos secundaos de la nvestgacón son los sguentes: Objetvo s1: Mosta como a pat de bases de datos opeaconales de un Banco es posble constu un modelo pedctvo del esgo cedtco de sus clentes, el cual debe calcula un puntaje de esgo paa cada ndvduo. Objetvo s2: Mosta como a pat de bases de datos opeaconales de un Banco es posble constu un modelo pedctvo de la entabldad potencal de sus clentes, el cual debe calcula un puntaje de entabldad paa cada ndvduo. Objetvo s3: Mosta cómo es posble clasfca a los clentes en dstntos segmentos de esgo y entabldad potencal, y cómo es posble dg una ofeta dfeencada paa cada uno de esos segmentos. Objetvo s4: Mosta cómo un Banco puede cece satsfacendo un nvel mínmo de esgo, utlzando paa ello puntajes calculados po modelos pedctvos de esgo de cédto y de entabldad potencal de los clentes. El objetvo del pesente tabajo no consste en elaboa modelos pedctvos específcos de la entabldad de los clentes n de su desempeño cedtco. El objetvo, en cambo, se centa en la descpcón genéca de cómo es posble elaboa un plan paa que un 42

43 Banco pequeño constuya e mplemente modelos de datamnng que le ayuden a enfocase en nchos de mecado. Po ello, las ndcacones que se entegan son genécas, puamente conceptuales, no están dgdas a nngún Banco específco y no se basan en nngún conjunto de datos de nngún gupo de pesonas. 43

44 4 DEFINICIONES PREVIAS Dado que el tema de esta tess ga en tono a la utlzacón de datamnng en las campañas bancaas y a un plan paa constu modelos, es pecso pmeo que nada da una defncón de los témnos datamnng y modelo. 4.1 El témno datamnng o mneía de datos A contnuacón se entegan algunas defncones tomadas de la lteatua: Data Mnng (1) The pocess of utlzng the esults of data exploaton to adjust o enhance busness stateges. It bulds on the pattens, tends, and exceptons found though data exploaton to suppot the busness. It s also known as data havestng. (2) A technque usng softwae tools geaed fo the use who typcally does not know exactly what he s seachng fo, but s lookng fo patcula pattens o tends. Data mnng s the pocess of sftng though lage amounts of data to poduce data content elatonshps. Ths s also known as data sufng 33. Data Mnng, as we use the tem, s the exploaton and analyss, by automatc o semautomatc means, of lage quanttes of data n ode to dscove meanngful pattens and ules 34. Usng advanced technques n mathematcs and atfcal ntellgence, data mnng uncoves complex pattens o models n data. Those models ae then used to help solve busness poblems that come up n dect maketng, cedt-sk evaluaton, faud detecton and othe aeas 35. Data mnng uses sophstcated statstcal analyss and modelng technques to uncove pattens and elatonshps hdden n oganzatonal databases pattens that odnay methods mght mss Fuente: Data Waehousng Technology Glossay, Appled Technology Goup, Fuente: BERRY, M. J. A., LINOFF, G., Data Mnng Technques fo Maketng, Sales, and Custome Suppot, John Wley & Sons, Inc., Fuente: WILSON, L., Canadan Bank Mnes fo Gold, Computewold, Fuente: Intoducton to Data Mnng and Knowledge Dscovey, Two Coss Copoaton,

45 Data Mnng [s] the pocess of effcent dscovey of nonobvous valuable nfomaton fom a lage collecton of data 37. El común denomnado en todas las defncones es el descubmento de elacones útles en gandes conjuntos de datos. La defncón del concepto de datamnng que se utlzaá en este documento es la de un conjunto de técncas aplcadas al poceso de extaccón y pesentacón de conocmento que yace mplícto en gandes conjuntos de datos, que es desconocdo y útl en témnos de negocos, y que pemte pedec en foma automatzada el compotamento de los clentes. En una de las efeencas se ha utlzado el témno modelo en el sentdo de un complejo patón de elacones pesentes en los datos, al tempo que se ha menconado que el popósto del datamnng seía descub tales patones. En ota defncón se ha menconado que paa descub dchos patones se utlzan técncas de modelamento. A contnuacón se entegaán defncones de los menconados conceptos de modelo y de técncas de modelamento. 4.2 El témno modelo Se entende po modelo de datamnng, o smplemente po modelo, a un algotmo constudo a pat de una muesta de datos y que pemte ealza estmacones o pedccones sobe otos datos, dstntos de aquellos de la muesta antes menconada, peo smlaes. Un modelo, como todo algotmo, puede po lo tanto se mplementado medante un sstema nfomátco o un pogama computaconal. No obstante, un modelo puede tambén se vsto como una funcón matemátca que descbe la elacón ente un conjunto de campos o vaables pesentes en los datos. Las estmacones o pedccones sobe otos datos son obtendas medante la menconada funcón. Sn embago, dado que una funcón matemátca no sempe puede se expesada en foma explícta, es más apopado conceb a un modelo como el algotmo que pemte calcula dcha funcón. Medante dcho algotmo un modelo pemte epesenta cualque complejo patón de elacones pesentes en los datos. En el pesente nfome los modelos tendán po popósto pedec s un clente bueno se tansfomaá en malo en un hozonte detemnado de tempo, y s un clente en el futuo se tansfomaá en alguen con sn entabldad potencal o no. 37 Fuente: BERSON, A., SMITH S. J., Data Waehousng, Data Mnng, and OLAP, McGaw-Hll,

46 4.3 Defncón del concepto de técnca de modelamento Se entende po técnca de modelamento a una foma patcula de especfca un modelo, ncluyendo el conjunto de supuestos asocados a dcha foma de especfcacón. Así, algunas técncas de modelamento coesponden a una ecuacón matemátca ente un conjunto de vaables, más un conjunto de supuestos sobe dchas vaables. Tal es el caso de técncas de modelamento como la egesón lneal y la egesón logístca. Otas técncas de modelamento, en cambo, coesponden más ben a algotmos que calculan un esultado a pat de los valoes de un conjunto de vaables. Tal es el caso de técncas de modelamento como las edes neuonales y los áboles de decsón. Las edes neuonales obtenen dcho esultado a pat de funcones no lneales, ya sea escalonadas o sgmodales, aplcadas sobe los valoes de las vaables. Los áboles de decsón obtenen el esultado medante funcones lógcas del tpo f then else. Clementne pemte constu modelos con una ampla gama de técncas de modelamento, ncluyendo las menconadas. La seccón 10.1 descbe las tes técncas de modelamento que más se ajustan al poblema de enfoca las campañas bancaas (egesón logístca, edes neuonales y áboles de decsón). 4.4 Defncón del concepto de poyecto de datamnng Un poyecto de datamnng coesponde al conjunto de actvdades concetas que se ealzan po pate de una nsttucón detemnada con el fn de elaboa modelos que petenden descub patones en un conjunto de datos específcos. Un poyecto de datamnng paa enfoca las campañas bancaas, po lo tanto, debe se llevado a cabo po un Banco, debe ealzase sobe el conjunto de datos específcos de los clentes de ese Banco, y debe consta de actvdades que efectvamente tengan luga dento de las laboes de dcho Banco. Un poyecto de datamnng, po lo tanto, es algo eal, tangble en témnos de plazos ncudos, costos en dneo nvolucados, ecusos computaconales específcos utlzados y pesonas que han patcpado o patcpan en él. A dfeenca de un plan de datamnng, un poyecto de datamnng no es una smple elaboacón conceptual, puesto que se efee a algo que ha ocudo, o que tene luga efectvamente en la hstoa cotdana de una empesa. 46

47 4.5 Defncón del concepto de plan de datamnng En contaposcón al concepto dado pevamente, un plan de datamnng es un conjunto de actvdades conceptuales dseñadas paa gua un poyecto de datamnng. S ben un plan de datamnng debe contempla plazos, pesupuesto y pesonas asgnadas, dchos elementos no coesponden a algo que tene o ha tendo luga, sno que smplemente son estmacones de lo que debea ocu en un poyecto de datamnng. Mentas un poyecto de datamnng tene vda en la hstoa eal, cotdana de una empesa, un plan de datamnng no exste más que en el papel. El pesente documento descbe cómo constu un plan de datamnng paa enfoca las campañas de un Banco en los poductos de cédtos de consumo, tajetas y líneas de cédto. Las ndcacones de este documento pueden taducse en un plan de datamnng conceto paa un Banco específco, no obstante paa ello es pecso defn plazos, pesupuesto, pesonas y ecusos a utlza. La mplementacón de dcho plan puede a su vez taducse en un poyecto de datamnng, medante la ejecucón de cada una de las actvdades establecdas en el plan. 47

48 5 HIPÓTESIS DE TRABAJO Como se ha menconado en el capítulo que vesa sobe los objetvos de esta nvestgacón, el pesente documento elaboa un plan de datamnng que no está dgdo a nngún Banco específco y que, po lo tanto, no se basa en nngún conjunto de datos de nngún gupo de pesonas. En ausenca de datos específcos sobe los cuales basase, el pesente tabajo se fundamenta en un conjunto de supuestos, los cuales se detallan en este capítulo. Es pecso consdea, po ende, que las conclusones de esta nvestgacón seán váldas sólo en la medda que se cumplan dchos supuestos. 5.1 Supuestos sobe dsponbldad de nfomacón El plan de datamnng planteado supone que el Banco no posee un datawaehouse y no puede po lo tanto dspone de nfomacón hstóca masva sobe sus clentes que se emonte a vaos años. De esa foma los modelos de datamnng sólo pueden almentase de bases de datos opeaconales y de sus espaldos en cntas. Es po ello que la pncpal hpótess de tabajo que se emplea en la pesente nvestgacón consste en da po hecho el que exste un conjunto de bases opeaconales que cualque Banco debe posee y que poveen de nfomacón necesaa y sufcente paa ealza los estudos de datamnng planteados. El capítulo 8 descbe la nfomacón que contenen dchas bases opeaconales, a las cual se denomna fuentes de datos y que coesponden a las sguentes: Infome de la SBIF, Infome D01 envado a la SBIF, Saldos el día de envío del D01, Poductos, Saldos actuales, Rentas de clentes, Caacteístcas demogáfcas, Factoes estmados de caga y fnalmente Ingesos contables po clente. Todos esas bases de datos poveen de nfomacón actualzada sobe las opeacones y los clentes del Banco, a excepcón de la fuente de datos Saldos el día de envío del D01, la cual coesponde a una foto de las bases de datos opeaconales el día de envío del nfome D01 a la SBIF hace dos meses. A pate de la nfomacón povsta po todas las bases opeaconales antes menconadas, y que contene todas las vaables necesaas paa pedec en el momento el compotamento de esgo y de entabldad futuos de los clentes, es pecso tambén posee la msma nfomacón peo de un peodo de un año atás. Ello es necesao no con el fn de utlza los modelos pedctvos, sno que con el fn de elaboalos. A tal especto, una hpótess de tabajo consste en da po hecho el que es 48

49 posble escata los espaldos de cntas con la nfomacón de un año atás de todas las fuentes de datos. Los supuestos sobe dsponbldad de nfomacón son utlzados en el capítulo 9, al momento de descb la obtencón del conjunto de datos necesao paa constu modelos de datamnng de esgo y entabldad (output 3z.1). Dchos supuestos son utlzados tambén en el capítulo 10, al deva la especfcacón de los modelos popuestos y comenta el conjunto de vaables empleadas en ellos (output 4c.3). 5.2 Supuestos tecnológcos No se ealzan supuestos con especto a los poveedoes de las bases de datos opeaconales, puesto que la heamenta de datamnng usada en esta nvestgacón (Clementne) se ajusta po gual a una ampla gama de bases de datos (Sybase, Oacle, DB2, SQL Seve, Access, Fox Po, bases de texto, bases de datos en COBOL, etc.), las cuales pueden esd en una ampla vaedad de platafomas (Wndows NT, Unx, Lnux, AS400, etc.). Un supuesto mpotante, en cambo, se ealza con especto a la dsponbldad de Clementne en la Insttucón fnancea, lo cual sgnfca un costo de unos US$ po lcenca. 5.3 Supuestos sobe el maco egulatoo Se supone que exste un conjunto mínmo de bases de datos que cualque banco debe fozosamente posee y cuya utlzacón no vola el seceto bancao y está en confomdad con las leyes y eglamentos que gen a la Banca. Muy en patcula se supone que la base de datos con las deudas consoldadas de de chlenos que elaboa mensualmente la SBIF puede se usada po los Bancos sn necesdad de ped la autozacón a nnguna pesona (dcha base de datos coesponde a la fuente de datos denomnada Infome de la SBIF, descta en el capítulo 8). Se supone que no exste una legslacón antdscmnacón que ja el otogamento de cédto, y que mpda basa la toma de decsones en caacteístcas de los clentes tales como el sexo, la edad, la pofesón, la comuna de esdenca, u otas. A tal especto es pecso señala que la legslacón amecana contempla leyes antdscmnacón de ese tpo, po lo que en los Estados Undos los modelos pedctvos de compotamento de 49

50 cédto no pueden nclu caacteístcas como el sexo o el gupo étnco. Se supondá no sólo que dcha legslacón no exste en Chle, sno que tampoco exstá en el medano plazo. 5.4 Supuestos de negocos En esta nvestgacón se supondá que un Banco pequeño en el ambente compettvo actual vgente en Chle tene sólo dos altenatvas paa sobevv: enfocase en nchos de mecado específcos o cece. Dcho supuesto se fundamenta, en pme témno, en el hecho de que el mecado bancao chleno es una ndusta con fuetes economías de escala, como ha quedado demostado en el capítulo 2 al compaa los mágenes de nteeses, gastos opeaconales, tasas de cecmento y entabldades de los Bancos gandes, medanos y pequeños. En segundo luga, dcho supuesto se fundamenta en la pesstente tendenca a la baja que muestan los mágenes de nteeses de los Bancos gandes y medanos, undo todo ello al hecho de que la mayoía de los Bancos pequeños cuentan con mágenes de nteeses po debajo de aquellos de sus competdoes. Ello puede se ntepetado como una dsmnucón genealzada de pecos po pate de los Bancos gandes y medanos en un ambente en donde la mayoía de los Bancos pequeños compten po peco. Claamente no es posble paa los Bancos pequeños compet po peco con nsttucones que poseen mayoes economías de escala, y po lo tanto sugen dos posbldades paa ellos: adqu mayoes economías de escala medante cecmento o aumenta los pecos medante un sevco dfeencado dgdo a nchos de mecado específcos. En tece luga, el supuesto de que un Banco pequeño tenga como úncas altenatvas paa sobevv el enfocase en nchos o cece encuenta sustento en la obsevacón de que las nsttucones focalzadas en clentes pefeencales puedan mantene mágenes de nteeses consstentemente po sobe los del esto de la ndusta (como es el caso del Ctbank y del BankBoston). Los supuestos antes desctos son utlzados en el capítulo 7, al momento de defn los objetvos de negocos del poyecto de datamnng (output 1a.2), y que son pecsamente focalzase en nchos de mecado y cece sujeto a un nvel mínmo de esgo. A la luz de los supuestos ealzados, los objetvos de negocos planteados paa el poyecto adqueen sentdo estatégco y no son smplemente metas abtaas. 50

51 Po oto lado, un supuesto de negocos adconal lo consttuye el que el pesente estudo se enfoque sólo en los clentes deudoes del Banco en algún poducto y sólo en las pesonas natuales sn go. Del msmo modo, se da po hecho que las campañas a las cuales se aplque el plan descto en este documento no contemplaán cédtos destnados a pepaga otas deudas. No se consdeaán, en consecuenca, ofetas paa los poductos denomnados cédtos de ecclaje n cédtos gúa, y que están destnados espectvamente a pepaga cédtos de la popa nsttucón o de otas nsttucones. Po lo tanto, como se ha menconado en la seccón 2.2, el estudo se concentaá sólo en los clentes con capacdad paa adqu deudas adconales a aquellas que ya poseen. Estos supuestos son utlzados en el capítulo 7, al momento de defn los conceptos de clente malo desde un punto de vsta cedtco y de clente sn gan entabldad potencal. Muy en patcula, el hecho de deja fuea de las campañas a las pesonas sn capacdad de adqu nuevas deudas se usa paa clasfca como sn entabldad potencal a ese tpo de clentes. 5.5 Supuestos opeaconales Se supone que el pesente plan de datamnng se elaboa paa un Banco pequeño que ealza sus campañas con un enfoque opeaconal smla al descto en el capítulo 2. Se supondá que el Áea Comecal y el Áea de Resgo de Cédto ejecutan su labo descoodnadamente: defnendo la pmea su popo plan paa oenta las campañas, peo sn tene pesente consdeacones de esgo, y establecendo la segunda cteos de esgo aceptables, peo sn mezclalos con aspectos comecales. En consecuenca se supondá que las campañas bancaas se ealzan entegando una ofeta estánda a todos los clentes que cumplen con cetos cteos de esgo, sn segmenta po esgo y entabldad potencal. Se supondá tambén que bajo un esquema opeaconal no exsten modelos capaces de calcula la pobabldad de pédda de los péstamos dgdos a cada clente, o en el mejo de los casos dcha pobabldad se estma a pat de las povsones asgnadas a cada catea de clentes. No obstante, dado que las povsones se calculan a pat de las péddas estmadas de gandes cateas de clentes, ellas no consttuyen, po lo tanto, una buena estmacón de la pobabldad de pédda asocada a cada clente ndvdual. En consecuenca, las povsones no pemten calcula en foma pecsa la 51

52 pobabldad de pédda asocada al monto total ofecdo en una campaña. En ausenca de un modelo capaz de med adecuadamente el nvel de esgo de una campaña po la vía de estma la pédda asocada al monto ofecdo en ésta, un Banco no podá aumenta los montos ofecdos sujeto todo ello a la satsfaccón de un ceto nvel de esgo. En la seccón 11.1 se mostaá como los supuestos opeaconales antes desctos hacen posble conclu que el plan de datamnng planteado en este documento pemte efectvamente que un Banco pueda cece. Ello se debe a que un Banco al ealza sus campañas con un enfoque opeaconal lmta sus posbldades de cecmento. Como se veá en la msma seccón 11.1, el plan de datamnng planteado en este documento pemte a un Banco pequeño supea esas lmtacones. 52

53 6 METODOLOGÍA DE TRABAJO Un poyecto de datamnng, como todo poyecto, equee de la aplcacón de una ceta metodología estuctuada paa obtene esultados extosos. La utlzacón de una metodología faclta la planfcacón y deccón del poyecto, pemtendo ealza un mejo segumento del msmo. A contnuacón se descben las pncpales metodologías que se pueden emplea en la elaboacón del pesente plan paa enfoca las campañas bancaas, menconando sus fotalezas y debldades, paa luego detalla las azones po las que se escogó CRISP-DM en esta nvestgacón. 6.1 Metodologías de datamnng Las pncpales metodologías de planfcacón de poyectos de datamnng son SEMMA y CRISP-DM, y se basan en la dvsón del poyecto de datamnng en fases. Son en ceta foma smlaes al modelo espal del cclo de vda de desaollo de softwae Metodología SEMMA Es una metodología de datamnng desaollada po SAS. Su nombe coesponde a las ncales de sus cnco fases pncpales (Sample, Exploe, Modfy, Model, Assess), las cuales se detallan a contnuacón: Fase de muesteo: La pmea fase extae una muesta epesentatva de la poblacón que se petende estuda y sobe la cual se ealzaá el análss. La epesentatvdad de la muesta es fundamental en este método, ya que de no cumplse nvalda todos los esultados del modelo de datamnng. La metodología SEMMA exge calcula el nvel de confanza de cada muesta consdeada en el estudo de datamnng. Fase de exploacón de los datos: luego de escoge las muestas epesentatvas en esta fase se debe pocede a una exploacón de la nfomacón con el popósto de smplfca al máxmo el poblema. La smplfcacón se consgue medante heamentas gáfcas de desplegue de los datos, y medante técncas estadístcas que establecen las coelacones ente las vaables. De esa labo de smplfcacón se espea optmza la efcenca del modelo de datamnng que se constuya, al nclu en él sólo las vaables que son ealmente explcatvas. 53

54 Fase de manpulacón de los datos: luego de fnalzada la exploacón de los datos se pocede a dales el fomato adecuado paa pode almenta el modelo que se desaolle en la fase sguente. Fase de modelado: esta fase se almenta de las vaables explcatvas defndas y fomateadas en las fases anteoes, y pesgue enconta una elacón ente dchas vaables y aquellas que se espea pedec. Medante esa elacón se espea ealza nfeencas que tengan un ceto nvel de confanza. Las técncas utlzadas paa establece la elacón ente las vaables ncluyen métodos estadístcos tadconales tales como el análss dscmnante, métodos de agupamento y análss de egesón, como así tambén métodos de ntelgenca atfcal como las edes neuonales, las técncas adaptatvas, la lógca dfusa, los áboles de decsón o las eglas de asocacón, ente otas. Fase de evaluacón de los esultados: en esta fase se evalúa la valdez de los esultados obtendos en la fase anteo. Paa ello se utlzan tests de bondad de ajuste, al gual que otos métodos estadístcos que contastan los esultados obtendos en la muesta usada en las fases anteoes con los esultados que se obtenen luego con otas muestas dstntas Metodología CRISP-DM Esta metodología contene un conjunto de actvdades selecconadas en base a la expeenca de ensayo y eo ecogda a tavés de numeosos poyectos po pofesonales de DamleChysle, SPSS y NCR. Dchas actvdades están odenadas en pme luga hozontalmente en ses fases sucesvas que ecoen toda la vda del poyecto de datamnng, desde la defncón de los objetvos del negoco que se petende obtene hasta la vglanca y el mantenmento del modelo que se poponga e mplemente. Cada una de esas fases se ha subdvddo a su vez en taeas odenadas en un esquema jeáquco, desde un mayo a un meno nvel de detalle. Las taeas geneales se componen a su vez de actvdades específcas, y de un conjunto de esultados concetos. La metodología CRISP-DM consttuye, po lo tanto, un mapa de uta que pemte detemna qué actvdades desaolla en qué etapa de manea de alcanza los objetvos fnales del poyecto. A contnuacón se entega una 54

55 fgua con las fases de esta metodología y sus coespondentes taeas, paa luego descblas en mayo detalle. Fgua 6.1 Fases y Taeas del Modelo CRISP-DM 38 Fase de compensón del negoco: se centa en la compensón de los objetvos del poyecto de datamnng desde un punto de vsta de negocos. Esta fase es equvalente, po lo tanto, a una fase de análss de equementos de un poyecto de desaollo de softwae, y es mpotante, puesto que el clente puede no tene clao qué es lo que quee. Las taeas a ealza en esta fase ncluyen detemna los objetvos de negocos, evalua la stuacón del poyecto en témnos de ecusos, estccones y suposcones, 38 Fuente: CHAPMAN, Pete, CLINTON, Julan, KERBER, Randy, KHABAZA, Thomas, REINARTZ, Thomas, SHEARER, Coln, WIRTH, Rüdge, CRISP DM 1.0 Step By Step Data Mnng Gude, SPSS Inc.,

56 detemna objetvos de datamnng que taduzcan a cteos técncos los objetvos de negocos, y fnalmente poduc el plan del poyecto. Fase de compensón de los datos: compende la ecoleccón ncal de datos, dentfcando la caldad de éstos y establecendo las elacones más evdentes ente ellos. Incluye la taea de ecoleccón de datos ncales, en la cual deben descbse los datos en témnos de númeo de egstos, númeo de campos po egsto y sgnfcado de cada campo. Incluye tambén la taea de descpcón de los datos en témnos de tpo, dstbucón, tablas de fecuenca y estadígafos. Taeas adconales de esta fase son la exploacón de los datos medante gáfcos y tablas, y la vefcacón de la caldad de los msmos. Los chequeos sobe la caldad de los datos deben efectuase paa asegua la consstenca de nfomacón povenente de bases de datos dstntas, popoconadas po entdades dstntas y con fechas de poceso dstntas. Fase de pepaacón de los datos: en esta fase debe constuse una base de datos, la cual debe contene todas las caacteístcas consdeadas canddatas paa estma el valo de una vaable que se espea pedec. Esta fase ncluye la taea de seleccón de los datos a los que se va a aplca la técnca de modelamento, la taea de lmpeza de los msmos de manea de alcanza el nvel de caldad equedo po las técncas de datamnng que se selecconen, la taea de constu datos adconales, la taea de ntega dfeentes bases de datos, y la taea de fomatea los datos. La fase de pepaacón de los datos debe entega datos que estén en un fomato adecuado paa la técnca de modelamento que se empleaá en la fase sguente. Po ello, la fase de modelamento puede eque volve a la fase de pepaacón de datos una o más veces. Fase de modelamento: esta es la fase medula del poyecto de datamnng y consste en descub una elacón ente un conjunto de vaables y una vaable que se espea pedec. Contempla la seleccón de una técnca de modelamento, ente las cuales pueden menconase las edes de Kohonen o modelos K-Mean paa clusteng, áboles C5 o áboles C&R paa segmentacón, edes neuonales o egesón logístca paa pedccón, nduccón de eglas genealzada paa descubmento de patones y análss de factoes paa educ la complejdad de los datos, ente otas. Ente sus taeas se encuentan la seleccón de la técnca de modelamento, la geneacón del dseño de las 56

57 puebas del modelo, la constuccón del msmo, y fnalmente, la evaluacón técnca a la que debe sometese el modelo a tavés de cteos estadístcos. Fase de evaluacón de negocos: en la fase de modelamento se evalúa el modelo en foma técnca en elacón a factoes tales como su pecsón y genealdad. En esta fase, en cambo, debe evaluase el nvel de satsfaccón de los objetvos de negocos pesegudos po el poyecto de datamnng. Incluye la taea de evalua los esultados, la taea de evsa el poceso de datamnng y fnalmente la taea de detemna los póxmos pasos a segu (momento en el que debe decdse s debe dase po temnado el poyecto de datamnng y enta a la fase de desplegue, s deben ncase teacones adconales, o s debe ncase un nuevo poyecto de mneía de datos). Fase de desplegue del modelo: en esta fase debeá defnse una estatega paa mplementa los esultados de la mneía de datos. Incluye las taeas de planfca el desplegue del modelo, de planfca el montoeo y la mantencón de los modelos, de genea el epote fnal del poyecto, y de evsa el poyecto en elacón a evalua lo que ocuó coectamente y lo que necesta se mejoado. 6.2 Razones paa utlza CRISP-DM La metodología SEMMA se centa más en las caacteístcas estadístcas del desaollo de un modelo de datamnng, mentas que la metodología CRISP-DM posee una vsón más ampla especto a los objetvos de negocos del poyecto. Paa aquellos que han tabajado en poyectos nfomátcos, la metodología CRISP-DM paeceá más famla y con mayoes posbldades de éxto. De hecho, en un poyecto nfomátco es noma básca de análss estuctuado el ealza una fase de análss de equementos que tenga en consdeacón los objetvos de negoco que se petenden alcanza. La omsón de una buena fase de análss de equementos puede povoca que se desaollen sstemas de nfomacón excelentes en los aspectos técncos, peo que no esuelvan los poblemas eales de los usuaos. En ese sentdo la metodología SEMMA paece habe sdo desaollada como un agegado de un paquete de softwae estadístco SAS, en cambo la metodología CRISP-DM, po no esta vnculada a nnguna heamenta específca, paece habe sdo dseñada con el eal popósto de ayuda a gua la labo de datamnng. Esta dfeenca suge desde la pmea fase del poyecto de datamnng, puesto que la metodología SEMMA comenza ealzando un muesteo de datos, 57

58 mentas que la metodología CRISP-DM se nca efectuando un análss del poblema desde un punto de vsta de negocos. La metodología CRISP-DM es más póxma a una metodología de gestón de poyectos, pudendo po ello ntegase en mejo foma a poyectos cuyo ámbto dento de la empesa sea más amplo que el smple manejo estadístco. La metodología SEMMA está muy lgada a los poductos SAS, donde se encuenta mplementada, en tanto que la metodología CRISP-DM ha sdo dseñada como una metodología no vnculada a nngún poveedo de softwae, sendo su dstbucón gatuta, po lo que es posble utlzala con múltples heamentas de busness ntellgence, ente ellas Clementne de SPSS. A todas las azones dadas anteomente paa justfca la eleccón de CRISP-DM debe agegase que es uno de los estándaes más amplamente utlzados en mneía de datos hoy en día. 58

59 7 PRIMERA FASE DEL PLAN: COMPRENSIÓN DEL NEGOCIO El sguente dagama muesta las dstntas taeas que deben se ealzadas en la fase de compensón del negoco de la metodología CRISP-DM, junto a los esultados o outputs que deben obtenese de la ejecucón de cada una de ellas: Fgua 7.1 Taeas y outputs de la fase de compensón del negoco, pmea fase del poyecto de datamnng según metodología CRISP-DM 39 Pasa po alto esta fase taeía como consecuenca el que se nvetía gan esfuezo y tempo en esponde las peguntas de negocos equvocadas. Algunos ejemplos de 39 Fuente: CHAPMAN, Pete, CLINTON, Julan, KERBER, Randy, KHABAZA, Thomas, REINARTZ, Thomas, SHEARER, Coln, WIRTH, Rüdge, CRISP DM 1.0 Step By Step Data Mnng Gude, SPSS Inc.,

60 posbles nteogantes de negocos que pueden motva un estudo de datamnng efedo a las campañas bancaas son las sguentes: - Es posble focalza las campañas en detemnados segmentos en témnos de esgo de cédto y de entabldad potencal?. - Cómo es posble cece en los segmentos de mecado ya defndos?. - Es posble detemna el máxmo de deuda que pueden contae los clentes de un Banco sn sobepasa un nvel aceptable de esgo de cédto?. Las peguntas anteoes defnen un poblema de negocos, susceptble de se esuelto de dvesas fomas, al entega dstntas espuestas a las nteogantes planteadas. Los supuestos opeaconales, dados en el capítulo 5, dan po hecho que el Banco al cual se aplca el pesente plan espondeá a las peguntas anteoes con un otundo no es posble con el enfoque opeaconal vgente. Sn embago, medante la elaboacón de un plan de datamnng es posble da una solucón dstnta al poblema, al entega mecansmos paa esponde afmatvamente a las peguntas antes pesentadas. El pesente documento se aboca pecsamente a da ndcacones sobe como constu un plan de datamnng. A contnuacón se descben las taeas de esta fase y sus esultados, entegando consejos y ecomendacones que han sdo tomados conjuntamente de la expeenca y eflexón del auto de este documento y de los conceptos pesentados en la guía de usuao CRISP-DM 40. Adconalmente, se desaollan en este capítulo con patcula detalle aquellos esultados que son más mpotantes paa un plan de datamnng dgdo a las campañas bancaas y que coesponden a aspectos específcos de éstas. Tal es el caso del backgound del poyecto de datamnng (output 1a.1), de los objetvos de negocos que debean peseguse con dcho poyecto (output 1a.2), de los cteos de éxto de negocos (output 1a.3), de los pncpales esgos que podían amenaza semejante poyecto (output 1b.3), de la temnología más elevante paa el msmo (output 1b.4), de sus costos y benefcos (output 1b.5), de los objetvos de datamnng (output 1c.1) y de los cteos de éxto de datamnng asocados (output 1c.2). Po oto lado, dado que el plan de datamnng que se elaboa en el pesente documento es 40 Fuente: CRISP-DM Use Gude, edactado po el CRISP-DM Consotum, documento contendo en CHAPMAN, Pete, CLINTON, Julan, KERBER, Randy, KHABAZA, Thomas, REINARTZ, Thomas, SHEARER, Coln, WIRTH, Rüdge, CRISP DM 1.0 Step By Step Data Mnng Gude, SPSS Inc.,

61 genéco y no se basa en el caso de nngún Banco específco, sólo es posble da una descpcón tambén conceptual y genéca de los esultados que se efeen al nventao de ecusos del poyecto (output 1b.1), a los equstos, supuestos y estccones del msmo (output 1b.2), al plan detallado del poyecto (output 1d.1) y a la evaluacón ncal de las heamentas y técncas dsponbles (output 1d.2). 7.1 Detemna los objetvos de negocos (taea 1a) Esta taea coesponde a una labo de compensón de qué es lo que el clente del poyecto de datamnng quee consegu desde una pespectva de negocos. Po clentes de datamnng se hace efeenca a aquellos altos ejecutvos bancaos que están nteesados en que el poyecto de mneía de datos sva paa algo (ya sea aumenta la entabldad, la tasa de cecmento del Banco o cualque objetvo que se espee consegu a tavés del poyecto). Esta fase es equvalente, po lo tanto, a la etapa de análss de equementos de un poyecto de desaollo de un sstema de nfomacón y es mpotante, puesto que el clente puede no tene clao qué es lo que quee. Las descpcones de los esultados que se deben obtene como futo de esta taea se entegan a contnuacón: Backgound (output 1a.1) De acuedo a la guía de usuao de la metodología CRISP-DM, este esultado debe documenta el conocmento que se posea sobe la stuacón de negocos de la oganzacón al comenzo del poyecto de datamnng. Ente las actvdades que es pecso desaolla paa obtene este output se encuentan las sguentes: - Consegu o elaboa dagamas oganzaconales que pemtan dentfca las pncpales dvsones, depatamentos y equpos de tabajo que se veían de algún modo vnculados al poyecto de datamnng. Es pecso ecolecta y actualza dchos dagamas con los nombes y las dependencas jeáqucas de los esponsables de cada una de las undades. Cabe señala que en un ambente de negocos en pemanente cambo los dagamas oganzaconales dsponbles en una empesa fecuentemente se encontaán desactualzados. - Identfca las pesonas claves en el negoco y sus oles. 61

62 - Identfca un auspcado nteno (un auspcado fnanceo y usuao pncpal). - Identfca las undades de negocos que se veían mpactadas po el poyecto de datamnng (po ejemplo: Maketng, Áea Comecal, Áea de Resgo de Cédto, Áea de Opeacones). - Identfca el áea funconal del poblema. - Descb el poblema en témnos geneales. En este caso, el poblema consste en oenta las campañas en tajetas, líneas y cédtos, de manea tal de pemt a un Banco pequeño focalzase en nchos de mecado y cece. - Detemna s exste conocmento dento de las undades de negocos especto al hecho de que se va a ealza un poyecto de datamnng, y s es necesao publcta la mneía de datos como una tecnología clave. - Clafca los peequstos del poyecto. - Identfca gupos objetvo paa pesenta el esultado del poyecto (po ejemplo, detemna s se espea un epote escto paa la alta geenca o un sstema en ejecucón que sea utlzado po usuaos fnales). - Identfca las necesdades del usuao y sus expectatvas. - Descb la solucón que se emplee paa esolve el poblema. A tal especto, en el capítulo 5 se ha menconado que se supone que el Banco ealza sus campañas con un enfoque opeaconal. Como se ha señalado en el msmo capítulo, bajo tal enfoque las campañas se oentan a los clentes sn dstngu segmentos de esgo y entabldad potencal, y sn pode med adecuadamente las péddas espeadas. - Descb las ventajas y desventajas de la solucón al poblema que esté sendo utlzada. En este punto es pecso mencona que el Banco, al oenta sus campañas con un enfoque opeaconal, asumá desventajas que ncluán el desapovecha opotundades de negocos e ncu en opeacones no entables. No obstante, la desventaja más gave del enfoque opeaconal la consttuye el que no pemte dspone de un modelo capaz de med adecuadamente el nvel de esgo de una campaña (po la vía de estma la pédda asocada al monto ofecdo en ésta). Con dcha falenca un Banco no podá aumenta los montos ofecdos sujeto todo ello a la satsfaccón de un ceto nvel de esgo, y en consecuenca lmtaá sus posbldades de cecmento. 62

63 De todas las actvdades antes menconadas, la seleccón de un patocnado es fundamental. S ben de acuedo a la metodología CRISP-DM el éxto de un poyecto de datamnng dependeá de que se satsfagan objetvos de negocos y sus coespondentes cteos de éxto, ello puede se en gan pate secundao. En efecto, s ben un Banco se benefca como un todo al alcanza detemnados objetvos de negocos, ello puede se total y absolutamente ndfeente paa el patocnado de un poyecto de datamnng. La pegunta no debea se tanto cómo un poyecto puede benefca a la empesa, sno que cómo puede benefca los nteeses de su patocnado. Un poyecto puede se excelente en témnos de alcanza objetvos de negocos de un Banco, no obstante sn un buen patocnado puede esta de cualque modo condenado al facaso. Los Bancos son nsttucones enomes, y el benefco geneal paa la nsttucón se taducá en éxto paa un poyecto sólo en la medda que los objetvos de negocos que éste pemta alcanza se taduzcan en un benefco tangble paa el patocnado del poyecto y sus nteeses Objetvos de negocos: focalzase en nchos y cece sujeto a un nvel mínmo de esgo (output 1a.2) Este esultado es el segundo de la taea de detemna los objetvos de negocos (taea 1a). Debe descb el objetvo pncpal del clente desde una pespectva de negocos. Ente las actvdades que es pecso desaolla paa obtene este output se encuentan: - Descb nfomalmente el poblema que se ntenta esolve a tavés del poyecto de datamnng. A este especto puede decse que el poblema consste, en vtud de los supuestos de negocos ealzados en el capítulo 5, en que un Banco pequeño se ve enfentado a dos úncas posbldades paa compet: focalzase en nchos de mecado o cece. - Especfca en foma tan pecsa como sea posble todas las nteogantes de negocos que se petenden esponde medante el poyecto de datamnng. Dchas nteogantes son aquellas planteadas a ncos del capítulo, las cuales pueden expesase como los objetvos de negocos de focalzase en nchos de mecado y cece sujeto a un nvel mínmo de esgo. - Especfca cualque oto equemento de negocos que se espee satsface medante el poyecto de datamnng. A tal especto es pecso señala que el objetvo de 63

64 negocos de focalzacón coesponde a la meta de dentfca segmentos de esgo y entabldad con caacteístcas dstntas a las de los clentes pomedo. El objetvo de negocos de cecmento, po su pate, coesponde a la meta de aumenta tanto los montos ofecdos de cédtos de consumo, como los montos ofecdos en cupos en las tajetas y líneas de cédto, sujeto todo ello a satsface un nvel mínmo de esgo. - Especfca los benefcos de negocos espeados que se obtendían de los esultados del poyecto de datamnng. Dchos benefcos debean se alcanzables y ealstas. En elacón con este punto convene ndca que el objetvo de cece se ha taducdo en la meta específca de aumenta los montos ofecdos y no en ncementa las ventas, po cuanto éstas en un peodo detemnado dependeán de muchos factoes que son exógenos a un modelo de datamnng (tales como el monto nvetdo en publcdad, la efcaca de la fueza de ventas, la eceptvdad de los clentes, etc.). En cambo, el modelo de datamnng s puede detemna los montos ofecdos en los cédtos de consumo, como así tambén los aumentos de cupos de las tajetas y líneas de cédto. No obstante, se espea que, cetes pabus, el aumento de los montos ofecdos en las campañas bajo la estccón de satsface un ceto nvel mínmo de esgo se taduzca en el benefco ndecto paa el Banco de cece en sus colocacones Cteos de éxto de negocos: pocentaje de aumento en los montos ofecdos en las campañas y monto de pédda espeada de éstas (output 1a.3) Este esultado es el teceo de la taea de detemna los objetvos de negocos (taea 1a). Descbe los cteos que seán utlzados paa calfca como extoso el esultado del poyecto de datamnng desde un punto de vsta de negocos. Los objetvos pueden se específcos y fáclmente medbles, tales como el aumento de los montos ofecdos en las campañas, o geneales y subjetvos, como la focalzacón en detemnados segmentos de mecado. Ente las actvdades que es pecso desaolla paa obtene este esultado se encuentan las sguentes: - Especfca los cteos de éxto de negocos. Cada uno de los cteos de éxto debe esta elaconado con al menos uno de los objetvos de negocos. En elacón al objetvo de cece, debe defnse un pocentaje de aumento en los montos ofecdos a tavés de cédtos de consumo, como así tambén en los montos de los aumentos de los cupos de las tajetas y de las líneas de cédto. Relaconado tambén al objetvo de cece 64

65 satsfacendo un nvel mínmo de esgo, debe defnse un nvel de esgo en la foma de una pédda espeada paa una campaña (calculada como monto en deuda vencda o castgada luego de tanscudo ceto tempo). - Identfca quen evalúa los cteos de éxto. Ello es mpotante paa evalua el cumplmento del objetvo de dentfca segmentos de esgo y entabldad con caacteístcas dstntas a las de los clentes pomedo, puesto que es dfícl expesa tal objetvo en témnos numécos. 7.2 Evalua la stuacón (taea 1b) Esta taea consste en ealza una nvestgacón exhaustva sobe los ecusos, estccones y suposcones que debean se consdeados al momento de elaboa el plan del poyecto de datamnng. Las descpcones de los esultados que se deben obtene como futo de esta taea se entegan a contnuacón: Inventao de ecusos (output 1b.1) De acuedo a la guía de usuao de la metodología CRISP-DM, este esultado consste en una lsta de todos ecusos dsponbles paa el poyecto, ncluyendo los sguentes: - Recusos de pesonal (tales como expetos del negoco y de los datos, dsponbldad de sopote técnco y de pesonal de datamnng) - Recusos de datos (tales como accesos a datamats, a bases de datos opeaconales o al escate de nfomacón opeaconal espaldada en cnta) - Recusos computaconales (tales como sevdoes en los cuales pueden coe los pocesos de datamnng, capacdad de almacenamento en dsco paa guada muestas de datos necesaas paa los estudos de datamnng y acceso a edes de alta velocdad paa comunca equpos sevdoes y clentes nvolucados en el pocesamento de datamnng) - Recusos de softwae (tales como heamentas de datamnng, y oto softwae elevante). En el pesente documento se utlza Clementne de SPSS paa lusta la constuccón del plan de datamnng. Ente las actvdades que es pecso desaolla paa obtene este esultado se encuentan las sguentes: 65

66 - Identfca el hadwae que se utlzaá. - Establece la dsponbldad de dcho hadwae paa el poyecto de datamnng. Es pecso tene pesente que muchos sevdoes y bases de datos no se encuentan dsponbles duante la jonada laboal po esta destnados 100% a funcones opeaconales. No obstante, tal vez sea posble tene acceso a ellos duante la noche o los fnes de semana. - Evalua s el pogama de mantenmento de sstemas enta en conflcto con la dsponbldad del hadwae paa el poyecto de datamnng. A tal especto es pecso consdea que los pocesos de mantenmento y espaldo se ejecutan nomalmente duante la noche, o los fnes de semana, que son pecsamente los hoaos más pobables en los que se otogaá acceso al hadwae. - Identfca el hadwae dsponble paa la heamenta de datamnng a se utlzada. - Identfca las fuentes de datos. - Identfca los tpos de fuentes de datos (s se tata de fuentes onlne, expetos, documentacón escta, etc.). - Identfca a los admnstadoes de sstemas, a los admnstadoes de las bases de datos y al staff de sopote técnco paa eventuales consultas. - Identfca a los analstas de mecado, a los expetos en datamnng y a los estadístcos que puedan colaboa en el poyecto, y chequea su dsponbldad. Ello es mpotante pues el poyecto puede necesta staff técnco en momentos mpevsbles Requementos, suposcones y estccones (output 1b.2) Este esultado es el segundo de la taea de evalua la stuacón (taea 1b). De acuedo a la guía de usuao de la metodología CRISP-DM, este output ncluye una lsta de todos los equementos del poyecto, ncluyendo el conogama de témno, la caldad y complettud de los esultados, la segudad de la nfomacón y los aspectos legales. En este punto es de vtal mpotanca aseguase que está pemtdo utlza los datos que se petenden ocupa. El esultado ncluye tambén una lsta de todas las suposcones ealzadas po el poyecto, las cuales pueden coesponde tanto a suposcones sobe los datos, sujetas a vefcacón, como suposcones no vefcables ealzadas sobe el negoco. Es patculamente mpotante detalla las suposcones s 66

67 ellas establecen condcones sobe la valdez de los esultados del poyecto. Asmsmo, el esultado debe nclu todas las estccones establecdas en el poyecto, y que pueden nvoluca la no dsponbldad de ecusos paa lleva a cabo algunas taeas. Ente las actvdades que es pecso desaolla paa obtene este esultado se encuentan: - Identfca todos los equementos sobe plazos que deben cumplse en el poyecto de datamnng. - Identfca todos los equementos sobe complettud, pecsón y mantencón de los modelos de datamnng esultantes. - Identfca los equementos sobe segudad, estccones legales, pvacdad y geneacón de epotes del poyecto. - Clafca y explcta todas las suposcones del poyecto de datamnng, ncluyendo aquellas mplíctas. - Elaboa una lsta de suposcones ealzadas sobe la caldad de los datos (po ejemplo, pecsón y dsponbldad). - Elaboa una lsta de suposcones sobe los factoes extenos al poyecto de datamnng que podían afecta su éxto (po ejemplo: asuntos económcos, poductos compettvos, avances técncos). - Elaboa una lsta de todas las suposcones ealzadas sobe la necesdad de explca el modelo a sus usuaos (po ejemplo: las suposcones que dcen elacón a cómo debea se pesentado el modelo y sus esultados a la alta geenca y a su patocnado). - Identfca las estccones de acceso a las fuentes de datos. - Identfca las estccones pesupuestaas del poyecto de datamnng (costos fjos, costos de mplementacón, etc.) Resgos y contngencas (output 1b.3) Este esultado es el teceo de la taea de evalua la stuacón (taea 1b). De acuedo a la guía de usuao de la metodología CRISP-DM, este output ncluye un lstado de los esgos que pueden afecta el poyecto, mpactando sus plazos, sus costos o su 67

68 esultado fnal. Incluye tambén un lstado de los coespondentes planes de contngenca dseñados paa mtga dchos esgos. Ente las actvdades que es pecso desaolla paa obtene este esultado se encuentan: - Identfca los esgos de negocos (tales como fusones, adquscones, entada de nuevos competdoes al mecado). - Identfca esgos oganzaconales. - Identfca esgos fnanceos. - Identfca esgos técncos. - Identfca esgos que dependan de los datos y de las fuentes de datos (po ejemplo, baja caldad de los datos). - Detemna las condcones bajo las cuales cada uno de los esgos puede ocu. - Desaolla planes de contngenca. Con especto a los esgos oganzaconales es pecso tene en consdeacón el pode de las cofadías dento de los depatamentos de cédto de un Banco pequeño. Se entende po cofadía a un conjunto de ejecutvos undos po estechos vínculos de confanza y que actúan tatando de acapaa todas las esponsabldades y todo el conocmento necesao paa el funconamento bancao. El éxto de las cofadías adca en pme luga en su capacdad paa enqustase pofundamente en los pocesos opeaconales bancaos, de manea de no pemt el eemplazo de sus membos sn afecta seveamente la contnudad de las opeacones de la empesa. En segundo luga, su éxto depende de su habldad paa asfxa el sugmento de cualque val al domno absoluto que ejecen sobe el conocmento y el manejo de las opeacones bancaas. Los poyectos de datamnng, po el hecho de automatza la toma de decsones, y pescnd de ese modo de la expeenca humana, pueden enconta oposcón po pate de tales gupos. Paa neutalza su oposcón es pecso conta con el fme espaldo de un líde bancao. La cultua de negocos puede pesenta tambén esgos concetos a la ealzacón de un poyecto de datamnng. Así, po ejemplo, el despeco de cualque actvdad de caácte técnco puede povoca que un poyecto de datamnng sea equpaado a la smple manpulacón de datos, y po lo tanto sea catalogado como una actvdad de 68

69 segundo oden. La ceenca de que es atbuto pvatvo de los jefes el pensa y de los subodnados smplemente ejecuta puede tambén fusta las ncatvas de un pofesonal que ntente desaolla datamnng, al vese éste mposbltado de ealza cualque labo po ncatva popa. La mpotanca que se da a las elacones pesonales de confanza po sobe el pofesonalsmo puede tambén en conta de quen ntenta ealza datamnng, s ésta pesona no cuenta con el fme espaldo de patocnadoes dento de la oganzacón. Exste el esgo de que un poyecto de datamnng deje de se auspcado po su patocnado, al consdea que se ha nvetdo demasado tempo tabajando con los datos sn consegu nada tangble. Dcha decsón puede enconta espaldo en el consejo y la opnón de pofesonales que, habendo tabajado con Access o Excel en otas nsttucones, están acostumbados a ealza manpulacón de datos de manea no estuctuada y ápda. El poblema suge debdo a que nomalmente en los poyectos de datamnng más del 90% del esfuezo se ealza en las pmeas fases del msmo 41, en patcula en la pepaacón de los datos. Ello povoca que este tpo de poyectos sea en geneal subestmado en cuanto a coste y tempo. El poblema se agava en el caso de una nsttucón fnancea que caece de un datawaehouse, po cuanto el nvel de esfuezo que es pecso ealza paa ntega datos povenentes de bases de datos dstntas, esdentes en platafomas dstntas, y con datos efedos a peodos dstntos, supea en mucho al que coespondeía lleva a cabo en otas ccunstancas Temnología (output 1b.4) Este esultado es el cuato de la taea de evalua la stuacón (taea 1b). De acuedo a la guía de usuao de la metodología CRISP-DM, este output consste en un glosao de témnos elevantes paa el poyecto, y debe nclu al menos dos componentes: un glosao de temnología elevante del negoco, y un glosao de temnología de datamnng. Ente las actvdades que es pecso desaolla paa obtene este esultado se encuentan: 41 Fuente: Jumpstat Clementne Tanng Bochue, Data Mnng Jumpstat, Data Mnng Pojects Clementne, SPSS,

70 - Chequea la dsponbldad de glosaos exstentes, o de lo contao comenza su bosquejo. - Convesa con expetos en la matea paa compende su temnología. - Famlazase con la temnología de negocos. A contnuacón se entegan las defncones de mayo elevanca paa el plan de datamnng de las campañas bancaas Defncón de clente malo desde un punto de vsta cedtco Paa constu un modelo del nvel de esgo de un clente debe calculase la pobabldad de que éste se tansfome en un clente malo dento de un detemnado peodo de tempo. Es mpotante, po lo tanto, aba a una defncón de qué se entende po clente malo. En la pesente nvestgacón se consdeaá malo en témnos cedtcos a toda pesona que cumpla alguna de las sguentes caacteístcas: - Habe pesentado deuda decta vencda o deuda decta castgada en los últmos 12 meses de los nfomes de la SBIF. - Pesenta saldo de captal castgado con el Banco. - Pesenta monto de catea vencda con el Banco. - Pesenta una deuda enegocada con el Banco que povenga con ceteza de cédtos vencdos o castgados. - Fgua con alguna cuenta vaos deudoes en el Banco, la cual con ceteza povenga de más de 60 días de moa en alguna tajeta de cédto. - Fgua en el denomnado fle negatvo del Banco, que eúne al conjunto de clentes con los que éste no desea opea. - Fgua en el lstado de los clentes cuyas cuentas hayan sdo ceadas en el pasado po el Banco. A la lsta dada anteomente pueden agegase condcones adconales, las cuales pueden apovecha la expeenca que el Banco posea paa dentfca a pesonas que efectvamente coespondan a clentes malos desde un punto de vsta cedtco. Dchas condcones pueden efleja tambén dfeentes expectatvas del Banco con especto a qué clentes esté dspuesto a consdea como demasado esgosos. 70

71 Defncón de entabldad potencal de un clente La entabldad potencal coesponde al valo actual neto de los flujos de efectvo que geneaía un clente paa el Banco, en el caso de que dcha nsttucón fuese capaz de vende a dcha pesona el máxmo de los sevcos que eventualmente aquel estaía dspuesto a contata en el futuo. La entabldad potencal tata de se explotada po lo que se conoce como fdelzacón. Detás del concepto de fdelzacón se encuenta la dea de ofece poductos que consttuyan un gancho paa atae a los clentes, a los cuales bnda a futuo otos sevcos fnanceos, hasta agota su entabldad potencal. Po lo tanto, pncpalmente la fdelzacón ntenta povoca la consevacón de los clentes po muchos años. Fgua 7.2 Ganancas extas obtendas po cada tansaccón de la tajeta de cédto de un clente, cuando éste tene vaos años de antgüedad 42 La fgua 7.2 muesta la mpotanca que tene conseva a los clentes, po cuanto los flujos de efectvo que genea un clente antguo de una tajeta de cédto bancaa son 42 Fuente: REICCHELD, SASSER, Zeo Defectons Come to Qualty, HBR,

72 mucho mayoes que aquellos que genea un clente nuevo. El gáfco muesta que los clentes entegan sólo ganancas báscas el pme año (consttudas po cobos de mantencón y po un nvel de utlzacón educdo de las tajetas). A pat del segundo año los clentes comenzan a genea ganancas adconales po dstntos conceptos: aumento de la utlzacón de los cupos de las tajetas, aumento de las tansaccones con ellas, uso más efcente de los sevcos bancaos, entega de ecomendacones de los sevcos del Banco a otas pesonas, o pago de sobepecos po detemnados sevcos. Mentas las ganancas báscas son las msmas, ndependentemente de la antgüedad del clente, las ganancas exta que se poducen son mucho mayoes en los clentes más antguos. Las ganancas no báscas sugen pecsamente de la utlzacón po pate del Banco de la entabldad potencal de los clentes. Mentas mayo sea la entabldad potencal de éstos, mayoes seán las ganancas no báscas que podían obtenese. Un Banco que sea ncapaz de conseva a sus clentes, no podá tampoco apovecha su entabldad potencal. Concentando los esfuezos de las campañas en los clentes con mayo entabldad potencal seá posble conseva a éstos po muchos años y de esa foma seá posble tambén apovecha efectvamente su entabldad potencal Defncón de clente sn gan entabldad potencal Paa constu un modelo de entabldad potencal es pecso calcula la pobabldad de que un clente se tansfome en alguen sn una gan entabldad potencal dento de un detemnado peodo de tempo. Es pecso, po lo tanto, llega a una defncón de qué se entende po alguen sn una gan entabldad potencal. Nótese que paa constu un modelo de entabldad potencal no es necesao calcula la entabldad potencal de los clentes, pues basta smplemente dentfca aquellas condcones en las cuales un clente puede clasfcase como sn gan entabldad potencal. Dado que la entabldad potencal coesponde al valo actual neto de los flujos de efectvo que geneaía un clente paa el Banco, un clente sn gan entabldad potencal seá alguen que sn luga a dudas posea un valo actual neto muy bajo paa el Banco. En la pesente nvestgacón se entendeá po clente sn una gan entabldad potencal a toda pesona que cumpla alguna de las condcones sguentes, cada una de las 72

73 cuales va ndsolublemente lgada a un valo pesente del clente que es claamente muy bajo paa el Banco: - La conjuncón de las sguentes caacteístcas: no se pofesonal, posee un ngeso mensual nfeo a un monto detemnado (po ejemplo: $ ) y no se lo sufcentemente joven paa camba de actvdad (pesenta una edad supeo a, po ejemplo, 40 años). - La conjuncón de las sguentes caacteístcas: se pofesonal, posee un ngeso mensual nfeo a un monto detemnado (po ejemplo: $ ) y no se pofesonal joven (pesenta una edad supeo a un númeo detemnado de años, po ejemplo: 30 años). - Ejece detemnadas pofesones y ofcos que son mal emuneados, que tampoco pemten a las pesonas aumenta sus ngesos sgnfcatvamente en el futuo, y en los cuales las pesonas tadconalmente tenden a desempeñase duante toda su vda (po ejemplo: pesonal de oden y segudad). - La conjuncón de las sguentes caacteístcas: no posee patmono, se mayo a una edad detemnada (po ejemplo: 40 años) y posee un ngeso nfeo a un monto detemnado (po ejemplo: $ ). - La conjuncón de las sguentes caacteístcas: se hombe y se una pesona mayo (con una edad po sobe los 70 años, po ejemplo). - La conjuncón de las sguentes caacteístcas: se muje y se una pesona mayo (con una edad po sobe los 65 años, po ejemplo). - Se un clente malo en témnos de esgo de cédto. - Posee una capacdad esdual de endeudamento meno a un mllón de pesos. A la lsta dada anteomente pueden agegase condcones adconales, las cuales pueden apovecha la expeenca que el Banco posea paa dentfca a pesonas que efectvamente coespondan a clentes sn gan entabldad potencal desde su pespectva. Dchas condcones pueden efleja tambén dfeentes expectatvas del Banco con especto a qué clentes esté dspuesto a consdea como pesonas sn atactvo. 73

74 Defncón de caga fnancea La caga fnancea coesponde al pocentaje de los ngesos que una pesona debe destna a solventa sus deudas, y consttuye nfomacón fundamental tanto paa evalua el nvel de esgo del clente como su entabldad potencal. En la medda que una pesona contae pogesvamente más deudas, el monto que debe eseva al pago de éstas aumenta, al msmo tempo que dsmnuye la popocón de su salao que puede destna al pago de otos sevcos. Claamente en la medda que la caga fnancea de un clente aumenta, mayo es tambén su esgo de cédto y meno es su entabldad potencal Costos y benefcos (output 1b.5) Este esultado es el qunto de la taea de evalua la stuacón (taea 1b). De acuedo a la guía de usuao de la metodología CRISP-DM, este output consste en un análss de costo-benefco, el cual debe compaa los costos del poyecto de datamnng con el benefco potencal que epotaía paa el negoco en el caso de se extoso. Ente las actvdades que es pecso desaolla paa obtene este esultado se encuentan: - Estma los costos de la ecoleccón de datos. - Estma los costos de desaolla e mplementa una solucón de datamnng. - Identfca los benefcos que se obtendían po la ealzacón del poyecto de datamnng. Antes de mencona el pncpal benefco del poyecto de datamnng es pecso consdea que los modelos que se elaboen deben estma el esgo cedtco y la entabldad potencal de los clentes. Como se descbe en la seccón 7.3, ello povene del hecho que los objetvos de negocos del poyecto de datamnng defndos en la seccón 7.1, y que conssten en enfocase en nchos de mecado y cece, se taducen en objetvos de datamnng de estma el esgo y la entabldad de los clentes. El mayo benefco apotado po el plan de datamnng de las campañas bancaas es estatégco y consste en pemt a un Banco focalzase en nchos de mecado y cece medante la clasfcacón de sus clentes po cteos de esgo y entabldad. Dcha clasfcacón es fundamental paa un Banco pequeño, s se aceptan los supuestos de negocos dados en la seccón 5.4, y según los cuales las dos opcones paa sobevv 74

75 de una nsttucón semejante son enfocase en nchos de mecado o cece. En efecto, los puntajes de esgo y entabldad que los modelos de datamnng pemten asgna a los clentes son útles en ambos casos, tanto paa enfocase en nchos como paa cece. En pme luga, es posble dentfca dstntos segmentos de mecado a pat de los puntajes de esgo y entabldad. En segundo luga, como se demuesta en la seccón 11.1, los menconados puntajes pemten aumenta el dneo que es posble ofece a los clentes en condcones ventajosas paa el Banco, al msmo tempo que se satsface un nvel mínmo de esgo. De esa foma, los puntajes pemten tambén a un Banco cece po la vía de aumenta los montos ofecdos en las campañas. 7.3 Detemna los objetvos de datamnng (taea 1c) Esta taea coesponde a la taduccón a témnos técnco-estadístcos de los objetvos de negocos que se petende alcanza con el poyecto de datamnng. Las descpcones de los esultados que se deben obtene como futo de esta taea se entegan a contnuacón: Objetvos de datamnng: estma el esgo cedtco y la entabldad potencal de los clentes (output 1c.1) Este output consste en una descpcón de los objetvos de datamnng que hacen posble alcanza los objetvos de negocos pesegudos po el poyecto. Ente las actvdades que es pecso desaolla paa obtene este output se encuentan: - Taduc los objetvos de negocos a objetvos de datamnng - Especfca el tpo de poblema de datamnng. En este caso los modelos de esgo de cédto y de entabldad potencal que se plantean son netamente modelos pedctvos. El pme objetvo de negocos pesegudo po el poyecto de datamnng, y que no es oto que focalzase en nchos de mecado, puede mplementase dentfcando dstntos segmentos de mecado que dfeencen ente s po el esgo y la entabldad de sus clentes. Así, el objetvo de negocos de focalzacón puede taducse en los objetvos de datamnng de estma el esgo cedtco y la entabldad potencal de los clentes. El segundo objetvo de negocos pesegudo po el poyecto de datamnng, que consste en cece sujeto a un nvel mínmo de esgo, equee de los sguentes cálculos pevos: 75

76 1. Especfca el nvel de esgo asocado a los montos ofecdos en una campaña. 2. Detemna el monto de dneo a ofece en las campañas sujeto a un nvel mínmo de esgo (especfcado usando el cálculo del punto anteo). Como se explca a contnuacón, el pme cálculo puede taducse en los objetvos de datamnng de estma el esgo cedtco y la entabldad potencal de los clentes. Como se ha detallado en la seccón 7.1 al descb los cteos de éxto de negocos (output 1a.3), la satsfaccón de un nvel mínmo de esgo paa las campañas se especfca en la foma de una pédda espeada (calculada como monto en deuda vencda o castgada luego de tanscudo ceto tempo). La pédda espeada paa un monto ofecdo a un clente puede calculase como el poducto del monto ofecdo y de la pobabldad de que dcho clente se tansfome en malo dento de un detemnado hozonte de tempo. No obstante, dcha pobabldad depende tanto del monto ofecdo como de la entabldad potencal del clente. Mentas mayo sea el monto ofecdo a un clente, mayo seá la pobabldad de que se tansfome en malo, puesto que el clente estaá más endeudado en el caso de acepta la ofeta y en consecuenca seá más esgoso. Po oto lado, mentas mayo entabldad potencal posea un clente, mayo seá su capacdad de seguse endeudando sn volvese más esgoso, y en consecuenca meno seá el aumento de la pobabldad de que él se tansfome en malo al aumenta su nvel de endeudamento. Po todo lo antes menconado, paa especfca el nvel de esgo asocado a los montos ofecdos en una campaña es pecso estma el esgo cedtco y la entabldad potencal de los clentes. El segundo cálculo antes menconado, que consste en detemna el monto de dneo a ofece en las campañas sujeto a un nvel de mínmo esgo, tambén puede taducse en los objetvos de datamnng de estma el esgo cedtco y la entabldad potencal de los clentes. En efecto, medante un modelo de pogamacón no lneal es posble especfca el poblema. Se desea maxmza el monto total a ofece en la campaña sujeto a la estccón de que las péddas totales sean guales a un monto detemnado. La funcón objetvo puede especfcase smplemente como la sumatoa de los montos a ofece a cada clente. La pédda de la campaña puede escbse como la sumatoa del monto a ofece a cada clente multplcado po la pobabldad de que dcho clente se tansfome en malo luego de acepta el monto ofecdo. Dado que la menconada pobabldad dependeá de la entabldad potencal y del nvel de esgo de cada clente 76

77 antes de acepta la ofeta, se tendá que la solucón del modelo de pogamacón equeá de estmacones del nvel de esgo y de la entabldad potencal de los clentes. Restccones adconales de tal modelo son que los montos deben se postvos y que la caga fnancea de cada clente no puede excede el 100% de sus ngesos luego de acepta la ofeta. La especfcacón detallada de tal modelo de pogamacón se entega en la seccón 11.1, al mosta como los puntajes calculados con los modelos de esgo y entabldad potencal pemten alcanza los objetvos de negocos del plan de datamnng. No obstante, con lo que se ha menconado es evdente que el poblema de detemna los montos de dneo a ofece en las campañas sujeto a un nvel mínmo de esgo equee necesaamente estma el esgo y la entabldad de los clentes. En esumen, los dos objetvos de negocos del poyecto de datamnng pueden taducse en los objetvos de datamnng de estma el esgo cedtco y la entabldad potencal de los clentes Cteos de éxto de datamnng: eoes tpo I y tpo II (output 1c.2) Este esultado es el segundo de la taea de detemna los objetvos de datamnng (taea 1c). De acuedo a la guía de usuao de la metodología CRISP-DM, este output coesponde a un conjunto de cteos técncos paa consdea extoso un poyecto de datamnng (po ejemplo, un ceto nvel de pecsón en las pedccones de los modelos desaollados). Ente las actvdades que es pecso desaolla paa obtene este esultado se encuentan: - Especfca los cteos paa la evaluacón de los modelos (po ejemplo, pecsón de los modelos, desempeño de éstos y nvel de complejdad). - Defn benchmaks paa los cteos de evaluacón. Los cteos de éxto de datamnng pueden nclu cualquea de las meddas estadístcas usadas paa evalua los modelos técncamente y detalladas en el capítulo 10. No obstante, cteos de éxto azonables paa los modelos de datamnng de las campañas bancaas deben nclu cotas paa dos tpos de eo. En un modelo de esgo el pmeo de ellos, o eo tpo I, povene de clasfca como bueno a un clente que seá malo. El segundo, o eo tpo II, suge al clasfca como malo a un clente que seá bueno. Análogamente, en los modelos de entabldad el eo tpo I se comete al 77

78 calfca como clente con gan entabldad potencal a un clente sn ella, en tanto que el eo tpo II ocue al clasfca como clente sn gan entabldad potencal a un clente que s poseeá una gan entabldad potencal. Los modelos de esgo calculaán notas o puntajes de esgo, que coespondeán a pobabldades de que los clentes se tansfomen en malos en un ceto hozonte de tempo. Paa calfca como bueno a un clente se utlzaá una nota o pobabldad mínma, denomnada puntaje de cote. Al fja un puntaje de cote paa un modelo de esgo detemnado, y aplca dcho modelo a un conjunto de datos de pueba se obtendán eoes tpo I y tpo II en la foma de pocentajes sobe el total de los clentes de la muesta. Los cteos de éxto de datamnng a tal especto pemtán detemna s los esultados de un modelo de esgo son aceptables o no. Conclusones análogas se obtenen paa los modelos de entabldad potencal. En efecto, los modelos de entabldad potencal calculaán notas o puntajes de entabldad, que coespondeán a pobabldades de que los clentes se tansfomen en pesonas sn gan entabldad potencal en el futuo. Paa calfca como sn gan entabldad potencal a un clente se utlzaá una nota o pobabldad mínma, denomnada tambén puntaje de cote. Al fja un puntaje de cote paa un modelo de entabldad potencal, y aplca dcho modelo a un conjunto de datos de pueba se obtendán eoes tpo I y tpo II en la foma de pocentajes sobe el total de los clentes de la muesta. 7.4 Poduc el plan del poyecto (taea 1d) Esta taea coesponde a la ealzacón de una cata Gantt del poyecto de mneía de datos, junto a la cual debe descbse el plan con el que se espea alcanza los objetvos de datamnng y los objetvos de negocos. Las descpcones de los esultados que se deben obtene como futo de esta taea se entegan a contnuacón: Plan del poyecto (output 1d.1) De acuedo a la guía de usuao de la metodología CRISP-DM, este esultado coesponde a una lsta de todas las etapas a se ejecutadas en el poyecto, junto a su duacón, ecusos equedos, nputs, outputs y dependencas. Debe hacese explícta la epetcón y el etoceso a la etapa anteo popas de las fases de modelamento y 78

79 de evaluacón de negocos. Como pate del plan de datamnng es tambén mpotante analza las dependencas ente los plazos y los esgos. Es pecso detalla los esultados de los análss de esgos en témnos de accones y ecomendacones sobe los pasos a segu en caso de contngenca. Ente las actvdades que es pecso desaolla paa obtene este esultado se encuentan: - Defn el plan ncal del poyecto de datamnng y dscut la factbldad con todo el pesonal nvolucado en el poyecto. - Reun en un poceso coheente todos los objetvos dentfcados y todas las técncas de datamnng selecconadas, de manea de esponde las peguntas de negocos y de satsface los cteos de éxto del poyecto. - Estma el esfuezo y los ecusos necesaos paa alcanza y genea la solucón del poyecto de datamnng. Se postula que ente un 50% y un 70% del tempo en un poyecto de datamnng debea destnase a la fase de pepaacón de los datos, mentas que tan solo un pocentaje ubcado ente un 10% y un 20% debea dgse a las fases de Modelamento, Evaluacón y Compensón del Negoco. El pocentaje asgnado a la fase de Desplegue debea encontase ente un 5% y un 10% del tempo total del poyecto. - Identfca los pasos cítcos. - Resalta los puntos de toma de decsones. - Resalta los puntos de evsón de los esultados del poyecto. - Identfca las pncpales teacones dento del flujo de fases y taeas de datamnng Evaluacón ncal de heamentas y técncas (output 1d.2) Este esultado es el segundo de la taea de poduc el plan del poyecto (taea 1d). De acuedo a la guía de usuao de la metodología CRISP-DM, este output consste en una evaluacón ncal de las heamentas y técncas de datamnng que es posble utlza. Debe selecconase una heamenta de datamnng que sopote vaos métodos paa dfeentes etapas del poyecto. Es mpotante evalua las heamentas y técncas tempanamente en el poyecto, puesto que la eleccón de las heamentas y técncas nfluencaá todo el poyecto. Ente las actvdades que es pecso desaolla paa obtene este esultado se encuentan: 79

80 - Cea una lsta de cteos paa seleccona las heamentas y técncas de datamnng. - Escoge las heamentas y técncas de datamnng. - Evalua qué tan apopadas son las técncas de datamnng. - Revsa y poza técncas de datamnng aplcables de acuedo a la evaluacón de solucones altenatvas. En la pesente nvestgacón se ha escogdo Clementne de SPSS como heamenta de datamnng paa lusta la elaboacón de un plan de mneía de datos, la cual sopota una ampla vaedad de técncas de datamnng. Ente aquellas técncas que se ajustan mejo a la constuccón de modelos pedctvos de esgo y entabldad se encuentan la egesón logístca, las edes neuonales y los áboles de decsón, las cuales se explcan en detalle en la seccón 10.1, ncluyendo una tabla con sus ventajas y desventajas. 80

81 8 SEGUNDA FASE DEL PLAN: COMPRENSIÓN DE LOS DATOS El sguente dagama muesta las dstntas taeas que deben se ealzadas en la fase de compensón de los datos de la metodología CRISP-DM, junto a los esultados o outputs que deben obtenese de la ejecucón de cada una: Fgua 8.1 Taeas y outputs de la fase de compensón de los datos, segunda fase del poyecto de datamnng según metodología CRISP-DM 43 A contnuacón se descben las taeas de esta fase y sus esultados, entegando consejos y ecomendacones elaboados a pat de la eflexón del auto de este 43 Fuente: CHAPMAN, Pete, CLINTON, Julan, KERBER, Randy, KHABAZA, Thomas, REINARTZ, Thomas, SHEARER, Coln, WIRTH, Rüdge, CRISP DM 1.0 Step By Step Data Mnng Gude, SPSS Inc.,

82 documento y de la guía de usuao de CRISP-DM 44. Como se ha señalado en el captulo 3, esta tess no se basa en nngún conjunto de datos de nngún gupo de pesonas. Po ello no pueden entegase ndcacones específcas sobe los epotes de descpcón, de exploacón, o de caldad de los datos (outputs 2b.1, 2c.1 y 2d.1). Sn embago, en vtud de los supuestos dados en el capítulo que vesa sobe las hpótess de tabajo es posble da una descpcón de las fuentes de datos que todo Banco debe posee y que poveen de nfomacón necesaa y sufcente paa la ealzacón de estudos de datamnng sobe las campañas bancaas. En consecuenca, como pate de la explcacón del epote de ecoleccón de los datos ncales (output 2a.1), se entegan en este capítulo las descpcones de todas las vaables necesaas paa constu los modelos de datamnng planteados en esta nvestgacón, de gual modo que todas las fuentes de datos que se utlzaán. 8.1 Recolecta datos ncales (taea 2a) Esta taea consste en la ealzacón de una ecoplacón de los datos necesaos paa el poyecto de datamnng, utlzando paa ello la lsta de ecusos dsponbles elaboada en la taea 1b de la fase de compensón del negoco. La ecoleccón debe nclu la caga de los datos en la heamenta de datamnng, s ello ayuda a compende la nfomacón (como puede se el caso de no exst un dcconao de datos que entegue el sgnfcado de cada campo de una base de datos). Las descpcones de los esultados que se deben obtene como futo de esta taea se entegan a contnuacón: Repote de ecoleccón de datos ncales (output 2a.1) De acuedo a la guía de usuao de la metodología CRISP-DM, este esultado consste en una lsta de los datos que seán utlzados en el poyecto. Asmsmo dcha lsta debe nclu los equementos de seleccón de datos que sea pecso ealza paa obtene nfomacón más detallada que la dsponble. El epote de ecoleccón de datos debe defn tambén s algunos atbutos son más mpotantes que otos, al msmo tempo 44 Fuente: CRISP-DM Use Gude, edactado po el CRISP-DM Consotum, documento contendo en CHAPMAN, Pete, CLINTON, Julan, KERBER, Randy, KHABAZA, Thomas, REINARTZ, Thomas, SHEARER, Coln, WIRTH, Rüdge, CRISP DM 1.0 Step By Step Data Mnng Gude, SPSS Inc.,

83 que esboza una evaluacón sobe la caldad de los datos. Ente las actvdades que es pecso desaolla paa obtene este esultado se encuentan: - Planfca qué nfomacón se necestaá (po ejemplo: solo atbutos dsponbles o nfomacón adconal). - Chequea s toda la nfomacón que se necesta paa alcanza los objetvos de datamnng está actualmente dsponble. - Especfca los cteos de seleccón de datos (detemna qué atbutos son necesaos paa alcanza los objetvos de datamnng y qué atbutos han sdo dentfcados como elevantes). Es pecso tene pesente que los datos ecolectados de dfeentes fuentes pueden povoca poblemas de caldad cuando son mezclados debdo a nconsstencas de fomatos o a la pesenca de datos nváldos. - Seleccona las tablas o achvos de nteés paa el poyecto de datamnng. - Seleccona datos dento de cada tabla o achvo de nteés paa el poyecto. - Detemna el númeo de meses pasados que debean se usados paa seleccona los datos del poyecto de datamnng (po ejemplo: aun s hay nfomacón dsponble de 36 meses puede que sólo 18 meses de hstoa sean elevantes paa la nvestgacón). - Detemna cómo se pueden obtene los atbutos que faltan y que son elevantes paa el poyecto de datamnng. - Descb cómo extae los datos (po ejemplo, vía un muesteo aleatoo smple). El conjunto de atbutos de los clentes que son necesaos paa constu modelos pedctvos se entega a contnuacón: Datos necesaos paa el poyecto: lsta de atbutos de los clentes En base a la expeenca y al conocmento del negoco de otogamento de cédto a pesonas es posble dentfca vaables que, ndependentemente de qué gupo de clentes se tate, son elevantes paa constu modelos pedctvos de esgo y entabldad. El modelo de datamnng que se pesgue constu coesponde a un sstema expeto que petende smula el azonamento de los ejecutvos comecales y de cédto. Po lo tanto, se han ncludo en este punto sólo las vaables que son elevantes paa dchos ejecutvos y que pueden encontase con facldad en las bases 83

84 de datos opeaconales de cualque Banco. A contnuacón se entegaá el conjunto de 88 vaables canddatas a ntega los modelos pedctvos de esgo y entabldad potencal, clasfcadas en dstntos gupos de acuedo al tpo de caacteístca del clente al que se efeen. El sguente dagama muesta dchas 88 vaables clasfcadas en ses gupos: Fgua 8.2 Ses gupos de vaables canddatas a se consdeadas en los modelos (nótese que sólo un gupo coesponde a vaables de deudas) Gupo de vaables demogáfcas (A) - Regón. - Cantdad de hjos. - Unvesdad. - Povnca. - Cantdad de cagas. - Régmen conyugal. - Comuna. - Nvel educaconal. - Tene datos de edad?. - Sexo. - Actvdad económca. - Edad. - Estado cvl. - Pofesón. 45 Fuente: elaboacón popa 84

85 Gupo de vaables de enta (B) - Patmono. - Renta. - Es ndependente?. - Tene un ben aíz?. - Tpo de enta (fja/va.).l - Tene datos de enta?. - Antgüedad de la enta. L Gupo de vaables de vínculo con el clente (C) Vaables de tpo de elacón del clente con el Banco - Tpo de clente (clente en conveno, clente estánda, etc.). - Antgüedad del clente. Sevcos contatados con el Banco - Tene líneas de cédto del Banco?. - Fecha más emota de apetua de línea de cédto hoy vgente con el Banco. - Tene tajetas del Banco?. - Fecha más emota de otogamento de tajeta de cédto hoy vgente con el Banco. - Monto ognal de las tajetas de cédto del Banco que el clente posee. - Tene cédtos no hpotecaos en el Banco?. - Fecha más emota de otogamento de cédto no hpotecao vgente con el Banco. - Monto ognal adeudado en cédtos no hpotecaos del Banco. - Plazo máxmo de cédtos no hpotecaos hoy vgentes con el Banco. - Tene cédtos hpotecaos del Banco?. - Fecha más emota de otogamento de cédto hpotecao hoy vgente con el Banco. - Monto ognal adeudado en cédtos hpotecaos hoy vgentes con el Banco. - Plazo máxmo de cédtos hpotecaos hoy vgentes con el Banco Gupo de vaables de ngesos contables geneados po clente (D) - Ingesos contables geneados po el clente po concepto de mantencón, spead de nteeses, comsones y otos ngesos en líneas de cédto. - Ingesos contables geneados po el clente po concepto de mantencón, spead de nteeses, comsones y otos ngesos en tajetas de cédto. - Ingesos contables geneados po el clente po concepto de spead de nteeses, comsones y otos ngesos en cédtos no hpotecaos. - Ingesos contables geneados po el clente po concepto de spead de nteeses, comsones y otos ngesos en cédtos hpotecaos. 85

86 Gupo de vaables de compotamento (E) Vaables de compotamento del clente con el Banco - En qué tamo de moosdad se encuenta el clente con el Banco (menos de tenta días de moa, ente 30 y 60 días, ente 60 y 90 días o más de 90 días). - Monto en moa. - Pesenta deuda vencda con el Banco?. - Pesenta captal castgado con el Banco?. - Máxmo de días de moa en los poductos del Banco. - Clente está en "fle negatvo"?. - Clente pesenta cuenta ceada po el Banco?. - Clente pesenta cédtos enegocados que povenen de ncapacdad de pago. - Clente pesenta cédtos epactados que no povenen de ncapacdad de pago. - Clente pesenta deuda de vaos deudoes povenente de una tajeta caída. - Clente pesenta deuda de vaos deudoes povenente de una línea caída. Vaables hstócas de compotamento en el sstema fnanceo Los sguentes campos se han obtendo del nfome SBIF y de las bases del Banco: - Pomedo de la deuda decta moosa en el sstema fnanceo los últmos 3 meses. - Pomedo de la deuda decta vencda en el sstema fnanceo los últmos 3 meses. - Pomedo de la deuda ndecta vencda en el sstema fnanceo los últmos 3 meses. - Pomedo del saldo de la deuda decta castgada en el sstema fnanceo los últmos 3 meses. - Pomedo del saldo de la deuda ndecta castgada en el sstema fnanceo los últmos 3 meses. - Pomedo de la deuda decta moosa en el sstema fnanceo en un peodo compenddo ente 6 meses atás y los últmos 3 meses. - Pomedo de la deuda decta vencda en el sstema fnanceo en un peodo compenddo ente 6 meses atás y los últmos 3 meses. - Pomedo de la deuda ndecta vencda en el sstema fnanceo en un peodo compenddo ente 6 meses atás y los últmos 3 meses. - Pomedo del saldo de la deuda decta castgada en el sstema fnanceo en un peodo compenddo ente 6 meses atás y los últmos 3 meses. 86

87 - Pomedo del saldo de la deuda ndecta castgada en el sstema fnanceo en un peodo compenddo ente 6 meses atás y los últmos 3 meses. - Pomedo de la deuda decta moosa en el sstema fnanceo en un peodo compenddo ente 15 meses atás y los últmos 6 meses. - Pomedo de la deuda decta vencda en el sstema fnanceo en un peodo compenddo ente 15 meses atás y los últmos 6 meses. - Pomedo de la deuda ndecta vencda en el sstema fnanceo en un peodo compenddo ente 15 meses atás y los últmos 6 meses. - Pomedo del saldo de la deuda decta castgada en el sstema fnanceo en un peodo compenddo ente 15 meses atás y los últmos 6 meses. - Pomedo del saldo de la deuda ndecta castgada en el sstema fnanceo en un peodo compenddo ente 15 meses atás y los últmos 6 meses. Vaables de compotamento del clente en boletnes - Cheques potestados. - Otos documentos potestados en el Boletín Comecal. - Moosdades nfomadas al Boletín Comecal Gupo de vaables de deudas (F) Deudas del clente con el Banco - Saldo vgente en las líneas de cédto del Banco. - Cupo dsponble en las líneas de cédto del Banco. - Saldo vgente en las tajetas de cédto del Banco. - Cupo dsponble en las tajetas de cédto del Banco. - Saldo vgente en cédtos no hpotecaos del Banco. - Saldo vgente en cédtos hpotecaos del Banco. Deudas del clente con otas nsttucones - Deuda comecal en otos bancos. - Deuda de consumo en otos bancos. - Deuda hpotecaa en otos bancos. - Cupo dsponble en líneas y tajetas de cédto de otos bancos. 87

88 Vaables de las deudas hstócas en el sstema fnanceo Los sguentes campos han sdo obtendos del nfome SBIF - Deuda decta vgente en el últmo mes del últmo nfome de la SBIF. - Monto de línea de cédto dsponble en el últmo mes del últmo nfome SBIF. - Pomedo de la deuda decta vgente en un peodo compenddo ente 6 meses atás y los últmos 3 meses. - Pomedo del monto de línea de cédto dsponble en un peodo compenddo ente 6 meses atás y los últmos 3 meses. - Pomedo de la deuda decta vgente en un peodo compenddo ente 15 meses atás y los últmos 6 meses. - Pomedo del monto de línea de cédto dsponble en un peodo compenddo ente 15 meses atás y los últmos 6 meses. Vaables de leveage y de caga fnancea Estas vaables son sólo paa aquellos clentes que poseen enta - Nvel de leveage hpotecao total del clente. El leveage hpotecao se calcula como la deuda hpotecaa dvdda po la enta. - Nvel de leveage no hpotecao total del clente. El leveage no hpotecao se calcula como la deuda no hpotecaa dvdda po la enta. - Estmacón de la caga fnancea del clente. A contnuacón se detalla el contendo de cada una de las fuentes de datos utlzadas en la pesente nvestgacón y que necesaamente deben esta dsponbles en las bases opeaconales de cualque Banco Fuentes de datos dsponbles y sufcentes paa el poyecto Un supuesto fundamental de las hpótess de tabajo ha consstdo en que exsten bases de datos opeaconales que cualque Banco debe posee y que poveen nfomacón sufcente paa ealza los estudos de datamnng contemplados en esta nvestgacón. La descpcón de la nfomacón contenda en dchas fuentes de datos se entega a contnuacón: Infome de la SBIF: coesponde al nfome de deudas de cada clente en el sstema fnanceo chleno. Es un achvo que entega mensualmente la SBIF a los Bancos y el 88

89 cual ncluye las deudas consoldadas de 4,5 mllones de pesonas. Dcho nfome epota la deuda castgada, vencda, moosa y vgente, junto al cupo dsponble en líneas y en tajetas de cada pesona. Se poveen todos esos datos paa 13 meses dstntos y consecutvos, con un desfase de dos meses ente el últmo mes y el pesente. Infome D01 envado a la SBIF: coesponde a un nfome que mensualmente todos los Bancos están oblgados a enva a la SBIF, y que detalla las deudas que cada uno de sus clentes mantene con ellos, clasfcadas en deudas de consumo, comecales e hpotecaas, cada una dvdda en deuda vgente o vencda y subdvdda en cuentas de actvo y de oden. Se epota además en este nfome la deuda castgada del clente con el Banco. Adconalmente, paa pode dentfca qué deudas del achvo de opeacones fueon epotadas a la SBIF y bajo qué cteo, esta fuente de datos debe además ncopoa nfomacón que detalla paa cada cuenta asocada a una opeacón (nteeses, captal, etc.) el monto que es epotado a la SBIF en el D01 bajo una de las categoías sguentes: - Deuda decta vgente po cédtos comecales en cuentas de actvo - Deuda decta vencda po cédtos comecales en cuentas de actvo - Deuda decta vgente po cédtos comecales en cuentas de oden - Deuda decta vencda po cédtos comecales en cuenta de oden - Deuda decta vgente po cédtos de consumo en cuentas de actvo - Deuda decta vencda po cédtos de consumo en cuentas de actvo - Deuda decta vgente po cédtos de consumo en cuentas de oden - Deuda decta vencda po cédtos de consumo en cuentas de oden - Deuda decta vgente po cédtos hpotecaos paa la vvenda en ctas. de actvo - Deuda decta vencda po cédtos hpotecaos paa la vvenda en ctas. de actvo - Deuda decta vgente po cédtos hpotecaos paa la vvenda en ctas. de oden - Deuda decta vencda po cédtos hpotecaos paa la vvenda en ctas. de oden Saldos el día de envío del D01: coesponde a una base de datos opeaconal con la nfomacón, el día del envío del nfome D01 a la SBIF hace dos meses, de cada uno de los poductos que tene vgente cada clente con el Banco. Debe contene la fecha de otogamento del poducto, su fecha de extncón, el monto ognal en pesos de los 89

90 cédtos otogados, el saldo opeaconal, el monto mpago en los dstntos tamos de moosdad, el monto del captal vencdo, el monto del captal castgado, el saldo dsponble en pesos de las líneas y tajetas, la tasa de nteés anual del poducto, el plazo en meses de éste y el tpo de poducto al que se efee. Poductos: coesponde a un achvo que contene una lsta de códgos de poductos en los que el Banco asume una poscón aceedoa y que son clasfcados en cédtos de consumo, cédtos comecales, cédtos hpotecaos, líneas o tajetas de cédto. En este achvo se dentfcan tambén los cédtos que povenen de ncapacdad de pago de los clentes (como es el caso de los cédtos vaos deudoes entegados a clentes que no pudeon paga tajetas o líneas de cédto vencdas). Es pecso señala que otas fuentes de datos contenen nfomacón sobe los poductos, como es el caso de los Saldos el día de envío del D01 y de los Saldos actuales, no obstante los achvos opeaconales de los Bancos pueden se nmensamente complejos, po lo que es de cualque foma necesao dspone de una tabla de clasfcacón de los poductos a pat de su códgo. Esta fuente de datos denomnada Poductos consttuye pecsamente dcha tabla de clasfcacón. Saldos actuales: coesponde a una base de datos opeaconal con la nfomacón, el día pesente, de cada uno de los poductos que tene vgente cada clente con el Banco. Al gual que los Saldos el día de envío del D01 debe contene la fecha de otogamento del poducto, su fecha de extncón, el monto ognal en pesos, el saldo opeaconal, el monto mpago en los dstntos tamos de moosdad, el monto del captal vencdo, el monto del captal castgado, el saldo dsponble en pesos de las líneas y tajetas, la tasa de nteés anual del poducto, el plazo en meses de éste y el tpo de poducto del que se tate. Rentas de clentes: coesponde a una base de datos con la nfomacón fnancea de cada clente, ncluyendo la fecha de su últmo estado fnanceo declaado, su patmono, s posee un ben aíz, su enta, el tpo de enta (fja o vaable) y s se tata de un tabajado dependente o ndependente. Caacteístcas demogáfcas: coesponde a la ntegacón de múltples achvos y bases de datos opeaconales del Banco. Contene nfomacón demogáfca tal como el estado cvl, el númeo de hjos, el nvel educaconal, la pofesón, el tpo de clente, la 90

91 Unvesdad y el égmen conyugal. Los campos fundamentales que debe nclu esta fuente de datos son las fechas de nacmento, las natualezas juídcas de las pesonas, el campo que ndca s se tata de un clente que pesenta alguna cuenta ceada po el Banco, y el campo que señala s éste se encuenta en el denomnado Fle Negatvo. Factoes estmados de caga: coesponde a un achvo de paámetos que contene los pocentajes estmados de caga fnancea a asgna a la deuda de los clentes con otas nsttucones en las categoías hpotecaa y no hpotecaa. Ingesos contables po clente: coesponde genealmente a un datamat que egsta los ngesos que pecbe el Banco anualmente po cada clente en cada poducto po concepto de cobo de mantencón, spead de la tasa de nteés sobe el costo de fondo, comsones po uso de Redbank, cheques y otas tansaccones, seguos asocados a las cuentas y otos ngesos. 8.2 Descb los datos (taea 2b) En esta taea debeán descbse los datos en témnos de tpo, dstbucón, tablas de fecuenca, valoes máxmo y mínmo, y estadígafos tales como el pomedo, la vaanza, la asmetía y la cutoss, ente otos. Las descpcones de los esultados que se deben obtene como futo de esta taea se entegan a contnuacón: Repote de descpcón de datos (output 2b.1) De acuedo a la guía de usuao de la metodología CRISP-DM, este esultado descbe los datos que han sdo obtendos, ncluyendo su fomato y cantdad en témnos de númeo de egstos y de campos de cada tabla. Ente las actvdades que es pecso desaolla paa obtene este esultado se encuentan: - Analza el volumen de los datos. - Identfca los datos y el método de captua. - Accesa las fuentes de datos. - Utlza análss estadístcos de se éstos necesaos paa descb los datos. 91

92 - Realza un epote de las tablas que se utlzaán en el poyecto junto a sus elacones. - Chequea la consstenca del volumen de los datos, su multplcdad y complejdad. - Vefca que los datos contengan datos consstentes en texto lbe. - Vefca la accesbldad y la dsponbldad de los atbutos o campos de las tablas. - Vefca los tpos de atbutos o campos (numécos, smbólcos, etc.). - Chequea los angos de valoes de los atbutos o campos. - Analza las coelacones ente los atbutos. - Compende el sgnfcado en témnos de negocos de cada atbuto y de sus valoes. - Paa cada atbuto, calcula los estadístcos báscos (pomedo, máxmo, mínmo, desvacón estánda, vaanza, asmetía, cutoss). - Analza los estadístcos báscos y elacona los esultados con un sgnfcado en témnos de negocos. - Detemna s es elevante cada atbuto paa los dstntos objetvos de datamnng. - Entevsta a expetos en la matea paa ecoge su opnón especto de la elevanca de cada atbuto o campo a se utlzado en el poyecto. Vefca s es necesao balancea los datos, dependendo de la técnca de modelamento utlzada. - Analza las elacones ente las dstntas llaves de las tablas de datos a usa en el poyecto. - Revsa los supuestos y los objetvos del poyecto. - Actualza la lsta de supuestos s es necesao. 8.3 Exploa los datos (taea 2c) Esta taea coesponde a un conjunto de análss de los datos ealzados medante el empleo de gáfcos y tablas. A pat de dchos análss puede obtenese nfomacón valosa sobe la composcón de la catea de clentes de un Banco, sobe tendencas nteesantes y sobe opotundades de negocos no vsualzadas pevamente. Dchos análss pueden tambén esta dgdos dectamente al cumplmento de los objetvos de 92

93 datamnng, como así tambén al efnamento de la descpcón de los datos o a la vefcacón de la caldad de los msmos. Las descpcones de los esultados que se deben obtene como futo de esta taea se entegan a contnuacón: Repote de exploacón de datos (output 2c.1) De acuedo a la guía de usuao de la metodología CRISP-DM, este output consste en una descpcón de los esultados de la taea de exploacón de los datos, ncluyendo los pmeos descubmentos o las hpótess ncales y su mpacto sobe el esto del poyecto. El epote puede tambén nclu gáfcos que ndquen las caacteístcas de los datos o que conduzcan a la obtencón de subconjuntos de datos nteesantes paa exámenes ulteoes. Ente las actvdades que es pecso desaolla paa obtene este esultado se encuentan: - Analza en detalle las popedades de aquellos atbutos que sean patculamente nteesantes. - Identfca las caacteístcas de las subpoblacones. - Foma supuestos paa futuos análss. - Evalua la nfomacón y los descubmentos que se han elaboado pevamente en el epote de descpcón de los datos (output 2b.1). - Ama hpótess sobe los datos. - Tansfoma las hpótess en objetvos de datamnng, s es posble. - Clafca los objetvos de datamnng o hacelos más pecsos. - Ejecuta análss báscos paa vefca las hpótess sobe los datos. 8.4 Vefca la caldad de los datos (taea 2d) Esta taea consste en examna la caldad de los datos, chequeando que éstos estén completos, que no tengan valoes faltantes y que cuban todos los casos equedos. S los datos contenen eoes, debe detemnase qué tan fecuentes son éstos, y s hay valoes faltantes es pecso nvestga cómo están epesentados, dónde ocuen, y qué 93

94 tan comunes son. Las descpcones de los esultados que deben obtenese como futo de esta taea se entegan a contnuacón: Repote de caldad de los datos (output 2d.1) De acuedo a la guía de usuao de la metodología CRISP-DM, este esultado coesponde a una lsta de chequeos sobe la caldad de los datos. S en los datos hay poblemas de caldad, este output debe contene una lsta de las posbles solucones. Ente las actvdades que es pecso desaolla paa obtene este esultado se encuentan las sguentes: - Identfca valoes especales que pueden asum los campos de los datos y ealza un catálogo de su sgnfcado. - Revsa las llaves y los atbutos de las tablas de los datos. - Chequea cobetua de los datos (todos los valoes que pueden esta epesentados). - Chequea s calzan los sgnfcados de los atbutos con los valoes que contenen. - Identfca los atbutos faltantes y los campos en blanco. - Revsa atbutos con un msmo sgnfcado, peo que pesentan valoes dstntos. - Chequea las desvacones que se poducen con especto al gueso de valoes de un conjunto de datos, y decd s una desvacón patcula coesponde o no a un udo. - Chequea qué tan plausbles son los valoes que pesentan los campos de los datos (po ejemplo: todos los campos no pueden tene los msmos o cas los msmos valoes). - Revsa todos los atbutos que pemten elaboa conclusones que caen en conflcto con el sentdo común (po ejemplo: caga fnancea supeo a un 100%). - Usa dstntos tpos de gáfcos paa mosta las nconsstencas en los datos. - S los datos están almacenados en achvos de texto plano, chequea qué delmtado es utlzado y s es usado en foma consstente en todos los atbutos. Chequea el númeo de campos en cada egsto y ve s concden. - Chequea consstencas y edundancas ente dfeentes fuentes de datos. - Planfca cómo maneja el udo en los datos. Exclu, s es necesao, algunos datos. - Detecta el tpo de udo que se pesenta en los datos y qué atbutos son afectados. 94

95 9 TERCERA FASE DEL PLAN: PREPARACIÓN DE LOS DATOS El sguente dagama muesta las dstntas taeas que deben se ealzadas en la fase de pepaacón de los datos de la metodología CRISP-DM, junto a los esultados o outputs que deben obtenese de la ejecucón de cada una de ellas: Fgua 9.1 Taeas y outputs de la fase de pepaacón de los datos, tecea fase del poyecto de datamnng según metodología CRISP-DM Fuente: CHAPMAN, Pete, CLINTON, Julan, KERBER, Randy, KHABAZA, Thomas, REINARTZ, Thomas, SHEARER, Coln, WIRTH, Rüdge, CRISP DM 1.0 Step By Step Data Mnng Gude, SPSS Inc.,

96 El conjunto de taeas de la fase de pepaacón de los datos, junto a sus coespondentes esultados se descben a contnuacón. Se entegan consejos y ecomendacones que ecogen conceptos de la guía de usuao CRISP-DM 47 a la vez que apotes extaídos de la expeenca y eflexón del auto de este documento. Esta nvestgacón, como se ha señalado antes, no emplea nngún conjunto de datos, po lo que sólo podán entegase ndcacones conceptuales y geneales sobe los esultados que equeen manpulacón de datos concetos. Tal es el caso de las azones paa la nclusón o exclusón de datos en el estudo (output 3a.1), del epote de lmpeza de datos (output 3b.1), de los egstos geneados (output 3c.2) y de los datos efomateados (output 3e.1). En cambo, el supuesto sobe la exstenca de fuentes de datos con nfomacón sufcente paa ésta nvestgacón pemte entega ndcacones detalladas sobe cómo genea el output 3z.1, a la vez que sobe la descpcón de ese esultado (output 3z.2). De gual modo, medante el empleo de atbutos devados (output 3c.1) y de datos mezclados (output 3d.1) es posble tambén en este capítulo mosta cómo pueden estmase las deudas de los clentes con otas nsttucones fnanceas a pat de la nfomacón dsponble en las fuentes de datos. Dos de los esultados de esta fase no están vnculados a nnguna taea específca y se descben en pme luga (output 3z.1 y 3z.2). 9.1 Conjunto de datos (output 3z.1) De acuedo a la guía de usuao de la metodología CRISP-DM, este esultado consste en el conjunto de datos que son usados paa el modelamento y paa la mayo pate del tabajo de análss del poyecto de datamnng. En la obtencón de este esultado es pecso ealza un esfuezo consdeable al no dspone de un datawaehouse que almacene toda la nfomacón hstóca necesaa paa constu modelos pedctvos de esgo y entabldad. Tal esfuezo debe concentase en la ntegacón de datos povenentes de sstemas computaconales dstntos y que pesentan necesaamente nconsstencas debdo a que contenen nfomacón obtenda en fechas dstntas. 47 Fuente: CRISP-DM Use Gude, edactado po el CRISP-DM Consotum, documento contendo en CHAPMAN, Pete, CLINTON, Julan, KERBER, Randy, KHABAZA, Thomas, REINARTZ, Thomas, SHEARER, Coln, WIRTH, Rüdge, CRISP DM 1.0 Step By Step Data Mnng Gude, SPSS Inc.,

97 9.1.1 Obtencón automatzada del conjunto de datos en Clementne En esta seccón se lustaá como en un Banco caente de un datawaehouse es posble constu una base de datos con toda la nfomacón necesaa paa elaboa modelos pedctvos de esgo o entabldad. Dcha base de datos, que coesponde al output 3z.1 del modelo CRISP-DM, seá denomnada base fnal paa constu modelo pedctvo y constaá de las sguentes componentes: a.- Los valoes obsevados hoy de las vaables que se espeaba pedec hace un año. b.- El conjunto de valoes de las vaables pedctvas en gual peodo. La dea de la pesente nvestgacón es desaolla modelos que a pat de las vaables pedctvas hace un año (punto b del output 3z.1), sean capaces de estma el valo que tendían en la actualdad las vaables a pedec. Dchas estmacones pueden contastase con los valoes obsevados hoy de aquellas vaables (punto a del output 3z.1). Se espea constu modelos a pat de las vaables del punto b cuyas estmacones no dfean mucho de las obsevacones del punto a. Las vaables a pedec son dos: la condcón del clente de se malo en témnos de cédto, y la condcón del clente de se alguen sn gan entabldad potencal. El conjunto de valoes de las vaables pedctvas obsevables cuando todas las fuentes de datos tenen fecha de un año atás se denomnaá base de vaables pedctvas hace un año. Po el contao, el conjunto de valoes de las vaables pedctvas obsevables cuando todas las fuentes de datos tenen fecha de hoy se denomnaá base de vaables pedctvas hoy. Mentas la base de vaables pedctvas hace un año pemte estma el valo que tendían hoy las vaables a pedec, la base de vaables pedctvas hoy, pemte estma el valo que ellas tendían dento de un año. Po la foma como se han defndo en la seccón los conceptos de clente malo y de clente sn gan entabldad potencal, los valoes de las vaables del punto a del output 3z.1 pueden detemnase a pat de la base de vaables pedctvas hoy. En efecto, cada una de las caacteístcas que debe posee un clente paa se clasfcado como malo, o sn gan entabldad potencal puede detemnase medante smple obsevacón de gupos de vaables pesentes en la base de vaables pedctvas hoy, sn meda estmacón n pedccón alguna, como se muesta a contnuacón: 97

98 Las caacteístcas de un clente malo, las cuales se detallan a contnuacón, pueden todas obsevase a pat del gupo de vaables de compotamento: - Habe pesentado deuda decta vencda o deuda decta castgada en los últmos 12 meses de los nfomes de la SBIF. - Pesenta saldo de captal castgado con el Banco. - Pesenta monto de catea vencda con el Banco. - Pesenta una deuda enegocada con el Banco que povenga con ceteza de cédtos vencdos o castgados. - Fgua con alguna cuenta vaos deudoes en el Banco, la cual con ceteza povenga de más de 60 días de moa en alguna tajeta de cédto. - Fgua en el denomnado fle negatvo del Banco, que eúne al conjunto de clentes con los que éste no desea opea. - Fgua en el lstado de clentes cuyas cuentas han sdo ceadas po el Banco. En cambo, las caacteístcas de un clente sn gan entabldad potencal, y que se detallan a contnuacón, pueden obsevase a pat de gupos de vaables demogáfcas, de enta, de compotamento y de deudas: - La conjuncón de no se pofesonal, posee un ngeso mensual nfeo a un monto detemnado y no se lo sufcentemente joven paa camba de actvdad. - La conjuncón de se pofesonal, posee un ngeso mensual nfeo a un monto detemnado y no se pofesonal joven. - Ejece detemnadas pofesones y ofcos que son mal emuneados, que no pemten a las pesonas aumenta sus ngesos sgnfcatvamente en el futuo, y en los cuales los sujetos tenden a desempeñase duante toda su vda. - La conjuncón de no posee patmono, se mayo a una edad detemnada y posee un ngeso nfeo a un monto detemnado. - Se hombe y se una pesona mayo. - Se muje y se una pesona mayo. - Se un clente malo en témnos de esgo de cédto. 98

99 - Posee una capacdad esdual de endeudamento meno a un mllón de pesos. La fgua 9.2 muesta como es posble elaboa en Clementne el output 3z.1 a pat de la base de vaables pedctvas hace un año y de la base de vaables pedctvas hoy. El flujo de datos, a pate de sev como un dagama explcatvo, consttuye un pogama computaconal de pocesamento de datos. Fgua 9.2 Flujo de datos en Clementne que obtene la base de datos fnal paa constu un modelo pedctvo 48 El nodo etquetado Valo hoy de vaables que se espeaba pedec hace un año es utlzado paa calcula los valoes de las vaables que establecen la condcón del clente de se malo y de se alguen sn gan entabldad potencal. Dchos valoes son calculados a pat de los egstos del nodo etquetado Base de vaables pedctvas hoy. Luego, de los egstos obtendos se selecconan solamente los campos adconales ecén calculados, lo cual se efectúa en el nodo etquetado Seleccona sólo vaables que se espeaba pedec hace un año. Se obtene de esa manea lo que coesponde a la pate a del output 3z.1, la cual se mezcla con los egstos del nodo Base de vaables pedctvas hace un año, que apota la pate b del output 3z.1. Se obtene fnalmente una Base fnal paa constu modelo pedctvo, que coesponde al output 3z.1 A contnuacón se entega el sgnfcado de los dstntos símbolos utlzados en los flujos en Clementne, paa luego descb el funconamento completo del flujo de datos que obtene una base de vaables pedctvas. 48 Fuente: elaboacón popa 99

100 Símbolos usados en Clementne paa pocesa datos Los dstntos símbolos usados en los dagamas en Clementne se explcan agupados en conjuntos con caacteístcas smlaes. Los símbolos que se entegan a la deecha de cada pa de íconos se utlzan en este documento paa esalta nodos al momento de se explcados en los dagamas. Supenodos defndos po el usuao: Los sguentes íconos con foma de estella, denomnados supenodos, epesentan nodos defndos po el usuao en Clementne y esumen po sí solos flujos de datos completos. Pueden pocesa, depua, eemplaza o mezcla datos, camba su fomato o calcula campos. S ben pueden llega a se abtaamente complejos, es posble conceblos como smples cajas negas que ecben datos en un nput, ealzan alguna labo sobe ellos, y aojan datos en un output. Estos íconos ecben como nput un flujo de datos onlne povenente de oto nodo en Clementne y luego de pocesalo entegan como output oto conjunto de datos onlne, paa que éste sea usado a su vez po otos nodos. Éstos conos no ecben sus nputs vía onlne de otos nodos de Clementne, sno que dectamente de bases de datos. Consttuyen, po lo tanto, los nodos de nput de un flujo de datos en Clementne. Estos íconos ecben onlne un nput de datos povenente de otos nodos en Clementne, y luego de pocesalo guadan sus esultados dectamente en bases de datos. Consttuyen, po lo tanto, los nodos de output de un flujo de datos en Clementne. Flujos de datos: Estas flechas epesentan datos que fluyen onlne en Clementne desde el output de un nodo hasta el nput de oto nodo. Paa faclta la compensón de los dagamas en este documento los flujos de datos cas sempe van de zqueda a deecha. 100

101 Achvos de paámetos: Estos íconos epesentan achvos de que no contenen nfomacón de las bases de datos opeaconales popamente tales, sno tan sólo paámetos (como la clasfcacón de los poductos, los factoes estmados de caga fnancea a asgna a los dstntos tpos de clentes, etc.). Coesponden a pequeños achvos de texto. Nodos de opeacones sobe los egstos o campos: Los sguentes íconos con foma de hexágono venen pedefndos en Clementne y tenen en común el ealza opeacones ya sea sobe los egstos de los flujos de datos, o sobe sus campos (atbutos). Dchas opeacones pueden coesponde a la seleccón de algunos campos o egstos, o a dstntas fomas de mezcla los datos: Este cono ecbe como nput un flujo de datos con un conjunto de campos (atbutos) paa cada clente y entega como output el msmo conjunto de datos, sn agega n elmna nngún clente, peo habendo elmnado algunos campos. Este cono ecbe como nput un flujo de datos con un conjunto de campos paa cada clente y entega como output el msmo conjunto de datos, peo habendo elmnado algunos clentes. Este cono epesenta la mezcla de dos flujos de datos ecbdos como nput, entegando en el output los campos que apota paa cada clente tanto el pme como el segundo flujo. En la modaldad antjon pemte seleccona los egstos de clentes del pme flujo que no están pesentes en los egstos del segundo flujo. Este cono epesenta tambén la mezcla de dos flujos de datos ecbdos como nput, con la dfeenca de que en este caso cada flujo povee exactamente los msmos campos, peo efedos a conjuntos completamente dstntos de clentes. Este cono entega en el output los egstos de los clentes que ecbe en ambos nputs, sn agega n elmna nngún campo a nngún clente. 101

102 En la fgua 9.2 se ha hecho efeenca a bases de vaables pedctvas con datos actuales y con datos váldos hace un año. Ambas bases pueden obtenese con el flujo de datos de la fgua 9.3 dada abajo, almentando apopadamente dcho dagama con fuentes de datos con nfomacón vgente hoy, o po el contao vgente hace un año. Las fuentes de datos con nfomacón hace un año pueden obtenese a pat los espaldos en cnta de las bases opeaconales. El dagama 9.3 lusta cómo obtene una de tales bases de vaables pedctvas a pat de la mezcla, pocesamento y depuacón de las fuentes de datos que cualque Banco debe necesaamente posee, y que se esaltan a la zqueda de la fgua. La base de vaables pedctvas, en tanto, se obtene en la esquna nfeo deecha luego de un lago pocesamento. Fgua 9.3 Gan flujo de datos de Clementne mostando la obtencón de una base de vaables pedctvas a pat de dstntas fuentes de datos Fuente: elaboacón popa 102

103 Flujo de datos que obtene base de vaables pedctvas En pme luga, el flujo de datos tata de detemna las deudas que el clente tene con otas nsttucones fnanceas, paa lo cual se equee conoce las deudas del clente con el Banco y que fueon nfomadas a la SBIF hace dos meses. La dea fundamental que se utlza paa estma las deudas del clente con otas nsttucones es que no es posble conoce dchas deudas hoy, peo s es posble conoce las oblgacones que hace dos meses tenía el clente en el sstema fnanceo. Ello se debe a que el nfome que elaboa la SBIF, y que contene las deudas consoldadas en el sstema fnanceo de 4,5 mllones de chlenos, es entegado a los Bancos con un desfase de dos meses. Restando a las deudas que hace dos meses tenía el clente en el sstema fnanceo aquellas deudas que en gual peodo tenía el clente con el popo Banco es posble obtene con exacttud las deudas de los clentes con otas nsttucones hace dos meses. A falta de mayo nfomacón esa es la mejo estmacón paa las deudas que una pesona tene con teceos hoy. La fgua 9.4, dada abajo, muesta como se obtenen las deudas del clente con el Banco y que fueon nfomadas a la SBIF hace dos meses. El dagama es el msmo antes entegado en la fgua 9.3, con la salvedad de que en la fgua la pocón del dagama que se está analzando es esaltada en un pequeño ecuado en la esquna supeo zqueda. Dcho ecuado es amplado en un cuado de detalle en la esquna nfeo deecha. Los egstos de la fuente de datos etquetada Saldos el día de envío del D01 se mezclan con el achvo de paámetos ttulado Poductos, de manea tal de consdea sólo los saldos de cuentas que coesponden efectvamente a poductos de cédtos y no a oto tpo de poductos o cuentas. Además, el cuce con el nodo Poductos pemte clasfca los saldos en cédtos comecales, hpotecaos, de consumo o cupos de líneas o tajetas. El esultado de dcha mezcla se cuza a su vez con el Infome D01 envado a la SBIF, de manea que cada ítem epotado a la SBIF (ya sea como nteés, captal o monto en moa), pueda se atbudo a un poducto que el clente tenía vgente con el Banco hace dos meses. Así, se aba al nodo Deudas de clente con el Banco nfomadas a la SBIF, cuyos egstos almacenan ente sus campos a una pocón de las deudas que pesentaban los clentes en el sstema fnanceo hace dos meses, pocón que coesponde efectvamente a deudas con el popo Banco. 103

104 Fgua 9.4 Flujo de datos en Clementne que obtene las deudas de los clentes con el Banco y que fueon nfomadas a la SBIF hace dos meses 50 De acuedo al plan paa estma las deudas de los clentes con otas nsttucones se mezcla el flujo de datos consegudo hasta este momento y ttulado Deudas de clente con el Banco nfomadas a la SBIF con la fuente de datos etquetada Infome de la SBIF y que contene las deudas consoldadas de los clentes en el sstema fnanceo hace 2 meses. Restando a dchas deudas consoldadas las oblgacones de los clentes con el popo Banco hace dos meses, se obtene una estmacón paa las deudas de los clentes con otas nsttucones en el nodo Deudas de clentes con teceos, como se muesta abajo en la fgua 9.5. Es pecso nota, sn embago, que dcho nodo no contene las deudas con teceos de aquellos clentes que nunca fguaon en el nfome 50 Fuente: elaboacón popa 104

105 D01 envado a la SBIF hace dos meses. Dcha falenca se soluconaá más adelante (concetamente en el dagama descto en la fgua 9.9). Fgua 9.5 Flujo de datos en Clementne que estma las deudas de un clente con teceos 51 Se ha obtendo hasta este momento una estmacón de las deudas de los clentes con teceos a pat de las deudas nfomadas a la SBIF hace dos meses. Sn embago, en el caso de las deudas que mantenen los clentes con el popo Banco puede conocese el saldo actualzado de dchas oblgacones. Los sguentes dagamas tenen po popósto pecsamente obtene las deudas actualzadas de los clentes con el Banco. En el dagama 9.6 se mezclan en pme témno los Saldos actuales de las cuentas con los Poductos, con el fn de clasfca las deudas en cédtos comecales, deudas 51 Fuente: elaboacón popa 105

106 hpotecaas, cédtos de consumo, cupos de tajetas o líneas. Luego dchas deudas son dvddas ente aquellas que coesponden a deudas de cuentas que exstían antes del envío del achvo D01 a la SBIF hace dos meses, y aquellas que son oblgacones contaídas po los clentes con el Banco hace menos de dos meses, y que po lo tanto no fueon envadas en el D01. Ambas bfucacones coesponden a los nodos etquetados Saldos de cuentas ceadas antes del envío del D01 y Saldos de cuentas ceadas después del envío del D01, como se muesta a contnuacón: Fgua 9.6 Flujo de datos en Clementne que obtene los saldos actuales de las cuentas, tanto antes como después del envío del D01 hace dos meses 52 Los datos del nodo Saldos de cuentas ceadas antes del envío del D01 seván paa actualza las oblgacones que tenían los clentes con el Banco hace dos meses y que 52 Fuente: elaboacón popa 106

107 po lo tanto apaecen ente las deudas consoldadas de los clentes en el últmo nfome de la SBIF. El dagama 9.7 muesta esa actualzacón, mezclando el flujo Saldos de cuentas ceadas antes del envío del D01 con los egstos povenentes del nodo que cuza Infome D01 envado a la SBIF y la mezcla de Saldos el día de envío del D01 y Poductos. El esultado es etquetado Saldos actualzados de cuentas epotadas en el D01 envado a la SBIF. Fgua 9.7 Flujo de datos en Clementne que obtene los saldos actualzados de las cuentas epotadas hace dos meses en el D01 envado a la SBIF 53 El sguente dagama muesta como se consoldan la totaldad de deudas de los clentes con el Banco, tanto aquellas que se efeen a cuentas nfomadas a la SBIF hace dos meses como aquellas que el clente contajo posteomente. Ello se obtene 53 Fuente: elaboacón popa 107

108 medante la mezcla del esultado del nodo Saldo de cuentas ceadas después del envío del D01 y del nodo Saldos actualzados de cuentas epotadas en el D01 envado a la SBIF. El esultado es denomnado Deudas de clentes con el Banco. Fgua 9.8 Flujo de datos en Clementne que obtene las deudas actualzadas de los clentes con el Banco 54 El lecto habá poddo obseva que el nodo Saldos actuales ya contenía las deudas actualzadas de los clentes con el Banco. No paece muy ntelgente sepaa los egstos de dcho nodo en Saldos de cuentas ceadas antes del envío del D01 y Saldos de cuentas ceadas después del envío del D01, paa luego volve a un ambos conjuntos de egstos en el nodo Deudas de clentes con el Banco. La sepaacón y posteo unón de egstos se ealza con el popósto de descata eoes en los 54 Fuente: elaboacón popa 108

109 achvos opeaconales. En efecto, s una cuenta fue ceada antes de la fecha de envío del D01 hace dos meses, entonces necesaamente debea apaece ente los egstos del nodo Infome D01 envado a la SBIF, o de lo contao coespondeía a un eo en los achvos opeaconales, y debea po lo tanto se descatada. En este caso se supone que los egstos del nodo Infome D01 envado a la SBIF no pesentan los eoes que se obsevan en los datos opeaconales del nodo Saldos actuales. Ello se fundamenta en el hecho de que la nfomacón povsta a la SBIF debe pasa po exhaustvos pocesos de depuacón pevos. S ben el númeo de eoes en los datos puede se muy educdo, es pecso consdea que mecansmos como el antes descto son vtales en datamnng paa lmta su mpacto. En efecto, aun cuando los datos puedan contene un 2% de datos eóneos, ello puede se totalmente naceptable paa constu modelos que taten de detecta a clentes malos en una catea (debe tenese en consdeacón que los clentes malos epesentaán genealmente un pocentaje nfeo a un 2% de la catea 55 ). La educcón de los eoes pesentes en la muesta que se empleaá paa constu un modelo es uno de los medos paa mejoa la pedctbldad de dcho modelo. Sguendo con la explcacón del flujo de datos que genea el output 3z.1, es pecso nota que hasta este momento se han obtendo dos cosas mpotantes con los dagamas de Clementne: - Las deudas actualzadas del clente con el Banco - Una estmacón de las deudas con teceos de los clentes que fguaon en el D01 envado a la SBIF hace dos meses. Falta, no obstante, un tece elemento paa obtene las deudas totales de los clentes, tanto con el Banco como con teceos: el conjunto de deudas con teceos de aquellos clentes ecentes que nunca fguaon en el D01 envado a la SBIF hace dos meses. Dchos clentes ecentes se denomnaán nuevos de aquí en adelante. El sguente dagama muesta la mezcla de los nodos Deudas de clentes con teceos y Deudas de clentes con el Banco, paa luego clasfca los esultados en clentes nuevos (con menos de dos meses en el Banco) y clentes antguos : 55 El auto del pesente documento sugee lmta los eoes en los datos a nveles nfeoes a 0,1%. 109

110 Fgua 9.9 Flujo de datos en Clementne que sepaa los clentes nuevos (de hace menos de dos meses) de los clentes antguos 56 El flujo explcado hasta este punto nunca ha escatado las deudas del nfome SBIF de aquellos clentes que son nuevos. En efecto, en el flujo de datos se han obtendo úncamente los egstos del nfome de la SBIF que coesponden a clentes que fguaon en el nfome D01 envado hace dos meses, en ccunstancas que los clentes nuevos nunca estuveon en dcho nfome. Paa obtene una estmacón de las deudas con teceos de esos clentes seá pecso cuza el nodo clentes nuevos con el nodo Infome de la SBIF. Las estmacones de las deudas de los clentes nuevos con teceos no seá ota cosa que la totaldad de las deudas de dchos clentes en el últmo nfome de la SBIF. Dchas estmacones se muestan en el sguente dagama a tavés del nodo denomnado Deuda con teceos de clentes nuevos : 56 Fuente: elaboacón popa 110

111 Fgua 9.10 Flujo de datos en Clementne que estma las deudas con teceos de los clentes nuevos (de menos de dos meses de antgüedad) 57 En la fgua 9.10 el ecuado supeo que se utlza paa explca el flujo de datos está consttudo po dos áeas dsjuntas con bode snusodal, las cuales luego de se ampladas apaecen en la pate nfeo del dagama en un cuado de detalle. Dcha epesentacón no tene oto popósto que mosta el cuado de detalle con un nvel de aumento que faclte la lectua. Una epesentacón análoga paa el áea a se explcada se utlza en la fgua 9.11, la cual muesta como se obtene una base geneal de clentes a pat de la unón de los egstos del nodo clentes antguos y del nodo Deudas con teceos de clentes nuevos. El esultado es etquetado Deudas de clentes con el Banco y teceos. 57 Fuente: elaboacón popa 111

112 Fgua 9.11 Flujo de datos en Clementne que obtene las deudas de los clentes tanto con el Banco como con teceos 58 Hasta el momento paecea que el dagama en Clementne tuvese po popósto smplemente estma adecuadamente las deudas de los clentes y en vedad ese ha sdo pncpalmente el foco hasta ahoa. No obstante, es pecso ndca que junto con los flujos de datos desctos hasta este momento deben necesaamente vaja campos que no coesponden a deudas y que son vtales paa constu la base de vaables pedctvas. Ente esos campos se encuentan las vaables del tpo de elacón del clente con el Banco (antgüedad, tpo de clente, etc.), los sevcos contatados con el Banco y las vaables de compotamento hstóco (moosdades, deudas vencdas, etc.). A pate de esos campos es pecso tambén enquece el flujo de datos con 58 Fuente: elaboacón popa 112

113 vaables demogáfcas y de enta, lo cual se ealza a tavés del flujo de datos descto en la fgua 9.12 dada abajo: Fgua 9.12 Flujo de datos en Clementne que mezcla los datos de las deudas de los clentes, de su enta y de sus caacteístcas demogáfcas 59 El dagama 9.12 muesta la mezcla del nodo Deudas de clentes con el Banco y teceos con la fuente de datos Rentas de clentes. El esultado de la mezcla anteo apaece en la fgua bajo la etqueta Exste enta?, y es mezclado a su vez con la fuente de datos Caacteístcas demogáfcas. El esultado fnal es denomnado Está en fle negatvo? po pemt, ente otas cosas, dentfca a los clentes mpeddos de opea con el Banco. El sguente dagama, en tanto, muesta la obtencón de la base de vaables pedctvas a pat del flujo de datos antes descto. 59 Fuente: elaboacón popa 113

114 Fgua 9.13 Flujo de datos en Clementne que obtene la base de vaables pedctvas 60 El conjunto de datos ecbdo de las etapas anteoes a tavés del nodo Está en fle negatvo es mezclado con los egstos de la fuente de datos denomnada Factoes estmados de caga. Dcha fuente de datos contene, paa dstntos tamos de enta, una estmacón de la caga fnancea que un clente pomedo tendía po cada 100 pesos de deuda en el sstema fnanceo, dstnguendo la deuda en categoías hpotecaa y no hpotecaa. El esultado de la mezcla pemte calcula el nvel de caga fnancea de cada clente, lo cual es ealzado en el nodo que apaece en el dagama bajo la etqueta Caga fnancea. Fnalmente, la mezcla del nodo Caga fnancea con la fuente de datos Ingesos contables po clente genea la Base de vaables pedctvas fnal, como ndca la fgua en el magen nfeo deecho. 60 Fuente: elaboacón popa 114

115 En las seccones pevas se ha dscutdo amplamente cómo es posble obtene el conjunto de datos coespondente al output 3z.1 de la fase de pepaacón de los datos, svéndose paa ello de la heamenta de datamnng utlzada en el pesente documento (Clementne). En las seccones sguentes contnuaán descbéndose los dstntos esultados que deben obtenese y las dstntas taeas que deben ealzase como pate de la fase de pepaacón de los datos del poyecto de datamnng. 9.2 Descpcón del conjunto de datos (output 3z.2) Este esultado es el segundo de esta fase del poyecto de datamnng que no está vnculado dectamente a nnguna taea, y coesponde a la descpcón del output 3z.1, denomnado en este documento Base fnal paa constu modelo pedctvo. El output 3z.1 debe contene toda la nfomacón que a po se consdea elevante paa elaboa un modelo capaz de pedec el compotamento futuo del clente en témnos de esgo y de entabldad potencal. El output 3z.1 debe posee, po lo tanto, 90 campos, ncluyendo un campo paa cada una de las 88 vaables desctas en el capítulo 8. Además debe nclu dos campos adconales paa las vaables que se espea pedec, y que son la condcón de se malo en témnos de esgo y de se un clente sn gan entabldad potencal. 9.3 Seleccona los datos (taea 3a) Esta taea consste en escoge los datos que seán utlzados en el poyecto de datamnng. Los cteos de seleccón debeán nclu tanto la elevanca paa los objetvos de datamnng, como las estccones técncas y de caldad (tales como los límtes en la capacdad de almacenamento de los datos). Las descpcones de los esultados que se deben obtene como futo de esta taea se entegan a contnuacón: Razones paa la nclusón o exclusón de datos (output 3a.1) De acuedo a la guía de usuao de la metodología CRISP-DM, este esultado consste en una lsta de todos los datos a se usados o a se excludos en el poyecto de datamnng, junto a las azones que justfcan dchas decsones. Ente las actvdades que es pecso desaolla paa obtene este esultado se encuentan las sguentes: 115

116 - Recolecta datos adconales de dfeentes fuentes, tanto ntenas como extenas a la nsttucón. - Ejecuta tests de sgnfcanca y de coelacón paa decd s los dstntos campos debean se ncludos o no. - Reconsdea los cteos de seleccón de los datos a la luz de la expeenca que se haya tendo sobe la caldad de éstos. Decd s se deben nclu o exclu otos conjuntos de datos. - Reconsdea los cteos de seleccón de los datos a la luz de la expeenca que se haya tendo en una fase de modelamento posteo (po ejemplo: pueden equese conjuntos de datos adconales paa aumenta la capacdad pedctva del modelo de datamnng). - Seleccona dfeentes subconjuntos de datos (po ejemplo: sólo datos que eúnan cetas condcones). - Consdea el uso de técncas de muesteo, lo cual puede se necesao s una solucón nvoluca la educcón del tamaño del conjunto de datos de pueba, o s la heamenta de datamnng es ncapaz de maneja el conjunto de datos completo. - A pat de los cteos de seleccón de datos, decd s uno o más atbutos son más mpotantes que otos y pondealos de acuedo a ello. Basa la pondeacón en el contexto del poblema (po ejemplo: en base a la utlzacón que se haga de los atbutos). Puede tambén se útl tene muestas pondeadas paa da dstnta mpotanca a dfeentes atbutos o a dfeentes valoes del msmo atbuto. Más adelante, en el capítulo 10, se descbe cómo puede se deseable tene conjuntos de datos de entenamento con una popocón de clentes malos mayo a la popocón de clentes buenos, aun cuando en la ealdad los clentes malos epesenten menos de un 2% de la catea. - Documenta las azones paa la nclusón o exclusón de atbutos. - Chequea las técncas dsponbles paa el muesteo de datos. Es mpotante señala que en esta etapa del poyecto es pecso dsmnu al máxmo el númeo de vaables con que se almentaán los modelos de datamnng a desaolla en la fase sguente. S ben los modelos de egesón logístca pueden se efnados 116

117 teatvamente de manea de consdea sólo las vaables ealmente elevantes, y los 2 áboles de decsón pemten descata los atbutos elevantes medante la poda χ, los modelos de edes neuonales no otogan gual ventaja. Po oto lado, aun cuando las técncas de modelamento pemtan descata atbutos, puede smplfcase enomemente el tabajo de geneacón de un modelo dsmnuyendo en esta fase el númeo de las vaables a consdea. Además exste un fenómeno, conocdo como sobeajuste, que puede afecta po gual a cualque técnca de modelamento, y en vtud del cual los modelos tatan de eplca eoes o udos aleatoos de los datos, de manea de mta lo más posble una muesta de datos patcula. El sobeajuste ncopoa a los modelos vaables que son elevantes, y que pejudcan su pedctbldad. Paa evta el fenómeno deben ealzase análss de manea de consdea en los modelos sólo las vaables que son ealmente elevantes. 9.4 Lmpa los datos (taea 3b) Esta taea petende mejoa la caldad de los datos, de manea de alcanza el nvel de caldad equedo po las técncas de datamnng que se selecconen en la fase sguente del poyecto. Esta taea puede nvoluca la seleccón de subconjuntos de datos que no pesenten eoes, como así tambén la nsecón de valoes po omsón en el caso de exst datos faltantes. La descpcón de los esultados que se deben obtene como futo de esta taea se entega a contnuacón: Repote de lmpeza de los datos (output 3b.1) De acuedo a la guía de usuao CRISP-DM este esultado descbe las accones tomadas paa enfenta los poblemas de caldad de datos y que fueon epotados duante la ejecucón de la taea 2d de la fase anteo del poyecto. Este output debe tambén dentfca los poblemas de caldad de los datos que están aun vgentes. En este punto se debe detemna tambén s los datos con eoes seán utlzados en el poyecto y deben descbse las posbles consecuencas que ello podía tae sobe los esultados de datamnng. Ente las actvdades que es pecso desaolla paa obtene este esultado se encuentan las sguentes: 117

118 - Reconsdea el tatamento que se daá a los dstntos tpos de udo que se hayan obsevado en los datos - Coeg, esolve o gnoa el udo pesente en los datos - Detemna cómo maneja valoes especales, y qué sgnfcado atbules. Los valoes especales pueden conduc a muchos esultados extaños y deben se examnados cudadosamente. Ejemplos de valoes especales pueden sug de nfomacón que no fue peguntada a los clentes o que no fue espondda po éstos. Tambén pueden encontase valoes especales cuando los datos son tuncados (po ejemplo 00 paa la edad de 100 años). - Reconsdea los cteos de seleccón de datos a la luz de la expeenca que se haya tendo con especto a la lmpeza de datos. Decd s se deben nclu o exclu otos conjuntos de datos. 9.5 Constu datos (taea 3c) Esta taea ncluye la geneacón de atbutos devados a pat de otos campos, como es el caso de los pomedos o de la caga fnancea estmada. Incluye tambén el cambo de los fomatos de los campos exstentes, como puede se el caso de la tansfomacón de la enta y la edad en categoías de enta y de edad. La tansfomacón de vaables numécas en vaables dscetas es necesaa paa pemt a los algotmos de modelamento entega esultados en tempos azonables (como es el caso de las edes neuonales). Las descpcones de los esultados que se deben obtene como futo de esta taea se entegan a contnuacón: Atbutos devados (output 3c.1) De acuedo a la guía de usuao CRISP-DM este esultado consste en nuevos atbutos que se han constudo a pat de uno o más campos exstentes en un msmo egsto. Un ejemplo de atbuto devado es la edad, calculada a pat de la fecha de nacmento. Ente las actvdades que es pecso desaolla paa obtene este esultado se encuentan las sguentes: - Decd s algún atbuto debea se nomalzado. 118

119 - Detemna cómo pueden se constudos o ngesados los datos faltantes. Detemna el tpo de constuccón (po ejemplo medante un pomedo, ntepolando, o a pat de un modelo pedctvo). - Agega nuevos atbutos a los datos. Impotantes atbutos devados son las estmacones de las deudas de los clentes con otas nsttucones fnanceas, las cuales se explcan a contnuacón: Estmacón de las deudas con otas nsttucones fnanceas Las oblgacones de un clente con otas nsttucones fnanceas se pueden estma como las deudas consoldadas de dcha pesona en el últmo nfome SBIF menos las deudas que ésta pesona mantuvo con el Banco y que debeon se epotadas al ogansmo supevso en el msmo peodo. S ben paece un poceso smple, se complca poque la fecha del últmo nfome de la SBIF está desfasada dos meses con especto al pesente. Po oto lado, las deudas que son nfomadas po el Banco a la Supentendenca no están clasfcadas exactamente en la msma foma que las oblgacones en el nfome de la SBIF. Así, es dfícl a po sabe con exacttud qué pocentaje de cada deuda del nfome SBIF povno de qué oblgacón del clente con el Banco. Paa dentfca qué deudas del achvo de opeacones fueon epotadas a la SBIF y bajo qué cteo debeá utlzase nfomacón empleada en la elaboacón del nfome D01. Dcha nfomacón debe contene paa cada cuenta asocada a una opeacón (nteeses, captal, etc.) el monto que es epotado a la SBIF bajo dstntas categoías de deuda vencda o vgente y de cuentas de actvo o de oden. El poceso de estmacón de las deudas con otas nsttucones, po lo tanto, no es nmedato, y es de espea que se poduzcan eoes. No obstante, es pecso lmta dchos eoes a nveles aceptables, menoes al 1%, paa asegua que las muestas pemtan elaboa modelos confables Regstos geneados (output 3c.2) Este esultado es el segundo de la taea de constu datos (taea 3c). De acuedo a la guía de usuao CRISP-DM este output coesponde a egstos que ncopoan nueva nfomacón, que de ota foma no estaía pesente en las muestas empleadas paa ealza datamnng (po ejemplo: habendo segmentado los datos puede se útl 119

120 ncopoa un egsto adconal paa un clente pototpo de cada segmento). Ente las actvdades que es pecso desaolla paa obtene este esultado se encuenta: - Chequea las técncas dsponbles paa genea datos, s es que éstas se equeen (po ejemplo: mecansmos paa detemna las caacteístcas de los clentes-pototpo de cada segmento). 9.6 Intega los datos (taea 3d) En esta taea se combna la nfomacón de múltples bases de datos, achvos y tablas. Ello es necesao paa obtene cetos valoes, como es el caso de las deudas estmadas de los clentes con otas nsttucones. La descpcón del esultado que debe obtenese como futo de esta taea se entega a contnuacón: Datos mezclados (output 3d.1) Este esultado coesponde a la obtencón de conjuntos de datos a pat dos o más tablas que tenen nfomacón dstnta sobe los msmos clentes, sobe los msmos poductos o sobe las msmas opeacones. Ente las actvdades que es pecso desaolla paa obtene este esultado se encuentan las sguentes: - Chequea que las heamentas de ntegacón sean capaces de mezcla las fuentes de datos como se equee. - Intega las fuentes de datos y almacena el esultado. - Reconsdea los cteos de seleccón de datos a la luz de la expeenca que se haya tendo en la ntegacón de datos. Detemna s se deben nclu o exclu nuevos conjuntos de datos. Como se ha lustado al comenzo de este capítulo, la mezcla de datos se utlza ntensvamente en la geneacón del output 3z.1, al ntega egstos povenentes de una ampla gama de fuentes de datos dstntas. La mezcla de datos pemte tambén elaboa estmacones de las deudas de los clentes con otas nsttucones fnanceas, po cuanto éstas se constuyen a pat de dvesas fuentes de datos (las bases opeaconales del Banco, los nfomes D01 envados a la SBIF y los epotes con las deudas consoldadas de las pesonas que dcho ogansmo supevso entega mensualmente). 120

121 9.7 Fomatea los datos (taea 3e) En esta taea se ealzan modfcacones sobe los datos que no altean su sgnfcado, peo que pueden se necesaas paa tabaja con la heamenta de datamnng. Un ejemplo puede se el cambo de la vaable RUT desde tpo texto a númeo, a fn de mezcla nfomacón sobe un msmo clente contenda en dos tablas, en una de las cuales el RUT es numéco y en la ota, texto. La descpcón del esultado que debe obtenese como futo de esta taea se entega a contnuacón: Datos efomateados (output 3e.1) De acuedo a la guía de usuao de la metodología CRISP-DM, este esultado coesponde al conjunto de datos cuya epesentacón computaconal ha sdo cambada sn modfca su sgnfcado. Ente las actvdades que es pecso desaolla paa obtene este esultado se encuentan las sguentes: - Camba el oden de los campos de los egstos. - Odena los egstos. - Refomatea el almacenamento nteno de los valoes (po ejemplo: de texto a númeo). 121

122 10 CUARTA FASE DEL PLAN: MODELAMIENTO El sguente dagama muesta las dstntas taeas que deben se ealzadas en la fase de modelamento de la metodología CRISP-DM, junto a sus esultados: Fgua 10.1 Taeas y outputs de la fase de modelamento, cuata fase del poyecto de datamnng según metodología CRISP-DM 61 A contnuacón se descben las dstntas taeas que es pecso ealza en esta fase junto a los esultados que deben obtenese de cada una. Se entegan asmsmo 61 Fuente: CHAPMAN, Pete, CLINTON, Julan, KERBER, Randy, KHABAZA, Thomas, REINARTZ, Thomas, SHEARER, Coln, WIRTH, Rüdge, CRISP DM 1.0 Step By Step Data Mnng Gude, SPSS Inc.,

123 consejos y ecomendacones extaídos de la guía de usuao CRISP-DM 62 y de la expeenca y eflexón del auto de este documento. Puesto que esta tess no se basa en nngún conjunto de datos, no pueden, po lo tanto, entegase ndcacones específcas con especto a los esultados que equeen de la manpulacón de datos concetos. Así ocue con los supuestos de modelamento (output 4a.2), con la defncón de los paámetos de los modelos (output 4c.1) y con el establecmento de los paámetos evsados (output 4d.2). En cambo, en este capítulo se ofece una extensa descpcón de las tes técncas de modelamento (output 4a.1) que se ajustan mejo al caso de las campañas bancaas. Así msmo, al explca el dseño de las puebas (output 4b.1) se dan tambén ndcacones páctcas efedas a las campañas bancaas. Del msmo modo al descb el output 4c.3 se explcan las fomas de especfca los modelos de esgo y de entabldad con cada una de las tes técncas de modelamento antes menconadas. Posteomente, al momento de comenta la evaluacón técnca de los modelos (output 4d.1) se detallan las pncpales meddas estadístcas que es posble utlza, a la vez que se explca cómo automatza el poceso de evaluacón técnca medante el empleo de Clementne Seleccona la técnca de modelamento (taea 4a) Como pme paso en el modelamento es pecso seleccona la técnca que se utlzaá. Las dstntas técncas dsponbles deben evaluase en elacón a su capacdad paa alcanza los objetvos de datamnng, tenendo en cuenta las estccones de ecusos del poyecto. No debe olvdase que no todas las heamentas y técncas son aplcables a cada taea, paa cetos poblemas solo algunas técncas son apopadas. Puede se el caso que solo una heamenta o técnca esté dsponble paa esolve el poblema, y aun aquella puede no se del todo técncamente la mejo altenatva paa el poblema en cuestón. La descpcón de los esultados que se deben obtene como futo de esta taea se entega a contnuacón: Técnca de modelamento (output 4a.1) Coesponde a la descpcón de la técnca de modelamento que se utlzaá en el poyecto de datamnng. Ente las actvdades que es pecso desaolla paa obtene 62 Fuente: CRISP-DM Use Gude, edactado po el CRISP-DM Consotum, documento contendo en CHAPMAN, Pete, CLINTON, Julan, KERBER, Randy, KHABAZA, Thomas, REINARTZ, Thomas, SHEARER, Coln, WIRTH, Rüdge, CRISP DM 1.0 Step By Step Data Mnng Gude, SPSS Inc.,

124 este esultado se encuenta decd sobe las técncas apopadas de datamnng, tenendo en mente la heamenta de softwae escogda (Clementne en este caso). Ente las técncas de modelamento más apopadas paa desaolla modelos pedctvos de esgo y entabldad se encuentan la egesón logístca, las edes neuonales y los áboles de decsón, y las tes son sopotadas po Clementne. En las seccones sguentes se descbán en detalle esas tes técncas, ndcando específcamente como constu modelos pedctvos de esgo y entabldad, y cómo dchos modelos pueden se efnados a tavés de dvesos mecansmos Regesón logístca La egesón logístca es un método estadístco adaptado al estudo del vínculo ente una vaable cualtatva y un conjunto de vaables cuanttatvas. La egesón logístca es smla a la egesón múltple y es utlzada con fecuenca cuando la vaable dependente es bnaa, como es el caso de la clasfcacón de los clentes en buenos y malos en témnos cedtcos, o clentes con potencal y sn potencal en témnos de entabldad. El método puede utlzase tambén cuando las vaables explcatvas son cualtatvas, eemplazando los valoes de cada vaable cualtatva po un índce. En el modelo más smple de egesón logístca la vaable dependente Y es bnaa, en tanto que la únca vaable explcatva X es numéca, po ejemplo: X : caga fnancea Y : condcón de bueno o malo en témnos de esgo de cédto (0: bueno, 1: malo) Se denotan las obsevacones de las vaables con letas mnúsculas: x y : obsevacón de la vaable X paa el caso de un clente cualquea : obsevacón de la vaable Y paa el caso de un clente cualquea Ahoa ben, las obsevacones x e y efedas a un clente específco se denotan x e y, espectvamente. De las vaables aleatoas { Y 1, Y2... Yn} se obtenen n obsevacones ndependentes denotadas po el vecto = y y ), y que como y,... ( 1 2 yn coesponden a la condcón de buenos o malos de n clentes dstntos. El conjunto de las vaables explcatvas de todos esos clentes se denomna = x x ). x,... ( 1 2 xn 124

125 No es posble vsualza con cladad la exstenca de una elacón ente X e Y s las obsevacones antes obtendas se epesentan contastadas con los valoes de la caga fnancea de cada clente, como muesta el sguente gáfco: Fgua 10.2 Clentes buenos y malos vesus caga fnancea 63 En cambo, s se dvde la vaable caga fnancea en clases y se calcula paa cada una la popocón de clentes malos, se obtene una gáfca bastante más nstuctva: Fgua 10.3 Popocón de clentes malos po clase de caga fnancea Fuente: elaboacón popa a pat del lbo de TENENHAUS, Mchele, Méthodes Statstques en Geston, Edtoal Dunod, Fance, Fuente: dem. a la anteo 125

126 Puede estmase la pobabldad de que un clente sea malo dada una caga fnancea a pat de la popocón de clentes malos po clase. Po oto lado la menconada pobabldad condconal es gual a la espeanza E ( Y x) sguentes ecuacones: E ( Y x) = P( Y = 1 x) * 1+ P( Y = 0 x) * 0 = P( Y = 1 x) El modelo de egesón lneal E ( Y x) α + βx 126, como lo demuestan las = no es aconsejable paa epesenta la condcón de buenos y malos de los clentes po vaas azones: 1.- El modelo de egesón lneal entega pedccones paa la vaable dependente fuea del ntevalo [0, 1]. d( E( Y x) ) 2.- La devada dx debea tende a ceo cuando x tende a ceo o a uno. 3.- Las vaables dependentes bnaas volan supuestos del modelo de egesón lneal, po cuanto sus eoes no son nomales sno bnomales y tampoco tenen una vaanza constante (puesto que aquella es una funcón del valo a pedec). El modelo de egesón logístca pemte epesenta de mejo manea E ( Y x) supuesto básco del modelo consste en descb las pobabldades como una funcón logístca de las vaables explcatvas. En el caso de una únca vaable explcatva la pobabldad de que un clente sea malo, denotada como π, debe cumpl: π = E Y ( x ) = P( Y = 1 x ) En luga de modela las pobabldades α + βx e = α + βx 1+ e. El π dectamente, se pefee modela una tansfomacón de ellas denomnada logt, la cual se muesta en la sguente ecuacón bajo la notacón g ( x ) paa emaca su dependenca de x : g( π x ) = ln = α + βx 1- π En la jega de los modelos automatzados de decsón de cédto se conoce como odds al témno 1 π lneal en el logatmo de los odds. π. Puede obsevase que el modelo de egesón logístca es

127 Los paámetos α y β del modelo de egesón logístca pueden estmase medante el método de máxma veosmltud. La funcón veosmltud no es ota cosa que la pobabldad de obtene valoes de la vaable Y, pobabldad expesada en foma tal que las vaables explcatvas X se suponen fjas y los paámetos α y β se consdean vaables. Dada una muesta de n clentes, con un conjunto de valoes de las vaables explcatvas denotado po el vecto = x x ) y un conjunto de x,... ( 1 2 xn y,... valoes de las vaables dependentes denotado po = y y ), el método de ( 1 2 yn máxma veosmltud obtene los paámetos α y β que hacen que el valo de la funcón veosmltud sea máxmo. Dcho de oto modo, el método obtene los paámetos del modelo de egesón que hacen más pobable la obtencón de una muesta. Paa obtene la funcón veosmltud de un conjunto de vaables = ( y y n) y, y coespondentes a la condcón de buenos o malos de n clentes dstntos, es pecso nota que las pobabldades de que un clente sea bueno o malo pueden se esctas como potencas de y, como muestan las sguentes ecuacones: P 1 1 ( y = 0) = ( 1- π ) = ( 1- π ) = ( 1- π ) 1 ( y = 1) = π = ( π ) ( π ) P = En ambos casos pueden escbse las pobabldades como: ( π ) ( 1- π ) S las vaables Y, Y... } son ndependentes ente s, la pobabldad de obtene los { 1 2 Yn y,... esultados = y y ) cada ( 1 2 yn y y y 1 se obtene multplcando las pobabldades de obtene y. Po ello, la funcón veosmltud de obtene = y y ) escbse, en tal caso, como sgue: L n = = 1 ( ) ( π ) ( 1- π ) y y 1 y y,... y ( 1 2 yn puede Paa detemna los paámetos que hacen que dcha funcón sea máxma puede gualase a ceo el gadente de la funcón veosmltud L ( y ) con especto al vecto de 127

128 β = ( α, β paámetos ). No obstante, nomalmente se pefee tabaja con el logatmo de la funcón veosmltud, que se denotaá como l ( y ) y que puede calculase como lo ndca la sguente ecuacón: l = = 1 ( y) ln( L( y) ) = ln ( π ) ( 1- π ) Dado que la funcón logatmo es monótona cecente, ( y ) n L y l ( ) son maxmzadas po los msmos valoes de β, po lo que se maxmzaá l ( y ) paa obtene los ˆ = estmadoes β ( α, β) ˆ ˆ y 1 de los paámetos del modelo. Utlzando las popedades de los logatmos es posble escb la ecuacón anteo de manea más smple: l ( ) = ln ( 1- π ) y = n = 1 π 1- π y n n π y ln + = 1 1- π = 1 ln y ( 1- π ) Luego puede expesase l ( y ) en témnos de los paámetos β, utlzando las ecuacones sguentes: ln ( 1 π ) π ln 1- π α + βx e = ln 1 α + βx 1+ e α + βx = ln 1+ e = α + βx = ln 1+ Fnalmente se obtene la sguente expesón paa l ( y ) : e y 1 α + βx l n ( y) = ( y ( α + βx )) = 1 = 1 n α + βx ln 1+ e 128

129 129 Calculando el gadente de ( ) y l con especto a los paámetos β, evaluando luego dcho gadente en los estmadoes βˆ de los paámetos del modelo e gualando las ecuacones esultantes a ceo, se obtendá el conjunto de ecuacones: 0 β (β) = ˆ l Dchas ecuacones pemten obtene los estmadoes de máxma veosmltud y pueden escbse en este caso como sgue: 0 π x y x βx α 1 βx α x y x β y β 0 π y βx α 1 βx α y α y β n 1 n 1 n 1 n 1 n 1 n 1 n 1 n 1 e e e e = = = = = = = = = = = = = = ) ( ) ( l l Este sstema de ecuacones no tene solucón analítca y equee de un poceso numéco teatvo paa esolvelas. Dcho poceso puede no convege a una solucón Repesentacón de modelos medante egesón logístca El modelo que se ha descto hasta este punto puede se genealzado paa k vaables explcatvas, coespondentes a dstntas caacteístcas de cada clente. El conjunto de dchas vaables seá esumdo en una sola vaable explcatva vectoal, como lo muesta la fómula: ) ( k 2 1 X X X X..., =. Un conjunto de obsevacones de dchas vaables, efedas todas a un msmo clente se denotaá po ) ( k 2 1 x x x x..., =. La pobabldad de que un clente sea malo, en este caso, queda descta po la sguente

130 130 funcón logístca: k k x β x β β x = ) ( g, donde ) ( x g es la tansfomacón logt. Las pobabldades π, po lo tanto, debeán cumpl: ) ( ) ( x 1 x π e e g g + = Al gual que en el modelo smple de egesón logístca, en este caso el logatmo de la funcón veosmltud podá tambén expesase medante la fómula: ( ) ( ) ( ) = = = + = = n 1 n 1 n 1 1- π ln 1- π π ln y 1- π y 1- π π ln y l La cual puede epesentase en témnos de los paámetos, utlzando paa ello las sguentes ecuacones: ( ) x 1- π π ln x 1 ln x 1 1 ln x 1 x 1 ln π 1 ln e e e e ) ( ) ( ) ( ) ( ) ( g g g g g = + = + = + = Fnalmente se obtene la sguente expesón paa ( ) y l : ( ) ( ) = = + = n 1 n 1 x 1 ln x y y e ) ( ) ( g g l Po lo que las ecuacones 0 β (β) = ˆ l se conveten en:

131 l ( β β l ( β β 0 j y ) = = y ) = = n y = 1 = 1 n n y n = 1 = 1 1+ π n n j x y = 1 = 1 n n j x y = 1 = 1 x g( x e e = 0 x j ) g( x j π ) 1+ g( x e e ) g( x { = 0 j ) 1,...k ˆ Los estmadoes de los paámetos venen dados po: β = ( βˆ, βˆ,... ˆ ) } 0 1 βk Refnamento teatvo de los modelos de egesón logístca Paa efna el modelo de egesón logístca es mpotante ncopoa en él solo las vaables que son ealmente pedctvas, po cuanto el esto sólo contbuye a aumenta los eoes ente las obsevacones y las pedccones. Po ello es pecso detemna el apote de cada vaable al modelo, paa lo cual exsten dvesos tests, ente ellos el test de Wald, el test de Scoe, y test de azón de veosmltud, sendo éste últmo el más utlzado. En el test de azón de veosmltud se calcula el estadístco G : Veosmltud sn la vaable G = 2 ln Veosmltud con la vaable Bajo la hpótess H 0 de que el coefcente j β de la vaable j en (x) g es gual a 0, G sgue una dstbucón 2 χ con un gado de lbetad. Po tablas de dcha dstbucón es posble echaza la hpótess H 0 con un nvel de sgnfcanca que puede se fjado a pat de la ealdad del negoco, po ejemplo un 5%. Ahoa ben, es posble constata po tablas de la dstbucón χ 2 con un gado de lbetad que con un nvel de sgnfcanca de 5% G debe se meno a 0, Po lo tanto, con un nvel de sgnfcanca de 5% coesponde elmna del modelo la vaable j s G es mayo a dcho valo. De esta manea es posble efna el modelo en foma pogesva, 131

132 ncluyendo en él sólo las vaables más sgnfcatvas y descatando el esto. Una vez elmnada la vaable j vuelven a estmase los paámetos de las vaables estantes esolvendo nuevamente el sstema de ecuacones: l (β) ˆ = 0 β Dcho sstema debeá se eescto, po cuanto β y x ya no tendán coefcentes n témnos paa la vaable elmnada. El poceso de elmnacón contnúa hasta que ya no es posble elmna vaables con el nvel de sgnfcanca escogdo Redes neuonales Desaolladas po McCulloch y Ptts en 1943, se basan en nodos o undades, que coesponden a un modelo matemátco del funconamento de una neuona. Fgua 10.4 Un modelo matemátco smple paa una neuona 65 El dagama 10.4 lusta uno de tales nodos. Los nodos de las edes neuonales se comuncan medante enlaces dgdos. Un enlace del nodo j al nodo popaga la vaable de actvacón a j desde j hasta. Cada enlace tene un peso 132 W j, asocado, el cual sve paa detemna la ntensdad y el sgno de la conexón. El nodo calcula un pomedo pondeado de las vaables que ecbe a tavés de los enlaces de entada, 65 Fuente: RUSSELL, Stewat, NORVIG, Pete, Atfcal Intellgence, a Moden Apoach, Second Edton, Chapte 20, Statstcal Leanng Methods, Pentce Hall, 2003

133 utlzando los pesos dcho pomedo, el cual se denomna W j, como factoes de pondeacón. La sguente fómula expesa n n : = ( W * a ) j El nodo evalúa la funcón de actvacón g sobe el pomedo pondeado n antes calculado, obtenendo el esultado a, que seá comuncado a otas undades medante los enlaces de salda. La sguente fómula muesta el cálculo de a : a j, = g ( n ) = g j j ( W ) j, * a j Las flechas de la zqueda de la fgua 10.4 coesponden a enlaces de entada que ecbe el nodo desde nodos j. El nodo ecbe además una vaable con un valo fjo a 0 a tavés de una conexón especal con un peso W 0,, el cual se denomna sesgo. El nodo se gatlla cuando una combnacón lneal de sus nputs sobepasa ceto umbal, el cual vene detemnado po el sesgo W 0,. Fgua 10.5 Funcones de actvacón de una neuona: funcón escalonada (a) y funcón sgmodal (b) Fuente: RUSSELL, Stewat, NORVIG, Pete, Atfcal Intellgence, a Moden Apoach, Second Edton, Chapte 20, Statstcal Leanng Methods, Pentce Hall,

134 El dagama 10.5 muesta dos funcones de actvacón de una neuona. La funcón de actvacón pemte a un nodo aoja un esultado sólo cuando los nputs son los coectos. A contnuacón se muesta como los nodos de una ed neuonal pueden se utlzados paa epesenta funcones booleanas a tavés de dstntos nputs a j y sesgos W 0,. Fgua 10.6 Undades con una funcón de actvacón escalonada que pueden epesenta dstntas puetas lógcas 67 Las edes neuonales pueden sev ncluso paa epesenta funcones vectoales, medante la utlzacón no sólo de una, sno de múltples undades de salda. De ese modo los múltples nputs de una ed neuonal pueden conectase a los esultados aojados po ota ed neuonal cuyo output sea vectoal. Exsten dos clases de edes neuonales: las acíclcas y las cíclcas o ecuentes. Una ed acíclca entega una funcón calculada exclusvamente a pat de sus nputs. Una ed cíclca, en cambo, entega valoes que además dependen del estado nteno de la ed, el cual a su vez depende de los nputs pevos que ésta haya ecbdo. Una ed cíclca, además, se etoalmenta de sus popos outputs, po lo que se compota como un sstema dnámco capaz de alcanza un estado estable, de oscla ente detemnados estados, o de funcona como un sstema caótco. La sguente fgua 67 Fuente: RUSSELL, Stewat, NORVIG, Pete, Atfcal Intellgence, a Moden Apoach, Second Edton, Chapte 20, Statstcal Leanng Methods, Pentce Hall,

135 muesta una ed neuonal acíclca con dos undades de entada, una undad de salda y dos undades ocultas (vale dec, que no son undades n de entada n de salda): Fgua 10.7 una salda 68 Una ed neuonal con dos nputs, un nvel oculto de dos undades y Dado un vecto de nput x = ( x 1, x 2 ) paa la ed neuonal, el conjunto de valoes que entegan las undades de entada 1 y 2 de la ed (los esultados de los nodos de entada) se establecen en a 1 y a 2 guales a los nputs ecbdos, vale dec a 1 1 = x y a 2 2 = x. Los nodos 3 y 4, denomnados undades ocultas, en tanto, aojan las saldas a 3 y a 4, cuyos valoes se calculan como ndcan las sguentes ecuacones: a3 a4 = g ( W 1,3 a 1 + W 2,3 a 2 ) ( + ) = g W 1,4 a 1 W 2,4 La salda fnal de la ed neuonal, a 5, se calcula como sgue: a5 a 2 ( + ) = g W 3,5 Expesón que es tambén equvalente a: a5 a 3 W 4,5 ( g( + ) + ( + )) a 4 = g W3,5 W1,3 a1 W2,3 a2 W4,5 g W1,4 a1 W2,4 a2 68 Fuente: RUSSELL, Stewat, NORVIG, Pete, Atfcal Intellgence, a Moden Apoach, Second Edton, Chapte 20, Statstcal Leanng Methods, Pentce Hall,

136 Puede obsevase como el esultado de la ed neuonal acíclca es una funcón que depende tan solo de los nputs x = ( x 1, x 2 ) y de los paámetos W j,. Po lo tanto, escbendo el vecto de pesos como W, puede expesase el esultado que aoja una x h. W ed neuonal como una funcón que depende de x y W, lo cual se denota po ( ) Repesentacón de modelos medante edes neuonales Las edes neuonales pueden epesenta cualque tpo de funcón, ncluyendo funcones pobablístcas y lógcas, y en patcula pueden se utlzadas paa clasfca clentes y paa pedec su compotamento. Paa asgna a los clentes notas de esgo o de entabldad basta dvd el output de la ed neuonal en vaos tamos, y asgna una nota patcula s el output se encuenta dento de un tamo. A contnuacón se explca como una ed neuonal puede se utlzada paa pedec el que un clente se tansfome en malo en el futuo. La dea cental se encuenta en modela una funcón que asuma el valo 1 solamente cuando las vaables explcatvas del compotamento del clente hagan posble pedec que éste no seá un buen clente. Dado un conjunto de vaables { X 1, X 2... X k} canddatas a explca el que un clente se tansfome en malo en un detemnado hozonte de tempo, se desea constu una ed neuonal cuyo esultado h ( x) sea 1 en aquella egón del espaco W { X 1 X 2... X k }, en el que sea más pobable que el clente se vuelva efectvamente malo. Po ello, a contnuacón se mostaá como las edes neuonales, al almentase del esultado de otas edes neuonales, pueden aoja un valo cecano a 1 en zonas del espaco de vaables que son pogesvamente más complejas. Se dá que la ed neuonal se gatlla en aquella egón en la que aoja un esultado de 1. En pme luga, en la fgua 10.8 dada abajo, se muesta como medante una ed neuonal con dos nputs 1 x y valo 1 en una mtad del plano 2 x se puede epesenta un funcón smple que asume el x 1, x 2, y el valo ceo en la ota mtad. Posteomente se mostaá como una ed neuonal almentada con dos nputs a 1 y a 2, ambos esultados de otas edes neuonales, puede gatllase en egones más complejas, 136

137 como son una fanja nteseccón de dos semplanos, o en un áea fnta del espaco x 1, x 2. Fgua 10.8 Gáfco del output de un peceptón con dos undades de entada y una funcón de actvacón sgmodal 69 Se entende po peceptón a una ed neuonal smple, que caece de nodos ocultos. La fgua 10.8 muesta los esultados de un peceptón, que paa valoes bajos de x 1 se gatlla cuando x 2 alcanza un valo de 4. En cambo, cuando se está en pesenca de valoes más altos de 1 x, el peceptón se gatlla con valoes mucho menoes de Dcho compotamento se debe a que el peceptón aoja un esultado 1 cuando una combnacón lneal de sus nputs sobepasa ceto umbal. Una combnacón lneal de x 1, x 2 dvde el espaco de los nputs en dos áeas, que en ealdad son dos semplanos, en uno de los cuales se gatllaá el peceptón. 2 x. 69 Fuente: RUSSELL, Stewat, NORVIG, Pete, Atfcal Intellgence, a Moden Apoach, Second Edton, Chapte 20, Statstcal Leanng Methods, Pentce Hall,

138 Una ed neuonal que ecba como nput los esultados de dos peceptones como el anteo puede entega un output con foma de codllea, como se lusta en la fgua: Fgua 10.9 El esultado de combna dos funcones sgmodales paa obtene una codllea 70 Paa foma la codllea el pme peceptón se gatlla en el espaco de los nputs que está en ojo, mentas que el segundo peceptón lo hace en la zona achuada en vede. Po lo tanto, el nodo de salda de la ed neuonal se gatlla en la egón dada po la nteseccón de los dos semplanos anteoes, la cual es una fanja que se esalta en amallo. Abajo, en la fgua se muesta la salda con foma de ceo que es posble obtene de una undad que se almenta con los esultados en foma de codllea de dos edes neuonales como la antes descta. Almentando una ed neuonal con nputs en foma de ceo es posble genea una salda con múltples montañas ubcadas sobe puntos específcos del espaco de vaables de entada. 70 Fuente: RUSSELL, Stewat, NORVIG, Pete, Atfcal Intellgence, a Moden Apoach, Second Edton, Chapte 20, Statstcal Leanng Methods, Pentce Hall,

139 Fgua El esultado de combna dos codlleas paa poduc un ceo 71 Con un solo nvel de undades ocultas y sufcentes nodos en dcho nvel es posble epesenta cualque funcón contnua con el nvel de pecsón que se desee, en tanto que con dos nveles de undades ocultas es posble epesenta aun cualque funcón dscontnua Refnamento teatvo de los modelos de edes neuonales Ajustando los pesos W es posble camba la funcón que la ed neuonal calcula. El apendzaje de la ed neuonal se ealza pecsamente modfcando dchos paámetos de manea de educ pogesvamente la dfeenca ente el valo que se espea obtene de la funcón ( x) h y el valo que ésta efectvamente entega. W A contnuacón se descbe pmeo un algotmo teatvo paa ajusta los pesos de una ed neuonal acíclca sn undades ocultas (vale dec, un peceptón), paa luego extapola dcho algotmo a una ed con un nvel de undades ocultas. Se entega fnalmente un algotmo paa ajusta los pesos de una ed neuonal acíclca con múltples nveles de undades ocultas. Paa faclta la pmea fase de explcacón del 71 Fuente: RUSSELL, Stewat, NORVIG, Pete, Atfcal Intellgence, a Moden Apoach, Second Edton, Chapte 20, Statstcal Leanng Methods, Pentce Hall,

140 algotmo se entega la sguente fgua que epesenta un peceptón con cuato undades de entada y una undad de salda: Fgua Peceptón con una undad de salda 72 El eo al cuadado que se obtene en un ejemplo de entenamento utlzado paa ajusta el peceptón se defne como sgue: E = 1 2 E 1 2 ( ( )) 2 y h 2 x W Donde y epesenta el esultado a obtene s la ed funconaa coectamente, mentas que ( x) h coesponde al esultado que el peceptón efectvamente calcula. El nput W del peceptón vene dado po el vecto x. Puede obtenese el vecto de pesos W que mnmza el eo al cuadado medante el método del gadente. Utlzando dcho método los pesos se actualzan usando la ecuacón sguente 73 : W'' W ' + α = E( W ) W = W' 72 Fuente: RUSSELL, Stewat, NORVIG, Pete, Atfcal Intellgence, a Moden Appoach, Second Edton, Chapte 20, Statstcal Leanng Methods, Pentce Hall, Fuente: HILLIER F., LIEBERMAN G., Investgacón de Opeacones, Séptma edcón, Capítulo 13, Pogamacón no Lneal, McGaw-Hll Inteamecana,

141 Donde α es un paámeto conocdo como tasa de apendzaje. Los vectoes W ' coesponden al vecto de pesos W ajustado en teacones sucesvas. En tanto W y el gadente del eo al cuadado venen dados po los sguentes vectoes: W '' y W = W... W 1, j,...etc. E W ( ) = E W1,... E W j,...etc. Cada uno de los témnos del gadente puede vese como la contbucón que cada W j, entega al eo al cuadado total, y es equvalente a las expesones sguentes: Donde E W j, = E = E = E E W W g' j, j, y g ( n ) x j j ( W * x j ) j x coesponde a uno de los nputs que ecbe el peceptón desde sus undades de entada, y foma pate, po lo tanto, del vecto x de nput. En tanto g ' es la devada de la funcón de actvacón logístca. j, S se denomna o eo modfcado al sguente témno: E g' ( n ) =, puede vese como la contbucón al eo al cuadado del peso j x del nodo j multplcado po el eo modfcado del nodo. W j, coesponde al esultado El algotmo de ajuste de los pesos posgue paa cada ejemplo del conjunto de datos de entenamento. Cuando se ha aplcado a todos los ejemplos se habla de que se ha completado un peodo. El algotmo contnua completando peodos hasta que se 141

142 alcanza algún cteo de témno (po ejemplo: cuando las vaacones consecutvas de los pesos W ' y '' W son ya muy pequeñas). Ahoa se deducá un algotmo smla aplcado a una ed neuonal que contene undades ocultas. Paa ello es pecso nota que en el caso de tene una ed neuonal con uno o más nveles de undades ocultas no exste a po una ntepetacón claa paa los eoes de las saldas de dchas undades debdo a que no exsten obsevacones que pemtan ealza una compaacón. Es necesao, po lo tanto, calcula la contbucón al eo de la ed neuonal completa que ealza la salda de una undad oculta. A contnuacón se devaá dcha contbucón a pat de la mnmzacón de la suma de los eoes al cuadado de una ed neuonal con un únco nvel de undades ocultas y vaos nodos de salda, como la ed de la fgua: Fgua Red neuonal con un nvel oculto y dos undades de salda 74 El eo al cuadado obsevado paa un ejemplo de pueba usado paa entena la ed neuonal puede expesase a tavés de la sguente ecuacón: E = 1 2 E 2 = 1 2 ( y a ) 2 74 Fuente: elaboacón popa 142

143 Donde y es el esultado a obtene s la ed funconaa coectamente, mentas que coesponde al esultado que la ed efectvamente calcula. La suma se ealza sobe los nodos de las undades de salda. La componente del gadente de ese eo al cuadado con especto a un peso específco W j, en el nvel de salda vene dado po: a E W j, = = = = ( y - a ) = ( y - a ) ( y - a ) ( y - a ) g' ( n ) ( W a ) a W j, n g' ( n ) W W j, j, ( y - a ) g' ( n ) a j = a j j g( n ) W j, j, j Paa obtene la contbucón al eo al cuadado de los pesos 143 W k, j que conectan las undades de entada k a las undades ocultas j es pecso ealza la sumatoa completa de las devadas pacales sobe todos los nodos de salda, po cuanto cada valo de salda a puede vese afectado po los cambos en Antes, al obtene el gadente con especto a nodo j del nvel oculto no dependían de los pesos a W k, j. W j, se utlzó que los esultados de un W j, en el nvel de salda, en j otas palabas: = 0. Ahoa ben, al calcula el gadente con especto a los pesos W j, W k,j del nvel de entada k seá pecso consdea que los esultados a j del nvel oculto s dependeán de los pesos a j g( n j ) W k, j, o en otas palabas: = 0 W W Con ello en mente las componentes del gadente obtendas al deva el eo al cuadado con especto a W k, j venen dadas po las expesones sguentes, en las que el gadente se escbe fnalmente en témnos de los esultados de los nodos de entada : k, j k, j

144 E W k, j = = = = = = = ( y - a ) = ( y - a ) ( y - a ) W W W j, j, j, W k, j a W a W k, j n g' ( n ) W j k, j g' ( n g' ( n j j j ( W a ) ) W ( W j, g' ( n j ) a ) = a j k k, j j, = n ) W j k, j k, j j ( Wk, jak ) k k W j, g( n ) W k, j g( n W j k, j ) La últma ecuacón muesta la contbucón que ealza a la suma de los eoes al cuadado de la ed completa un peso W k, j coespondente a un vínculo que ecbe la undad oculta j. Dcha contbucón coesponde al esultado a k del nodo k multplcado po un facto que es smla al eo modfcado antes defndo, y que coesponde a la expesón sguente: j = g' ( n j ) ( W ) S la expesón anteo se acepta como defncón de eo modfcado de los nodos que son undades ocultas, nductvamente puede obtenese que la contbucón de cualque peso W j, a la suma de los eoes al cuadado de la ed neuonal vendá dada po el poducto del esultado del nodo j po el eo modfcado del nodo. j, * 144

145 Puede obtenese el vecto de pesos W que mnmza el eo al cuadado medante el método del gadente, actualzando los pesos a tavés de la ecuacón: W'' W ' + α = E( W ) W = W' El algotmo de ajuste de los pesos a tavés de la ed neuonal con vaos nveles de undades ocultas pocede en foma análoga al algotmo antes pesentado Cálculo con ed neuonal de pobabldad de que un clente sea malo En una seccón anteo se ha mostado como las edes neuonales pueden pedec el que un clente se vuelva malo en el futuo, mtando paa ello una funcón que asume el valo 1 solamente cuando las vaables explcatvas hacen posble pedec que el clente no seá un buen clente. En esta seccón se muesta como las edes neuonales pueden se usadas tambén paa calcula la pobabldad de que un clente sea bueno o malo en témnos cedtcos o de entabldad en un detemnado hozonte de tempo. La dea cental adca en que al utlza funcones de actvacón logístcas el esultado de cada neuona puede ntepetase en foma pobablístca. En efecto, una ed neuonal con una funcón de actvacón logístca puede ntepetase como una ed bayesana. Las edes bayesanas son gafos dgdos acíclcos cuyos nodos epesentan vaables aleatoas y cuyos acos denotan dependenca. Así, una flecha de un nodo A a un nodo B ndca que la vaable aleatoa B depende dectamente de la vaable A. Se dce en tal caso que A es pade de B. En una ed bayesana un nodo coespondente a una vaable aleatoa denota como X tene una pobabldad condconal de asum el valo x P x Pades X, donde X todas las vaables cuyos nodos son pades del nodo de la pobabldad de obtene los valoes ( x 1 x2... xk ) { X 1 X 2... X k } que se Pades epesenta el conjunto de X. Con dchas defncones, de un gupo de vaables aleatoas, se epesenta po: ( ) P x 1, x2... xk = P x Pades X 145

146 Un peceptón que tata de epoduc una vaable bnaa puede se vsto como una ed bayesana. Es posble apeca esto con cladad s se pensa en el output de la funcón logístca como la pobabldad condconal de obtene un esultado 1 dados los valoes de los nputs. Bajo este punto de vsta las edes neuonales que tatan de modela el que un clente sea malo dento de un detemnado hozonte de tempo en el fondo no hacen sno calcula la pobabldad condconal de que dcho clente sea malo dado que las vaables de nput x han asumdo detemnados valoes. Ahoa ben, s es posble ntepeta el esultado de una ed neuonal como una pobabldad condconal cabe peguntase qué tpo de estmacón de dcha pobabldad se obtene al aplca el algotmo de efnamento teatvo que se ha entegado en la seccón anteo. Como se mostaá a contnuacón, el algotmo que mnmza los eoes ente las obsevacones y los esultados de una ed neuonal no hace ota cosa que maxmza la funcón veosmltud de las obsevacones consdeadas en los ejemplos de entenamento. En otas palabas, las pobabldades condconales que entega una ed neuonal utlzan estmadoes de W que han sdo obtendos medante el método de máxma veosmltud al aplca el algotmo teatvo de efnamento de la ed sobe una base de ejemplos de entenamento. A contnuacón se calculaá el gadente con especto a W de la funcón veosmltud del esultado y que aoja un peceptón con una únca undad de salda al ecb los nputs x. Se mostaá que dcho gadente posee una deccón contaa al gadente del eo al cuadado que es usado en el algotmo de efnamento teatvo de las edes neuonales. Po ello, es clao que al mnmza el eo al cuadado de las obsevacones no se hace ota cosa sno maxmza la funcón veosmltud del esultado y. La funcón veosmltud puede escbse en foma dfeencable notando que ndependentemente del valo de y la pobabldad condconal de obseva ese esultado dado un conjunto de valoes de las vaables de entada x vendá dado po la ecuacón sguente: P y ( ) ( 1 h ( x) ) ( y) = h ( x) Ello vene del hecho de pode escb las pobabldades como sgue: 146 W W 1 y

147 147 ( ) ( ) ( ) ( ) ( ) ( ) y x x x 1 y P W 1 W W h h h = = = = ( ) ( ) ( ) ( ) ( ) ( ) ( ) y x x x 0 y P 1 W 1 W W = = = = h 1 h 1 h 1 El logatmo de la funcón veosmltud estaá descto po: ( ) ( ) ( ) ( ) = y x y x ln 1 W W h 1 h L En vez de maxmza la funcón veosmltud se puede maxmza el logatmo de dcha funcón. El gadente del logatmo de la funcón veosmltud vendá dado po: ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) j, W W 1 W j, W W 1 W W j, W W 1 W W 1 W 1 j, W W 1 1 j, W W j, W 1 1 j, W W 1 1 W j, 1 W 1 W j, j, W x x x E W x x x x y W x x x x y x y W x x y W x x y W x ln y W x ln y x ln y x ln y W y x y x ln W W = = = = = = = + + h h h h h h h h h h h h h h h h h h h h h h L Esta últma expesón puede smplfcase aun más consdeando que ( ) x W h es una funcón logístca, y que la devada de una funcón logístca debe cumpl la ecuacón:

148 g' = g ( 1 g). Así se tene que la devada del esultado ( x) puede escbse como sgue: h ( x) h ( x) ( n ) W j, W = = h = h W n W W Po lo que se obtene fnalmente que: W ( ) ( Wj,* x j ) W ( x) 1 h ( x) ( ) x j ( x) 1 h ( x) W L W j, j, W = E j, x j j W h con especto a W j, Puede vese que el gadente obtendo tene sentdo contao a la deccón de ajuste de los coefcentes en la ecuacón del pocedmento de mnmzacón de los eoes al cuadado dado en la seccón anteo. Se puede conclu, po lo tanto, que el algotmo que mnmza la suma de los eoes al cuadado del peceptón maxmza la veosmltud de las obsevacones utlzadas paa constu el modelo. S ben ello no se mostaá en esta seccón, la conclusón anteo no sólo es válda paa un peceptón, sno que tambén paa edes neuonales con múltples nveles de undades ocultas Áboles de decsón Un ábol de decsón ecbe como nput un conjunto de atbutos y entega una decsón, que puede se vsta tambén como una pedccón del output dados los nputs. Los nputs y los outputs de un ábol de decsón pueden se dscetos o contnuos, no obstante en esta seccón se supondán nputs dscetos y outputs booleanos. Un ábol llega a una decsón luego de aplca en cada nodo un test a un atbuto. Cada ama coesponde a uno de los valoes posbles de dcho atbuto. Las hojas entegan el output del ábol. A contnuacón se entega un ejemplo de un ábol de decsón que pemte clasfca a los clentes como buenos o malos en témnos de cédto. La decsón del ábol aoja un S en las hojas s un clente es bueno. La lsta de atbutos que consttuyen el nput del ábol, y que pemten toma la decsón son los sguentes: moosdad, tene 148

149 aval?, clente antguo?, otacón empleo, enta, pofesón, dependente?, patmono, comuna, y fnalmente, deuda. Fgua Ejemplo de ábol de decsón que pemte clasfca a los clentes en buenos y malos 75 Cada uno de los nodos del ábol, epesentados en el dagama medante cajas, está etquetado con el nombe de un atbuto, ndcando con ello que en él se aplca un test a los valoes de dcho atbuto. Así, po ejemplo, el nodo moosdad pueba el valo del atbuto del msmo nombe, entegando como output el esultado del subábol que comenza en la ama etquetada con el valo que haya asumdo dcho atbuto. S la moosdad de un clente es baja, el nodo moosdad entegaá como output el esultado del subábol que comenza en la ama etquetada baja, análogamente s la moosdad es alta, el nodo entegaá el esultado del subábol que comenza con la ama etquetada como alta. El ábol que sgue la ama baja de uno de los nodos 75 Fuente: elaboacón popa 149

150 etquetados moosdad es una hoja, gafcada como un cículo en el dagama, y po lo tanto entega una decsón fnal del ábol (en este caso un S ). Ejemplos específcos de clentes son pocesados po el ábol patendo de la aíz, sguendo luego las amas que coespondan a los valoes asumdos po los atbutos del clente hasta llega a una hoja. Po ejemplo, un clente con enta meda y sn deudas seá clasfcado como clente bueno (vale dec, se alcanzaá un output S en una hoja). Puede notase como el ábol de decsón no utlza los atbutos comuna y pofesón, puesto que ambos son consdeados elevantes paa clasfca a un clente en témnos de esgo de cédto Repesentacón de modelos medante áboles de decsón Cualque funcón booleana puede se epesentada medante un ábol de decsón. Ello puede conseguse tvalmente hacendo coesponde cada fla de la tabla de vedad de una funcón lógca con una uta en el ábol de decsón, desde la aíz hasta una de sus hojas. Ello da luga a un ábol de decsón exponencalmente gande, po cuanto una tabla de vedad tene una cantdad exponencal de flas. No obstante lo anteo, muchas funcones booleanas pueden se epesentadas con áboles más pequeños. Exsten, de cualque modo, funcones que equeen áboles exponencalmente gandes, como la funcón padad, que etona 1 s un númeo pa de nputs son 1, y la funcón mayoía, que etona 1 s más de la mtad de los nputs son 1. Po ello los áboles de decsón son adecuados paa epesenta cetas funcones y no otas, lo cual es mpotante al momento de tata de constu áboles de decsón que sean consstentes con conjuntos de datos. Dados k ejemplos de nputs de una funcón booleana, con sus coespondentes outputs, se desea constu un ábol de decsón que sea capaz de eplca dchos outputs al ecb los msmos nputs que la funcón booleana. El poblema adca en que no exste una sola foma de genea un ábol de decsón semejante, sno muchas. En geneal el númeo de áboles de decsón que es posble constu dado un nput booleano de n atbutos es exponencalmente gande. En efecto, una tabla de vedad con n atbutos booleanos tendá 2 n flas. Paa cada una de dchas flas el ábol de decsón podá entega uno de dos esultados booleanos posbles, po lo tanto habá un total de 2 n 2 áboles de decsón dstntos paa un nput de n atbutos. Po ello los 150

151 algotmos de constuccón de áboles de decsón a pat de conjuntos de datos deben se patculamente ntelgentes. Una foma que paeceía a pmea vsta ntelgente de constu un ábol de decsón seía el genea el ábol más pequeño y smple posble que fuese consstente con los ejemplos de la funcón booleana. Sn embago, el poblema de enconta dcho ábol es ntatable computaconalmente paa cualque defncón azonable de pequeño o smple. A contnuacón se descbá un algotmo azonable y tatable computaconalmente paa constu áboles de decsón sobe n atbutos que se ajusten a los esultados de un conjunto de ejemplos. El algotmo entegado se denomna algotmo de apendzaje de áboles de decsón, no obstante exsten algotmos de uso comecal que ofecen un desempeño supeo, y cuya exacta mplementacón está enccutada dento de heamentas de softwae específcas. Tal es el caso del algotmo C5, enccutado en Clementne ente otas heamentas. Un ejemplo de un ábol de decsón booleano consste de un nput dado po un vecto 1 2 k ( X, X X X... ) = de atbutos y un output booleano y. Un ejemplo paa un clente x,... k ( específco vene dado po el pa de valoes 1 2 x x x ) = e y. Un conjunto de 12 ejemplos de clentes clasfcados utlzando el ábol de decsón de la fgua se entega a contnuacón en la fgua Los ejemplos postvos son aquellos en los cuales el output del ábol de decsón coesponde a un S, en tanto que los ejemplos negatvos son aquellos en los que coesponde a un No. S se utlza el conjunto de ejemplos de la fgua paa nduc un ábol de decsón que sea consstente con ellos, se hablaá entonces de dchos ejemplos en témnos de conjunto de datos de entenamento. Exste una foma tval paa constu un ábol de decsón que sea consstente con el conjunto de datos de entenamento: asgna una hoja del ábol a cada uno de los ejemplos, con una uta que desde la aíz aplque un test sobe cada atbuto, sguendo sempe las amas coespondentes a los valoes asumdos po el ejemplo. Desafotunadamente un ábol constudo así no puede dec mucho sobe otos ejemplos dstntos de los del conjunto de entenamento, puesto que en ealdad no hace sno memoza las obsevacones, sn extapola nngún patón. 151

152 Fgua Ejemplos de clentes clasfcados como buenos o malos 76 Po el contao, el algotmo de apendzaje de áboles de decsón es un mecansmo azonable paa constu un ábol. La dea cental esde en escoge paa el nodo aíz el atbuto que dvda en mejo foma el conjunto de datos. Luego de escogdo el pme atbuto, puede aplcase sucesvamente el algotmo a los atbutos estantes. Con ello se espea educ el númeo de tests que es necesao ealza paa clasfca los datos y consecuentemente dsmnu el nvel de complejdad del ábol esultante. La fgua sguente muesta la dvsón del conjunto de datos que ealza el atbuto comuna. 76 Fuente: elaboacón popa a pat del lbo de RUSSELL, Stewat, NORVIG, Pete, Atfcal Intellgence, a Moden Apoach, Second Edton, Chapte 18, Leanng Decson Tees, Pentce Hall,

153 Fgua Clasfcacón de conjunto de datos de entenamento medante el atbuto de comuna 77 Paa cualquea de los valoes de comuna posbles asumdos en los ejemplos del conjunto de entenamento se tene que exsten tantos ejemplos postvos como negatvos. Claamente el atbuto comuna no dvde de buena foma el conjunto de datos. La fgua dada abajo, en cambo muesta la dvsón del conjunto de datos de entenamento que ealza el atbuto enta. Cuando la enta es baja, todos los ejemplos obsevados en el conjunto de entenamento son negatvos, en tanto que cuando es alta, todos los ejemplos son postvos. Po lo tanto es posble clasfca pefectamente a los clentes cuando su enta es baja o alta, y esulta po ende clao que el atbuto enta pemte clasfca de mejo foma a los clentes. No obstante, cuando los ejemplos del conjunto de entenamento pesentan enta meda se tene una mezcla de esultados postvos y negatvos, po lo que la nfomacón contenda en el atbuto enta no es sufcente paa clasfca a los clentes, y es pecso ma algún atbuto adconal. En la fgua se muesta como clasfca a los clentes que han pesentado enta meda obsevando su otacón en el empleo. S ésta es baja, todos los casos coesponden a ejemplos negatvos. En cambo, s la otacón es alta se tene nuevamente una mezcla de esultados y se equee, en consecuenca, ma atbutos adconales. 77 Fuente: elaboacón popa 153

154 Fgua Clasfcacón de conjunto de datos de entenamento medante atbutos de enta y otacón de empleo 78 En el algotmo ecusvo de constuccón del ábol se tenen los casos sguentes: - S exsten tanto ejemplos postvos como negatvos, se debe escoge el atbuto que dvde en mejo foma el conjunto de ejemplos. - S todos los ejemplos son postvos o negatvos, entonces se estaá en una hoja. - S no quedan ejemplos, sgnfca que no se ha obsevado un caso semejante en el conjunto de datos entenamento. Se ecomenda entega como output un valo calculado como la funcón booleana mayoía aplcada a las clasfcacones ealzadas po el nodo pade. - S no quedan ya más atbutos paa contnua con el algotmo de constuccón del ábol, peo exste una mezcla de ejemplos negatvos como postvos, ello ndca que los datos contenen eoes, que los atbutos no poveen sufcente nfomacón paa 78 Fuente: elaboacón popa 154

155 clasfca po completo los ejemplos, o ben que los esultados que se tata de modela son no detemnístcos. En cualque caso una foma de enfenta el poblema es escoge como output la funcón booleana mayoía aplcada a la clasfcacón de los ejemplos estantes. El algotmo de constuccón de un ábol de decsón como se ha descto da como esultado la fgua cuando se aplca al caso de los ejemplos de la fgua Fgua Ábol de decsón geneado po algotmo a pat de los ejemplos del conjunto de datos de entenamento 79 Cabe nota que el ábol obtendo es bastante más smple que el de la fgua 10.13, que se utlzó paa genea los 12 ejemplos del conjunto de entenamento. Con mayo númeo de ejemplos en el conjunto de entenamento es posble aba a un ábol de decsón más paecdo al ábol ognal que svó paa genea los datos. Es pecso dec tambén que el ábol de decsón geneado es consstente con el conjunto de datos de entenamento de la fgua 10.14, peo no tene po qué se consstente con ejemplos 79 Fuente: elaboacón popa a pat del lbo de RUSSELL, Stewat, NORVIG, Pete, Atfcal Intellgence, a Moden Apoach, Second Edton, Chapte 18, Leanng Decson Tees, Pentce Hall,

156 que no hayan estado en dcho conjunto. Po ello un ábol de decsón estaá sujeto a eo al enfentase a nuevos ejemplos. La especfcacón completa del algotmo descto exge una foma de detemna la capacdad que posee un atbuto paa dvd los ejemplos del conjunto de entenamento en mejo o peo foma. Se desea enconta una funcón que pemta detemna qué atbuto dvde en mejo foma los datos. Dos conjuntos de datos ben dvddos tendán sólo ejemplos postvos o sólo ejemplos negatvos. Po el contao, conjuntos mal dvddos tendán una mezcla de ejemplos postvos y negatvos. Mentas mayo sea la dfeenca ente la popocón de ejemplos postvos y la popocón de ejemplos negatvos dento de cada conjunto de datos, mejo seá la dvsón que se haya efectuado. Una foma de enfenta el poblema es medante la funcón nfomacón. S la pobabldad de obtene un ejemplo postvo dento de un conjunto de datos es 1, claamente no se necesta nfomacón adconal paa clasfca los datos, análogamente s dcha pobabldad es 0. Ahoa ben, se equeá un máxmo de nfomacón adconal paa clasfca los datos cuando sea gualmente pobable obtene un ejemplo postvo o un ejemplo negatvo. S se tene un conjunto de n espuestas posbles v, cada una con una pobabldad de ocuenca ( ) v P, la funcón nfomacón queda descta po la ecuacón sguente 80 : n ( ) ( P( v ) P( v )) = P( v ) log P( ) I,... 1 n v 2 = 1 El lado deecho de la ecuacón anteo puede escbse como el logatmo de una ceta foma de pomedo geométco, como se muesta a contnuacón: ( P( v ) ( )) = ( ( ) ) ( ) 1 P v P v n log P v 2 I,... Ahoa ben, en funcones con un output booleano, como es el caso de un ábol de decsón que clasfca a los clentes en buenos o malos, sólo se tendán dos esultados posbles. S se denota con p la cantdad de esultados postvos y con n la cantdad de esultados negatvos en un conjunto de datos, la funcón nfomacón queda: n = 1 80 Fuente: SHANNON, C. E., WEAVER, W., The Mathematcal Theoy of Communcaton, Unvesty of Illnos Pess,

157 p n p+ n n p+ n 2 p + n p n I, = log p + n p + n p p + n La funcón nfomacón, po lo tanto, coespondeá a un logatmo de una ceta foma de pomedo geométco ente la popocón de ejemplos postvos y la popocón de ejemplos negatvos. La sguente fgua gafca la funcón nfomacón y el pomedo geométco antes descto en funcón de la popocón de ejemplos postvos: Fgua Funcón nfomacón y pomedo geométco ente la popocón de ejemplos postvos y negatvos en un conjunto de datos 81 El pomedo geométco alcanzaá su mínmo cuando ambas popocones sean guales, y su máxmo cuando una de dchas popocones sea gual a ceo. La funcón nfomacón descta hasta este punto pemte conoce la cantdad adconal de nfomacón necesaa paa clasfca los clentes de un ábol de decsón dado que se conoce la popocón de ejemplos postvos. No obstante, lo que se desea conoce es cuanto contbuye un atbuto a dsmnu dcha nfomacón equeda. Paa ello se ecue a los conceptos de gananca y de esto de nfomacón equeda, los cuales se defnen en los páafos sguentes. 81 Fuente: elaboacón popa 157

158 Se tene un conjunto de datos con p esultados postvos y n esultados negatvos. Un atbuto A dvde un conjunto de datos en v gupos, de acuedo al valo que asume. Un gupo de esos v gupos tene p esultados postvos y n esultados negatvos. Se tendá que un ejemplo escogdo aleatoamente mostaá el valo del atbuto con una pobabldad dada po: p p + + n n. Po lo tanto, el valo espeado de la nfomacón estante necesaa paa clasfca un ejemplo luego de habe aplcado el test a un atbuto A vendá dado po: v p + ( ) = n p + n Resto A I, p n p + n p + n = 1 La gananca de nfomacón obtenda al aplca el test sobe un atbuto A seá: Gananca p p n n p + n ( A) = I Resto( A) +, La funcón gananca de nfomacón pemte compaa atbutos, como puede compobase con la enta y comuna de los ejemplos de la fgua 10.14: Gananca =, ( Renta) 1 I( 0, 1) + I( 1, 0) + I, = Gananca = = ( Comuna) 1 I, + I, + I, + I, 0 El atbuto enta dvde al conjunto de datos de entenamento en mejo foma que el atbuto comuna, po cuanto la gananca de nfomacón equeda paa clasfca datos es mayo s se utlza el atbuto enta que s se usa el atbuto comuna Refnamento de los modelos de áboles de decsón Es posble aplca un algotmo denomnado poda 2 χ que pevene el que un nodo A del ábol de decsón sea dvddo en subáboles a tavés del testeo de atbutos que no son claamente elevantes. Los áboles de decsón constudos con poda 2 χ se compotan sgnfcatvamente mejo que los áboles constudos sn se podados 158

159 cuando los datos contenen gan cantdad de udo. La poda 2 χ pemte defn un nodo del ábol como hoja, aun cuando los datos en dcho nodo no coesponden sólo a ejemplos postvos o sólo a ejemplos negatvos. Paa aplca la poda detemna cuando un atbuto es elevante. 2 χ es pecso S se dvdea un conjunto de ejemplos utlzando un atbuto elevante, se espeaía que los subconjuntos esultantes tuvesen apoxmadamente la msma popocón de ejemplos postvos y negatvos que el conjunto ognal. Po lo tanto, la gananca de nfomacón seía cecana a ceo. Po ello la gananca de nfomacón pemte descub atbutos elevantes. Cabe, no obstante peguntase cuánto debea se la gananca de nfomacón mínma de un atbuto paa consdealo elevante. Paa ello se utlza un test de sgnfcanca. Bajo la hpótess H 0 de que el atbuto A es elevante, la gananca de nfomacón del atbuto paa un conjunto de datos de entenamento nfntamente gande debea se ceo. Es pecso calcula, bajo la hpótess H 0, la pobabldad de que una muesta de tamaño v exhba una desvacón con especto a la dstbucón espeada de ejemplos postvos y negatvos. Puede calculase dcha desvacón compaando los númeos de ejemplos postvos p y negatvos n en cada subconjunto en el cual el atbuto A asume el valo, con los númeos espeados pˆ y nˆ que se obtendían asumendo elevanca del atbuto. Dado que un ejemplo escogdo aleatoamente mostaá el valo del atbuto A con una pobabldad dada po espeados de pˆ y nˆ vendán dados po: p n p p + ˆ = y p + n medda convenente paa la desvacón total vendá dada po la fómula: nˆ p p + + = n n n, los valoes p p + + n n. Una D = v = 1 ( p ˆp ) ( n nˆ ) ˆp 2 + nˆ 2 159

160 Bajo la hpótess H 0 el valo de D dstbuye χ 2 con v 1 gados de lbetad. La pobabldad de que el atbuto sea ealmente elevante puede se calculada con la 2 ayuda de las tablas de la dstbucón χ Compaacón de las técncas de modelamento A contnuacón se entegan las ventajas y desventajas de las tes técncas desctas pevamente, de manea de faclta la eleccón de alguna técnca patcula: Ventajas Desventajas Regesón logístca Redes neuonales Áboles de decsón - Pemte dentfca con cladad los atbutos más elevantes que afectan la decsón de cédto y qué tan mpotante es cada uno. - Medante el test de azón de veosmltud pemte efna en foma teatva el modelo de manea de seleccona sólo los atbutos más elevantes. - Pemte que los atbutos asuman valoes contnuos. - No equee de mayo análss estadístco. - Son capaces de detecta y eplca vtualmente cualque tpo de elacón ente los nputs y los outputs, po compleja que esta sea. - Pueden se taducdos en témnos de conjuntos de eglas fáclmente compensbles y tasnscbbles en la foma de polítcas de cédto o manuales de pocedmentos. 2 χ - Entega el mecansmo de poda que pemte descata los atbutos elevantes. - Exge que no exstan coelacones mpotantes ente los atbutos. - El sstema de ecuacones del gadente del logatmo de la funcón veosmltud no tene solucón analítca y el algotmo paa esolvelo puede no convege. - Sve paa epesenta una ceta foma de elacón ente las vaables de nput y de output, descta po la ecuacón de egesón, peo no oto tpo de elacones. - No povee un mecansmo paa descata los atbutos menos elevantes. - Constuye cajas negas que ecben nputs y pedcen outputs, peo que no pemten obseva exactamente qué pasa en su nteo. - S ben puede pedec un valo booleano, pesenta dfcultad paa calcula outputs contnuos. - S los atbutos son contnuos el algotmo paa seleccona el punto de dvsón de un atbuto puede eque un enome esfuezo en témnos de cálculo computaconal. - Sven sólo paa algunas funcones. 160

161 En las seccones anteoes se han detallado las pncpales técncas de modelamento aplcables al caso de las campañas bancaas, ello como pate de la descpcón del output 4a.1 de la taea de seleccona la técnca de modelamento (taea 4a) de cuata fase del poyecto de datamnng. En las seccones sguentes se descben los esultados y taeas estantes de dcha fase del poyecto Supuestos de modelamento (output 4a.2) Este esultado es el segundo de la taea de seleccona la técnca de modelamento (taea 4a). De acuedo a la guía de usuao de la metodología CRISP-DM, este output coesponde al conjunto de suposcones ealzadas sobe la caldad, los valoes o el fomato de los datos y que son mpuestas po la técnca de modelamento selecconada. Ente las actvdades que es pecso desaolla paa obtene este esultado se encuentan las sguentes: - Defn cualque supuesto sobe los datos que esté mplícto en la técnca de datamnng escogda (po ejemplo: caldad, fomato, dstbucón de las vaables). - Compaa dchos supuestos con aquellos del epote de descpcón de los datos. - Aseguase de que los supuestos se cumplen y etocede a la fase de pepaacón de los datos s es necesao Genea el dseño de las puebas (taea 4b) Esta taea consste en una defncón del pocedmento que se utlzaá paa poba la caldad y valdez del modelo. El dseño de las puebas debe especfca qué datos debeán se sepaados del esto paa confoma el conjunto de datos de entenamento con el que se constuá el modelo. Debeá especfcase tambén qué datos fomaán el conjunto de datos de pueba con el que se valdaá el modelo antes constudo. La descpcón de los esultados que se deben obtene como futo de esta taea se entega a contnuacón: Dseño de las puebas (output 4b.1) De acuedo a la guía de usuao de la metodología CRISP-DM, este esultado coesponde al plan elaboado paa el entenamento y la evaluacón de los modelos de datamnng. Una componente pncpal del plan consste en decd cómo dvd el 161

162 conjunto de datos dsponble en un conjunto de datos de entenamento y un conjunto datos de pueba. Ente las actvdades que es pecso desaolla se encuentan: - Chequea el dseño de las puebas sepaadamente paa cada objetvo de datamnng. - Decd los pasos necesaos paa ejecuta cada pueba (númeo de teacones, etc.). - Pepaa los datos equedos paa las puebas (el conjunto de datos de entenamento y el conjunto de datos de pueba). Los algotmos geneadoes de modelos tatan de mnmza los eoes o dfeencas ente las obsevacones y las pedccones, dándole gual peso a cada obsevacón. No obstante, en témnos cedtcos es nmensamente peo comete el eo de clasfca como bueno a un clente malo (eo tpo 1) que de clasfca como malo a un clente bueno (eo tpo 2). Po ello el conjunto de datos de entenamento debe esta adecuadamente balanceado, y seía ncluso deseable tene más clentes malos que buenos en la muesta, de manea tal de pvlega en la geneacón de los modelos la mnmzacón del eo tpo 1. Exste, no obstante, un nconvenente en la utlzacón de muestas desbalanceadas que mnmcen el eo tpo 1, y es que los clentes malos son en vedad escasos en una catea de clentes (genealmente coesponde a un 1% de la catea). Po oto lado la expeenca señala que se necestan al menos clentes malos paa pode constu un modelo confable. S a eso se agega que luego de se geneado todo modelo debe se valdado en un conjunto de datos de pueba, se tene que son necesaos en total unos clentes malos. Debe consdease, además, que un Banco pequeño tendá tan solo clentes o menos, de los cuales sólo o seán malos. Puede concluse, po lo tanto, que no exste mucho magen de manoba paa escoge muestas desbalanceadas y puede consdease que un conjunto de datos de entenamento balanceado (con gual númeo de clentes malos que de buenos) es sufcentemente apopado paa genea un modelo ealsta. En este punto es mpotante señala además que el conjunto de datos de pueba usado paa valda los modelos no debe tene datos en común con el conjunto de datos de entenamento utlzado en la geneacón de dchos modelos. De lo contao la evaluacón de los modelos pede toda valdez, tendendo a favoece a los modelos sobeajustados. 162

163 10.3 Constu un modelo (taea 4c) En esta taea debe ejecutase la heamenta de modelamento sobe el conjunto de datos de entenamento. Se obtendá un modelo especfcado po un conjunto de paámetos. La descpcón de los esultados que se deben obtene como futo de esta taea se entega a contnuacón: Establece los paámetos (output 4c.1) En cualque heamenta de modelamento hay un gan númeo de paámetos que deben se ajustados. De acuedo a la guía de usuao de la metodología CRISP-DM, este esultado coesponde a una lsta de los paámetos y sus valoes, junto a las azones po las que fueon elegdos dchos valoes. Ente las actvdades que es pecso desaolla paa obtene este esultado se encuentan: - Establece los paámetos ncales. - Documenta las azones paa escoge aquellos valoes Modelos (output 4c.2) Este esultado es el segundo de la taea de constu un modelo (taea 4c). De acuedo a la guía de usuao de la metodología CRISP-DM, este output coesponde a modelos geneados luego de coe la heamenta de datamnng sobe el conjunto de datos de entenamento. Ente las actvdades que es pecso desaolla paa obtene este esultado se encuentan las sguentes: - Coe la técnca selecconada de datamnng sobe el conjunto de datos de entenamento, de manea tal de genea el modelo de datamnng. - Pocesa los esultados de datamnng aojados po el modelo (po ejemplo: edta las eglas en el caso de un ábol de decsón) Geneacón automatzada de modelos en Clementne El sguente dagama muesta un flujo de datos en Clementne capaz de genea modelos y apoya el poceso de valdacón de los msmos. La geneacón de los modelos pate de la fuente de datos denomnada Base fnal paa constu modelo pedctvo, que coesponde al output 3z.1 antes descto en este documento, y que se muesta a la zqueda en la fgua Los modelos geneados se ubcan en la 163

164 esquna supeo deecha, en tanto que las pedccones consegudas y que sven paa valda dchos modelos se entegan en la pate nfeo de la msma fgua. Fgua Flujo de datos en Clementne que genea modelos y pedccones a pat de una base fnal paa almenta el modelo pedctvo Símbolos usados en Clementne paa genea modelos El sgnfcado de los íconos usados en el dagama y no explcados anteomente se entega a contnuacón. Los íconos que apaecen a la deecha de cada pa de símbolos se utlzan en los dagamas paa esalta nodos que están sendo explcados. Seleccón de muestas: Este cono seleccona una muesta del flujo de datos que ecbe como nput. 82 Fuente: elaboacón popa 164

165 Nodos geneadoes de modelos: Los sguentes íconos epesentan nodos que ecben como nput un conjunto de datos de entenamento, donde cada egsto coesponde a una lsta de valoes de las vaables pedctvas más un valo de la vaable que se espea pedec. A pat de esa nfomacón cada uno de éstos nodos genea un modelo pedctvo, el cual es entegado como output en la foma de nodo. Este cono genea un modelo de egesón logístca a pat de los conjuntos de valoes de las vaables pedctvas y de la vaable a pedec. Este cono, en cambo, genea un modelo de ed neuonal. Este cono genea un modelo de ábol de decsón. Nodos de modelos geneados: Los sguentes íconos epesentan modelos pedctvos que ya han sdo geneados po alguno de los nodos antes desctos. Cada uno de ellos puede se utlzado en Clementne de la msma foma que los nodos pedefndos po el softwae, sn necesdad de pogama su funconamento. Estos nodos al ecb como nput un conjunto de valoes de las vaables pedctvas paa un clente en patcula aojan una pedccón paa la vaable a pedec. Este cono epesenta un modelo de egesón logístca que ha sdo geneado po el usuao. Este cono epesenta un modelo de ed neuonal que ha sdo geneado po el usuao. C C Este cono epesenta un modelo de ábol de decsón que ha sdo geneado po el usuao. 165

166 Descpcón del dagama en Clementne que genea un modelo El dagama en Clementne que pemte genea modelos se explca en dos fases: pmeo la obtencón de un conjunto de datos de entenamento (fgua 10.20), y luego la geneacón del modelo a pat de dcho conjunto de datos (fgua 10.21). Fgua Flujo de datos en Clementne que obtene un conjunto de datos de entenamento 83 En la fgua el nodo Base fnal paa constu modelo pedctvo del ecuado contene datos tanto de una base de vaables pedctvas de hace un año, como de las clasfcacones de la base de clentes hoy. Dcha clasfcacón dvde a los clentes en buenos o malos y en clentes con gan entabldad potencal o clentes sn gan entabldad potencal. Como pme paso del dagama los dstntos campos de dcha base son tansfomados en vaables dscetas. Dcha labo, que ocue en el nodo denomnado Tansfoma en categoías, se ealza paa faclta la teacón de los algotmos de geneacón de modelos. Los egstos esultantes son dvddos en 83 Fuente: elaboacón popa 166

167 aquellos coespondentes a los clentes malos y a los clentes buenos (los cuales son selecconados en el dagama po los nodos Clentes malos hoy y Clentes buenos hoy, espectvamente) 84. Posteomente, el flujo de datos en Clementne pocede a constu el conjunto de datos de entenamento que se utlzaá en la geneacón de los modelos, paa lo cual se seleccona el 50% de los clentes malos y el esultado se mezcla con el nodo 1% de muesta de buenos. Los pocentajes han sdo escogdos paa asegua la obtencón de una muesta balanceada paa la geneacón de modelos pedctvos (po cuanto el 1% de los clentes buenos es tan numeoso como el 50% de los clentes malos). La muesta balanceada se obtene en el dagama en el nodo etquetado como Conjunto de datos de entenamento. La fgua dada abajo, en tanto, lusta la segunda fase de la geneacón de modelos en Clementne: Fgua Flujo de Datos en Clementne que genea modelos a pat de un conjunto de datos de entenamento Una accón análoga es necesaa paa tabaja con clentes con gan entabldad potencal y clentes sn gan entabldad potencal 85 Fuente: elaboacón popa 167

168 La muesta antes obtenda se esalta medante la etqueta Conjunto de datos de entenamento a la zqueda del dagama. En la mtad supeo de la fgua, en tanto, se esaltan los nodos geneadoes de modelos, bajo la etqueta Geneacón de modelos. Estos nodos geneadoes de modelos ecben como nput el conjunto de datos de entenamento y al momento de se ejecutados po el usuao entegan como output nodos geneados. Cada nodo geneado puede entendese como un pogama, que puede se utlzado en Clementne de gual foma que cualque oto nodo pedefndo. Los nodos geneados son depostados po los nodos geneadoes en la esquna supeo deecha del dagama, donde apaecen esaltados con la etqueta Modelos geneados Descpcón del modelo (output 4c.3) Este esultado es el teceo de la taea de constu un modelo (taea 4c). De acuedo a la guía de usuao de la metodología CRISP-DM, este output coesponde a una descpcón del modelo esultante y a una evaluacón de su pecsón espeada, su obustez y sus posbles defectos. Incluye tambén una descpcón de la ntepetacón del modelo. Ente las actvdades que es pecso desaolla paa obtene este esultado se encuentan las sguentes: - Descb cualque caacteístca del modelo que pueda se útl en el futuo. - Regsta los valoes establecdos de los paámetos que se han utlzado paa poduc el modelo. - Da una descpcón detallada del modelo. - Paa modelos basados en eglas, ealza una lsta de todas las eglas poducdas más cualque estmacón del pocentaje de clentes que seía cubeto po cada egla. - Paa las edes neuonales ealza una lsta de cualque nfomacón técnca sobe el modelo (tal como la topología) y cualque descpcón del compotamento del modelo obtenda duante el poceso de modelamento (tal como la pecsón o la sensbldad espeada del modelo). - Descb el compotamento del modelo y su ntepetacón. - Establece conclusones sobe los patones descubetos en los datos (s es que éstos exsten). 168

169 A contnuacón se entegan las meta-especfcacones de los modelos de esgo y de entabldad pesegudos po esta nvestgacón, utlzando paa ello las tes técncas de modelamento desctas pevamente: egesón logístca, edes neuonales y áboles de decsón Modelo de esgo especfcado usando egesón logístca A contnuacón se descbe como puede especfcase el modelo de esgo de cédto como un modelo de egesón lneal. Cada clente tendá un conjunto de caacteístcas esumdas en la vaable explcatva vectoal X, defnda de la foma sguente: X = ( X X X X X X A1 B1 C1 D1 E1 F1,X,X,X,X,X,X A2 B2 C2 D2 E2 F2...X...X...X...X...X...X A14 B7 C15 D4, E29 F19,,, ), Cada una de las componentes de dcho vecto es una vaable que epesenta una detemnada caacteístca, lo cual puede esumse de la foma sguente: A1 A2 { X,X...X A14 } B1 B2 { X,X...X B7 } C1 C2 { X,X...X C15 } D1 D2 { X,X...X D4 } E1 E2 { X,X...X E29 } F1 F2 { X,X...X F19 } Vaables demogáfcas Vaables de enta Vaables de vínculo con el clente Vaables de ngesos contables geneados po un clente Vaables de compotamento del clente Vaables de deudas del clente 169

170 El conjunto de obsevacones de dchas vaables paa un clente patcula se denota como sgue: x = ( x x x x x x A1 B1 C1 D1 E1 F1,x,x,x,x,x,x La vaable dependente, denotada po Y, descbe la condcón de bueno o malo de un clente en témnos de esgo de cédto (0: bueno, 1: malo). Se denotan las A2 B2 C2 D2 E2 F2...x...x...x...x...x A14 B7 C15...x D4 E29 F19,,,, ), obsevacones de dcha vaable paa un clente como y. Con estas defncones la estmacón que entega un modelo de egesón logístca paa la pobabldad de que un clente sea malo, dado que pesenta caacteístcas desctas po el vecto x, vendá dada po: π = 1+ g( x ) e e g( x ) Donde g ( x ) coesponde a la ecuacón g ( x ( ) T ) β 1 x. El vecto ( 1 x ) T es el vecto ( 1 x ) tanspuesto: un vecto cuyo pme elemento es el númeo 1 y todos = los elementos estantes son componentes del vecto x. La azón paa agega el númeo 1 al vecto x se debe a que se desea ncopoa el paámeto β 0 en g ( x ), a pesa de que este paámeto no vaya acompañado de nnguna componente de x. A contnuacón se entega la defncón de los vectoes β y ( 1 x ) en témnos de sus componentes: 170

171 β = ( β 0, β β β β β β A1 B1 C1 D1 D1 F1,,,,,, β β β β β β A2 B2 C2 D2 D2 F β β β β β β A14, B7, C15, D4, D29, F19 ) ( x ) 1 = ( 1, x x x x x x A1 B1 C1 D1 E1 F1,x,x,x,x,x,x A2 B2 C2 D2 E2 F2...x...x...x...x...x A14 B7 C15...x D4 E29 F19,,,,, ) Los coefcentes β se obtenen de esolve numécamente el sstema de ecuacones: l (β) ˆ = 0 β Dcho sstema de ecuacones se obtene calculando el gadente de l ( y ) con especto a los paámetos β, evaluado luego dchos paámetos en los estmadoes βˆ e gualando fnalmente las ecuacones esultantes a ceo, donde: En tanto x e l n n = = 1 = 1 ( y) ( y g( x )) 171 ln 1 + e g( x ) y epesentan obsevacones de una muesta de n clentes escogdos en el conjunto de datos de entenamento. El modelo tal y como se ha descto acá tene 88 vaables, las cuales claamente están mutuamente coelaconadas ente s. No obstante, un modelo de egesón lneal equee que las vaables no tengan coelacones mpotantes, pues de lo contao el modelo tende a tata de eplca los udos contendos en la muesta. Paa evta dcho nconvenente es pecso depua el modelo, dejando en él solamente las vaables que son más pedctvas. Una foma de ealza dcho poceso consste en detemna el apote de cada vaable al modelo medante el test de azón de veosmltud que se ha descto antes en este documento Modelo de entabldad especfcado usando egesón logístca El modelo de entabldad potencal puede especfcase en foma análoga a como se ha hecho en el caso del modelo de esgo de cédto. La únca dfeenca adca en que la

172 vaable dependente Y descbe la condcón de se o no un clente con gan entabldad potencal (0: con gan entabldad potencal, 1: sn gan entabldad potencal). Se denotan las obsevacones de dcha vaable paa un clente como y. La vaable x, en tanto, coesponde a una obsevacón de la vaable explcatva vectoal X paa un clente patcula, defnda del msmo modo que en el modelo de esgo de cédto. La estmacón que entega un modelo de egesón logístca paa la pobabldad de que un clente no tenga una gan entabldad potencal dado que posee un conjunto de caacteístcas desctas po la vaable x vene dada po: x π = 1+ g( x ) e e g( x ) Donde g ) se obtene en la msma foma que en el caso del modelo de esgo. ( Modelo de esgo especfcado usando edes neuonales El conjunto de datos de entenamento utlzado paa constu el modelo de ed neuonal de esgo de cédto debe contene paa cada clente el conjunto de vaables pedctvas (que son las msmas desctas anteomente paa especfca el modelo de egesón logístca) además de la vaable a pedec Y, que descbe la condcón de bueno o malo de un clente en témnos de cédto (0: bueno, 1: malo). La vaable x coesponde a una obsevacón paa un clente patcula de la vaable explcatva vectoal X, defnda como sgue: X = ( X X X X X X A1 B1 C1 D1 E1 F1,X,X,X,X,X,X Cada una de las componentes de dcho vecto son vaables que epesentan una detemnada caacteístca, y que pueden esumse de la foma sguente: B2 C2 E2 F2 172 A2 D2...X...X...X...X...X...X A14 B7 C15 D4, E29 F19,,, ),

173 A1 A2 { X,X...X A14 } B1 B2 { X,X...X B7 } C1 C2 { X,X...X C15 } D1 D2 { X,X...X D4 } E1 E2 { X,X...X E29 } F1 F2 { X,X...X F19 } Vaables demogáfcas Vaables de enta Vaables de vínculo con el clente Vaables de ngesos contables geneados po un clente Vaables de compotamento del clente Vaables de deudas del clente La estmacón que entega un modelo de ed neuonal paa la pobabldad condconal de que un clente sea malo en témnos de cédto dado que posee un conjunto de caacteístcas desctas po la vaable x vene dada po h ( x) como una pobabldad condconal de ocuenca de un evento dados los valoes de las vaables de nput. No obstante, en la páctca a menos que el softwae de datamnng pemta defn una topología exacta no es posble da un sgnfcado clao a los esultados de las undades ocultas de la ed. Clementne, que es la heamenta de datamnng que es utlzada en este documento, no pemte defn la topología de las edes neuonales más allá del númeo de nveles de las undades ocultas. Po ello no tene sentdo en esta seccón especfca la topología paa el modelo de esgo. Usualmente la foma de alcanza un modelo satsfactoo con edes neuonales consste en ealza muchas puebas con dstntos númeos de nveles de undades ocultas y dstntos paámetos alfa de apendzaje, ente otos paámetos. No obstante, sólo es posble especfca el modelo en témnos fjos de esos paámetos dsponendo de los datos concetos usados en la geneacón del modelo Modelo de entabldad especfcado usando edes neuonales El conjunto de datos de entenamento utlzado paa constu el modelo de ed neuonal de entabldad potencal debe contene paa cada clente el conjunto de vaables pedctvas (que son las msmas desctas anteomente paa especfca el 173 W. Las edes neuonales a veces son denomnadas modelos opacos po consttu cajas negas cuyo contendo no puede ntepetase. Se ha menconado que ellas pueden concebse como edes bayesanas, en las que la funcón ( x) h de cada undad puede se vsta W

174 modelo de egesón logístca) y la vaable a pedec Y, que descbe la condcón de se o no un clente con gan entabldad potencal (0: con gan entabldad potencal, 1: sn gan entabldad potencal). La vaable x coesponde a una obsevacón paa un clente patcula de la vaable explcatva vectoal X, defnda en la msma foma que paa los modelos antes desctos. La estmacón que entega un modelo de ed neuonal paa la pobabldad condconal de que un clente no tenga una gan entabldad potencal dado que posee un conjunto de caacteístcas desctas po la vaable x vene dada po ( x) h. W Modelo de esgo especfcado usando áboles de decsón Un ábol de decsón puede se especfcado de dstntas fomas, una de las cuales es a tavés de la descpcón de sus nodos, amas y hojas, (lo que se conoce como TREE RESULT FORMAT en Clementne) y ota es a tavés de un conjunto de eglas (lo que se conoce como RULESET RESULT FORMAT en Clementne). A contnuacón se entega la sntaxs de ambas defncones utlzadas po Clementne en los outputs de sus modelos de áboles de decsón C5 86. En cualque caso los áboles son especfcados en un lenguaje smla, cuya sntaxs consta de los sguentes símbolos: < y > odean un dentfcado de un símbolo no temnal. Un símbolo no temnal puede se taducdo a un conjunto de palabas claves y otos dentfcadoes == ndca la defncón de un dentfcado no temnal a su zqueda en témnos de palabas clave e dentfcadoes a la deecha. se usa paa sepaa elementos de una lsta. Un dentfcado defndo como una lsta de ítems sepaados po puede se taducdo usando cualquea de los ítems de la lsta. * ndca ceo o más nstancas del dentfcado ubcado a su zqueda. Especfcacón utlzando TREE RESULT FORMAT: Bajo esta especfcacón el ábol consste de un númeo de líneas en las que cada una contene un test segudo de dos puntos. Cada línea coesponde a una hoja o a una ama. S hay cualque cosa después de los dos puntos, la línea es un nodo hoja y el 86 Fuente: CLEMENTINE 7.0 Use s Gude, SPSS,

175 ítem ubcado después de los dos puntos coesponde a una clasfcacón (output del ábol de decsón). En el caso de un nodo ama, el test contendo en la línea se aplcaá a uno de los posbles valoes de un atbuto, po ejemplo del atbuto A. Las líneas sguentes a dcho nodo ama coespondeán a tests aplcados a otos atbutos, o al msmo atbuto A. Dependendo de qué atbuto se tate es posble dentfca s la línea sguente coesponde a un nodo hjo, hemano o tío del nodo ama de la línea anteo. A contnuacón se entega la sntaxs y un ejemplo de esta especfcacón. Sntaxs TREE RESULT FORMAT: <Rama> == <Atbuto> <Compaacón> <Valo> : <Hoja> == <Atbuto> <Compaacón> <Valo> : <Clasfcacón> <Compaacón> == = > <= < Ejemplo dado en la fgua en el fomato TREE RESULT FORMAT Renta = baja : No Renta = meda : Rotacón_empleo = baja : No Rotacón_empleo = alta : Comuna = Concepcón : S Comuna = Valpo. : No Comuna = Vña : S Comuna = Stgo. : Clente_antguo? = nuevo : No Clente_antguo? = antguo : S Renta = alta : S Especfcacón utlzando RULESET RESULT FORMAT: En esta especfcacón un conjunto de eglas es descto tambén en un lenguaje smla a un lenguaje de pogamacón. Dento de cada conjunto de eglas debe habe ceo o más eglas. Cada egla consste en una línea que empeza con la palaba esevada Rule, seguda po un númeo de egla y po dos puntos, y luego po ceo o más condcones. Luego de las condcones la egla temna con la palaba esevada class, a contnuacón de la cual se entega una clasfcacón (output del ábol). Un conjunto de eglas temna con la clasfcacón po omsón, la cual comenza con las palabas esevadas Default class y luego po un output del ábol. 175

176 Sntaxs RULESET RESULT FORMAT: <Regla> == Rule <númeo de egla> : <Condcón>* class <Clasfcacón> <Condcón> == <Campo> <Compaacón> <Valo> : <Compaacón> == = > <= < Ejemplo dado en la fgua en el fomato RULESET RESULT FORMAT Rule 1 : Renta = baja class No Rule 6 : Renta = meda Rotacón_empleo = alta Rule 2 : Renta = meda Rotacón_empleo = baja class No Comuna = Stgo. Clente_antguo? = nuevo class No Rule 3 : Renta = meda Rotacón_empleo = alta Comuna = Concepcón class S Rule 7 : Renta = meda Rotacón_empleo = alta Comuna = Stgo. Clente_antguo? = antguo Rule 4 : Renta = meda class S Rotacón_empleo = alta Comuna = Valpo. Rule 8 : Renta = alta class S class No Default class : No Rule 5 : Renta = meda Rotacón_empleo = alta Comuna = Vña class S El modelo de esgo puede especfcase de cualquea de las dos fomas antes pesentadas. Dcho modelo paa cada clente en el conjunto de datos de entenamento ecbe una vaable explcatva vectoal X, defnda en la msma foma que paa los modelos de egesón logístca o edes neuonales, más la vaable Y que se espea pedec, y la cual descbe la condcón de se o no un clente malo en témnos de cédto (0: bueno, 1: malo). Las notas de esgo de los clentes pueden fjase a pat de las pobabldades estmadas de que un clente clasfcado en cada hoja sea malo. Dcha nfomacón es calculada po Clementne al pocesa el conjunto de datos de 176

177 entenamento, a pat de los pocentajes obsevados de clentes malos en cada nodo sobe el total de los clentes que han sdo clasfcados en dcho nodo Modelo de entabldad especfcado usando áboles de decsón En este caso el ábol de decsón puede se especfcado tambén de las dos fomas dadas anteomente (TREE RESULT FORMAT o RULESET RESULT FORMAT). La vaable a pedec Y descbe en este caso la condcón de se o no un clente con gan entabldad potencal (0: con gan entabldad potencal, 1: sn gan entabldad potencal). Las notas de entabldad de los clentes pueden fjase a pat de las pobabldades estmadas de clasfca a clentes como sn gan entabldad potencal en cada hoja del ábol, nfomacón que Clementne entega con cada ábol geneado Vaables váldas en los tes tpos de modelos antes explcados A contnuacón se entega la descpcón completa de las vaables que almentan los tes tpos de modelos antes especfcados: Vaables demogáfcas: A1 X Regón A8 X Nvel educaconal A2 X Povnca A9 X Actvdad económca A3 X Comuna A10 X Pofesón A4 X Sexo A11 X Unvesdad A5 X Estado cvl A12 X Régmen conyugal A6 X Cantdad de hjos A13 X Tene datos de edad? A7 X Cantdad de cagas A14 X Edad Vaables de enta: B1 B5 X Patmono X Tpo de enta (fja o vaable) B2 X Tene un ben aíz? B3 X Tene datos de enta? B6 X Antgüedad de la enta B7 X Es tabajado ndependente? B4 X Renta 177

178 Vaables de vínculo con el clente: C1 X Tpo de clente (clente en conveno, clente estánda, etc.) C2 X Antgüedad del clente C3 X Tene líneas de cédto del Banco? C4 X Fecha más emota de apetua de línea de cédto hoy vgente con el Banco C5 X Tene tajetas del Banco? C6 X Fecha más emota de otogamento de tajeta de cédto vgente con el Banco C7 X Monto ognal de las tajetas de cédto del Banco que el clente posee C8 X Tene cédtos no hpotecaos en el Banco? C9 X Fecha más emota de otogamento de cédto no hpot. vgente con el Banco C10 X Monto ognal adeudado en cédtos no hpotecaos del Banco C11 X Plazo máxmo de cédtos no hpotecaos hoy vgentes con el Banco C12 X Tene cédtos hpotecaos del Banco? C13 X Fecha más emota de otogamento de cédto hpot. hoy vgente con el Banco C14 X Monto ognal adeudado en cédtos hpotecaos hoy vgentes con el Banco C15 X Plazo máxmo de cédtos hpotecaos hoy vgentes con el Banco Vaables de ngesos contables po clente: X X X X D1 D2 D3 D4 Ingesos contables geneados po el clente po concepto de mantencón, spead de nteeses, comsones y otos ngesos en líneas de cédto Ingesos contables geneados po el clente po concepto de mantencón, spead de nteeses, comsones y otos ngesos en tajetas de cédto Ingesos contables geneados po el clente po concepto de spead de nteeses, comsones y otos ngesos en cédtos no hpotecaos Ingesos contables geneados po el clente po concepto de spead de nteeses, comsones y otos ngesos en cédtos hpotecaos 178

179 Vaables de compotamento del clente: E1 X En qué tamo de moosdad se encuenta el clente con el Banco E2 X Monto en moa E3 X Pesenta deuda vencda con el Banco? E4 X Pesenta captal castgado con el Banco? E5 X Días de moa en poductos del Banco E6 X Clente está en "fle negatvo"? E7 X Clente pesenta cuenta ceada po el Banco? E8 X Pesenta cédtos enegocados que povenen de ncapacdad de pago E9 X Pesenta cédtos epactados que no povenen de ncapacdad de pago E10 X Pesenta deuda de vaos deudoes povenente de una tajeta caída E11 X Pesenta deuda de vaos deudoes povenente de una línea caída X X X X X X X X E12 E13 E14 E15 E16 E17 E18 E19 Pomedo de la deuda decta moosa en el sstema fnanceo los últmos 3 meses Pomedo de la deuda decta vencda en el sstema fnanceo los últmos 3 meses Pomedo de la deuda ndecta vencda en el sstema fnanceo en los últmos 3 meses Pomedo del saldo de la deuda decta castgada en el sstema fnanceo los últmos 3 meses Pomedo del saldo de la deuda ndecta castgada en el sstema fnanceo los últmos 3 meses Pomedo de la deuda decta moosa en el sstema fnanceo en un peodo compenddo ente 6 meses atás y los últmos 3 meses Pomedo de la deuda decta vencda en el sstema fnanceo en un peodo compenddo ente 6 meses atás y los últmos 3 meses Pomedo de la deuda ndecta vencda en el sstema fnanceo en un peodo compenddo ente 6 meses atás y los últmos 3 meses 179

180 X X X X X X X E20 E21 E22 E23 E24 E25 E26 Pomedo del saldo de la deuda decta castgada en el sstema fnanceo en un peodo compenddo ente 6 meses atás y los últmos 3 meses Pomedo del saldo de la deuda ndecta castgada en el sstema fnanceo en un peodo compenddo ente 6 meses atás y los últmos 3 meses Pomedo de la deuda decta moosa en el sstema fnanceo en un peodo compenddo ente 15 meses atás y los últmos 6 meses Pomedo de la deuda decta vencda en el sstema fnanceo en un peodo compenddo ente 15 meses atás y los últmos 6 meses Pomedo de la deuda ndecta vencda en el sstema fnanceo en un peodo compenddo ente 15 meses atás y los últmos 6 meses Pomedo del saldo de la deuda decta castgada en el sstema fnanceo en un peodo compenddo ente 15 meses atás y los últmos 6 meses Pomedo del saldo de la deuda ndecta castgada en el sstema fnanceo en un peodo compenddo ente 15 meses atás y los últmos 6 meses E27 X Cheques potestados E28 X Otos documentos potestados en el Boletín Comecal E29 X Moosdades nfomadas al Boletín Comecal Vaables de deuda del clente: F1 X Saldo vgente en las líneas de cédto del Banco F2 X Cupo dsponble en las líneas de cédto del Banco F3 X Saldo vgente en las tajetas de cédto del Banco F4 X Cupo dsponble en las tajetas de cédto del Banco F5 X Saldo vgente en cédtos no hpotecaos del Banco F6 X Saldo vgente en cédtos hpotecaos del Banco F7 X Deuda comecal en otos bancos F8 X Deuda de consumo en otos bancos F9 X Deuda hpotecaa en otos bancos F10 X Cupo dsponble en líneas y tajetas de cédto de otos bancos 180

181 F11 X Deuda decta vgente en el últmo mes del últmo nfome SBIF F12 X Monto de línea de cédto dsponble en el últmo nfome SBIF X X X X X X F13 F14 F15 F16 F17 F18 Pomedo de la deuda decta vgente en un peodo compenddo ente 6 meses atás y los últmos 3 meses Pomedo del monto de línea de cédto dsponble en un peodo compenddo ente 6 meses atás y los últmos 3 meses Pomedo de la deuda decta vgente en un peodo compenddo ente 15 meses atás y los últmos 6 meses Pomedo del monto de línea de cédto dsponble en un peodo compenddo ente 15 meses atás y los últmos 6 meses Nvel de leveage hpotecao total del clente, el cual se calcula como la deuda hpotecaa dvdda po la enta Nvel de leveage no hpotecao total del clente, el cual se calcula como la deuda no hpotecaa dvdda po la enta F19 X Estmacón de la caga fnancea del clente 10.4 Evalua el modelo técncamente (taea 4d) Esta taea se encaga de evalua el modelo paa asegua que satsface tanto los cteos de éxto de datamnng (output 1c.2) como los cteos de las puebas (output 4b.1). Coesponde a una evaluacón puamente técnca y estadístca, basada en el esultado de las taeas de modelamento. Dfee po tanto de la subsguente fase de evaluacón de negocos del modelo de datamnng pecsamente po su enfoque técnco. La descpcón de los esultados que se deben obtene como futo de esta taea se entega a contnuacón: Evaluacón técnca del modelo y de los objetvos de datamnng de estma el esgo cedtco y la entabldad potencal de los clentes (output 4d.1) De acuedo a la guía de usuao de la metodología CRISP-DM, este output coesponde a un esumen de los esultados de la taea de evalua el modelo técncamente (taea 4d). Debe nclu lstas de cualdades de los modelos geneados (po ejemplo, en témnos de pecsón) y ankngs de caldad de los modelos geneados. Ente las actvdades que es pecso desaolla paa obtene este esultado se encuentan: 181

182 - Evalua los esultados del modelo con especto a los cteos de éxto de datamnng (output 1c.2), muy en patcula con especto a los eoes tpo I y tpo II defndos en la seccón 7.3, y expesados como pocentaje de un conjunto de datos de pueba. En este punto es pecso fja un puntaje de cote, o nota mínma que pemte clasfca como bueno a un clente 87, y calcula los eoes tpo I y tpo II que se obtengan paa un conjunto de datos de pueba. En un modelo de esgo el eo tpo I povene de clasfca como bueno a un clente que seá malo, mentas que el eo tpo II suge al clasfca como malo a un clente que seá bueno Valda los esultados del modelo sguendo la estatega de puebas (output 4b.1). - Compaa e ntepeta los esultados obtendos en la valdacón. - Cea ankngs de esultados con especto a los cteos de evaluacón técnca. - Seleccona los mejoes modelos. - Obtene comentaos sobe los modelos po pate de expetos en la matea. - Chequea que tan plausble es cada modelo. - Vefca el mpacto que tendía la mplementacón de un modelo paa los objetvos de datamnng de estma el esgo cedtco y la entabldad de los clentes. - Detemna s la nfomacón descubeta po cada modelo es nueva y útl. - Vefca la confabldad de los esultados de los modelos. - S hay una descpcón vebal del modelo geneado, po ejemplo vía eglas, evalua s las eglas son lógcas o factbles, o s contaían el sentdo común. - Compende po qué una detemnada técnca de modelamento y cetos valoes de los paámetos conducen a buenos o a malos esultados Pncpales meddas estadístcas paa evalua modelos técncamente A contnuacón se da un conjunto de meddas estadístcas que pueden se usadas paa compaa modelos pedctvos, entegando paa cada una sus ventajas y desventajas. 87 Análogamente un puntaje de cote es la nota mínma paa calfca a un clente como con gan entabldad potencal 88 Análogamente lo msmo es váldo paa los modelos de entabldad. El eo tpo I se comete al calfca como clente con gan entabldad potencal a un clente sn ella, en tanto que el eo tpo II ocue al clasfca como clente sn gan entabldad potencal a un clente que s poseeá una gan entabldad potencal 182

183 Dvegenca La dvegenca puede usase paa med la sepaacón de la dstbucón de clentes malos de la dstbucón de clentes buenos. Un modelo que entegue mayo dvegenca que oto seá capaz de sepaa mejo a los clentes buenos de los malos a tavés de las notas de esgo, en otas palabas seá capaz de dstngu mejo a los clentes malos de los buenos. La dstbucón de clentes malos puede estmase a pat del hstogama de fecuenca de los puntajes de esgo de los clentes malos. La dstbucón de clentes buenos puede apoxmase análogamente a pat de un hstogama de los puntajes de clentes buenos. La dvegenca D de dos modelos se calcula como sgue: Donde µ b y D = ( µ µ ) 1 2 m ( σ 2 + σ 2 ) m b b 2 σ 2 b son la meda y la vaanza de la dstbucón de puntaje de los clentes buenos y clentes malos. µ m y σ 2 m son la meda y la vaanza de la dstbucón de puntaje de los Fgua Factoes consdeados en la dvegenca de un modelo de puntaje: cuanto se sepaan y se supeponen las dstbucones de buenos y malos Fuente: ADAMSON, J. DOUGLAS, Evaluatng & Compang Pedctve Models, Fa Isaac Insght Sees,

184 Ente las ventajas de este estadístco se encuentan el que consdea las dstbucones de puntajes completas paa ealza la compaacón de modelos. Toma en consdeacón la sepaacón de los dos gupos de clentes, buenos y malos, al gual que las vaanzas de sus dstbucones. Ente sus desventajas están el que tal vez no dentfca el mejo modelo paa una detemnada nota de cote, entendendo esta últma como la nota mínma aceptable paa apoba una decsón de otogamento de cédto. Ello povene del hecho de que s ben un modelo puede sepaa mejo a los clentes malos de los buenos en témnos geneales, ello no gaantza que paa una nota específca tal modelo sepae mejo que el esto a los clentes buenos de los malos Estadístco de Kolmogoov-Smnov (K-S) Este estadístco mde la dfeenca máxma ente las cuvas de pobabldad acumulada del puntaje de dos gupos de clentes, po ejemplo: clentes buenos y malos. Fgua Estadígafo K-S, calculado como la máxma dstanca ente las dstbucones de buenos y malos de un modelo de puntaje 90 Mentas mayo sea el estadístco K-S de un modelo, mejo seá la capacdad de dcho modelo paa sepaa a los clentes buenos de los malos. Este estadístco tene la ventaja de se fácl de ntepeta. Sus desventajas ncluyen el med la sepaacón de 90 Fuente: ADAMSON, J. DOUGLAS, Evaluatng & Compang Pedctve Models, Fa Isaac Insght Sees,

185 dos dstbucones de pobabldad en un solo punto y el se un método que depende fuetemente de cual sea la eleccón de las bandas de puntaje. No obstante, la mayo desventaja adca en que el punto de máxma sepaacón ente las dstbucones de buenos y malos puede esta lejos del puntaje de cote que esté sendo utlzado paa toma decsones de otogamento de cédto. Un modelo puede sepaa en geneal mejo que el esto a los clentes buenos de los malos po tene un estadístco K-S más elevado, no obstante ello no gaantza que dcho modelo sea mejo que el esto dstnguendo a los clentes buenos de los malos paa un puntaje de esgo específco (po ejemplo: un puntaje de cote mínmo usado paa otoga cédto) Cuva ROC o de Tade-off Los oígenes de la cuva ROC o de Tade-off se emontan a 1905, cuando Max O. Loenz desaolló la cuva que lleva su nombe paa mosta la desgualdad en la dstbucón del ngeso. Los puntos sobe la cuva de Loenz gafcaban declaacones del tpo: el 80% de todos los hogaes pecbe sólo un 20% de la queza. El eje hozontal de la cuva epesentaba el pocentaje acumulado de hogaes consdeados, odenados de meno a mayo nvel socoeconómco, mentas que el eje vetcal lustaba el pocentaje de la queza que pecbían los hogaes. Fgua Cuvas de tade-off de dos modelos de puntaje Fuente: ADAMSON, J. DOUGLAS, Evaluatng & Compang Pedctve Models, Fa Isaac Insght Sees,

186 La cuva ROC (Receve Opeatng Chaactestc Cuve), conocda tambén como cuva de tade-off, es análoga a la cuva de Loenz, con la salvedad de que odena a los clentes de mayo a meno nota. Luego de odenados éstos, paa cada nota debe contase el númeo de clentes P con un puntaje gual o meno a dcha nota, a la vez que el númeo de clentes malos M con un puntaje gual o nfeo. La cuva ROC se obtene gafcando M v/s P, expesados en témnos de pocentajes sobe el total de clentes malos y sobe el total de clentes de la poblacón, espectvamente. Ente las ventajas de la cuva ROC están el pemt compaa vsualmente la efectvdad de dos modelos, del msmo modo que ealza compaacones de dstntos puntajes de cote. La fgua muesta la cuva ROC paa dos modelos, A y B. A pesenta un mejo desempeño que B, puesto que paa el X % de la poblacón con peoes notas B dentfca solamente Z % de los malos, en tanto que A loga econoce Y %. La línea aleatoa odena a los clentes po puntajes con dstbucón unfome de pobabldad Receve Opeatng Chaactestc (ROC) Este estadígafo esume el áea bajo una cuva de tade-off. Mentas mayo sea el áea, mejo seá el modelo. Fgua Estadígafo ROC de un modelo de puntaje, calculado como el áea bajo la cuva de tade-off Fuente: ADAMSON, J. DOUGLAS, Evaluatng & Compang Pedctve Models, Fa Isaac Insght Sees,

187 Ente las ventajas de este estadístco están el povee un valo cuanttatvo, y el pemt compaa cuvas de tade-off completas, consdeando toda la poblacón. Cuando las cuvas de tade-off se cuzan, ayuda a ndca qué modelo es más efectvo en témnos globales. Ente sus desventajas están que no pemte ndca qué modelo puede sepaa en mejo foma a los clentes buenos de los malos paa un puntaje de esgo detemnado (po ejemplo: un puntaje de cote mínmo usado paa otoga cédto) Razón Odds/Scoe Este estadístco gafca el logatmo de los odds paa cada puntaje. Los odds paa un detemnado puntaje coesponden al númeo de clentes buenos dvddo po el númeo de clentes malos que se obsevan con ese puntaje. La gáfca obtenda es altamente dependente de la escala abtaa de puntaje que calcule un modelo. Este estadístco puede se usado paa compaa el desempeño de un msmo modelo a lo lago del tempo, o paa compaa el desempeño de un msmo modelo sobe segmentos de clentes dstntos. Ente sus ventajas están el mosta la capacdad de odenamento po puntaje que posee un modelo. Ente sus desventajas fguan el que no povee de nfomacón sobe la dstbucón subyacente (como la cuva de tade-off), y el que no pemte compaa modelos dstntos con escalas de puntajes dstntas. Fgua Razón de Odds/Scoe de un modelo de puntaje Fuente: ADAMSON, J. DOUGLAS, Evaluatng & Compang Pedctve Models, Fa Isaac Insght Sees,

188 Evaluacón técnca automatzada de modelos utlzando Clementne A contnuacón se muesta como Clementne ayuda a automatza la obtencón del esultado 4d.1, coespondente a la evaluacón técnca de los modelos. En el dagama se lusta como seleccona una muesta paa valda los modelos, la cual se denomna conjunto de datos de pueba. En la fgua Clementne toma de los nodos etquetados Clentes malos hoy y Clentes buenos hoy todos aquellos egstos que no fueon selecconados paa confoma el conjunto de datos de entenamento. Fgua Flujo de datos en Clementne que obtene un conjunto de datos de pueba paa valda un modelo 94 El nodo etquetado 50% estante de muesta de malos ealza una mezcla especal de sus nputs conocda como antjon, que lo que hace es seleccona todos aquellos egstos del nodo Clentes malos hoy que no se encuentan ente los egstos del nodo 50% de muesta de malos (los cuales fueon utlzados en el conjunto de datos de entenamento). El nodo etquetado 99% estante de muesta de buenos ealza 94 Fuente: elaboacón popa 188

189 una mezcla análoga empleando la modaldad antjon de manea de no utlza los egstos empleados en el conjunto de datos de entenamento. Fgua Flujo de datos en Clementne que entega notas y pedccones de de esgo y entabldad potencal paa un conjunto de clentes 95 La fgua muesta como los modelos geneados que apaecen en la esquna supeo deecha pueden se enchufados al conjunto de datos de pueba. En efecto, el conjunto de datos de pueba apaece conectado a un gupo de modelos que fguan sobe la etqueta Utlzacón de modelos, obtenendo notas de esgo o entabldad potencal en los nodos sobe la etqueta Pedccones. Dchas notas coesponden efectvamente a pedccones o estmacones de las pobabldades de que los clentes se tansfomen en malos o en pesonas sn gan entabldad potencal. Al clasfca con aquellas notas de esgo y entabldad potencal un conjunto de clentes contendos en el conjunto de datos de pueba es posble utlza las dstntas meddas estadístcas paa evalua los modelos técncamente (dvegenca, estadístco K-S, etc., las cuales se 95 Fuente: elaboacón popa 189

190 han detallado en la seccón ). Del msmo modo, a pat de los puntajes calculados paa el conjunto de datos de pueba, y habendo defndo puntajes de cote paa los modelos de esgo y de entabldad potencal es posble calcula los eoes tpo I y tpo 2 defndos en la seccón 7.3 (output 1c.2) Establece los paámetos evsados (output 4d.2) Este esultado es el segundo de la taea de evalua el modelo técncamente (taea 4d). De acuedo a la guía de usuao de la metodología CRISP-DM, este output coesponde a un chequeo de los valoes establecdos paa los paámetos y a un afnamento teatvo de dchos paámetos medante etonos sucesvos a la taea de constuccón de modelos (taea 4c). Ente las actvdades que es pecso desaolla paa obtene este esultado se encuenta el ajusta los paámetos paa obtene el mejo modelo. 190

191 11 QUINTA FASE DEL PLAN: EVALUACIÓN DE NEGOCIOS El sguente dagama muesta las dstntas taeas que deben se ealzadas en la fase de evaluacón de negocos de la metodología CRISP-DM, junto a los esultados que deben obtenese de la ejecucón de cada una de ellas: Fgua 11.1 Taeas y outputs de la fase de evaluacón de negocos, qunta fase del poyecto de datamnng según metodología CRISP-DM 96 A contnuacón se descben las taeas de esta fase y sus coespondentes esultados, entegando consejos y ecomendacones tomados de la guía de usuao CRISP-DM 97 y de la expeenca y eflexón del auto de este documento. Dado que el plan de datamnng planteado es conceptual y no se efee a nngún Banco en patcula, son 96 Fuente: CHAPMAN, Pete, CLINTON, Julan, KERBER, Randy, KHABAZA, Thomas, REINARTZ, Thomas, SHEARER, Coln, WIRTH, Rüdge, CRISP DM 1.0 Step By Step Data Mnng Gude, SPSS Inc., Fuente: CRISP-DM Use Gude, edactado po el CRISP-DM Consotum, documento contendo en CHAPMAN, Pete, CLINTON, Julan, KERBER, Randy, KHABAZA, Thomas, REINARTZ, Thomas, SHEARER, Coln, WIRTH, Rüdge, CRISP DM 1.0 Step By Step Data Mnng Gude, SPSS Inc.,

192 tambén genécas y conceptuales todas las ndcacones que se entegan con especto a los modelos apobados (output 5a.2), a la evsón del poceso (output 5b.1) a la lsta de accones posbles (output 5c.1) y a la decsón a toma en esta fase (output 5c.2). Se entegan, en cambo, comentaos efedos a las campañas bancaas al descb la evaluacón de negocos de los esultados de datamnng (output 5a.1), po cuanto paa dchas campañas se han defndo en este documento dos objetvos de negocos concetos Evalua los esultados de negocos (taea 5a) En las taeas pevamente desctas se evaluaba el modelo de datamnng en elacón a factoes tales como su pecsón y genealdad. En esta taea, en cambo, debe evaluase el nvel de satsfaccón de los objetvos de negocos pesegudos po el poyecto de datamnng. S el modelo es defcente en cuanto al cumplmento de dchos objetvos debe detemnase s exste alguna azón que lo explque. Las descpcones de los esultados que se deben obtene como futo de esta taea se entegan a contnuacón: Evaluacón de negocos de esultados de datamnng y de los objetvos de negocos de focalzase en nchos y cece sujeto a un nvel mínmo de esgo (output 5a.1) De acuedo a la guía de usuao de la metodología CRISP-DM, este output coesponde a un esumen de los esultados de la evaluacón de negocos en témnos de cteos de éxto, ncluyendo una declaacón fnal sobe s el poyecto satsfzo los objetvos de negocos ncales. Ente las actvdades que es pecso desaolla paa obtene este esultado se encuentan las sguentes: - Compende los esultados de los modelos. - Intepeta los esultados de los modelos en témnos de la aplcacón que se les daá. - Evalua el mpacto de los esultados de datamnng paa los objetvos de negocos. - Evalua los esultados de datamnng con especto a los cteos de éxto de negocos, vale dec, vefca s el poyecto consguó los objetvos de negocos ognales. Muy en especal es pecso chequea el cumplmento de los cteos de éxto de negocos 192

193 (output 1a.3) de aumenta los montos ofecdos en las campañas en un pocentaje detemnado y de acota las péddas espeadas de éstas en una cfa detemnada. - Rankea esultados de datamnng con especto a los cteos de éxto de negocos. - Vefca s hay nuevos objetvos a se tatados en el poyecto o en nuevos poyectos. - Establece conclusones paa futuos poyectos de mneía de datos. En los supuestos de negocos de la nvestgacón se ha menconado que se aceptan sólo dos fomas paa compet paa un Banco pequeño en el compettvo ambente bancao actual: alcanza economías de escala medante cecmento o focalzase en nchos de mecado específcos. Dos han sdo po lo tanto los objetvos de negocos que se han defndo paa este poyecto de datamnng en el capítulo de compensón del negoco: la labo de focalzacón popamente tal, y el cecmento sujeto a un nvel mínmo de esgo. En este punto deben evaluase los esultados de los modelos de datamnng con especto a dchos objetvos. En pme témno, en la evaluacón de negocos debeá detemnase s los modelos pedctvos pemten efectvamente dentfca segmentos de esgo y entabldad con caacteístcas dstntas a las de los clentes pomedo. Ello seá posble en la medda que los clentes estén espacdos en dstntos segmentos, y no aglutnados en uno solo. No obstante, como se mencona en el capítulo 7, es dfícl expesa el objetvo de focalzacón en témnos numécos, po lo que debe dentfcase a algún pofesonal que evalúe los cteos de éxto a ese especto, y entegue un juco sobe su nvel de cumplmento. La fgua 11.2 lusta cómo es posble clasfca a los clentes en dstntos segmentos en base a sus puntajes de esgo y entabldad. Es clao que dentfcando segmentos como los de la fgua 11.2 puede dgse una ofeta dfeencada a cada segmento (po ejemplo: cédtos de consumo con tasas pefeencales sólo paa el segmento esgo bajo, alta entabldad ). Po oto lado, un esquema multsegmentos como el dado en la fgua 11.2 pemte apoya la mplementacón de una oentacón estatégca de las campañas, entendda como se ha descto en el capítulo

194 Fgua 11.2 Segmentos de esgo y entabldad 98 En segundo témno, en la evaluacón de negocos debe detemnase s los modelos pedctvos pemten a un Banco cece satsfacendo un nvel mínmo de esgo. Con tal popósto, es pecso ecu a los supuestos opeaconales dados en las hpótess de tabajo, y de acuedo a los cuales el Banco ealza sus campañas con una oentacón opeaconal. Como se ha menconado en la seccón 5.5, bajo un enfoque opeaconal no exsten modelos capaces de calcula la pobabldad de pédda de los péstamos dgdos a cada clente, y en consecuenca no es posble estma la pobabldad de pédda asocada al monto total ofecdo en una campaña. Como ya se menconó en la msma seccón, en ausenca de un modelo capaz de med en foma cetea el nvel de esgo de una campaña (vale dec, la pédda asocada al monto ofecdo en ésta), un Banco no podá maxmza los montos ofecdos a sus clentes sujeto todo ello a la satsfaccón de un ceto nvel de esgo. En esta seccón se mostaá como un esquema multsegmentos de esgo y entabldad pemte alcanza un mejo desempeño, al hace posble maxmza los montos ofecdos paa un ceto nvel de esgo. Bajo un enfoque opeaconal las campañas bancaas se ealzan sn segmenta a los clentes po cteos de esgo y entabldad potencal, entegando una ofeta estánda a todos quenes cumplan cetos cteos de esgo. La sguente fgua lusta una segmentacón semejante: 98 Fuente: elaboacón popa 194

195 Fgua 11.3 Oentacón opeaconal de las campañas bancaas 99 La utlzacón de un esquema multsegmentos como el lustado en la fgua 11.2 pemte que un Banco con el enfoque opeaconal dado en la fgua 11.3 cezca po tes azones dstntas: 1. Exste un segmento de la fgua 11.2 que no ecbe ofeta alguna en la fgua 11.3, y que puede se objeto de una ofeta dfeencada. 2. El esquema multsegmentos hace posble dentfca el potencal de negocos de los clentes vía las notas de entabldad, lo que faclta oenta los esfuezos de las campañas haca los clentes con mayo potencal. 3. El esquema multsegmentos pemte aumenta los montos ofecdos a los clentes satsfacendo un nvel mínmo de esgo. Como se ha explcado en la seccón 7.1 al descb los cteos de éxto de negocos (output 1a.3), dcho nvel mínmo de esgo puede establecese como un monto espeado de péddas en cada campaña. Paa cada clente el monto de pédda espeada se calcula como el monto ofecdo a dcho clente multplcado po la pobabldad de que dcho clente se tansfome en malo en el futuo (la cual coesponde en foma bunívoca a un puntaje de esgo). Dcha pobabldad aumentaá al ncementase la caga fnancea del clente, en el caso de que éste acepte el monto ofecdo. Po lo tanto, la maxmzacón de los montos ofecdos sujeta a satsface un detemnado nvel de esgo coespondeá a 99 Fuente: elaboacón popa 195

196 Sea un poblema de pogamacón no lneal, en la medda que la estccón contempla la multplcacón de las vaables po pobabldades que dependen de las msmas vaables. A contnuacón se entegaá una especfcacón de un modelo de pogamacón no lneal que pemte estma los montos a ofece en las campañas, a la vez que se dan algunas ndcacones sobe como esolvelo. De cualque foma la esolucón de semejante poblema escapa a los objetvos de esta nvestgacón. En esta seccón smplemente se desea mosta como los puntajes de esgo y entabldad pemten especfca matemátcamente el poblema de detemna los montos a ofece en una campaña, satsfacendo un detemnado nvel de esgo. S ben el poblema especfcado puede se dfícl de esolve en foma exacta, su sola especfcacón ya pemte compaa dstntas solucones posbles, po lo que hace posble escoge la mejo solucón ente ellas. Po lo tanto, la especfcacón del poblema pemte po s sola cumpl el objetvo de aumenta los montos ofecdos en una campaña sujeto a satsface un ceto nvel de esgo. x el monto ofecdo en una campaña a un clente. Sea 2 p la pobabldad de que un clente se tansfome en malo en el futuo (la cual coesponde en foma 2 bunívoca a un puntaje de esgo). La menconada pobabldad p debeá calculase tenendo en consdeacón el aumento en el endeudamento del clente al acepta el monto ofecdo. Mentas mayo sea el aumento de la caga fnancea de un clente, mayo seá el aumento de su nvel de esgo. Po oto lado, mentas mayo sea la entabldad potencal de un clente, mayo seá tambén su capacdad paa ncementa su nvel de endeudamento sn deteoa su nvel de esgo. Po lo tanto, el aumento del nvel de esgo de un clente seá funcón no lneal del cambo en su nvel de caga fnancea, al msmo tempo que funcón no lneal de su entabldad potencal, como lo muesta la fgua El aumento de esgo de los clentes poducto de la aceptacón de una ofeta se denomna p, el cual se defne como la azón ente el cambo en la pobabldad de que el clente se tansfome en malo y el máxmo cambo que podía vefcase en dcha pobabldad. Po lo tanto, los valoes posbles paa y 100%. p se encuentan ente 0% 196

197 Fgua 11.4 Funcones contnua y escalonada que descben el aumento del esgo de los clentes al aumenta su caga fnancea 100 S se denota como 1 p la pobabldad de que el clente se tansfome en malo antes de acepta la ofeta ealzada en la campaña, entonces sguente: La funcón p = p 2 - p 1- p 1 1 p vendá dado po la fómula p puede obtenese a pat de los datos de un conjunto de clentes. La foma más smple de descb dcha funcón es a tavés de un conjunto de tablas, las cuales deben entega una estmacón de potencal y de aumento de la caga fnancea. p paa cada pa de valoes de entabldad El puntaje de entabldad potencal del clente se denota en la fgua 11.4, en tanto que el aumento en la caga fnancea de los clentes al acepta el monto ofecdo en una campaña se denomna q. Denotando como I el ngeso mensual de un clente 100 Fuente: elaboacón popa 197

198 y como Cuota ( x ) la cuota que coespondeía paga mensualmente a dcho clente po un monto ofecdo x, se tendá que Claamente q = q vendá dado po la sguente elacón: Cuota( x I ) q debe se mayo que 0. Po oto lado, denotando como q la caga fnancea del clente antes de acepta el monto ofecdo en la campaña, debe tenese que la suma ente q y 100% de los ngesos de un clente). q debeá se meno a 1 (puesto que no puede supea el Con las defncones dadas pevamente es posble expesa como un modelo de pogamacón no lneal el poblema de detemna los montos a ofece en las campañas, satsfacendo al msmo tempo un nvel de esgo dado po una pédda espeada de P : Denotando po -1 Max x s. a. p q x q n = ( x p ) = 0 n = 1 = ( 1 ( 1 p + p 1- p ) Cuota( x I q x 1 = P ) { { { 1,...n 1,...n 1,...n Cuota la funcón nvesa de la funcón Cuota x ) el poblema anteo de manea que las vaables sean los aumentos } } } (, es posble escb q de las cagas fnanceas de los clentes al acepta los montos ofecdos. En efecto, se tendá - = Cuota ( q I ), po lo que el poblema de optmzacón podá expesase como x 1 se muesta a contnuacón: 198

199 Max q s. a. 0 q n = 1 + Cuota q n = 1 q Cuota ( q 1 ( q I { { ) 1,...n I 1,...n ( 1 ( 1 p + p 1- p ) } } ) = P Algunas fomas de de esolve el modelo anteo, como son el método del gadente y las condcones de Kaush-Kuhn-Tucke, equeán que la funcón p esté expesada en foma contnua y dfeencable. No obstante, es posble entega una foma ngenua y q puede asum p es una funcón escalonada. Dcha solucón fáclmente compensble de esolve el modelo anteo s úncamente valoes dscetos, y s consste en poba todas las posbles combnacones de valoes paa el conjunto de vaables q. S los valoes que q puede asum se lmtan a tan solo 11 númeos posbles (0%, 10% %), entonces se tendán 11 n combnacones posbles, un númeo en vedad enome. S ben tal solucón ngenua es mpactcable computaconalmente paa cualque conjunto de clentes, puede mplementase paa un conjunto de segmentos de clentes lmtado, (10 segmentos, o n = 10, po ejemplo) 101. La optmzacón antes lustada no puede se mplementada con un enfoque opeaconal de las campañas, sn dstncón de segmentos de esgo/entabldad. Un esquema opeaconal de las campañas puede flta clentes que no cumplen con detemnados cteos de esgo, peo no puede detemna la pobabldad de pédda asocada a cada clente, po lo que tampoco puede obtene la pédda espeada paa una campaña, y en consecuenca no puede obtene el máxmo monto a ofece a los clentes satsfacendo un nvel mínmo de esgo. 101 En efecto, s un computado puede ealza mllones de opeacones po segundo, podá ealza opeacones en unas 7 hoas

200 Bajo un esquema opeaconal la máxma cuota que puede paga un clente se detemna a pat de las polítcas de cédto del Banco, lo cual no necesaamente debe se lo más adecuado, en patcula poque en nngún momento se utlza el nvel de entabldad potencal de los clentes. En esumen, puede obsevase, po lo tanto, que medante modelos pedctvos que calculan puntajes de esgo y entabldad pueden constuse segmentacones que ayuden a que un Banco cezca y contole un nvel mínmo de esgo. El objetvo de aumenta los montos ofecdos en las campañas puede medse dectamente de los esultados del modelo de datamnng. No obstante, es pecso espea mínmo un año y medo paa vefca s el nvel de esgo de los clentes consdeados en las campañas satsfzo efectvamente el nvel mínmo estpulado en los cteos de éxto de negocos (output 1a.3). Ello se debe a que la expeenca señala que los clentes pueden tada años en tansfomase en malos. En efecto, los clentes que ecben un cédto de consumo y que dejan de pagalo sólo lo haán luego de tanscudo un mínmo de dos años. Po ello el objetvo de cecmento debe medse no sólo en el coto plazo, sno que tambén en el lago plazo Modelos apobados (output 5a.2) Este esultado es el segundo de la taea de evalua los esultados de negocos (taea 5a). Después de evalua un modelo con especto a los cteos de éxto de negocos eventualmente se obtendán modelos apobados (s se da el caso que los modelos geneados cumplan con los cteos equedos) Revsa el poceso de datamnng (taea 5b) En esta taea es pecso evsa en foma acucosa s algún facto o actvdad mpotantes del poyecto de datamnng fueon pasados po alto. Consttuye una evsón de caldad ealzada no sobe los datos, sno que sobe el poceso que geneó los esultados de datamnng. La descpcón de los esultados que se deben obtene como futo de esta taea se entega a contnuacón: 200

201 Revsón del poceso de datamnng (output 5b.1) De acuedo a la guía de usuao de la metodología CRISP-DM, este esultado coesponde a un esumen de la evsón del poceso de datamnng. Es un documento que contene pstas paa descub actvdades que han sdo olvdadas o que debean se epetdas. Ente las actvdades que es pecso desaolla paa obtene este esultado se encuentan las sguentes: - Da una vsón geneal del poceso de datamnng utlzado. - Analza el poceso de datamnng, espondendo en etospectva s fue o no necesaa cada fase del poyecto y s se ejecutó óptmamente. - Detemna de qué foma podía se mejoado el poceso de datamnng. - Identfca posbles fallas en el poceso de datamnng. - Identfca pasos del poceso de datamnng que podían conduc a eo. - Identfca posbles accones altenatvas en el poceso de datamnng Detemna los póxmos pasos (taea 5c) De acuedo a lo obtendo a tavés de la evaluacón de negocos de los esultados de datamnng y de la evsón del poceso de datamnng, en este punto debe decdse s debe dase po temnado el poyecto y enta a la fase de desplegue, s deben ncase teacones adconales, o ben s debe ncase un nuevo poyecto de mneía de datos. Las descpcones de los esultados que se deben obtene como futo de esta taea se entegan a contnuacón: Lsta de las accones posbles (output 5c.1) Paa consegu este esultado deben ealzase las sguentes actvdades: - Realza una lsta de las accones ulteoes a empende en el poyecto de datamnng junto a las azones a favo y en conta de cada opcón asocada. - Analza el potencal de desplegue de cada esultado de datamnng. - Estma el potencal de mejoamento del actual poceso de datamnng. - Vefca s los ecusos estantes pemten teacones adconales del poceso de datamnng, o s po el contao deben obtenese ecusos adconales. 201

202 - Recomenda altenatvas de contnuacón del poyecto de datamnng. - Refna el plan del poceso de datamnng Decsón (output 5c.2) Este esultado es el segundo de la taea de detemna los póxmos pasos (taea 5c). De acuedo a la guía de usuao de la metodología CRISP-DM, este output coesponde a una descpcón de la decsón en témnos de cómo pocede a contnuacón, junto a las azones que justfcan tal medda. Ente las actvdades que es pecso desaolla paa obtene este esultado se encuentan las sguentes: - Realza un ankng de las accones posbles. - Seleccona una de las accones posbles. - Documenta las azones que justfcan la eleccón. 202

203 12 SEXTA FASE DEL PLAN: DESPLIEGUE DE LOS RESULTADOS El sguente dagama muesta las dstntas taeas que deben se ealzadas en la fase de desplegue de la metodología CRISP-DM, junto a los esultados que deben obtenese de la ejecucón de cada una de ellas: Fgua 12.1 Taeas y outputs de la fase de desplegue, sexta y últma fase del poyecto de datamnng según metodología CRISP-DM 102 A contnuacón se descben las taeas de esta fase y sus esultados, entegando consejos y ecomendacones dados en la guía de usuao CRISP-DM 103 y tomados de 102 Fuente: CHAPMAN, Pete, CLINTON, Julan, KERBER, Randy, KHABAZA, Thomas, REINARTZ, Thomas, SHEARER, Coln, WIRTH, Rüdge, CRISP DM 1.0 Step By Step Data Mnng Gude, SPSS Inc.,

204 la expeenca y eflexón del auto de este documento. En vtud de que el plan de datamnng que se ha elaboado en el pesente documento es conceptual y no se basa en nngún caso específco de nngún Banco, son tambén conceptuales las ecomendacones entegadas paa el plan de montoeo y mantencón (output 6b.1), paa el epote y la pesentacón fnales (outputs 6c.1 y 6c.2) y paa la documentacón de la expeenca (output 6d.1). Un caso dstnto coesponde al plan de desplegue (output 6a.1), que se descbe en este capítulo apotando antecedentes sobe cómo es posble automatza la mplementacón de los modelos de las campañas dento de los sstemas nfomátcos de un Banco sn ncu en costos de desaollo de softwae Planfca el desplegue (taea 6a) Esta taea toma los esultados de la evaluacón del modelo de datamnng y elaboa una estatega paa desplega el modelo en el negoco. Se debe detemna cómo popaga a los usuaos la nfomacón geneada po el modelo, y cómo desplega los esultados de éste dento de los sstemas nfomátcos de la empesa. Deben tambén dentfcase poblemas que pudesen sug al desplega los esultados de datamnng. Las descpcones de los esultados que se deben obtene como futo de esta taea se entegan a contnuacón: Plan de desplegue (output 6a.1) De acuedo a la guía de usuao de la metodología CRISP-DM, este esultado es un esumen de la estatega de desplegue del modelo de datamnng. Dcho esumen debe nclu los dstntos pasos a segu en el desplegue y señala cómo ejecutalos. Ente las actvdades que es pecso desaolla paa obtene este esultado se encuentan: - Resum los esultados desplegables. - Desaolla planes altenatvos de desplegue de los esultados de datamnng. - Paa cada modelo obtendo decd qué plan de desplegue aplca. - Detemna cómo se popagaá a los usuaos el nuevo conocmento descubeto. - Detemna cómo se desplegaán los esultados de los modelos dento de los sstemas nfomátcos de la oganzacón. 103 Fuente: CRISP-DM Use Gude, edactado po el CRISP-DM Consotum, documento contendo en CHAPMAN, Pete, CLINTON, Julan, KERBER, Randy, KHABAZA, Thomas, REINARTZ, Thomas, SHEARER, Coln, WIRTH, Rüdge, CRISP DM 1.0 Step By Step Data Mnng Gude, SPSS Inc.,

205 - Detemna cómo se montoeaá la utlzacón de los esultados de los modelos y cómo se medán sus benefcos. - Identfca posbles poblemas que podían sug al desplega los esultados Automatzacón de la fase de desplegue utlzando Clementne En la fase de desplegue del modelo debe mplementase éste. Gacas a las facldades popoconadas po Clementne ello no mplca un costo adconal en témnos de desaollo de softwae. De hecho, los modelos geneados en la fase de modelamento son almacenados en nodos, que no son ota cosa sno pogamas computaconales lstos paa usa. La fgua 12.2 muesta cómo utlza esos pogamas: Fgua 12.2 Flujo de datos en Clementne que obtene una base de clentes con notas de esgo y entabldad a pat de una base de vaables pedctvas Fuente: elaboacón popa 205

206 La fgua 12.2 contene el msmo dagama que se ha utlzado en el capítulo 9 paa obtene una base de vaables pedctvas, con la salvedad que se ha agegado uno de los menconados nodo-pogama en la esquna nfeo deecha bajo la etqueta Modelo. Al enchufa a la base de vaables pedctvas uno de esos nodos-pogama se obtenen notas de esgo o de entabldad de los clentes. Dchas notas de esgo y de entabldad potencal pemten a su vez genea ofetas automátcamente a tavés de Clementne, como se lusta abajo en la fgua 12.3: Fgua 12.3 Flujo de datos en Clementne que obtene una base de ofetas comecales a pat de una base con notas de esgo y entabldad Planfca el montoeo y la mantencón (taea 6b) En esta taea debe detemnase cómo se montoeaá la pecsón del modelo y sus esultados, y cuándo deben deja de utlzase éstos. El montoeo y la mantencón son en extemo mpotantes en el caso de las campañas bancaas, puesto que los esultados de datamnng se vuelven pate del tabajo opeaconal cotdano de un Banco. Un buen plan de mantencón ayuda a evta el pelgo del uso ncoecto de los esultados de datamnng. Las descpcones de los esultados que se deben obtene como futo de esta taea se entegan a contnuacón: Plan de montoeo y mantencón (output 6b.1) De acuedo a la guía de usuao de la metodología CRISP-DM, este esultado coesponde a un esumen de la estatega de montoeo y mantencón, y debe nclu 105 Fuente: elaboacón popa 206

207 los pasos necesaos y cómo ejecutalos. Ente las actvdades que es pecso desaolla paa obtene este esultado se encuentan: - Chequea qué podía camba en el ambente en el medano y lago plazo. - Vefca cómo se montoeaá la pecsón del modelo y sus esultados. - Establece cuándo debe dejase de utlza un modelo de datamnng. Identfca los cteos paa ello. Establece qué debea pasa s un modelo o esultado de datamnng ya no pudese se utlzado (actualza el modelo, comenza un nuevo poyecto de datamnng, etc.). - Detemna s cambaán en el tempo los objetvos de negocos que se pesguen con la utlzacón del modelo. Documenta completamente el poblema ncal que el modelo ntentaba esolve. Como se ha vsto en el capítulo sobe la evaluacón de negocos, sólo en el lago plazo es posble vefca el cumplmento del objetvo de negocos de cecmento sujeto a un nvel mínmo de esgo. Po ello el éxto y aceptacón de los modelos de datamnng planteados en este documento sólo podán vsualzase en el lago plazo. Es vtal, po lo tanto, conta no sólo con el fme compomso de la nsttucón fnancea y de su auspcado paa mplementa, montoea y mantene los modelos de datamnng de las campañas bancaas, sno que tambén es pecso que dcho compomso sea de lago alento Poduc el epote fnal (taea 6c) Esta taea coesponde a la elaboacón de un epote fnal con un esumen del poyecto y sus expeencas. Las descpcones de los esultados que se deben obtene como futo de esta taea se entegan a contnuacón: Repote fnal (output 6c.1) De acuedo a la guía de usuao de la metodología CRISP-DM, este esultado coesponde al nfome fnal escto del poyecto de datamnng e ncluye todos los entegables pevos, a la vez que esume y oganza sus esultados. 207

208 Pesentacón fnal (output 6c.2) Este esultado es el segundo de la taea de poduc el epote fnal (taea 6c). De acuedo a la guía de usuao de la metodología CRISP-DM, este output coesponde a una eunón al fnal del poyecto en la cual los esultados del poyecto de datamnng son pesentados a su auspcado Revsa el poyecto (taea 6d) En esta taea coesponde evalua lo que ocuó coectamente y lo que ocuó mal en el poyecto de mneía de datos, lo que se hzo ben y lo que necesta se mejoado. La descpcón del esultado que se debe obtene como futo de esta taea se entega a contnuacón: Documentacón de la expeenca (output 6d.1) De acuedo a la guía de usuao de la metodología CRISP-DM, este esultado coesponde a un esumen de las expeencas más mpotantes adqudas duante el poyecto (po ejemplo: defectos, enfoques conducentes a eo, o pstas paa seleccona técncas de datamnng en stuacones smlaes). 208

209 13 CONCLUSIÓN De la nvestgacón completa puede concluse que medante heamentas de datamnng puede elaboase un plan paa enfoca las campañas en un Banco pequeño que caece de un datawaehouse, de manea de pemt a la nsttucón segmenta a sus clentes y cece. Ello ha quedado demostado al detalla cómo elaboa un plan semejante a pat de las hpótess de tabajo. Po lo tanto, la tess que se petendía demosta en un comenzo es válda, s se aceptan los supuestos ealzados en matea de dsponbldad de nfomacón, de tecnología, de maco egulatoo, de negocos y de opeacones. De este modo el objetvo pncpal de la nvestgacón se ha cumpldo. Se han extaído tambén conclusones elevantes de cada una de las ses fases en las que se ha dvddo el desaollo de la tess. Dchas conclusones se detallan a contnuacón: 1. De la fase de compensón del negoco puede concluse que es mpotante dentfca los objetvos de negocos que se espea consegu con el poyecto de datamnng, de manea tal de hace posble la valdacón de sus esultados conta dchos objetvos. Ello está pensado paa gaantza que los esultados de la mneía de datos no sólo sean técncamente váldos, sno que además tengan sgnfcado desde un punto de vsta de negocos. Así tambén de la fase de compensón del negoco puede concluse que no es posble ealza estudos de datamnng sn conta con el espaldo decddo de alguna geenca, como únca foma de neutalza los esgos oganzaconales y de tmng del poyecto. En decta elacón con lo antes menconado se encuenta una conclusón aun más fundamental, y que establece que el éxto de un poyecto de datamnng depende no sólo de que se satsfagan cetos objetvos de negocos del Banco, sno que en mucho mayo medda de que se logen benefcos tangbles paa el patocnado del poyecto y sus nteeses. 2. De la fase de compensón de los datos puede concluse que a po las caacteístcas más elevantes paa pedec el nvel de esgo cedtco de los clentes y su entabldad potencal ncluyen aspectos demogáfcos, enta, nvel de vínculo ente el clente y el Banco, los ngesos contables geneados po el clente, su compotamento cedtco pasado, y su nvel de deudas. Todas esas 209

210 caacteístcas apaecen como las más mpotantes en opnón de las pesonas que han tabajado como ejecutvos de cédto, y es nfomacón que está dsponble en las bases opeaconales de cualque Banco (aceptando los supuestos dados en las hpótess de tabajo). 3. De la fase de pepaacón de los datos se concluye que puede se nmenso el esfuezo destnado a ntega los datos necesaos paa el estudo y a elmna sus nconsstencas, po cuanto al no exst un datawaehouse es pecso mezcla datos povenentes de bases de datos opeaconales esdentes en sstemas dstntos y con nfomacón de fechas dstntas. La lteatua establece que más del 90% del tempo empleado en un poyecto de datamnng debe utlzase en las fases pevas al modelamento, pncpalmente en las fases de compensón y pepaacón de los datos. Como consecuenca de ello es posble que los esgos oganzaconales y de tmng del poyecto, detectados en la fase de compensón del negoco, se matealcen en la foma de un bocot al poyecto de mneía de datos. 4. De la fase de modelamento puede concluse que es posble elaboa modelos pedctvos del esgo de cédto y de la entabldad potencal de los clentes, usando paa ello técncas de datamnng como la egesón logístca, las edes neuonales o los áboles de decsón. Se ha mostado que dchos modelos pueden calcula puntajes de esgo y de entabldad paa los clentes. Po lo tanto, se han satsfecho los dos objetvos secundaos s1 y s2 desctos en el capítulo 3, que vesa sobe los objetvos de la nvestgacón. 5. En la fase de evaluacón de negocos se ha mostado que es posble clasfca a los clentes en dstntos segmentos en base a sus puntajes de esgo y entabldad, y que puede dgse una ofeta dfeencada a cada uno de esos segmentos. Po lo tanto, se ha cumpldo el objetvo secundao s3 descto en el capítulo 3. En la msma fase se ha mostado que un Banco puede utlza los puntajes de esgo y entabldad paa cece, satsfacendo al msmo tempo un nvel mínmo de esgo. Dcho cecmento puede vefcase medante una ofeta a segmentos sn ella, medante la oentacón de los esfuezos de las campañas haca los clentes con mayo entabldad potencal, y a tavés del aumento de los montos ofecdos a los clentes. Po lo tanto, se ha cumpldo tambén el objetvo secundao s4 descto en el capítulo 3. Se concluye entonces de la fase de evaluacón de negocos que 210

211 medante datamnng un Banco puede focalzase en segmentos de clentes clasfcados po esgo y entabldad, y que puede cece satsfacendo un nvel mínmo de esgo. 6. De la fase de desplegue puede concluse que el éxto de los modelos de datamnng de las campañas bancaas y el logo de sus objetvos de negocos sólo podán vsualzase en el lago plazo, po lo que es vtal conta no sólo con el fme compomso de la nsttucón fnancea paa mplementa y montoea un modelo de datamnng, sno que tambén es pecso que dcho compomso sea de lago alento. Ello se debe a que la expeenca señala que los clentes pueden tada años en pesenta poblemas de pago, po lo que sólo es posble en el lago plazo vefca que el objetvo de cecmento sujeto a un nvel mínmo de esgo satsfaga efectvamente dcho nvel de esgo. Ente las ecomendacones que pueden entegase a pat de los esultados de esta nvestgacón destacan el busca un apoyo fme y decddo de la geenca de un Banco antes de comenza un poyecto de datamnng. En patcula ello debe taducse en dos esultados concetos. En pme luga un pesupuesto elevante paa la nvestgacón, lo sufcentemente cuantoso paa bnda estatus al poyecto y paa compomete al Banco en su éxto. En segundo luga es pecso ecb el nombamento de un cago dento de la estuctua oganzaconal del Banco paa gaantza el éxto del poyecto de datamnng. Ello obedece al hecho de que los Bancos son nsttucones altamente jeaquzadas, en las que paa ealza cualque tpo de poyecto es pecso dspone de un nvel jeáquco adecuado. Aun en el caso de tatase de un poyecto ealzado po consultoes extenos, éstos deben ecb el espaldo de la oganzacón en la foma de un nombamento de jefes o geentes de poyecto. Se ecomenda en todo caso ealza los estudos de datamnng a tavés de consultoías extenas, de manea tal de tata de evta los ataques que pudesen poven desde dento de la nsttucón. 211

212 14 BIBLIOGRAFÍA 1. ADAMSON, J. DOUGLAS, Evaluatng & Compang Pedctve Models, Fa Isaac Insght Sees, B ERRY, M. J. A., LINOFF, G., Data Mnng Technques fo Maketng, Sales, and Custome Suppot, John Wley & Sons, Inc., BERSON, A., SMITH S. J., Data Waehousng, Data Mnng, and OLAP, McGaw- Hll, CHAPMAN, Pete, CLINTON, Julan, KERBER, Randy, KHABAZA, Thomas, REINARTZ, Thomas, SHEARER, Coln, WIRTH, Rüdge, CRISP DM 1.0 Step By Step Data Mnng Gude, SPSS Inc., CLEMENTINE 7.0 Use s Gude, SPSS, Data Mnng wth Confdence, SPSS Inc., Data Mnng Tools, METAspectum Maket Summay, META Goup, Septembe 2004, 8. Data Waehousng Technology Glossay, Appled Technology Goup, EL DIARIO FINANCIERO, La Nueva Ofensva de los Bancos po Fdelza y Capta Clentes, 20/01/ EL DIARIO FINANCIERO, Bancos Deben Constu Economías de Escala, 28/01/ EL DIARIO FINANCIERO, Banco de Chle Ldea Mecado de Cuentas Coentes con 24%, 29/03/ EL DIARIO FINANCIERO, Bancos Salen a la Caza de Nuevos Segmentos paa Rentablza su Negoco, 28/03/ EL DIARIO FINANCIERO, BBVA va tas Segmentos que no están Bancazados, 17/03/ EL DIARIO FINANCIERO, Banco del Desaollo Lanza Áea de Consumo, 28/04/ EL DIARIO FINANCIERO, Las Fusones de los Bancos Elevaon Efcenca del Sstema, 19/04/ EL DIARIO FINANCIERO, La Altenatva de Bancos a la Baja de los Speads, 02/05/

213 17. EL DIARIO FINANCIERO, Flales de Bancos Aemeten en Competenca po Clentes, 11/05/ EL DIARIO FINANCIERO, Los Bancos Extanjeos han Inyectado Mayo Competenca al Mecado, 05/06/ EL DIARIO FINANCIERO, Bancos y Multtendas Olvdan sus Dfeencas po Convenenca Mutua, 06/06/ EL DIARIO FINANCIERO, Bancos en Aleta po Posble Regulacón de Tajetas del Comeco, 16/06/ EL DIARIO FINANCIERO, Bank of Ameca, Repotaje, 12/05/ HALLBERG, Gath, OGILVY, Davd, Todos Los Consumdoes No Son Iguales, Capítulo 3: Po qué no Todos los Consumdoes Han Sdo Ceados Iguales, Deusto, HILLIER F., LIEBERMAN G., Investgacón de Opeacones, Séptma edcón, McGaw-Hll Inteamecana, Infome de Colocacones po Actvdad Económca, SBIF, febeo Infome de Establdad Fnancea, Banco Cental, pme semeste Infome Tasas Pncpales Poductos de Consumo, SBIF, Infome Mutuos Hpotecaos Endosables, SBIF, Intoducton to Data Mnng and Knowledge Dscovey, Two Coss Copoaton, Jumpstat Clementne Tanng Bochue, Data Mnng Jumpstat, Data Mnng Pojects Clementne, SPSS, KOTLER, Phlp, Deccón de Maketng, Décma Edcón, Capítulo 9: Identfcacón de Segmentos de Mecado y Seleccón de Mecados Meta, Peason Educacón, KRAFT, Holge, KROISANDT, Geald, MÜLLER, Malene, Redesgnng Ratngs: Assessng the Dscmnatoy Powe of Cedt Scoes unde Censong, Faunhofe Insttut fü Techno und Wtschaftsmathematk (ITWM), June, LAMBIN, Jean-Jacques, Maketng Estatégco, Capítulo 6: El Análss de las Necesdades a tavés de la Segmentacón, McGaw-Hll Inteamecana, PÉREZ, Cesa, Técncas Estadístcas con SPSS, Pentce Hall, REICHHELD, Fedeck, El Efecto de la Lealtad del Clente, Capítulo 2: Economía de la Lealtad del Clente, Edtoal Noma, REICCHELD, SASSER, Zeo Defectons Come to Qualty, HBR,

214 36. REVISTA INFORMACIÓN FINANCIERA, SBIF, julo 1999, julo 2000, julo 2001, julo 2002, julo 2003, julo 2004, julo RUSSELL, Stewat, NORVIG, Pete, Atfcal Intellgence, a Moden Appoach, Second Edton, Pentce Hall, RUST, Roland, ZEITHAML, Valee, LEMON, Kathene, Dvng Custome Equty : How Custome Lfetme Value s Reshapng Copoate Stategy, The Fee Pess, June SHANNON, C.E., WEAVER, W., The Mathematcal Theoy of Communcaton, Unvesty of Illnos Pess, TENENHAUS, Mchele, Méthodes Statstques en Geston, Edtoal Dunod, Fance, WILSON, L., Canadan Bank Mnes fo Gold, Computewold,

215 ANEXOS

216 Anexo A Colocacones totales de los Bancos del sstema fnanceo chleno, Julo del Colocacones totales (en mles de mllones Valoes en % de pesos) Bancos Patcpacón Cecmento Gandes Medanos Pequeños Banco de Chle ,7 14,6 Banco Santande ,0 10,5 Banco del Estado ,1 14,6 BCI ,0 20,5 Copbanca ,6 21,6 BBVA ,7 15,9 BICE ,6 9,8 Secuty ,2 28,6 Ctbank ,1 6,0 BankBoston ,4 21,5 Scotabank ,9 4,0 B. del Desaollo ,9 19,5 Otos ,0-5,1 Sstema fnanceo ,2 106 Fuente: volúmenes de Julo de los años 2004 y 2005 de la evsta Infomacón Fnancea de la SBIF

217 Anexo B Compaacón ente Bancos de la azón de efcenca (gastos de apoyo opeaconal / esultado opeaconal buto), peodo Valoes en % Bancos Pequeños Medanos Gandes Jul-05 Jul-04 Jul-03 Jul-02 Jul-01 Jul-00 Bco. de Chle 52,1 49,3 56,6 51,6 44,5 48,2 Santande 49,0 45,1 43,2 44,6 44,5 41,0 Bco. Estado 70,3 66,6 65,2 63,9 61,0 58,9 BCI 65,0 54,9 55,2 48,5 50,7 51,4 Copbanca 64,3 46,6 43,1 39,2 37,6 40,7 BBVA 67,6 59,6 61,0 55,1 57,9 56,7 BICE 56,0 50,1 58,0 57,7 64,2 60,8 Bco. Secuty 56,9 57,7 60,2 49,6 50,2 48,2 Ctbank 74,0 59,3 56,9 60,9 66,0 85,3 BankBoston 71,6 53,1 68,5 68,2 70,7 69,2 Scotabank 73,8 68,6 73,0 67,9 68,8 68,3 B. del Desaollo 61,2 55,9 54,6 52,4 47,7 51,3 Sstema fnanceo 60,2 52,2 54,6 52,5 50,7 51,7 107 Fuente: volúmenes de Julo de los años 2000 al 2005 de la evsta Infomacón Fnancea de la SBIF

218 Anexo C Evolucón del magen de nteeses del sstema fnanceo, peodo Jul-05 Jul-04 Jul-03 Jul-02 Jul-01 Jul-00 Cfas en mles de mllones de pesos Valoes en % Magen de nteeses Comsones netas Resultado opeaconal buto Resultado opeaconal neto Magen de nteeses / Resultado ope. buto Magen de nteeses / Resultado ope. neto Gastos apoyo ope. / Resultado ope. buto ,8 81,1 81,7 70,2 78,4 73,8 651,2 278,3 325,5 236,9 245,8 217,3 60,2 52,2 54,6 52,5 50,7 51,7 108 Fuente: volúmenes de Julo de los años 2000 al 2005 de la evsta Infomacón Fnancea de la SBIF

219 Anexo D Compaacón ente Bancos de la azón de magen de nteeses sobe colocacones, peodo Sstema fnanceo ,2 3,5 3,4 2,9 3,1 2,7 B. del Desaollo ,1 2,6 2,5 2,4 2,6 2,4 Scotabank ,7 2,4 2,1 1,8 2,1 2,0 Pequeños BankBoston Ctbank ,7 5,4 6,4 6,4 3,8 5,6 2,9 5,1 4,0 8,0 3,2 6,1 Banco Secuty ,7 2,0 2,4 2,1 2,0 1,9 BICE ,2 2,6 2,3 1,9 2,0 1,8 BBVA ,8 3,1 3,3 2,2 2,2 1,7 Copbanca ,1 4,1 3,3 2,8 2,8 2,2 BCI ,2 3,3 2,8 2,8 2,6 2,3 Banco del Estado ,4 3,2 3,6 2,6 2,9 2,5 Banco Santande ,2 4,1 4,0 3,0 3,2 3,0 Banco de Chle Magen de nteeses (en mles de mllones de pesos) Colocacones (en mles de mllones de pesos) Magen de nteeses / Colocacones (valoes en %) Jul-00 Jul-01 Jul-02 Jul-03 Jul ,1 3,2 3,3 2,7 3,0 2,6 Jul-05 Jul-00 Jul-01 Jul-02 Jul-03 Jul-04 Jul-05 Jul-00 Jul-01 Jul-02 Jul-03 Jul-04 Jul-05 Medanos Gandes 109 Fuente: volúmenes de Julo de los años 2000 al 2005 de la evsta Infomacón Fnancea de la SBIF

220 Anexo E Compaacón de la azón utldad del ejecco sobe captal y esevas de los dstntos Bancos, peodo Bancos Pequeños Medanos Gandes Valoes en % Jul-05 Jul-04 Jul-03 Jul-02 Jul-01 Jul-00 Banco de Chle 27,8 28,6 10,5 24,2 32,0 35,2 Banco Santande 24,0 26,7 31,5 22,1 22,6 28,0 Banco del Estado 8,7 9,8 7,4 8,6 9,7 10,8 BCI 11,6 21,6 18,5 27,3 27,6 27,2 Copbanca 8,0 21,0 21,2 16,7 16,4 14,3 BBVA 9,5 7,5 9,1 12,8 13,0 14,0 BICE 9,0 25,1 15,9 18,1 13,9 17,2 Banco Secuty 12,1 10,9 9,5 15,9 17,0 16,2 Ctbank 1,8 12,9 18,0 16,0 10,8 5,0 BankBoston 5,7 18,0 6,9 10,8 9,7 7,9 Scotabank 3,9 6,3 9,7 11,5 10,4 8,6 B. del Desaollo 10,0 10,6 7,7 7,5 12,8 12,2 Sstema fnanceo 11,1 19,3 17,1 17,3 18,6 18,8 110 Fuente: volúmenes de Julo de los años 2000 al 2005 de la evsta Infomacón Fnancea de la SBIF

221 Anexo F Compaacón del cecmento anual de las colocacones de los Bancos, peodo Valoes en % Bancos Pequeños Medanos Gandes Jul-05 Jul-04 Jul-03 Jul-02 Jul-01 Jul-00 Bco. de Chle 9,9 10,1 58,5 3,5 6,2 14,6 Santande 3,3 9,9 3,5 118,1 11,0 10,5 Bco. Estado 4,9 12,0 5,8 9,9 10,5 14,6 BCI 6,6 13,7 20,7 14,2 16,8 20,5 Copbanca 4,2 19,7 17,0 26,2 15,5 21,6 BBVA 11,4 23,5 11,9 19,4 20,1 15,9 BICE 23,6 8,7 0,1 4,3 16,5 9,8 Bco. Secuty 25,2 18,5-1,3 20,1 9,1 28,6 Ctbank -3,7 8,2-3,9-6,0-19,1 6,0 BankBoston 22,8 25,8 36,1 13,9 6,8 21,5 Scotabank -9,6 5,1 12,0 3,9-3,4 4,0 B. del Desaollo 5,9 1,3 10,6 12,1 5,2 19,5 Sstema fnanceo 6,5 12,0 5,4 5,6 9,8 14,2 111 Fuente: volúmenes de Julo de los años 1999 al 2005 de la evsta Infomacón Fnancea de la SBIF

222 Anexo G Evolucón de las colocacones totales del sstema fnanceo desglosadas po tpo, peodo Nov-04 Nov-03 Nov-02 Nov-01 Nov-00 Cfas en mles de mllones de pesos Cédtos de consumo (a) Cédtos hpotecaos paa la vvenda (b) Colocacones de empesas (estmado como (c ) - (a) - (b) ) Total (c) Cédtos de consumo 10,4 9,4 10,7 11,2 14,9 Valoes en % Cédtos hpotecaos paa la vvenda 19,6 18,6 19,7 20,5 20,4 Colocacones de empesas 70,1 72,0 69,6 68,3 64,7 Total Fuente: volumen de Febeo del 2005 de la evsta Infomacón Fnancea de la SBIF

223 Anexo H Tasas de cédtos de consumo, hpotecaos y comecales, peodo Líneas de cédto Tajetas de cédto Cédtos de consumo hata 200 UF Cédtos comecales (*) Mutuos 1 a 8 años Mutuos hpotecaos Mutuos 8 a 12 años Mutuos 12 a 20 años Mutuos más de 20 años Jul-02 27,0 34,1 26,9 16,7 6,5 7,4 7,0 6,7 Ago-02 26,2 33,4 26,0 15,6 6,5 7,0 6,9 6,8 Sep-02 26,0 33,4 25,0 14,9 6,3 6,9 6,9 6,8 Oct-02 26,0 33,0 25,1 16,0 6,0 7,0 7,0 7,0 Nov-02 26,3 32,8 25,6 15,3 6,2 6,9 7,0 7,4 Dc-02 27,0 32,8 23,7 14,2 6,2 6,8 7,0 6,8 Ene-03 26,8 33,9 25,6 17,2 6,2 6,8 7,0 7,0 Feb-03 26,8 33,4 25,6 17,1 6,1 6,6 6,8 7,0 Ma-03 25,3 33,2 23,2 13,0 5,9 6,6 6,7 7,2 Ab-03 25,4 32,3 24,2 14,2 5,7 6,5 6,8 7,1 May-03 25,9 31,6 23,8 13,5 5,7 6,7 6,8 7,0 Jun-03 26,2 30,9 24,0 14,3 5,7 6,2 6,7 7,0 Jul-03 28,7 31,9 23,1 13,8 6,1 6,3 6,7 7,1 Ago-03 28,0 32,6 22,4 13,6 5,7 5,9 6,6 7,2 Sep-03 28,0 33,0 21,7 13,2 5,4 6,0 6,7 7,1 Oct-03 27,9 33,0 21,5 13,3 5,6 6,0 6,5 6,8 Nov-03 27,9 33,0 22,3 13,6 5,5 5,6 6,3 6,4 Dc-03 28,6 33,3 21,9 12,7 7,0 5,2 6,4 6,5 Ene-04 26,2 33,6 22,9 14,0 5,4 5,6 6,1 6,5 Feb-04 27,7 33,6 23,5 12,0 5,2 5,4 5,4 6,3 Ma-04 27,6 34,0 20,8 11,0 5,1 5,4 5,5 6,3 Ab-04 28,1 33,9 21,3 11,4 4,9 5,3 5,9 6,2 May-04 28,3 33,4 22,2 11,6 4,2 5,0 5,5 6,1 Jun-04 28,3 33,3 22,3 12,0 4,0 4,5 4,9 5,4 Jul-04 28,7 33,3 21,3 11,9 4,1 4,5 4,6 5,2 Ago-04 28,7 33,5 21,1 11,5 4,3 4,5 4,7 5,0 Sep-04 28,4 33,6 20,0 11,3 4,1 4,6 4,7 4,6 Oct-04 28,2 33,9 20,3 11,6 4,1 4,8 4,9 5,1 Nov-04 28,6 33,5 21,2 12,1 4,4 4,5 4,9 4,9 Dc-04 28,5 31,8 21,0 12,1 4,2 4,5 4,9 4,9 Ene-05 29,3 32,5 20,5 13,0 4,6 4,8 5,1 4,7 Feb-05 30,2 32,4 21,8 13,3 4,4 5,1 5,2 5,3 Ma-05 30,2 32,9 21,1 12,4 4,5 4,8 5,2 5,3 Ab-05 31,1 33,6 21,7 13,1 4,3 4,9 5,2 5,1 May-05 31,7 34,2 22,2 13,9 4,4 4,7 5,4 6,0 Jun-05 31,9 35,0 22,3 14,0 4,6 5,0 5,4 5,3 Jul-05 31,8 35,2 21,9 14,0 4,4 4,8 5,3 5,2 Ago-05 31,7 35,5 21,8 13,9 4,0 4,7 5,3 5,0 (*) Tasas de los cédtos de consumo ente 2000 y 5000 UF 113 Fuente: volúmenes del 2005 del Infome de las Tasas de los Pncpales Poductos de Consumo de la SBIF y del Infome de Mutuos Hpotecaos Endosables de la SBIF

224 Anexo I Julo Composcón del magen opeaconal buto de los dstntos Bancos, Cfas en mles de mllones de pesos Valoes en % Otos ngesos opeaconales / Resultado opeaconal buto Comsones netas / Resultado opeaconal buto Magen de nteeses / Resultado opeaconal buto Resultado opeaconal buto Total otos ngesos ope. (a) + (b) + (c ) + (d) + (e) + (f) Otos ngesos (f) Coeccón monetaa neta (e) Otos ngesos de opeacón netos (d) Recupeacón de colocacones castgadas (c) Dfeencas de cambo netas (b) Dfeencas de peco netas (a) Comsones netas Magen de nteeses Bancos Bco. de Chle ,5 21,4 5,1 Santande ,7 17,6 5,7 Bco. Estado ,1 19,6 12,3 Gandes BCI ,5 20,8 4,7 Copbanca ,7 12,5 7,7 BBVA ,0 21,0 15,0 Medanos BICE ,7 17,6 4,8 Bco. Secuty ,3 12,4 9,3 Ctbank ,1 15,9 3,1 BankBoston ,2 16,7-4,9 Scotabank ,9 22,6 1,5 Pequeños B. del Desaollo ,2 20,7 6, ,8 18,5 7,7 Sstema fnanceo 114 Fuente: volumen de Julo del 2005 de la evsta Infomacón Fnancea de la SBIF

225 Anexo J Pocentaje de los dstntos tpos de cédtos sobe el total de colocacones de cada Banco, Febeo Cfas en mles de mllones de pesos Valoes en % Bancos Gandes Medanos Pequeños Cédtos de consumo (a) Cédtos hpotecaos paa la vvenda (b) Colocacones de empesas (estmado como (c ) - (a) - (b) ) Total (c) Cédtos de consumo Cédtos hpotecaos paa la vvenda Banco de Chle ,9 12,0 65,1 100 Banco Santande ,1 23,0 62,9 100 Banco del Estado ,9 44,2 44,9 100 BCI ,6 17,2 70,2 100 Copbanca ,7 7,8 79,4 100 BBVA ,1 28,7 62,2 100 BICE ,4 4,0 92,5 100 Banco Secuty ,8 3,3 94,9 100 Ctbank ,9 7,6 59,5 100 BankBoston ,8 24,8 55,4 100 Scotabank ,7 9,5 59,8 100 Banco del Desaollo ,5 17,4 80,1 100 Banco Rpley ,1 13,7 7,2 100 Banco Falabella ,2 19,4 0,5 100 Banco Pas ,1 0,0 6,9 100 Sstema fnanceo ,2 20,3 64,5 100 Colocacones de empesas Total 115 Fuente: volumen de febeo del 2005 del Infome de Colocacones po Actvdad Económca de la SBIF, y volumen del 2005 del Infome de Mutuos Hpotecaos Endosables de la SBIF

6 Sistemas Autoorganizativos

6 Sistemas Autoorganizativos 6 Sstemas Autooganzatvos 6.1 Intoduccón Las edes de neuonas atfcales con apendzae no supevsado se han aplcado con éxto a poblemas de econocmento de patones y deteccón de señales. Estas edes constuyen clases

Más detalles

Macroeconomía Abierta

Macroeconomía Abierta Macoeconomía Abeta of. chad oca Gaay [email protected] http://chadoca.blogspot.com Unvesdad Naconal Mayo de an Macos ontfca Unvesdad Católca del eú Lma eú 009 chad oca. INDICE Capítulo. Cuentas Naconales

Más detalles

clasificación digital

clasificación digital clasfcacón dgtal leccón 3 sumao Intoduccón. Conceptos estadístcos. Fase de entenamento. Fase de clasfcacón. Contol de caldad. La es un poceso de genealzacón temátca que, medante categozacón, convete la

Más detalles

i:n i 0""E' D G-EOLOGIA 2i'_'T1?11C;TURAL E L.A POJ-11 BE.-OLA DE LEMA, - í y

i:n i 0E' D G-EOLOGIA 2i'_'T1?11C;TURAL E L.A POJ-11 BE.-OLA DE LEMA, - í y ' 20078 :N 0""E' D G-EOLOGA 2'_'T1?11C;TURAL E L.A POJ-11 BE.-OLA DE LEMA, - í y { t f 4 v s Se ha ealzado un estudo estuctual de la Hoja, aunque po dvesos motvos que vamos a analza no ha sdo posble obtene

Más detalles

Mauricio Riera, S' IEEE Departamento de Potencia Instituto de Ingeniería Eléctrica Facultad de Ingeniería, UDEELAR Montevideo, Uruguay

Mauricio Riera, S' IEEE Departamento de Potencia Instituto de Ingeniería Eléctrica Facultad de Ingeniería, UDEELAR Montevideo, Uruguay Poceedngs of 5º Encuento de Potenca, Instumentacón y Meddas, IEEE, Octobe 19-20, 1999, Montevdeo, Uuguay Contol De Flujo Vectoal Medante un Inveso de Coente Alejando Gómez Estudante de Ingeneía Insttuto

Más detalles

CAPÍTULO III TRABAJO Y ENERGÍA

CAPÍTULO III TRABAJO Y ENERGÍA TRAJO Y ENERGÍA CAPÍTULO III "De todos los conceptos físcos, el de enegía es pobablemente el de más vasto alcance. Todos, con fomacón técnca o no, tenen una pecepcón de la enegía y lo que esta palaba sgnfca.

Más detalles

AUTOCALIBRACIÓN Y SINCRONIZACIÓN DE MÚLTIPLES CÁMARAS PTZ

AUTOCALIBRACIÓN Y SINCRONIZACIÓN DE MÚLTIPLES CÁMARAS PTZ UNIVERSIDAD AUTÓNOMA DE MADRID ESCUELA POLITÉCNICA SUPERIOR AUTOCALIBRACIÓN Y SINCRONIZACIÓN DE MÚLTIPLES CÁMARAS PTZ -PROYECTO FIN DE CARRERA- Jave Gacía Ocón Mayo de 27 AUTOCALIBRACIÓN Y SINCRONIZACIÓN

Más detalles

A r. 1.5 Tipos de magnitudes

A r. 1.5 Tipos de magnitudes 1.5 Tipos de magnitudes Ente las distintas popiedades medibles puede establecese una clasificación básica. Un gupo impotante de ellas quedan pefectamente deteminadas cuando se expesa su cantidad mediante

Más detalles

OPTIMIZACIÓN DE LOS GRÁFICOS DE CONTROL ESTADÍSTICO DE PROCESOS EWMA Y MEWMA MEDIANTE ALGORITMOS GENÉTICOS

OPTIMIZACIÓN DE LOS GRÁFICOS DE CONTROL ESTADÍSTICO DE PROCESOS EWMA Y MEWMA MEDIANTE ALGORITMOS GENÉTICOS 27 Congeso Naconal de Estadístca e Investgacón Opeatva Lleda, 8- de abl de 2003 OPTIMIZACIÓN DE LOS GRÁFICOS DE CONTROL ESTADÍSTICO DE PROCESOS EWMA Y MEWMA MEDIANTE ALGORITMOS GENÉTICOS J.C. Gacía-Díaz,

Más detalles

Capitalización y descuento simple

Capitalización y descuento simple Undad 2 Captalzacón y descuento smple 2.1. Captalzacón smple o nterés smple 2.1.1. Magntudes dervadas 2.2. Intereses antcpados 2.3. Cálculo de los ntereses smples. Métodos abrevados 2.3.1. Método de los

Más detalles

ACUERDO DE ACREDITACIÓN IST 184. Programa de Magister en Ciencias mención Oceanografía Universidad de Concepción

ACUERDO DE ACREDITACIÓN IST 184. Programa de Magister en Ciencias mención Oceanografía Universidad de Concepción A t f l E D T A C l f l N UMITAS ACUERDO DE ACREDITACIÓN IST 184 Programa de Magster en Cencas mencón Oceanografía Unversdad de Concepcón Con fecha 10 de octubre de 2012, se realza una sesón del Consejo

Más detalles

Comparación entre distintos Criterios de decisión (VAN, TIR y PRI) Por: Pablo Lledó

Comparación entre distintos Criterios de decisión (VAN, TIR y PRI) Por: Pablo Lledó Comparacón entre dstntos Crteros de decsón (, TIR y PRI) Por: Pablo Lledó Master of Scence en Evaluacón de Proyectos (Unversty of York) Project Management Professonal (PMP certfed by the PMI) Profesor

Más detalles

Índice INTRODUCCIÓN... 11 1.1 MARCO DE LA TESIS...11 1.1.1 ALCANCE DE LA TESIS...12 1.2 OBJETIVOS...13 1.3 ESTRUCTURA DE LA TESIS...

Índice INTRODUCCIÓN... 11 1.1 MARCO DE LA TESIS...11 1.1.1 ALCANCE DE LA TESIS...12 1.2 OBJETIVOS...13 1.3 ESTRUCTURA DE LA TESIS... Índce INTRODUCCIÓN.... MARCO DE LA TESIS..... ALCANCE DE LA TESIS.... OBJETIVOS...3.3 ESTRUCTURA DE LA TESIS...4 PROBLEMÁTICA DE LA INSPECCIÓN VISUAL AUTOMATIZADA... 7. LA INSPECCIÓN INDUSTRIAL...8.. TAXONOMÍA

Más detalles

TEMA 1: MODELOS DE REPRESENTACIÓN DE OBJETOS 3D

TEMA 1: MODELOS DE REPRESENTACIÓN DE OBJETOS 3D TEMA : MODELOS DE REPRESENTACIÓN DE OBJETOS 3D.. MODELOS DE SUPERFICIES Exsten vaas azones paa quee epesenta un objeto medante un modelo de supefce: Cuando el objeto msmo es una supefce que podemos supone

Más detalles

Potencial eléctrico. Trabajo y energía potencial en el campo eléctrico. Potencial de una carga puntual: Principio de superposición

Potencial eléctrico. Trabajo y energía potencial en el campo eléctrico. Potencial de una carga puntual: Principio de superposición Potencial eléctico Intoducción. Tabajo y enegía potencial en el campo eléctico Potencial eléctico. Gadiente. Potencial de una caga puntual: Pincipio de supeposición Potencial eléctico de distibuciones

Más detalles

SIMULACIÓN DE PRESIÓN NO ESTÁTICA EN YACIMIENTOS MEDIANTE SOLUCIONES FUNDAMENTALES

SIMULACIÓN DE PRESIÓN NO ESTÁTICA EN YACIMIENTOS MEDIANTE SOLUCIONES FUNDAMENTALES FARAUTE Cens. y Tec., 3(): 4-5, 8. ISSN 698-748 Depósto Legal PP4CA67 SIMULACIÓN DE PRESIÓN NO ESTÁTICA EN YACIMIENTOS MEDIANTE SOLUCIONES FUNDAMENTALES Smulaton Of Tansent Resevo Pessue Based On Fundamental

Más detalles

Kronotek: Configuración de Red para VoIP

Kronotek: Configuración de Red para VoIP Konotek: Configuación de Red paa VoIP Contenido 1. Intoducción... 2 2. Impotancia de la Configuación de Red... 2 3. Pasos Pevios: Cálculo del númeo de líneas de voz... 3 Pime paso: obtención del ancho

Más detalles

CREACIÓN DE MAPAS DENSOS BASADOS EN APARIENCIA

CREACIÓN DE MAPAS DENSOS BASADOS EN APARIENCIA CREACIÓ DE MAPAS DESOS BASADOS E APARIECIA Loenzo Fenández, Lus Paá, Davd Úbeda, Mónca Ballesta, Jose M. Maín Depatamento de Ingeneía de Sstemas Industales. Unvesdad Mguel Henández. Avda. de la Unvesdad

Más detalles

ANÁLISIS GRÁFICO DE UN MOVIMIENTO RECTILÍNEO

ANÁLISIS GRÁFICO DE UN MOVIMIENTO RECTILÍNEO Insttuto de Poesoes Atgas Físca Expemental 1 Guía páctca Nº ANÁLISIS GRÁFICO DE UN MOVIMIENTO RECTILÍNEO DISPOSITIVO EXPERIMENTAL El dspostvo expemental se muesta en la gua 1. Un egstado electónco o tme

Más detalles

DEFINICIÓN DE INDICADORES

DEFINICIÓN DE INDICADORES DEFINICIÓN DE INDICADORES ÍNDICE 1. Notacón básca... 3 2. Indcadores de ntegracón: comerco total de benes... 4 2.1. Grado de apertura... 4 2.2. Grado de conexón... 4 2.3. Grado de conexón total... 5 2.4.

Más detalles

TEMA 10. OPERACIONES PASIVAS Y OPERACIONES ACTIVAS.

TEMA 10. OPERACIONES PASIVAS Y OPERACIONES ACTIVAS. GESTIÓN FINANCIERA. TEMA 10. OPERACIONES PASIVAS Y OPERACIONES ACTIVAS. 1.- Funconamento de las cuentas bancaras. FUNCIONAMIENTO DE LAS CUENTAS BANCARIAS. Las cuentas bancaras se dvden en tres partes:

Más detalles

2.7 Cilindros, conos, esferas y pirámides

2.7 Cilindros, conos, esferas y pirámides UNIDAD Geometía.7 Cilindos, conos, esfeas y piámides 58.7 Cilindos, conos, esfeas y piámides OBJETIVOS Calcula el áea y el volumen de cilindos, conos, esfeas y piámides egulaes Resolve poblemas de solidos

Más detalles

Índice de Precios de las Materias Primas

Índice de Precios de las Materias Primas May-15 Resumen Ejecutvo El objetvo del (IPMP) es sntetzar la dnámca de los precos de las exportacones de Argentna, consderando la relatva establdad en el corto plazo de los precos de las ventas externas

Más detalles

Tema 3. DINÁMICA DE UN SÓLIDO RÍGIDO.

Tema 3. DINÁMICA DE UN SÓLIDO RÍGIDO. Tema 3. DINÁMICA DE UN SÓLIDO RÍGIDO. CONTENIDOS: 3.1 Intoduccón 3. Cnemátca de la otacón alededo de un eje fjo. 3.3 Momento de una fueza y de un sstema de fuezas. 3.4 Momento angula del sóldo ígdo. 3.5

Más detalles

Análisis de la Envoltura de Datos Usos y Aplicaciones. Palabras Clave: Análisis de la Envoltura de Datos, DEA, Análisis de Eficiencia

Análisis de la Envoltura de Datos Usos y Aplicaciones. Palabras Clave: Análisis de la Envoltura de Datos, DEA, Análisis de Eficiencia Títlo: Ato: Análss de la Envolta de Datos Usos y Aplcacones Davd Güemes Castoena, D.Sc. Fecha: Jlo del 2004 Palabas Clave: Análss de la Envolta de Datos, DEA, Análss de Efcenca Resmen Este atíclo se enfoca

Más detalles

2.2 TASA INTERNA DE RETORNO (TIR). Flujo de Caja Netos en el Tiempo

2.2 TASA INTERNA DE RETORNO (TIR). Flujo de Caja Netos en el Tiempo Evaluacón Económca de Proyectos de Inversón 1 ANTECEDENTES GENERALES. La evaluacón se podría defnr, smplemente, como el proceso en el cual se determna el mérto, valor o sgnfcanca de un proyecto. Este proceso

Más detalles

UNIDAD 3: CONFIGURACIONES COMPUESTAS

UNIDAD 3: CONFIGURACIONES COMPUESTAS 4/5/009 Undad 3 lectónca UNA 3: ONFGUAONS OMPUSTAS OJTO PATULA l alumn estudaá ls dfeentes tps de cnfguacnes y su análss 3. nexnes en cascada, cascde y alngtn 3. Pa etalmentad 3.3 cut MOS, de fuente de

Más detalles

LOCALIZACIÓN DE FALTAS EN SISTEMAS DE DISTRIBUCIÓN DE ENERGÍA ELÉCTRICA USANDO MÉTODOS BASADOS EN EL MODELO Y MÉTODOS BASADOS EN EL CONOCIMIENTO

LOCALIZACIÓN DE FALTAS EN SISTEMAS DE DISTRIBUCIÓN DE ENERGÍA ELÉCTRICA USANDO MÉTODOS BASADOS EN EL MODELO Y MÉTODOS BASADOS EN EL CONOCIMIENTO LOCALIZACIÓN DE FALTAS EN SISTEMAS DE DISTRIBUCIÓN DE ENERGÍA ELÉCTRICA USANDO MÉTODOS BASADOS EN EL MODELO Y MÉTODOS BASADOS EN EL CONOCIMIENTO Juan José MORA FLÓREZ ISBN: 978-84-69-453-8 Dpòst legal:

Más detalles

Para caracterizar completamente una magnitud vectorial, como son la velocidad, aceleración, fuerza, etc, es preciso indicar tres cosas:

Para caracterizar completamente una magnitud vectorial, como son la velocidad, aceleración, fuerza, etc, es preciso indicar tres cosas: VECTORES Y ESCLRES Las magntudes escalaes son aquellas que quedan totalmente defndas al epesa la cantdad la undad en que se mde. Eemplos son la masa, el tempo, el tabao todas las enegías, etc. Las magntudes

Más detalles

MATEMÁTICA DE LAS OPERACIONES FINANCIERAS II

MATEMÁTICA DE LAS OPERACIONES FINANCIERAS II Facultad de iencias Económicas onvocatoia de Junio Pimea Semana Mateial Auxilia: alculadoa financiea MATEMÁTIA DE LAS OPERAIONES FINANIERAS II 2 de Mayo de 202 hoas Duación: 2 hoas. Péstamos a) Teoía:

Más detalles

La Carga Eléctrica Puntual, es una partícula cuya masa se supone está concentrada en un punto, y en el mismo se concentra su carga eléctrica.

La Carga Eléctrica Puntual, es una partícula cuya masa se supone está concentrada en un punto, y en el mismo se concentra su carga eléctrica. LEY DE COULOMB La Ley de Coulomb es la pmea ue se estuda en Electcdad ella consttuye una LEY UNIVERSAL poue es posble deducla del expemento y s ese expemento se ealza bajo las msmas condcones físcas cualuea

Más detalles

PROPORCIONAR RESERVA ROTANTE PARA EFECTUAR LA REGULACIÓN PRIMARIA DE FRECUENCIA ( RPF)

PROPORCIONAR RESERVA ROTANTE PARA EFECTUAR LA REGULACIÓN PRIMARIA DE FRECUENCIA ( RPF) ANEXO I EVALUACIÓN DE LA ENERGIA REGULANTE COMENSABLE (RRmj) OR ROORCIONAR RESERVA ROTANTE ARA EFECTUAR LA REGULACIÓN RIMARIA DE FRECUENCIA ( RF) REMISAS DE LA METODOLOGÍA Las pruebas dnámcas para la Regulacón

Más detalles

Tema 3. Estadísticos univariados: tendencia central, variabilidad, asimetría y curtosis

Tema 3. Estadísticos univariados: tendencia central, variabilidad, asimetría y curtosis Tema. Estadístcos unvarados: tendenca central, varabldad, asmetría y curtoss 1. MEDIDA DE TEDECIA CETRAL La meda artmétca La medana La moda Comparacón entre las meddas de tendenca central. MEDIDA DE VARIACIÓ

Más detalles

Clase 25. Macroeconomía, Sexta Parte

Clase 25. Macroeconomía, Sexta Parte Introduccón a la Facultad de Cs. Físcas y Matemátcas - Unversdad de Chle Clase 25. Macroeconomía, Sexta Parte 12 de Juno, 2008 Garca Se recomenda complementar la clase con una lectura cudadosa de los capítulos

Más detalles

Definir los conceptos de autoinducción, inducción mutua. Analizar circuitos con bobinas y resistencias. Definir energía magnética.

Definir los conceptos de autoinducción, inducción mutua. Analizar circuitos con bobinas y resistencias. Definir energía magnética. Capítulo 8 nduccón electomagnétca 8.1 ntoduccón 8. Fenómenos de nduccón electomagnétca 8.3 Ley Faaday. Ley de Lenz 8.4 nduccón mutua. Autonduccón 8.5 Ccuto L 8.6 Enegía almacenada en una autonduccón. 8.7

Más detalles

CULTURA DE EJECUCIÓN: Gestión del capital humano

CULTURA DE EJECUCIÓN: Gestión del capital humano CULTURA DE EJECUCIÓN Es uno de los pilaes fundamentales paa la implementación de la estategia Es un tema de toda la oganización Contol egula Actuación de las pesonas CULTURA DE EJECUCIÓN: Gestión del capital

Más detalles

* Introducción * Principio de mínima energía * Transformaciones de Legendre * Funciones (o potenciales) termodinámicas. Principios de mínimo.

* Introducción * Principio de mínima energía * Transformaciones de Legendre * Funciones (o potenciales) termodinámicas. Principios de mínimo. 5. otencales emonámcos * Intouccón * ncpo e mínma enegía * ansomacones e Legene * Funcones (o potencales) temonámcas. ncpos e mínmo. * Enegía lbe (potencal) e Helmholtz lt * Entalpía. * Enegía lbe e Gbbs.

Más detalles

EXPERIMENTACIÓN COMERCIAL(I)

EXPERIMENTACIÓN COMERCIAL(I) EXPERIMENTACIÓN COMERCIAL(I) En un expermento comercal el nvestgador modfca algún factor (denomnado varable explcatva o ndependente) para observar el efecto de esta modfcacón sobre otro factor (denomnado

Más detalles

Material realizado por J. David Moreno y María Gutiérrez. Asignatura: Economía Financiera

Material realizado por J. David Moreno y María Gutiérrez. Asignatura: Economía Financiera Tema - MATEMÁTICAS FINANCIERAS Materal realzado por J. Davd Moreno y María Gutérrez Unversdad Carlos III de Madrd Asgnatura: Economía Fnancera Apuntes realzados por J. Davd Moreno y María Gutérrez Advertenca

Más detalles

Tema 2. DINÁMICA DE SISTEMAS DE PARTÍCULAS

Tema 2. DINÁMICA DE SISTEMAS DE PARTÍCULAS Tea. DIÁMICA DE SISTEMAS DE PARTÍCULAS. Intoduccón. Cento de asas.. Movento del cento de asas.. Masa educda..3 Consevacón del oento lneal..4 Consevacón del oento angula.3 Enegía de un sstea de patículas.3.

Más detalles

TEMA 4 Variables aleatorias discretas Esperanza y varianza

TEMA 4 Variables aleatorias discretas Esperanza y varianza Métodos Estadístcos para la Ingenería Curso007/08 Felpe Ramírez Ingenería Técnca Químca Industral TEMA 4 Varables aleatoras dscretas Esperanza y varanza La Probabldad es la verdadera guía de la vda. Ccerón

Más detalles

avance de un sacacorchos que gira como lo hacemos para llevar el primer vector sobre el segundo por el

avance de un sacacorchos que gira como lo hacemos para llevar el primer vector sobre el segundo por el /5 Conceptos pevios PRODUCTO VECTORIAL DE DO VECTORE. Es oto vecto cuyo módulo viene dado po: a b a b senα. u diección es pependicula al plano en el ue se encuentan los dos vectoes y su sentido viene dado

Más detalles

PROBLEMAS DE OPTIMIZACIÓN DE FUNCIONES

PROBLEMAS DE OPTIMIZACIÓN DE FUNCIONES PROBLEMAS DE OPTIMIZACIÓN DE FUNCIONES.- Halla dos númeos que sumados den cuo poducto sea máimo. Sean e los númeos buscados. El poblema a esolve es el siguiente: máimo Llamamos p al poducto de los dos

Más detalles

Parte 3: Electricidad y Magnetismo

Parte 3: Electricidad y Magnetismo Pate 3: Electicidad y Magnetismo 1 Pate 3: Electicidad y Magnetismo Los fenómenos ligados a la electicidad y al magnetismo, han sido obsevados y estudiados desde hace muchos siglos. No obstante ello, las

Más detalles

Matemática Financiera Sistemas de Amortización de Deudas

Matemática Financiera Sistemas de Amortización de Deudas Matemátca Fnancera Sstemas de Amortzacón de Deudas 7 Qué aprendemos Sstema Francés: Descomposcón de la cuota. Amortzacones acumuladas. Cálculo del saldo. Evolucón. Representacón gráfca. Expresones recursvas

Más detalles

CUESTIONES Y PROBLEMAS DE CAMPO ELÉCTRICO. Ejercicio nº1 Cómo se manifiesta la propiedad de la materia denominada carga eléctrica?

CUESTIONES Y PROBLEMAS DE CAMPO ELÉCTRICO. Ejercicio nº1 Cómo se manifiesta la propiedad de la materia denominada carga eléctrica? UESTIONES Y POBLEMAS DE AMPO ELÉTIO Ejecicio nº ómo se manifiesta la popiedad de la mateia denominada caga eléctica? La popiedad de la mateia denominada caga eléctica se manifiesta mediante fuezas de atacción

Más detalles

Leyes de Kepler. Ley de Gravitación Universal

Leyes de Kepler. Ley de Gravitación Universal Leyes de Keple y Ley de Gavitación Univesal J. Eduado Mendoza oes Instituto Nacional de Astofísica Óptica y Electónica, México Pimea Edición onantzintla, Puebla, México 009 ÍNDICE 1.- PRIMERA LEY DE KEPLER

Más detalles

A N Á L I S I S D E C O N S T I T U C I O N E S S O C I E T A R I A S E N L A C I U D A D D E B A D A J O Z A T R A V É S D E L B O L E T Í N

A N Á L I S I S D E C O N S T I T U C I O N E S S O C I E T A R I A S E N L A C I U D A D D E B A D A J O Z A T R A V É S D E L B O L E T Í N A N Á L I S I S D E C O N S T I T U C I O N E S S O C I E T A R I A S E N L A C I U D A D D E B A D A J O Z A T R A V É S D E L B O L E T Í N A N Á L I S I S D E 2 0 0 9, 2 0 1 0, 2 0 1 1 Y 2 0 1 2 En

Más detalles

Tema 2. Sistemas conservativos

Tema 2. Sistemas conservativos Tema. Sistemas consevativos Tecea pate: Fueza gavitatoia A Campo gavitatoio Una masa M cea en su vecindad un campo de fuezas, el campo gavitatoio E, dado po E u siendo u el vecto unitaio adial que sale

Más detalles

INSYS Advanced Dashboard for Enterprise

INSYS Advanced Dashboard for Enterprise Enterprse Enterprse INSYS Advanced Dashboard for Enterprse Enterprse, es un tablero de control para llevar a cabo la Gestón de la Segurdad de la Informacón, Gestón de Gobernabldad, Resgo, Cumplmento (GRC)

Más detalles

I ESCUELA DE EMPRESARIALES DIPLOMATURA DE EMPRESARIALES ESTADÍSTICA

I ESCUELA DE EMPRESARIALES DIPLOMATURA DE EMPRESARIALES ESTADÍSTICA Depatamento de Economía Aplcada I EUELA DE EMPREARIALE DIPLOMATURA DE EMPREARIALE ETADÍTIA Ejeccos Resueltos REGREIÓ O LIEAL Y REGREIÓ LIEAL MÚLTIPLE uso 006-00 Escuela de Empesaales Depatamento de Economía

Más detalles

De factores fijos. Mixto. Con interacción Sin interacción. No equilibrado. Jerarquizado

De factores fijos. Mixto. Con interacción Sin interacción. No equilibrado. Jerarquizado Análss de la varanza con dos factores. Introduccón Hasta ahora se ha vsto el modelo de análss de la varanza con un factor que es una varable cualtatva cuyas categorías srven para clasfcar las meddas de

Más detalles

Momento cuadrupolar eléctrico

Momento cuadrupolar eléctrico Depatamento de Físca Fac. Cencas Eactas - UNLP Momento cuadupola eléctco El núcleo y sus adacones Cuso 0 Págna S el pomedo tempoal de la dstbucón de caga dento del núcleo se desvía de la smetía esféca,

Más detalles

MODELO DE DESAPAREO EN TRANSISTOR MOS Y APLICACIONES. MODELLING MOS TRANSISTOR MISMATCH AND APPLICATIONS

MODELO DE DESAPAREO EN TRANSISTOR MOS Y APLICACIONES. MODELLING MOS TRANSISTOR MISMATCH AND APPLICATIONS MODELO DE DESAPAREO EN TRANSISTOR MOS Y APLICACIONES. MODELLING MOS TRANSISTOR MISMATCH AND APPLICATIONS Aledo Anaud, Joel Gak, Matías Míguez, Danel Pecante Depatamento de Ingeneía Eléctca, Unvesdad Católca

Más detalles

TEMA 5. EL SISTEMA DE PRODUCCIÓN DE LA EMPRESA (I) CONTENIDO

TEMA 5. EL SISTEMA DE PRODUCCIÓN DE LA EMPRESA (I) CONTENIDO Págna de 4 TEMA 5. EL SISTEMA DE PRODUCCIÓN DE LA EMPRESA (I) CONTENIDO INTRODUCCIÓN... 2 2 CLASIFICACIÓN DE LAS ACTIVIDADES PRODUCTIVAS... 4 3 FUNCIÓN DE PRODUCCIÓN... 3 4 CLASIFICACIÓN DE LOS PROCESOS

Más detalles

El participante puede llevar a cabo el proceso de auto-comparación y sobre esa base reforzar los aspectos menos consistentes.

El participante puede llevar a cabo el proceso de auto-comparación y sobre esa base reforzar los aspectos menos consistentes. Guía de Evaluación Como evaluación de la guía pedagógica se ha elegido una metodología de evaluación cualitativa del nivel de conocimientos del participante. Para ello se ha construido una guía de preguntas

Más detalles

1 http://www.sencilloyrapido.com/

1 http://www.sencilloyrapido.com/ 1 Contenido Introducción 3 Que son las encuestas pagadas por internet?. 5 Como ganar dinero con las encuestas pagadas por internet. 7 Pueden las encuestas pagadas generarte un ingreso decente?.. 9 Conclusión.

Más detalles

www.fisicaeingenieria.es Vectores y campos

www.fisicaeingenieria.es Vectores y campos www.fisicaeingenieia.es Vectoes y campos www.fisicaeingenieia.es www.fisicaeingenieia.es ) Dados los vectoes a = 4$ i + 3$ j + k$ y c = $ i + $ j 7k$, enconta las componente de oto vecto unitaio, paa que

Más detalles

PRÁCTICA 2. LEY DE LA REFRACCIÓN. Medida del índice de refracción de una lámina de vidrio

PRÁCTICA 2. LEY DE LA REFRACCIÓN. Medida del índice de refracción de una lámina de vidrio Coodnacón EVAU. Páctcas cuso 2017-18 P2 Objetvo: Detemna el índce de efaccón de un vdo. Fundamento: PRÁCTICA 2. LEY DE LA REFRACCIÓN. Medda del índce de efaccón de una lámna de vdo La ley de la efaccón,

Más detalles

CÁLCULO DE INCERTIDUMBRE EN MEDIDAS FÍSICAS: MEDIDA DE UNA MASA

CÁLCULO DE INCERTIDUMBRE EN MEDIDAS FÍSICAS: MEDIDA DE UNA MASA CÁLCULO DE INCERTIDUMBRE EN MEDIDAS FÍSICAS: MEDIDA DE UNA MASA Alca Maroto, Rcard Boqué, Jord Ru, F. Xaver Rus Departamento de Químca Analítca y Químca Orgánca Unverstat Rovra Vrgl. Pl. Imperal Tàrraco,

Más detalles

ESTRATEGIAS DIDÁCTICAS PARA ABORDAR LA EDUCACIÓN

ESTRATEGIAS DIDÁCTICAS PARA ABORDAR LA EDUCACIÓN ESTRATEGIAS DIDÁCTICAS PARA ABORDAR LA EDUCACIÓN AMBIENTAL EN EL NIVEL MEDIO SUPERIOR ARACELI ACEVEDO-CRUZ / MA. EUGENIA HERES-PULIDO Facultad de Estudos Superores Iztacala, Unversdad Naconal Autónoma

Más detalles

Características de una fuente de poder regulada

Características de una fuente de poder regulada UNERSDAD DEL ALLE ESCUELA DE NGENERA ELECTRCA Y ELECTRONCA 1 Caacteístcas de una fuente de pode egulada Aslamento galanco ente la almentacón y la caga Entada Salda UNERSDAD DEL ALLE ESCUELA DE NGENERA

Más detalles

CAMPO GRAVITATORIO FCA 10 ANDALUCÍA

CAMPO GRAVITATORIO FCA 10 ANDALUCÍA CMPO GRVIORIO FC 0 NDLUCÍ. a) Explique qué se entiende po velocidad de escape y deduzca azonadamente su expesión. b) Razone qué enegía había que comunica a un objeto de masa m, situado a una altua h sobe

Más detalles

Comprensión conceptual y el uso de tecnología. César Cristóbal Escalante Verónica Vargas Alejo Universidad de Quintana Roo Julio 2013

Comprensión conceptual y el uso de tecnología. César Cristóbal Escalante Verónica Vargas Alejo Universidad de Quintana Roo Julio 2013 Compensión conceptual y el uso de tecnología Césa Cistóbal Escalante Veónica Vagas Alejo Univesidad de Quintana Roo Julio 203 Qué significa tene conocimiento de un concepto? Conoce su definición? Conoce

Más detalles

Ejercicios resueltos

Ejercicios resueltos Ejecicios esueltos Boletín 2 Campo gavitatoio y movimiento de satélites Ejecicio 1 En el punto A(2,0) se sitúa una masa de 2 kg y en el punto B(5,0) se coloca ota masa de 4 kg. Calcula la fueza esultante

Más detalles

2.4 La circunferencia y el círculo

2.4 La circunferencia y el círculo UNI Geometía. La cicunfeencia y el cículo. La cicunfeencia y el cículo JTIVS alcula el áea del cículo y el peímeto de la cicunfeencia. alcula el áea y el peímeto de sectoes y segmentos ciculaes. alcula

Más detalles

Destilación Multicomponente

Destilación Multicomponente Destlacón Multcomponente Componentes Clave: pueden se o no aquellos cuyas sepaacones se han especfcados Componente Clave Lgeo: Es el componente mas pesado ente los componentes lvanos Componente Clave Pesado:

Más detalles

CAPITULO 4: LA UPS SOLAR Y SISTEMAS PARECIDOS EN EL MERCADO

CAPITULO 4: LA UPS SOLAR Y SISTEMAS PARECIDOS EN EL MERCADO CAPÍTULO 4 46 CAPITULO 4: LA UPS SOLAR Y SISTEMAS PARECIDOS EN EL MERCADO 4.1 Introducción Este es el capítulo donde se presenta el proyecto, es decir, la UPS Solar que se ha diseñado junto con su explicación.

Más detalles

CAPÍTULO 3 METODOLOGÍA. En el siguiente capítulo se presenta al inicio, definiciones de algunos conceptos actuariales

CAPÍTULO 3 METODOLOGÍA. En el siguiente capítulo se presenta al inicio, definiciones de algunos conceptos actuariales CAPÍTULO 3 METODOLOGÍA En el sguente capítulo se presenta al nco, defncones de algunos conceptos actuarales que se utlzan para la elaboracón de las bases técncas del Producto de Salud al gual que la metodología

Más detalles

CONTROVERSIAS A LAS BASES TÉCNICO ECONOMICAS PRELIMINARES PROCESO TARIFARIO CONCESIONARIA COMPAÑÍA DE TELÉFONOS DE COYHAIQUE S.A.

CONTROVERSIAS A LAS BASES TÉCNICO ECONOMICAS PRELIMINARES PROCESO TARIFARIO CONCESIONARIA COMPAÑÍA DE TELÉFONOS DE COYHAIQUE S.A. CONTROVERSIAS A LAS BASES TÉCNICO ECONOMICAS PRELIMINARES PROCESO TARIFARIO CONCESIONARIA COMPAÑÍA DE TELÉFONOS DE COYHAIQUE S.A. PERÍODO 201-2020 Introduccón Las Bases Técnco Económcas Prelmnares, en

Más detalles

Maestría en Economía Facultad de Ciencias Económicas Universidad Nacional de La Plata TESIS DE MAESTRIA. ALUMNO Laura Carella. DIRECTOR Alberto Porto

Maestría en Economía Facultad de Ciencias Económicas Universidad Nacional de La Plata TESIS DE MAESTRIA. ALUMNO Laura Carella. DIRECTOR Alberto Porto Maestría en Economía Facultad de Cencas Económcas Unversdad Naconal de La Plata TESIS DE MAESTRIA ALUMNO Laura Carella TITULO Educacón unverstara: medcón del rendmento académco a través de fronteras de

Más detalles

PROBLEMAS CAPÍTULO 5 V I = R = X 1 X

PROBLEMAS CAPÍTULO 5 V I = R = X 1 X PROBLEMAS APÍULO 5.- En el cicuito de la figua, la esistencia consume 300 W, los dos condensadoes 300 VAR cada uno y la bobina.000 VAR. Se pide, calcula: a) El valo de R,, y L. b) La potencia disipada

Más detalles

CAPITULO 5. TRABAJO Y ENERGIA.

CAPITULO 5. TRABAJO Y ENERGIA. CAPITULO 5. TRABAJO Y ENERGIA. El poblema undamental de la Mecánca es descb como se moveán los cuepos s se conocen las uezas aplcadas sobe él. La oma de hacelo es aplcando la segunda Ley de Newton, peo

Más detalles

CAPITULO V. SIMULACION DEL SISTEMA 5.1 DISEÑO DEL MODELO

CAPITULO V. SIMULACION DEL SISTEMA 5.1 DISEÑO DEL MODELO CAPITULO V. SIMULACION DEL SISTEMA 5.1 DISEÑO DEL MODELO En base a las variables mencionadas anteriormente se describirán las relaciones que existen entre cada una de ellas, y como se afectan. Dichas variables

Más detalles

Reflexión y Refracción

Reflexión y Refracción eflexón y efaccón Unvesdad de Pueto co ecnto Unvestao de Mayagüez Depatamento de Físca Actvdad de Laboatoo 8 La Ley de eflexón y La Ley de Snell Objetvos: 1. Detemna, paa una supefce eflectoa, la elacón

Más detalles

REPARACIÓN Y TECNOLOGÍA MECÁNICA REPAIRING AND MECHANICAL TECHNOLOGICAL

REPARACIÓN Y TECNOLOGÍA MECÁNICA REPAIRING AND MECHANICAL TECHNOLOGICAL Revsta Cencas Técncas Agopecuaas, E-ISSN: 07-0054, RNPS-77, Vol. 4, No. 3 (julo-agosto-septembe, pp. 45-5), 05 REPARACIÓN Y TECNOLOGÍA MECÁNICA REPAIRING AN MECHANICAL TECHNOLOGICAL ARTÍCULO ORIGINAL seño

Más detalles

La fuerza gravitatoria entre dos masas viene dada por la ley de gravitación universal de Newton, cuya expresión vectorial es

La fuerza gravitatoria entre dos masas viene dada por la ley de gravitación universal de Newton, cuya expresión vectorial es LGUNS CUESTIONES TEÓICS SOE LOS TEMS Y.. azone si las siuientes afimaciones son vedadeas o falsas a) El tabajo que ealiza una fueza consevativa sobe una patícula que se desplaza ente dos puntos, es meno

Más detalles

12-16 de Noviembre de 2012. Francisco Javier Burgos Fernández

12-16 de Noviembre de 2012. Francisco Javier Burgos Fernández MEMORIA DE LA ESTANCIA CON EL GRUPO DE VISIÓN Y COLOR DEL INSTITUTO UNIVERSITARIO DE FÍSICA APLICADA A LAS CIENCIAS TECNOLÓGICAS. UNIVERSIDAD DE ALICANTE. 1-16 de Novembre de 01 Francsco Javer Burgos Fernández

Más detalles

Trabajo y Energía Cinética

Trabajo y Energía Cinética Trabajo y Energía Cnétca Objetvo General Estudar el teorema de la varacón de la energía. Objetvos Partculares 1. Determnar el trabajo realzado por una fuerza constante sobre un objeto en movmento rectlíneo..

Más detalles

Administración eficiente de laboratorios en un mundo globalizado

Administración eficiente de laboratorios en un mundo globalizado Admnsacón efcene de laboaoos en un mundo globalzado Fancsco Gacía Geene de Opeacones Dvsón Meología CESMEC S.A. Chle 6 de agoso de 202 Caagena, Colomba Inoduccón Aspecos comecales Recuso humano Aspecos

Más detalles

Introducción. XI Jornadas de I+D en Telecomunicaciones

Introducción. XI Jornadas de I+D en Telecomunicaciones XI Jonadas de I+D en Teecomuncacones Conto de potenca en WCDMA Dane Cañadas; Fean Casadeva Gupo de Comuncacones Rado Depatamento de Teoía de a Seña y Comuncacones Unvesdad otécnca de Catauña (UC) [email protected];

Más detalles

C I R C U L A R N 2.133

C I R C U L A R N 2.133 Montevdeo, 17 de Enero de 2013 C I R C U L A R N 2.133 Ref: Insttucones de Intermedacón Fnancera - Responsabldad patrmonal neta mínma - Susttucón de la Dsposcón Transtora del art. 154 y de los arts. 158,

Más detalles

Créditos Y Sistemas de Amortización: Diferencias, Similitudes e Implicancias

Créditos Y Sistemas de Amortización: Diferencias, Similitudes e Implicancias Crédtos Y Sstemas de Amortzacón: Dferencas, Smltudes e Implcancas Introduccón Cuando los ngresos de un agente económco superan su gasto de consumo, surge el concepto de ahorro, esto es, la parte del ngreso

Más detalles

Observatorio Bancario

Observatorio Bancario México Observatorio Bancario 2 junio Fuentes de Financiamiento de las Empresas Encuesta Trimestral de Banco de México Fco. Javier Morales E. [email protected] La Encuesta Trimestral de Fuentes

Más detalles

Qué es la EN81-28? Atrapado en el ascensor?

Qué es la EN81-28? Atrapado en el ascensor? Qué es la EN81-28? Atrapado en el ascensor? www.safelne.se La podemos ayudar! Hsselektronk desarrolla y produce electrónca para ascensores. Nuestra gama de productos consste prncpalmente en teléfonos de

Más detalles

Economía de la Empresa: Financiación

Economía de la Empresa: Financiación Economía de la Empresa: Fnancacón Francsco Pérez Hernández Departamento de Fnancacón e Investgacón de la Unversdad Autónoma de Madrd Objetvo del curso: Dentro del contexto de Economía de la Empresa, se

Más detalles

Econometría. Ayudantía # 01, Conceptos Generales, Modelo de Regresión. Profesor: Carlos R. Pitta 1

Econometría. Ayudantía # 01, Conceptos Generales, Modelo de Regresión. Profesor: Carlos R. Pitta 1 Escuela de Ingenería Comercal Ayudantía # 01, Conceptos Generales, Modelo de Regresón Profesor: Carlos R. Ptta 1 1 [email protected] Escuela de Ingenería Comercal Ayudantía 01 Parte 01: Comentes Señale

Más detalles

Relaciones entre variables

Relaciones entre variables Relacones entre varables Las técncas de regresón permten hacer predccones sobre los valores de certa varable Y (dependente), a partr de los de otra (ndependente), entre las que se ntuye que exste una relacón.

Más detalles

Tema 1: Estadística Descriptiva Unidimensional Unidad 2: Medidas de Posición, Dispersión y de Forma

Tema 1: Estadística Descriptiva Unidimensional Unidad 2: Medidas de Posición, Dispersión y de Forma Estadístca Tema 1: Estadístca Descrptva Undmensonal Undad 2: Meddas de Poscón, Dspersón y de Forma Área de Estadístca e Investgacón Operatva Lceso J. Rodríguez-Aragón Septembre 2010 Contendos...............................................................

Más detalles