III JORNADAS DE DATA MINING

Tamaño: px
Comenzar la demostración a partir de la página:

Download "III JORNADAS DE DATA MINING"

Transcripción

1 III JORNADAS DE DATA MINING EN EL MACRO DE LA MAESTRÍA EN DATA MINING DE LA UNIVERSIDAD AUSTRAL R.O.I. VS L.T.V. José Alvarez Profesor Maestría en Data Mining de la Universidad Austral. IAE - Pilar, 12 y 13 de agosto de 2008

2 1

3 Objetivos Plantear algunas limitaciones en la instrucción y la práctica de data mining Presentar algunas herramientas para aliviar (puntualmente) las limitaciones señaladas ROI vs. LTV es solo la punta del iceberg 2 2

4 Limitaciones Poca instrucción y aplicación de teoría estadística de las decisiones Poca instrucción y aplicación de los fundamentos de las disciplinas abarcadas por data mining Poca capacitación en tareas de modelización de complejidad mediana (ni hablar de alta) Algunas consecuencias: Modelizaciones muy ingenuas Aplicaciones inadecuadas o muy poco eficaces 3 Data Mining, bastante básica en sus inicios, se dedicaba fundamentalmente a encontrar patrones novedosos (pepitas de conocimiento) y se orientaba conceptualmente a las consideraciones algorítmicas. Pero ha evolucionado en los últimos diez años hacia una disciplina que, especialmente en contextos de negocios, se encarga de la modelización predictiva, forecasting y optimización de todo tipo de fenómenos y problemas. Esto llevó a algunos a tratar de redefinir el campo, empezando por su denominación: sería Analytics en lugar de Data Mining. Más allá del nombre, el contexto actual plantea requerimientos importantes y mucho más exigentes a los profesionales que pretendan hacer data mining. Se requieren conocimientos y destrezas mucho más profundos en técnicas y fundamentos estadísticos, y una práctica mucho más diversa y compleja. 3

5 Algunas herramientas Mayor atención a la teoría y práctica de teoría estadística de las decisiones Criterios más complejos de evaluación de modelos, como LTV y otros Aplicación del análisis de supervivencia 4 Estas son solo algunas herramientas puntuales y acotadas que consideraremos en la presentación. Más en general, lo que es necesario, para resolver realmente las limitaciones antes planteadas, son, por lo menos, revisiones y ampliaciones de las curricula del lado educativo, y determinación de estándares y buenas prácticas para las aplicaciones. 4

6 Paradigma de data mining 5 La instrucción y el propio diseño de las herramientas de mining estimulan a pensar que existe una situación paradigmática típica del data mining predictivo que es la de encontrar un modelo campeón. Así lo plantean también unos cuantos libros de texto. 5

7 Scoring de modelos El propósito de una función de scoring es establecer un orden entre los modelos según su performance La performance se mide agregando el resultado de un conjunto de predicciones del modelo, una por cada caso del conjunto de testeo (scoring de nuevos casos) El orden define un modelo ganador Es muy frecuente una aplicación inadecuada del scoring de modelos por varias razones: Rol de la selección de modelos Funciones multiobjetivo Necesidad de múltiples modelos Selección de una función de scoring 6 6

8 Rol de la selección de modelos La selección de modelos indica cuál es el modelo menos malo, no necesariamente un buen modelo El modelo ganador puede ser bastante inadecuado en términos de lo que se desea modelizar Algunas técnicas como el análisis de regresión (en todas sus variantes) poseen numerosos diagnósticos y métodos que permiten evaluar la calidad de un modelo y ajustarlo, sin necesidad del enfoque de competencia de modelos El enfoque de selección de modelos solo es conveniente en situaciones restringidas 7 Lo que buscamos en general es un buen modelo, es decir, un modelo que sea capaz de representar las principales relaciones entre las variables de un problema, que nos permita comprender las características importantes del mismo y que tenga una buena performance predictiva. En general, esto no se logra organizando una competencia entre modelos. El enfoque de selección de modelos se presta fácilmente a déficits metodológicos como la comparación de modelos de complejidad muy distinta y la utilización de métricas de performance no apropiadas, o no igualmente apropiadas para todos los modelos competidores. Algunas de las situaciones restringidas en las que la selección de modelos puede ser apropiada son: Cuando se emplean técnicas de modelización pobres en recursos diagnósticos. De todas maneras, esta es una situación que convendría evitar. Cuando se desea decidir si un modelo existente puede ser reemplazado por otro en situaciones en las que el modelo existente acusa problemas de performance, o hay nueva información predictiva disponible. Los modelos que se comparan son muy similares en muchos aspectos. Esta es una situación apropiada para el enfoque de selección de modelos. 7

9 Funciones uniobjetivo La selección de modelos se basa en el orden establecido por una función uniobjetivo de scoring (función de valores escalares con un orden total) En general los nodos de evaluación de las herramientas de mining se basan en el máximo (o mínimo) de una sola métrica Criterios de selección más complejos deben aplicarse manualmente Siempre es conveniente examinar la consistencia o no de diversas métricas 8 8

10 Funciones multiobjetivo La selección de modelos es, en realidad, un problema de optimización: encontrar el máximo de una función de bondad de un modelo El espacio de búsqueda es el de todos los modelos posibles: cuánto más diversos o heterogéneos sean los modelos, más complejo es el problema de búsqueda y más improbable es que baste una función uniobjetivo La evaluación debe usar una función multiobjetivo (multicriterio): debe encontrar soluciones óptimas de compromiso entre criterios frecuentemente en conflicto Ejemplo: identificar los clientes más redituables pero menos riesgosos 9 La optimización es la disciplina que se encarga de encontrar una o más soluciones factibles que corresponden a valores extremos de una o más funciones objetivo. Se denominan soluciones óptimas. Debido a las propiedades extremas de las soluciones óptimas, los métodos de optimización son de mucha importancia en la práctica, en áreas como el diseño ingenieril, la experimentación científica y la toma de decisiones en problemas de negocios. Cuando un problema de optimización involucra una sola función objetivo, la tarea de encontrar la solución óptima se llama optimización uniobjetivo. Cuando el problema involucra más de una función objetivo se denomina optimización multiobjetivo. Estos últimos problemas de búsqueda y optimización también se denominan problemas multicriterio de decisión. La existencia de múltiples objetivos en conflicto (como minimizar simultáneamente el costo de fabricación y maximizar la confiabilidad de un producto, o maximizar la cartera de poseedores de tarjetas de crédito pero minimizar el promedio del índice de riesgo de la misma) es algo frecuente en muchos problemas prácticos. En estos casos, ninguna solución puede calificarse como solución óptima y por lo tanto, deben encontrarse soluciones óptimas de compromiso. Formalmente, cuando la función de evaluación es una función de valores escalares, el problema es uniobjetivo, y cuando la función de evaluación es una función de valores vectoriales, el problema es multiobjetivo. Cada componente de un vector responde a algún criterio de valoración de la solución. La dificultad básica de los problemas multiobjetivo radica en que los diversos criterios pueden estar en conflicto entre sí, de modo que una solución óptima en una dimensión (objetivo) puede no serlo en otra u otras dimensiones. Esto hace que no se pueda considerar el caso multiobjetivo meramente como una extensión del caso uniobjetivo. Más bien, el problema uniobjetivo debe considerarse un caso degenerado de problema multiobjetivo. Para poder decidir la optimalidad de una solución según un criterio nos basta que las soluciones estén totalmente ordenadas. El inconveniente en los problemas multiobjetivo reside en que no podemos, sin más, inducir un orden completo entre los vectores que representan la calidad de las soluciones a partir del orden de los componentes. Para resolver un problema multiobjetivo existen básicamente dos enfoques. En un primer enfoque, podemos transformar de alguna forma la función de valores vectoriales en una función de valores escalares (es decir, componer los varios criterios en uno solo), o sea, transformar un problema multiobjetivo en un problema uniobjetivo; pero esta estrategia tiene sus dificultades. La principal es que la tarea de construir la función de evaluación combinada de modo de preservar los criterios fundamentales de valoración de una solución puede ser muy difícil o incluso imposible. Parece mejor, entonces, un segundo enfoque que resuelva un problema multiobjetivo sin transformarlo en uniobjetivo. A partir del orden establecido por los diferentes criterios no podemos inducir un orden total en el conjunto de vectores (y por ende de soluciones), pero sí podemos definir un orden parcial. Este orden permite reconocer el conjunto de soluciones no inferiores o no dominadas. Una vez obtenido, debemos utilizar algún criterio, información extra, etcétera, relacionado con el problema que nos permita elegir una única solución. Los conjuntos de Pareto son una herramienta frecuentemente utilizada en economía para tratar de resolver problemas multicriterio. 9

11 Múltiples modelos Problema: Predecir el monto de pago mensual de los balances de tarjeta de crédito a partir de información de los clientes (transaccional, demográfica, etc.) Solución ingenua : Modelo de regresión, árbol de decisión, etc. que predice el monto concreto para cada cliente Solución apropiada: La distribución de los pagos es bimodal: un porcentaje hace el pago mínimo, otro hace el pago total Modelo 1: Clasificador de pago mínimo Modelo 2: Clasificador de pago total Modelo 3: Predicción de monto de pago para los no clasificados positivamente en los dos modelos anteriores Mejora de un 25% en la precisión 10 Muchos problemas no se modelizan mediante un único modelo, sino mediante varios modelos que representan o predicen distintos aspectos o segmentos del problema. Si bien esto puede mejorar muchas veces el resultado final, hay que tener en cuenta varias cosas: Se requiere un estudio preliminar de los datos y conocimiento de dominio para detectar los casos en los que es conveniente usar más de un modelo: multimodalidad, problemas heterogéneos, etc. Se deben aplicar criterios de la teoría estadística de decisiones para determinar cómo combinar los modelos A veces la combinación de modelos puede producir problemas de estabilidad. Técnicas habituales (aunque no demasiado usadas) como ensemble learning y aprendizaje multiestratégico pueden considerarse casos particulares de una modelización múltiple, en las que se hace una búsqueda casi ciega de varios modelos que en realidad terminan modelizando los mismos aspectos (o similares) de un problema, aunque probablemente usando diferentes valores de parámetros (en particular, el ensemble learning). 10

12 Selección de una función de scoring Como en la práctica suele ser difícil medir la utilidad de un modelo en términos de la tarea concreta se recurre a funciones de scoring genéricas (p. ej. el error cuadrático) que tienen propiedades bien conocidas y son fáciles de calcular. Es muy común la utilización de funciones de scoring convenientes (genéricas) pero totalmente inapropiadas para una aplicación dada Tipos de funciones: Funciones genéricas Funciones basadas en costo/ganancia Funciones basadas en el ROI Funciones basadas en el NPV Funciones basadas en el LTV 11 Diferentes funciones de scoring tienen distintas propiedades y son útiles en diferentes situaciones. Existen funciones de scoring para modelos (globales) y para patrones (locales). También existen diferentes funciones de scoring para modelos predictivos y descriptivos. Además, funciones de scoring para modelos de complejidad fija y funciones de scoring para modelos de distinta complejidad. Cuanto más específica sea la función de scoring respecto del problema de aplicación, mayor será su potencia discriminadora sobre los modelos. 11

13 Funciones genéricas Error de clasificación (Función de pérdida 0-1): Error cuadrático medio (ECM): 1/n i (h(x i ) f(x i )) 2 Medidas de separación: Diferencia de medias de dos distribuciones Estadístico K-S (Kolmogorov-Smirnov) Area bajo la curva ROC (equivalente al test Wilcoxon-Mann-Whitney) Medidas que penalizan la complejidad del modelo: AIC, SBC 12 12

14 P Umbrales Sen Esp x 1 x Diferentes umbrales producen diferentes decisiones y diferentes matrices de confusión Para determinar el umbral óptimo debe definirse un criterio 13de performance Salvo en los clasificadores que asignan directamente una clasificación, los estadísticos basados en el error de clasificación (sensibilidad, valor predictivo positivo, riesgo, etc.) dependen de la selección de un valor de corte (umbral). Diferentes umbrales producen diferentes reglas de decisión y matrices de confusión. Para determinar el umbral óptimo debe definirse un criterio de performance. Si el objetivo es aumentar la sensibilidad del clasificador, entonces el clasificador óptimo asignaría todos los casos a la clase 1. Si el objetivo fuera aumentar la especificidad, entonces el clasificador óptimo asignaría todos los casos a la clase 0. Para aplicaciones realistas, existe una solución de compromiso entre sensibilidad y especificidad. Umbrales más altos disminuyen la sensibilidad y aumentan la especificidad. Umbrales más bajos disminuyen la especificidad y aumentan la sensibilidad. 13

15 Diferencia de medias Modelo 1 Modelo 2 PDF Clase 0 Clase Probabilidad Posterior 14 Los estadísticos que resumen la performance de un clasificador a través del rango de umbrales (como las medidas de separación) pueden ser útiles para evaluar la potencia discriminatoria global de los modelos. En el enfoque de las medidas de separación, se mide la divergencia entre las probabilidades posteriores predichas para cada clase. Cuanto más se superponen las distribuciones, más débil es el modelo. Los estadísticos más simples se basan en la diferencia de medias de las dos distribuciones. Uno es el test t de Student, que tiene muchas propiedades óptimas cuando las dos distribuciones son simétricas, tienen varianzas iguales y colas no pesadas. Sin embargo, esto no suele ocurrir con las probabilidades posteriores predichas, que típicamente siguen distribuciones asimétricas con varianzas muy desiguales. Existen otros tests estadísticos para dos clases basados en distribuciones no normales. 14

16 0 1 PDF 0 1 Estadístico K-S Modelo 2 Probabilidad Posterior 1 0 EDF D = Se basa en la distancia entre las dos distribuciones empíricas D es la diferencia vertical máxima entre las distribuciones acumulativas 15 El test para dos muestras de Kolmogorov-Smirnov se basa en la distancia entre las funciones de distribución empíricas. El estadístico D es la diferencia vertical máxima entre las distribuciones acumuladas. Si D es igual a cero, las distribuciones son idénticas en todos lados. Si D > 0, existen algunos valores de probabilidad posterior en los que las distribuciones difieren. El valor máximo del estadístico K-S, 1, ocurre cuando las distribuciones están perfectamente separadas. El uso del estadístico K-S para comparar modelos predictivos es popular en marketing en bases de datos. 15

17 Area bajo la curva ROC PDF EDF ROC Modelo 1 D =.24 c =.66 Modelo 2 D =.49 c =.82 Equivalente al test de Wilcoxon-Mann-Whitney 16 El test K-S es sensible a todo tipo de diferencias entre las distribuciones: localización, escala y forma. En el contexto de la modelización predictiva, puede argumentarse que las diferencias de localización son muy importantes. Debido a su generalidad, el test K-S no es particularmente potente para la detección de diferencias de localización. El test no paramétrico para dos muestras más potente es el de Wilcoxon-Mann-Whitney. Este test es equivalente al área debajo de la curva ROC. La versión de Wilcoxon se basa en los rangos de los datos. En el contexto de la modelización predictiva, las probabilidades posteriores predichas pueden ser ordenadas de menor a mayor. El estadístico se basa en la suma de los rangos en las clases. El área bajo la curva ROC, c, puede determinarse a partir de la suma de rangos en la clase 1. 16

18 Criterio de Schwarz-Bayes (SBC) SBC = 2 ln( l( w)) + p ln( n) + constant SBC usa una penalización por complejidad dada por p ln(n), donde p es el número de parámetros en el modelo y n es el número de observaciones, y -2 ln(l(w)), una medida de verosimilitud que mide el ajuste del modelo a los datos SBC favorece entonces modelos que tienen buen ajuste a los datos pero que son parsimoniosos (menor número posible de parámetros) No existe una escala absoluta para SBC. Se prefieren los modelos con valores más bajos en 17 este criterio SBC es un ejemplo de medidas que además de utilizar algún criterio de performance predictivo utilizan una medida de la complejidad del modelo (penalizan la complejidad). Dos ventajas importantes de estas medidas son: Establecen un terreno común para comparar modelos de distinta complejidad Permiten usar todos los datos para entrenamiento y testeo, sin necesidad de hold-out o crossvalidation. La desventaja principal es que estas medidas no poseen una escala absoluta, lo que dificulta una interpretación fina de los resultados obtenidos. 17

19 Funciones basadas en costo/ganancia Costo Total 70 5 Predicho 9*4 + 5 = Real *4 + 9 = 25 Matriz de costos * = 22 La regla de decisión óptima minimiza el costo esperado total (riesgo) 18 Un enfoque formal para determinar el umbral óptimo utiliza la teoría estadística de las decisiones. Se asignan costos o ganancias a cada decisión. La regla de decisión óptima es aquella que minimiza el costo total esperado (riesgo) o maximiza la ganancia total esperada. 18

20 Regla bayesiana (dos clases) Costo de clasificar un caso con 1: (1 p) costo FP Costo de clasificar un caso con 0: p costo FN Regla óptima: asignar un caso a 1 si Asignar a clase 1 si Si no asignar a clase 0 (1 p) costo FP < p costo FN La regla bayesiana solo depende de la tasa de los costos, no de sus valores concretos Si los costos son iguales, la regla bayesiana corresponde a 19 un umbral de 0.5 La regla bayesiana es la regla de decisión que minimiza el costo esperado. En la situación de dos clases, la regla bayesiana puede determinarse analíticamente como se expone arriba. p es la probabilidad posterior verdadera de que un caso pertenece a la clase 1. Como p debe estimarse a partir de los datos, la regla de Bayes usa p^. Una consecuencia es que la regla bayesiana puede no alcanzar el costo mínimo si la estimación de la probabilidad posterior es pobre. 19

21 Umbrales Cuando la tasa de costos es igual a 1, el costo esperado es proporcional a la tasa de error Un umbral de 0.5 tiende a minimizar la tasa de error (maximizar la precisión) Sin embargo, el uso de la tasa de error frecuentemente refleja que no se pensaron cuidadosamente los objetivos reales de la aplicación Cuando el suceso target es raro el costo de un falso negativo es usualmente mayor que el costo de un falso positivo (el costo de no ofrecer un producto o servicio a alguien que lo compraría es mayor que enviar la promoción a alguien que no lo comprará) Esto frecuentemente lleva a umbrales mucho menores que

22 Matriz de ganancias Ganancia Total Predicho *4-5 = 59 Real *4-9 = *4-18 = Definir una matriz de ganancia (en lugar de una matriz de costos) no lleva a una regla de clasificación diferente. Sin embargo, permite utilizar un estadístico práctico para medir la performance de un clasificador. Un modelo produce probabilidades posteriores que junto con una matriz de ganancias o costos) clasifica a los individuos en probables positivos y probables negativos. Como en el conjunto de testeo se conoce la verdadera clasificación de esos individuos, es factible calcular la ganancia esperada individual y, por lo tanto, la ganancia total. Esta puede usarse como criterio de selección y evaluación de modelos. 21

23 ROI El enfoque de retorno de la inversión se usa frecuentemente porque es simple y fácil de comprender ROI= (Ganancias brutas Inversión)/Inversión Genera medidas simples de scoring basadas en la aplicación del modelo y en relación con su objetivo inmediato Sin embargo, es una medida miope Solo mide los resultados inmediatos No busca optimizar las ganancias obtenibles haciendo uso de datos y conocimiento 22 disponibles al analista Se invierte tanto en una promoción, por ejemplo, y se mide la respuesta. Se calcula la ganancia neta de las ventas a quienes respondieron a la promoción y se divide por la cantidad invertida. El resultado es el retorno de la inversión. Por ejemplo, se invierten $ en mailing a clientes en una promoción. Si se tiene una tasa de respuesta del 2% y se venden ítems a $100 cada uno, con una ganancia neta de $50 por ítem, se tendrá una ganancia bruta de $ Restando los $ invertidos en el mailing de la ganancia bruta, el retorno es $ El retorno sobre la inversión es de 1.5, algo respetable y comprensible. El ROI es un modo de medir el resultado inmediato de un esfuerzo de marketing o algún otro tipo de actividad comercial que use un modelo como insumo. 22

24 NPV (Valor Neto Actual) Valor neto actual (NPV): El valor en pesos actuales de las ganancias futuras generadas por un producto o servicio El cálculo de NPV es más complejo, requiere de la estimación de diversos componentes según la aplicación: Ejemplo en marketing: Probabilidad de respuesta: Estimación a partir de un modelo de respuesta Indice de riesgo: Indice determinado por un modelo o un análisis actuarial Ingresos: Valor presente de los ingresos producidos por un producto o servicio en un intervalo de tiempo (por ejemplo, 3 años) Costos: Costos diversos vinculados a la campaña de marketing Modelo: NPV = P(Activación) x Indice de riesgo x Ganancia del 23 producto - Costos Un enfoque de Valor Actual Neto (NPV) es un primer intento de resolver la miopía del ROI. Se intenta predecir la ganancia global de un producto durante una longitud de tiempo predeterminada. El valor se calcula sobre un cierto número de años descontado a pesos actuales. Aunque hay algunos métodos estándar para calcular el NPV, existen muchas variaciones a través de productos e industrias. La probabilidad de respuesta surge de algún modelo de respuesta Indice de riesgo: Indice actuarial derivado de un análisis de segmentación de clientes. Representa un ajuste al NPV final basado en grupo de edad, género, estado civil, etc. Ingresos: Estimación promedio de la ganancia que un producto o servicio produce en un intervalo de tiempo. Costos: Los costos de las diversas tareas de una campaña de marketing: procesamiento, folletería, correo, etc. 23

25 Utilización moderna de modelos Registro del modelo Ambiente de producción Repositorio de modelos Selección del modelo ganador Interrase de mining Interfase de scoring Software estadístico Código scoring Testeo del modelo Modelo en producción Puesta en producción Interactivo Batch Tiempo real Ambiente de desarrollo y administración Seguimiento del modelo Retiro del modelo 24 Concepción del ambiente de desarrollo, despliegue y administración de modelos de SAS. En un contexto actual o futuro, donde una empresa considera sus modelos predictivos como un recurso estratégico y táctico importante, la existencia de múltiples modelos aplicables a los mismos clientes y situaciones influye de modo significativo en la forma de realizar tareas analíticas. 24

26 Estandarización del ciclo de vida de un modelo (Concepción de SAS) SEMMA RECARSA Sample Explore Modify Model Assess Register Evaluate Compare (Test) Approve Release Score Assess 25 Todavía en la concepción de SAS, al estándar de desarrollo de modelos (SEMMA) debe agregarse un estándar de administración de modelos (RECARSA). 25

27 Ciclo de vida del cliente Prospecto Nuevo cliente Ciente establecido Ex-cliente Respuesta Pérdida Up-sell Activación Valor tiempo de vida del prospecto Cross-sell Ganancia Ingresos Costos Ganancia Valor tiempo de vida del cliente Recuperación Riesgo Pérdida Riesgo Riesgo Retención Cobranza Cobranza 26 En un contexto de Business Intelligence con enfoques de CRM integrales, de 360, etc. tiene sentido considerar a los clientes en términos de su ciclo de vida como clientes, y anidar los distintos problemas de CRM y sus modelizaciones en este marco. El ciclo de vida del cliente se divide en tres partes principales: 1) prospecto, 2) cliente y 3) ex-cliente. Dentro de este ciclo de vida hay muchas oportunidades para desarrollar modelos predictivos. Un prospecto puede modelizarse por su propensión a responder y o activarse. También puede estimarse el nivel de riesgo usando modelización predictiva o segmentación. Combinando modelos de respuesta, activación y/o riesgo con algunas estimaciones del valor del cliente como attrition y/o ganancias subsiguientes, puede calcularse el valor de tiempo de vida de un prospecto. Después de que un prospecto se vuelve un cliente, existen numerosas oportunidades de modelización adicionales. Finalmente, después de que la relación con el cliente finaliza, hay modelos que pueden desarrollarse para mejorar las ganancias. Formular un problema de modelización en este marco permite desarrollar modelos más apropiados y eficaces que pueden utilizar información más completa y precisa para su predicción y evaluación. Esto lleva directamente a la aplicación de un enfoque de LTV (tiempo de vida del cliente) en la modelización. 26

28 LTV Valor de tiempo de vida (LTV): Valor esperado de un prospecto o cliente durante un período de tiempo dado, descontado a pesos actuales. También se conoce como CLV (Customer Life Value) El cálculo de LTV es complejo, requiere de la estimación de diversos componentes según la aplicación: Ejemplo en marketing : Duración esperada de la relación con el cliente Período de tiempo: medida del incremento de LTV Ingresos: Valor presente de los ingresos producidos por un producto o servicio Costos diversos Tasa de retención Factor de riesgo Ganancias incrementales (Cross-sell/Upsell, referenciamiento, etc.) Modelo: LTV = P(Activación) x Indice de riesgo x (Ganancia del producto + 27 Cross-sell/Upsell) x Indice de retención - Costos Un modelo de LTV intenta predecir el valor total de un cliente (persona o negocio) durante una longitud de tiempo predeterminado. De manera similar al NPV, se calcula sobre un cierto número de años y se descuenta a pesos actuales. Los métodos para calcular el valor de tiempo de vida también varían a través de productos e industrias. A medida que los mercados se achican y la competencia aumenta, las compañías buscan oportunidades para obtener ganancias de su base de clientes. Como resultado, muchas compañías expanden sus ofertas de productos y/o servicios en un esfuerzo por hacer cross-sell y up-sell a sus clientes existentes. Este enfoque crea la necesidad de ir más allá del valor neto actual de un producto, a un enfoque de valor de tiempo de vida del cliente (LTV). Esta valuación permite a las compañías asignar recursos en base al valor potencial del cliente. Las mediciones de LTV son útiles para adquirir clientes, manejar sus relaciones con los mismos e incluso cuantificar la salud financiera de largo plazo de una empresa en base a la calidad de su portfolio de clientes. Una vez que se asigna un LTV a cada cliente, la base de clientes puede segmentarse de diversas maneras. Con esta información, una compañía puede tomar acciones o evitarlas en base al beneficio a largo plazo para la compañía. Duración esperada de la relación con el cliente: Este valor es uno de los más críticos para los resultados y difícil de determinar. Podría pensarse que una duración prolongada sería mejor para el negocio, pero hay dos desventajas. Primero, cuanto mayor es la duración, menor la precisión del modelo. Segundo, una gran duración demora la validación final. Período de tiempo: medida del incremento de LTV. Generalmente es un año, pero puede reflejar diferentes periodos de renovación o ciclos de productos. 27

29 LTV en Marketing La investigación de marketing tradicional es un enfoque estático que puede complementarse con un enfoque más dinámico basado en el valor actual del cliente y su ciclo de vida Obstáculos de los enfoques de LTV: Formalización teórica insuficiente Requiere una competencia cuantitativa y conceptual más compleja Clases de enfoques: Modelos econométricos que buscan una comprensión en términos económicos de la conducta del consumidor Modelos de naturaleza probabilística: Pareto/NBD, BG/NBD Técnicas de Data Mining 28 La introducción del enfoque de LTV se basa en trabajos empíricos de investigadores de marketing. No existe aún un conjunto de fundamentos teóricos apropiados, si bien algunas de sus formulaciones (en general las menos prácticas) se basan en algunos instrumentos estadísticos y econométricos tradicionales. Para mayores consideraciones sobre estas cuestiones véase Castéran (2004). Gupta et al. (2006) utilizan una clasificación más compleja de enfoques de LTV consistente en: Modelos RFM, Modelos probabilísticos, Modelos econométricos, Modelos de persistencia, Modelos computacionales, Modelos de difusión/crecimiento. 28

30 Modelo Pareto/NBD Calcula P(activo) y predice el número de transacciones (individuales y acumulativas) Difícil de implementar Supuestos del modelo: Las compras siguen una distribución de Poisson con tasa de compra λ El tiempo de vida sigue una distribución exponencial con tasa μ Heterogeneidad de los clientes: Las tasas de compra y de deserciones tienen distribuciones gamma Tasas de compra y de deserciones son independientes Modelo: Entrada: Vector de parámetros θ=(r, α, s, β ) y vector de transacciones V=(X=x, t, T) Salida: P(Activo V, θ), E[V, T F, θ] 29 Modelo formulado por Schmittlein, Morrison y Colombo (1987). Es el modelo más conocido y referenciado. Conceptualmente simple aunque intrincado de implementar. Varios supuestos distribucionales. Entrada: Vector de parámetros θ=(r, α, s, β) (r, α): Parámetros de la distribución gamma de tasa de compras (s, β): Parámetros de la distribución gamma de la tasa de deserción Vector de transacciones V=(X=x, t, T): información de las compras individuales, donde x es el número de transacciones en el período (0, T] y t es el tiempo de la última compra. Salida: P(Activo V, θ): probabilidad de que un cliente todavía está activo dado un patrón individual de compra y parámetros del modelo E[V, T F, θ]: Número esperado de compras dado un patrón individual de compra y parámetros del modelo 29

Aplicaciones prácticas de Minería de Datos con IBM SPSS Modeler

Aplicaciones prácticas de Minería de Datos con IBM SPSS Modeler Álvaro J. Méndez Services Engagement Manager IBM SPSS / Profesor Econometría UAM Jecas, 22 Oct 2010 Aplicaciones prácticas de Minería de Datos con IBM SPSS Modeler Business Analytics software Agenda Minería

Más detalles

Cómo se usa Data Mining hoy?

Cómo se usa Data Mining hoy? Cómo se usa Data Mining hoy? 1 Conocer a los clientes Detectar segmentos Calcular perfiles Cross-selling Detectar buenos clientes Evitar el churning, attrition Detección de morosidad Mejora de respuesta

Más detalles

El Valor del Cliente. Marcelo Ferreyra. IX Jornadas de Data Mining & Business Intelligence Universidad Austral

El Valor del Cliente. Marcelo Ferreyra. IX Jornadas de Data Mining & Business Intelligence Universidad Austral 1 El Valor del Cliente Marcelo Ferreyra IX Jornadas de Data Mining & Business Intelligence Universidad Austral - Agenda 2 El valor del cliente Valor Histórico Valor Actual Valor Potencial Aplicaciones

Más detalles

Habilidades y Herramientas para trabajar con datos

Habilidades y Herramientas para trabajar con datos Habilidades y Herramientas para trabajar con datos Marcelo Ferreyra X Jornadas de Data Mining & Business Intelligence Universidad Austral - Agenda 2 Tipos de Datos Herramientas conceptuales Herramientas

Más detalles

Orientarse al Cliente a partir del Customer Lifetime Value

Orientarse al Cliente a partir del Customer Lifetime Value Orientarse al Cliente a partir del Customer Lifetime Value Cómo Transformar la Base de Datos de Clientes en el Activo Fundamental de una Compañía. por Cristián Maulén CEO & Founder CustomerTrigger.com

Más detalles

Universidad del CEMA Master en Finanzas 2006

Universidad del CEMA Master en Finanzas 2006 Universidad del CEMA Master en Finanzas 2006 La Simulación como una herramienta para el manejo de la incertidumbre Fabián Fiorito ffiorito@invertironline.com Tel.: 4000-1400 Hoy en día la simulación es

Más detalles

entre la publicidad online y el ROI

entre la publicidad online y el ROI La clara entre la publicidad online y el ROI Análisis del impacto de la publicidad online en el mix de medios para las empresas de telecomunicaciones. Greg Forbes, Research Manager, Microsoft Advertising

Más detalles

EPB 603 Sistemas del Conocimiento!"#$ %& $ %'

EPB 603 Sistemas del Conocimiento!#$ %& $ %' Metodología para el Desarrollo de Proyectos en Minería de Datos CRISP-DM EPB 603 Sistemas del Conocimiento!"#$ %& $ %' Modelos de proceso para proyectos de Data Mining (DM) Son diversos los modelos de

Más detalles

UNIDAD 2. ADMINISTRACIÓN DE LA RELACIÓN CON EL CLIENTE (CRM)

UNIDAD 2. ADMINISTRACIÓN DE LA RELACIÓN CON EL CLIENTE (CRM) UNIDAD 2. ADMINISTRACIÓN DE LA RELACIÓN CON EL CLIENTE (CRM) Objetivos Al finalizar la unidad el alumno deberá conocer los antecedentes, el origen, los objetivos, los diferentes tipos y las estrategias

Más detalles

Resultados de Marketing Directo Utilizando Conceptos de Segmentación. RFM: Recency, Frequency, Monetary Value.

Resultados de Marketing Directo Utilizando Conceptos de Segmentación. RFM: Recency, Frequency, Monetary Value. Resultados de Marketing Directo Utilizando Conceptos de Segmentación. RFM: Recency, Frequency, Monetary Value. Luis Aburto Lafourcade Gerente de Desarrollo luaburto@analytics.cl Agenda CRM: Entendiendo

Más detalles

5. SISTEMA DE COSTOS ESTÁNDAR

5. SISTEMA DE COSTOS ESTÁNDAR 5. SISTEMA DE COSTOS ESTÁNDAR Entre los diversos procedimientos técnicos que los ejecutivos y funcionarios de las organizaciones privadas, públicas o no gubernamentales, tienen que utilizar para administrar

Más detalles

Conocer al cliente: Esta vez es personal

Conocer al cliente: Esta vez es personal Conocer al cliente: Esta vez es personal Cómo analytics puede ayudar a los bancos a lograr un CRM de nivel superior, asegurar el crecimiento y lograr un alto desempeño. Índice Introducción Cómo advanced

Más detalles

UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL

UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL Objetivo terminal: Calcular e interpretar medidas de tendencia central para un conjunto de datos estadísticos. Objetivos específicos: 1. Mencionar las características

Más detalles

UN MODELO PARA LA PREDICCIÓN DE RECIDIVA DE PACIENTES OPERADOS DE CÁNCER DE MAMA (CMO) BASADO EN REDES NEURONALES

UN MODELO PARA LA PREDICCIÓN DE RECIDIVA DE PACIENTES OPERADOS DE CÁNCER DE MAMA (CMO) BASADO EN REDES NEURONALES UN MODELO PARA LA PREDICCIÓN DE RECIDIVA DE PACIENTES OPERADOS DE CÁNCER DE MAMA (CMO) BASADO EN REDES NEURONALES José Alejandro Chiri Aguirre RESUMEN La predicción de recidiva en pacientes que han sido

Más detalles

Curso de Estadística no-paramétrica

Curso de Estadística no-paramétrica Curso de Estadística no-paramétrica Sesión 1: Introducción Inferencia no Paramétrica David Conesa Grup d Estadística espacial i Temporal Departament d Estadística en Epidemiologia i Medi Ambient i Investigació

Más detalles

TABLAS DINAMICAS DE MORTALIDAD Y SUPERVIVENCIA

TABLAS DINAMICAS DE MORTALIDAD Y SUPERVIVENCIA TABLAS DINAMICAS DE MORTALIDAD Y SUPERVIVENCIA Ana Debón 1 Ramón Sala 2 Universitat de Valencia Resumen: Es una realidad que la esperanza de vida está aumentando en todos los países desarrollados. Así

Más detalles

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING Aprendizaje Automático y Data Mining Bloque IV DATA MINING 1 Índice Definición y aplicaciones. Grupos de técnicas: Visualización. Verificación. Descubrimiento. Eficiencia computacional. Búsqueda de patrones

Más detalles

Monografías de Juan Mascareñas sobre Finanzas Corporativas ISSN: 1988-1878 Introducción al VaR

Monografías de Juan Mascareñas sobre Finanzas Corporativas ISSN: 1988-1878 Introducción al VaR Juan Mascareñas Universidad Complutense de Madrid Versión inicial: mayo 1998 - Última versión: mayo 2008 - El valor en riesgo (VaR), 2 - El método histórico, 3 - El método varianza-covarianza, 6 - El método

Más detalles

TEMA 9: Desarrollo de la metodología de Taguchi

TEMA 9: Desarrollo de la metodología de Taguchi TEMA 9: Desarrollo de la metodología de Taguchi 1 La filosofía de la calidad de Taguchi 2 Control de calidad Off Line y On Line Calidad Off Line Calidad On Line 3 Función de pérdida 4 Razones señal-ruido

Más detalles

How organizations are influenced by Business Analytics? Octubre 2014

How organizations are influenced by Business Analytics? Octubre 2014 How organizations are influenced by Business Analytics? Octubre 2014 El boom de los datos Fuente: Gestión. Artículo: Big Data: La nueva moneda en el mundo de los negocios. Martes, 07 de octubre del 2014

Más detalles

Regresión de Poisson

Regresión de Poisson Regresión de Poisson -- Si la estructura de los errores es realmente de Poisson, entonces: devianza residual / grados de libertad residuales = 1 si el cociente es mayor que 1 estamos ante el fenómeno (incómodo)

Más detalles

Clase 2: Estadística

Clase 2: Estadística Clase 2: Estadística Los datos Todo conjunto de datos tiene al menos dos características principales: CENTRO Y DISPERSIÓN Los gráficos de barra, histogramas, de puntos, entre otros, nos dan cierta idea

Más detalles

Clase 2: Estadística

Clase 2: Estadística Clase 2: Estadística Los datos Todo conjunto de datos tiene al menos dos características principales: CENTRO Y DISPERSIÓN Los gráficos de barra, histogramas, de puntos, entre otros, nos dan cierta idea

Más detalles

Identificación rápida de cuellos de botella: Una mejor manera de realizar pruebas de carga. Documento técnico de Oracle Junio de 2009

Identificación rápida de cuellos de botella: Una mejor manera de realizar pruebas de carga. Documento técnico de Oracle Junio de 2009 Identificación rápida de cuellos de botella: Una mejor manera de realizar pruebas de carga Documento técnico de Oracle Junio de 2009 Identificación rápida de cuellos de botella: Una mejor manera de realizar

Más detalles

Precision Pricing de Depósitos

Precision Pricing de Depósitos Precision Pricing de Depósitos AUTORES: PABLO LOS SANTOS Y RICH SOLOMON La analítica aplicada al pricing de depósitos ofrece una oportunidad sustancial a los bancos, pero la dirección enfrenta el desafío

Más detalles

Retos de la Proliferación de Modelos. 2 de Octubre 2012

Retos de la Proliferación de Modelos. 2 de Octubre 2012 Retos de la Proliferación de Modelos 2 de Octubre 2012 ÍNDICE Introducción Tipos de modelos Problemática de gestión Conclusiones Introducción 3 Aunque hay créditos desde hace 5000 años, los modelos sólo

Más detalles

Contenido. Horizontes temporales de la previsión La influencia del ciclo de vida del producto

Contenido. Horizontes temporales de la previsión La influencia del ciclo de vida del producto Previsión Contenido Qué es la previsión? Horizontes temporales de la previsión La influencia del ciclo de vida del producto Tipos de previsiones La importancia estratégica de la previsión Recursos humanos

Más detalles

CURSOS CONENTO. Una puerta abierta para que puedas desarrollar tus propios análisis

CURSOS CONENTO. Una puerta abierta para que puedas desarrollar tus propios análisis CURSOS CONENTO Una puerta abierta para que puedas desarrollar tus propios análisis Introducción Este documento recoge la lista de los cursos que ofrecemos para ayudar a nuestros clientes a incrementar

Más detalles

Q-EVAL MEJORANDO LA SATISFACCIÓN DE SUS CLIENTES

Q-EVAL MEJORANDO LA SATISFACCIÓN DE SUS CLIENTES Q-EVAL MEJORANDO LA SATISFACCIÓN DE SUS CLIENTES Este documento es propiedad intelectual de MORE, Market & Opinion Research, por lo que cualquier tema relacionado con su contenido, es de uso confidencial

Más detalles

Tutorial - Parte 2: Scoring

Tutorial - Parte 2: Scoring Introducción Tutorial - Parte 2: Scoring En este segundo tutorial aprenderá lo que significa un modelo de Scoring, verá cómo crear uno utilizando Powerhouse Analytics y finalmente a interpretar sus resultados.

Más detalles

Cómo usar el marketing relacional

Cómo usar el marketing relacional DOSSIER >> Latin Stock Más allá del CRM Cómo usar el marketing relacional Todavía son demasiadas las compañías que no se enfocan en los clientes. A continuación se exponen cuatro prácticas para crear una

Más detalles

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003 MINERÍA DE DATOS Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE Octubre - 2003 CONTENIDO Qué es Data Warehousing Data Warehouse Objetivos del Data Warehouse

Más detalles

1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2.

1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2. 1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2. GENERALIDADES SOBRE LAS TÉCNICAS DE INVESTIGACIÓN SOCIAL Y DE MERCADOS

Más detalles

MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN

MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN Suponga que le pedimos a un grupo de estudiantes de la asignatura de estadística que registren su peso en kilogramos. Con los datos del peso de los estudiantes

Más detalles

MATERIA : GESTION DE SERVICIOS DE TI FECHA: Marzo 18 de 2013

MATERIA : GESTION DE SERVICIOS DE TI FECHA: Marzo 18 de 2013 Tabla de contenido Métricas de la Gestión de los : Cómo Empezar... 2 Por qué realizar informes de gestión desde los datos de del Centro de Servicio al Usuario?... 2 Clasificación de los Datos de Rendimiento...

Más detalles

Parte I: Introducción

Parte I: Introducción Parte I: Introducción Introducción al Data Mining: su Aplicación a la Empresa Cursada 2007 POR QUÉ? Las empresas de todos los tamaños necesitan aprender de sus datos para crear una relación one-to-one

Más detalles

Precio del alquiler de pisos durante una serie de meses. Evolución del índice del precio del trigo con mediciones anuales.

Precio del alquiler de pisos durante una serie de meses. Evolución del índice del precio del trigo con mediciones anuales. Series Temporales Introducción Una serie temporal se define como una colección de observaciones de una variable recogidas secuencialmente en el tiempo. Estas observaciones se suelen recoger en instantes

Más detalles

Scoring: Construcción y Aplicación

Scoring: Construcción y Aplicación Scoring: Construcción y Aplicación Agosto de 2014 2014 Experian Information Solutions, Inc. All rights reserved. Experian and the marks used herein are service marks or registered trademarks of Experian

Más detalles

EJEMPLO PRÁCTICO DE CÁLCULO DEL VALOR DE VIDA DEL CLIENTE (VVC) O LIFE TIME VALUE (LTV)

EJEMPLO PRÁCTICO DE CÁLCULO DEL VALOR DE VIDA DEL CLIENTE (VVC) O LIFE TIME VALUE (LTV) APARTADO Nº: 6 DIAPOSITIVA Nº: 2 PRÁCTICA Nº 2: Ejemplo práctico de cálculo del Valor de Vida del Cliente (VVC) o Life Time Value (LTV) EJEMPLO PRÁCTICO DE CÁLCULO DEL VALOR DE VIDA DEL CLIENTE (VVC) O

Más detalles

Creando relaciones con los clientes a través del e-crm. E-Brain Consulting

Creando relaciones con los clientes a través del e-crm. E-Brain Consulting Creando relaciones con los clientes a través del e-crm E-Brain Consulting I.- Índice 1.- Introducción... 3 2.- Qué es e-crm?... 3 3.- Planteamientos para una Solución de e-crm Exitosa... 4 4.- Implementando

Más detalles

GERENCIA ESTRATEGICA DE COSTOS OBJETIVOS IDEAS

GERENCIA ESTRATEGICA DE COSTOS OBJETIVOS IDEAS GERENCIA ESTRATEGICA DE COSTOS Consiste en la utilización que la gerencia o dirección de la empresa hace de la información de costos en las distintas etapas de la toma de decisiones de la misma. Es el

Más detalles

Competir con Analytics Fernando Mogetta Gerente de Consultoría de Negocios SAS Argentina. Copyright 2010, SAS Institute Inc. All rights reserved.

Competir con Analytics Fernando Mogetta Gerente de Consultoría de Negocios SAS Argentina. Copyright 2010, SAS Institute Inc. All rights reserved. Competir con Analytics Fernando Mogetta Gerente de Consultoría de Negocios SAS Argentina OCHO NIVELES DE ANALYTICS 4 ALERTAS Contesta las preguntas: Cuándo reaccionar? Qué acciones son necesarias? 3 2

Más detalles

Lección n 5. Modelos de distribución n potencial de especies

Lección n 5. Modelos de distribución n potencial de especies Lección n 5. Modelos de distribución n potencial de especies 1. Elaboración de modelos de distribución de especies. a. Planteamiento. El modelado del nicho ambiental se basa en el principio de que la distribución

Más detalles

Identificación fácil de los clientes adecuados

Identificación fácil de los clientes adecuados PASW Direct Marketing 18 Especificaciones Identificación fácil de los clientes adecuados Sabemos que le gustaría que sus programas de marketing sean lo más rentables posible y sabemos que conocer la información

Más detalles

Marketing Advanced Analytics. Predicción del abandono de los clientes. Whitepaper

Marketing Advanced Analytics. Predicción del abandono de los clientes. Whitepaper Marketing Advanced Analytics Predicción del abandono de los clientes Whitepaper El reto de predecir el abandono de los clientes Resulta entre cinco y quince veces más caro para una compañía captar nuevos

Más detalles

GESTIÓN DE CLIENTES Y MERCADO

GESTIÓN DE CLIENTES Y MERCADO Por: José Antonio Villagra GESTIÓN DE CLIENTES Y MERCADO Qué se entiende por gestión de clientes y mercado? La gestión de clientes y mercado comprende un conjunto de conceptos y herramientas de gestión

Más detalles

ANÁLISIS DISCRIMINANTE

ANÁLISIS DISCRIMINANTE ANÁLISIS DISCRIMINANTE ANÁLISIS DISCRIMINANTE 1. Introducción 2. Etapas 3. Caso práctico Análisis de dependencias introducción varias relaciones una relación 1 variable dependiente > 1 variable dependiente

Más detalles

CARACTERIZACIÓN DEL PROCESO DE FUGA DE CLIENTES UTILIZANDO INFORMACIÓN TRANSACCIONAL 1

CARACTERIZACIÓN DEL PROCESO DE FUGA DE CLIENTES UTILIZANDO INFORMACIÓN TRANSACCIONAL 1 CARACTERIZACIÓN DEL PROCESO DE FUGA DE CLIENTES UTILIZANDO INFORMACIÓN TRANSACCIONAL 1 Carolina Segovia csegovia@analytics.cl - Luis Aburto luaburto@analytics.cl Marcel Goic mgoic@dii.uchile.cl Resumen

Más detalles

Introducción a la Minería de Datos

Introducción a la Minería de Datos Introducción a la Minería de Datos Abdelmalik Moujahid, Iñaki Inza y Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Índice 1 Minería de

Más detalles

Análisis y cuantificación del Riesgo

Análisis y cuantificación del Riesgo Análisis y cuantificación del Riesgo 1 Qué es el análisis del Riesgo? 2. Métodos M de Análisis de riesgos 3. Método M de Montecarlo 4. Modelo de Análisis de Riesgos 5. Qué pasos de deben seguir para el

Más detalles

Por qué Analytics en su Negocio?

Por qué Analytics en su Negocio? Por qué Analytics en su Negocio? Aplicaciones para la Gestión de Riesgos: El Caso del Score Crediticio 22 de Agosto de 2013 Bruno Gili y Sven Schaffrath Por qué Analytics en su negocio? Cantidad de Información

Más detalles

MODULO 2. INVENTARIOS. CLASIFICACIÓN, CONTEO Y VALUACIÓN. C. ETAPAS DE LOS INVENTARIOS Y REGISTRO CONTABLE D. SELECCIÓN DEL SISTEMA DE VALUACIÓN

MODULO 2. INVENTARIOS. CLASIFICACIÓN, CONTEO Y VALUACIÓN. C. ETAPAS DE LOS INVENTARIOS Y REGISTRO CONTABLE D. SELECCIÓN DEL SISTEMA DE VALUACIÓN MODULO 2. INVENTARIOS. CLASIFICACIÓN, CONTEO Y VALUACIÓN. A. CLASIFICACIÓN DE INVENTARIOS Tipos de inventario Sistemas de inventario Modelos de inventario Control de inventarios B. COSTO DE INVENTARIOS

Más detalles

Algoritmos de minería de datos incluidos en SQL Server 2008 1. Algoritmo de árboles de decisión de Microsoft [MIC2009a] Cómo funciona el algoritmo

Algoritmos de minería de datos incluidos en SQL Server 2008 1. Algoritmo de árboles de decisión de Microsoft [MIC2009a] Cómo funciona el algoritmo 1 Algoritmos de minería de datos incluidos en SQL Server 2008 Los algoritmos que aquí se presentan son: Árboles de decisión de Microsoft, Bayes naive de Microsoft, Clústeres de Microsoft, Serie temporal

Más detalles

La inteligencia de marketing que desarrolla el conocimiento

La inteligencia de marketing que desarrolla el conocimiento La inteligencia de marketing que desarrolla el conocimiento SmartFocus facilita a los equipos de marketing y ventas la captación de consumidores con un enfoque muy relevante y centrado en el cliente. Ofrece

Más detalles

Cadena de Valor y Estrategias Genéricas 1. Prof. Marcelo Barrios

Cadena de Valor y Estrategias Genéricas 1. Prof. Marcelo Barrios Cadena de Valor y Estrategias Genéricas 1 1 Nota Técnica Preparada por el del Área de Política de Empresa de EDDE.. Primera versión: Noviembre 2001. Noviembre de 2003. 1 Cadena de Valor y Estrategias Genéricas

Más detalles

SIO Technology SRL. Sumario de Servicios

SIO Technology SRL. Sumario de Servicios SIO Technology SRL Sumario de Servicios Página 1 de 11 Tabla de Contenido Reseña de SIO Technology SIO Consulting... 3 Nuestra Misión... 3 Nuestra Visión... 3 Nuestros Valores... 3 SERVICIOS BRINDADOS

Más detalles

Instantánea Estratégica

Instantánea Estratégica Instantánea Estratégica La Ventaja Corporativa de una Estrategia Unificada de Backup y Archiving Por Clay Ryder y Rob Kidd The Sageza Group, Inc. Marzo de 2005 The Sageza Group, Inc. 32108 Alvarado Blvd

Más detalles

CAPITULO III EL MANTENIMIENTO. 3.1 Conceptos Básicos de Mantenimiento

CAPITULO III EL MANTENIMIENTO. 3.1 Conceptos Básicos de Mantenimiento 39 CAPITULO III EL MANTENIMIENTO 3.1 Conceptos Básicos de Mantenimiento Antes que realizar cualquier tipo de clasificación o descripción de los tipos de mantenimiento, es muy importante saber realmente

Más detalles

DataCrédito está con usted en los momentos de verdad

DataCrédito está con usted en los momentos de verdad DataCrédito está con usted en los momentos de verdad 2 Su progreso es nuestra visión Introducción 3 DataCrédito en un momento Innovación, tecnología, conocimiento y servicio. En DataCrédito trabajamos

Más detalles

Evaluación Económica y Financiera de Inversiones. Dr. Marcelo A. Delfino

Evaluación Económica y Financiera de Inversiones. Dr. Marcelo A. Delfino Evaluación Económica y Financiera de Inversiones Dr. Marcelo A. Delfino Evaluación de proyectos de Inversión Contenido Etapas de desarrollo de un proyecto. Evaluación financiera de proyectos de inversión.

Más detalles

ESTRATEGIAS DIRECTIVAS

ESTRATEGIAS DIRECTIVAS ESTRATEGIAS DIRECTIVAS CRM: Estrategia de Negocios que Crea Valor Ing. Víctor M. Ornelas P. y Lic. Víctor M. Ornelas O. La Alta Dirección de las empresas se encuentra en una búsqueda continua de crear

Más detalles

www.fundibeq.org Además, se recomienda su uso como herramienta de trabajo dentro de las actividades habituales de gestión.

www.fundibeq.org Además, se recomienda su uso como herramienta de trabajo dentro de las actividades habituales de gestión. HISTOGRAMAS 1.- INTRODUCCIÓN Este documento sirve de guía para la construcción de Histogramas y permite profundizar, más allá de su propia significación matemática, en el análisis del funcionamiento y

Más detalles

Aplicación de los modelos de credit scoring para instituciones microfinacieras.

Aplicación de los modelos de credit scoring para instituciones microfinacieras. Econ. Reynaldo Uscamaita Huillca Aplicación de los modelos de credit scoring para instituciones microfinacieras. OBJETIVO Proporcionar al ejecutivo del sistema financiero un modelo solido que permita tomar

Más detalles

VALOR VITALICIO DEL CLIENTE?

VALOR VITALICIO DEL CLIENTE? Extracto del documento 2013 Customer Experience Management Guide QUÉ ES EL VALOR VITALICIO DEL CLIENTE? Por: Laura Bassett, Director of Marketing, Customer Experience and Emerging Technologies, Avaya El

Más detalles

Las Matemáticas En Ingeniería

Las Matemáticas En Ingeniería Las Matemáticas En Ingeniería 1.1. Referentes Nacionales A nivel nacional se considera que el conocimiento matemático y de ciencias naturales, sus conceptos y estructuras, constituyen una herramienta para

Más detalles

Estudio comparativo de los currículos de probabilidad y estadística español y americano

Estudio comparativo de los currículos de probabilidad y estadística español y americano Estudio comparativo de los currículos de probabilidad y estadística español y americano Jaldo Ruiz, Pilar Universidad de Granada Resumen Adquiere las mismas capacidades en Probabilidad y Estadística un

Más detalles

Asset Allocation. Introducción. tradicionales de minimización de riesgo y maximización de beneficios con el contexto actual de los mercados.

Asset Allocation. Introducción. tradicionales de minimización de riesgo y maximización de beneficios con el contexto actual de los mercados. Introducción Dando un vistazo a la década pasada, el tema relevante en los mercados no eran los modelos teóricos para determinar el riesgo y el retorno de los activos sino los cambios en el mercado y las

Más detalles

Serie Documentos de Trabajo. Tablas de Mortalidad CNSF 2000-I y CNSF 2000-G. Documento de trabajo No. 80

Serie Documentos de Trabajo. Tablas de Mortalidad CNSF 2000-I y CNSF 2000-G. Documento de trabajo No. 80 Tablas de Mortalidad CNSF 2-I y CNSF 2-G Manuel Mendoza Ramírez Ana María Madrigal Gómez Evangelina Martínez Torres Mayo 2 Serie Documentos de Trabajo Documento de trabajo No. 8 Índice 1. Antecedentes

Más detalles

CAPÍTULO 5 ANÁLISIS DE CONVERGENCIA DEL MÉTODO BINOMIAL AL MODELO DE BLACK & SCHOLES

CAPÍTULO 5 ANÁLISIS DE CONVERGENCIA DEL MÉTODO BINOMIAL AL MODELO DE BLACK & SCHOLES CAPÍTULO 5 ANÁLISIS DE CONVERGENCIA DEL MÉTODO BINOMIAL AL MODELO DE BLACK & SCHOLES Para la valuación de opciones hay dos modelos ampliamente reconocidos como son el modelo binomial y el modelo de Black

Más detalles

Comparación de modelos de curvas ROC para la evaluación de procedimientos estadísticos de predicción en investigación de mercados.

Comparación de modelos de curvas ROC para la evaluación de procedimientos estadísticos de predicción en investigación de mercados. Comparación de modelos de curvas ROC para la evaluación de procedimientos estadísticos de predicción en investigación de mercados. Pedro Concejero Cerezo Tesis Doctoral dirigida por Rosario Martínez Arias

Más detalles

EL MARKETING RELACIONAL Y NUEVAS TENDENCIAS DE MARKETING

EL MARKETING RELACIONAL Y NUEVAS TENDENCIAS DE MARKETING APARTADO: 6 DIAPOSITIVA Nº: 2 Las métricas del CRM PDF Nº 1: Valor de la relación con el cliente LTV Valor de la relación con el cliente LTV Uno de los aspectos que mayor falencias presenta en la implementaciones

Más detalles

Data Mining Técnicas y herramientas

Data Mining Técnicas y herramientas Data Mining Técnicas y herramientas Introducción POR QUÉ? Empresas necesitan aprender de sus datos para crear una relación one-toone con sus clientes. Recogen datos de todos lo procesos. Datos recogidos

Más detalles

Carta de control CEV X para distribuciones Weibull con datos censurados

Carta de control CEV X para distribuciones Weibull con datos censurados Revista Colombiana de Estadística Volumen 28 N o 2. pp. 125 a 139. Diciembre 2005 Carta de control CEV X para distribuciones Weibull con datos censurados CEV X Control Chart for Weibull Distributions with

Más detalles

Apalancando EFL para influir el mercado de consumidores de bajos recursos

Apalancando EFL para influir el mercado de consumidores de bajos recursos % Tasa de Morosidad Distribución de la Población Caso de Estudio EFL: Apalancando EFL para influir el mercado de consumidores de bajos recursos BanBif Perú Resumen Ejecutivo BanBif, quinto banco 1 comercial

Más detalles

Estimación de parámetros, validación de modelos y análisis de sensibilidad

Estimación de parámetros, validación de modelos y análisis de sensibilidad Tema 6 Estimación de parámetros, validación de modelos y análisis de sensibilidad 6.1 Calibración Una vez que se ha identificado el modelo y se ha programado, necesitamos aplicarlo al problema concreto

Más detalles

Directrices para el Uso del Método de Costo del Usuario

Directrices para el Uso del Método de Costo del Usuario Programa de Comparación Internacional Directrices para el Uso del Método de Costo del Usuario en el Cálculo de Alquileres para Viviendas Ocupadas por el Dueño Oficina Mundial Material Operativo Índice

Más detalles

4. PROYECCIÓN DE EGRESOS... 4 Costos variables...4 Gastos fijos...5 Inversiones...6 Amortizaciones...6

4. PROYECCIÓN DE EGRESOS... 4 Costos variables...4 Gastos fijos...5 Inversiones...6 Amortizaciones...6 Valor actual neto Un caso aplicado a la Valuación de Empresas MSc Pablo Lledó Índice 1. INTRODUCCIÓN... 2 2. SUPUESTOS PARA LA VALUACIÓN... 2 3. PROYECCIÓN DE INGRESOS... 3 3.1. Ingresos por ventas...3

Más detalles

Introducción al DataMining

Introducción al DataMining Introducción al DataMining Lluís Garrido garrido@ecm.ub.es Universitat de Barcelona Índice Qué es el DataMining? Qué puede hacer el DataMining? Cómo hacer el DataMining? Técnicas Metodología del DataMining

Más detalles

Unidad 6. Distribuciones de probabilidad continua, muestreo y distribución de muestras

Unidad 6. Distribuciones de probabilidad continua, muestreo y distribución de muestras Unidad 6 Distribuciones de probabilidad continua, muestreo y distribución de muestras Introducción La unidad 5 se enfocó en el estudio de las distribuciones de probabilidad discreta, entre las cuales

Más detalles

Tema 4:Segmentación de imágenes

Tema 4:Segmentación de imágenes Tema 4:Segmentación de imágenes La segmentación de imágenes divide la imagen en sus partes constituyentes hasta un nivel de subdivisión en el que se aíslen las regiones u objetos de interés. Los algoritmos

Más detalles

Una herramienta para entender y medir la creación de valor: el conjoint analysis

Una herramienta para entender y medir la creación de valor: el conjoint analysis Una herramienta para entender y medir la creación de valor: el conjoint analysis Pablo Raies praies@cema.edu.ar 02477-15469055 1 l Pablo Raies - Introducción al Conjoint - Una herramienta para entender

Más detalles

ESTADÍSTICA. [análisis regresivo]

ESTADÍSTICA. [análisis regresivo] ESTADÍSTICA wikipedia.com la estadística es una ciencia con base matemática referente a la recolección, análisis e interpretación de datos, que busca explicar condiciones regulares en fenómenos de tipo

Más detalles

Curso. Análisis Estadístico de Datos Climáticos

Curso. Análisis Estadístico de Datos Climáticos Curso I-1 Análisis Estadístico de Datos Climáticos Distribuciones de Probabilidad Mario Bidegain (FC) Alvaro Diaz (FI) Universidad de la República Montevideo, Uruguay 2011 I-2 DISTRIBUCIONES DE PROBABILIDAD

Más detalles

ANÁLISIS DINÁMICO DEL RIESGO DE UN PROYECTO

ANÁLISIS DINÁMICO DEL RIESGO DE UN PROYECTO ANÁLISIS DINÁMICO DEL RIESGO DE UN PROYECTO Por: Pablo Lledó Master of Science en Evaluación de Proyectos (University of York) Project Management Professional (PMP) Profesor de Project Management y Evaluación

Más detalles

EL IMPACTO DE BASILEA III EN EL NEGOCIO FINANCIERO

EL IMPACTO DE BASILEA III EN EL NEGOCIO FINANCIERO EL IMPACTO DE BASILEA III EN EL NEGOCIO FINANCIERO Herramientas idóneas para el control de riesgos y la evolución de la calidad de las carteras Gustavo Chuliver Gerente AIS Argentina gustavo.chuliver@ais-int.net

Más detalles

Minería de Datos. Vallejos, Sofia

Minería de Datos. Vallejos, Sofia Minería de Datos Vallejos, Sofia Contenido Introducción: Inteligencia de negocios (Business Intelligence). Descubrimiento de conocimiento en bases de datos (KDD). Minería de Datos: Perspectiva histórica.

Más detalles

III JORNADAS DE DATA MINING DEL CREDIT SCORING A LOS MODELOS DE PRICING AJUSTADOS

III JORNADAS DE DATA MINING DEL CREDIT SCORING A LOS MODELOS DE PRICING AJUSTADOS III JORNADAS DE DATA MINING EN EL MACRO DE LA MAESTRÍA EN DATA MINING DE LA UNIVERSIDAD AUSTRAL DEL CREDIT SCORING A LOS MODELOS DE PRICING AJUSTADOS POR RIESGO David Mermelstein, Economista Senior, Estudio

Más detalles

Valor del tiempo de vida del cliente

Valor del tiempo de vida del cliente Valor del tiempo de vida del cliente 1. Introducción 2. Qué se conoce como Valor del Tiempo de Vida del Cliente? 3. Cómo se calcula el CLV? 4. Modelos del CLV 5. Importancia del CLV 6. Conclusiones 7.

Más detalles

V. EL ESTUDIO FINANCIERO

V. EL ESTUDIO FINANCIERO V. EL ESTUDIO FINANCIERO A. INTRODUCCION 1. OBJETIVO: Analizar la viabilidad financiera de un proyecto. Se sistematiza la información monetaria de los estudios precedentes y se analiza su financiamiento

Más detalles

Indicadores matemáticos para el análisis técnico de precios

Indicadores matemáticos para el análisis técnico de precios ANÁLISIS TÉCNICO DE PRECIOS Nota técnica Joaquín Arias Segura Ph.D i Especialista Regional en Políticas y Negociaciones Comerciales para la Región Andina Instituto Interamericano de Cooperación para la

Más detalles

Añada analítica avanzada a su repertorio con extracción de datos, analítica avanzada y R

Añada analítica avanzada a su repertorio con extracción de datos, analítica avanzada y R Añada analítica avanzada a su repertorio con extracción de datos, analítica avanzada y R Por qué la analítica avanzada? Las empresas que inyectan grandes volúmenes de datos y analítica a sus operaciones

Más detalles

Lean SEIS SIGMA Área Temática: Logística

Lean SEIS SIGMA Área Temática: Logística Proyecto fin de Master Hito 3 Ejercicio Nº 1 Lean SEIS SIGMA Área Temática: Logística www.formatoedu.com 1 Enunciado Lean Seis Sigma es una metodología eficaz para reducir sistemáticamente todas las deficiencias

Más detalles

SAS Business Analytics

SAS Business Analytics SAS Business Analytics Montevideo, 2 de Agosto de 2012 Fernando Mogetta Gerente de Consultoría de Negocios La empresa Años de experiencia 36 Instalaciones +45,000 1 o Empresa privada de software más grande

Más detalles

ANÁLISIS e INTERPRETACIÓN de ESTADOS CONTABLES

ANÁLISIS e INTERPRETACIÓN de ESTADOS CONTABLES ANÁLISIS e INTERPRETACIÓN de ESTADOS CONTABLES Análisis Qué es el análisis de los Estados Contables? Es un conjunto de técnicas que aportan un mayor conocimiento y comprensión de variables para diagnosticar

Más detalles

PROCESO DE INNOVACIÓN EN LA ENSEÑANZA DE LA GESTIÓN DE EQUIPOS INDUSTRIALES EN INGENIERÍA

PROCESO DE INNOVACIÓN EN LA ENSEÑANZA DE LA GESTIÓN DE EQUIPOS INDUSTRIALES EN INGENIERÍA PON-C-22 PROCESO DE INNOVACIÓN EN LA ENSEÑANZA DE LA GESTIÓN DE EQUIPOS INDUSTRIALES EN INGENIERÍA A. García Sánchez (1), M. Ortega Mier (2), E. Ponce Cueto (3) Dpto. de Ingeniería de Organización, Administración

Más detalles

Boletín de Asesoría Gerencial*

Boletín de Asesoría Gerencial* Espiñeira, Sheldon y Asociados No. 10-2008 *connectedthinking Contenido Haga click en los enlaces para navegar a través del documento Haga click en los enlaces para llegar directamente a cada sección 4

Más detalles

LT Accountant & Asociados Firma de Auditores y Asesores Autorizados

LT Accountant & Asociados Firma de Auditores y Asesores Autorizados Análisis Foda y Formulas Financieras Una lista de verificación DOFA Potenciales fortalezas internas Existen muchas líneas de productos? Presenta amplia cobertura de mercado? Existen habilidades de fabricación?

Más detalles

Con el fin de obtener los datos, se procede con las siguientes instrucciones:

Con el fin de obtener los datos, se procede con las siguientes instrucciones: Capitulo 3. La predicción de beneficios del mercado bursátil Este segundo caso de estudio va más allá en el uso de técnicas de minería de datos. El dominio específico utilizado para ilustrar estos problemas

Más detalles

Informática II Ing. Industrial. Data Warehouse. Data Mining

Informática II Ing. Industrial. Data Warehouse. Data Mining Data Warehouse Data Mining Definición de un Data Warehouses (DW) Fueron creados para dar apoyo a los niveles medios y altos de una empresa en la toma de decisiones a nivel estratégico en un corto o mediano

Más detalles

MÁRKETING VIRAL CLIENTES

MÁRKETING VIRAL CLIENTES Por qué son tan importantes los consumidores para el éxito de una empresa? MÁRKETING VIRAL CLIENTES Y HUBS José Luis Ibáñez Medrano Profesor asociado del Área de Márketing del Instituto de Empresa y socio

Más detalles