ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo

Tamaño: px
Comenzar la demostración a partir de la página:

Download "ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo"

Transcripción

1 UNIVERSIDAD POLITÉCNICA DE MADRID FACULTAD DE INFORMÁTICA Proyecto fin de carrera ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo AUTOR: SANTIAGO GONZÁLEZ TORTOSA TUTOR: VÍCTOR ROBLES FORCADA OSCAR CUBO MEDINA MADRID, OCTUBRE 2005

2

3 El futuro pertenece a quienes hacen realidad sus sueños A las dos mujeres que más quiero, mi madre y Carol.

4

5 SINOPSIS Sinopsis ICC+ es una herramienta para el Marketing Inteligente, destinado a departamentos de marketing de empresas que comercializan productos que van dirigidos al consumidor. Su contenido es información que aporta un alto nivel de conocimiento para decidir clientes, a quién y dónde dirigir las actividades, dónde abrir puntos de venta, etc. El desarrollo de esta herramienta comprende un diseño, utilizando la metodología de minería de datos CRISP-DM, y una implementación, desarrollada bajo aplicaciones como puedan ser Clementine o R-Project. La herramienta ICC+ está comprendida principalmente por tres niveles de información: Índices: Valor que una determinada área censal adopta respecto a la media nacional. Podemos apreciar dos tipos de índices, económicos, y de consumo. Propensiones: Valores que expresan la probabilidad que tienen determinadas familias situadas en un área censal respecto de una serie de variables específicas. Tipologías: ICC+ realiza una clasificación de las familias en perfiles, utilizando diferentes enfoques analíticos. La información permite disponer de una caracterización de la misma, o bien una estructura de diferentes grupos. - i -

6

7 AGRADECIMIENTOS Agradecimientos Durante toda mi carrera como ingeniero, han estado muchas personas a mí alrededor, animándome y prestándome todo su apoyo. Es por ello que, en este proyecto, quisiera transmitir mi más sincero agradecimiento a todas ellas. En primer lugar, recordar a mi madre, Mariluz, que descanse en paz. Quiero agradecerle tantas cosas que no sé por donde empezar. He aprendido muchas cosas de ella, pero si algo tengo que destacar, es la fuerza de voluntad y las ganas de vivir. Desde el día que lo aprendí, observo la vida con diferente perspectiva, hasta el punto de llegar a creer que todo lo que uno se proponga, puede llegar a conseguirlo. Por ello y por más cosas, gracias por todo madre. Realmente, si a alguien debo haber terminado la carrera, y con ello este proyecto, es a Carol, mi novia. Sin ella, mi vida no tendría ningún sentido. Gracias, de todo corazón, por tu apoyo, tu confianza, tu simpatía, tu sinceridad, tu preocupación, tu aprecio, tu cariño, tu sonrisa, en todo momento. En definitiva, mil gracias por todo Carol. Quiero agradecer a mi familia el apoyo recibido en todo momento. Han sido comprensibles, tanto en los estudios como en el trabajo, y me han facilitado todo lo necesario para poder haber hecho realidad mi sueño desde pequeño, ser ingeniero informático. Gracias por estar ahí en los buenos y malos momentos de mi vida. Especial mención a todos los miembros del grupo DaME (Javier Segovia, Ernestina, Víctor, Oscar, Alex, etc.), por su trabajo, confianza, apoyo y colaboración, pero sobre todo, por su compañerismo y amistad. Y, claro está, agradecer a los compañeros del laboratorio de Sistemas Operativos, especialmente a Ramón, el aguantarme todos estos días en los que hemos estado haciendo el proyecto. También quiero agradecer a todos los miembros del Departamento de Arquitectura y Tecnología de Sistemas Informáticos el apoyo y la confianza depositada en mí, sin los cuales no habría podido llevar a cabo este proyecto. Gracias especialmente a Víctor, mi tutor, quien me ofreció la posibilidad de trabajar en el Laboratorio de Sistemas Operativos, y de realizar este proyecto. También quisiera destacar a Fernando y Chema, por su gran ayuda y amabilidad en todo momento. - iii -

8 AGRADECIMIENTOS Como olvidar a mis compañeros y amigos del grupo ISYS (Victor s, Mamen, Sandra, Nuria, Juanjo, Alex, etc.) a quienes agradezco su ánimo, consejo, confianza y amistad. Os tendré siempre en mi recuerdo. No debo olvidar a mis compañeros de colegio (Alfonso, Javier, Juan, etc.). Gracias por la amistad que, después de tantos años, permanecemos teniendo. Gracias por todos los sabios consejos y ánimos que me habéis estado dando en el transcurso del tiempo. Puede que me olvide de muchos nombres y lo lamento. Pero todos saben dónde guardo aquel momento de vida que compartí con ellos, que me acompañará el resto de mi vida, sin borrarse de mis recuerdos.

9 CONTENIDOS Contenidos SINOPSIS... I AGRADECIMIENTOS... III CONTENIDOS... V Índice de figuras... vii Índice de tablas... viii 1. INTRODUCCIÓN MDS Boole e ICC Arquitectura de ICC Niveles de Información Índices Tipologías Propensiones Objetivos Contenidos ESTADO DEL ARTE Mineria de Datos Alcance Fundamentos Generación de Modelos Ciclo CRISP-DM Algoritmos Heurísticos Búsqueda Local Recocido Simulado Algoritmos Genéticos Herramientas v -

10 CONTENIDOS Clementine R Project Lenguaje C# PostGres PREPROCESO DE DATOS Censo de Población y Viviendas Encuesta Continua de Presupuesto Familiares (ECPF) Carga de Datos del Censo Transformación de las Variables Variables demográficas comunes Índices derivados de la ECPF METODOLOGÍA DE AGRUPACIÓN Variables de interés Algoritmos de Optimización Algoritmo Genético Búsqueda Local Simulated Annealing Comparativa Cálculo de Índices Entrenamiento de modelos Estimación de Índices Validación de resultados GENERACIÓN DE TIPOLOGÍAS Y PROPENSIONES Generación de Tipologías Tipologías de ciclo de vida familiar Tipologías económicas Tipologías de gasto Proyección de tipologías en el Censo Cálculo de Propensiones Propensión de hipotecas Propensión de tenencia de segunda vivienda Propensión de posesión de segundo vehículo vi -

11 CONTENIDOS Propensión de compra de gama de automóvil CONCLUSIONES Y LÍNEAS FUTURAS Conclusiones Documentación Conocimientos Dificultades en el desarrollo Líneas Futuras BIBLIOGRAFÍA TRANSFORMACIÓN DE VARIABLES Índice de figuras Figura 2.1 Fases del modelo de proceso CRISP-DM Figura 2.2 Función de Enfriamiento Figura 2.3 Cruce en un punto Figura 2.4 Cruce en dos puntos Figura 2.5 Cruce uniforme Figura 2.6 Cruce aritmético Figura 2.7 Inversión de genes Figura 2.8 Cambio de orden Figura 2.9 Modificación de genes Figura 2.10 Selección por la regla de la ruleta Figura 2.11 Método del Ranking Figura 2.12 Arquitectura de Clementine Figura 2.13 Ejemplo de análisis con Clementine Figura 2.14 Una visión esquemática del funcionamiento de R Figura 2.15 Ejemplo de resolución gráfica de un análisis en R Figura 4.1 Factor de enfriamiento Figura 4.2 Condición de evaluación para Recocido Simulado Figura municipios con mayor población de la Comunidad de Madrid Figura municipios con mayor población del País Vasco Figura municipios con mayor población de Asturias Figura 5.1 Tipologías Económicas (Riqueza / ValorVivienda) Figura 5.2 Histograma asociado a la variable Valor Vivienda Figura 5.3 Histograma asociado a la variable Riqueza vii -

12 CONTENIDOS Figura 5.4 Histograma asociado a la variable Gasto...86 Figura 5.5 Distribución de tipos de gasto con escasa representatividad...88 Figura 5.6 Tipologías de Gasto (OcioCultura / Energía)...89 Figura 5.7 Histograma de la variable OcioCultura...90 Figura 5.8 Histograma de la variable Energía...90 Figura 5.9 Histograma de la variable Telecomunicaciones...90 Índice de tablas Tabla 4.1 Comparativa entre algoritmos de optimización...74 Tabla 4.2 Comunidad de Madrid...79 Tabla 4.3 País Vasco...80 Tabla 4.4 Asturias viii -

13 Parte I Introducción

14

15 1. INTRODUCCIÓN Capítulo 1 1. Introducción El proyecto surge, en la empresa MDS Boole, por la necesidad de explorar y desarrollar el conocimiento individual de los consumidores, el cual, se ha convertido en uno de los principales objetivos en la mayoría de las empresas que desean orientar sus actividades de marketing de forma más eficaz y rentable. La falta de información sobre nuestros propios clientes, y sobre los consumidores en general, es un importante obstáculo que impide saber más acerca de los potenciales consumidores a nivel individual. En el mejor de los casos, aquellas empresas que desarrollan sus actividades directamente con el consumidor, disponen de una información transaccional muy importante pero, en la mayoría de los casos, desconocen los aspectos descriptivos de cómo son sus clientes. Por el contrario, las empresas que desarrollan sus actividades a través de un canal de distribución sobre el que no tienen control directo, la transacción es anónima y el conocimiento sobre el transaccional de los clientes a nivel individual es inexistente. Se planteó, pues, desarrollar una herramienta (denominada ICC+), la cual, tiene por objeto el proporcionar colas de información que permitan, por un lado, enriquecer la información que dispone la empresa acerca de sus clientes, y por otro, proporcionar datos a nivel microgeográfico sobre los perfiles y comportamiento de consumo de la población española MDS Boole e ICC+ MDS es una empresa de servicios de Marketing, encargada de ayudar a compañías y empresas a obtener mejores resultados en sus departamentos de marketing. MDS posee tres filiales, una de las cuales se localiza en Madrid, denominada MDS Boole. Ésta última ha solicitado el desarrollo del proyecto ICC+ a partir de un documento descriptivo del mismo. ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo

16 1. INTRODUCCIÓN ICC+ [1] es una herramienta para el Marketing Inteligente, destinado a departamentos de marketing de empresas que comercializan con productos que van dirigidos al consumidor. Su contenido es información que le aporta un alto nivel de conocimiento para decidir a quien y donde dirigir las actividades, donde abrir puntos de venta, etc. La información que facilita ICC + está basada en los principios de la demografía, es decir, los individuos que viven en un mismo entorno tienen características y comportamientos similares. Con ello, se deduce que un individuo por el hecho de vivir en una determinada microárea geográfica se le puede asociar diferentes perfiles de consumidor, patrones y comportamientos de consumo. La información de ICC+ está referida a nivel de áreas censales, y por tanto existe información para cada una de las aproximadamente áreas censales en las que está dividida España. A partir de esta unidad geográfica es posible realizar diferentes tipos de agregaciones basadas en distintos criterios aunque uno de los más usados sea el de proximidad. Un área censal tiene como características destacables: Está formada, por término medio, por 400 familias Representa la mínima unidad de análisis con validez estadística del INE. Es un área geográfica estándar muy utilizado y extendido entre las empresas para la explotación de la información a nivel microgeográficos (ej.: planos digitales). La dirección postal tiene asociada un área censal específica, lo que permite asociar información de ICC+ de forma individual a registros de datos sólo partiendo de la dirección postal. Tiene una composición muy homogénea, lo que permite aplicar los principios de demografía con mayor precisión. Al utilizar datos agregados no nominales no le afecta la LOPD (Ley Orgánica de Protección de Datos) ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo

17 1. INTRODUCCIÓN 1.2. Arquitectura de ICC+ La información necesaria para realizar el producto ICC+ se obtiene a partir de dos conjuntos diferentes de datos: Censo de Población y Viviendas, con información demográfica de las secciones censales (grupos de 500 familias) actualizada con una frecuencia de 10 años Encuesta Continua de Presupuestos Familiares (ECPF), contiene información de consumo de una muestra de, aproximadamente, 9000 familias. A partir de estos conjuntos de datos es necesario estimar los cuatro niveles de información, los cuales son: Valores Demográficos: obtenidos directamente de los datos originales Índices Económicos Tipologías Propensiones Así pues, siguiendo el ciclo de vida CRISP-DM (que más adelante se comentará), podemos describir la herramienta ICC+ como un conjunto de 4 procesos conectados entre sí, los cuales son: Preproceso de Datos Agrupación de Datos Cálculo de Índices Cálculo de otros niveles de Información El punto clave del proyecto es obtener una estimación de los índices para todas las secciones censales. Para ello, se parte de los valores de la ECPF (transformados en índices) y se proyectan sobre el censo mediante modelos. No obstante, el primer inconveniente encontrado es la diferencia de los datos, es decir, los datos del Censo están representados a nivel de sección censal, y los datos de la ECPF están representados a nivel familiar. ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo

18 1. INTRODUCCIÓN Por lo que, primeramente debemos procesar dichos datos, agrupar las familias por sección censal para, más adelante, realizar el calculo de índices a nivel de sección censal. Para ello, necesitamos partir de datos que sean comunes entre el Censo de Población y la ECPF. Utilizando los datos originales procesados, los índices estimados, y otra información derivada (calculados al procesar los datos) es posible obtener el resto de los niveles de información necesarios: propensiones y tipologías Niveles de Información Para realizar el proyecto ICC+, es necesario obtener distintos niveles de información [1], ya que proporcionan bastante conocimiento sobre los consumidores. Estos niveles son los siguientes: Índices Tipologías Propensiones Índices Un índice es el valor que una determinada área censal adopta respecto a la media nacional y que está disponible para las siguientes variables de información: Índices Económicos: los índices económicos son estimaciones realizadas para cada área censal en base a las características de la población y de su entorno. Los índices económicos necesarios son los siguientes: o Renta: Indica la renta media familiar disponible anual (renta monetaria) por área censal, lo que representa flujos de entrada de dinero para la familia procedente de las diferentes fuentes generadoras de ingresos. o Capacidad de Gasto: Indica el consumo o gasto medio anual realizado por las familias por área censal y que representa flujos de salida de di ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo

19 1. INTRODUCCIÓN nero. Este indicador esta formado por las diferentes partidas o conceptos de gastos que recoge la Encuesta Continua de Presupuestos Familiares del INE (ECPF). o Endeudamiento: Indica la dificultad que las familias tienen para llegar a fin de mes. Se calcula como la diferencia (siempre negativa) de los flujos monetarios entrantes y salientes (ingresos y gastos, respectivamente). o Ahorro: Al contrario que el endeudamiento, indica la facilidad que tienes las familias para llegar a fin de mes. Se calcula como la diferencia entre ingresos y gastos. o Hipoteca (valor no estimado): Indica la proporción respecto a la media nacional de viviendas con deudas pendientes de pago respecto del total de las viviendas de un área censal. Se obtiene por observación directa de los datos del Censo del INE (viviendas con pagos pendientes). o Valor de la Vivienda: Muestra un índice, sobre la media nacional, del valor medio imputable a una vivienda en alquiler o en propiedad existente en una determinada área censal. Resulta de imputar el valor real de alquiler o el coste de oportunidad de una vivienda en propiedad. o Riqueza: Es la agregación de la renta familiar y el valor de la vivienda. Indica el nivel de riqueza medio familiar por área censal. Índices de Consumo: Estos indicadores muestran el nivel de gasto para determinados tipos de consumo realizados por término medio las familias españolas. Las diferentes partidas de gasto utilizadas para construir los índices de consumo se proporcionan siguiendo la clasificación elaborada por el INE. Esta clasificación se apoya en la utilizada en la OSCE para las Encuestas de Presupuestos Familiares de los hogares, que a su vez está basada en la clasificación ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo

20 1. INTRODUCCIÓN PROCOME a 2 dígitos del Sistema Europeo de Cuentas Económicas Integradas (SEC). En dicha nomenclatura, cada partida de gasto aparece asociada, excepto en casos excepcionales, a la actividad que lo produce Tipologías ICC+ realiza una clasificación de las familias en perfiles utilizando diferentes enfoques analíticos. La información que proporciona permite, para cada área censal, disponer de una caracterización (distribución en cada uno de los grupos tipológicos detectados) de la misma o bien una estructura de diferentes grupos. Las diferentes tipologías a obtener son las siguientes: Tipologías económicas: Realiza una clasificación de las familias en función de sus datos económicos (renta, gasto, ahorro, deuda, valor vivienda, etc.). El objetivo es clasificar las familias en grupos tipológicos de comportamiento económico (caracterización y grupos tipológicos existentes en cada área censal). Tipologías familiares: Muestra para cada área censal la estructura de tipologías de las diferentes familias (generadas a partir de la ECPF). Tipologías de distribución del gasto: Muestra las distintas tipologías de distribución del gasto de cada área censal. Tipologías de consumidores: Clasifica las áreas censales en función de su grado de similitud o parecido en cuanto a diferentes grupos de variables discriminantes y representativas del entorno. Cada una de las tipologías anteriores se generan a partir de un conjunto de variables escogidas según varios factores y objetivos: o o Descartar variables que estén altamente correlacionadas, seleccionando únicamente aquellas que se consideren altamente predictivas. Las variables deberán correlacionarse bien con el comportamiento del consumidor ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo

21 1. INTRODUCCIÓN o o o Las variables deberán tener el suficiente tamaño muestral para ser estadísticamente válidas. Las variables no deben estar fuertemente concentradas en un pequeño número de áreas geográficas. Algoritmos de proximidad de las secciones censales (ej.: el distrito municipal que es el siguiente nivel de agregación de las secciones censales) Propensiones Las propensiones expresan la probabilidad que tienen determinadas familias, situadas en un área censal, respecto a una serie de criterios:: Propensión Hipotecas: Indica la probabilidad de que las familias de una determinada área censal tengan la vivienda hipotecada. Propensión posesión Segunda Vivienda: Indica la probabilidad de posesión de una segunda vivienda por parte de las familias que residen en una determinada área censal. Adicionalmente, en el caso de disponer de esta segunda vivienda, se dispone de información de: o o Lugar de posesión: Lugares más probables de posesión, clasificado por provincias. Tiempo de uso: Muestra el tiempo medio de uso de la segunda vivienda. Propensión de posesión de 2 o más coches: Expresa la probabilidad de que las familias de una sección censal dispongan de más de un vehículo dentro del hogar. Propensión de compra de modelos de coches (valor estimado): Indica la probabilidad de una familia situada en una determinada área censal de compra/posesión de los diferentes segmentos de coches. ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo

22 1. INTRODUCCIÓN 1.4. Objetivos Se trata, pues, de aplicar el proceso CRISP-DM al análisis de los datos publicados por el UNE para la creación del producto ICC+. Este objetivo supone los siguientes subobjetivos: 1. Quiénes son mis clientes y dónde puedo encontrar otros similares? 2. Cuáles de mis mejores clientes pueden dejar de serlo? 3. Qué productos no compran mis clientes y podrían comprar? Las aplicaciones específicas de ICC+ se engloban en 4 grupos: Análisis de cartera de clientes: Analizar la composición de la cartera de clientes y determinar los grupos de clientes que son más interesantes para desarrollar actividades de fidelización, venta cruzada y/o riesgos de abandono/fuga. Identificación de potenciales clientes: Conociendo las características de los clientes es posible saber dónde encontrar clientes potenciales, cuántos son y cómo se distribuyen en cada uno de sus puntos de venta. Respuestas a Campañas: Identificar los clientes y prospectos que mejor responden a cada tipo de acción promocional y de marketing directo. Identificar la localización idónea de los puntos de venta: Conocer las áreas geográficas más beneficiosas y de mayor potencial para las compañías Contenidos En primer lugar, se presenta la introducción del proyecto, seguido del estado del arte, el cual, se describirá el proceso de Minería de Datos, su definición, y herramientas que nos permiten llevarla a cabo. Se describirá el ciclo de vida CRISP-DM, y dos herramientas utilizadas en este proyecto, Clementine y R-Project. Seguidamente, se describirá el análisis y preproceso de datos que comprende una descripción del origen de los datos, las operaciones de transformación (agrupar, modificar ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo

23 1. INTRODUCCIÓN nombres, etc.) sobre dichos datos para generar un conjunto de datos útil para las siguientes fases. Tras el preproceso de datos, se procederá a exponer la metodología de agrupación utilizada para agrupar familias de la ECPF. Se presentarán las variables que son interesantes para realizar la agrupación y los algoritmos planteados para realizarla, con una comparativa entre ellas. A continuación, se realizará el cálculo y proyección de todos los índices solicitados, a partir de los grupos generados por el algoritmo de agrupación. Una vez calculados y validados los índices, se crearán las tipologías y propensiones a partir del conjunto de datos inicial Para finalizar, se expondrán las conclusiones, valoraciones y experiencia adquirida durante la realización del proyecto. ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo

24

25 Parte II Estado del Arte

26

27 2. ESTADO DEL ARTE Capítulo 2 2. Estado del Arte La primera fase en el desarrollo de un proyecto es estudiar y comprender las tecnologías existentes para, más tarde, seleccionar las más apropiadas. En este caso, es necesario conocer qué es y para qué sirve la Minería de Datos [10], y el ciclo de vida estándar utilizado en este tipo de proyectos (CRISP-DM) [12]. También se describen los algoritmos heurísticos utilizados para realizar la agrupación de familias de la ECPF. Por último, se proporciona una breve descripción de las herramientas utilizadas en el transcurso del proyecto Mineria de Datos La tecnología disponible actualmente permite almacenar, transferir y gestionar información crítica dentro de una organización. Sin embargo, si esta información no se transforma en conocimiento útil, carece de valor. La minería de datos es el proceso de extracción de información significativa de cualquier conjunto de datos. Las técnicas de minería de datos revelarán tendencias y correlaciones ocultas que permitan una mejor comprensión de los datos, esto es, generar conocimiento útil. Por lo tanto, la minería de datos es un proceso de soporte al usuario. Esta tecnología ayuda a las organizaciones a centrarse en la información más significativa contenida en sus bases de datos corporativas. Mediante esta información es posible predecir nuevas perspectivas y situaciones futuras con mayor precisión, lo que facilita la toma de decisiones y, empleada de forma apropiada, podría suponer una ventaja competitiva. Los avances en la recolección de datos, el amplio uso de códigos de barras y la automatización de muchos negocios, tanto privados como gubernamentales, han generado una ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo

28 2. ESTADO DEL ARTE ingente cantidad de datos. El análisis de este volumen de datos ha generado una necesidad urgente de nuevas técnicas y herramientas que puedan asistir en la transformación automática e inteligente de toda esta información en conocimiento útil. Los avances en minería de datos y en el descubrimiento del conocimiento, han impulsado varios campos de investigación como la estadística basada en técnicas de lógica difusa, bases de datos universales, máquinas que aprenden e inteligencia artificial, todos ellos parte del creciente campo de minería de datos. La minería de datos tiene una serie de ventajas: Contribuye a facilitar la toma de decisiones tácticas y estratégicas proporcionando un procedimiento automatizado para identificar información clave desde volúmenes de datos generados por procesos tradicionales y de e-business. Permite dar prioridad a decisiones y acciones. Proporciona criterios que faciliten la toma de decisiones a los usuarios del negocio que mejor entienden el problema y el entorno. Habitualmente, genera modelos descriptivos. Permite que relaciones ocultas e identificadas a través del proceso de la minería de datos sean expresadas como reglas de negocio o modelos predictivos. Un sistema de minería de datos permite analizar factores de influencia en determinados procesos, predecir o estimar variables o comportamientos futuros, segmentar o agrupar ítems similares, además de obtener secuencias de eventos que provocan comportamientos específicos. La llegada de la minería de datos se considera como la última etapa de la introducción de métodos cuantitativos, científicos en el mundo del comercio, industria y negocios ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo

29 2. ESTADO DEL ARTE Alcance Dados conjuntos de datos de suficiente tamaño y calidad, la minería de datos puede generar nuevas oportunidades al proporcionar las siguientes capacidades: Predicción automatizada de tendencias y comportamientos: La minería de datos automatiza el proceso de encontrar información predecible en cantidades de datos de diverso tamaño. Preguntas que tradicionalmente requerían un intenso análisis manual, ahora pueden ser contestadas directa y rápidamente desde los datos. Descubrimiento automatizado de modelos previamente desconocidos: Las herramientas de minería de datos identifican modelos y relaciones ocultas en los datos analizados. Cuando son implementadas en sistemas de procesamiento paralelo de alto rendimiento, pueden analizar bases de datos masivas en minutos Fundamentos En la evolución desde los datos a información, cada nuevo paso se basa en el previo. Por ello, las técnicas de minería de datos son el resultado de largos procesos de investigación y desarrollo. Esta evolución comenzó cuando los datos de negocios fueron almacenados por primera vez en computadoras, continuó con mejoras en el acceso a los datos y, más recientemente, con mecanismos que permiten a los usuarios navegar a través de los datos en tiempo real. La minería de datos se sustenta en tres tecnologías que tienen suficiente madurez: Recolección masiva de datos Algoritmos de aprendizaje Potentes computadoras con multiprocesadores Estos componentes esenciales de la minería de datos han estado en desarrollo durante décadas en diferentes áreas de investigación: estadística, inteligencia artificial y aprendizaje automático. ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo

30 2. ESTADO DEL ARTE Hoy, la madurez de estas técnicas junto con los motores de bases de datos relacionales de alto rendimiento, hacen que la aplicación de estas tecnologías sea viable en los entornos actuales. Los sistemas de minería de datos suelen utilizar algoritmos procedentes de la inteligencia artificial o modelos matemáticos tales como: Redes neuronales artificiales: modelos predecibles no-lineales que aprenden a través del entrenamiento y se asemejan a la estructura de una red neuronal biológica. Árboles de decisión: estructuras en forma de árbol que representan conjuntos de decisiones. Estas decisiones generan reglas para la clasificación de un conjunto de datos. Método del vecino más cercano: técnica que clasifica cada registro en un conjunto de datos basado en una combinación de las clases de los k registros más cercanos a él en un conjunto de datos históricos. Regla de inducción: extracción de reglas if-then de datos basados en significado estadístico. Algoritmos heurísticos: técnicas de optimización que usan procesos como combinaciones genéticas, mutaciones y selección natural en un diseño basado en los conceptos de evolución. Muchas de estas técnicas han estado en desarrollo durante más de una década en herramientas de análisis especializadas que trabajan con volúmenes de datos relativamente pequeños. Estas capacidades están ahora evolucionando para integrarse directamente con herramientas OLAP y de Data Warehousing Generación de Modelos El modelado es la técnica usada en minería de datos para construir un modelo capaz de explicar una situación en la que se conoce la respuesta para, posteriormente, aplicarlo en aquellas situaciones en las que dicha respuesta es desconocida ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo

31 2. ESTADO DEL ARTE Para ello, las computadoras se cargan con mucha información acerca de una variedad de situaciones donde la respuesta es conocida a priori (algoritmos de aprendizaje supervisado). Posteriormente, los algoritmos de aprendizaje investigarán esta información, distinguiendo entre las distintas características, y construirán un modelo. Una vez este modelo ha sido construido, puede ser usado en situaciones similares en las que la respuesta no es desconocida. Para estimar la precisión del modelo se aplican técnicas de validación. Una de las más empleadas consiste en excluir un conjunto de las situaciones conocidas en el entrenamiento del modelo y aplicarles el modelo resultante. De esta forma es posible comparar la respuesta real conocida con la generada por el modelo Ciclo CRISP-DM CRISP-DM (CRoss Industry Standard Process for DataMining) surgió por iniciativa de Daimler Chrysler a finales de 1996 y tuvo éxito al basarse en la experiencia práctica del mundo real; de cómo los profesionales, tales como los médicos, trabajaban en proyectos basados en la experiencia, para de este modo obtener mejores resultados. CRISP-DM es una metodología estándar para la realización de proyectos de minería de datos que reduce el tiempo de recuperación de la inversión realizada. El modelo de proceso proporciona una descripción del ciclo de vida de un proyecto, conteniendo sus correspondientes fases, tareas y las relaciones entre estas tareas. No es posible identificar a este nivel de descripción todas las relaciones, al existir éstas probablemente entre todas las tareas existentes dependiendo de los objetivos, motivos, intereses de los usuarios y, por supuesto, de los datos. A continuación, se muestra el ciclo de vida de un proyecto de minería de datos, consistente en 6 fases cuya secuencia no es estricta sino dependiente del resultado de la última fase llevada a cabo. El círculo externo simboliza la naturaleza cíclica de la minería de datos y las flechas pequeñas indican las dependencias más importantes y frecuentes entre fases. ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo

Algoritmos genéticos como métodos de aproximación analítica y búsqueda de óptimos locales

Algoritmos genéticos como métodos de aproximación analítica y búsqueda de óptimos locales Algoritmos genéticos como métodos de aproximación analítica y búsqueda de óptimos locales Jorge Salas Chacón A03804 Rubén Jiménez Goñi A93212 Juan Camilo Carrillo Casas A91369 Marco Vinicio Artavia Quesada

Más detalles

Algoritmos Genéticos.

Algoritmos Genéticos. Algoritmos Genéticos. Miguel Cárdenas Montes, Antonio Gómez Iglesias Centro de Investigaciones Energéticas Medioambientales y Tecnológicas, Madrid, Spain miguel.cardenas@ciemat.es 15-19 de Octubre de 2011

Más detalles

Desarrollo de un sistema capaz de optimizar rutas de entrega utilizando algoritmos genéticos

Desarrollo de un sistema capaz de optimizar rutas de entrega utilizando algoritmos genéticos MT 6 Desarrollo de un sistema capaz de optimizar rutas de entrega utilizando algoritmos genéticos Rosario Baltazar 1 Judith Esquivel Vázquez 2 Andrea Rada 3 Claudia Díaz 4 Resumen Durante los últimos 15

Más detalles

HADES: Hidrocarburos Análisis de Datos de Estaciones de Servicio

HADES: Hidrocarburos Análisis de Datos de Estaciones de Servicio Hidrocarburos: Análisis de Pablo Burgos Casado (Jefe de Área Desarrollo (SGTIC - MITYC)) María Teresa Simino Rueda Rubén Pérez Gómez Israel Santos Montero María Ángeles Rodelgo Sanchez 1. INTRODUCCIÓN

Más detalles

Búsqueda Local. cbea (LSI-FIB-UPC) Inteligencia Artificial Curso 2011/2012 1 / 33

Búsqueda Local. cbea (LSI-FIB-UPC) Inteligencia Artificial Curso 2011/2012 1 / 33 Introducción Búsqueda Local A veces el camino para llegar a la solución no nos importa, buscamos en el espacio de soluciones Queremos la mejor de entre las soluciones posibles alcanzable en un tiempo razonable

Más detalles

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003 MINERÍA DE DATOS Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE Octubre - 2003 CONTENIDO Qué es Data Warehousing Data Warehouse Objetivos del Data Warehouse

Más detalles

Métodos evolutivos de Optimización. Prof. Cesar de Prada Dpto. Ingeneiria de Sitemas y Automática Universidad de Valladolid

Métodos evolutivos de Optimización. Prof. Cesar de Prada Dpto. Ingeneiria de Sitemas y Automática Universidad de Valladolid Métodos evolutivos de Optimización Prof. Cesar de Prada Dpto. Ingeneiria de Sitemas y Automática Universidad de Valladolid Indice Introducción Método de Montecarlo Algoritmos genéticos Tabú Search Simulated

Más detalles

FORMULACIÓN DE UN ALGORITMO GENÉTICO PARA EL PROBLEMA DE PROGRAMACIÓN DE ÓRDENES DE TRABAJO DE UNA EMPRESA DE ARTES GRÁFICAS

FORMULACIÓN DE UN ALGORITMO GENÉTICO PARA EL PROBLEMA DE PROGRAMACIÓN DE ÓRDENES DE TRABAJO DE UNA EMPRESA DE ARTES GRÁFICAS FORMULACIÓN DE UN ALGORITMO GENÉTICO PARA EL PROBLEMA DE PROGRAMACIÓN DE ÓRDENES DE TRABAJO DE UNA EMPRESA DE ARTES GRÁFICAS PROYECTO DE GRADO Javier mauricio gamboa salgado Código: 544004 John alexander

Más detalles

Definición de status. Actualizado y Evolutivo

Definición de status. Actualizado y Evolutivo Definición de status Es un indicador del nivel de renta neta disponible, en el hogar de residencia de cada persona física, respecto al conjunto total de hogares de su entorno geográfico. Dinámico El índice

Más detalles

Proyecto técnico MINERÍA DE DATOS. Febrero 2014. www.osona-respon.net info@osona-respon.net

Proyecto técnico MINERÍA DE DATOS. Febrero 2014. www.osona-respon.net info@osona-respon.net Proyecto técnico MINERÍA DE DATOS Febrero 2014 www.osona-respon.net info@osona-respon.net 0. Índice 0. ÍNDICE 1. INTRODUCCIÓN... 2 2. LOS DATOS OCULTOS... 3 2.1. Origen de la información... 3 2.2. Data

Más detalles

ALGORITMOS GENÉTICOS

ALGORITMOS GENÉTICOS Arranz de la Peña, Jorge Universidad Carlos III 100025106@alumnos.uc3m.es ALGORITMOS GENÉTICOS Parra Truyol, Antonio Universidad Carlos III 100023822@alumnos.uc3m.es En este documento se pretende analizar

Más detalles

Parte I: Introducción

Parte I: Introducción Parte I: Introducción Introducción al Data Mining: su Aplicación a la Empresa Cursada 2007 POR QUÉ? Las empresas de todos los tamaños necesitan aprender de sus datos para crear una relación one-to-one

Más detalles

Data Mining Técnicas y herramientas

Data Mining Técnicas y herramientas Data Mining Técnicas y herramientas Introducción POR QUÉ? Empresas necesitan aprender de sus datos para crear una relación one-toone con sus clientes. Recogen datos de todos lo procesos. Datos recogidos

Más detalles

Identificación fácil de los clientes adecuados

Identificación fácil de los clientes adecuados PASW Direct Marketing 18 Especificaciones Identificación fácil de los clientes adecuados Sabemos que le gustaría que sus programas de marketing sean lo más rentables posible y sabemos que conocer la información

Más detalles

CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN.

CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN. SISTEMA EDUCATIVO inmoley.com DE FORMACIÓN CONTINUA PARA PROFESIONALES INMOBILIARIOS. CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN. Business Intelligence. Data Mining. PARTE PRIMERA Qué es

Más detalles

Minería de datos (Introducción a la minería de datos)

Minería de datos (Introducción a la minería de datos) Minería de datos (Introducción a la minería de datos) M. en C. Sergio Luis Pérez Pérez UAM CUAJIMALPA, MÉXICO, D. F. Trimestre 14-I. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 1 / 24

Más detalles

Introducción a los Algoritmos Genéticos. Tomás Arredondo Vidal 17/4/09

Introducción a los Algoritmos Genéticos. Tomás Arredondo Vidal 17/4/09 Introducción a los Algoritmos Genéticos Tomás Arredondo Vidal 17/4/09 Esta charla trata de lo siguiente: Introducción a algunos aspectos de los algoritmos genéticos. Introducción a algunas aplicaciones

Más detalles

OPTIMIZACIÓN DE TRANSFORMACIONES LINEALES DE DATOS MEDIANTE BUSQUEDA LOCAL

OPTIMIZACIÓN DE TRANSFORMACIONES LINEALES DE DATOS MEDIANTE BUSQUEDA LOCAL OPTIMIZACIÓN DE TRANSFORMACIONES LINEALES DE DATOS MEDIANTE BUSQUEDA LOCAL INGENIERIA INFORMATICA AUTOR: FRANCISCO GODOY MUÑOZ-TORRERO TUTOR: JOSE MARIA VALLS FERRAN CO-DIRECTOR: RICARDO ALER MUR Contenidos

Más detalles

Algoritmos Genéticos Y

Algoritmos Genéticos Y Algoritmos Genéticos Y Optimización n Heurística Dr. Adrian Will Grupo de Aplicaciones de Inteligencia Artificial Universidad Nacional de Tucumán awill@herrera.unt.edu.ar Operadores de Mutación El operador

Más detalles

UTgeNes - Framework para Implementación y Estudio de Algoritmos

UTgeNes - Framework para Implementación y Estudio de Algoritmos UTgeNes - Framework para Implementación y Estudio de Algoritmos Genéticos Abstract UTgeNes es un framework para la implementación y estudio de algoritmos genéticos propuesto para la realización de trabajos

Más detalles

Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322

Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322 Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322 Nicole García Gómez 2830047-6 Diego Riquelme Adriasola 2621044-5 RESUMEN.- La minería de datos corresponde a la extracción

Más detalles

Introducción a la Minería de Datos (Data Mining)

Introducción a la Minería de Datos (Data Mining) a la Minería de Datos (Data Mining) IT-Nova Facultad de Ingeniería Informática y Telecomunicaciones Iván Amón Uribe, MSc Minería de Datos Diapositivas basadas parcialmente en material de Inteligencia Analítica

Más detalles

Inteligencia en Redes de Comunicaciones. Tema 7 Minería de Datos. Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda

Inteligencia en Redes de Comunicaciones. Tema 7 Minería de Datos. Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda Inteligencia en Redes de Comunicaciones Tema 7 Minería de Datos Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda {jvillena, rcrespo, rueda}@it.uc3m.es Índice Definición y conceptos

Más detalles

MINERIA DE DATOS Y Descubrimiento del Conocimiento

MINERIA DE DATOS Y Descubrimiento del Conocimiento MINERIA DE DATOS Y Descubrimiento del Conocimiento UNA APLICACIÓN EN DATOS AGROPECUARIOS INTA EEA Corrientes Maximiliano Silva La información Herramienta estratégica para el desarrollo de: Sociedad de

Más detalles

Introducción a los Algoritmos Genéticos

Introducción a los Algoritmos Genéticos Introducción a los Algoritmos Genéticos Francisco José Ribadas Pena INTELIGENCIA ARTIFICIAL 5 Informática ribadas@uvigo.es 17 de octubre de 2005 c FJRP 2005 ccia IA Métodos de 8 < : 1 Introducción 9 =

Más detalles

9.1.Los sistemas expertos. 9.2.Las redes neuronales artificiales. 9.3.Sistemas de inducción de reglas y árboles de decisión.

9.1.Los sistemas expertos. 9.2.Las redes neuronales artificiales. 9.3.Sistemas de inducción de reglas y árboles de decisión. TEMA 9 TÉCNICAS DE INTELIGENCIA ARTIFICIAL PARA EL ANÁLISIS DE LA INFORMACIÓN CONTABLE 9.1.Los sistemas expertos. 9.2.Las redes neuronales artificiales. 9.3.Sistemas de inducción de reglas y árboles de

Más detalles

Aplicaciones prácticas de Minería de Datos con IBM SPSS Modeler

Aplicaciones prácticas de Minería de Datos con IBM SPSS Modeler Álvaro J. Méndez Services Engagement Manager IBM SPSS / Profesor Econometría UAM Jecas, 22 Oct 2010 Aplicaciones prácticas de Minería de Datos con IBM SPSS Modeler Business Analytics software Agenda Minería

Más detalles

MINERÍA DE DATOS Y DESCUBRIMIENTO DE CONOCIMIENTO (DATA MINING AND KNOWLEDGE DISCOVERY)

MINERÍA DE DATOS Y DESCUBRIMIENTO DE CONOCIMIENTO (DATA MINING AND KNOWLEDGE DISCOVERY) MINERÍA DE DATOS Y DESCUBRIMIENTO DE CONOCIMIENTO (DATA MINING AND KNOWLEDGE DISCOVERY) Autor: Lic. Manuel Ernesto Acosta Aguilera Entidad: Facultad de Economía, Universidad de La Habana Dirección: Edificio

Más detalles

v.1.0 Clase 5 Docente: Gustavo Valencia Zapata

v.1.0 Clase 5 Docente: Gustavo Valencia Zapata v.1.0 Clase 5 Docente: Gustavo Valencia Zapata Temas Clase 5: Conceptos de Minería de Datos Herramientas de DM Referencias Minería de datos Proceso de DM www.gustavovalencia.com Minería de datos La minería

Más detalles

Algoritmos Genéticos. Introduccion a la Robótica Inteligente

Algoritmos Genéticos. Introduccion a la Robótica Inteligente Algoritmos Genéticos Introduccion a la Robótica Inteligente 7 Marzo 2014 (IRIN) AGs 7/03/2014 1 / 43 Índice 1 Introducción 2 Algoritmos Genéticos 3 Algunos Fundamentos Matemáticos 4 Conclusiones (IRIN)

Más detalles

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING Aprendizaje Automático y Data Mining Bloque IV DATA MINING 1 Índice Definición y aplicaciones. Grupos de técnicas: Visualización. Verificación. Descubrimiento. Eficiencia computacional. Búsqueda de patrones

Más detalles

Introducción a la Computación Evolutiva

Introducción a la Computación Evolutiva Introducción a la Computación Evolutiva Sección de Computación CINVESTAV-IPN Av. IPN No. 2508 Col. San Pedro Zacatenco México, D.F. 07300 email: ccoello@cs.cinvestav.mx http: //delta.cs.cinvestav.mx/~ccoello

Más detalles

EPB 603 Sistemas del Conocimiento!"#$ %& $ %'

EPB 603 Sistemas del Conocimiento!#$ %& $ %' Metodología para el Desarrollo de Proyectos en Minería de Datos CRISP-DM EPB 603 Sistemas del Conocimiento!"#$ %& $ %' Modelos de proceso para proyectos de Data Mining (DM) Son diversos los modelos de

Más detalles

Minería de Datos. Vallejos, Sofia

Minería de Datos. Vallejos, Sofia Minería de Datos Contenido Introducción: Inteligencia de negocios (Business Intelligence). Componentes Descubrimiento de conocimiento en bases de datos (KDD). Minería de Datos: Perspectiva histórica. Fases

Más detalles

APOYO PARA LA TOMA DE DECISIONES

APOYO PARA LA TOMA DE DECISIONES APOYO PARA LA TOMA DE DECISIONES Cátedra: Gestión de Datos Profesor: Santiago Pérez Año: 2006 Bibliografía: Introducción a las Bases de Datos. DATE - 1 - 1. INTRODUCCION APOYO PARA LA TOMA DE DECISIONES

Más detalles

SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA

SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA Qué es inteligencia de negocios? (BI) Business Intelligence es la habilidad para transformar los datos en información, y la información en

Más detalles

Algoritmos Genéticos

Algoritmos Genéticos Introducción a la Computación Evolutiva Tercera Clase: Algoritmos Genéticos Algoritmos Genéticos Desarrollados en USA durante los años 70 Autores principales: J. Holland, K. DeJong, D. Goldberg Aplicados

Más detalles

Minería de Datos. Vallejos, Sofia

Minería de Datos. Vallejos, Sofia Minería de Datos Vallejos, Sofia Contenido Introducción: Inteligencia de negocios (Business Intelligence). Descubrimiento de conocimiento en bases de datos (KDD). Minería de Datos: Perspectiva histórica.

Más detalles

Algoritmos Genéticos. Algoritmos Genéticos. Introducción a la Computación Evolutiva. Tercera Clase: Algoritmos Genéticos

Algoritmos Genéticos. Algoritmos Genéticos. Introducción a la Computación Evolutiva. Tercera Clase: Algoritmos Genéticos Introducción a la Computación Evolutiva Tercera Clase: Algoritmos Genéticos Algoritmos Genéticos Desarrollados en USA durante los años 70 Autores principales: J. Holland, K. DeJong, D. Goldberg Aplicados

Más detalles

Procesamiento Digital de Imágenes. Pablo Roncagliolo B. Nº 22. Algoritmos Genéticos. prb@2007 2

Procesamiento Digital de Imágenes. Pablo Roncagliolo B. Nº 22. Algoritmos Genéticos. prb@2007 2 Procesamiento Digital de Imágenes Pablo Roncagliolo B. Nº 22 prb@2007 2 1 El núcleo de cada célula humana contiene una base de datos química. Esta base de datos contiene todas las instrucciones que la

Más detalles

TÉCNICAS DE MINERÍA DE DATOS Y TEXTO APLICADAS A LA SEGURIDAD AEROPORTUARIA

TÉCNICAS DE MINERÍA DE DATOS Y TEXTO APLICADAS A LA SEGURIDAD AEROPORTUARIA TÉCNICAS DE MINERÍA DE DATOS Y TEXTO APLICADAS A LA SEGURIDAD AEROPORTUARIA MSC ZOILA RUIZ VERA Empresa Cubana de Aeropuertos y Servicios Aeronáuticos Abril 2010 ANTECEDENTES El proyecto Seguridad es una

Más detalles

Habits España Geomarketing y segmentación

Habits España Geomarketing y segmentación Habits España Geomarketing y segmentación Qué es Habits? Habits es una base de datos que contiene una completa descripción de la población española y su precisa localización geográfica. Esta información

Más detalles

BUSINESS INTELLIGENCE. www.sbi-technology.com

BUSINESS INTELLIGENCE. www.sbi-technology.com BUSINESS INTELLIGENCE www.sbi-technology.com SBI Technology SRL Maipú 1492 Piso 2 S2000CGT - Rosario Rep. Argentina Tel: (54 341) 530 0815 www.sbi-technology.com Copyright - SBI Technology SRL - Todos

Más detalles

PORTFOLIO APLICA.DÀT. Business Intelligence. Que veo y que hay

PORTFOLIO APLICA.DÀT. Business Intelligence. Que veo y que hay Soluciones de Gestión para extraer provecho de los datos. (Business Intelligence, Cuadro de Mando i Calidad de datos) Que veo y que hay PORTFOLIO Business Intelligence Tiene infinidad de datos. No tiene

Más detalles

CONSTRUCCION DE INDICADORES DE GESTION Y HERRAMIENTAS OLAP PARA PEQUEÑAS Y MEDIANAS EMPRESAS

CONSTRUCCION DE INDICADORES DE GESTION Y HERRAMIENTAS OLAP PARA PEQUEÑAS Y MEDIANAS EMPRESAS CONSTRUCCION DE INDICADORES DE GESTION Y HERRAMIENTAS OLAP PARA PEQUEÑAS Y MEDIANAS EMPRESAS 1. RESEÑA HISTORICA Las exigencias competitivas del mercado hacen que las organizaciones busquen mecanismos

Más detalles

Minería de Datos. Universidad Politécnica de Victoria

Minería de Datos. Universidad Politécnica de Victoria Minería de Datos Universidad Politécnica de Victoria 1 Motivación Nuevas Necesidades del Análisis de Grandes Volúmenes de Datos El aumento del volumen y variedad de información que se encuentra informatizada

Más detalles

Introducción a la Minería de Datos

Introducción a la Minería de Datos Introducción a la Minería de Datos Abdelmalik Moujahid, Iñaki Inza y Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Índice 1 Minería de

Más detalles

LOS CINCO GRADOS DE MADUREZ DE UN PROYECTO BI

LOS CINCO GRADOS DE MADUREZ DE UN PROYECTO BI LOS CINCO GRADOS DE MADUREZ DE UN PROYECTO BI INTRODUCCIÓN Se habla en multitud de ocasiones de Business Intelligence, pero qué es realmente? Estoy implementando en mi organización procesos de Business

Más detalles

DESARROLLO DE SOFTWARE CON CALIDAD PARA UNA EMPRESA

DESARROLLO DE SOFTWARE CON CALIDAD PARA UNA EMPRESA DESARROLLO DE SOFTWARE CON CALIDAD PARA UNA EMPRESA Resumen AUTORIA CARLOS CABALLERO GONZÁLEZ TEMATICA INFORMÁTICA ETAPA ESO-BACHILLERATO-CFGM(ESI,ASI,DSI) Se describe la revolución que supuso la incursión

Más detalles

Identificación rápida de cuellos de botella: Una mejor manera de realizar pruebas de carga. Documento técnico de Oracle Junio de 2009

Identificación rápida de cuellos de botella: Una mejor manera de realizar pruebas de carga. Documento técnico de Oracle Junio de 2009 Identificación rápida de cuellos de botella: Una mejor manera de realizar pruebas de carga Documento técnico de Oracle Junio de 2009 Identificación rápida de cuellos de botella: Una mejor manera de realizar

Más detalles

? 50 30 20 20 emplear NA 0,788 0,367879 se queda s a 150 275 70-125 se pone s en s a 15 58 200-43 se pone s en s a

? 50 30 20 20 emplear NA 0,788 0,367879 se queda s a 150 275 70-125 se pone s en s a 15 58 200-43 se pone s en s a 350 MR Versión 1 1 Prueba Parcial 1/5 UNIVERSIDAD NACIONAL ABIERTA VICERRECTORADO ACADÉMICO ÁREA: INGENIERÍA MODELO DE RESPUESTA ASIGNATURA: Computación Evolutiva CÓDIGO: 350 MOMENTO: Primera Parcial VERSIÓN:

Más detalles

Computación Evolutiva: Técnicas de Selección

Computación Evolutiva: Técnicas de Selección Computación Evolutiva: Técnicas de Selección Dr. Gregorio Toscano Pulido Laboratorio de Tecnologías de Información Centro de Investigación y de Estudios Avanzados del IPN Cinvestav-Tamaulipas Dr. Gregorio

Más detalles

Cómo ganar con una solución intuitiva de Business Intelligence para las medianas empresas

Cómo ganar con una solución intuitiva de Business Intelligence para las medianas empresas Resumen de producto SAP Soluciones SAP para pequeñas y medianas empresas SAP BusinessObjects Business Intelligence, Edge Edition Objetivos Cómo ganar con una solución intuitiva de Business Intelligence

Más detalles

La investigación de mercado VÍA CONTACT CENTER DOSSIER >>

La investigación de mercado VÍA CONTACT CENTER DOSSIER >> STOCK PHOTOS La investigación de mercado VÍA CONTACT CENTER La encuesta telefónica es la fórmula utilizada por el contact center para la realización de investigación de mercado (fundamentalmente de campo);

Más detalles

Comparación de modelos de curvas ROC para la evaluación de procedimientos estadísticos de predicción en investigación de mercados.

Comparación de modelos de curvas ROC para la evaluación de procedimientos estadísticos de predicción en investigación de mercados. Comparación de modelos de curvas ROC para la evaluación de procedimientos estadísticos de predicción en investigación de mercados. Pedro Concejero Cerezo Tesis Doctoral dirigida por Rosario Martínez Arias

Más detalles

Temario III Algoritmos Combinatorios y Metaheurísticas

Temario III Algoritmos Combinatorios y Metaheurísticas Temario III Algoritmos Combinatorios y Metaheurísticas Verificación y Validación de Software UNCo 1 Contenidos Combinación de Datos de Test Algoritmos Combinatorios Metaheurísticas Búsqueda Tabú Algoritmos

Más detalles

Revista Facultad de Ingeniería Universidad de Antioquia ISSN: 0120-6230 revista.ingenieria@udea.edu.co Universidad de Antioquia Colombia

Revista Facultad de Ingeniería Universidad de Antioquia ISSN: 0120-6230 revista.ingenieria@udea.edu.co Universidad de Antioquia Colombia Revista Facultad de Ingeniería Universidad de Antioquia ISSN: 0120-6230 revista.ingenieria@udea.edu.co Universidad de Antioquia Colombia Tabares, Héctor; Hernández, Jesús Pronóstico puntos críticos de

Más detalles

1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2.

1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2. 1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2. GENERALIDADES SOBRE LAS TÉCNICAS DE INVESTIGACIÓN SOCIAL Y DE MERCADOS

Más detalles

LA GESTIÓN DEL CONOCIMIENTO

LA GESTIÓN DEL CONOCIMIENTO Plan de Formación 2006 ESTRATEGIAS Y HABILIDADES DE GESTIÓN DIRECTIVA MÓDULO 9: 9 LA ADMINISTRACIÓN ELECTRÓNICA EN LA SOCIEDAD DE LA INFORMACIÓN LA GESTIÓN DEL CONOCIMIENTO José Ramón Pereda Negrete Jefe

Más detalles

Algoritmos Genéticos Y

Algoritmos Genéticos Y Algoritmos Genéticos Y Optimización n Heurística Dr. Adrian Will Grupo de Aplicaciones de Inteligencia Artificial Universidad Nacional de Tucumán awill@herrera.unt.edu.ar Algoritmos Genéticos - Operadores

Más detalles

INTRODUCCIÓN A LA INTELIGENCIA ARTIFICIAL: LOS SISTEMAS EXPERTOS

INTRODUCCIÓN A LA INTELIGENCIA ARTIFICIAL: LOS SISTEMAS EXPERTOS Introducción a los Sistemas Expertos 1 INTRODUCCIÓN A LA INTELIGENCIA ARTIFICIAL: LOS SISTEMAS EXPERTOS ÍNDICE 1. INTRODUCCIÓN. EVOLUCIÓN HISTÓRICA 2. DEFINICIÓN Y CARACTERÍSTICAS DE LOS SE. 3. TIPOS Y

Más detalles

Programación Genética

Programación Genética Programación Genética Programación Genética consiste en la evolución automática de programas usando ideas basadas en la selección natural (Darwin). No sólo se ha utilizado para generar programas, sino

Más detalles

PROGRAMA DEL DIPLOMADO DE PROCESO BENCHMARKING. TEMA 7. MANEJO DE LA INFORMACIÓN.

PROGRAMA DEL DIPLOMADO DE PROCESO BENCHMARKING. TEMA 7. MANEJO DE LA INFORMACIÓN. PROGRAMA DEL DIPLOMADO DE PROCESO BENCHMARKING. TEMA 7. MANEJO DE LA INFORMACIÓN. Objetivo: Al final de la unidad el alumno comprenderá la presencia de estas herramientas informáticas (programas Datamining))

Más detalles

POSIBLE APLICACIÓN DE LA MINERÍA DE TEXTOS A LOS TRABAJOS DE LA COMISIÓN MINISTERIAL DE INFORMÁTICA

POSIBLE APLICACIÓN DE LA MINERÍA DE TEXTOS A LOS TRABAJOS DE LA COMISIÓN MINISTERIAL DE INFORMÁTICA POSIBLE APLICACIÓN DE LA MINERÍA DE TEXTOS A LOS TRABAJOS DE LA COMISIÓN MINISTERIAL DE INFORMÁTICA M.ª del Pilar Cantero Blanco Jefa de Servicio de Sistemas Informáticos. Subdirección General de Planificación

Más detalles

CICLO DE VIDA DEL SOFTWARE. Una aproximación lógica a la adquisición, el suministro, el desarrollo, la explotación y el mantenimiento del software

CICLO DE VIDA DEL SOFTWARE. Una aproximación lógica a la adquisición, el suministro, el desarrollo, la explotación y el mantenimiento del software 3.010 CONCEPTO DE CICLO DE VIDA Una aproximación lógica a la adquisición, el suministro, el desarrollo, la explotación y el mantenimiento del software IEEE 1074 Un marco de referencia que contiene los

Más detalles

1.1 Titulo Descriptivo del Proyecto

1.1 Titulo Descriptivo del Proyecto 1.1 Titulo Descriptivo del Proyecto Diseño de un Manual empleando Data Mining (Minería de Datos) para predecir el Potencial de Desarrollo de las empresas en la Zona Oriental asociadas a la Comisión Nacional

Más detalles

Pero que es el Data Mining? Como esta tecnología puede resolver los problemas diarios de las organizaciones? Cuál es el ciclo de vida de un DM?

Pero que es el Data Mining? Como esta tecnología puede resolver los problemas diarios de las organizaciones? Cuál es el ciclo de vida de un DM? Introducción En vista de los comentarios y sugerencias que nos hicieron, via mail y por chat, sobre la posibilidad de la creación de nuevo conocimiento, he creido conveniente introducir el tema Data Mining

Más detalles

Un algoritmo genético híbrido para resolver el EternityII. Rico, Martin; Ros, Rodrigo Directora: Prof. Dra. Irene Loiseau

Un algoritmo genético híbrido para resolver el EternityII. Rico, Martin; Ros, Rodrigo Directora: Prof. Dra. Irene Loiseau Un algoritmo genético híbrido para resolver el EternityII Rico, Martin; Ros, Rodrigo Directora: Prof. Dra. Irene Loiseau Temas Temas Introducción Eternity II Historia Descripción Demo Metaheurísticas Algoritmos

Más detalles

Introducción al DataMining

Introducción al DataMining Introducción al DataMining Lluís Garrido garrido@ecm.ub.es Universitat de Barcelona Índice Qué es el DataMining? Qué puede hacer el DataMining? Cómo hacer el DataMining? Técnicas Metodología del DataMining

Más detalles

E-data. Transformando datos en información con Data Warehousing

E-data. Transformando datos en información con Data Warehousing Federico Plancarte Sánchez E-data. Transformando datos en información con Data Warehousing Tema 2 El soporte a la Decisión 2-1 Evolución del soporte a la decisión Diversas categorías del análisis del DS

Más detalles

Ingeniería Energética E-ISSN: 1815-5901 orestes@cipel.ispjae.edu.cu. Instituto Superior Politécnico José Antonio Echeverría. Cuba

Ingeniería Energética E-ISSN: 1815-5901 orestes@cipel.ispjae.edu.cu. Instituto Superior Politécnico José Antonio Echeverría. Cuba Ingeniería Energética E-ISSN: 1815-5901 orestes@cipel.ispjae.edu.cu Instituto Superior Politécnico José Antonio Echeverría Cuba Carvajal- Pérez, Raúl Nicolás Un Algoritmo Genético Especializado en Planeamiento

Más detalles

Contenido. Horizontes temporales de la previsión La influencia del ciclo de vida del producto

Contenido. Horizontes temporales de la previsión La influencia del ciclo de vida del producto Previsión Contenido Qué es la previsión? Horizontes temporales de la previsión La influencia del ciclo de vida del producto Tipos de previsiones La importancia estratégica de la previsión Recursos humanos

Más detalles

Ingeniería de Software I

Ingeniería de Software I Ingeniería de Software I Agenda Objetivo. Unidades de aprendizaje. Formas de evaluación. Bibliografía. 2 Datos del profesor Correo electrónico: egonzalez@upemor.edu.mx Asesorías Jueves de 11:00 a 13:00

Más detalles

Representación, Codificación en un AG Población Inicial. Aptitud. Estrategia de Selección. Cruce, Mutación, Reemplazo. Condición de Parada.

Representación, Codificación en un AG Población Inicial. Aptitud. Estrategia de Selección. Cruce, Mutación, Reemplazo. Condición de Parada. Computación n Evolutiva: Algoritmos Genéticos 1.- Metaheurísticos. Computación Evolutiva: Algoritmos Genéticos 2.- Conceptos principales de un Algoritmo Genético 3.- Estructura de un Algoritmo Genético

Más detalles

Planos de ejecución en Velneo V7

Planos de ejecución en Velneo V7 Planos de ejecución en Velneo V7 Por Jesús Arboleya Introducción 3 Arquitectura Cliente/Servidor 4 1. Objetos que siempre se ejecutan en el servidor 5 2. Objetos que siempre se ejecutan en el cliente 6

Más detalles

Desarrollo de algoritmos genéticos, de recocido simulado e híbridos para la planificación de un taller flexible

Desarrollo de algoritmos genéticos, de recocido simulado e híbridos para la planificación de un taller flexible X Congreso de Ingeniería de Organización Valencia, 7 y 8 de septiembre de 2006 Desarrollo de algoritmos genéticos, de recocido simulado e híbridos para la planificación de un taller flexible Sara Lumbreras

Más detalles

Capítulo 1. Introducción

Capítulo 1. Introducción Capítulo 1. Introducción El WWW es la mayor fuente de imágenes que día a día se va incrementando. Según una encuesta realizada por el Centro de Bibliotecas de Cómputo en Línea (OCLC) en Enero de 2005,

Más detalles

MATERIAL DE APOYO CASO PRÁCTICO SISTEMA INTEGRAL PARA LA PROYECCION Y DETECCION DE LA PREVENCION DEL DELITO, MEDIANTE MINERIA DE DATOS.

MATERIAL DE APOYO CASO PRÁCTICO SISTEMA INTEGRAL PARA LA PROYECCION Y DETECCION DE LA PREVENCION DEL DELITO, MEDIANTE MINERIA DE DATOS. MATERIAL DE APOYO CASO PRÁCTICO SISTEMA INTEGRAL PARA LA PROYECCION Y DETECCION DE LA PREVENCION DEL DELITO, MEDIANTE MINERIA DE DATOS. PRESENTA MTIE. Erik Guerrero Bravo. Tula de Allende Hidalgo Septiembre

Más detalles

CAPITULO III EL MANTENIMIENTO. 3.1 Conceptos Básicos de Mantenimiento

CAPITULO III EL MANTENIMIENTO. 3.1 Conceptos Básicos de Mantenimiento 39 CAPITULO III EL MANTENIMIENTO 3.1 Conceptos Básicos de Mantenimiento Antes que realizar cualquier tipo de clasificación o descripción de los tipos de mantenimiento, es muy importante saber realmente

Más detalles

Boletín de Asesoría Gerencial*

Boletín de Asesoría Gerencial* Espiñeira, Sheldon y Asociados No. 10-2008 *connectedthinking Contenido Haga click en los enlaces para navegar a través del documento Haga click en los enlaces para llegar directamente a cada sección 4

Más detalles

Introducción. Francisco J. Martín Mateos. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla

Introducción. Francisco J. Martín Mateos. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Francisco J. Martín Mateos Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Qué es la (KE)? Definición de Wikipedia: La es una disciplina cuyo objetivo es integrar conocimiento

Más detalles

&$3Ì78/2 $/*25,7026 (92/87,926 $9$1=$'26 3$5$ 763 6.1. INTRODUCCIÓN

&$3Ì78/2 $/*25,7026 (92/87,926 $9$1=$'26 3$5$ 763 6.1. INTRODUCCIÓN &$3Ì78/2 6.1. INTRODUCCIÓN Los primeros avances para solucionar el TSP, por medio de Algoritmos Evolutivos han sido introducidos por Goldberg y Lingle en [68] y Grefenstette en [72]. En éste área muchos

Más detalles

Hoy en día el uso de robots es común en distintas actividades, ya que estos

Hoy en día el uso de robots es común en distintas actividades, ya que estos CAPÍTULO 1 ANTECEDENTES 1.1 INTRODUCCIÓN Hoy en día el uso de robots es común en distintas actividades, ya que estos sistemas pueden someterse a trabajos pesados, repetitivos o peligrosos para el ser humano.

Más detalles

PROCESO DE INNOVACIÓN EN LA ENSEÑANZA DE LA GESTIÓN DE EQUIPOS INDUSTRIALES EN INGENIERÍA

PROCESO DE INNOVACIÓN EN LA ENSEÑANZA DE LA GESTIÓN DE EQUIPOS INDUSTRIALES EN INGENIERÍA PON-C-22 PROCESO DE INNOVACIÓN EN LA ENSEÑANZA DE LA GESTIÓN DE EQUIPOS INDUSTRIALES EN INGENIERÍA A. García Sánchez (1), M. Ortega Mier (2), E. Ponce Cueto (3) Dpto. de Ingeniería de Organización, Administración

Más detalles

INGENIERIA DE SOFTWARE I INTRODUCCIÓN A LA INGENIERIA DE SOFTWARE

INGENIERIA DE SOFTWARE I INTRODUCCIÓN A LA INGENIERIA DE SOFTWARE INGENIERIA DE SOFTWARE I INTRODUCCIÓN A LA INGENIERIA DE SOFTWARE Agenda El software. Definición de software Dominios de aplicación Software heredado La naturaleza de las webapps Ingeniería del software

Más detalles

U. T. 2. EL EMPRESARIO COMO EMPRENDEDOR. LA IDEA DE NEGOCIO

U. T. 2. EL EMPRESARIO COMO EMPRENDEDOR. LA IDEA DE NEGOCIO COMO EMPRENDEDOR. ACTIVIDADES DE ACERCAMIENTO Sabes distinguir entre el autoempleo y el empleo por cuenta ajena? Tienes alguna idea de negocio? Sabes en qué consiste un estudio de mercado? Conoces lugares

Más detalles

Framework basado en Colonias de Hormigas artificiales para la resolución de problemas de optimización

Framework basado en Colonias de Hormigas artificiales para la resolución de problemas de optimización Universidad Central de Venezuela Facultad de Ciencias Escuela de Computación Laboratorio de Inteligencia Artificial Framework basado en Colonias de Hormigas artificiales para la resolución de problemas

Más detalles

Tema 2. Ingeniería del Software I feliu.trias@urjc.es

Tema 2. Ingeniería del Software I feliu.trias@urjc.es Tema 2 Ciclo de vida del software Ingeniería del Software I feliu.trias@urjc.es Índice Qué es el ciclo de vida del Software? El Estándar 12207 Modelos de proceso Qué es el Ciclo de Vida del SW? Definición

Más detalles

Introducción a PTC Windchill. Cómo puede ayudar PTC a gestionar mejor el contenido del producto

Introducción a PTC Windchill. Cómo puede ayudar PTC a gestionar mejor el contenido del producto Introducción a PTC Windchill Introducción a PTC Windchill Cómo puede ayudar PTC a gestionar mejor el contenido del producto Página: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 En los actuales entornos de

Más detalles

GoldMine Premium Edition

GoldMine Premium Edition GESTIÓN DE LAS RELACIONES CON LOS CLIENTES Ficha técnica GoldMine Premium Edition Gestión de las relaciones y las actividades diarias GoldMine Premium Edition puede ayudarle a impulsar el crecimiento de

Más detalles

METAHEURISTICAS Ideas, Mitos, Soluciones

METAHEURISTICAS Ideas, Mitos, Soluciones METAHEURISTICAS Ideas, Mitos, Soluciones OPTIMIZACION COMBINATORIA Qué es un problema de optimización combinatoria? Cómo se modela matemáticamente un problema de optimización combinatoria? Minimizar (o

Más detalles

Planificación de proyectos

Planificación de proyectos Planificación de proyectos Introducción Características de un proyecto: Conjunto numeroso de actividades complejas. Es singular (Conjunto de sucesos y actividades que sólo se presenta una vez) Es finito

Más detalles

UNIDAD 2. ADMINISTRACIÓN DE LA RELACIÓN CON EL CLIENTE (CRM)

UNIDAD 2. ADMINISTRACIÓN DE LA RELACIÓN CON EL CLIENTE (CRM) UNIDAD 2. ADMINISTRACIÓN DE LA RELACIÓN CON EL CLIENTE (CRM) Objetivos Al finalizar la unidad el alumno deberá conocer los antecedentes, el origen, los objetivos, los diferentes tipos y las estrategias

Más detalles

TEMA 2 LA GESTIÓN DE MARKETING EN LAS ORGANIZACIONES

TEMA 2 LA GESTIÓN DE MARKETING EN LAS ORGANIZACIONES TEMA 2 LA GESTIÓN DE MARKETING EN LAS ORGANIZACIONES 2.1. SUBSISTEMA COMERCIAL O DE MARKETING Vamos a considerar la empresa con el enfoque de la Teoría General de Sistemas. Comenzando con la definición

Más detalles

LOS ESTUDIOS DE ENCUESTA

LOS ESTUDIOS DE ENCUESTA UAM Métodos de Investigación en Educación Especial Curso 2009/10 LOS ESTUDIOS DE ENCUESTA AMANDA GONZÁLEZ VANESA CALLEJA LETICIA LÓPEZ PATRICIA PADRINO PATRICIA PUEBLA 1. ESTUDIOS DE ENCUESTA. UN ESTUDIO

Más detalles

Microsoft Dynamics AX for Dealers La gestión de las empresas del sector de la automoción

Microsoft Dynamics AX for Dealers La gestión de las empresas del sector de la automoción Microsoft Dynamics AX for Dealers La gestión de las empresas del sector de la automoción Solución global Contexto actual Las empresas del sector de la automoción tienen la necesidad de mejorar la gestión

Más detalles

TTP / Informática Profesional y Personal Módulo / Mantenimiento de software

TTP / Informática Profesional y Personal Módulo / Mantenimiento de software Ministerio de Educación, Ciencia y Tecnología TTP / Informática Profesional y Personal Módulo / Mantenimiento de software Aprobado por Res. 190/02 CFCyE Presentación La problemática abordada por este módulo

Más detalles

A L G O R I T M O S E VO L U T I VO S A P L I C A D O S A L A G E N E R AC I Ó N D E H O R A R I O S PA R A C O L E G I O

A L G O R I T M O S E VO L U T I VO S A P L I C A D O S A L A G E N E R AC I Ó N D E H O R A R I O S PA R A C O L E G I O E S C U E L A P O L I T É C N I C A N A C I O N A L F A C U L T A D D E C I E N C I A S D E P A R T A M E N T O D E M A T E M Á T I C A S A L G O R I T M O S E VO L U T I VO S A P L I C A D O S A L A G

Más detalles

Curso Práctico de INTELIGENCIA EMOCIONAL en el CRM y el Servicio al Cliente. Módulo 1

Curso Práctico de INTELIGENCIA EMOCIONAL en el CRM y el Servicio al Cliente. Módulo 1 Curso Práctico de INTELIGENCIA EMOCIONAL en el CRM y el Servicio al Cliente Módulo 1 Lectura Principal CRM COMO UN MODELO DE MÁXIMA RENTABILIDAD LOS ÉXITOS DE HOY SON EL FRUTO DE LAS DECISIONES DE AYER

Más detalles

En este capitulo se presentan los métodos y algoritmos utilizados para el desarrollo del

En este capitulo se presentan los métodos y algoritmos utilizados para el desarrollo del 33 En este capitulo se presentan los métodos y algoritmos utilizados para el desarrollo del sistema de procesamiento de imágenes para controlar un robot manipulador y se describen en la forma como serán

Más detalles