ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo

Tamaño: px
Comenzar la demostración a partir de la página:

Download "ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo"

Transcripción

1 UNIVERSIDAD POLITÉCNICA DE MADRID FACULTAD DE INFORMÁTICA Proyecto fin de carrera ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo AUTOR: SANTIAGO GONZÁLEZ TORTOSA TUTOR: VÍCTOR ROBLES FORCADA OSCAR CUBO MEDINA MADRID, OCTUBRE 2005

2

3 El futuro pertenece a quienes hacen realidad sus sueños A las dos mujeres que más quiero, mi madre y Carol.

4

5 SINOPSIS Sinopsis ICC+ es una herramienta para el Marketing Inteligente, destinado a departamentos de marketing de empresas que comercializan productos que van dirigidos al consumidor. Su contenido es información que aporta un alto nivel de conocimiento para decidir clientes, a quién y dónde dirigir las actividades, dónde abrir puntos de venta, etc. El desarrollo de esta herramienta comprende un diseño, utilizando la metodología de minería de datos CRISP-DM, y una implementación, desarrollada bajo aplicaciones como puedan ser Clementine o R-Project. La herramienta ICC+ está comprendida principalmente por tres niveles de información: Índices: Valor que una determinada área censal adopta respecto a la media nacional. Podemos apreciar dos tipos de índices, económicos, y de consumo. Propensiones: Valores que expresan la probabilidad que tienen determinadas familias situadas en un área censal respecto de una serie de variables específicas. Tipologías: ICC+ realiza una clasificación de las familias en perfiles, utilizando diferentes enfoques analíticos. La información permite disponer de una caracterización de la misma, o bien una estructura de diferentes grupos. - i -

6

7 AGRADECIMIENTOS Agradecimientos Durante toda mi carrera como ingeniero, han estado muchas personas a mí alrededor, animándome y prestándome todo su apoyo. Es por ello que, en este proyecto, quisiera transmitir mi más sincero agradecimiento a todas ellas. En primer lugar, recordar a mi madre, Mariluz, que descanse en paz. Quiero agradecerle tantas cosas que no sé por donde empezar. He aprendido muchas cosas de ella, pero si algo tengo que destacar, es la fuerza de voluntad y las ganas de vivir. Desde el día que lo aprendí, observo la vida con diferente perspectiva, hasta el punto de llegar a creer que todo lo que uno se proponga, puede llegar a conseguirlo. Por ello y por más cosas, gracias por todo madre. Realmente, si a alguien debo haber terminado la carrera, y con ello este proyecto, es a Carol, mi novia. Sin ella, mi vida no tendría ningún sentido. Gracias, de todo corazón, por tu apoyo, tu confianza, tu simpatía, tu sinceridad, tu preocupación, tu aprecio, tu cariño, tu sonrisa, en todo momento. En definitiva, mil gracias por todo Carol. Quiero agradecer a mi familia el apoyo recibido en todo momento. Han sido comprensibles, tanto en los estudios como en el trabajo, y me han facilitado todo lo necesario para poder haber hecho realidad mi sueño desde pequeño, ser ingeniero informático. Gracias por estar ahí en los buenos y malos momentos de mi vida. Especial mención a todos los miembros del grupo DaME (Javier Segovia, Ernestina, Víctor, Oscar, Alex, etc.), por su trabajo, confianza, apoyo y colaboración, pero sobre todo, por su compañerismo y amistad. Y, claro está, agradecer a los compañeros del laboratorio de Sistemas Operativos, especialmente a Ramón, el aguantarme todos estos días en los que hemos estado haciendo el proyecto. También quiero agradecer a todos los miembros del Departamento de Arquitectura y Tecnología de Sistemas Informáticos el apoyo y la confianza depositada en mí, sin los cuales no habría podido llevar a cabo este proyecto. Gracias especialmente a Víctor, mi tutor, quien me ofreció la posibilidad de trabajar en el Laboratorio de Sistemas Operativos, y de realizar este proyecto. También quisiera destacar a Fernando y Chema, por su gran ayuda y amabilidad en todo momento. - iii -

8 AGRADECIMIENTOS Como olvidar a mis compañeros y amigos del grupo ISYS (Victor s, Mamen, Sandra, Nuria, Juanjo, Alex, etc.) a quienes agradezco su ánimo, consejo, confianza y amistad. Os tendré siempre en mi recuerdo. No debo olvidar a mis compañeros de colegio (Alfonso, Javier, Juan, etc.). Gracias por la amistad que, después de tantos años, permanecemos teniendo. Gracias por todos los sabios consejos y ánimos que me habéis estado dando en el transcurso del tiempo. Puede que me olvide de muchos nombres y lo lamento. Pero todos saben dónde guardo aquel momento de vida que compartí con ellos, que me acompañará el resto de mi vida, sin borrarse de mis recuerdos.

9 CONTENIDOS Contenidos SINOPSIS... I AGRADECIMIENTOS... III CONTENIDOS... V Índice de figuras... vii Índice de tablas... viii 1. INTRODUCCIÓN MDS Boole e ICC Arquitectura de ICC Niveles de Información Índices Tipologías Propensiones Objetivos Contenidos ESTADO DEL ARTE Mineria de Datos Alcance Fundamentos Generación de Modelos Ciclo CRISP-DM Algoritmos Heurísticos Búsqueda Local Recocido Simulado Algoritmos Genéticos Herramientas v -

10 CONTENIDOS Clementine R Project Lenguaje C# PostGres PREPROCESO DE DATOS Censo de Población y Viviendas Encuesta Continua de Presupuesto Familiares (ECPF) Carga de Datos del Censo Transformación de las Variables Variables demográficas comunes Índices derivados de la ECPF METODOLOGÍA DE AGRUPACIÓN Variables de interés Algoritmos de Optimización Algoritmo Genético Búsqueda Local Simulated Annealing Comparativa Cálculo de Índices Entrenamiento de modelos Estimación de Índices Validación de resultados GENERACIÓN DE TIPOLOGÍAS Y PROPENSIONES Generación de Tipologías Tipologías de ciclo de vida familiar Tipologías económicas Tipologías de gasto Proyección de tipologías en el Censo Cálculo de Propensiones Propensión de hipotecas Propensión de tenencia de segunda vivienda Propensión de posesión de segundo vehículo vi -

11 CONTENIDOS Propensión de compra de gama de automóvil CONCLUSIONES Y LÍNEAS FUTURAS Conclusiones Documentación Conocimientos Dificultades en el desarrollo Líneas Futuras BIBLIOGRAFÍA TRANSFORMACIÓN DE VARIABLES Índice de figuras Figura 2.1 Fases del modelo de proceso CRISP-DM Figura 2.2 Función de Enfriamiento Figura 2.3 Cruce en un punto Figura 2.4 Cruce en dos puntos Figura 2.5 Cruce uniforme Figura 2.6 Cruce aritmético Figura 2.7 Inversión de genes Figura 2.8 Cambio de orden Figura 2.9 Modificación de genes Figura 2.10 Selección por la regla de la ruleta Figura 2.11 Método del Ranking Figura 2.12 Arquitectura de Clementine Figura 2.13 Ejemplo de análisis con Clementine Figura 2.14 Una visión esquemática del funcionamiento de R Figura 2.15 Ejemplo de resolución gráfica de un análisis en R Figura 4.1 Factor de enfriamiento Figura 4.2 Condición de evaluación para Recocido Simulado Figura municipios con mayor población de la Comunidad de Madrid Figura municipios con mayor población del País Vasco Figura municipios con mayor población de Asturias Figura 5.1 Tipologías Económicas (Riqueza / ValorVivienda) Figura 5.2 Histograma asociado a la variable Valor Vivienda Figura 5.3 Histograma asociado a la variable Riqueza vii -

12 CONTENIDOS Figura 5.4 Histograma asociado a la variable Gasto...86 Figura 5.5 Distribución de tipos de gasto con escasa representatividad...88 Figura 5.6 Tipologías de Gasto (OcioCultura / Energía)...89 Figura 5.7 Histograma de la variable OcioCultura...90 Figura 5.8 Histograma de la variable Energía...90 Figura 5.9 Histograma de la variable Telecomunicaciones...90 Índice de tablas Tabla 4.1 Comparativa entre algoritmos de optimización...74 Tabla 4.2 Comunidad de Madrid...79 Tabla 4.3 País Vasco...80 Tabla 4.4 Asturias viii -

13 Parte I Introducción

14

15 1. INTRODUCCIÓN Capítulo 1 1. Introducción El proyecto surge, en la empresa MDS Boole, por la necesidad de explorar y desarrollar el conocimiento individual de los consumidores, el cual, se ha convertido en uno de los principales objetivos en la mayoría de las empresas que desean orientar sus actividades de marketing de forma más eficaz y rentable. La falta de información sobre nuestros propios clientes, y sobre los consumidores en general, es un importante obstáculo que impide saber más acerca de los potenciales consumidores a nivel individual. En el mejor de los casos, aquellas empresas que desarrollan sus actividades directamente con el consumidor, disponen de una información transaccional muy importante pero, en la mayoría de los casos, desconocen los aspectos descriptivos de cómo son sus clientes. Por el contrario, las empresas que desarrollan sus actividades a través de un canal de distribución sobre el que no tienen control directo, la transacción es anónima y el conocimiento sobre el transaccional de los clientes a nivel individual es inexistente. Se planteó, pues, desarrollar una herramienta (denominada ICC+), la cual, tiene por objeto el proporcionar colas de información que permitan, por un lado, enriquecer la información que dispone la empresa acerca de sus clientes, y por otro, proporcionar datos a nivel microgeográfico sobre los perfiles y comportamiento de consumo de la población española MDS Boole e ICC+ MDS es una empresa de servicios de Marketing, encargada de ayudar a compañías y empresas a obtener mejores resultados en sus departamentos de marketing. MDS posee tres filiales, una de las cuales se localiza en Madrid, denominada MDS Boole. Ésta última ha solicitado el desarrollo del proyecto ICC+ a partir de un documento descriptivo del mismo. ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo

16 1. INTRODUCCIÓN ICC+ [1] es una herramienta para el Marketing Inteligente, destinado a departamentos de marketing de empresas que comercializan con productos que van dirigidos al consumidor. Su contenido es información que le aporta un alto nivel de conocimiento para decidir a quien y donde dirigir las actividades, donde abrir puntos de venta, etc. La información que facilita ICC + está basada en los principios de la demografía, es decir, los individuos que viven en un mismo entorno tienen características y comportamientos similares. Con ello, se deduce que un individuo por el hecho de vivir en una determinada microárea geográfica se le puede asociar diferentes perfiles de consumidor, patrones y comportamientos de consumo. La información de ICC+ está referida a nivel de áreas censales, y por tanto existe información para cada una de las aproximadamente áreas censales en las que está dividida España. A partir de esta unidad geográfica es posible realizar diferentes tipos de agregaciones basadas en distintos criterios aunque uno de los más usados sea el de proximidad. Un área censal tiene como características destacables: Está formada, por término medio, por 400 familias Representa la mínima unidad de análisis con validez estadística del INE. Es un área geográfica estándar muy utilizado y extendido entre las empresas para la explotación de la información a nivel microgeográficos (ej.: planos digitales). La dirección postal tiene asociada un área censal específica, lo que permite asociar información de ICC+ de forma individual a registros de datos sólo partiendo de la dirección postal. Tiene una composición muy homogénea, lo que permite aplicar los principios de demografía con mayor precisión. Al utilizar datos agregados no nominales no le afecta la LOPD (Ley Orgánica de Protección de Datos) ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo

17 1. INTRODUCCIÓN 1.2. Arquitectura de ICC+ La información necesaria para realizar el producto ICC+ se obtiene a partir de dos conjuntos diferentes de datos: Censo de Población y Viviendas, con información demográfica de las secciones censales (grupos de 500 familias) actualizada con una frecuencia de 10 años Encuesta Continua de Presupuestos Familiares (ECPF), contiene información de consumo de una muestra de, aproximadamente, 9000 familias. A partir de estos conjuntos de datos es necesario estimar los cuatro niveles de información, los cuales son: Valores Demográficos: obtenidos directamente de los datos originales Índices Económicos Tipologías Propensiones Así pues, siguiendo el ciclo de vida CRISP-DM (que más adelante se comentará), podemos describir la herramienta ICC+ como un conjunto de 4 procesos conectados entre sí, los cuales son: Preproceso de Datos Agrupación de Datos Cálculo de Índices Cálculo de otros niveles de Información El punto clave del proyecto es obtener una estimación de los índices para todas las secciones censales. Para ello, se parte de los valores de la ECPF (transformados en índices) y se proyectan sobre el censo mediante modelos. No obstante, el primer inconveniente encontrado es la diferencia de los datos, es decir, los datos del Censo están representados a nivel de sección censal, y los datos de la ECPF están representados a nivel familiar. ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo

18 1. INTRODUCCIÓN Por lo que, primeramente debemos procesar dichos datos, agrupar las familias por sección censal para, más adelante, realizar el calculo de índices a nivel de sección censal. Para ello, necesitamos partir de datos que sean comunes entre el Censo de Población y la ECPF. Utilizando los datos originales procesados, los índices estimados, y otra información derivada (calculados al procesar los datos) es posible obtener el resto de los niveles de información necesarios: propensiones y tipologías Niveles de Información Para realizar el proyecto ICC+, es necesario obtener distintos niveles de información [1], ya que proporcionan bastante conocimiento sobre los consumidores. Estos niveles son los siguientes: Índices Tipologías Propensiones Índices Un índice es el valor que una determinada área censal adopta respecto a la media nacional y que está disponible para las siguientes variables de información: Índices Económicos: los índices económicos son estimaciones realizadas para cada área censal en base a las características de la población y de su entorno. Los índices económicos necesarios son los siguientes: o Renta: Indica la renta media familiar disponible anual (renta monetaria) por área censal, lo que representa flujos de entrada de dinero para la familia procedente de las diferentes fuentes generadoras de ingresos. o Capacidad de Gasto: Indica el consumo o gasto medio anual realizado por las familias por área censal y que representa flujos de salida de di ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo

19 1. INTRODUCCIÓN nero. Este indicador esta formado por las diferentes partidas o conceptos de gastos que recoge la Encuesta Continua de Presupuestos Familiares del INE (ECPF). o Endeudamiento: Indica la dificultad que las familias tienen para llegar a fin de mes. Se calcula como la diferencia (siempre negativa) de los flujos monetarios entrantes y salientes (ingresos y gastos, respectivamente). o Ahorro: Al contrario que el endeudamiento, indica la facilidad que tienes las familias para llegar a fin de mes. Se calcula como la diferencia entre ingresos y gastos. o Hipoteca (valor no estimado): Indica la proporción respecto a la media nacional de viviendas con deudas pendientes de pago respecto del total de las viviendas de un área censal. Se obtiene por observación directa de los datos del Censo del INE (viviendas con pagos pendientes). o Valor de la Vivienda: Muestra un índice, sobre la media nacional, del valor medio imputable a una vivienda en alquiler o en propiedad existente en una determinada área censal. Resulta de imputar el valor real de alquiler o el coste de oportunidad de una vivienda en propiedad. o Riqueza: Es la agregación de la renta familiar y el valor de la vivienda. Indica el nivel de riqueza medio familiar por área censal. Índices de Consumo: Estos indicadores muestran el nivel de gasto para determinados tipos de consumo realizados por término medio las familias españolas. Las diferentes partidas de gasto utilizadas para construir los índices de consumo se proporcionan siguiendo la clasificación elaborada por el INE. Esta clasificación se apoya en la utilizada en la OSCE para las Encuestas de Presupuestos Familiares de los hogares, que a su vez está basada en la clasificación ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo

20 1. INTRODUCCIÓN PROCOME a 2 dígitos del Sistema Europeo de Cuentas Económicas Integradas (SEC). En dicha nomenclatura, cada partida de gasto aparece asociada, excepto en casos excepcionales, a la actividad que lo produce Tipologías ICC+ realiza una clasificación de las familias en perfiles utilizando diferentes enfoques analíticos. La información que proporciona permite, para cada área censal, disponer de una caracterización (distribución en cada uno de los grupos tipológicos detectados) de la misma o bien una estructura de diferentes grupos. Las diferentes tipologías a obtener son las siguientes: Tipologías económicas: Realiza una clasificación de las familias en función de sus datos económicos (renta, gasto, ahorro, deuda, valor vivienda, etc.). El objetivo es clasificar las familias en grupos tipológicos de comportamiento económico (caracterización y grupos tipológicos existentes en cada área censal). Tipologías familiares: Muestra para cada área censal la estructura de tipologías de las diferentes familias (generadas a partir de la ECPF). Tipologías de distribución del gasto: Muestra las distintas tipologías de distribución del gasto de cada área censal. Tipologías de consumidores: Clasifica las áreas censales en función de su grado de similitud o parecido en cuanto a diferentes grupos de variables discriminantes y representativas del entorno. Cada una de las tipologías anteriores se generan a partir de un conjunto de variables escogidas según varios factores y objetivos: o o Descartar variables que estén altamente correlacionadas, seleccionando únicamente aquellas que se consideren altamente predictivas. Las variables deberán correlacionarse bien con el comportamiento del consumidor ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo

21 1. INTRODUCCIÓN o o o Las variables deberán tener el suficiente tamaño muestral para ser estadísticamente válidas. Las variables no deben estar fuertemente concentradas en un pequeño número de áreas geográficas. Algoritmos de proximidad de las secciones censales (ej.: el distrito municipal que es el siguiente nivel de agregación de las secciones censales) Propensiones Las propensiones expresan la probabilidad que tienen determinadas familias, situadas en un área censal, respecto a una serie de criterios:: Propensión Hipotecas: Indica la probabilidad de que las familias de una determinada área censal tengan la vivienda hipotecada. Propensión posesión Segunda Vivienda: Indica la probabilidad de posesión de una segunda vivienda por parte de las familias que residen en una determinada área censal. Adicionalmente, en el caso de disponer de esta segunda vivienda, se dispone de información de: o o Lugar de posesión: Lugares más probables de posesión, clasificado por provincias. Tiempo de uso: Muestra el tiempo medio de uso de la segunda vivienda. Propensión de posesión de 2 o más coches: Expresa la probabilidad de que las familias de una sección censal dispongan de más de un vehículo dentro del hogar. Propensión de compra de modelos de coches (valor estimado): Indica la probabilidad de una familia situada en una determinada área censal de compra/posesión de los diferentes segmentos de coches. ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo

22 1. INTRODUCCIÓN 1.4. Objetivos Se trata, pues, de aplicar el proceso CRISP-DM al análisis de los datos publicados por el UNE para la creación del producto ICC+. Este objetivo supone los siguientes subobjetivos: 1. Quiénes son mis clientes y dónde puedo encontrar otros similares? 2. Cuáles de mis mejores clientes pueden dejar de serlo? 3. Qué productos no compran mis clientes y podrían comprar? Las aplicaciones específicas de ICC+ se engloban en 4 grupos: Análisis de cartera de clientes: Analizar la composición de la cartera de clientes y determinar los grupos de clientes que son más interesantes para desarrollar actividades de fidelización, venta cruzada y/o riesgos de abandono/fuga. Identificación de potenciales clientes: Conociendo las características de los clientes es posible saber dónde encontrar clientes potenciales, cuántos son y cómo se distribuyen en cada uno de sus puntos de venta. Respuestas a Campañas: Identificar los clientes y prospectos que mejor responden a cada tipo de acción promocional y de marketing directo. Identificar la localización idónea de los puntos de venta: Conocer las áreas geográficas más beneficiosas y de mayor potencial para las compañías Contenidos En primer lugar, se presenta la introducción del proyecto, seguido del estado del arte, el cual, se describirá el proceso de Minería de Datos, su definición, y herramientas que nos permiten llevarla a cabo. Se describirá el ciclo de vida CRISP-DM, y dos herramientas utilizadas en este proyecto, Clementine y R-Project. Seguidamente, se describirá el análisis y preproceso de datos que comprende una descripción del origen de los datos, las operaciones de transformación (agrupar, modificar ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo

23 1. INTRODUCCIÓN nombres, etc.) sobre dichos datos para generar un conjunto de datos útil para las siguientes fases. Tras el preproceso de datos, se procederá a exponer la metodología de agrupación utilizada para agrupar familias de la ECPF. Se presentarán las variables que son interesantes para realizar la agrupación y los algoritmos planteados para realizarla, con una comparativa entre ellas. A continuación, se realizará el cálculo y proyección de todos los índices solicitados, a partir de los grupos generados por el algoritmo de agrupación. Una vez calculados y validados los índices, se crearán las tipologías y propensiones a partir del conjunto de datos inicial Para finalizar, se expondrán las conclusiones, valoraciones y experiencia adquirida durante la realización del proyecto. ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo

24

25 Parte II Estado del Arte

26

27 2. ESTADO DEL ARTE Capítulo 2 2. Estado del Arte La primera fase en el desarrollo de un proyecto es estudiar y comprender las tecnologías existentes para, más tarde, seleccionar las más apropiadas. En este caso, es necesario conocer qué es y para qué sirve la Minería de Datos [10], y el ciclo de vida estándar utilizado en este tipo de proyectos (CRISP-DM) [12]. También se describen los algoritmos heurísticos utilizados para realizar la agrupación de familias de la ECPF. Por último, se proporciona una breve descripción de las herramientas utilizadas en el transcurso del proyecto Mineria de Datos La tecnología disponible actualmente permite almacenar, transferir y gestionar información crítica dentro de una organización. Sin embargo, si esta información no se transforma en conocimiento útil, carece de valor. La minería de datos es el proceso de extracción de información significativa de cualquier conjunto de datos. Las técnicas de minería de datos revelarán tendencias y correlaciones ocultas que permitan una mejor comprensión de los datos, esto es, generar conocimiento útil. Por lo tanto, la minería de datos es un proceso de soporte al usuario. Esta tecnología ayuda a las organizaciones a centrarse en la información más significativa contenida en sus bases de datos corporativas. Mediante esta información es posible predecir nuevas perspectivas y situaciones futuras con mayor precisión, lo que facilita la toma de decisiones y, empleada de forma apropiada, podría suponer una ventaja competitiva. Los avances en la recolección de datos, el amplio uso de códigos de barras y la automatización de muchos negocios, tanto privados como gubernamentales, han generado una ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo

28 2. ESTADO DEL ARTE ingente cantidad de datos. El análisis de este volumen de datos ha generado una necesidad urgente de nuevas técnicas y herramientas que puedan asistir en la transformación automática e inteligente de toda esta información en conocimiento útil. Los avances en minería de datos y en el descubrimiento del conocimiento, han impulsado varios campos de investigación como la estadística basada en técnicas de lógica difusa, bases de datos universales, máquinas que aprenden e inteligencia artificial, todos ellos parte del creciente campo de minería de datos. La minería de datos tiene una serie de ventajas: Contribuye a facilitar la toma de decisiones tácticas y estratégicas proporcionando un procedimiento automatizado para identificar información clave desde volúmenes de datos generados por procesos tradicionales y de e-business. Permite dar prioridad a decisiones y acciones. Proporciona criterios que faciliten la toma de decisiones a los usuarios del negocio que mejor entienden el problema y el entorno. Habitualmente, genera modelos descriptivos. Permite que relaciones ocultas e identificadas a través del proceso de la minería de datos sean expresadas como reglas de negocio o modelos predictivos. Un sistema de minería de datos permite analizar factores de influencia en determinados procesos, predecir o estimar variables o comportamientos futuros, segmentar o agrupar ítems similares, además de obtener secuencias de eventos que provocan comportamientos específicos. La llegada de la minería de datos se considera como la última etapa de la introducción de métodos cuantitativos, científicos en el mundo del comercio, industria y negocios ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo

29 2. ESTADO DEL ARTE Alcance Dados conjuntos de datos de suficiente tamaño y calidad, la minería de datos puede generar nuevas oportunidades al proporcionar las siguientes capacidades: Predicción automatizada de tendencias y comportamientos: La minería de datos automatiza el proceso de encontrar información predecible en cantidades de datos de diverso tamaño. Preguntas que tradicionalmente requerían un intenso análisis manual, ahora pueden ser contestadas directa y rápidamente desde los datos. Descubrimiento automatizado de modelos previamente desconocidos: Las herramientas de minería de datos identifican modelos y relaciones ocultas en los datos analizados. Cuando son implementadas en sistemas de procesamiento paralelo de alto rendimiento, pueden analizar bases de datos masivas en minutos Fundamentos En la evolución desde los datos a información, cada nuevo paso se basa en el previo. Por ello, las técnicas de minería de datos son el resultado de largos procesos de investigación y desarrollo. Esta evolución comenzó cuando los datos de negocios fueron almacenados por primera vez en computadoras, continuó con mejoras en el acceso a los datos y, más recientemente, con mecanismos que permiten a los usuarios navegar a través de los datos en tiempo real. La minería de datos se sustenta en tres tecnologías que tienen suficiente madurez: Recolección masiva de datos Algoritmos de aprendizaje Potentes computadoras con multiprocesadores Estos componentes esenciales de la minería de datos han estado en desarrollo durante décadas en diferentes áreas de investigación: estadística, inteligencia artificial y aprendizaje automático. ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo

30 2. ESTADO DEL ARTE Hoy, la madurez de estas técnicas junto con los motores de bases de datos relacionales de alto rendimiento, hacen que la aplicación de estas tecnologías sea viable en los entornos actuales. Los sistemas de minería de datos suelen utilizar algoritmos procedentes de la inteligencia artificial o modelos matemáticos tales como: Redes neuronales artificiales: modelos predecibles no-lineales que aprenden a través del entrenamiento y se asemejan a la estructura de una red neuronal biológica. Árboles de decisión: estructuras en forma de árbol que representan conjuntos de decisiones. Estas decisiones generan reglas para la clasificación de un conjunto de datos. Método del vecino más cercano: técnica que clasifica cada registro en un conjunto de datos basado en una combinación de las clases de los k registros más cercanos a él en un conjunto de datos históricos. Regla de inducción: extracción de reglas if-then de datos basados en significado estadístico. Algoritmos heurísticos: técnicas de optimización que usan procesos como combinaciones genéticas, mutaciones y selección natural en un diseño basado en los conceptos de evolución. Muchas de estas técnicas han estado en desarrollo durante más de una década en herramientas de análisis especializadas que trabajan con volúmenes de datos relativamente pequeños. Estas capacidades están ahora evolucionando para integrarse directamente con herramientas OLAP y de Data Warehousing Generación de Modelos El modelado es la técnica usada en minería de datos para construir un modelo capaz de explicar una situación en la que se conoce la respuesta para, posteriormente, aplicarlo en aquellas situaciones en las que dicha respuesta es desconocida ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo

31 2. ESTADO DEL ARTE Para ello, las computadoras se cargan con mucha información acerca de una variedad de situaciones donde la respuesta es conocida a priori (algoritmos de aprendizaje supervisado). Posteriormente, los algoritmos de aprendizaje investigarán esta información, distinguiendo entre las distintas características, y construirán un modelo. Una vez este modelo ha sido construido, puede ser usado en situaciones similares en las que la respuesta no es desconocida. Para estimar la precisión del modelo se aplican técnicas de validación. Una de las más empleadas consiste en excluir un conjunto de las situaciones conocidas en el entrenamiento del modelo y aplicarles el modelo resultante. De esta forma es posible comparar la respuesta real conocida con la generada por el modelo Ciclo CRISP-DM CRISP-DM (CRoss Industry Standard Process for DataMining) surgió por iniciativa de Daimler Chrysler a finales de 1996 y tuvo éxito al basarse en la experiencia práctica del mundo real; de cómo los profesionales, tales como los médicos, trabajaban en proyectos basados en la experiencia, para de este modo obtener mejores resultados. CRISP-DM es una metodología estándar para la realización de proyectos de minería de datos que reduce el tiempo de recuperación de la inversión realizada. El modelo de proceso proporciona una descripción del ciclo de vida de un proyecto, conteniendo sus correspondientes fases, tareas y las relaciones entre estas tareas. No es posible identificar a este nivel de descripción todas las relaciones, al existir éstas probablemente entre todas las tareas existentes dependiendo de los objetivos, motivos, intereses de los usuarios y, por supuesto, de los datos. A continuación, se muestra el ciclo de vida de un proyecto de minería de datos, consistente en 6 fases cuya secuencia no es estricta sino dependiente del resultado de la última fase llevada a cabo. El círculo externo simboliza la naturaleza cíclica de la minería de datos y las flechas pequeñas indican las dependencias más importantes y frecuentes entre fases. ICC+: DataMining aplicado al Marketing y Comportamiento de Consumo

Algoritmos genéticos como métodos de aproximación analítica y búsqueda de óptimos locales

Algoritmos genéticos como métodos de aproximación analítica y búsqueda de óptimos locales Algoritmos genéticos como métodos de aproximación analítica y búsqueda de óptimos locales Jorge Salas Chacón A03804 Rubén Jiménez Goñi A93212 Juan Camilo Carrillo Casas A91369 Marco Vinicio Artavia Quesada

Más detalles

Desarrollo de un sistema capaz de optimizar rutas de entrega utilizando algoritmos genéticos

Desarrollo de un sistema capaz de optimizar rutas de entrega utilizando algoritmos genéticos MT 6 Desarrollo de un sistema capaz de optimizar rutas de entrega utilizando algoritmos genéticos Rosario Baltazar 1 Judith Esquivel Vázquez 2 Andrea Rada 3 Claudia Díaz 4 Resumen Durante los últimos 15

Más detalles

Algoritmos Genéticos.

Algoritmos Genéticos. Algoritmos Genéticos. Miguel Cárdenas Montes, Antonio Gómez Iglesias Centro de Investigaciones Energéticas Medioambientales y Tecnológicas, Madrid, Spain miguel.cardenas@ciemat.es 15-19 de Octubre de 2011

Más detalles

Búsqueda Local. cbea (LSI-FIB-UPC) Inteligencia Artificial Curso 2011/2012 1 / 33

Búsqueda Local. cbea (LSI-FIB-UPC) Inteligencia Artificial Curso 2011/2012 1 / 33 Introducción Búsqueda Local A veces el camino para llegar a la solución no nos importa, buscamos en el espacio de soluciones Queremos la mejor de entre las soluciones posibles alcanzable en un tiempo razonable

Más detalles

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003 MINERÍA DE DATOS Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE Octubre - 2003 CONTENIDO Qué es Data Warehousing Data Warehouse Objetivos del Data Warehouse

Más detalles

Parte I: Introducción

Parte I: Introducción Parte I: Introducción Introducción al Data Mining: su Aplicación a la Empresa Cursada 2007 POR QUÉ? Las empresas de todos los tamaños necesitan aprender de sus datos para crear una relación one-to-one

Más detalles

Data Mining Técnicas y herramientas

Data Mining Técnicas y herramientas Data Mining Técnicas y herramientas Introducción POR QUÉ? Empresas necesitan aprender de sus datos para crear una relación one-toone con sus clientes. Recogen datos de todos lo procesos. Datos recogidos

Más detalles

HADES: Hidrocarburos Análisis de Datos de Estaciones de Servicio

HADES: Hidrocarburos Análisis de Datos de Estaciones de Servicio Hidrocarburos: Análisis de Pablo Burgos Casado (Jefe de Área Desarrollo (SGTIC - MITYC)) María Teresa Simino Rueda Rubén Pérez Gómez Israel Santos Montero María Ángeles Rodelgo Sanchez 1. INTRODUCCIÓN

Más detalles

Identificación fácil de los clientes adecuados

Identificación fácil de los clientes adecuados PASW Direct Marketing 18 Especificaciones Identificación fácil de los clientes adecuados Sabemos que le gustaría que sus programas de marketing sean lo más rentables posible y sabemos que conocer la información

Más detalles

EPB 603 Sistemas del Conocimiento!"#$ %& $ %'

EPB 603 Sistemas del Conocimiento!#$ %& $ %' Metodología para el Desarrollo de Proyectos en Minería de Datos CRISP-DM EPB 603 Sistemas del Conocimiento!"#$ %& $ %' Modelos de proceso para proyectos de Data Mining (DM) Son diversos los modelos de

Más detalles

Proyecto técnico MINERÍA DE DATOS. Febrero 2014. www.osona-respon.net info@osona-respon.net

Proyecto técnico MINERÍA DE DATOS. Febrero 2014. www.osona-respon.net info@osona-respon.net Proyecto técnico MINERÍA DE DATOS Febrero 2014 www.osona-respon.net info@osona-respon.net 0. Índice 0. ÍNDICE 1. INTRODUCCIÓN... 2 2. LOS DATOS OCULTOS... 3 2.1. Origen de la información... 3 2.2. Data

Más detalles

FORMULACIÓN DE UN ALGORITMO GENÉTICO PARA EL PROBLEMA DE PROGRAMACIÓN DE ÓRDENES DE TRABAJO DE UNA EMPRESA DE ARTES GRÁFICAS

FORMULACIÓN DE UN ALGORITMO GENÉTICO PARA EL PROBLEMA DE PROGRAMACIÓN DE ÓRDENES DE TRABAJO DE UNA EMPRESA DE ARTES GRÁFICAS FORMULACIÓN DE UN ALGORITMO GENÉTICO PARA EL PROBLEMA DE PROGRAMACIÓN DE ÓRDENES DE TRABAJO DE UNA EMPRESA DE ARTES GRÁFICAS PROYECTO DE GRADO Javier mauricio gamboa salgado Código: 544004 John alexander

Más detalles

CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN.

CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN. SISTEMA EDUCATIVO inmoley.com DE FORMACIÓN CONTINUA PARA PROFESIONALES INMOBILIARIOS. CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN. Business Intelligence. Data Mining. PARTE PRIMERA Qué es

Más detalles

Definición de status. Actualizado y Evolutivo

Definición de status. Actualizado y Evolutivo Definición de status Es un indicador del nivel de renta neta disponible, en el hogar de residencia de cada persona física, respecto al conjunto total de hogares de su entorno geográfico. Dinámico El índice

Más detalles

Métodos evolutivos de Optimización. Prof. Cesar de Prada Dpto. Ingeneiria de Sitemas y Automática Universidad de Valladolid

Métodos evolutivos de Optimización. Prof. Cesar de Prada Dpto. Ingeneiria de Sitemas y Automática Universidad de Valladolid Métodos evolutivos de Optimización Prof. Cesar de Prada Dpto. Ingeneiria de Sitemas y Automática Universidad de Valladolid Indice Introducción Método de Montecarlo Algoritmos genéticos Tabú Search Simulated

Más detalles

v.1.0 Clase 5 Docente: Gustavo Valencia Zapata

v.1.0 Clase 5 Docente: Gustavo Valencia Zapata v.1.0 Clase 5 Docente: Gustavo Valencia Zapata Temas Clase 5: Conceptos de Minería de Datos Herramientas de DM Referencias Minería de datos Proceso de DM www.gustavovalencia.com Minería de datos La minería

Más detalles

DESARROLLO DE SOFTWARE CON CALIDAD PARA UNA EMPRESA

DESARROLLO DE SOFTWARE CON CALIDAD PARA UNA EMPRESA DESARROLLO DE SOFTWARE CON CALIDAD PARA UNA EMPRESA Resumen AUTORIA CARLOS CABALLERO GONZÁLEZ TEMATICA INFORMÁTICA ETAPA ESO-BACHILLERATO-CFGM(ESI,ASI,DSI) Se describe la revolución que supuso la incursión

Más detalles

CONSTRUCCION DE INDICADORES DE GESTION Y HERRAMIENTAS OLAP PARA PEQUEÑAS Y MEDIANAS EMPRESAS

CONSTRUCCION DE INDICADORES DE GESTION Y HERRAMIENTAS OLAP PARA PEQUEÑAS Y MEDIANAS EMPRESAS CONSTRUCCION DE INDICADORES DE GESTION Y HERRAMIENTAS OLAP PARA PEQUEÑAS Y MEDIANAS EMPRESAS 1. RESEÑA HISTORICA Las exigencias competitivas del mercado hacen que las organizaciones busquen mecanismos

Más detalles

Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322

Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322 Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322 Nicole García Gómez 2830047-6 Diego Riquelme Adriasola 2621044-5 RESUMEN.- La minería de datos corresponde a la extracción

Más detalles

TÉCNICAS DE MINERÍA DE DATOS Y TEXTO APLICADAS A LA SEGURIDAD AEROPORTUARIA

TÉCNICAS DE MINERÍA DE DATOS Y TEXTO APLICADAS A LA SEGURIDAD AEROPORTUARIA TÉCNICAS DE MINERÍA DE DATOS Y TEXTO APLICADAS A LA SEGURIDAD AEROPORTUARIA MSC ZOILA RUIZ VERA Empresa Cubana de Aeropuertos y Servicios Aeronáuticos Abril 2010 ANTECEDENTES El proyecto Seguridad es una

Más detalles

Algoritmos Genéticos Y

Algoritmos Genéticos Y Algoritmos Genéticos Y Optimización n Heurística Dr. Adrian Will Grupo de Aplicaciones de Inteligencia Artificial Universidad Nacional de Tucumán awill@herrera.unt.edu.ar Operadores de Mutación El operador

Más detalles

APOYO PARA LA TOMA DE DECISIONES

APOYO PARA LA TOMA DE DECISIONES APOYO PARA LA TOMA DE DECISIONES Cátedra: Gestión de Datos Profesor: Santiago Pérez Año: 2006 Bibliografía: Introducción a las Bases de Datos. DATE - 1 - 1. INTRODUCCION APOYO PARA LA TOMA DE DECISIONES

Más detalles

Introducción a los Algoritmos Genéticos. Tomás Arredondo Vidal 17/4/09

Introducción a los Algoritmos Genéticos. Tomás Arredondo Vidal 17/4/09 Introducción a los Algoritmos Genéticos Tomás Arredondo Vidal 17/4/09 Esta charla trata de lo siguiente: Introducción a algunos aspectos de los algoritmos genéticos. Introducción a algunas aplicaciones

Más detalles

Minería de datos (Introducción a la minería de datos)

Minería de datos (Introducción a la minería de datos) Minería de datos (Introducción a la minería de datos) M. en C. Sergio Luis Pérez Pérez UAM CUAJIMALPA, MÉXICO, D. F. Trimestre 14-I. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 1 / 24

Más detalles

POSIBLE APLICACIÓN DE LA MINERÍA DE TEXTOS A LOS TRABAJOS DE LA COMISIÓN MINISTERIAL DE INFORMÁTICA

POSIBLE APLICACIÓN DE LA MINERÍA DE TEXTOS A LOS TRABAJOS DE LA COMISIÓN MINISTERIAL DE INFORMÁTICA POSIBLE APLICACIÓN DE LA MINERÍA DE TEXTOS A LOS TRABAJOS DE LA COMISIÓN MINISTERIAL DE INFORMÁTICA M.ª del Pilar Cantero Blanco Jefa de Servicio de Sistemas Informáticos. Subdirección General de Planificación

Más detalles

Pero que es el Data Mining? Como esta tecnología puede resolver los problemas diarios de las organizaciones? Cuál es el ciclo de vida de un DM?

Pero que es el Data Mining? Como esta tecnología puede resolver los problemas diarios de las organizaciones? Cuál es el ciclo de vida de un DM? Introducción En vista de los comentarios y sugerencias que nos hicieron, via mail y por chat, sobre la posibilidad de la creación de nuevo conocimiento, he creido conveniente introducir el tema Data Mining

Más detalles

MINERIA DE DATOS Y Descubrimiento del Conocimiento

MINERIA DE DATOS Y Descubrimiento del Conocimiento MINERIA DE DATOS Y Descubrimiento del Conocimiento UNA APLICACIÓN EN DATOS AGROPECUARIOS INTA EEA Corrientes Maximiliano Silva La información Herramienta estratégica para el desarrollo de: Sociedad de

Más detalles

LOS CINCO GRADOS DE MADUREZ DE UN PROYECTO BI

LOS CINCO GRADOS DE MADUREZ DE UN PROYECTO BI LOS CINCO GRADOS DE MADUREZ DE UN PROYECTO BI INTRODUCCIÓN Se habla en multitud de ocasiones de Business Intelligence, pero qué es realmente? Estoy implementando en mi organización procesos de Business

Más detalles

Introducción a la Computación Evolutiva

Introducción a la Computación Evolutiva Introducción a la Computación Evolutiva Sección de Computación CINVESTAV-IPN Av. IPN No. 2508 Col. San Pedro Zacatenco México, D.F. 07300 email: ccoello@cs.cinvestav.mx http: //delta.cs.cinvestav.mx/~ccoello

Más detalles

Implantación y Aceptación del Sistema

Implantación y Aceptación del Sistema y Aceptación del Sistema 1 y Aceptación del Sistema ÍNDICE DESCRIPCIÓN Y OBJETIVOS... 2 ACTIVIDAD IAS 1: ESTABLECIMIENTO DEL PLAN DE IMPLANTACIÓN...5 Tarea IAS 1.1: De finición del Plan de... 5 Tarea IAS

Más detalles

CICLO DE VIDA DEL SOFTWARE

CICLO DE VIDA DEL SOFTWARE CICLO DE VIDA DEL SOFTWARE 1. Concepto de Ciclo de Vida 2. Procesos del Ciclo de Vida del Software 3. Modelo en cascada 4. Modelo incremental 5. Modelo en espiral 6. Prototipado 7. La reutilización en

Más detalles

Minería de Datos. Vallejos, Sofia

Minería de Datos. Vallejos, Sofia Minería de Datos Vallejos, Sofia Contenido Introducción: Inteligencia de negocios (Business Intelligence). Descubrimiento de conocimiento en bases de datos (KDD). Minería de Datos: Perspectiva histórica.

Más detalles

SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA

SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA Qué es inteligencia de negocios? (BI) Business Intelligence es la habilidad para transformar los datos en información, y la información en

Más detalles

CICLO DE VIDA DEL SOFTWARE. Una aproximación lógica a la adquisición, el suministro, el desarrollo, la explotación y el mantenimiento del software

CICLO DE VIDA DEL SOFTWARE. Una aproximación lógica a la adquisición, el suministro, el desarrollo, la explotación y el mantenimiento del software 3.010 CONCEPTO DE CICLO DE VIDA Una aproximación lógica a la adquisición, el suministro, el desarrollo, la explotación y el mantenimiento del software IEEE 1074 Un marco de referencia que contiene los

Más detalles

Introducción a la Minería de Datos (Data Mining)

Introducción a la Minería de Datos (Data Mining) a la Minería de Datos (Data Mining) IT-Nova Facultad de Ingeniería Informática y Telecomunicaciones Iván Amón Uribe, MSc Minería de Datos Diapositivas basadas parcialmente en material de Inteligencia Analítica

Más detalles

Inteligencia en Redes de Comunicaciones. Tema 7 Minería de Datos. Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda

Inteligencia en Redes de Comunicaciones. Tema 7 Minería de Datos. Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda Inteligencia en Redes de Comunicaciones Tema 7 Minería de Datos Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda {jvillena, rcrespo, rueda}@it.uc3m.es Índice Definición y conceptos

Más detalles

Tema 2. Ingeniería del Software I feliu.trias@urjc.es

Tema 2. Ingeniería del Software I feliu.trias@urjc.es Tema 2 Ciclo de vida del software Ingeniería del Software I feliu.trias@urjc.es Índice Qué es el ciclo de vida del Software? El Estándar 12207 Modelos de proceso Qué es el Ciclo de Vida del SW? Definición

Más detalles

Habits España Geomarketing y segmentación

Habits España Geomarketing y segmentación Habits España Geomarketing y segmentación Qué es Habits? Habits es una base de datos que contiene una completa descripción de la población española y su precisa localización geográfica. Esta información

Más detalles

Escuela Politécnica Superior. Proyectos de Desarrollo Software. Capítulo 5. daniel.tapias@uam.es. Dr. Daniel Tapias Curso 2014/ 15 PROYECTOS

Escuela Politécnica Superior. Proyectos de Desarrollo Software. Capítulo 5. daniel.tapias@uam.es. Dr. Daniel Tapias Curso 2014/ 15 PROYECTOS Escuela Politécnica Superior Proyectos de Desarrollo Software Capítulo 5 Dr. Daniel Tapias Curso 2014/ 15 daniel.tapias@uam.es PROYECTOS PROGRAMA DE LA ASIGNATURA Capítulo 1: Introducción. Capítulo 2:

Más detalles

Aplicaciones prácticas de Minería de Datos con IBM SPSS Modeler

Aplicaciones prácticas de Minería de Datos con IBM SPSS Modeler Álvaro J. Méndez Services Engagement Manager IBM SPSS / Profesor Econometría UAM Jecas, 22 Oct 2010 Aplicaciones prácticas de Minería de Datos con IBM SPSS Modeler Business Analytics software Agenda Minería

Más detalles

PORTFOLIO APLICA.DÀT. Business Intelligence. Que veo y que hay

PORTFOLIO APLICA.DÀT. Business Intelligence. Que veo y que hay Soluciones de Gestión para extraer provecho de los datos. (Business Intelligence, Cuadro de Mando i Calidad de datos) Que veo y que hay PORTFOLIO Business Intelligence Tiene infinidad de datos. No tiene

Más detalles

Introducción a los Algoritmos Genéticos

Introducción a los Algoritmos Genéticos Introducción a los Algoritmos Genéticos Francisco José Ribadas Pena INTELIGENCIA ARTIFICIAL 5 Informática ribadas@uvigo.es 17 de octubre de 2005 c FJRP 2005 ccia IA Métodos de 8 < : 1 Introducción 9 =

Más detalles

1.1 Titulo Descriptivo del Proyecto

1.1 Titulo Descriptivo del Proyecto 1.1 Titulo Descriptivo del Proyecto Diseño de un Manual empleando Data Mining (Minería de Datos) para predecir el Potencial de Desarrollo de las empresas en la Zona Oriental asociadas a la Comisión Nacional

Más detalles

INGENIERÍA DEL SOFTWARE

INGENIERÍA DEL SOFTWARE INGENIERÍA DEL SOFTWARE Sesión No. 2 Nombre: Procesos de ingeniería del software INGENIERÍA DEL SOFTWARE 1 Contextualización La ingeniería de software actualmente es muy importante, pues con los avances

Más detalles

&$3Ì78/2 $/*25,7026 (92/87,926 $9$1=$'26 3$5$ 763 6.1. INTRODUCCIÓN

&$3Ì78/2 $/*25,7026 (92/87,926 $9$1=$'26 3$5$ 763 6.1. INTRODUCCIÓN &$3Ì78/2 6.1. INTRODUCCIÓN Los primeros avances para solucionar el TSP, por medio de Algoritmos Evolutivos han sido introducidos por Goldberg y Lingle en [68] y Grefenstette en [72]. En éste área muchos

Más detalles

Propuesta Matriz de Actividades para un Ciclo de Vida de Explotación de Datos

Propuesta Matriz de Actividades para un Ciclo de Vida de Explotación de Datos Propuesta Matriz de Actividades para un Ciclo de Vida de Explotación de Datos Britos, P. 1,2 ; Fernández, E. 2,1 ; García Martínez, R 1,2 1 Centro de Ingeniería del Software e Ingeniería del Conocimiento.

Más detalles

ALGORITMOS GENÉTICOS

ALGORITMOS GENÉTICOS Arranz de la Peña, Jorge Universidad Carlos III 100025106@alumnos.uc3m.es ALGORITMOS GENÉTICOS Parra Truyol, Antonio Universidad Carlos III 100023822@alumnos.uc3m.es En este documento se pretende analizar

Más detalles

Algoritmos Genéticos. Introduccion a la Robótica Inteligente

Algoritmos Genéticos. Introduccion a la Robótica Inteligente Algoritmos Genéticos Introduccion a la Robótica Inteligente 7 Marzo 2014 (IRIN) AGs 7/03/2014 1 / 43 Índice 1 Introducción 2 Algoritmos Genéticos 3 Algunos Fundamentos Matemáticos 4 Conclusiones (IRIN)

Más detalles

Un algoritmo genético híbrido para resolver el EternityII. Rico, Martin; Ros, Rodrigo Directora: Prof. Dra. Irene Loiseau

Un algoritmo genético híbrido para resolver el EternityII. Rico, Martin; Ros, Rodrigo Directora: Prof. Dra. Irene Loiseau Un algoritmo genético híbrido para resolver el EternityII Rico, Martin; Ros, Rodrigo Directora: Prof. Dra. Irene Loiseau Temas Temas Introducción Eternity II Historia Descripción Demo Metaheurísticas Algoritmos

Más detalles

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING Aprendizaje Automático y Data Mining Bloque IV DATA MINING 1 Índice Definición y aplicaciones. Grupos de técnicas: Visualización. Verificación. Descubrimiento. Eficiencia computacional. Búsqueda de patrones

Más detalles

TEMA 2 LA GESTIÓN DE MARKETING EN LAS ORGANIZACIONES

TEMA 2 LA GESTIÓN DE MARKETING EN LAS ORGANIZACIONES TEMA 2 LA GESTIÓN DE MARKETING EN LAS ORGANIZACIONES 2.1. SUBSISTEMA COMERCIAL O DE MARKETING Vamos a considerar la empresa con el enfoque de la Teoría General de Sistemas. Comenzando con la definición

Más detalles

INTRODUCCIÓN A LA COMPUTACION EN LA NUBE Y BIG DATA (1) Ing. Carlos Ormella Meyer

INTRODUCCIÓN A LA COMPUTACION EN LA NUBE Y BIG DATA (1) Ing. Carlos Ormella Meyer INTRODUCCIÓN A LA COMPUTACION EN LA NUBE Y BIG DATA (1) Ing. Carlos Ormella Meyer En los últimos años, el interés por la Computación en la Nube (Cloud Computing), tanto para uso personal como para negocios,

Más detalles

TEMA 1. Introducción

TEMA 1. Introducción TEMA 1. Introducción Francisco José Ribadas Pena, Santiago Fernández Lanza Modelos de Razonamiento y Aprendizaje 5 o Informática ribadas@uvigo.es, sflanza@uvigo.es 28 de enero de 2013 1.1 Aprendizaje automático

Más detalles

UNIDAD 2. ADMINISTRACIÓN DE LA RELACIÓN CON EL CLIENTE (CRM)

UNIDAD 2. ADMINISTRACIÓN DE LA RELACIÓN CON EL CLIENTE (CRM) UNIDAD 2. ADMINISTRACIÓN DE LA RELACIÓN CON EL CLIENTE (CRM) Objetivos Al finalizar la unidad el alumno deberá conocer los antecedentes, el origen, los objetivos, los diferentes tipos y las estrategias

Más detalles

CUALIFICACIÓN SISTEMAS DE GESTIÓN DE INFORMACIÓN PROFESIONAL. Nivel 3. Versión 5 Situación RD 1201/2007 Actualización

CUALIFICACIÓN SISTEMAS DE GESTIÓN DE INFORMACIÓN PROFESIONAL. Nivel 3. Versión 5 Situación RD 1201/2007 Actualización Página 1 de 16 CUALIFICACIÓN SISTEMAS DE GESTIÓN DE INFORMACIÓN PROFESIONAL Familia Profesional Informática y Comunicaciones Nivel 3 Código IFC304_3 Versión 5 Situación RD 1201/2007 Actualización Competencia

Más detalles

Un comité de la organización ANSI (American National Standards Institute) aborda la problemática del almacenamiento de datos para su procesamiento en

Un comité de la organización ANSI (American National Standards Institute) aborda la problemática del almacenamiento de datos para su procesamiento en 15/05/2012 1 Un comité de la organización ANSI (American National Standards Institute) aborda la problemática del almacenamiento de datos para su procesamiento en aplicaciones informáticas en 1975. 2 Como

Más detalles

Introducción al DataMining

Introducción al DataMining Introducción al DataMining Lluís Garrido garrido@ecm.ub.es Universitat de Barcelona Índice Qué es el DataMining? Qué puede hacer el DataMining? Cómo hacer el DataMining? Técnicas Metodología del DataMining

Más detalles

Procesamiento Digital de Imágenes. Pablo Roncagliolo B. Nº 22. Algoritmos Genéticos. prb@2007 2

Procesamiento Digital de Imágenes. Pablo Roncagliolo B. Nº 22. Algoritmos Genéticos. prb@2007 2 Procesamiento Digital de Imágenes Pablo Roncagliolo B. Nº 22 prb@2007 2 1 El núcleo de cada célula humana contiene una base de datos química. Esta base de datos contiene todas las instrucciones que la

Más detalles

MINERÍA DE DATOS Y DESCUBRIMIENTO DE CONOCIMIENTO (DATA MINING AND KNOWLEDGE DISCOVERY)

MINERÍA DE DATOS Y DESCUBRIMIENTO DE CONOCIMIENTO (DATA MINING AND KNOWLEDGE DISCOVERY) MINERÍA DE DATOS Y DESCUBRIMIENTO DE CONOCIMIENTO (DATA MINING AND KNOWLEDGE DISCOVERY) Autor: Lic. Manuel Ernesto Acosta Aguilera Entidad: Facultad de Economía, Universidad de La Habana Dirección: Edificio

Más detalles

Gestión y Desarrollo de Requisitos en Proyectos Software

Gestión y Desarrollo de Requisitos en Proyectos Software Gestión y Desarrollo de Requisitos en Proyectos Software Ponente: María Jesús Anciano Martín Objetivo Objetivo Definir un conjunto articulado y bien balanceado de métodos para el flujo de trabajo de Ingeniería

Más detalles

9.1.Los sistemas expertos. 9.2.Las redes neuronales artificiales. 9.3.Sistemas de inducción de reglas y árboles de decisión.

9.1.Los sistemas expertos. 9.2.Las redes neuronales artificiales. 9.3.Sistemas de inducción de reglas y árboles de decisión. TEMA 9 TÉCNICAS DE INTELIGENCIA ARTIFICIAL PARA EL ANÁLISIS DE LA INFORMACIÓN CONTABLE 9.1.Los sistemas expertos. 9.2.Las redes neuronales artificiales. 9.3.Sistemas de inducción de reglas y árboles de

Más detalles

Programación Genética

Programación Genética Programación Genética Programación Genética consiste en la evolución automática de programas usando ideas basadas en la selección natural (Darwin). No sólo se ha utilizado para generar programas, sino

Más detalles

STATISTICAL PROCESS CONTROL: MANUAL REFERENCIA QS 9000

STATISTICAL PROCESS CONTROL: MANUAL REFERENCIA QS 9000 STATISTICAL PROCESS CONTROL: MANUAL REFERENCIA QS 9000 SECCIÓN 2: SISTEMA DE CONTROL 1.- Proceso: Se entiende por proceso, la combinación de suministradores, productores, personas, equipos, imputs de materiales,

Más detalles

Introducción. Francisco J. Martín Mateos. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla

Introducción. Francisco J. Martín Mateos. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Francisco J. Martín Mateos Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Qué es la (KE)? Definición de Wikipedia: La es una disciplina cuyo objetivo es integrar conocimiento

Más detalles

Ingeniería de Software I

Ingeniería de Software I Ingeniería de Software I Agenda Objetivo. Unidades de aprendizaje. Formas de evaluación. Bibliografía. 2 Datos del profesor Correo electrónico: egonzalez@upemor.edu.mx Asesorías Jueves de 11:00 a 13:00

Más detalles

MODELACION Y ANALISIS DE PROCESOS EMPRESARIALES MAPE

MODELACION Y ANALISIS DE PROCESOS EMPRESARIALES MAPE MODELACION Y ANALISIS DE PROCESOS EMPRESARIALES MAPE Thomas A. Little Ph. D Traducción Autorizada por el Autor. Traductor: MANUEL H RAMIREZ Alta Via Consulting-América Latina La Modelación y Análisis de

Más detalles

SOLUCIÓN CASO CÁLCULO DE GASTOS DE VIAJE

SOLUCIÓN CASO CÁLCULO DE GASTOS DE VIAJE SOLUCIÓN CASO CÁLCULO DE GASTOS DE VIAJE La cumplimentación del parte de dietas requerirá de la introducción de algunos datos como: el nombre del empleado, la fecha de inicio del viaje, la fecha de finalización,

Más detalles

UNIDAD DIDÁCTICA 7 ANÁLISIS DE ÍTEMS Y BAREMACIÓN DE UN TEST

UNIDAD DIDÁCTICA 7 ANÁLISIS DE ÍTEMS Y BAREMACIÓN DE UN TEST UNIDAD DIDÁCTICA 7 ANÁLISIS DE ÍTEMS Y BAREMACIÓN DE UN TEST 7.1. ANÁLISIS DE LOS ÍTEMS Al comenzar la asignatura ya planteábamos que uno de los principales problemas a los que nos enfrentábamos a la hora

Más detalles

LOS ESTUDIOS DE ENCUESTA

LOS ESTUDIOS DE ENCUESTA UAM Métodos de Investigación en Educación Especial Curso 2009/10 LOS ESTUDIOS DE ENCUESTA AMANDA GONZÁLEZ VANESA CALLEJA LETICIA LÓPEZ PATRICIA PADRINO PATRICIA PUEBLA 1. ESTUDIOS DE ENCUESTA. UN ESTUDIO

Más detalles

GUÍA DE USO. Copyright 2009 AGORA Team Tech, S.L. Todos los derechos reservados.

GUÍA DE USO. Copyright 2009 AGORA Team Tech, S.L. Todos los derechos reservados. GUÍA DE USO Copyright 2009 AGORA Team Tech, S.L. Todos los derechos reservados. ÍNDICE Pág. 1. Introducción. 2. Desarrollo de la competición. 3. La empresa.. 3.1 Gestión comercial. 3.2 Gestión financiera.

Más detalles

Simulación y Modelos Estocásticos

Simulación y Modelos Estocásticos y Modelos Estocásticos Héctor Allende O!"# $# %#&' ( ) *+,-+,,*,/ ) -++,,*,/ ) 0 1 %*++,,*,/ $2,/ 04 %! 2! 5,,#6)5 1 Conceptos básicos: fundamentos de modelos de simulación y del modelado de sistemas complejos,

Más detalles

Preguntas y respuestas (rebatibles) sobre metodologías de desarrollo de software

Preguntas y respuestas (rebatibles) sobre metodologías de desarrollo de software Preguntas y respuestas (rebatibles) sobre metodologías de desarrollo de software Introducción Este documento recopila las preguntas, opiniones y respuestas que se produjeron en un pequeño curso sobre las

Más detalles

OPTIMIZACIÓN DE TRANSFORMACIONES LINEALES DE DATOS MEDIANTE BUSQUEDA LOCAL

OPTIMIZACIÓN DE TRANSFORMACIONES LINEALES DE DATOS MEDIANTE BUSQUEDA LOCAL OPTIMIZACIÓN DE TRANSFORMACIONES LINEALES DE DATOS MEDIANTE BUSQUEDA LOCAL INGENIERIA INFORMATICA AUTOR: FRANCISCO GODOY MUÑOZ-TORRERO TUTOR: JOSE MARIA VALLS FERRAN CO-DIRECTOR: RICARDO ALER MUR Contenidos

Más detalles

Portafolio de Servicios y Productos

Portafolio de Servicios y Productos Portafolio de Servicios y Productos Introducción Somos una empresa que se dedica a generar ventajas competitivas para nuestros clientes a través de desarrollos y consultoría en inteligencia de negocios

Más detalles

INTRODUCCION A LA CONTABILIDAD DE COSTES

INTRODUCCION A LA CONTABILIDAD DE COSTES INTRODUCCION A LA CONTABILIDAD DE COSTES PROYECTO REALIZADO POR: ENTIDAD GESTORA: COFINANCIADO POR: PROYECTO 1. Introducción REALIZADO POR: ENTIDAD GESTORA: COFINANCIADO POR: 1. INTRODUCCIÓN La contabilidad

Más detalles

La investigación de mercado VÍA CONTACT CENTER DOSSIER >>

La investigación de mercado VÍA CONTACT CENTER DOSSIER >> STOCK PHOTOS La investigación de mercado VÍA CONTACT CENTER La encuesta telefónica es la fórmula utilizada por el contact center para la realización de investigación de mercado (fundamentalmente de campo);

Más detalles

5.- ANÁLISIS DE RIESGO

5.- ANÁLISIS DE RIESGO 5.- ANÁLISIS DE RIESGO El módulo de Análisis de Riesgo se caracteriza por desarrollar una herramienta formativa para la gestión, que permite al usuario identificar, analizar y cuantificar el riesgo de

Más detalles

1.- Quiénes somos? 2.- Red de agencias. 3.- Por qué una franquicia? 4.- Por qué una franquicia inmobiliaria? 5.- Por qué vive?

1.- Quiénes somos? 2.- Red de agencias. 3.- Por qué una franquicia? 4.- Por qué una franquicia inmobiliaria? 5.- Por qué vive? Franquicias 1.- 2.- Red de agencias 3.- Por qué una franquicia? 4.- Por qué una franquicia inmobiliaria? 5.- Por qué vive? 6.- Perfil de franquiciado 7.- Su gran oportunidad Grupo vive Soluciones Inmobiliarias

Más detalles

Resumen. 1. Introducción. 2. Objetivos

Resumen. 1. Introducción. 2. Objetivos Propuesta para la Asignatura Sistemas Industriales en las Titulaciones de Informática F.A. Pujol, F.J. Ferrández, J.L. Sánchez, J. M. García Chamizo Dept. de Tecnología Informática y Computación Universidad

Más detalles

Minería de Datos. Vallejos, Sofia

Minería de Datos. Vallejos, Sofia Minería de Datos Contenido Introducción: Inteligencia de negocios (Business Intelligence). Componentes Descubrimiento de conocimiento en bases de datos (KDD). Minería de Datos: Perspectiva histórica. Fases

Más detalles

INICIATIVA BAPPLAB: SUGAR CRM 2012 INICIATIVA BAPPLAB: SUGAR CRM, COMO ACTIVIDAD DE LIBRE ELECCIÓN PARA ESTUDIANTES DE CIENCIAS ECONÓMICAS

INICIATIVA BAPPLAB: SUGAR CRM 2012 INICIATIVA BAPPLAB: SUGAR CRM, COMO ACTIVIDAD DE LIBRE ELECCIÓN PARA ESTUDIANTES DE CIENCIAS ECONÓMICAS INICIATIVA BAPPLAB: SUGAR CRM, COMO ACTIVIDAD DE LIBRE ELECCIÓN PARA ESTUDIANTES DE CIENCIAS ECONÓMICAS FAMILIARIZACIÓN CON LA PLATAFORMA BAJO MODALIDAD SEMIPRESENCIAL SALCEDO FERRAGGINE, MARÍA A.- MARINO,

Más detalles

1. COMPRENDE LOS VERDADEROS BENEFICIOS Y COMPÁRTELOS

1. COMPRENDE LOS VERDADEROS BENEFICIOS Y COMPÁRTELOS C omo todo nuevo proyecto, emprender la digitalización o captura de los documentos en papel de tu empresa requiere una estrategia a seguir que garantice un buen resultado. Si bien, el manejo masivo de

Más detalles

ORGANIZACIÓN DE LOS SERVICIOS INFORMÁTICOS

ORGANIZACIÓN DE LOS SERVICIOS INFORMÁTICOS 1 ORGANIZACIÓN DE LOS SERVICIOS INFORMÁTICOS INTRODUCCIÓN La realización de trabajos utilizando los medios informáticos de una empresa requiere una cierta organización y destreza relativa tanto a los equipos,

Más detalles

Simulación Discreta Estocástica Tutor: Deivis Galván

Simulación Discreta Estocástica Tutor: Deivis Galván Capitulo 1 Simulación Discreta Estocástica Tutor: Deivis Galván OBJETIVOS Al aprobar la asignatura el alumno será capaz de: Conocer, comprender y aplicar los principios del modelado de sistemas complejos

Más detalles

LA GESTIÓN DE PROYECTOS EN LAS EMPRESAS: UNA EXPERIENCIA ENRIQUECEDORA PARA LOS ALUMNOS DE TELECOMUNICACIONES EN LA EUPM

LA GESTIÓN DE PROYECTOS EN LAS EMPRESAS: UNA EXPERIENCIA ENRIQUECEDORA PARA LOS ALUMNOS DE TELECOMUNICACIONES EN LA EUPM LA GESTIÓN DE PROYECTOS EN LAS EMPRESAS: UNA EXPERIENCIA ENRIQUECEDORA PARA LOS ALUMNOS DE TELECOMUNICACIONES EN LA EUPM Rosa Giralt, Pere Palà, Francisco del Águila, Jordi Bonet Escola Universitària Politècnica

Más detalles

INGENIERIA DE SOFTWARE I INTRODUCCIÓN A LA INGENIERIA DE SOFTWARE

INGENIERIA DE SOFTWARE I INTRODUCCIÓN A LA INGENIERIA DE SOFTWARE INGENIERIA DE SOFTWARE I INTRODUCCIÓN A LA INGENIERIA DE SOFTWARE Agenda El software. Definición de software Dominios de aplicación Software heredado La naturaleza de las webapps Ingeniería del software

Más detalles

TEMA : MEDICION - REQUISITOS- PROCEDIMIENTO PARA CONSTRUIR UN INSTRUMENTO DE MEDICION

TEMA : MEDICION - REQUISITOS- PROCEDIMIENTO PARA CONSTRUIR UN INSTRUMENTO DE MEDICION TEMA : MEDICION - REQUISITOS- PROCEDIMIENTO PARA CONSTRUIR UN INSTRUMENTO DE MEDICION Resumen Cap. 8 del libro Introducción a la Investigación Pedagógica de Ary, Jacobs y Razavieh y cap 9. del libro Metodología

Más detalles

Microsoft Dynamics AX for Dealers La gestión de las empresas del sector de la automoción

Microsoft Dynamics AX for Dealers La gestión de las empresas del sector de la automoción Microsoft Dynamics AX for Dealers La gestión de las empresas del sector de la automoción Solución global Contexto actual Las empresas del sector de la automoción tienen la necesidad de mejorar la gestión

Más detalles

2.- MODELADO DE SOLIDOS. En este capítulo comenzaremos exponiendo conceptos genéricos de sistemas de Cad, así como nociones de modelado de sólidos. Finalizaremos con dos ejemplos que ilustran el procedimiento

Más detalles

LOS INDICADORES DE GESTIÓN

LOS INDICADORES DE GESTIÓN LOS INDICADORES DE GESTIÓN Autor: Carlos Mario Pérez Jaramillo Todas las actividades pueden medirse con parámetros que enfocados a la toma de decisiones son señales para monitorear la gestión, así se asegura

Más detalles

Curso Práctico de INTELIGENCIA EMOCIONAL en el CRM y el Servicio al Cliente. Módulo 1

Curso Práctico de INTELIGENCIA EMOCIONAL en el CRM y el Servicio al Cliente. Módulo 1 Curso Práctico de INTELIGENCIA EMOCIONAL en el CRM y el Servicio al Cliente Módulo 1 Lectura Principal CRM COMO UN MODELO DE MÁXIMA RENTABILIDAD LOS ÉXITOS DE HOY SON EL FRUTO DE LAS DECISIONES DE AYER

Más detalles

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE CONTADURIA Y ADMINISTRACIÓN. Construcción de sitios web comerciales

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE CONTADURIA Y ADMINISTRACIÓN. Construcción de sitios web comerciales UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE CONTADURIA Y ADMINISTRACIÓN Construcción de sitios web comerciales Tema I E-business 1.3 Concepto de e Presenta: ING. y M.A.. RENÉ MONTESANO BRAND Objetivo.

Más detalles

Control del Stock, aprovisionamiento y distribución a tiendas.

Control del Stock, aprovisionamiento y distribución a tiendas. Control del Stock, aprovisionamiento y distribución a tiendas. Tan importante como el volumen de ventas y su rentabilidad, el control del stock supone uno de los pilares fundamentales en el éxito de una

Más detalles

Capítulo 4. Requisitos del modelo para la mejora de la calidad de código fuente

Capítulo 4. Requisitos del modelo para la mejora de la calidad de código fuente Capítulo 4. Requisitos del modelo para la mejora de la calidad de código fuente En este capítulo definimos los requisitos del modelo para un sistema centrado en la mejora de la calidad del código fuente.

Más detalles

www.fundibeq.org Además, se recomienda su uso como herramienta de trabajo dentro de las actividades habituales de gestión.

www.fundibeq.org Además, se recomienda su uso como herramienta de trabajo dentro de las actividades habituales de gestión. DIAGRAMA DE FLECHAS 1.- INTRODUCCIÓN Este documento sirve de guía para el proceso de planificación de proyectos. Describe desde la visualización de la secuencia de acciones a desarrollar en dichos proyectos

Más detalles

Ciclo de vida del Software

Ciclo de vida del Software Tema 2: Ciclo de vida del Software Marcos López Sanz Índice Qué es el ciclo de vida del Software? La norma 12207-2008 Modelos de desarrollo Qué es el Ciclo de Vida del SW? Es una sucesión de etapas por

Más detalles

DATA WAREHOUSE DATA WAREHOUSE

DATA WAREHOUSE DATA WAREHOUSE DATA WAREHOUSE DATA WAREHOUSE Autor: Roberto Abajo Alonso Asignatura: Sistemas Inteligentes, 5º Curso Profesor: José Carlos González Dep. Ing. Sistemas Telemáticos, E.T.S.I. Telecomunicación Universidad

Más detalles

CRITERIOS DE EVALUACIÓN

CRITERIOS DE EVALUACIÓN CRITERIOS DE EVALUACIÓN MÓDULO PROFESIONAL: APLICACIONES WEB CICLO: SISTEMAS MICROINFORMÁTICOS Y REDES NIVEL: FORMACIÓN PROFESIONAL DE GRADO MEDIO CURSO: 2º FAMILIA PROFESIONAL: INFORMÁTICA IES: IES JORGE

Más detalles

SERIES DOCENTES TN-CCG-01

SERIES DOCENTES TN-CCG-01 SERIES DOCENTES TN-CCG-01 Sistemas de Costos Autor: Antonio Farías Landabur Ayudante Colaborador: Marco Lang www.managementcontrol.cl Departamento de Control de Gestión y Sistemas de Información Facultad

Más detalles

RAID. Los detalles de las características segunda y tercera, cambian según los distintos niveles RAID. RAID 0 no soporta la tercera característica.

RAID. Los detalles de las características segunda y tercera, cambian según los distintos niveles RAID. RAID 0 no soporta la tercera característica. RAID Como se dijo anteriormente, el ritmo de mejora de prestaciones en memoria secundaria ha sido considerablemente menor que en procesadores y en memoria principal. Esta desigualdad ha hecho, quizás,

Más detalles