CONSIDERACIONES GENERALES DEL WEB MINING



Documentos relacionados
Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322

MINING SOLUTIONS LIMITADA

Web mining y obtención de información para la generación de

MÓDULO IV INTERNET: ESTRATEGIAS DE BÚSQUEDA DE INFORMACIÓN ACADÉMICA PROGRAMA DE EDUCACIÓN EN INFORMACIÓN

Proceso del KDD (minería de datos o DataMining)

Mesa de Ayuda Interna

Índice INTERNET MARKETING 1

activuspaper Text Mining and BI Abstract

CONSTRUCCIÓN DEL PROCESO MESA DE AYUDA INTERNA. BizAgi Process Modeler

Google Analytics Y Herramientas para Webmasters

PROPÓSITO... 2 DETERMINANTES PARA UNA BUENA EXPERIENCIA DE USO...

Ofrece soluciones a través de una variedad de servicios que van de acuerdo a las necesidades de cada cliente.

Qué es una página web?, qué conoces al respecto?, sabes crear una página

HERRAMIENTAS TECNOLOGICAS DE GESTION EMPRESARIAL. Profesor: Dr.Alberto Un Han Alumnos: Enrique Huaco, Lino Mejia y Jaime Ballon

TEMA 4: EMPEZANDO A NAVEGAR ESCUELA UNIVERSITARIA DE INFORMÁTICA. Raúl Martín Martín

MANUAL DE USUARIO APLICACIÓN SYSACTIVOS

Web. Web Diapositiva 1. Febrero 2010

REGISTRO DE EMPRESAS Y PERSONAS BASE DE INFORMACIÓN DE CLIENTES & CONTACTOS

Resumen de la Tesina. Autor: Adrià Batet López. Tutor: Víctor Pascual Ayats

Objetivos del proyecto:

GuÍa rápida de uso. westlaw chile

Sistemas de Gestión de Documentos Electrónicos de Archivo (SGDEA)

Mi Negocio en Línea. DESCRIPCIÓN y CONCEPTO DEL PRODUCTO

Propuesta Técnica y Económica

La Web Semántica como herramienta para e-learning

Entre las principales ventajas que aporta la utilización Internet en las gestiones con clientes están las siguientes:

OFICINA VIRTUAL SIS MANUAL DE TUTOR

Seven ERP Guía De Referencia - Imágenes

Gestión de campañas Marketing. Entrenamiento en Ventas Pymes

Proceso Creación de Páginas Web

GUÍA BÁSICA USUARIO MOODLE 2.6

ing Solution La forma más efectiva de llegar a sus clientes.

Artículo dedicado a la Innovación y Mejores Prácticas en la Ingeniería de Negocios

Presentación del Data Monitor de Sedex Nuestra interesante nueva gama de herramientas de creación de informes

USO DE LA TECNOLOGIA COMO RECURSO PARA LA ENSEÑANZA. Sistema de búsqueda en Internet. Mtro. Julio Márquez Rodríguez

La inteligencia de marketing que desarrolla el conocimiento

II. Relación con Terceros

ADT CONSULTING S.L. PROYECTO DE DIFUSIÓN DE BUENAS PRÁCTICAS

Es necesario conocer otras dos herramientas de búsqueda en Internet: los «metabuscadores» ó «motores de búsqueda» y los «portales».

UNIVERSIDAD DR. JOSE MATIAS DELGADO Facultad de Economía, Empresas y Negocios

CASO 3-5 EUROPEAN ALCOHOL RESEARCH FOUNDATION

BearSoft. SitodeCloud. Rafael Rios Bascón Web: Móvil:

CRECE EN INTERNET. Llegar a buen puerto: buscando información

Los servicios más comunes son como por ejemplo; el correo electrónico, la conexión remota, la transferencia de ficheros, noticias, etc.

Los motores de búsqueda.

Windows Server 2012 Manejabilidad y automatización. Module 3: Adaptación del Administrador de servidores a sus necesidades

Windows Server 2012: Infraestructura de Escritorio Virtual

Reflexión. Inicio. Contenido

Medición de resultados. capítulo 07

"Diseño, construcción e implementación de modelos matemáticos para el control automatizado de inventarios

Sencillo: Usuarios no técnicos crean y publican encuestas profesionales.

Política de cookies. la utilización de cookies en las webs y aplicaciones de PERSONLIG-GUIDE-

Página 1 EVALUACIÓN DE CONTENIDOS DE SITIOS WEB EVALUACIÓN DE CONTENIDOS DE SITIOS WEB. Adaptación del Test de Alexander & Tate 1

Base de datos II Facultad de Ingeniería. Escuela de computación.

PROPUESTA DE DESARROLLO DE SITIO WEB AVANZADO


La interoperabilidad se consigue mediante la adopción de estándares abiertos. Las organizaciones OASIS y W3C son los comités responsables de la

PROCEDIMIENTO PARA CONTROL DE REGISTROS

ESPACIOS DE COMUNICACIÓN VIRTUAL

Informe de. posicionamiento online

ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL Facultad de Ingeniera en Electricidad y Computación


PROCEDIMIENTO ESPECÍFICO. Código SB-V-01-1 Edición 0

BASE DE DATOS RELACIONALES

Análisis de tu sitio web: posicionamiento y marketing online

Windows Server 2012: Identidad y Acceso. Módulo 2: Descripción General de Windows Server 2012 Remote Desktop Services.

CAPÍTULO I INTRODUCCIÓN

CAPÍTULO I. Introducción. 1.1 Marco Contextual. El estudio de la satisfacción laboral como fenómeno vinculado a actitudes y la relación de

Gestión completa del rendimiento

Especificación de mensajes SWIFT. que desempeñen, provean en cualquier forma actividades ilegales al narcotráfico.

Cloud Security Alliance, Inc. (CSA) se atiene a los siguientes principios en relación al manejo de información personal en formato electrónico:

Seminario Electrónico de Soluciones Tecnológicas sobre VPNs de Extranets

1. Instala gestores de contenidos, identificando sus aplicaciones y configurándolos según requerimientos.

Prestaciones generales. Web corporativa del despacho

Marketing O Mercadotecnia Online. El Problema? Que su Pagina No Siga en un Desierto... Marketing O Mercadotecnia Online QUE ES?

Tema 9: Portales, Índices,

PROPUESTA DE RESOLUCIÓN ESPECÍFICA PARA LOS PROGRAMAS DE CONTADURÍA PÚBLICA.

Programa de Gestión Documental

GLOSARIO. Arquitectura: Funcionamiento, estructura y diseño de una plataforma de desarrollo.

Minería Web: un recurso insoslayable para el profesional de la información*

SAP BusinessObjects Edge BI Standard Package La solución de BI preferida para. Empresas en Crecimiento

Manual del Descubridor

S o l u c i o n e s I n f o r m a t i c a s. Soluciones a un solo clic

Contenido Derechos Reservados DIAN - Proyecto MUISCA

Capitulo 3: Metodología de Investigación.

CRM Gestión de Oportunidades Documento de Construcción Bizagi Process Modeler

MOODLE PARA ASESORES, GUIA DE APOYO.

Gestión de Permisos. Bizagi Suite. Copyright 2014 Bizagi

Transcripción:

CONSIDERACIONES GENERALES DEL WEB MINING Sandra Milena Leal Elizabeth Castiblanco Calderón* RESUMEN: el presente artículo describe los conceptos básicos para la utilización del Webmining, dentro de los cuales se encuentran técnicas (Reglas de Asociación, Patrones secuenciales, clasificación y Clustering) y áreas (minería de contenido web, minería de estructura web y minería de uso web) de mayor utilización para el descubrimiento de informacion. También se pretende exponer la importancia de la utilización de esta técnica dentro de las unidades de informacion, teniendo en cuenta que esta trabaja a partir de las necesidades de los usuarios, parte fundamental para el funcionamiento de las mismas. PALABRAS CLAVES: Webmining, Logs, Técnicas, Minería de Datos, Áreas. GENERAL CONSIDERATIONS OF WEBMINING ABSTRACT: This article describes the basic concepts for the use of Webmining, within which are techniques (Rules of Association, sequential patterns, sorting and clustering) and areas (web content mining, mining structure and mining use Web site) of greater use for the information discovery. It also aims to expose the importance of the use of this technique within units of information, bearing in mind that this works from the users' needs, essential to the operation. KEYWORDS: Webmining, Logs, Techniques, Datamining, Areas. 1

INTRODUCCIÓN Con la llegada de las tecnologías el ser humano ha evolucionado hacia una nueva sociedad, la sociedad del conocimiento, en la cual Las Tecnologías de Informacion se hacen presentes en todas las actividades del hombre; por ello es necesario que exista una actualización permanente con informacion oportuna que satisfaga sus necesidades. El usuario actualmente se enfrenta a una serie de cambios rápidos debido al acelerado crecimiento de la informacion en la web y a la globalización de la sociedad. Este crecimiento ha traído consigo informacion no relevante la cual lleva al usuario a una saturación de información, todo esto conlleva a la creación de técnicas que permitan la adecuada estructuración del contenido en la web, para que la recuperación de la informacion sea de forma ágil y oportuna. Dentro de estas técnicas se encuentra el webmining que se deriva de la minería de datos, la cual se usa para el estudio de varios aspectos esenciales de un sitio y ayuda a descubrir tendencias y relaciones en el comportamiento de los usuarios que sirven como pistas para, por ejemplo, mejorar la usabilidad de un sitio 1. Esta a su vez se divide en diferentes áreas y técnicas las cuales se presentan a continuación. ÁREAS Y TÉCNICAS La minería es una técnica aplicada al descubrimiento de patrones interesantes en la estructura, el contenido y la utilización de los sitios web 2 con el fin de identificar las tendencias de los usuarios en el uso y acceso a la informacion. Dentro de la aplicación de esta técnica se encuentran diferentes áreas que permiten el estudio de algunos componentes de la web, con el fin de proporcionar informacion personalizada a los usuarios teniendo en cuenta su perfil; dentro de las cuales encontramos: 1 http://www.webtaller.com/maletin/articulos/web-mining-diseno-sitios-web.php 2 http://www.infovis.net/printmag.php?num=172&lang=1 2

1. Web Content Mining (minería de contenido web) Este pretende obtener datos sobre el contenido y las búsquedas realizadas en los website, con el fin de extraer patrones a partir de información online, incluida en los diferentes formatos del contenido de la web tales como: texto libre, HML, HTML, multimedia y su vez identificar los patrones en los resultados de los motores de búsqueda 3 Esta técnica permite utilizar métodos para presentar los resultados de las búsquedas de forma tal que permita que el usuario seleccione las más relevantes para satisfacer sus necesidades de información, teniendo en cuenta que los motores de búsquedas no proveen información estructurada ni filtran o interpretan los documentos. 4 Como se expuso anteriormente estos problemas han llevado a la creación de herramientas inteligentes para la recuperación de información como es: agentes Web inteligentes, técnicas de bases de datos y datamining, con el fin de garantizar un mayor nivel de organización a los datos semiestructurados disponibles en la Web. 5 Dentro de las herramientas más conocidas se encuentran: Índices Buscadores que mantienen una organizació n de las páginas incluidas en su base de datos por categoría. Motores De Búsqueda Permite la recolección de páginas a través de su contenido para facilitar su clasificación. Recorre permanentem ente las Multibuscadores Se relaciona con varios buscadores con el fin de realizar una búsqueda simultánea. Ej: My search (que busca simultáneam Representación De Contenido Se hace a través de palabras clave y se pueden encontrar de forma manual o automática que permiten Agentes Inteligentes Estos trabajan teniendo en cuenta un perfil particular de un usuario y lo pueden hacer de forma 3 Ibíd. 4 Schiaffino Silvia. Descubrimiento de Conocimiento a partir de Datos. [en línea] disponible en : < 5 Ibíd. Pág 7 3

La información se encuentra contenida en un directorio que permite la organizació n de las páginas por temas y a su vez cada página posee interrelacio nes con otras páginas que contienen el mismo tema. páginas Web en busca de posibles cambios. Ej: Google y Alta vista. ente Google, Yahoo, Altavista muchos otros) en y buscar en todo el documento o por partes. Ej: titulo, y primer parágrafo. autónoma o semi - autónoma en base a un dominio dado. 2. Web Structure Mining (minería de estructura web) Se centra en usar el análisis de la estructura de links de la Web y uno de sus propósitos es identificar los documentos más importantes y más buscados para un tema. 6 Esta determina el grado de popularidad de un documento a través de links, este permite que el usuario pueda remitirse a otras páginas que le amplíen la información que esta buscando. Uno de los mecanismos relevantes para determinar la importancia de las páginas es el PageRank, este permite que los sitios más visitados y con mayor importancia sean ubicados en los primeros lugares. 6 Schiaffino Silvia. Descubrimiento de Conocimiento a partir de Datos. [en línea] disponible en : < 4

3. Web Usage Mining (minería de uso web) Identifica los patrones que determinan la forma en que los usuarios interactúan con la Web, estos patrones se determinan a través del logs que están ubicados en los servidores Web. Beneficios: Mejorar la navegación en un sitio. Permite realizar campañas de publicidad efectivas. Estructurar mejor el contenido en un sitio Web. Dirigir avisos ofertas a grupos de usuarios específicos. Para la implementación de estas áreas es necesaria la aplicación de técnicas, las cuales provienen del dataminig, dentro de las más concidas se encuentran: Reglas de Asociación Descubrir las correlaciones entre referencias a varios archivos disponibles en el servidor hechas por un mismo cliente. 7 A través de esta regla se conocen las transacciones realizadas por cada usuario, las cuales están contenidas en el Log. Teniendo en cuenta que cada transacción esta compuesta por un conjunto de URL 8. Esto permite encontrar las similitudes entre los diferentes ítems como por ejemplo: El 60% de los clientes que acceden a la página con URL /company/products/, también acceden a la página /company/products/product1.html. 9 Patrones secuenciales: Permite a las organizaciones basadas en la Web predecir los patrones de visita de los usuarios y los ayuda a dirigir las publicidades a grupos de usuarios basándose en estos patrones 10. 7 Ibíd. Pág 21 8 http://www2.ing.puc.cl/gescopp/sergio_maturana/sag/webmining.html 9 Ibid 10 Schiaffino Silvia. Descubrimiento de Conocimiento a partir de Datos. [en línea] disponible en : < 5

Esta técnica analiza la informacion contenida en el Log determinando el comportamiento de los usuarios con respecto al tiempo 11 con el fin de predecir las futuras visitas 12 y así promover con anticipación la publicidad de la página. Clasificación las técnicas de clasificación permiten definir los perfiles de los clientes que acceden a los archivos del servidor. Ejemplo: Clientes de agencias del estado o del gobierno que visitaron el sitio tienden a interesarse en la página /company/products/product1.html; 50% de los clientes que colocaron una orden online en /company/products/product2, pertenecen al grupo 20-25 años y viven en la capital. Clustering: El claustering permite agrupar clientes y elementos de datos que tienen características similares. 13 A través de esta técnica se analizan los logs de transacciones con el fin de desarrollar y ejecutar futuras estrategias de marketing, como por ejemplo el envió de correo electrónico a los clientes. CONCLUSIÓN Como se evidencio la Webmining es una técnica que sirve en la actualidad para el descubrimiento de conocimiento en el uso de la web. Uso que refleja las tendencias de los usuarios en la búsqueda y recuperación de informacion, por lo tanto esta técnica es importante por que trabaja a partir de las necesidades propias de los usuarios. Seria importante que las unidades de información conocieran esta técnica con el fin de ofrecer mejores servicios en pro de generar mayor acceso a los recursos, teniendo en cuenta que estos se encuentran en diferentes formatos. Es por esta 11 http://www2.ing.puc.cl/gescopp/sergio_maturana/sag/webmining.html 12 Ibíd. 13 Schiaffino Silvia. Descubrimiento de Conocimiento a partir de Datos. [en línea] disponible en : < 6

razón que los profesionales de la informacion deben conocer y aplicar estas técnicas para garantizar que la informacion se ajuste a las necesidades de los usuarios. BIBLIOGRAFÍA Dürsteler, Juan C. Minería Web [en línea] disponible en: <http://www.infovis.net/printmag.php?num=172&lang=1> Explotación de datos del webmining [en línea] disponible en: <http://gamoreno.wordpress.com/2007/08/24/explotacion-de-datos-del-web-mining/ > Koblinc, Gustavo D. Web Mining: Estado Actual de Investigación. [en línea] Disponible en: http://www2.ing.puc.cl/gescopp/sergio_maturana/sag/webmining.html MENESES, Esteban. Web Mining [en línea] disponible en: http://www.geocities.com/emenesesr/recursos/webmining.pdf**** Webmining en el diseño de sitios web [en línea] disponible en: <http://www.webtaller.com/maletin/articulos/web-mining-diseno-sitios-web.php> Schiaffino Silvia. Descubrimiento de Conocimiento a partir de Datos. [en línea] disponible en : < http://www.exa.unicen.edu.ar/catedras/dbdiscov/clase4.pdf> consultada 27 octubre 2007. 7