Django, Backlink, Redis, tecnología Comet, capa middleware.



Documentos relacionados
Título del Proyecto: Sistema Web de gestión de facturas electrónicas.

Este proyecto tiene como finalidad la creación de una aplicación para la gestión y explotación de los teléfonos de los empleados de una gran compañía.

Diseño de un directorio Web de diseñadores gráficos, ilustradores y fotógrafos.

Contents. Introduction. Aims. Software architecture. Tools. Example

Sistema basado en firma digital para enviar datos por Internet de forma segura mediante un navegador.

MANUAL EASYCHAIR. A) Ingresar su nombre de usuario y password, si ya tiene una cuenta registrada Ó

Diseño ergonómico o diseño centrado en el usuario?

Agustiniano Ciudad Salitre School Computer Science Support Guide Second grade First term

Sistema de Control Domótico

Sistemas de impresión y tamaños mínimos Printing Systems and minimum sizes

Creating your Single Sign-On Account for the PowerSchool Parent Portal

ADAPTACIÓN DE REAL TIME WORKSHOP AL SISTEMA OPERATIVO LINUX

Volatilidad: Noviembre 2010 Futuros Frijol de Soya

TOUCH MATH. Students will only use Touch Math on math facts that are not memorized.

LUIS GERARDO RUIZ AGUDELO

SISTEMA DE GESTIÓN Y ANÁLISIS DE PUBLICIDAD EN TELEVISIÓN

DISEÑO DE UN PLC DOMÉSTICO UTILIZANDO UN MICROCONTROLADOR PIC-18F4550

ANÁLISIS Y DESARROLLO DE UNA PLATAFORMA BIG DATA

Kuapay, Inc. Seminario Internacional Modernización de los medios de pago en Chile

PROYECTO - WLAB. SISTEMA DE CONTROL REMOTO EN TIEMPO REAL DE EQUIPOS DE LABOROTORIO AUTORA: Sara Mira Fernández. Resumen

DISEÑO DE UN CRONOTERMOSTATO PARA CALEFACCIÓN SOBRE TELÉFONOS MÓVILES. Entidad Colaboradora: ICAI Universidad Pontificia Comillas.

UNIVERSIDAD TECNOLÓGICA EQUINOCCIAL DIRECCIÓN GENERAL DE POSGRADOS MAGÍSTER EN GERENCIA DE NEGOCIOS. Trabajo de grado para la obtención del título de:

SIGUIENDO LOS REQUISITOS ESTABLECIDOS EN LA NORMA ISO Y CONOCIENDO LAS CARACTERISTICAS DE LA EMPRESA CARTONAJES MIGUEL Y MATEO EL ALUMNO DEBERA

Tesis de Maestría titulada

Sistema de gestión de datos GESTSOFT

Análisis exploratorio sobre las publicaciones relacionadas con la comunicación organizacional en Pymes. Revista Publicando, 1(1),37-45

PROGRAMA PARA ANALIZAR DOCUMENTOS Y DETECTAR

Objetos Distribuidos - Componentes. Middleware

SISTEMA DE GESTIÓN DE RECIBOS

La interoperabilidad se consigue mediante la adopción de estándares abiertos. Las organizaciones OASIS y W3C son los comités responsables de la

Edgar Quiñones. HHRR: Common Sense Does Not Mean Business. Objective

PROYECTO INFORMÁTICO PARA LA CREACIÓN DE UN GESTOR DOCUMENTAL PARA LA ONG ENTRECULTURAS

Desarrollo y servicios web Sesión 18

Sistema!de!iluminación!de!un!longboard!

SISTEMA CONTROL DE ACCESOS A EDIFICIOS MEDIANTE TARJETAS CRIPTOGRÁFICAS Y TARJETAS DE RADIOFRECUENCIA (RFID)

Instalación: Instalación de un agente en una máquina cliente y su registro en el sistema.

Students Pledge: Parents Pledge:

CUANDO LA MUSA SE HACE VERBO VERSOS CORTOS POEMAS DE AMOR POEMAS DE DESAMOR Y POEMAS CORTOS SPANISH EDITION

Servicio de estadísticas de Alojamiento Fecha de revisión: 19/09/2005

PHOENIX OVIPOSITOR. Introducción...2 Capacidades / Posibilidades / Ventajas...3 Expansiones / Características técnicas...4

OSCILLATION 512 (LM 3R)

manual de servicio nissan murano z51

UNIVERSIDAD TECNOLÓGICA ISRAEL

RESUMEN DE TRABAJO DE GRADO

PROBLEMAS PARA LA CLASE DEL 20 DE FEBRERO DEL 2008

Tendencias educativas oficiales en México

Point of sale. Dossier punto de venta

Control web Guía de introducción

Búsqueda Sistemática de Información

Hourly Time Reporting

SEO Lite. Extract the file SEO.zip in the modules folder, so that module files are inside /moules/ seo/.

Learning Masters. Early: Force and Motion

Phone Manager Compatibilidad con aplicaciones OCTOBER 2014 DOCUMENT RELEASE 4.1 COMPATIBILIDAD CON APLICACIONES

ACCESS for ELLs, a Test of English Proficiency. El ACCESS de los estudiantes ELL, una prueba de conocimientos de inglés

Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322

FCC Information : Warning: RF warning statement:

La siguiente generación de Datawarehouse : Más allá del Data Warehouse permitir information on demand. IBM Information Management

Guía de referencia rápida / Quick reference guide Visor de Noticias Slider / NCS News Slider for SharePoint

Certificado de Asistente de Oficina

SCADA BASADO EN LABVIEW PARA EL LABORATORIO DE CONTROL DE ICAI

PROGRAMA. Operaciones de Banca y Bolsa SYLLABUS BANKING AND STOCK MARKET OPERATIONS

Pages: 171. Dr. Olga Torres Hostench. Chapters: 6

RESUMEN DE RESULTADOS

SISTEMA DE IMPORTACIÓN DINÁMICA DE INFORMACIÓN WEB Y PRESENTACIÓN WAP (SIDIW-PW)

CONSIDERACIONES GENERALES DEL WEB MINING

Proyecto realizado por el alumno: JOSÉ LUIS TELLO MENESES.

ESPOLI- CICYT REVISTA TECNOLÓGICA PROYECTO DE CONTROL DE BODEGAS

IntesisBox MD-AC-xxx-yy AC indoor unit compatibilities

Trademarks Third-Party Information

ISA 700 / ISA 800 Mayo 2014

Conectar Outlook con Exchange en local

An explanation by Sr. Jordan

Universidad de Guadalajara

MANUAL DE FARMACIA CLINICA Y ATENCION FARMACEUTICA. EL PRECIO ES EN DOLARES BY JOAQUIN HERRERA CARRANZA

JESÚS EDUARDO CORTÉS SÁNCHEZ

Phone Manager Compatibilidad con aplicaciones OCTOBER 2014 DOCUMENT RELEASE 4.1 COMPATIBILIDAD CON APLICACIONES

La adecuación de la oferta de productos y servicios al perfil

El proceso de Instalación de Microsoft SQL Server 2008

SOCIALIZANDO EL CAMPUS VIRTUAL ATENEA DE LA UPC. Cataluña

TEESP: Technology Enhanced Elementary Spanish Program Lesson Planner. Title: Qué pasa con su corazón?

DISPOSITIVO DE CONTROL PARA REDES DE DISTRIBUCIÓN ELÉCTRICA RESUMEN DEL PROYECTO

Plataforma de movilidad SAP en la Nube

REST BACK END Y APLICACIÓN PARA ios PARA OPTIMIZAR TIEMPO Y RECOMENDAR NUEVOS EVENTOS

English Workout. Indonesians Connect with Feature Phones. 1) What does the boy sell? Answer: 2) Why does he like having a cell phone?

Por tanto, la aplicación SEAH (Sistema Experto Asistente para Hattrick) ofrece las siguientes opciones:

Matemáticas Muestra Cuadernillo de Examen

Sierra Security System

ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL Facultad de Ingeniera en Electricidad y Computación. Tema:

Adobe Acrobat Reader X: Manual to Verify the Digital Certification of a Document

INSTITUTO TECNOLOGICO Y DE ESTUDIOS SUPERIORES DE OCCIENTE CASO DE ESTUDIO DEPARTAMENTO DE ELECTRONICA, SISTEMAS E INFORMÁTICA TÍTULO

Aplicación web para el modelado de redes eléctricas

LA DONCELLA DE LA SANGRE: LOS HIJOS DE LOS ANGELES CAIDOS (LOS HIJOS DE LOS NGELES CADOS) (VOLUME 1) (SPANISH EDITION) BY AHNA STHAUROS

COMO FUNCIONA EL PROTOCOLO OAI PMH EN LA RECUPERACION DE INFORMACION

Los ensayos que se van a desarrollar son los siguientes:

Connection from School to Home Science Grade 5 Unit 1 Living Systems

UTILIZACIÓN DE UN BOLÍGRAFO DÍGITAL PARA LA MEJORA DE PROCEDIMIENTOS DE CAMPO EN UNA CENTRAL NUCLEAR.

QUE ES EL CANCER DE MAMA PDF

NETWORK SPECIFICATIONS IN OPTIMAX SYSTEM

SAFETY ROAD SHOW 2015 Paul Teboul Co Chairman HST México

Transcripción:

Análisis y Gestión de Backlinks. Autor: José Luis Tello Meneses. Director: Antonio Melé de Juan. Resumen. Actualmente el acceso a una página web se realiza, en la mayoría de los casos, a través de enlaces desde otras páginas web. A estos enlaces, conocidos como backlinks, no se les ha prestado demasiada importancia como medio de obtener datos estadísticos. Un backlink contiene multitud de datos interesantes encapsulados en el protocolo HTTP y en el protocolo de control de transmisión TCP/IP. A través de un análisis de las peticiones a una página web se pueden obtener gráficas, con sus correspondientes datos estadísticos, que informen sobre el tráfico en tiempo real de la página y permitan tomar decisiones sobre posicionamiento web, inversión publicitaria, seguridad y posicionamiento de contenidos. La importancia del proyecto reside en la creación de una capa middleware que permita el análisis de backlinks en tiempo real, con alta escalabilidad y sin comprometer el rendimiento de la web, utilizando para ello una base de datos no relacional. Palabras clave. Django, Backlink, Redis, tecnología Comet, capa middleware. Introducción. Una página web es la presentación digital de cualquier contenido que se desee aportar a la World Wide Web. Mediante cualquier navegador web se puede

acceder a la información de una página web. Pero, qué ocurre cuando existe tal cantidad de información que los usuarios no son capaces de llegar al contenido que realmente les interesa sin haber pasado antes por otras cinco páginas web inútiles? Cómo pueden saber los propietarios de las páginas web si su información está llegando al público objetivo que les interesa? Existen varias formas de llegar a una página web: algunas veces se obtiene la dirección en un periódico, una revista o incluso se escucha por la radio o la televisión. Pero la inmensa mayoría de las veces se accede a ese contenido que llama la atención a través de un enlace llamado comúnmente link. Un link es un enlace que dirige a un navegador web a una página determinada. Se puede realizar la vinculación a la página pulsando directamente con el ratón. Se utiliza el término backlink en vez de link debido a que es como se denomina comúnmente en las técnicas de posicionamiento web, utilizadas en buscadores como Google, Yahoo! O Bing, entre otros. Los backlinks contienen mucha información sobre el usuario y su ubicación, tanto en el protocolo de aplicación HTTP como en el protocolo de red y transporte TCP/IP. El objetivo de este proyecto consiste en analizar y gestionar los backlinks que acceden a una página web. Mediante dicho análisis se podrán mejorar aspectos de la gestión de la página web como son el posicionamiento en buscadores, posicionamiento de contenidos, la seguridad de la propia página e incluso incrementar los posibles ingresos por publicidad. Existen servicios en Internet que realizar estadísticas sobre una página web propia. El más conocido de ellos es Google Analytics. Pero el gran problema de todos ellos es que no son capaces de ofrecer la información en tiempo real. Los datos no son fiables hasta pasadas 48 horas como mínimo. Esto supone un gran obstáculo en todos los objetivos que persigue el proyecto, sobre todo en el

ámbito de la seguridad debido a que en pocos segundos se pueden producir ataques que comprometan la continuidad de una página web. Descripción del trabajo. La ejecución de la aplicación es transparente al usuario. Se trata de una capa middleware, una capa software entre el usuario y la página web que no afecta de manera alguna al usuario ni al rendimiento de la página web. Esta capa es gestionada por el propietario de la página web o el responsable del mantenimiento (webmaster). Imagen 1 - Comunicaciones de la capa middleware. La aplicación trabaja en tiempo real. Realiza constantemente análisis de backlinks para gestionar los posibles problemas de seguridad de la página web y obtiene estadísticas fiables para tomar medidas en un corto periodo de tiempo. La aplicación informará al responsable de los datos críticos que puedan comprometer a la accesibilidad y disponibilidad de la web.

Por otro lado, la aplicación ha sido diseñada para que sea totalmente escalable. El almacenamiento de datos y estadísticas se realiza en memoria volátil hasta unos límites de espacio o tiempos prefijados. De esta manera se debilita el problema de la sobrecarga de los servidores. Esto se consigue mediante el uso de la base de datos no relacional Redis junto con la tecnología Comet, almacenándose la información únicamente cuando se superan los límites prefijados, en vez de almacenar constantemente en el servidor cada dato nuevo que se obtenga, pudiendo producir una reducción del rendimiento del servidor, llegando incluso a la saturación y la denegación del servicio. La aplicación ha sido desarrollada utilizando un lenguaje de alto nivel llamado Python, que le aporta la característica de ser multiplataforma. Python es un lenguaje interpretado el cuál se compila en el momento de la ejecución y es soportado por cualquier sistema operativo. La aplicación no tendrá problemas de compatibilidad en ningún servidor o plataforma operativa. Resultados. La capa middleware de Análisis y Gestión de Backlinks ha sido desarrollada correctamente y sus resultados cumplen los objetivos marcados al inicio del proyecto. El código desarrollado en el lenguaje Python junto con el framework Django es limpio y eficiente. La aplicación ha sido implantada en un banco de pruebas en el servidor, realizando diversas peticiones a la página web desde distintos enlaces para comprobar su capacidad de acceso a base de datos, encapsulamiento de los datos, conexión con Google Visualization y generación de gráficos.

Imagen 2 - Gráfico de accesos a contenidos cada hora. La gestión de la base de datos REDIS ha sido muy satisfactoria, al igual que las interfaces de administración en donde se muestran las gráficas producidas en tiempo real. Se han realizado todas las pruebas posibles para comprobar el rendimiento de la web y los posibles fallos que hubiera en el código fuente. Conclusiones. Como colofón de esta aplicación se puede destacar su gran aportación para el futuro de Internet. La gestión de backlinks ofrece muchas aportaciones en cuanto a materia de seguridad, posicionamiento e inversión. Internet, que crece de una manera desmesurada e incontrolada, necesita mecanismos de análisis para poder mejorar las sensaciones de los usuarios, centrar las búsquedas de la información relevante para los usuarios y desechar la información inútil. Mediante las estadísticas y los métodos de posicionamiento se puede conseguir un Internet más eficaz y eficiente.

Referencias. [HOLO09] La guía definitiva de Django Adrian Holovaty, Jacob Kaplan Anaya, 2009. [BECK07] Extreme programming Kent Beck. Embrace Change, 2007. [FISS08] [WEB001] Aplicaciones web 2.0 Wikis RSS - Marcela L. Fissore Lic. Gustavo A. Gómez Rodríguez. Ebook, 2008. Google Visualization API http://code.google.com/intl/es-es/apis/chart [WEB002] Documentación BBDD REDIS http://redis.io/documentation

Analysis and Management of Backlinks Author: José Luis Tello Meneses. Director: Antonio Melé de Juan. Abstract. Nowadays the access to a web page is done in most cases through links from other web pages. These links are known as backlinks, they have not been considered very important as a way of obtaining statistic data. A backlink contains a wide range of interesting information encapsulated in the HTTP protocol and also the transmission control TCP/IP protocol. Through an analysis of the petitions of a webpage we can obtain graphics with their correspondent statistic data which give us information instantly over the webpage and also allows us to make decisions over the positioning of the web itself, publicity investments, security and positioning of contents. The importance of this project relies on the creation of a middleware level which can allow us to analyze backlinks in real-time with a high scalability level and without compromising the webs performance by using a not related data base. Key Words. Django, Backlink, Redis, Comet technology, middleware level. Introduction. A webpage is the digital presentation of any content which is contributed to the World Wide Web. By using any web navigator you can gain access to the information of a webpage. But what happens when there is so much

information that the users are not able to reach the content they are really interested in without previously passing through five useless web pages? How can the owners of these web pages know that their information is reaching that part of the public which is really interested? There are various forms to reach a web page: sometimes you obtain the website from a newspaper, a magazine or even hear it on the radio or television. But the vast majority of times that someone gains access to certain content that draws their attention it is through a connection commonly known as a link. A link is a connector which directs a web navigator to a certain web page. You can perform this connection to the page by just simply pressing on the mouse. The term backlink is used instead of link due to the fact that this is how commonly called in positioning web techniques used in web searchers such as Google, Yahoo! O Bing, among others. Backlinks contain a lot of information of the user and his location, it can be used in both the HTTP application protocol and the TCP/IP red and transport protocol. The main objective of this project consists in the analysis and management of those backlinks through which we gain access to a web page. Through this analysis we will be able to improve certain aspects of the web page s management as that of the positioning of searchers, positioning of contents, security measures of the web page itself and we will even be able to increase possible benefits for publicity. There are certain services on the Internet which gather statistics on a web site itself. The most famous one is Google Analytics. But they all have one defect which is that they are not able to offer information in real-time. Data is not reliable until after minimum 48 hours. This is a big obstacle for all the objectives this project seeks to complete. This is also an obstacle of the security

aspect because there can be attacks which could compromise the well being of a web site. Description. The execution of the application is transparent to the user. This is a middleware layer; it is a level of software between the user and the web page that does not affect in any possible way neither the user or the software we are dealing with. This layer is managed by the owner of the web page or the person responsible for maintenance (webmaster). Image 1 - Middleware communication. This application works in real-time. It constantly performs the analysis of backlinks to manage the possible problems concerning the security of the web page and it also obtains reliable statistics to make quick decisions of any type.

The application will inform the person in charge of all the critical data which may compromise the web page s level of accessibility or availability. On the other hand, this application has been designed to be totally scalable. The storage of statistics data is done in a volatile memory until a set of prefixed space and time limits. This way the servers overload problem can be solved. This is possible thanks to the use of the non-related data base Redis together with the Comet technology which stores the information only once the prefixed limits have been overcome instead of constantly storing in the data base every new piece of data it may obtain reducing this way the performance rate of the server and risking a saturation or rejection of any kind of service. The application has been developed using a high level language called Python which adds to it the multiplatform feature. Python is an interpreted language which is compiled in the moment of execution and which is supported by any operative system. The application will not have any problems of compatibility with any server or operative platform whatsoever. Results. The middleware layer of Analysis and Management of Backlinks has been correctly developed and its results succeed in the objectives which were established at the beginning of the project. The code which was developed in the Python language together with Django framework is clean and efficient. The application has been implanted in a location of test storage in the server, performing various petitions to the web page from different links to check its capacity to access the data base, storage of data, connection with Google Visualization and graphics.

Image 2 - Chart hourly access to content. The management of the Redis data base is satisfactory as well as the administration interfaces where the graphics are shown in real-time. All the possible tests regarding the performance of the web have been taken to seek for any possible failures in the code source. Conclusion. As a colophon of this application we can highlight its big input for the future of Internet. The management of backlinks offers many inputs concerning security matters, positioning and investment. Internet grows hugely and rapidly so we need analysis mechanisms to be able to improve its accessibility for users. We need to focus our efforts on the searching of relevant information for user this way avoiding any kind of unnecessary information. Using statistics and positioning methods we can achieve in making Internet more efficient.

Bibliography. [HOLO09] La guía definitiva de Django Adrian Holovaty, Jacob Kaplan Anaya, 2009. [BECK07] Extreme programming Kent Beck. Embrace Change, 2007. [FISS08] [WEB001] Web applications 2.0 Wikis RSS - Marcela L. Fissore Lic. Gustavo A. Gómez Rodríguez. Ebook, 2008. Google Visualization API http://code.google.com/intl/es-es/apis/chart/ [WEB002] Documentation BBDD REDIS http://redis.io/documentation