Desarrollo de herramientas empresariales para la búsqueda de información utilizando Biginsights, Java y otras tecnologías de la informática

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Desarrollo de herramientas empresariales para la búsqueda de información utilizando Biginsights, Java y otras tecnologías de la informática"

Transcripción

1 Desarrollo de herramientas empresariales para la búsqueda de información utilizando Biginsights, Java y otras tecnologías de la informática

2 Índice Introducción Capítulo 1: Contexto General 1.1 Descripción del problema 1.2 Descripción del sistema Capítulo 2: Tecnologías involucradas 2.1 IBM Biginsights Big Data Hadoop MapReduce Características de Biginsights 2.2 Java Servlets y JSP Frameworks de Java 2.3 Freemarker Struts Log4j IBM Rational Team Concert IBM Websphere Jaql IBM MQ Linux Bash scripting Bases de datos Derby IBM Db2 XML Capítulo 3 : Sistema de Búsqueda Backend Motor de búsqueda Nutch Crawler Frontend Aplicaciones Web Interfaz de Usuario Interfaz de Administración

3 Runtime Aplicación para empujar documentos Servicio de búsqueda empresarial Capítulo 4: Desarrollo e implementación del sistema Capítulo 5: Evaluación y funcionamiento del sistema Capítulo 6 : Conclusiones

4 Introducción Este trabajo presenta bajo la modalidad de titulación por caso de estudio el desarrollo de algunas herramientas de software que dan solución al problema de búsqueda de información interna y externa a una empresa multinacional mediante la implementación de un sistema de búsqueda. Este documento es producto de la experiencia de casi cuatro años como desarrollador y analista de sistemas como parte del equipo encargado del sistema de búsqueda implementando nuevos requerimientos, mejoras, actualizaciones y solucionando problemas de diferentes tipos que se han presentado durante el proyecto al que pertenece esta solución o sistema. Por razones de confidencialidad y seguridad no se mencionará en este trabajo el nombre de la empresa ni se detallará a fondo la arquitectura del sistema implementado. En este documento se hablará sobre las tecnologías involucradas en la implementación del sistema de búsqueda y de cómo interactúan entre sí. El problema de la búsqueda de información se refiere como un usuario puede obtener información, documentos, contenidos multimedia, entre otros, de forma precisa, es decir, que la información encontrada sea de relevancia conforme a lo que el usuario necesita y en un tiempo reducido. Mismo que es solucionado mediante la implementación de un sistema de búsqueda en la página web de la empresa de manera que clientes, estudiantes, investigadores o cualquier usuario interesado en obtener cualquier tipo de información relacionada a la empresa lo pueda hacer de la manera más eficiente posible. Además de satisfacer las necesidades de los usuarios finales mencionados anteriormente, el sistema debe de solucionar las necesidades de los usuarios

5 relacionados con el funcionamiento del sistema, por ejemplo, los usuarios encargados de actualizar contenidos y de administrar cada uno de los componentes del mismo. La resolución de este problema se inscribe en el área de desarrollo de sistemas. Se requiere contar con experiencia en programación en la tecnología Java, ingeniería y arquitectura en software, componentes web, patrones de diseño, entre otras áreas. Estas áreas de conocimiento fueron estudiadas y reforzadas durante el tiempo que cursé la Maestría en Tecnologías de Información principalmente en las materia de Programación avanzada, Matemáticas avanzadas, Sistemas operativos avanzados, Bases de datos Ingeniería de Software I y II y Tópicos selectos de desarrollo de sistemas (Usabilidad) En este trabajo primero se hablará a fondo sobre las diferentes tecnologías involucradas en el desarrollo del sistema de búsqueda, después de los componentes que conforman el sistema y por último un análisis del funcionamiento sistema. También hay un anexo sobre cómo se ejecutaron las pruebas del sistema y de la metodología Agile que se utilizó para las etapas de desarrollo y mantenimiento del sistema.

6 Capítulo 1: Contexto General 1.1 Descripción del problema Una empresa multinacional cuyo giro son las Tecnologías de Información necesita de un sistema de búsqueda el cual permita buscar información de manera eficiente sobre productos, tecnologías desarrolladas y cualquier otro tipo de información relacionada con la empresa. Este debe ser implementado como un buscador web de contenidos, parecido a los sistemas de búsqueda web que implementan Yahoo o Google. Este sistema será parte de la página principal de la empresa. La información o los contenidos provienen de muchos sistemas que pertenecen a diferentes áreas de la compañía, estos sistemas generan diferente tipo de información en diversos tipos de archivos o presentaciones por ejemplo se generan blogs, páginas web, wikis, archivos de texto, archivos multimedia, entre otros. La totalidad de la información disponible es demasiado grande, se estiman más de 10 Terabytes de datos. Por tanto, la problemática general a resolver consiste en cómo desarrollar un sistema de búsqueda web que sea capaz presentar de forma eficaz la información que el usuario necesita. También es necesario que el sistema esté disponible 99.9% del tiempo. Existen muchos otras problemáticas que se originan por la naturaleza de las actividades de la empresa pero que no pueden ser incluidas en este documento por cuestiones de confidencialidad, Problemas como los tipos de accesos a la aplicación, el tipo de infraestructura de hardware empleada, idiomas que soporta el sistema, entre otros están por tanto fuera del alcance del documento.

7 1.2 Descripción del sistema El sistema de debe ser capaz de manejar grandes volúmenes de datos de una manera rápida y eficiente para dar una respuesta satisfactoria en relevancia, tiempo y en calidad a los usuarios. Este sistema debe contar con las características básicas de un buscador web y debe contar con diferentes módulos para los diferentes tipos de operaciones que se realizan en un buscador. También debe permitir a los usuarios administradores del mismo contar con herramientas para llevar a cabo tareas relacionadas la búsqueda de información, tales como actualización de contenidos, administración de la publicidad en la página, bloqueo de contenidos, generación de reportes, entre otras. Para entender el funcionamiento del sistema de búsqueda que se requiere es necesario entender cómo funciona un motor de búsqueda. Un sistema de búsqueda o motor de búsqueda efectúa al menos dos funciones principales [1]: Proceso de indexar: Se refiere a construir estructuras de datos que permiten la búsqueda Proceso de consulta: Se refiere a usar esas estructuras para producir una lista de documentos ordenadas por relevancia dada una consulta de un usuario El proceso de indexar se compone de: Adquisición de texto Transformación de texto Creación de un índice

8 El proceso de adquisición de texto se refiere a identificar y poner a disponibilidad los documentos que podrán ser buscados. Esto se efectúa mediante un crawler que se encarga de escanear el repositorio de datos para posteriormente identificar y adquirir los documentos para el motor de búsqueda. Otra de sus funciones es la de describir contenido nuevo en el repositorio e integrarlo al índice. Después se efectúa el proceso de convertir la variedad de formatos de archivos que se encuentran a una estructura de datos que contiene tanto el documento como información relevante sobre él. Estas estructuras de datos son guardadas generalmente en un Data Document Store que es una base de datos para este tipo de estructuras. Después la información de esta base de datos se transforma en un índice, que es una representación depurada y reducida de estos datos para facilitar el proceso de consulta. Figura 1. Proceso de Indexar. [1]

9 El proceso de consulta se refiere a las actividades que involucran las consultas que realizan el usuario y los resultados que obtiene del sistema. Este proceso consta de: Interacción del usuario Evaluación Categorización Primero el usuario envía una petición de consulta al sistema, dicha consulta se transforma y pasa por un proceso de evaluación en el cual la consulta se transforma a información significativa para el sistema con el fin de que obtengamos resultados relevantes respecto a la búsqueda. Finalmente todos esos resultados son categorizados por relevancia y son presentados al usuario iniciando por el más relevante. Figura 2. El proceso de consulta. [2]

10 El sistema de búsqueda incluye las funcionalidades previamente explicadas y cuenta además de otros módulos. Los componentes de los que consta el sistema son: Motor de búsqueda: Encargado de recolectar, actualizar documentos, contenidos y generar un índice de contenidos. Interfaz de usuario para búsqueda: Es la interfaz que utilizaran los usuarios para efectuar búsquedas de información y ver los resultados Interfaz de usuario para administración: Se refiere a la interfaz de usuario que utilizarán los administradores de la aplicación para realizar actividades diversas como actualización de contenidos, parar el sistema, entre otras. Servicios para actualizar o agregar documentos: Este componente se utilizará para agregar contenido nuevo o actualizar el contenido existente en el sistema Otros servicios: Se refiere a componentes encargados de otras actividades por ejemplo healthchecks, reportadores, analizadores de datos, entre otros. A grandes rasgos la arquitectura básica del sistema de búsqueda es el siguiente. El motor de búsqueda está basado en el software IBM Biginsights trabajando en conjunto con Nutch. Las aplicaciones web del sistema, la interfaz de usuario, de administración y servicios de documentos están programadas en Java EE. Los servicios adicionales están programados en Java SE. Estas no son todas las tecnologías involucradas en el desarrollo del sistema de búsqueda. En el siguiente capítulo se tiene la información más relevante de todas las tecnologías empleadas

11 Capítulo 2: Tecnologías Involucradas En esta sección se hablará de las diferentes tecnologías involucradas en el desarrollo del sistema de búsqueda. Esta información ayudará a que comprender el siguiente capítulo que trata sobre los componentes del sistema. 2.1 IBM InfoSphere Biginsights Biginsights es una plataforma para el análisis y visualización de volúmenes de información de escala grande. Fue diseñada en base a Apache Hadoop, la cual es a su vez una plataforma de cómputo distribuido de código abierto. En el sistema esta plataforma es usada como el componente principal del motor de búsqueda. Antes de entrar en los aspectos específicos de Biginsights primero necesitamos conocer sobre el concepto de Big Data y sobre la tecnología Hadoop Big Data El término Big Data se refiere a la tendencia en el avance de la tecnología que ha abierto las puertas hacia un nuevo enfoque de entendimiento y toma de decisiones, la cual es utilizada para describir enormes cantidades de datos (estructurados, no estructurados y semi estructurados) que tomaría demasiado tiempo y sería muy costoso cargarlos a un base de datos relacional para su análisis. De tal manera que, el concepto de Big Data aplica para toda aquella información que no puede ser procesada o analizada utilizando procesos o herramientas tradicionales. Sin embargo, Big Data no se refiere a alguna cantidad en específico, ya que es usualmente utilizado cuando se habla en términos de petabytes y exabytes de datos. [2]

12 En la definición anterior tenemos la siguiente clasificación de datos: Datos estructurados: son los que recolectan uno o varios valores definidos simultáneamente y se les asignan una cantidad de memoria definida. Datos no estructurados: almacenan tipos de valores no predefinidos almacenan como documentos u objetos sin estructura uniforme. Datos semi estructurados: son tipos de datos que puede consistir de datos estructurados y no estructurados, no necesariamente tienen que tener todos sus atributos definidos. Además de que existe una gran cantidad de información, esta misma existe en una gran variedad de datos que pueden ser representados de diversas maneras, por ejemplo dispositivos móviles, audio, video, sistemas GPS, sensores digitales, automóviles, medidores eléctricos, entre otros, de manera que las aplicaciones que analizan estos datos necesitan que la velocidad de respuesta sea lo demasiado rápida para lograr obtener la información correcta en el momento preciso. Estas características en la información hacen que el concepto Big Data se consolide como una manera de manejar datos. En el artículo de R. Barranco [2] se sugiere que existe una amplia variedad de tipos de datos a analizar, una buena clasificación nos ayudaría a entender mejor su representación, aunque es muy probable que estas categorías puedan extenderse con el avance tecnológico.

13 Los tipos de datos mencionados en el artículo son [2]: 1.- Web and Social Media: Incluye contenido web e información que es obtenida de las redes sociales como Facebook, Twitter, LinkedIn, etc, blogs. 2.- Machine-to-Machine (M2M): M2M se refiere a las tecnologías que permiten conectarse a otros dispositivos. M2M utiliza dispositivos como sensores o medidores que capturan algún evento en particular (velocidad, temperatura, presión, variables meteorológicas, variables químicas como la salinidad, etc.) los cuales transmiten a través de redes alámbricas, inalámbricas o híbridas a otras aplicaciones que traducen estos eventos en información significativa. 3.- Big Transaction Data: Incluye registros de facturación, en telecomunicaciones registros detallados de las llamadas (CDR), etc. Estos datos transaccionales están disponibles en formatos tanto semiestructurados como no estructurados. 4.- Biometrics: Información biométrica en la que se incluye huellas digitales, escaneo de la retina, reconocimiento facial, genética, etc. En el área de seguridad e inteligencia, los datos biométricos han sido información importante para las agencias de investigación. 5.- Human Generated: Las personas generamos diversas cantidades de datos como la información que guarda un call center al establecer una llamada telefónica, notas de voz, correos electrónicos, documentos electrónicos, estudios médicos, etc.

14 Figura 3. Tipos de datos empleados en Big Data. [2] El contexto de Big Data en el sistema de búsqueda que se desarrolló se refiere a los documentos o el tipo de información que pueden encontrar los usuarios, por ejemplo, archivos de diferentes tipos (pdf, documentos office, documentos open office, html, xml, binarios, entre otros) de los cuales existe un gran volumen de información misma que el sistema requiere procesar rápidamente para dar una respuesta.

15 2.1.2 Apache Hadoop Hadoop es un framework de software que permite el procesamiento distribuido de grandes volúmenes de información en clusters de computadoras usando modelos de programación simples. Está diseñado para escalar desde servidores únicos hasta miles de computadoras que ofrecen cada una cómputo y almacenamiento local. En lugar de depender de hardware para lograr alta disponibilidad. Está diseñado para detectar y manejar fallas en la capa de aplicación, para de esta forma entregar un servicio altamente disponible. [3] Hadoop está basado en el proyecto de Google, File System (GFS) y en el paradigma de programación MapReduce, el cual consiste en dividir en dos tareas (mapper y reducer) para manipular los datos distribuidos a nodos de un clúster logrando un alto paralelismo en el procesamiento. Incluye también otras tecnologías de código abierto. Está compuesto de los módulos [3]: Hadoop Common: Utilerías communes de soporte. Hadoop Distributed File System (HDFS ): Un sistema de archivos distribuidos que provee de alta disponibilidad a datos de aplicación Hadoop YARN: Un framework para planificación de tareas y manejo de recursos de clusters Hadoop MapReduce: Un sistema basado en YARN para el procesamiento en paralelo de grandes volumenes de información.

16 De [4] los módulos fundamentales de Hadoop son HDFS y MapReduce. La funcionalidad de HDFS es proveer una manera para almacenar la información y MapReduce es una forma de procesar la información de manera distribuida. Hadoop consiste en muchas computadoras conectadas, llamadas DataNodes, los cuales almacenan informacion en sus sistemas de archivos locales y procesan la informacion dirigidos por un nodo de control cental. Los nodos de control consisten en los siguientes procesos: NameNode: Este proceso mantiene la metadata que tiene que ver con donde esta almacenados los datos en los DataNode. Cuando un trabajo se presenta, la metadata es accesada para poder localizar los bloques de datos que el trabajo necesita. NameNode secundario: Este nodo tiene un punto de control de la metadata en el NameNode, tambien como archivo editable que contiene la informaci[on de todos los cambios hechos a la localizacion de los datos. Este nodo es redundante a el NameNode y aumenta la velocidad significativamente si falla en NameNode JobTracker: Cuando un trabajo de tipo MapReduce es presentado, el JobTracker decide en cual nodo se lleva a cabo el trabajo, coordina el procesamiento distribuido para asegurar que los nodos que tienen los datos locales inicien Map y Reduce. Tambien, si es posible, se asegura que el trabajo se lleve a cabo en multiples nodos. En cada DataNode, se encuentra también un TaskTracker. Su rol es el de aceptar trabajos desde el JobTracker y crear un proceso de JVM para cada uno de estos trabajos. A continuación se muestra una imagen que detalla a alto nivel el funcionamiento de una

17 configuración de Hadoop Ya que Hadoop se trata de una arquitectura de procesamiento por lotes, la mayor ventaja que tiene es que permite consultas a la medida para ejecutar en un conjunto de datos y devolver los resultados en un plazo de tiempo razonable. El cómputo distribuido a través de un clúster de varios nodos es lo que permite este nivel de procesamiento de datos tenga lugar MapReduce La aplicación de MapReduce es el poder procesar grandes cantidades (varios terabyte) de datos en paralelo en grandes clusters de manera fiable y tolerante a fallos. MapReduce es un paradigma computacional en el que una aplicación se divide en unidades autónomas de trabajo. Cada una de estas unidades de trabajo se puede ejecutar en cualquier nodo del clúster. Un trabajo MapReduce divide el conjunto de datos de entrada en partes independientes que son procesados tareas map en paralelo. El framework ordena las salidas de las tareas map, las cuales se ingresan tareas reduce. Las entradas y salidas de trabajo se almacenan en el sistema de archivos. El framework MapReduce y el sistema de archivos HDFS están normalmente en el mismo conjunto de nodos, lo que permite al framework agendar tareas en los nodos que contienen datos. El framework MapReduce consta de un JobTracker primario y un TaskTracker secundario por nodo. El nodo primario agenda, tareas, componentes de trabajo, trabajo de monitoreo, y vuelve a ejecutar las tareas falladas, y el nodo secundario ejecuta tareas según las indicaciones del nodo primario.

18 De lo anterior observamos que MapReduce consiste en las etapas: Map Reduce La fase map es la primera parte de la secuencia de procesamiento de datos dentro de MapReduce. Las funciones map sirven de nodos que trabajan y son capaces de procesar varios fragmentos pequeños del conjunto de datos. MapReduce es responsable de dividir el conjunto de datos de entrada en trozos más pequeños, y los llevan a su trabajo de map correspondiente. Cuando se escribe un función map, no hay necesidad de incorporar lógica para activar la función de crear varios mapas capaces de aprovechar la arquitectura de computación distribuida de Hadoop, esto mismo es una funcionalidad por defecto. De la misma manera que se tiene la función de map, los desarrolladores también necesitan de una función de reducción (Reduce). La pares clave/valor de las salidas de la función map, deben corresponder a la partición de reducción adecuada de manera que los resultados finales son agregados a datos correspondientes apropiadamente. Este proceso de mover las salidas de la función map hacia las funciones de reducción es conocida como shuffling Una vez que el proceso shuffling ha finalizado y los reductores (encargados de las funciones de reducción) ha copiado todas las salidas de la función de map, los reductores pueden entrar en lo que se conoce como un proceso de mezcla. Durante esta etapa de la fase de reducción, todas las salidas de la función map se pueden combinar juntas manteniendo su tipo de petición establecido durante la fase de map. Una vez que la mezcla final termina (esto se realiza en las rondas con fines de optimización del rendimiento), la última tarea de reducción de la consolidación de todos los resultados

19 para cada clave dentro de la salida ya mezclada, y el resultado final se escriben en el HDFS. [5] El flujo completo con una tarea sencilla de reducción se ilustra a continuación. Las cajas punteadas son nodos, las flechas punteadas muestran transferencias de datos en un nodo y las flechas continuas muestran transferencia de datos entre nodos. Figura 4. Ejemplo de Mapreduce con una tarea sencilla de reducción. [4] La cantidad de tareas de reducción no depende del tamaño de la entrada, este es especificado independientemente. Cuando existen múltiples reductores, las tareas de map particionan sus salidas, cada una crea una partición para cada tarea de reducción. Pueden existir múltiples claves asociadas a cada partición, pero los registros para una clave específica están en una partición sencilla. El particionamiento puede ser controlado por funciones de particionamiento definidas por el usuario, pero normalmente el particionador por defecto de Hadoop funciona bien. [5]

20 El flujo de datos para el caso general donde se tienen múltiples tareas de reducción se ilustra en la siguiente figura. Este diagrama clarifica porque el flujo de datos entre tareas map y reduce se denomina shuffling (barajear), ya que cada tarea de reducción es alimentada por múltiples tareas map. El shuffling es más complicado que lo que sugiere este diagrama y mejorarlo puede tener un impacto grande en el tiempo de ejecución. Figura 5. Flujo de datos en MapReduce con múltiples tareas de reducción[4] Características de Biginsights Es un producto de IBM construido en base a la tecnología Apache Hadoop diseñado para hacer que el procesamiento distribuido sea fácilmente implementado. Biginsights mejora la tecnología Hadoop para satisfacer demandas empresariales, agregando funcionalidades administrativas, de flujo de trabajo y de seguridad, además de capacidades analíticas provistas por el equipo de investigación de IBM. Por lo cual

21 se obtiene un sistema más amigable para los desarrolladores y usuarios para el análisis complejo a larga escala. IBM InfoSphere BigInsights está integrado por los siguientes componentes [6]: La distribución de IBM de Apache Hadoop, la cual contiene Apache Hadoop, una versión de 64-bit para Linux del IBM SDK para Java 6 IBM InfoSphere BigInsights Jaql, un lenguaje de consultas basado en JavaScript Object Notation (JSON), el cual es primariamente usado para analizar información semi-estructurada de larga escala Avro, un sistema de serialización de información Flume, un servicio distribuido, confiable y de alta disponibilidad para mover eficientemente grandes cantidades de información alrededor de un cluster. HBase, una base de datos distribuida y no relacional escrita en Hive, una infraestructura de data warehouse que facilita tanto la transformación y carga de extracción de información y el análisis de cargas de información grandes almacenados en el Sistema de Archivos Distribuidos de Hadoop (HDFS). Lucene, Una librería de motor de búsqueda de alto desempeño escrita en Java Oozie, un coordinador de flujos de trabajo Orchestrator, un avanzado sistema de control de trabajos MapReduce que usa el format JSON para describir los trabajos y la relación que existe entre ellos. Pig (0.70), una plataforma para analizar grandes cargas de información que consiste en un lenguaje de alto nivel para expresar programas de análisis de datos y una infraestructura para evaluar dichos programas

22 BigInsights scheduler, el cual asegura que todos los trabajos obtengan una compartición de recursos apropiada ZooKeeper, un servicio centralizado para mantener información sobre Algunos de estos productos son proyectos de código abierto y han sido particularmente probados por IBM para asegurar que estas versiones funcionan a la perfección. Existen también algunos otros componentes nuevos que ha desarrollado IBM para agregar valor a estas tecnologías los cuales se encuentran en las dos versiones de Biginsights, la versión Básica (Biginsights Basic Edition) y la versión Empresarial (Biginsights Enterprise Edition) siendo la segunda la que cuenta con más funcionalidades. Figura 5. Ediciones de Biginsights. [6]

23 La edición básica está disponible para su descarga gratuita y puede gestionar hasta 10 Terabytes de datos. Por lo tanto, es conveniente para proyectos piloto y trabajos de exploración. La edición empresarial es de paga y no tiene restricciones de licencia sobre la cantidad de datos que pueden ser administrados. Incluye todas las características de la Edición básica y ofrece analíticas adicionales, administrativas y capacidades de software de integración, por lo cual la edición empresarial es adecuada para aplicaciones de producción. [7] Para el motor del sistema de búsqueda se utiliza la versión empresarial de Biginsights, de esta versión existen dos componentes desarrollados por IBM, y que por tanto no se encuentran en Hadoop, que han proporcionado muchos beneficios al sistema. Instalador Gráfico Uno de los componentes desarrollados específicamente para Biginsights es el instalador gráfico, el cual es una herramienta web compatible con la mayoría de las versiones de los navegadores Firefox, Google Chrome e Internet Explorer. El instalador configura todo el software que selecciona el administrador y se puede observar el progreso de la instalación en tiempo real, así mismo cuenta con herramientas de health check que automáticamente verifican y reportan si la instalación fue correcta o no y los detalles de instalación. El instalador ofrece los siguientes beneficios [4]: Instalación sencilla, no se requieren de habilidades especiales.

24 Instalación rápida que incluye un inspector de instalación el cual requiere sólo un periodo de tiempo corto para realizar y verificar la instalación. Componentes probados previamente los cuales incluyen versiones que se han probado y funcionan de forma integrada sin problemas. Instalación en un solo nodo a través de una interfaz de usuario la cual es útil para los desarrolladores si no necesita cambiar o personalizar la configuración durante el proceso de una instalación para múltiples nodos. Una opción de instalación de varios nodos, ya sea a través de una interfaz gráfica de usuario o la línea de comandos para instalar los componentes con facilidad a través de múltiples nodos. El proceso de instalación de Biginsights incluye los siguientes pasos: 1.- Definir el tipo de instalación Existe la opción de instalar Biginsights solamente en un nodo, la cual es llamada instalación pseudo-distribuida, incluye configuración por defecto de todos los componentes y es posible agregar más nodos en un futuro que soporten la configuración establecida. Existe también la instalación en cluster, es la más común ya que soporta configuración de múltiples nodos distribuidos y permite la configuración completa o específica para cada componente a instalar (ver figura 6).

25 2.- Configuración del sistema de archivos En esta etapa de la instalación se definen el directorio raíz, el directorio donde será instalado Biginsights, el directorio donde se crean los archivos de historial (logs) y el directorio donde MapReduce maneja los archivos de sistema (ver figura 7). 3.- Configuración SSH Aquí se configuran el usuario administrador de sistema y el usuario administrador de Biginsights que deberá contar con configuración SSH sin contraseña para poder establecer comunicación entre los nodos. Más información sobre la tecnología SSH y su configuración se encuentra más adelante en el apartado de Linux en este documento. 4.- Configuración de nodos Aquí se define la localización de cada uno de los nodos de los que se compone la configuración del sistema de sistema distribuido de Biginsights, se definen en este paso las direcciones IP de cada nodo y su contraseña del ususario administrador. 5.- Configuración específica para los componentes En esta etapa se definen configuraciones de nodos, de la base de datos Derby, configuraciones de Jaql, puerto del TastTracker, directorios de datos para los nodos y para TasckTracker, configuraciones de Hive, Pig, Zookeper, HBase

26 6.- Revisión e Instalación Después de especificar todas las configuraciones se muestra una pantalla con el resumen de la configuración del sistema y se muestra el botón para iniciar la configuración mencionada. 7.- Resultados Aquí se muestran los resultados de la configuración general nodo por nodo y de los componentes instalados. Figura 6. Tipos de instalación [5]

27 Figura 7. Configuración del sistema de archivos. [5] Figura 8. Configuración SSH [5]

28 Figura 9. Configuración de nodos [5] Figura 10. Configuración de componentes 1 [5]

29 Figura 11. Configuración de componentes 2 [5] Figura 12. Configuración de componentes 3 [5]

30 Figura 13. Resumen de la instalación [5] Figura 14. Resultados de la instalación [5]

31 Consola de Administración Web La consola de administración es un componente que se instala por defecto e incluye herramientas para administradores, desarrolladores y analistas de negocios. Después de instalado Biginsights se puede accesar a la consola por medio de un navegador web utilizando la dirección name>:8080 o la dirección https://<host name>:8443 para instalaciones con SSL. Figura 15. Pantalla inicial de la consola de administración [8] En la consola de administración encontramos herramientas para monitoreo del estado del clúster, monitoreo del servicio de Biginsights, navegación del sistema de archivos, monitoreo de trabajos de Biginsights, entre otras.

BIG DATA. Jorge Mercado. Software Quality Engineer

BIG DATA. Jorge Mercado. Software Quality Engineer BIG DATA Jorge Mercado Software Quality Engineer Agenda Big Data - Introducción Big Data - Estructura Big Data - Soluciones Conclusiones Q&A Big Data - Introducción Que es Big Data? Big data es el termino

Más detalles

Big data A través de una implementación

Big data A través de una implementación Big data A través de una implementación Lic. Diego Krauthamer Profesor Adjunto Interino del Área Base de Datos Universidad Abierta Interamericana Facultad de Tecnología Informática Buenos Aires. Argentina

Más detalles

Curso de Android con Java

Curso de Android con Java Todos los Derechos Reservados Global Mentoring Experiencia y Conocimiento para tu Vida 1 Este es un tiempo único para el mundo de los celulares, en particular de los Smartphones. Este tipo de dispositivos

Más detalles

JAVA EE 5. Arquitectura, conceptos y ejemplos.

JAVA EE 5. Arquitectura, conceptos y ejemplos. JAVA EE 5. Arquitectura, conceptos y ejemplos. INTRODUCCIÓN. MODELO DE LA APLICACIÓN JEE5. El modelo de aplicación Java EE define una arquitectura para implementar servicios como lo hacen las aplicaciones

Más detalles

APACHE HADOOP. Daniel Portela Paz Javier Villarreal García Luis Barroso Vázquez Álvaro Guzmán López

APACHE HADOOP. Daniel Portela Paz Javier Villarreal García Luis Barroso Vázquez Álvaro Guzmán López APACHE HADOOP Daniel Portela Paz Javier Villarreal García Luis Barroso Vázquez Álvaro Guzmán López Objetivos 1. Qué es Apache Hadoop? 2. Funcionalidad 2.1. Map/Reduce 2.2. HDFS 3. Casos prácticos 4. Hadoop

Más detalles

Big Data y Supercómputo. Dr. Jesús Antonio González (jagonzalez@inaoep.mx) Instituto Nacional de Astrofísica, Óptica y Electrónica (INAOE)

Big Data y Supercómputo. Dr. Jesús Antonio González (jagonzalez@inaoep.mx) Instituto Nacional de Astrofísica, Óptica y Electrónica (INAOE) Big Data y Supercómputo Dr. Jesús Antonio González (jagonzalez@inaoep.mx) Instituto Nacional de Astrofísica, Óptica y Electrónica (INAOE) Big Data 2 Hasta qué cantidad de datos podemos procesar en nuestra

Más detalles

Bienvenidos a la presentación: Introducción a conceptos básicos de programación.

Bienvenidos a la presentación: Introducción a conceptos básicos de programación. Bienvenidos a la presentación: Introducción a conceptos básicos de programación. 1 Los programas de computadora son una serie de instrucciones que le dicen a una computadora qué hacer exactamente. Los

Más detalles

Visualización y modelado de elementos geográficos en dispositivos móviles. Capítulo 5: Aplicaciones cliente

Visualización y modelado de elementos geográficos en dispositivos móviles. Capítulo 5: Aplicaciones cliente Capítulo 5: Aplicaciones cliente 46 5.1 La aplicación cliente en la Pocket PC La aplicación desarrollada para el cliente en un dispositivo móvil como corresponde a la Pocket PC necesita una capa muy delgada

Más detalles

A continuación resolveremos parte de estas dudas, las no resueltas las trataremos adelante

A continuación resolveremos parte de estas dudas, las no resueltas las trataremos adelante Modulo 2. Inicio con Java Muchas veces encontramos en nuestro entorno referencias sobre Java, bien sea como lenguaje de programación o como plataforma, pero, que es en realidad Java?, cual es su historia?,

Más detalles

Revista Digital Universitaria. 10 de agosto 2004 Volumen 5 Número 7 ISSN: 1067-6079

Revista Digital Universitaria. 10 de agosto 2004 Volumen 5 Número 7 ISSN: 1067-6079 Revista Digital Universitaria 10 de agosto 2004 Volumen 5 Número 7 ISSN: 1067-6079 JAVA o L.I. Anabell Comas Becaria de la Coordinación de Publicaciones Digitales anabell@alethia.dgsca.unam.mx o http://www.revista.unam.mx/vol.7/num12/art104/art104.htm

Más detalles

Conectores Pentaho Big Data Community VS Enterprise

Conectores Pentaho Big Data Community VS Enterprise Conectores Pentaho Big Data Community VS Enterprise Agosto 2014 Stratebi Business Solutions www.stratebi.com info@stratebi.com Índice 1. Resumen... 3 2. Introducción... 4 3. Objetivo... 4 4. Pentaho Community

Más detalles

VISIÓN GENERAL HERRAMIENTAS COMERCIALES

VISIÓN GENERAL HERRAMIENTAS COMERCIALES VISIÓN GENERAL El servidor de MS SQL se ha convertido en un estándar en muchas partes de la América corporativa. Puede manejar volúmenes de datos grandes y se integra bien con otros productos de Microsoft.

Más detalles

The H Hour: Hadoop The awakening of the BigData. Antonio Soto SolidQ COO asoto@solidq.com @antoniosql

The H Hour: Hadoop The awakening of the BigData. Antonio Soto SolidQ COO asoto@solidq.com @antoniosql The H Hour: Hadoop The awakening of the BigData Antonio Soto SolidQ COO asoto@solidq.com @antoniosql Tendencias de la Industria El nuevo rol del operador El operador de ayer Sigue el proceso basado en

Más detalles

White Paper Help Desk Intranet

White Paper Help Desk Intranet 2004 Koala Developers Versión del documento: 2.0.8 White Paper Help Desk Intranet Autor: Departamento de Comercialización Última modificación: Abril de 2004 1 Contenido 2 Quién debería leer este documento?...3

Más detalles

XII Encuentro Danysoft en Microsoft Abril 2015. Business Intelligence y Big Data XII Encuentro Danysoft en Microsoft Directos al código

XII Encuentro Danysoft en Microsoft Abril 2015. Business Intelligence y Big Data XII Encuentro Danysoft en Microsoft Directos al código Business Intelligence y Big Data XII Encuentro Danysoft en Microsoft Directos al código Ana María Bisbé York Servicios Profesionales sp@danysoft.com 916 638683 www.danysoft.com Abril 2015 Sala 1 SQL Server

Más detalles

Capítulo II. Arquitectura del Software

Capítulo II. Arquitectura del Software Capítulo II. Arquitectura del Software Después de un cuidadoso análisis de los objetivos del proyecto, se determinó que la mejor manera de estructurar el sistema era haciendo uso del muy famoso patrón

Más detalles

CURSO: DESARROLLADOR PARA APACHE HADOOP

CURSO: DESARROLLADOR PARA APACHE HADOOP CURSO: DESARROLLADOR PARA APACHE HADOOP CAPÍTULO 3: HADOOP CONCEPTOS BÁSICOS www.formacionhadoop.com Índice 1 Introducción a Hadoop 1.1 Proyecto Hadoop 1.2 Conceptos de Hadoop 2 Cluster Hadoop 2.1 Demonios

Más detalles

Jornadas INCATEC 2015

Jornadas INCATEC 2015 Jornadas INCATEC 2015 Dr. Pedro Nolasco Bonillo Ramos Ingeniero en Computación. USB Magíster en Ingeniería de Sistemas. USB Magíster en Gerencia de las Finanzas. UNY Doctor en Ciencias de la Computación.

Más detalles

desarrollo. Dentro del desarrollo de la tesis el proceso de modelado del sistema fue hecho con el

desarrollo. Dentro del desarrollo de la tesis el proceso de modelado del sistema fue hecho con el Capitulo II. Análisis de herramientas y tecnologías de desarrollo. Dentro del desarrollo de la tesis el proceso de modelado del sistema fue hecho con el lenguaje de Modelo de Objetos llamado UML (Unified

Más detalles

Apéndice A Herramientas utilizadas

Apéndice A Herramientas utilizadas Apéndice A Herramientas utilizadas A.1 Java Media Framework El Java Media Framework (JMF) es una interfaz para el desarrollo de aplicaciones (API) e incorpora el manejo de audio y video en el lenguaje

Más detalles

emuseum PUBLIQUE SUS COLECCIONES EN LA WEB Por qué elegir emuseum? Se integra fácilmente con TMS Búsqueda eficaz Completamente personalizable

emuseum PUBLIQUE SUS COLECCIONES EN LA WEB Por qué elegir emuseum? Se integra fácilmente con TMS Búsqueda eficaz Completamente personalizable emuseum emuseum PUBLIQUE SUS COLECCIONES EN LA WEB emuseum es un sistema de publicación web que se integra perfectamente con TMS para publicar información en la web y dispositivos móviles. Mediante emuseum

Más detalles

ÍNDICE. Introducción... Capítulo 1. Conceptos de Big Data... 1

ÍNDICE. Introducción... Capítulo 1. Conceptos de Big Data... 1 ÍNDICE Introducción... XIII Capítulo 1. Conceptos de Big Data... 1 Definición, necesidad y características de Big Data... 1 Aplicaciones típicas de Big Data... 4 Patrones de detección del fraude... 4 Patrones

Más detalles

PROGRAMA FORMATIVO Desarrollador Big Data Cloudera Apache Hadoop

PROGRAMA FORMATIVO Desarrollador Big Data Cloudera Apache Hadoop PROGRAMA FORMATIVO Desarrollador Big Data Cloudera Apache Hadoop Julio 2015 DATOS GENERALES DE LA ESPECIALIDAD 1. Familia Profesional: INFORMÁTICA Y COMUNICACIONES (IFC) Área Profesional: DESARROLLO 2.

Más detalles

Capítulo I. Marco Teórico

Capítulo I. Marco Teórico 1 Capítulo I. Marco Teórico 1. Justificación Hoy en día existe una gran diversidad de aplicaciones que corren sobre la World Wide Web (WWW o Web), y cada una orientada a un fin en particular, el cuál depende

Más detalles

Características de OpenCms

Características de OpenCms Características de OpenCms Se basa en Java y Xml OpenCms está totalmente desarrollado en java bajo el estándar servlet. Por lo tanto, se puede integrar fácilmente en entornos hardware y software existentes,

Más detalles

Big Data en la nube. Use los datos. Obtenga información. La pregunta clave es: Qué puede hacer Doopex por mi negocio?

Big Data en la nube. Use los datos. Obtenga información. La pregunta clave es: Qué puede hacer Doopex por mi negocio? Qué es Doopex? Big Data en la nube. Use los datos. Obtenga información. Seguramente, la pregunta clave no es Qué es Doopex?. La pregunta clave es: Qué puede hacer Doopex por mi negocio? El objetivo de

Más detalles

Desarrollo de Aplicaciones Web con Eclipse

Desarrollo de Aplicaciones Web con Eclipse Desarrollo de Aplicaciones Web con Eclipse Oscar Gosdinski Software Services Representative Java Es un lenguaje de programación y una plataforma de desarrollo. 2 Lenguaje de alto nivel que puede ser caracterizado

Más detalles

http://www.cem.itesm.mx/extension/ms

http://www.cem.itesm.mx/extension/ms Diplomado Programación orientada a objetos con Java y UML Las empresas necesitan contar con sistemas de información modernos, ágiles y de calidad para alcanzar sus objetivos y ser cada vez más competitivos

Más detalles

Uso de los Servicios Web en la nueva arquitectura de N-Capas del Sistema Económico Integral Rodas XXI.

Uso de los Servicios Web en la nueva arquitectura de N-Capas del Sistema Económico Integral Rodas XXI. Ponencia para Evento de Redes. Autor: Rubén Rivera Rodríguez, Citmatel Resumen Uso de los Servicios Web en la nueva arquitectura de N-Capas del Sistema Económico Integral Rodas XXI. Las nuevas tendencias

Más detalles

Diferenciadores entre ediciones de Bases de Datos Oracle Octubre de 2011. Standard Edition One. Express Edition. Standard Edition

Diferenciadores entre ediciones de Bases de Datos Oracle Octubre de 2011. Standard Edition One. Express Edition. Standard Edition Diferenciadores entre ediciones de Bases de Datos Oracle Octubre de 2011 Características Express Standard One Standard Enterprise Procesamiento Máximo 1 CPU 2 Sockets 4 Sockets Sin límite Memoria RAM Máxima

Más detalles

BOLETÍN DE NOVEDADES Barcelona, junio de 2006

BOLETÍN DE NOVEDADES Barcelona, junio de 2006 BOLETÍN DE NOVEDADES Barcelona, junio de 2006 Introducción El objeto de este documento es presentar y describir brevemente las principales actuaciones en los últimos meses de Carver en algunos de sus clientes,

Más detalles

1. INTRODUCCIÓN Y OBJETIVOS

1. INTRODUCCIÓN Y OBJETIVOS 1. INTRODUCCIÓN Y OBJETIVOS Los teléfonos móviles son ya parte esencial en nuestra forma de vida y cada día son más los usuarios de estos terminales. Hasta ahora nos han acompañado a todas partes y nos

Más detalles

Programador en Plataforma Java y XML

Programador en Plataforma Java y XML Programador en Plataforma Java y XML Java Fundamentos Módulo 1: Java Básico Introducción En la presente unidad, se detalla los fundamentos de la tecnología Java, reconociendo las 3 plataformas que la conforman.

Más detalles

La obra se proporciona bajo los términos de esta licencia pública de Sisoft de México

La obra se proporciona bajo los términos de esta licencia pública de Sisoft de México Licencia La obra se proporciona bajo los términos de esta licencia pública de Sisoft de México S. A de C.V., Está protegida por derechos de autor y / u otras leyes aplicables. Cualquier uso diferente a

Más detalles

Capitulo 4. JavaFX. Se da a conocer la plataforma de desarrollo JavaFX, los niveles en el cual se encuentra

Capitulo 4. JavaFX. Se da a conocer la plataforma de desarrollo JavaFX, los niveles en el cual se encuentra Capitulo 4. JavaFX Se da a conocer la plataforma de desarrollo JavaFX, los niveles en el cual se encuentra estructurado el lenguaje de programación, se realiza el análisis del código Helloworld.fx para

Más detalles

Introducción a AJAX y visión global de la práctica

Introducción a AJAX y visión global de la práctica Introducción a AJAX y visión global de la práctica Modelo de aplicaciones Web clásico (1) La mayor parte de las interacciones del usuario causan una petición HTTP al servidor Web El servidor Web procesa

Más detalles

Arquitectura de Software

Arquitectura de Software Arquitectura de Software (Estilos Arquitectónicos) Universidad de los Andes Demián Gutierrez Mayo 2011 1 Diseño Arquitectónico Diseño Arquitectónico Arquitectura del Software Estilos Arquitectónicos Frameworks

Más detalles

SISTEMAS DE INFORMACIÓN II TEORÍA

SISTEMAS DE INFORMACIÓN II TEORÍA CONTENIDO: EL PROCESO DE DISEÑO DE SISTEMAS DISTRIBUIDOS MANEJANDO LOS DATOS EN LOS SISTEMAS DISTRIBUIDOS DISEÑANDO SISTEMAS PARA REDES DE ÁREA LOCAL DISEÑANDO SISTEMAS PARA ARQUITECTURAS CLIENTE/SERVIDOR

Más detalles

INTRODUCCIÓN A LA COMPUTACION EN LA NUBE Y BIG DATA (1) Ing. Carlos Ormella Meyer

INTRODUCCIÓN A LA COMPUTACION EN LA NUBE Y BIG DATA (1) Ing. Carlos Ormella Meyer INTRODUCCIÓN A LA COMPUTACION EN LA NUBE Y BIG DATA (1) Ing. Carlos Ormella Meyer En los últimos años, el interés por la Computación en la Nube (Cloud Computing), tanto para uso personal como para negocios,

Más detalles

Tema 1: Introducción a las Tecnologías Java

Tema 1: Introducción a las Tecnologías Java Tema 1: Introducción a las Tecnologías Java Índice Características de las aplicaciones empresariales Tecnologías Java Alternativas a las tecnologías Java XML Material de clase Características de las aplicaciones

Más detalles

Tema 1. Introducción a Java EE

Tema 1. Introducción a Java EE Objetivos del tema Propiedades de las aplicaciones empresariales El Modelo Cliente/Servidor Presentar la Plataforma Java Presentar Java EE y otras tecnologías horizontales Tema 1. Introducción a Java EE

Más detalles

Introducción... 1 Qué es Java?... 1 Compilando a Bytecode... 1 Usando jgrasp Para Hacer el Trabajo Sucio... 5 El Entorno de jgrasp...

Introducción... 1 Qué es Java?... 1 Compilando a Bytecode... 1 Usando jgrasp Para Hacer el Trabajo Sucio... 5 El Entorno de jgrasp... Contenido Introducción... 1 Qué es Java?... 1 Compilando a Bytecode... 1 Usando jgrasp Para Hacer el Trabajo Sucio... 5 El Entorno de jgrasp... 5 Introducción Es tiempo de hablar en detalle de lo que significa

Más detalles

Notas técnicas de JAVA Nro. 7 Tip Breve

Notas técnicas de JAVA Nro. 7 Tip Breve Notas técnicas de JAVA Nro. 7 Tip Breve (Lo nuevo, lo escondido, o simplemente lo de siempre pero bien explicado) Tema: JAVA Basics: Diferencias conceptuales entre JavaBeans y Enterprise JavaBeans (EJB)

Más detalles

Big Data. Analisís de grandes cantidades de datos. Sergio Marchena Quirós

Big Data. Analisís de grandes cantidades de datos. Sergio Marchena Quirós Big Data Analisís de grandes cantidades de datos Sergio Marchena Quirós Índice 1.0 Introducción...3 1.1 Objetivos del proyecto...3 1.1.1 Estudio Teórico...3 2.0 Big Data...3 2.1 las 5 V...3 2.2 Tipos de

Más detalles

Anexo IV Configuración del Entorno de Desarrollo. Guía de puntos de interés de la Ciudad de Madrid

Anexo IV Configuración del Entorno de Desarrollo. Guía de puntos de interés de la Ciudad de Madrid Anexo IV Configuración del Entorno de Desarrollo Guía de puntos de interés de la Ciudad de Madrid 1. Índice Anexo IV Configuración del Entorno de Desarrollo... 1 1. Índice... 2 2. Entorno de Desarrollo...

Más detalles

Informática y Programación Escuela de Ingenierías Industriales y Civiles Grado en Ingeniería en Ingeniería Química Curso 2010/2011

Informática y Programación Escuela de Ingenierías Industriales y Civiles Grado en Ingeniería en Ingeniería Química Curso 2010/2011 Módulo 1. Fundamentos de Computadores Informática y Programación Escuela de Ingenierías Industriales y Civiles Grado en Ingeniería en Ingeniería Química Curso 2010/2011 1 CONTENIDO Tema 1. Introducción

Más detalles

Tema 3. 3.3 Tecnologías de Desarrollo

Tema 3. 3.3 Tecnologías de Desarrollo Tema 3 3.3 Tecnologías de Desarrollo HTML pronto pasa a ser insuficiente para todas las posibilidades de la Red No se puede interactuar con el servidor Aparecen los primeros scripts para propocionar dichar

Más detalles

Big Data Analytics: propuesta de una arquitectura

Big Data Analytics: propuesta de una arquitectura Big Data Analytics: propuesta de una arquitectura Jonathan Solano Rodriguez y Estefany Leiva Valverde Escuela de Ingeniería, Universidad Latinoamericana de Ciencia y Tecnología, ULACIT, Urbanización Tournón,

Más detalles

Ciclo Formativo de Grado Superior Desarrollo de Aplicaciones Web

Ciclo Formativo de Grado Superior Desarrollo de Aplicaciones Web Ciclo Formativo de Grado Superior Desarrollo de Aplicaciones Web Proyecto Propio de Ampliación con Programación de Dispositivos Móviles e Inteligentes Paseo de la Puerta del Ángel, s/n 28011 Madrid www.iesellago.net

Más detalles

Facilite la Gestión, Manejo y Distribución de Información en su Web Site. WBC V2 Web Content Management

Facilite la Gestión, Manejo y Distribución de Información en su Web Site. WBC V2 Web Content Management Facilite la Gestión, Manejo y Distribución de Información en su Web Site. WBC V2 Web Content Management Web Business Creator Content Management Introducción Muchas empresas basan sus estrategias de comunicación

Más detalles

Programación de red con Cisco Application Centric Infrastructure

Programación de red con Cisco Application Centric Infrastructure Informe técnico Programación de red con Cisco Application Centric Infrastructure Descripción general En este documento se examina la compatibilidad de la programación de Cisco Application Centric Infrastructure

Más detalles

Beneficios estratégicos para su organización. Beneficios

Beneficios estratégicos para su organización. Beneficios La solución ideal para controlar la totalidad de su infraestructura IT mediante un inventario automatizado, control remoto y Gestión de activos informáticos. Beneficios Características Inventario actualizado

Más detalles

Qué significa Hadoop en el mundo del Big Data?

Qué significa Hadoop en el mundo del Big Data? Qué significa Hadoop en el mundo del Big Data? Un contenido para perfiles técnicos 2 ÍNDICE Qué significa Hadoop en el Universo Big Data?.... 3 El planteamiento: big data y data science.... 3 Los desafíos

Más detalles

Tema 1: Introducción a Java EE

Tema 1: Introducción a Java EE Tema 1: Introducción a Java EE Índice Arquitecturas características de las aplicaciones empresariales Tecnologías J2EE Alternativas a J2EE Patrones arquitectónicos Model-View-Controller y Layers Recursos

Más detalles

La Arquitectura de las Máquinas Virtuales.

La Arquitectura de las Máquinas Virtuales. La Arquitectura de las Máquinas Virtuales. La virtualización se ha convertido en una importante herramienta en el diseño de sistemas de computación, las máquinas virtuales (VMs) son usadas en varias subdiciplinas,

Más detalles

Experto en Desarrollo de Componentes Web con Tecnología Servlet y JSP (Online)

Experto en Desarrollo de Componentes Web con Tecnología Servlet y JSP (Online) Experto en Desarrollo de Componentes Web con Tecnología Servlet y JSP (Online) Experto en Desarrollo de Componentes Web con Tecnología Servlet y JSP (Online) Duración: 300 horas Precio: 200 * Modalidad:

Más detalles

Unicenter Asset Management versión 4.0

Unicenter Asset Management versión 4.0 D A T A S H E E T Unicenter Asset Management versión 4.0 Unicenter Asset Management es una completa solución para gestionar los activos TI de su entorno empresarial de forma activa. Proporciona funciones

Más detalles

Tema 1. Introducción a JAVA

Tema 1. Introducción a JAVA Tema 1. Introducción a JAVA Historia Características Plataforma Java Entorno de desarrollo Ejemplo: Hola mundo Estructura general de un programa Java 1 Historia de Java (i) Surge en 1991: Sun Microsystems

Más detalles

JSP(JAVA SERVER PAGES)

JSP(JAVA SERVER PAGES) JSP(JAVA SERVER PAGES) Introducción En la actualidad, la mayoría de los sitios Web quieren mostrar contenido dinámico basado en el usuario y en la sesión. La mayor parte del contenido, tal como imágenes,

Más detalles

Curso de Java EE Todos los Derechos Reservados Global Mentoring 2012 Experiencia y Conocimiento para tu Vida 1

Curso de Java EE Todos los Derechos Reservados Global Mentoring 2012 Experiencia y Conocimiento para tu Vida 1 Todos los Derechos Reservados Global Mentoring 2012 Experiencia y Conocimiento para tu Vida 1 Vivimos en un mundo globalizado, donde la eficiencia y productividad de las empresas es un factor crucial para

Más detalles

CAPÍTULO 3 VISUAL BASIC

CAPÍTULO 3 VISUAL BASIC CAPÍTULO 3 VISUAL BASIC 3.1 Visual Basic Microsoft Visual Basic es la actual y mejor representación del viejo lenguaje BASIC, le proporciona un sistema completo para el desarrollo de aplicaciones para

Más detalles

PROGRAMA FORMATIVO Analista de Datos Big Data Cloudera Apache Hadoop

PROGRAMA FORMATIVO Analista de Datos Big Data Cloudera Apache Hadoop PROGRAMA FORMATIVO Analista de Datos Big Data Cloudera Apache Hadoop Julio 2015 DATOS GENERALES DE LA ESPECIALIDAD 1. Familia Profesional: INFORMÁTICA Y COMUNICACIONES (IFC) Área Profesional: SISTEMAS

Más detalles

Capítulo 5. Implementación y Tecnologías Utilizadas

Capítulo 5. Implementación y Tecnologías Utilizadas Capítulo 5. Implementación y Tecnologías Utilizadas Cada vez más, se está utilizando Flash para desarrollar aplicaciones basadas en Web, pues permite la construcción de ambientes con mayor interacción.

Más detalles

Introducción a WebMathematica

Introducción a WebMathematica Introducción a WebMathematica WebMathematica es una nueva tecnología que permite la generación de contenido web dinámico con Mathematica. Se integra en Mathematica a través de un servidor web. WebMathematica

Más detalles

El Framework de desarrollo del Consejo

El Framework de desarrollo del Consejo El Framework de desarrollo del Consejo Superior de Investigaciones Científicas Director de la OPCSIC Centro Técnico de Informática (CSIC) Directora Centro Técnico de Informática (CSIC) Palabras clave Framework,

Más detalles

Metodología de Ingeniería del Software para el desarrollo y mantenimiento de sistemas de información del Gobierno de Extremadura

Metodología de Ingeniería del Software para el desarrollo y mantenimiento de sistemas de información del Gobierno de Extremadura Metodología de Ingeniería del Software para el desarrollo y mantenimiento de sistemas de información del Gobierno de Extremadura Página 1 de 23 Índice del Documento 1.- Introducción... Página 4 2.- Propuesta

Más detalles

Capítulo III. Análisis y diseño.

Capítulo III. Análisis y diseño. Capítulo III. Análisis y diseño. 3.1 Análisis. El análisis es el intermediario entre los requisitos del sistema y el diseño, esta sección definiremos el análisis con una serie de modelos técnicos del sistema,

Más detalles

Novedades. Introducción. Potencia

Novedades. Introducción. Potencia Introducción Basado en el demostrado rendimiento y flexibilidad de la versión 8.5, Crystal Reports 9 presenta una amplia variedad de avanzadas funciones para que el diseño, entrega e integración de informes

Más detalles

Unidad didáctica 2: Metodologías de desarrollo de Bases de Datos. Unidad didáctica 1: Fase de análisis de requisitos Modelo E/R

Unidad didáctica 2: Metodologías de desarrollo de Bases de Datos. Unidad didáctica 1: Fase de análisis de requisitos Modelo E/R índice Módulo A Unidad didáctica 1: Introducción a las Bases de Datos Unidad didáctica 2: Metodologías de desarrollo de Bases de Datos 3 19 Módulo B Unidad didáctica 1: Fase de análisis de requisitos Modelo

Más detalles

Con la interacción de tus empleados mejorará la productividad de tu negocio

Con la interacción de tus empleados mejorará la productividad de tu negocio 1. Introducción Con la interacción de tus empleados mejorará la productividad de tu negocio Los empleados de cualquier compañía precisan numerosos accesos en su trabajo diario, además de interaccionar

Más detalles

Unidad 1: Conceptos generales de Sistemas Operativos.

Unidad 1: Conceptos generales de Sistemas Operativos. Unidad 1: Conceptos generales de Sistemas Operativos. Tema 3: Estructura del sistema operativo. 3.1 Componentes del sistema. 3.2 Servicios del sistema operativo. 3.3 Llamadas al sistema. 3.4 Programas

Más detalles

TECNOLOGÍAS DE DESARROLLO: JAVA

TECNOLOGÍAS DE DESARROLLO: JAVA Página 1 de 13 TECNOLOGÍAS DE DESARROLLO: JAVA Java es un lenguaje de programación de Sun Microsystems originalmente llamado "Oak", que fue concebido bajo la dirección de James Gosling y Bill Joy, quienes

Más detalles

Cristian Blanco www.cristianblanco.es

Cristian Blanco www.cristianblanco.es INSTALACIÓN Y USO DE ENTORNOS DE DESARROLLO 2.1 ENTORNO DE DESARROLLO INTEGRADO Un entorno de desarrollo integrado (en inglés integrated development environment) es un programa informático compuesto por

Más detalles

Tema 2: La Tecnología Java

Tema 2: La Tecnología Java Tema 2: La Tecnología Java 0 La Tecnología de Java Es : Un lenguaje de programación Similar a C/C++ sin los problemas de manejo de memoria. Un ambiente de desarrollo Compilador, intérprete, generados de

Más detalles

ÍNDICE 1 LA NUEVA EDICIÓN DE QUIVIR...1 1.1 ENTORNO WEB...2 1.2 FIABILIDAD Y ROBUSTEZ...4 2 WEBFACING...6 3 MÁS VENTAJAS DEL USO DE LA EDICIÓN WEB...

ÍNDICE 1 LA NUEVA EDICIÓN DE QUIVIR...1 1.1 ENTORNO WEB...2 1.2 FIABILIDAD Y ROBUSTEZ...4 2 WEBFACING...6 3 MÁS VENTAJAS DEL USO DE LA EDICIÓN WEB... QUIVIR WEB EDITION ÍNDICE 1 LA NUEVA EDICIÓN DE QUIVIR...1 1.1 ENTORNO WEB...2 1.2 FIABILIDAD Y ROBUSTEZ...4 2 WEBFACING...6 3 MÁS VENTAJAS DEL USO DE LA EDICIÓN WEB...8 4 CONCLUSIONES FINALES...10 Página

Más detalles

Notas técnicas de JAVA Nro. 4 White Paper

Notas técnicas de JAVA Nro. 4 White Paper Tema: Notas técnicas de JAVA Nro. 4 White Paper (Lo nuevo, lo escondido, o simplemente lo de siempre pero bien explicado) JAVA Basics : Entendiendo la Java Virtual Machine (JVM) Java, JVM, objetos, introducción,

Más detalles

Alessandro Chacón 05-38019. Ernesto Level 05-38402. Ricardo Santana 05-38928

Alessandro Chacón 05-38019. Ernesto Level 05-38402. Ricardo Santana 05-38928 Alessandro Chacón 05-38019 Ernesto Level 05-38402 Ricardo Santana 05-38928 CONTENIDO Universo Digital Hadoop HDFS: Hadoop Distributed File System MapReduce UNIVERSO DIGITAL 161 EB 2006 Fuente: International

Más detalles

AcuServer Servidor de Archivos Remoto de Alto Rendimiento

AcuServer Servidor de Archivos Remoto de Alto Rendimiento AcuServer Servidor de Archivos Remoto de Alto Rendimiento RESUMEN EJECUTIVO AcuServer es una tecnología de servidor de datos remoto que ofrece un seguro e inmediato acceso a datos indexados, relativos

Más detalles

Solución. DigitalAccess Solución integral de banca en línea y banca móvil para Smartphones y Tablets

Solución. DigitalAccess Solución integral de banca en línea y banca móvil para Smartphones y Tablets Solución DigitalAccess Solución integral de banca en línea y banca móvil para Smartphones y Tablets Solución El mundo se encamina hacia un nuevo tipo de experiencia en servicios financieros: aquella en

Más detalles

O3 Requerimientos de Software y Hardware

O3 Requerimientos de Software y Hardware IdeaSoft Uruguay S.R.L. Phone: +598 (2) 710 4372 21 de Setiembre 2570 Fax: +598 (2) 710 4965 Montevideo http://www.ideasoft.com.uy Uruguay O3 Requerimientos de Software y Hardware Uso de memoria, espacio

Más detalles

TFC J2EE. Aplicación Web para la gestión de facturación de una empresa de cerrajería. Sara Gutiérrez Melero ITIG Junio de 2012

TFC J2EE. Aplicación Web para la gestión de facturación de una empresa de cerrajería. Sara Gutiérrez Melero ITIG Junio de 2012 TFC J2EE Aplicación Web para la gestión de facturación de una empresa de cerrajería Sara Gutiérrez Melero ITIG Junio de 2012 Consultor: Jose Juan Rodriguez Índice 1. Introducción Objetivos Planificación

Más detalles

Master Executive en Programación y Desarrollo de Aplicaciones JAVA

Master Executive en Programación y Desarrollo de Aplicaciones JAVA Master Executive en Programación y Desarrollo de Aplicaciones JAVA by admin - Martes, julio 26, 2011 http://cursosgratuitos.eu/master-gratuito-executive-en-programacion-y-desarrollo-de-aplicaciones-java/

Más detalles

TEMA 3: SISTEMAS OPERATIVOS.

TEMA 3: SISTEMAS OPERATIVOS. TEMA 3: SISTEMAS OPERATIVOS. 1. QUÉ ES UN SISTEMA OPERATIVO? 2. SISTEMAS OPERATIVOS GRÁFICOS. 3. SISTEMAS OPERATIVOS MÓVILES. 4. EL ENTORNO DE WINDOWS PARA PC. 5. LA APLICACIÓN DEL TEMA. 6. ACTIVIDADES.

Más detalles

Proyecto ELO-330 Administración Salas del Departamento de Electrónica RC1. Gerardo Lecaros Felipe Díaz

Proyecto ELO-330 Administración Salas del Departamento de Electrónica RC1. Gerardo Lecaros Felipe Díaz Proyecto ELO-330 Administración Salas del Departamento de Electrónica RC1 Gerardo Lecaros Felipe Díaz Problemática Petición de salas de forma tradicional Solución J2EE Java 2 Platform, Enterprise Edition

Más detalles

CUALIFICACIÓN SISTEMAS DE GESTIÓN DE INFORMACIÓN PROFESIONAL. Nivel 3. Versión 5 Situación RD 1201/2007 Actualización

CUALIFICACIÓN SISTEMAS DE GESTIÓN DE INFORMACIÓN PROFESIONAL. Nivel 3. Versión 5 Situación RD 1201/2007 Actualización Página 1 de 16 CUALIFICACIÓN SISTEMAS DE GESTIÓN DE INFORMACIÓN PROFESIONAL Familia Profesional Informática y Comunicaciones Nivel 3 Código IFC304_3 Versión 5 Situación RD 1201/2007 Actualización Competencia

Más detalles

Simulador de Protocolos de Red a tráves de WEB

Simulador de Protocolos de Red a tráves de WEB Simulador de Protocolos de Red a tráves de WEB Propuesta de Estudio 20071608 Director Ing. Francisco Antonio Polanco Montelongo Resumen Introducción Actualmente, el desarrollo tecnológico a alcanzado niveles

Más detalles

Utilizar los servicios de Index Service para buscar información de forma rápida y segura, ya sea localmente o en la red.

Utilizar los servicios de Index Service para buscar información de forma rápida y segura, ya sea localmente o en la red. Funciones de servidor La familia Windows Server 2003 ofrece varias funciones de servidor. Para configurar una función de servidor, instale dicha función mediante el Asistente para configurar su servidor;

Más detalles

FaceFinder MÓDULO DE BÚSQUEDA DE PERSONAS DENTRO DE UNA BASE DE DATOS DE ROSTROS

FaceFinder MÓDULO DE BÚSQUEDA DE PERSONAS DENTRO DE UNA BASE DE DATOS DE ROSTROS FaceFinder MÓDULO DE BÚSQUEDA DE PERSONAS DENTRO DE UNA BASE DE DATOS DE ROSTROS Introducción Los algoritmos utilizados para el procesamiento de imágenes son de complejidad computacional alta. Por esto

Más detalles

2.1 Compuertas para Bases de Datos

2.1 Compuertas para Bases de Datos 1 Colección de Tesis Digitales Universidad de las Américas Puebla Romero Martínez, Modesto Uno de los aspectos mas importantes en un sistema multibase de datos es la forma en como llevar a cabo la comunicación

Más detalles

Capitulo 5. Implementación del sistema MDM

Capitulo 5. Implementación del sistema MDM Capitulo 5. Implementación del sistema MDM Una vez que se concluyeron las actividades de análisis y diseño se comenzó la implementación del sistema MDM (Manejador de Documentos de MoProSoft). En este capitulo

Más detalles

Hadoop. Cómo vender un cluster Hadoop?

Hadoop. Cómo vender un cluster Hadoop? Hadoop Cómo vender un cluster Hadoop? ÍNDICE Problema Big Data Qué es Hadoop? Descripción HDSF Map Reduce Componentes de Hadoop Hardware Software 3 EL PROBLEMA BIG DATA ANTES Los datos los generaban las

Más detalles

Laboratorio de Procesamiento Paralelo MultiCluster accesible vía v a WEB

Laboratorio de Procesamiento Paralelo MultiCluster accesible vía v a WEB FACULTAD DE INFORMÁTICA UNIVERSIDAD NACIONAL DE LA PLATA Laboratorio de Procesamiento Paralelo MultiCluster accesible vía v a WEB Tesina de Licenciatura en Sistemas Autor: Adrián Pousa Director: Armando

Más detalles

COMPARTIENDO UN LIBRO DE TRABAJO EXCEL 2007. Manual de Referencia para usuarios. Salomón Ccance CCANCE WEBSITE

COMPARTIENDO UN LIBRO DE TRABAJO EXCEL 2007. Manual de Referencia para usuarios. Salomón Ccance CCANCE WEBSITE COMPARTIENDO UN LIBRO DE TRABAJO EXCEL 2007 Manual de Referencia para usuarios Salomón Ccance CCANCE WEBSITE COMPARTIENDO UN LIBRO DE TRABAJO Existen muchas formas de compartir, analizar y comunicar información

Más detalles

TEMA 37: Arquitecturas Cliente / Servidor. Tipos de cliente. Tipos de Servidor. Clasificación del software.

TEMA 37: Arquitecturas Cliente / Servidor. Tipos de cliente. Tipos de Servidor. Clasificación del software. . TEMA 37: Arquitecturas Cliente / Servidor. Tipos de cliente. Tipos de Servidor. Clasificación del software. Índice 1 INTRODUCCIÓN 2 2 CARACTERÍSTICAS 2 2.1 Características del cliente...2 2.2 Características

Más detalles

Diplomado Java. Descripción. Objetivo. A quien está dirigido. Requisitos. Beneficios

Diplomado Java. Descripción. Objetivo. A quien está dirigido. Requisitos. Beneficios Diplomado Java Descripción El lenguaje de programación Java es uno de los más utilizados hoy en día. Su potencia, simplicidad, funcionalidad y capacidad hacen que este lenguaje sea una de las herramientas

Más detalles

BIG DATA & SEGURIDAD UN MATRIMONIO DE FUTURO

BIG DATA & SEGURIDAD UN MATRIMONIO DE FUTURO BIG DATA & SEGURIDAD UN MATRIMONIO DE FUTURO PRESENTACIÓN ANTONIO GONZÁLEZ CASTRO IT SECURITY DIRECTOR EN PRAGSIS TECHNOLOGIES agcastro@pragsis.com antoniogonzalezcastro.es @agonzaca linkedin.com/in/agonzaca

Más detalles

Windows Server 2003. Windows Server 2003

Windows Server 2003. Windows Server 2003 Windows Server 2003 Windows Server 2003 Es un sistema operativo de la familia Windows de la marca Microsoft para servidores que salió al mercado en el año 2003. Está basada en tecnología NT y su versión

Más detalles

Solución empresarial Hadoop de EMC. NAS de escalamiento horizontal Isilon y Greenplum HD

Solución empresarial Hadoop de EMC. NAS de escalamiento horizontal Isilon y Greenplum HD Informe técnico Solución empresarial Hadoop de EMC NAS de escalamiento horizontal Isilon y Greenplum HD Por Julie Lockner, analista ejecutivo, y Terri McClure, analista ejecutivo Febrero de 2012 Este Informe

Más detalles