Apéndices técnicos. Método de representación: forma en que serán representados internamente los documentos.
|
|
- José Belmonte Ayala
- hace 8 años
- Vistas:
Transcripción
1 APÉNDICE A: INDEXACIÓN DE INFORMACIÓN. LUCENE 1. INTRODUCCIÓN: INDEXACIÓN DE INFORMACIÓN El desarrollo y crecimiento masivo de las redes de computadoras y medios de almacenamiento a lo largo de los últimos años, ha motivado la aparición de un creciente interés por los sistemas de clasificación automática de documentos. Estos sistemas realizan diferentes operaciones de clasificación basándose en el análisis del contenido del texto de los documentos que procesan. La mayoría de las técnicas de análisis y representación de documentos utilizadas en la actualidad en los sistemas de clasificación, se basan en criterios fundamentalmente estadísticos, centrados en frecuencias de aparición de términos en documentos. Dentro de los sistemas de clasificación de documentos podemos distinguir los sistemas de recuperación de texto, que seleccionan aquellos textos o documentos que son adecuados a una necesidad del usuario entre un conjunto más amplio, y sistemas de agrupamiento de textos que, a partir de un conjunto de textos, construyen subconjuntos de éstos con contenidos semejantes. Si trabajamos con este tipo de sistemas, debemos centrarnos en tres cuestiones fundamentales: Método de representación: forma en que serán representados internamente los documentos. Método de análisis: proceso que permitirá obtener las representaciones concretas de los documentos a partir del análisis de su contenido. Motor de búsqueda para un SRI con agrupamiento 97
2 Método de cálculo de similitud: entre las representaciones de los documentos y la representación del otro elemento de la operación de clasificación. En la figura que se muestra a continuación se representa la operación de recuperación de textos centrada en las tres cuestiones descritas. En ella se puede observar que, en este caso, el elemento específico de la operación de clasificación es una consulta de usuario; es decir, que los documentos que se recuperarían serían aquellos cuya representación interna presentase una mayor similitud con la de la consulta del usuario. Documentos de texto Consulta del usuario Análisis Análisis Representación de Documentos Representación de consulta Cálculo de similitud Documentos recuperados Motor de búsqueda para un SRI con agrupamiento 98
3 Una vez introducida la recuperación de textos, diremos que el término de indexación hace referencia a un método que engloba la definición de uno de representación y uno de análisis. El término proceso de indexación hace referencia al proceso de análisis de documentos para la obtención de una representación concreta de los mismos. Existe una serie de elementos que se pueden utilizar para la definición de métodos de indexación y cálculo de similitud. En concreto, el modelo del espacio vectorial proporciona las bases para definir un método de representación y cálculo de similitud. En el modelo del espacio vectorial se propone la representación de cada documento mediante un vector cuyos componentes son los pesos asociados a los términos utilizados en la representación. Para realizar el proceso de indexación utilizando una representación basada en el espacio vectorial se pueden utilizar los siguientes elementos, que permiten obtener la representación interna de los documentos mediante un análisis automático de su contenido: 1. Peso de los términos El concepto de poder de resolución de un término proporciona una base para los métodos de indexación basados en frecuencia de aparición de términos. El poder de resolución de un término proporciona información acerca de su adecuación como término de indexación. 2. Listas de parada Las listas de parada(stoplists) se utilizan en el análisis de los documentos para la eliminación de una serie de palabras que no resultan útiles para la obtención de términos de indexación, por ejemplo, de, en, el, etc. 3. Extracción de raíces Los algoritmos de extracción de raíces(stemming), o de eliminación de sufijos, se encuentran orientados a obtener un único término a partir de Motor de búsqueda para un SRI con agrupamiento 99
4 diferentes palabras que constituyen, esencialmente, variaciones morfológicas con un mismo significado. El resultado del algoritmo debe ser una misma forma regular para las diferentes variantes morfológicas de una palabra, que no tiene por qué ser, necesariamente, la raíz lingüística. 4. Frases de términos Las frases de términos se orientan a la obtención de términos de indexación con un significado más preciso que el de los términos obtenidos directamente a partir de las palabras individuales. Una frase de términos es una tupla de términos y constituye en sí misma un nuevo término de indexación. 5. Thesaurus Un thesaurus proporciona una agrupación o clasificación de términos en un determinado dominio o área en categorías denominadas clases. Permite recuperar documentos que son relevantes a la consulta de un usuario, aunque no aparezcan en ellos los términos de la consulta, pero si sinónimos de estos. 2. LUCENE 2.1. INTRODUCCIÓN Lucene es una novedosa herramienta que permite tanto la indexación cómo la búsqueda de documentos. Creada bajo una metodología orientada a objetos e implementada completamente en Java, no se trata de una aplicación que pueda ser descargada, instalada y ejecutada sino de una API flexible, muy potente y realmente fácil de utilizar, a través de la cual se pueden añadir, con pocos esfuerzos de programación, capacidades de indexación y búsqueda a cualquier sistema que se esté desarrollando. Originalmente escrita por Doug Cutting, en Septiembre de 2001 pasó a formar parte de la familia de código abierto de la fundación Jakarta. Desde Motor de búsqueda para un SRI con agrupamiento 100
5 entonces, debido a su mayor disponibilidad, ha atraído a un gran número de desarrolladores, incluso empresas como Hewlett Packard, FedEx, etc. usan, o al menos lo han evaluado. Existen otras herramientas, a parte de Lucene, que permiten realizar la indexación y búsqueda de documentos pero dichas herramientas han sido optimizadas para usos concretos, lo que implica que el intentar adaptar dichas herramientas a un proyecto específico sea una tarea realmente difícil. La idea que engloba Lucene es completamente diferente, ya que su principal ventaja es su flexibilidad, que permite su utilización en cualquier sistema que lleve a cabo procesos de indexación CARACTERÍSTICAS A continuación se detallan algunas características que hacen de Lucene una herramienta flexible y adaptable: Indexación incremental vs indexación por lotes. El término de indexación por lotes se utiliza para referirse a aquellos procesos de indexación, en los cuales, una vez que ha sido creado el índice para un conjunto de documentos, el intentar añadir algunos documentos nuevos es una tarea difícil por lo que se opta por reindexar todos los documentos de nuevo. Sin embargo en la indexación incremental se pueden añadir documentos a un índice ya creado con anterioridad de forma fácil. Lucene soporta ambos tipos de indexación. Origen de datos. Muchas herramientas de indexación sólo permiten indexar ficheros o páginas web, lo que supone un serio inconveniente cuando se tiene que indexar contenido almacenado en una base de datos. Lucene permite indexar tanto Motor de búsqueda para un SRI con agrupamiento 101
6 documentos y páginas web como el contenido procedente de una base de datos. Contenido Etiquetado. Algunas herramientas, tratan los documentos como simples flujos de palabras. Pero otras como Lucene permiten dividir el contenido de los documentos en campos y así poder realizar consultas con un mayor contenido semántico. Esto es, se pueden buscar términos en los distintos campos del documento concediéndole más importancia según el campo en el que aparezca. Por ejemplo, si se dividen los documentos en dos campos, título y contenido, puede concederse mayor importancia a aquellos documentos que contengan los términos de la búsqueda en el campo título. Técnica de indexación. Existen palabras tales como a, unos, el, la etc. que añaden poco significado al índice, son palabras poco representativas del documento. Al eliminar estas palabras del índice se reduce considerablemente el tamaño del mismo así como el tiempo de indexación. Estas palabras están contenidas en lo que se denomina lista de parada, que es la técnica de indexación contemplada por Lucene. Concurrencia. Lucene gestiona que varios usuarios puedan buscar en el índice de forma simultánea así como también que un usuario modifique el índice al mismo tiempo que otro lo consulta. Elección del idioma Tal y como ya se indicó con anterioridad Lucene trabaja con listas de parada, las cuales son proporcionadas por el desarrollador que está utilizando Lucene, esto permite escoger el idioma a utilizar. Motor de búsqueda para un SRI con agrupamiento 102
7 2.3. COMO OBTENER LUCENE Como la mayoría de los proyectos de Jakarta, Lucene se distribuye en forma de ficheros binarios precompilados o de código fuente. Ambas distribuciones pueden ser descargadas de la página oficial de Jakarta, así como también una demo que permite ver el funcionamiento de Lucene FUNCIONALIDAD BÁSICA Como ya se ha mencionado anteriormente, en la introducción de este anexo, Lucene es una herramienta que permite tanto la indexación cómo la búsqueda de documentos. A continuación, y puesto que indexación y búsqueda son dos operaciones muy generales, que abarcan multitud de aspectos, se trata en detalle cada una de ellas Indexación De Documentos Creación de un índice La creación de un índice constituye el punto de partida para el trabajo con Lucene, puesto que una vez que ha sido creado, se irán añadiendo todos aquellos documentos susceptibles de ser indexados. El sencillo programa que se muestra a continuación, CrearIndice.java, construye un índice vacío, para lo cual simplemente crea un objeto IndexWriter. Motor de búsqueda para un SRI con agrupamiento 103
8 public class CreateIndice { public static void main(string[] args) throws Exception { String indexpath = args[0]; IndexWriter writer; writer = new IndexWriter(indexPath, null, true); writer.close(); } } La clase IndexWriter se utiliza tanto para la creación de índices como para su mantenimiento. Cuando se crea un objeto de esta clase, como se puede observar en el ejemplo, al constructor se le pasan tres parámetros. Puesto que en este caso, lo que nos interesa es la creación del índice, solamente son relevantes el primero y el tercero: el primero representa el path dónde será almacenado el índice(en el ejemplo, se introduce en línea de comandos)y con el valor del tercero establecido a true, indicamos que lo que estamos es creando el índice y no abriéndolo para su mantenimiento. El segundo de los parámetros se establece a un valor null. El método close() se llama para liberar todos los recursos asociados a la creación del índice. Motor de búsqueda para un SRI con agrupamiento 104
9 Añadir documentos a un índice Una vez que tenemos un índice creado, está listo para empezar a añadirle documentos. La siguiente porción de código, IndexFile.java, muestra cómo podemos llevar a cabo esta operación. Para cada uno de los documentos(nombrados en la línea de comandos), se crea un objeto Document y posteriormente se llama al método adddocument del IndexWriter para añadirlo al índice. public class IndexFiles { public static void main(string[] args) throws Exception { String indexpath = args[0]; IndexWriter writer; writer = new IndexWriter(indexPath, new SimpleAnalyzer(), false); for (int i=1; i<args.length; i++) { System.out.println("Indexing file " + args[i]); InputStream is = new FileInputStream(args[i]); Document doc = new Document(); doc.add(field.unindexed("path", args[i])); doc.add(field.text("body", (Reader) new InputStreamReader(is))); writer.adddocument(doc); is.close(); }; } } writer.close(); Motor de búsqueda para un SRI con agrupamiento 105
10 Los documentos constituyen la unidad de indexación y búsqueda en Lucene. Un objeto Document representa un único documento, modelado como un conjunto de campos(fields) de la forma <nombre,valor>. Cuando creamos un objeto Document, la llamada al constructor, como se puede observar en el ejemplo, no requiere ningún parámetro y construye un nuevo documento sin ningún campo. Una vez creado el documento, para añadirle campos, se utiliza el método add, al que pasamos el campo como parámetro. A la hora de crear un objeto Field, tenemos que tener en cuenta una serie de importantes consideraciones, ya que algunas de las decisiones que se tomen en este punto afectarán en los posteriores procesos de búsqueda sobre el índice. Cuando creamos un objeto Field, aparte del nombre de dicho campo y de su valor, debemos proporcionar tres valores booleanos adicionales que indican lo siguiente: El primero de ellos indica si el campo será indexado para las búsquedas. En determinados casos, puede interesarnos almacenar campos de un documento que no son relevantes para los procesos de búsqueda. El segundo de los valores indica si el valor de un campo será tokenizado previamente a que sea indexado; es decir, en caso de que este parámetro sea true el valor de dicho campo es convertido en una secuencia de tokens o trozos de texto. Finalmente se puede indicar si se desea que el valor de un campo sea almacenado en el índice. En el caso de que el contenido del campo sea razonablemente pequeño, Lucene permite que éste sea almacenado en el índice. Con los campos almacenados en el índice, en lugar de utilizar el Documento para localizar el fichero o los datos originales, se pueden recuperar directamente del índice. Motor de búsqueda para un SRI con agrupamiento 106
11 Una vez construido el documento con los campos deseados, éste se añade al índice a través del método adddocument de IndexWriter. Esta clase ya ha sido comentada para la operación de creación del índice, pero en este caso se utiliza para la manipulación de uno ya creado. Cuando queremos abrir un índice para añadir documentos, al constructor de IndexWriter le pasamos el nombre de dicho índice, un objeto Analizer, y un valor booleano establecido a false, para indicar que no estamos creando un índice sino abriendo uno ya existente. Un objeto Analyzer se crea para analizar un texto y en base a un determinado criterio, obtener la representación interna de dicho texto en el índice. Los Analizadores preprocesan el texto de entrada convirtiendo éste en una secuencia de tokens y se utilizan tanto al añadir un documento a un índice como en los procesos de búsqueda, puesto que el texto o criterio de búsqueda debe de ser procesado de la misma manera que el contenido de los campos del documento cuando éste es añadido al índice. Uno de los criterios de análisis más utilizados es el de la lista de parada, que consiste en eliminar del texto una serie de palabras que no resultan útiles para la obtención de términos tanto de indexación como de búsqueda, como por ejemplo, de, en, el, etc. En este caso, el objeto que se pasa al constructor de IndexWriter, es un objeto StopAnalyzer, subclase de Analyzer. Cualquier aplicación que haga uso de Lucene debe proporcionar los datos que van a ser indexados bien como un String o bien como InputStream. Es por esta razón que Lucene permite la indexación de datos, no sólo de ficheros, sino de cualquier fuente(bd,etc.) En el caso de que los documentos se encuentren almacenados en ficheros, se utiliza FileInputStream para recuperarlos; En caso de que se encuentren almacenados en una base de datos, se hace uso de InputStream y de manera similar, se puede recuperar contenido HTML, por ejemplo, utilizando FilterInputStream, que permite la eliminación de etiquetas. Motor de búsqueda para un SRI con agrupamiento 107
12 Búsqueda De Documentos La búsqueda de documentos constituye la funcionalidad principal proporcionada por Lucene. Para ello aporta múltiples clases y métodos para la representación de consultas y para buscar en el índice aquellos documentos que son relevantes y cumplen con los criterios de la búsqueda. El código que se muestra a continuación, Search.java, es un sencillo ejemplo de cómo buscar en un índice. public class Search { public static void main(string[] args) throws Exception { String indexpath = args[0], querystring = args[1]; Searcher searcher = new IndexSearcher(indexPath); Query query = QueryParser.parse(queryString, "body", new SimpleAnalyzer()); Hits hits = searcher.search(query); for (int i=0; i<hits.length(); i++) { System.out.println(hits.doc(i).get("path") + "; Score: " + hits.score(i)); }; } } Las tres clases más importantes que proporcionan métodos relacionados con la búsqueda de documentos indexados son Search, Hits y Query(con sus respectivas subclases) Motor de búsqueda para un SRI con agrupamiento 108
13 La clase Searcher es una clase abstracta y constituye la base para cualquier búsqueda en un índice de documentos. Declara métodos que son implementados por sus subclases, como por ejemplo, IndexSearcher, proporcionando así la forma de acceder y recuperar información indexada. En el caso de Search.java, se crea un objeto de este tipo, pasando al constructor un único parámetro, que no es otro que el path dónde se encuentra el índice de documentos. El método más importante de esta clase es el método search(), que devuelve todos aquellos documentos que cumplen con las condiciones de la búsqueda. Su sintaxis es la siguiente: Hits search (Query query) en la cual se corrobora que junto con Searcher, a la hora de realizar búsquedas de documentos en un índice destacan Hits y Query. La clase Query, al igual que Searcher es una clase abstracta siendo QueryParser su subclase más importante, de la cual el método que más funcionalidad proporciona a la búsqueda de documentos es parse(). Este método partiendo de una cadena de entrada, del campo del documento dónde se desea realizar la búsqueda y de un analizador 7, obtiene como parámetro de salida una Query. Una Query está formada por una serie de cláusulas de la forma: 1. Toda cláusula debe ir predecida de: Un símbolo más(+) o un símbolo menos(-) indicando si la cláusula es requerida o es rechazada, o Un termino seguido de una coma, indicando el campo dónde se va a realizar la búsqueda, lo cual permite la construcción de Querys que implementen búsquedas en varios campos de un documento indexado. 2. Además de: 7 Los analizadores ya han sido explicados en el apartado anterior. Motor de búsqueda para un SRI con agrupamiento 109
14 Un término, indicando todos los documentos que contienen a dicho término, o Una Query anidada, encerrada entre paréntesis. En formato BNF, la gramática que resume esto, sería: Query ::= ( Clause )* Clause ::= ["+", "-"] [<TERM> ":"] ( <TERM> "(" Query ")" ) Una vez que hemos obtenido una Query, pasada como argumento al método search(), éste devuelve un objeto Hits, que representa una colección ordenada de documentos(podemos pensar en un Hits como en un Vector, ordenado, claro). El orden viene determinado por la relevancia de cada documento en la búsqueda implementada por la Query. De esta manera habremos obtenido aquellos documentos que cumplen con las expectativas de la búsqueda introducida. Motor de búsqueda para un SRI con agrupamiento 110
Modulo 1 El lenguaje Java
Modulo 1 El lenguaje Java 13 - Codificación en Java Una de las grandes diferencias entre Java y Pascal en cuando a la codificación es que Java se trata de un lenguaje de los llamados case sensitive Esto
TEMA 4: EMPEZANDO A NAVEGAR ESCUELA UNIVERSITARIA DE INFORMÁTICA. Raúl Martín Martín
TEMA 4: EMPEZANDO A ESCUELA UNIVERSITARIA DE INFORMÁTICA NAVEGAR Raúl Martín Martín SERVICIOS DE INTERNET SERVICIOS DE INTERNET Las posibilidades que ofrece Internet se denominan servicios. Hoy en día,
CASO PRÁCTICO. ANÁLISIS DE DATOS EN TABLAS DINÁMICAS
CASO PRÁCTICO. ANÁLISIS DE DATOS EN TABLAS DINÁMICAS Nuestra empresa es una pequeña editorial que maneja habitualmente su lista de ventas en una hoja de cálculo y desea poder realizar un análisis de sus
SEGURIDAD Y PROTECCION DE FICHEROS
SEGURIDAD Y PROTECCION DE FICHEROS INTEGRIDAD DEL SISTEMA DE ARCHIVOS ATAQUES AL SISTEMA PRINCIPIOS DE DISEÑO DE SISTEMAS SEGUROS IDENTIFICACIÓN DE USUARIOS MECANISMOS DE PROTECCIÓN Y CONTROL INTEGRIDAD
Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322
Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322 Nicole García Gómez 2830047-6 Diego Riquelme Adriasola 2621044-5 RESUMEN.- La minería de datos corresponde a la extracción
Propuesta de Portal de la Red de Laboratorios Virtuales y Remotos de CEA
Propuesta de Portal de la Red de Laboratorios Virtuales y Remotos de CEA Documento de trabajo elaborado para la Red Temática DocenWeb: Red Temática de Docencia en Control mediante Web (DPI2002-11505-E)
GENERALIDADES DE BASES DE DATOS
GENERALIDADES DE BASES DE DATOS A fin de evitar que idénticos datos se encuentren repetidos en múltiples archivos, parece necesario que los comunes se almacenen en un archivo único y que este archivo sea
UNIVERSIDAD DE SALAMANCA
UNIVERSIDAD DE SALAMANCA FACULTAD DE CIENCIAS INGENIERÍA TÉCNICA EN INFORMÁTICA DE SISTEMAS Resumen del trabajo práctico realizado para la superación de la asignatura Proyecto Fin de Carrera. TÍTULO SISTEMA
Unidad 1. Fundamentos en Gestión de Riesgos
1.1 Gestión de Proyectos Unidad 1. Fundamentos en Gestión de Riesgos La gestión de proyectos es una disciplina con la cual se integran los procesos propios de la gerencia o administración de proyectos.
App para realizar consultas al Sistema de Información Estadística de Castilla y León
App para realizar consultas al Sistema de Información Estadística de Castilla y León Jesús M. Rodríguez Rodríguez rodrodje@jcyl.es Dirección General de Presupuestos y Estadística Consejería de Hacienda
Este instructivo ha sido ordenado de manera tal de ir explicando las distintas secciones, que son las siguientes:
INSTRUCTIVO DE USO DEL NUEVO SERVICIO DE MICROJURIS En este manual le ofreceremos los consejos básicos para que empiece a utilizar la herramienta de Microjuris.com. y pueda aprovechar todas las innovaciones
MODELOS DE RECUPERACION
RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN INGENIERÍA INFORMÁTICA RECUPERACIÓN Y ACCESO A LA INFORMACIÓN MODELOS DE RECUPERACION AUTOR: Rubén García Broncano NIA 100065530 grupo 81 1 INDICE 1- INTRODUCCIÓN
Elementos requeridos para crearlos (ejemplo: el compilador)
Generalidades A lo largo del ciclo de vida del proceso de software, los productos de software evolucionan. Desde la concepción del producto y la captura de requisitos inicial hasta la puesta en producción
MANUAL DE CS-ALMACENES
MANUAL DE CS-ALMACENES INSTALACIÓN DEL PROGRAMA La instalación del programa es muy sencilla simplemente haga doble click sobre el instalador que se puede descargar de la página web. Al pulsarlo se le irán
Modelo de Objetos Distribuidos
Remote Method Invocation Modelo de Objetos Distribuidos Un objeto remoto es un objeto cuyos métodos pueden ser invocados desde otra máquina virtual de java, potencialmente en un host diferente. Modelo
Sistemas de Recuperación de Información
Sistemas de Recuperación de Información Los SRI permiten el almacenamiento óptimo de grandes volúmenes de información y la recuperación eficiente de la información ante las consultas de los usuarios. La
Plataforma e-ducativa Aragonesa. Manual de Administración. Bitácora
Plataforma e-ducativa Aragonesa Manual de Administración Bitácora ÍNDICE Acceso a la administración de la Bitácora...3 Interfaz Gráfica...3 Publicaciones...4 Cómo Agregar una Publicación...4 Cómo Modificar
Mesa de Ayuda Interna
Mesa de Ayuda Interna Documento de Construcción Mesa de Ayuda Interna 1 Tabla de Contenido Proceso De Mesa De Ayuda Interna... 2 Diagrama Del Proceso... 3 Modelo De Datos... 4 Entidades Del Sistema...
- MANUAL DE USUARIO -
- MANUAL DE USUARIO - Aplicación: Kz Precio Hora Instagi Instagi Teléfono: 943424465-943466874 Email: instagi@instagi.com GUIA PROGRAMA CALCULO PRECIO HORA 1. Introducción 2. Datos de la empresa 2.1.Gastos
Catoira Fernando Fullana Pablo Rodriguez Federico [MINERIA DE LA WEB] Proyecto Final - Informe Final
Catoira Fernando Fullana Pablo Rodriguez Federico [MINERIA DE LA WEB] Proyecto Final - Informe Final INTRODUCCION En principio surgió la idea de un buscador que brinde los resultados en agrupaciones de
Resumen de la solución SAP SAP Technology SAP Afaria. Gestión de la movilidad empresarial para mayor ventaja competitiva
de la solución SAP SAP Technology SAP Afaria Gestión de la movilidad empresarial para mayor ventaja competitiva Simplificar la gestión de dispositivos y aplicaciones Simplificar la gestión de dispositivos
SOLUCIÓN CASO GESTIÓN DE PERSONAL I
SOLUCIÓN CASO GESTIÓN DE PERSONAL I Empezaremos abriendo un nuevo libro de trabajo que podemos guardar como Nóminas e introducimos los datos que nos proporciona el enunciado relativos a coste por hora
Un primer acercamiento a la CMDB.
Un Versión primer 1.2 acercamiento a la CMDB. 20/07/2005 Un primer acercamiento a la CMDB. Versión 1.1 1.2 18/02/05 20/02/05 Fecha Jose Autores Carlos Manuel García Viejo García Lobato http://ars.viejolobato.com
Gestión de Permisos. Bizagi Suite. Copyright 2014 Bizagi
Gestión de Permisos Bizagi Suite Gestión de Permisos 1 Tabla de Contenido Gestión de Permisos... 3 Definiciones... 3 Rol... 3 Perfil... 3 Permiso... 3 Módulo... 3 Privilegio... 3 Elementos del Proceso...
Diseño orientado al flujo de datos
Diseño orientado al flujo de datos Recordemos que el diseño es una actividad que consta de una serie de pasos, en los que partiendo de la especificación del sistema (de los propios requerimientos), obtenemos
Práctica de introducción a
Práctica de introducción a XML El trabajo consiste en una introducción al uso del lenguaje XML y su aplicación en documentos y sistemas de caracteristicas multimedia. 1.- Qué es XML? XML (extensible Markup
CONSULTAS CON SQL. 3. Hacer clic sobre el botón Nuevo de la ventana de la base de datos. Aparecerá el siguiente cuadro de diálogo.
CONSULTAS CON SQL 1. Qué es SQL? Debido a la diversidad de lenguajes y de bases de datos existentes, la manera de comunicar entre unos y otras sería realmente complicada a gestionar de no ser por la existencia
GuÍa rápida de uso. westlaw chile
GuÍa rápida de uso westlaw chile guía rápida de uso de westlaw chile Área legal como acceder Ingreso Para acceder a nuestra nueva plataforma de información, debe ingresar a nuestro sitio oficial www.puntolex.cl
En cualquier caso, tampoco es demasiado importante el significado de la "B", si es que lo tiene, lo interesante realmente es el algoritmo.
Arboles-B Características Los árboles-b son árboles de búsqueda. La "B" probablemente se debe a que el algoritmo fue desarrollado por "Rudolf Bayer" y "Eduard M. McCreight", que trabajan para la empresa
GedicoPDA: software de preventa
GedicoPDA: software de preventa GedicoPDA es un sistema integrado para la toma de pedidos de preventa y gestión de cobros diseñado para trabajar con ruteros de clientes. La aplicación PDA está perfectamente
Manual CMS Mobincube
Manual CMS Mobincube CMS Mobincube Qué es? El CMS (Sistema de Gestión de Contenidos) es un completo website que permite la creación y actualización de contenido remoto. De esta forma, una vez creada una
Tutorial: Primeros Pasos con Subversion
Tutorial: Primeros Pasos con Subversion Introducción Subversion es un sistema de control de versiones open source. Corre en distintos sistemas operativos y su principal interfaz con el usuario es a través
ARQUITECTURA DE DISTRIBUCIÓN DE DATOS
4 ARQUITECTURA DE DISTRIBUCIÓN DE DATOS Contenido: Arquitectura de Distribución de Datos 4.1. Transparencia 4.1.1 Transparencia de Localización 4.1.2 Transparencia de Fragmentación 4.1.3 Transparencia
CONSTRUCCIÓN DEL PROCESO MESA DE AYUDA INTERNA. BizAgi Process Modeler
CONSTRUCCIÓN DEL PROCESO MESA DE AYUDA INTERNA BizAgi Process Modeler TABLA DE CONTENIDO PROCESO DE MESA DE AYUDA INTERNA... 3 1. DIAGRAMA DEL PROCESO... 4 2. MODELO DE DATOS... 5 ENTIDADES DEL SISTEMA...
Ministerio de Educación. Base de datos en la Enseñanza. Open Office. Módulo 5: Report Builder
Ministerio de Educación Base de datos en la Enseñanza. Open Office Módulo 5: Report Builder Instituto de Tecnologías Educativas 2011 Informes con Oracle Report Builder En su configuración original, OpenOffice
Normas y procedimientos para la clasificación de los documentos administrativos
Normas y procedimientos para la clasificación de los documentos administrativos La Universidad de Lleida (UdL) necesita desarrollar el cuadro de clasificación de los documentos administrativos, para toda
Ciclo de vida y Metodologías para el desarrollo de SW Definición de la metodología
Ciclo de vida y Metodologías para el desarrollo de SW Definición de la metodología La metodología para el desarrollo de software es un modo sistemático de realizar, gestionar y administrar un proyecto
Presentaciones. Con el estudio de esta Unidad pretendemos alcanzar los siguientes objetivos:
UNIDAD 8 Presentaciones Reunión. (ITE. Banco de imágenes) as presentaciones son documentos formados por una sucesión de páginas, llamadas diapositivas, que transmiten información estructurada de manera
PAGOS DOMICILIADOS - GESTIÓN DE PAGOS PAGOS DOMICILIADOS Y GESTIÓN DE PAGOS
PAGOS DOMICILIADOS Y GESTIÓN DE PAGOS 1 INDICE GESTIÓN DE PAGOS DOMICILIADOS 3 Incorporar beneficiarios manualmente 4 Anulación de pagos domiciliados o gestión de pagos 7 Importar beneficiarios de un fichero
Máster en Lenguajes y Sistemas Informáticos: Tecnologías del Lenguaje en la Web Universidad de Educación a Distancia Marzo 2013
Presentación de Trabajo de Fin de Máster PROPUESTA DE BÚSQUEDA SEMÁNTICA: APLICACIÓN AL CATÁLOGO DE MAPAS, PLANOS Y DIBUJOS DEL ARCHIVO GENERAL DE SIMANCAS Máster en Lenguajes y Sistemas Informáticos:
Manual de Introducción a SIMULINK
Manual de Introducción a SIMULINK Autor: José Ángel Acosta Rodríguez 2004 Capítulo Ejemplo.. Modelado de un sistema dinámico En este ejemplo se realizará el modelado de un sistema dinámico muy sencillo.
Manual del Protocolo XML-RPC de Mensajería Negocios
Manual del Protocolo XML-RPC de Mensajería Negocios Índice de contenidos 1 INTRODUCCIÓN... 3 2 FUNCIONALIDADES DEL API DE COMUNICACIÓN XML-RPC... 4 2.1 Envío Libre... 4 2.2 Envío a Grupo de Contactos...
LA LOGÍSTICA COMO FUENTE DE VENTAJAS COMPETITIVAS
LA LOGÍSTICA COMO FUENTE DE VENTAJAS COMPETITIVAS Los clientes compran un servicio basandose en el valor que reciben en comparacion con el coste en el que incurren. Por, lo tanto, el objetivo a largo plazo
6. SISTEMAS CAD-CAM (CAM) 6.1. CONCEPTO DE CAM
6.1. CONCEPTO DE CAM Las siglas CAM corresponden al acrónimo de Computer Aided Manufacturing, Fabricación asistida por ordenador. Por CAM se entiende la utilización de ordenadores para tareas técnicas
01 Índice. GESTOR DE CONTENIDOS Manual de uso 01 ÍNDICE... 1 02 OBJETO DEL DOCUMENTO... 2 03 ESTRUCTURA GRÁFICA DEL SISTEMA... 3
01 Índice 01 ÍNDICE..... 1 02 OBJETO DEL DOCUMENTO..... 2 03 ESTRUCTURA GRÁFICA DEL SISTEMA..... 3 04 GESTIÓN DE TABLAS..... 5 05 USO DE TABLAS EN ENVIDUR..... 15 06 GESTIÓN DE FUNCIONALIDAD ADICIONAL.
UNIDAD 2: Abstracción del Mundo real Al Paradigma Orientado a Objetos
2.1. Principios básicos del Modelado de Objetos UNIDAD 2: Abstracción del Mundo real Al Paradigma Orientado a Objetos Hoy en día muchos de los procesos que intervienen en un negocio o empresa y que resuelven
1.1. Introducción y conceptos básicos
Tema 1 Variables estadísticas Contenido 1.1. Introducción y conceptos básicos.................. 1 1.2. Tipos de variables estadísticas................... 2 1.3. Distribuciones de frecuencias....................
Descarga, instalación y uso de herramientas:
Descarga, instalación y uso de herramientas: Eclipse: Instalación de Eclipse (Más información en http://www.eclipse.org/) 1. Copiar, descomprimir e instalar si es necesario la última versión de Eclipse
ASOCIACION DE PERSONAL OPS/OMS
ASOCIACION DE PERSONAL OPS/OMS BASE DE DATOS DE LA ASOCIACION DE PERSONAL MANUAL PARA EL USUARIO Alicia Fernández Toricez Montevideo Uruguay 2004 1. INTRODUCCION La Asociación de Personal de la OPS/OMS
1.4.1.2. Resumen... 1.4.2. ÁREA DE FACTURACIÓN::INFORMES::Pedidos...27 1.4.2.1. Detalle... 1.4.2.2. Resumen... 1.4.3. ÁREA DE
MANUAL DE USUARIO DE ABANQ 1 Índice de contenido 1 ÁREA DE FACTURACIÓN......4 1.1 ÁREA DE FACTURACIÓN::PRINCIPAL...4 1.1.1. ÁREA DE FACTURACIÓN::PRINCIPAL::EMPRESA...4 1.1.1.1. ÁREA DE FACTURACIÓN::PRINCIPAL::EMPRESA::General...4
Ejercicios - Persistencia en Android: proveedores de contenidos y SharedPreferences
Ejercicios - Persistencia en Android: proveedores de contenidos y SharedPreferences Índice 1 Compartir datos entre actividades con Shared Preferences (0.75 puntos)... 2 2 Actividad de preferencias (0.75
Trabajo final de Ingeniería
UNIVERSIDAD ABIERTA INTERAMERICANA Trabajo final de Ingeniería Weka Data Mining Jofré Nicolás 12/10/2011 WEKA (Data Mining) Concepto de Data Mining La minería de datos (Data Mining) consiste en la extracción
Ampliación de Estructuras de Datos
Ampliación de Estructuras de Datos Amalia Duch Barcelona, marzo de 2007 Índice 1. Diccionarios implementados con árboles binarios de búsqueda 1 2. TAD Cola de Prioridad 4 3. Heapsort 8 1. Diccionarios
Tecnología de la Información y la Comunicación. Base de datos. Consultas - 2007 -
Tecnología de la Información y la Comunicación Base de datos Consultas - 2007 - Profesores del área Informática: Guillermo Storti Gladys Ríos Gabriel Campodónico Consultas Se utilizan consultas para ver,
CONSULTAS DE RESUMEN SQL SERVER 2005. Manual de Referencia para usuarios. Salomón Ccance CCANCE WEBSITE
CONSULTAS DE RESUMEN SQL SERVER 2005 Manual de Referencia para usuarios Salomón Ccance CCANCE WEBSITE CONSULTAS DE RESUMEN Una de las funcionalidades de la sentencia SELECT es el permitir obtener resúmenes
Reseñas. Ángeles Maldonado y Elena Fernández, Cindoc. El profesional de la información, vol. 9, nº 3, marzo de 2000
Reseñas Análisis comparativo de buscadores en internet Por Ángeles Maldonado Martínez y Elena Fernández Sánchez Resumen de la comunicación presentada por las autoras a la conferencia Online Information
INVESTIGACIÓN CON CAZA DE TESOROS EN EL ESTUDIO DE LOS MITOS CLÁSICOS EN LA LITERATURA EUROPEA
INVESTIGACIÓN CON CAZA DE TESOROS EN EL ESTUDIO DE LOS MITOS CLÁSICOS EN LA LITERATURA EUROPEA Programación Investigación con Caza de Tesoros en el estudio de los mitos clásicos en la literatura europea
Los servicios más comunes son como por ejemplo; el correo electrónico, la conexión remota, la transferencia de ficheros, noticias, etc.
Página 1 BUSCADORES EN INTERNET Internet es una red de redes informáticas distribuidas por todo el mundo que intercambian información entre sí mediante protocolos 1 TCP/IP. Puede imaginarse Internet como
Estructuras de Datos y Algoritmos Tecnólogo en Informática
Estructuras de Datos y Algoritmos Tecnólogo en Informática INSTRUCTIVO DEL COMANDO MAKE ESTRUCTURAS DE DATOS Y ALGORITMOS - TECNÓLOGO EN INFORMÁTICA 1 Contenido Introducción... 3 El archivo makefile...
CRECE EN INTERNET. Llegar a buen puerto: buscando información
CRECE EN INTERNET Llegar a buen puerto: buscando información Llegar a buen puerto: buscando información Internet es una red mundial que vincula miles de ordenadores que almacenan gran cantidad de documentos
Análisis de los datos
Universidad Complutense de Madrid CURSOS DE FORMACIÓN EN INFORMÁTICA Análisis de los datos Hojas de cálculo Tema 6 Análisis de los datos Una de las capacidades más interesantes de Excel es la actualización
Resumen de la Tesina. Autor: Adrià Batet López. Tutor: Víctor Pascual Ayats
Inventario y geolocalización de las actividades comerciales en las plantas bajas de los edificios de L Hospitalet de Llobregat. Aplicación web de recursos para el ciudadano. Resumen de la Tesina. Autor:
port@firmas V.2.3.1 Manual de Portafirmas V.2.3.1
Manual de Portafirmas V.2.3.1 1 1.- Introducción 2.- Acceso 3.- Interfaz 4.- Bandejas de peticiones 5.- Etiquetas 6.- Búsquedas 7.- Petición de firma 8.- Redactar petición 9.- Firma 10.- Devolución de
7zip es un programa de carácter libre y gratuito, que permite tanto comprimir como descomprimir archivos, con una alta capacidad de comprensión.
1 QUÉ ES 7-ZIP? 7zip es un programa de carácter libre y gratuito, que permite tanto comprimir como descomprimir archivos, con una alta capacidad de comprensión. Para comenzar a utilizar 7-ZIP debemos descargar
GUÍA Nro. 1 TECNOLOGÍA DE INTERNET. TIII PIII
GUÍA Nro. 1 TECNOLOGÍA DE INTERNET. TIII PIII GUIA DISPONIBLE EN: http://preparadorivan.blogspot.com/ - http://preparadormssi.50webs.com/inicio.html La World Wide Web o la Web, es una de las múltiples
4.Diseño de Bases de Datos (I)
4.Diseño de Bases de Datos (I) 4.1 Anomalías. Se denominan así en teoría de Bases de Datos a ciertos problemas que aparecen con frecuencia en el manejo de las mismas cuando el diseño no ha sido realizado
INTRODUCCIÓN: Una Visión Global del Proceso de Creación de Empresas
INTRODUCCIÓN: Una Visión Global del Proceso de Creación de Empresas 1 INTRODUCCIÓN. Una visión global del proceso de creación de empresas Cuando se analiza desde una perspectiva integral el proceso de
Recuperación de información Bases de Datos Documentales Licenciatura en Documentación Curso 2011/2012
Bases de Datos Documentales Curso 2011/2012 Miguel Ángel Rodríguez Luaces Laboratorio de Bases de Datos Universidade da Coruña Introducción Hemos dedicado la primera mitad del curso a diseñar e implementar
Ejercicios - Persistencia en Android: ficheros y SQLite
Ejercicios - Persistencia en Android: ficheros y SQLite Índice 1 Uso de ficheros (0.5 puntos)...2 2 Persistencia con ficheros (0.5 puntos)...3 3 Base de datos: SQLiteOpenHelper (0.5 puntos)... 3 4 Base
FAQ Parking PPC de SEDO. NicLine
FAQ Parking PPC de SEDO NicLine Se prohíbe la reproducción, transmisión, transformación, distribución o el ejercicio de cualquier derecho de autor de este documento, total o parcial, sin la autorización
Capítulo VI. Diagramas de Entidad Relación
Diagramas de Entidad Relación Diagramas de entidad relación Tabla de contenido 1.- Concepto de entidad... 91 1.1.- Entidad del negocio... 91 1.2.- Atributos y datos... 91 2.- Asociación de entidades...
4. Base de datos XML nativa: Marklogic
4. Base de datos XML nativa: Marklogic XML ha ganado con el paso de los años protagonismo a la hora de trabajar con la información. Su lenguaje fuertemente tipado permite la comunicación entre distintas
by Tim Tran: https://picasaweb.google.com/lh/photo/sdo00o8wa-czfov3nd0eoa?full-exif=true
by Tim Tran: https://picasaweb.google.com/lh/photo/sdo00o8wa-czfov3nd0eoa?full-exif=true I. FUNDAMENTOS 3. Representación de la información Introducción a la Informática Curso de Acceso a la Universidad
8. Sentencia return y métodos
92 A. García-Beltrán y J.M. Arranz 8. Sentencia return y métodos Objetivos: a) Describir el funcionamiento de la sentencia return b) Interpretar el resultado de una sentencia return en el código fuente
Microsoft Access proporciona dos métodos para crear una Base de datos.
Operaciones básicas con Base de datos Crear una Base de datos Microsoft Access proporciona dos métodos para crear una Base de datos. Se puede crear una base de datos en blanco y agregarle más tarde las
1.- INTRODUCCIÓN 2.- PARÁMETROS
1.- INTRODUCCIÓN Hemos diseñado una aplicación que facilite el envío a las entidades bancarias de las de cobro por domiciliación. La entrada de esta aplicación pueden ser, tanto ficheros cuyos formatos
El Outsourcing como Opción Estratégica
El Outsourcing como Opción Estratégica Improven Consultores Colón 18, 2ºF 46004 Valencia Tel: 96 352 18 22 Fax: 96 352 20 79 www.improven-consultores.com info@improven-consultores.com El outsourcing como
Descubra las novedades de EasyProf 3.0! Cambios en la filosofía de trabajo
Descubra las novedades de EasyProf 3.0! EasyProf 3.0 incorpora potentes mejoras y funcionalidades que le permitirá crear sus propios contenidos con mayor facilidad y rapidez. Con EasyProf 3.0 podrá crear
MANUAL DE CS-ALMACENES (MAYO 2012)
MANUAL DE CS-ALMACENES (MAYO 2012) FILOSOFÍA DE LA APLICACIÓN CS-ALMACENES Esta aplicación informática busca gestionar de una manera muy sencilla las existencias de uno o varios almacenes. Se basa en la
CASO PRÁCTICO DISTRIBUCIÓN DE COSTES
CASO PRÁCTICO DISTRIBUCIÓN DE COSTES Nuestra empresa tiene centros de distribución en tres ciudades europeas: Zaragoza, Milán y Burdeos. Hemos solicitado a los responsables de cada uno de los centros que
El control de la tesorería consiste en gestionar desde la aplicación los cobros y pagos generados a partir de las facturas de venta y de compra.
Gestión de la tesorería y del riesgo El control de la tesorería consiste en gestionar desde la aplicación los cobros y pagos generados a partir de las facturas de venta y de compra. En este manual nos
MANUAL DE AYUDA MODULO TALLAS Y COLORES
MANUAL DE AYUDA MODULO TALLAS Y COLORES Fecha última revisión: Enero 2010 Índice TALLAS Y COLORES... 3 1. Introducción... 3 CONFIGURACIÓN PARÁMETROS TC (Tallas y Colores)... 3 2. Módulos Visibles... 3
Apunte. Estrategias de Búsqueda de Recursos en Internet 3
Apunte Estrategias de Búsqueda de Recursos en Internet 3 Dada la enorme cantidad de sitios existentes en la Red (cerca de mil millones y creciendo en forma constante) y la dudosa calidad o valor educativo
MANUAL DE USUARIO PLAN GENÉRICO DE AUTOCONTROL EN HOSTELERÍA ASOCIACIÓN DE EMPRESARIOS DE HOSTELERÍA DE GIPUZKOA 1
MANUAL DE USUARIO PLAN GENÉRICO DE AUTOCONTROL EN HOSTELERÍA ASOCIACIÓN DE EMPRESARIOS DE HOSTELERÍA DE GIPUZKOA 1 1. Introducción Esta aplicación tiene como objeto cubrir la informatización de los documentos
1. Creación del repositorio
FACULTADE DE INFORMÁTICA Departamento de Computación Tecnología de la Programación 2008-2009 Ingeniería Informática Práctica 1: Subversion Introducción El objetivo de esta práctica es aprender a manejar
Seminario de Informática
Unidad II: Operaciones Básicas de Sistemas Operativos sobre base Windows 11. Herramientas del Sistema INTRODUCCION Este apunte está basado en Windows XP por ser el que estamos utilizando en el gabinete
Operaciones Morfológicas en Imágenes Binarias
Operaciones Morfológicas en Imágenes Binarias Introducción La morfología matemática es una herramienta muy utilizada en el procesamiento de i- mágenes. Las operaciones morfológicas pueden simplificar los
TEMA 39: OPERACIONES LOCALES EN EL MODELO RASTER
TEMA 39: OPERACIONES LOCALES EN EL MODELO RASTER OBJETO DEL TEMA: Conocer las herramientas de análisis de los Sistemas de Información Geográfica raster para realizar operaciones locales. Comprender la
Base de datos en Excel
Base de datos en Excel Una base datos es un conjunto de información que ha sido organizado bajo un mismo contexto y se encuentra almacenada y lista para ser utilizada en cualquier momento. Las bases de
BASES DE DATOS OFIMÁTICAS
BASES DE DATOS OFIMÁTICAS Qué es una Bases de Datos Ofimática?. En el entorno de trabajo de cualquier tipo de oficina ha sido habitual tener un archivo con gran parte de la información necesaria para el
Introducción a Protégé
FACULTAD DE INFORMÁTICA LICENCIATURA EN DOCUMENTACIÓN SISTEMAS DE REPRESENTACIÓN Y PROCESAMIENTO AUTOMÁTICO DEL CONOCIMIENTO Práctica 1 1ª Parte Introducción a Protégé Febrero 2003 1. Objetivo La presente
BANCO CENTRAL DE RESERVA DEL PERÚ
CONSULTA DE DATOS ESTADÍSTICOS DEL BCRP GUÍA DE USO ÍNDICE 1. Organización de las series y zonas de la pantalla 2. Acceso a las series y consultas 3. Suscripción de usuarios 4. Manejo de listas personalizadas
MF0952_2: Publicación de páginas web
MF0952_2: Publicación de páginas web TEMA 1. Características de seguridad en la publicación de páginas web TEMA 2. Herramientas de transferencia de archivos TEMA 3. Publicación de páginas web TEMA 4. Pruebas
"Diseño, construcción e implementación de modelos matemáticos para el control automatizado de inventarios
"Diseño, construcción e implementación de modelos matemáticos para el control automatizado de inventarios Miguel Alfonso Flores Sánchez 1, Fernando Sandoya Sanchez 2 Resumen En el presente artículo se
GMF Gestor de incidencias
GMF Gestor de incidencias Contenidos Contenidos... 1 Introducción... 2 El módulo de Gestión de Incidencias... 2 Vista del técnico... 2 Vista de usuario... 4 Workflow o flujo de trabajo... 5 Personalización
Generación de ficheros PC-Axis desde Oracle mediante SAS
csiefum@gobiernodecanariasorg fojechi@gobiernodecanariasorg mespbae@gobiernodecanariasorg Instituto Canario de Estadística Resumen: El Instituto Canario de Estadística hace uso de la herramienta SAS en
EL MODELO DE DATOS RASTER
EL MODELO DE DATOS RASTER El modelo de datos raster, como señala Bosque (1992), es el modelo de datos complementario al modelo vectorial presentado anteriormente. Tiene como principal característica el
Manual del Alumno de la plataforma de e-learning.
2 Manual del Alumno de la Plataforma de E-learning 3 4 ÍNDICE 1. Página de Inicio...7 2. Opciones generales...8 2.1. Qué es el Campus...8 2.2. Nuestros Cursos...9 2.3. Cómo matricularme...9 2.4. Contactar...9
Laboratorio 7 Motor de búsqueda web basado en el TAD Árbol Binario de Búsqueda GUIÓN DEL LABORATORIO
Laboratorio 7 Motor de búsqueda web basado en el TAD Árbol Binario de Búsqueda GUIÓN DEL LABORATORIO 1.- Objetivos del laboratorio Diseño de clases en C++ Comprensión y uso del TAD Árbol Binario de Búsqueda