Nuevo paradigma del análisis documental de programas y materiales de televisión



Documentos relacionados
La versión 1.1 contiene 15 elementos que se agrupan por: contenido, propiedad intelectual y característica de instancia:

METADATOS Y SITIOS WEB

MANUAL EASYCHAIR. A) Ingresar su nombre de usuario y password, si ya tiene una cuenta registrada Ó

Este proyecto tiene como finalidad la creación de una aplicación para la gestión y explotación de los teléfonos de los empleados de una gran compañía.

Uso de Dublin Core para mejorar la visibilidad de la producción científica española.

Directrices DRIVER para proveedores de contenidos

LUIS GERARDO RUIZ AGUDELO

Guía del usuario de KIP sobre el estado de la impresora Instalación y guía del usuario de KIP sobre el estado de la impresora

Facturación Informatizada Tema 13 Gestión de Cobro

INTRODUCCIÓN A OAI-PHM Y SU IMPLANTACIÓN EN EL PORTAL E-REVISTAS

Orden de domiciliación o mandato para adeudos directos SEPA. Esquemas Básico y B2B

Análisis y síntesis El proceso documental Lenguajes documentales El proceso de indización El resumen documental

Tipos de publicaciones científicas. Sergio Luján

MANUAL EASYCHAIR.

Creating your Single Sign-On Account for the PowerSchool Parent Portal

DISEÑO DE UN PLC DOMÉSTICO UTILIZANDO UN MICROCONTROLADOR PIC-18F4550

PROYECTOS DI V NORMALlZAClON DOCUMENTAL

HTML 5. Que es HTML5 07/04/2011

Repaso de Conceptos Básicos de Bases de Datos

Tabla de contenidos

COMO FUNCIONA EL PROTOCOLO OAI PMH EN LA RECUPERACION DE INFORMACION

Diseño de un directorio Web de diseñadores gráficos, ilustradores y fotógrafos.

Guía de referencia rápida / Quick reference guide Visor de Noticias Slider / NCS News Slider for SharePoint

Pistas Separadas TÉRMINOS Y CONDICIONES

GENERALIDADES DE BASES DE DATOS

activuspaper Text Mining and BI Abstract

JESÚS EDUARDO CORTÉS SÁNCHEZ

ACCESS for ELLs, a Test of English Proficiency. El ACCESS de los estudiantes ELL, una prueba de conocimientos de inglés

BASE DE DATOS DEL FONDO DOCUMENTAL GEOLOGICO

Estrategias para la mejora de la visibilidad internacional de la producción científica en las Instituciones de Educación Superior 23 de Marzo 2010

La Representación de Recursos en los Repositorios Institucionales

Beneficios de Fundar una Corporación Sin Fines de Lucro Benefits of Establishing a Non-Profit Corporation

Servicio de Reclamos Amadeus Guía Rápida

MOTORES VERSUS DIRECTORIOS: EL DILEMA DE LA BÚSQUEDA

MANUAL. Gestor de referencias bibliográficas. José Alfonso Gálvez Salinas

Búsqueda Sistemática de Información

Colegio Agustiniano Ciudad Salitre Área de Tecnología e Informática - Guía de Apoyo Docente: José Luis Solano Ospino

Análisis de información

UNA SOLUCIÓN POSIBLE:

I understand that I must request that this waiver be reconsidered annually, each school year. Parent/Guardian Signature: Date:

PRINTING INSTRUCTIONS

Normalización de la sonoridad y nivel máximo permitido de las señales de audio

Sistema de gestión de datos GESTSOFT

Roadshow ECM Proyecto Imaging & Workflow Barclays. Miguel Ángel García de la Cruz

Guía del usuario Scopus. Tutorial

Volatilidad: Noviembre 2010 Futuros Frijol de Soya

FOR INFORMATION PURPOSES ONLY Terms of this presentation

IRS DATA RETRIEVAL NOTIFICATION DEPENDENT STUDENT ESTIMATOR

CRITERIOS OBLIGATORIOS PARA POSTULAR UNA REVISTA A SCIELO CHILE

La curación de contenidos en la era de la infoxicación. Propuestas para bibliotecas

En la nueva versión encontrarás

Servidores Donantonio

EMC SourceOne TM para Microsoft SharePoint 7.0 Búsqueda de archivo Tarjeta de referencia rápida

DESARROLLO DE SOFTWARE ORIENTADO. A OBJETOS: Modelo de requerimientos del RUP

CATALOGACIÓN BÁSICA. Introducción: Catalogación. Las Reglas de Catalogación. El Formato IBERMARC. Catalogación en CIRBIC

Bienvenidos a la presentación, producción de informes y depuración (debugging). En esta unidad discutiremos la producción de informes utilizando la

CERTIFICACIÓN PROFESIONAL EN ESTÁNDARES TIC DE SALUD

Sistema basado en firma digital para enviar datos por Internet de forma segura mediante un navegador.

El estándar MPEG-7. MPEG-7: interfaz para la descripción de contenido multimedia.

INSTITUTO POLITECNICO NACIONAL UNIDAD PROFESIONAL INTERDISCIPLINARIA DE INGENIERIA Y CIENCIAS SOCIALES Y ADMINISTRATIVAS

Construcción de un componente que permita manipular un gráfico para su almacenamiento como texto en una base de datos

Sistemas de Gestión de Calidad. Control documental

Diseño e Implementación de un Sistema de Mercadeo por Correo Electrónico ( marketing)

Elementos requeridos para crearlos (ejemplo: el compilador)

POSICIONAMIENTO EN LA WEB (SEM Y SEO)

Servicios pensados para optimizar los procesos de comunicación de voz y SMS.

POLITICA DE SERVICIOS PARA ESTUDIANTES EN PROGRAMAS EN LÍNEA

Gestión de la Configuración

PRIMER INFORME DE AVANCE DEL PROYECTO MEDIATECA VIRTUAL DE RECURSOS ACADEMICOS

Sistema de Información Integrada del Área Social

Qué es SPIRO? Características

DICOM (Digital. Imaging and Communications in Medicine)

Ponencia Redes y Sistemas de Información Especializadas LA VIRTUALIZACION DE LA INFORMACION EN LA RED DE BIBLIOTECAS UNIVERSITARIAS DE SAN ANDRES

Componentes de Integración entre Plataformas Información Detallada

Unidad 1. Fundamentos en Gestión de Riesgos

Grupo de Difusión del CTN50/SC1 Gestión de documentos y aplicaciones de AENOR Universitat Oberta de Catalunya

DESARROLLO TECNOLÓGICO E INNOVACIÓN: EL ROL DE LA I+D PRIVADA La vinculación academia-empresa

Estrategias para la mejora de la visibilidad internacional de la producción científica en las Instituciones de Educación Superior

Phone Manager Compatibilidad con aplicaciones OCTOBER 2014 DOCUMENT RELEASE 4.1 COMPATIBILIDAD CON APLICACIONES

Sistemas de Gestión de Documentos Electrónicos de Archivo (SGDEA)

Orientación acerca de los requisitos de documentación de la Norma ISO 9001:2000

Voyager Serie 1400g. Guía de inicio rápido. Escáner alámbrico de Captura de Imágenes (Area-Imaging) VG1400-LS-QS Rev A 10/12

MANUAL DEL SISTEMA DE GESTION AMBIENTAL ISO 14001:2004. Control de versiones

Área Académica: Ingeniería en Computación. Profesor: M. en C. Evangelina Lezama León

Ecuador - Encuesta Condiciones de Vida 1995

Software TRENDnetVIEW Pro. Guía de instalación rápida de TRENDnetVIEW Pro (1)

LOS METADATOS Y SU LUGAR EN LA ARENA INTERNACIONAL METADATA AND ITS PLACE IN INTERNATIONAL ARENA

Buscamos perfiles para proyecto en el Parlamento Europeo

OSCILLATION 512 (LM 3R)

Clientes Donantonio. Especificación de requisitos software. Juan José Amor David Escorial Ismael Olea

Cacheado de datos procedentes de servicios WFS en la aplicación web del proyecto EuroGeoSource

INSTRODUCCION. Toda organización puede mejorar su manera de trabajar, lo cual significa un

Universidad de Guadalajara

Trademarks Third-Party Information

Programación en Capas.

Depósito legal electrónico

Comunicación de proximidad. Servicios y Aplicaciones Bluetooth

UNIVERSIDAD DE LAS AMERICAS Facultad de ingeniería

NOTAS DE LANZAMIENTO SOFTWARE TRIMBLE ACCESS

Transcripción:

Nuevo paradigma del análisis documental de programas y materiales de televisión Félix del Valle Gastaminza Profesor Titular de Documentación. Universidad Complutense de Madrid PARADIGMA CLÁSICO DEL ANÁLISIS DOCUMENTAL En la cadena documental el análisis documental consiste en el resumen, en texto libre, y la indización, en lenguaje controlado, de los documentos. Esto permite el acceso al contenido del documento con el objeto de recuperarlo, explotarlo y difundirlo. Una vez identificada la unidad documental que debe ser catalogada se trata de obtener una representación de la misma que sea manejable por el ordenador. En televisión se trabaja con una cierta diversidad de unidades documentales que además, en ocasiones, son interdependientes. Es el caso de los programas informativos, considerados como unidad, y las noticias que los integran. O estas mismas noticias, sus premontajes y los materiales brutos utilizados para realizarlas. Información bibliográfica : Datos de creación y de emisión Afecta al documento completo La operación de indización y representación de material de informativos de TV sigue los pasos siguientes: 1. Segmentar el vídeo jerárquicamente en segmentos, secuencias y planos. ( Un plano es una toma continua de cámara. Una secuencia está compuesta por uno o más planos que presentan diferentes tomas del mismo acontecimiento con una relación espacial y temporal. Un segmento está compuesto por una o más secuencias relacionadas.) 2. Describir la información videobibliográfica completa: Título/s, autor/es, fechas, datos de publicación/edición, formato, duración, etc 3. Describir cada segmento - TCR (Time Code Recording) del frame de comienzo, duración, descripción textual. Información técnica Información del contenido: Resumen, Minutado, Indización Afecta al documento completo pero también al documento segmentado Segmenta el documento, que suele representarse globalmente (descriptores y resumen) y jerárquicamente (minutado) 4. Describir cada secuencia - TCR (Time Code Recording) del frame de comienzo, duración, descripción textual. 5. Describir cada plano - TCR (Time Code Recording) del frame de comienzo, duración, descripción textual.

Nuevo paradiigma del análisis documental de programas y materiales de televisión Para realizar todas estas operaciones el documentalista tiene que ver el documento completo a veces más de una vez, tomando notas y sintetizando el contenido sonoro y visual para transformarlo en texto. Tiene que atender a la esencia del contenido y detectar cómo se ha expuesto en el documento; localizar los temas, personas y lugares relevantes; observar los aspectos formales y compositivos reseñables. El resultado final se expone en un registro catalográfico de una base de datos integrado por campos especialmente diseñados para los documentos en cuestión. Un ejemplo muy sencillo incompleto en su desarrollo sería el que se puede ver en el gráfico de la derecha. UN NUEVO PARADIGMA En los centros de documentación de televisión se está comenzando a utilizar nuevos programas y tecnologías que permiten automatizar algunas de las operaciones descritas hasta aquí y plantear nuevas formas de representación. Estas tecnologías utilizan técnicas avanzadas de análisis de imagen y sonido que son capaces de comprender automáticamente la señal de vídeo. Detectan cambios de plano y movimientos de cámara, y generan un storyboard de fotogramas (keyframe images). Si-

Nuevo paradigma del análisis documental de programas y materiales de televisión multáneamente, extrae cualquier texto presente en la señal de vídeo. Transforma la señal de audio en texto e identifica así palabras, hablantes, etc. Toda la información que genera es susceptible de contrastarse con un lenguaje documental incluído en el sistema y, por supuesto, es susceptible de revisión y ampliación por un documentalista. Estos programas no generan ya un solo registro por documento, sino que aprovechan la segmentación y jerarquización propia del documento para obtener un registro matriz del que dependen otros miniregistros con sus correspondientes metadatos. Debe tenerse en cuenta que el TCR actúa como señal física que permite ir automáticamente al punto del documento que nos interesa. El resultado es que los niveles de descripción vienen determinados por el contenido; la unidad documental clásica se disgrega y sólo es perceptible si es necesaria. La recuperación es mucho más precisa, el índice de relevancia aumenta y el acceso físico a la documentación solicitada es mucho más rápido. Normalización de la representación en Internet. El enorme crecimiento de la información audiovisual en Internet exige el diseño de herramientas capaces de facilitar la indización, recuperación, obtención y revisión de datos audiovisuales. El desarrollo de normas de metadatos orientadas al contenido aplicables a documentos multimedia puede facilitar la tarea de diseño de los ingenios de búsqueda de información multimedia en la WWW. Revisaremos dos propuestas de normalización, integrables entre sí. Los Metadatos del Dublin Core y la norma MPEG-7.

Nuevo paradiigma del análisis documental de programas y materiales de televisión Dublin Core. Los elementos del DC son los siguientes: Element Descriptions 1. Title Label: TITLE The name given to the resource by the CREATOR or PUBLISHER. 2. Author or Creator Label: CREATOR The person or organization primarily responsible for creating the intellectual content of the resource. For example, authors in the case of written documents, artists, photographers, or illustrators in the case of visual resources. 3. Subject and Keywords Label: SUBJECT The topic of the resource. Typically, subject will be expressed as keywords or phrases that describe the subject or content of the resource. The use of controlled vocabularies and formal classification schemas is encouraged. 4. Description Label: DESCRIPTION A textual description of the content of the resource, including abstracts in the case of document-like objects or content descriptions in the case of visual resources. 5. Publisher Label: PUBLISHER The entity responsable for making the resource available in its present form, such as a publishing house, a university department, or a corporate entity. 6. Other Contributor Label: CONTRIBUTOR A person or organization not specified in a CREATOR element who has made significant intellectual contributions to the resource but whose contribution is secondary to any person or organization specified in a CREATOR element (for example, editor, transcriber, and illustrator). 7. Date Label: DATE The date the resource was made available in its present form. Recommended best practice is an 8 digit number in the form YYYY-MM-DD as defined in http://www.w3.org/tr/notedatetime, a profile of ISO 8601. In this scheme, the date element 1994-11-05 corresponds to November 5, 1994. Many other schema are possible, but if used, they should be identified in an unambiguous manner. 8. Resource Type Label: TYPE The category of the resource, such as home page, novel, poem, working paper, technical report, essay, dictionary. For the sake of interoperability, TYPE should be selected from an enumerated list that is under development in the workshop series at the time of publication of this document. See http://sunsite.berkeley.edu/metadata/types.html

Nuevo paradigma del análisis documental de programas y materiales de televisión for current thinking on the application of this element Image Moving Animation Film Feature Musical Animation Documentary Silent Short Staged Performance etc. TV Drama Serial Documentary News Current Affairs Performance Comedy Children s Review Interview etc. Photograph Sequence Scene Shot Frame Object/Actor/Person 9. Format Label: FORMAT The data format of the resource, used to identify the software and possibly hardware that might be needed to display or operate the resource. For the sake of interoperability, FORMAT should be selected from an enumerated list that is under development in the workshop series at the time of publication of this document. Format.type = 35mm film, VHS etc. Format.colour.depth = 256 Format.length = 31 mins. Format.videocodec = MJPEG, MPEG1, MPEG2, AVI, QT, etc. Format.framerate = 25 Format.videocolourdepth Format.videores Format.videowidth Format.videoheight Format.sound = Yes/No Format.sound.channels Format.sound.samplerate etc. 10. Resource Identifier Label: IDENTIFIER String or number used to uniquely identify the resource. Examples for networked resources include URLs and URNs (when implemented). Other globally-unique identifiers,such as International Standard Book Numbers (ISBN) or other formal names would also be candidates for this element in the case of off-line resources. 11. Source Label: SOURCE A string or number used to uniquely identify the work from which this resource was derived, if applicable. For example,

Nuevo paradiigma del análisis documental de programas y materiales de televisión a PDF version of a novel might have a SOURCE element containing an ISBN number for the physical book from which the PDF version was derived. 12. Language Label: LANGUAGE Language(s) of the intellectual content of the resource. Where practical, the content of this field should coincide with RFC 1766. See: http://ds.internic.net/rfc/rfc1766.txt 13. Relation Label: RELATION The relationship of this resource to other resources. The intent of this element is to provide a means to express relationships among resources that have formal relationships to others, but exist as discrete resources themselves. For example, images in a document, chapters in a book, or items in a collection. Formal specification of RELATION is currently under development. Users and developers should understand that use of this element is currently considered to be experimental. 15. Rights Management Label: RIGHTS A link to a copyright notice, to a rights-management statement, or to a service that would provide information about terms of access to the resource. Formal specification of RIG- HTS is currently under development. Users and developers should understand that use of this element is currently considered to be experimental. MPEG-7. Aunque todavía está en una fase inicial es muy interesante referirse también al MPEG-7, Interfaz de Descripción de contenido multimedia, norma ISO creada por el Moving Pictures Expert Group para tratar el contenido de todo tipo de objeto multimedia. La descripción obtenida estará unida al contenido mismo, para facilitar el acceso al material que sea de interés del usuario. 14.Coverage Label: COVERAGE The spatial and/or temporal characteristics of the resource. Formal specification of COVERAGE is currently under development. Users and developers should understand that use of this element is currently considered to be experimental.

Nuevo paradigma del análisis documental de programas y materiales de televisión Figure 1.1: An abstract representation of possible applications using MPEG-7.