El ciclo de vida de los datos de la biodiversidad

Documentos relacionados
Cómo crear su propio Archivo Darwin Core

Guía para Principiantes sobre Identificadores Persistentes Resumen Ejecutivo Versión 1.0

Gestión de datos primarios de biodiversidad: Algunas herramientas de entrada de datos

José Sarukhán Comisión Nacional para el Conocimiento y Uso de la Biodiversidad. México, D.F. Enero 2012

SISTEMA DE INFORMACIÓN DE LA BIODIVERSIDAD DE EUSKADI

Biomas en el mundo. Recursos naturales y catástrofes climáticas. Exploración en lo profundo del océano

Primeros pasos: Perspectiva general del proceso de publicación de datos en la red GBIF Versión 1.0

Guía de buenas prácticas para la elaboración y evaluación de proyectos digitales en las Humanidades

Base de datos con acceso enlínea para colección de la flora vascular de Jalisco (ReBiOMex, versión 1.3 ALPHA)

SECRETARÍA EJECUTIVA Alba Margarita Salazar Viscarra

Los requisitos de accesibilidad en un proyecto software. Implicaciones de usuarios discapacitados en el proceso software

1.2 Qué es un Sistemas de Información Geográfica?

*HQHUDOLGDGHVGHORV6,*

Transferencia de capacidades técnicas asociadas a la publicación de datos de biodiversidad a través de GBIF

Versión 1.0 MANUAL DEL USUARIO

:: Definiendo los SIG :: :: IMPLAN :: Coordinación de Geoestadística e Informática ISC Carlos A. Martínez Mar

Unidad de aprendizaje Interpretando significados de diversos textos. Materia Lenguaje. Grado 4. Título del objeto de aprendizaje

Sistemas para integrar bases de datos distribuidas, heterogéneas y autónomas. María Mora, INBio. Costa Rica mmora@inbio.ac.cr

Introducción. Ciclo de vida de los Sistemas de Información. Diseño Conceptual

PERCEPCIÓN N REMOTA APLICADA A ESTUDIOS HIDROGEOLÓGICOS

Construyendo gráficos estadísticos con ayuda de Microsoft Excel

DIAGRAMA DE CLASES EN UML

Guía para el Paso 2: Desarrollo de la Fase A Explorar y Reflexionar

MANUAL DE AYUDA HERRAMIENTA DE APROVISIONAMIENTO

DIGITALIZACION DE DATOS DE ESPECIMENES DE LEPIDOPTERA Y COLEOPTERA (INSECTA) DEL MUSEO ENTOMOLOGICO DE LEON NICARAGUA

LA METODOLOGÍA DEL BANCO PROVINCIA

MANUAL DE USO E-FACTURA FullPyme

S I S T E M A E N L Í N E A

Más allá del acceso abierto: nuevos servicios en repositorios de Biomedicina. Isabel Bernal DIGITAL.CSIC, URICI, CSIC 22 de mayo 2015 BiblioSalud2015

MODULO ADMINISTRATIVO

Evaluación de la Continuidad de Negocio en los Sistemas de Pagos de Latinoamérica y el Caribe. Octubre, 2010

CIMA. MANUAL DE USUARIO

Manual de usuario Sitio

Correspondencias entre taxonomías XBRL y ontologías en OWL Unai Aguilera, Joseba Abaitua Universidad de Deusto, EmergiaTech

Informe final de evaluación del seguimiento de la implantación de títulos oficiales

Colección de Tesis Digitales Universidad de las Américas Puebla. Morales Salcedo, Raúl

La filosofía open source en la bioinformática

Gestión de Permisos. Documento de Construcción. Copyright 2014 Bizagi

El presente documento describe la importancia que está tomando el cómputo distribuido en

INFORME FINAL DE TERMINACIÓN DEL PROYECTO PEQUEÑA DONACIÓN

La ventana de Microsoft Excel

Expediente nº: Informe de Seguimiento nº. 01/2011

Reporte de Actividades, Periodo Noviembre de 2010 Septiembre de 2011, D. Bannasch

DIAGNÓSTICO INTEGRAL DE ARCHIVO DE LA COMISIÓN DE REGULACIÓN DE COMUNICACIONES

Portal INAPI INAPI Conecta Instructivo de Gestión en Sitio Web. Perfil: Comprador Versión: 1.0

INFORMACIÓN PARA LA INSTALACIÓN DE CERTIFICADOS

Guía para el Portal de Profesores del Sistema de Información CLASS Académico

Análisis de RF de Alta Resolución: Los Beneficios de Conjuntos de Datos de Lidar de Terreno e Clutter

En muchas ocasiones resulta muy útil que la información contenida en un libro de Excel se visualice gráficamente.

Notas de actualización Versión de Aconex Publicadas el 6 de febrero de 2015 para cubrir el periodo de actualización de febrero 15 a marzo 15,

Curso: Arquitectura Empresarial basado en TOGAF

1. Formulario de ingreso de información

Enfoque sistémico Ecosistemas Ecología

Proyecto. Bioalfabetización: Popularizando el Conocimiento Sobre la Biodiversidad. Fondo de Canje de Deuda España Costa Rica

MADRID EN LOS ARCHIVOS EUROPEOS EL PROYECTO APEx

Belo Horizonte, Brasil, Abril de Katia Cezón GBIF España

PRIMER INFORME DE AVANCE DEL PROYECTO MEDIATECA VIRTUAL DE RECURSOS ACADEMICOS

INTEGRACIÓN HERMES POSITRÓN

Publicar y Registrar Datos en GBIF Versión 1.0

GE Power Management. 6S``O[WS\bORS1]\TWUc`OQWÕ\g. GE-FILES 7\ab`cQQW]\Sa 539$ &

DOCMA IBISCOM.

MATERIAL 2 EXCEL 2007

ANEXO (NÓMINA DE CANDIDATOS EN SOPORTE INFORMÁTICO

TEMA 14. Modelos de representación de diagramas

SIIT SISTEMA INFORMÁTICO DE INSPECCIONES DE TRABAJO. Modulo de Planificación Manual de Usuario

INFORME SEMANAL EXTRAORDINARIO DE MONITOREO DE INCENDIOS

PRC-DTI-006 Administración de Roles de los Sistemas de Información de la DTI Procedimiento Dirección de TI - COSEVI

Redacción de textos: Roberto Matellanes, Luís Quesada y Devora Muñoz Elaborado por: Proyecto Pandora y Asociación Geoinnova

MANUAL DE USO PORTAL B2B PROCESO OPERATIVO- DESPACHOS

Resumen. Tesis Doctoral Evaluación por competencias del profesional de enfermería y su marco

CARTA DE PRESENTACIÓN Raul Farias S. Victor Gomez V.

O N A B I O COMISIÓN NACIONAL PARA EL CONOCIMIENTO Y USO DE LA BIODIVERSIDAD

GERENCIA DE INTEGRACIÓN

Capacitación Regístrelo Cosméticos

Descripción y tablas de especificaciones de las pruebas formativas

PLICATIVO WEB PARA LA AUTOMATIZACIÓN DEL PROCESO DE ACTUALIZACIÓN Y DEL PROCESO DE SINCRONIZACIÓN DE LOS

MANUAL DE USUARIO SICVECA DESKTOP. Código: R-02-I-IF-312 Versión: de 19 SICVECA DESKTOP. Manual de Usuario Versión 1.0.

MANUAL DE USUARIO MÓDULO Web

Todos los ecosistemas existen pues tienen un equilibrio implícito en su interior de manera que los organismos que viven dentro puedan vivir en el.

Manual WEBIECV. Público. Fecha de Aprobación Versión 2.0 Código DE-M-03

Metalite. Estándares:

Unidad 5. Primaria Ciencias de la Naturaleza 5 Programación

PROCESO DE ALTA EN EL PORTALCIUDADANO DEL AYUNTAMIENTO DE ALCORCON

MANUAL DE USO DEL SISTEMA INFOMEX PARA LOS SERVIDORES PÚBLICOS HABILITADOS DEL TRIBUNAL FEDERAL DE JUSTICIA FISCAL Y ADMINISTRATIVA.

Recomendaciones jurídicas para que una empresa empiece un negocio en la web

La Teledetección y los Sistemas de Información Geográfica, algunas aplicaciones en el Uruguay *

PRÁCTICA TECNOLOGÍAS DE LA INFORMACIÓN. Objetivos

Manual de usuario. Tramitación de inspecciones periódicas de ascensores: La visión de las empresas conservadoras

Sharpdesk V3.5. Guía de instalación: Edición con clave de producto. Versión 1.0

Conceptos básicos de Ingeniería de Software

Tutorial Sistema de indicadores Observatorio de la Persona Joven

Informe final de evaluación del seguimiento de la implantación de títulos oficiales MÁSTER UNIVERSITARIO EN DIRECCIÓN COMERCIAL Y MARKETING

MANUAL DE USUARIO CONTROL LOGÍSTICO DE TIEMPOS

ANALISIS DE BITACORAS POR METODO RELACIONAL- PROBABILISTICO EN SISTEMAS CON COMPORTAMIENTO CAUSA-EFECTO

SISTEMA DE GESTIÓN DE CALIDAD INFORME DE MEDICIÓN Y AVANCE INDICADORES DE GESTIÓN A 30 DE JUNIO DE 2013

MINISTERIO DE EDUCACION NACIONAL

Unidad I: Introducción a la gestión de proyectos

FUNCIONALIDAD AUDITORES.

Facturas Electrónicamente Firmadas en formato XML

Curso Excel Básico. Clase 1. Relator: Miguel Rivera Adonis

Transcripción:

El ciclo de vida de los datos de la biodiversidad Manuel Vargas Instituto Nacional de Biodiversidad (INBio) 15 de abril de 2013

Resumen Se presenta una descripción general de los datos sobre la biodiversidad y un esquema de las diferentes etapas del ciclo de vida de los mismos. Se exponen los aspectos generales del área de conocimiento conocida como Informática para la Biodiversidad y se ofrecen varios ejemplos de aplicaciones relacionadas, particularmente de aquellas que hacen uso de modelos de distribuciones de especies.

Contenidos La biodiversidad y sus datos. Áreas de conocimiento relacionadas con la biodiversidad y con la computación. Datos primarios. Datos secundarios. La Informática de la Biodiversidad. El ciclo de vida de los datos de la biodiversidad. Ejemplos de aplicación de la Informática de la Biodiversidad.

La biodiversidad y sus datos Biodiversidad Por "diversidad biológica" se entiende la variabilidad de organismos vivos de cualquier fuente, [...]; comprende la diversidad dentro de cada especie, entre las especies y de los ecosistemas (Naciones Unidas, 1992). Datos relacionados Moleculares: Alineamiento de secuencias, genes, estructura de proteinas,... Ecosistémicos: Clima, vegetación, flujos energéticos, relaciones,... De especies y organismos: nombres taxonómicos, coordenadas geográficas, nombres de lugares, fechas de recolección, rangos de distribución,...

Nivel molecular Bioinformática (Bioinformatics) Rama computacional de la biología molecular. Análisis de secuencias de proteínas almacenadas en bases de datos. Análisis de secuencias de ADN y ARN almacenadas en bases de datos. Interacciones genéticas. Árboles filogenéticos. Anotación de genomas. Mapa del cromosoma humano X. La imagen es del National Center for Biotechnology Information (NCBI) y está disponible en Wikimedia (http://www.wikimedia.org/).

Nivel ecosistémico Ecoinformática (Ecoinformatics) Integración de la ecología, las ciencias ambientales y las ciencias de la computación. Mapeo de ecosistemas. Clasificación de la vegetación. Dinámica de poblaciones. Procesamiento de datos de sensores remotos ambientales. Clasificación de la vegetación basada en información del satélite Landsat7. La imagen es de Pavle Cikovac y está disponible en Wikimedia ( http://www.wikimedia.org/).

Nivel de especies Informática de la biodiversidad (Biodiversity Informatics) Aplicación de tecnologías computacionales al manejo de datos sobre biodiversidad del nivel de especies y organismos. Digitalización de datos de colecciones de historia natural. Georreferenciación de localidades de recolección. Integración de datos de museos y herbarios en portales en el web. Modelos de distribución de especies. Mapa de distribución de la rana venenosa Oophaga granuliferus en Costa Rica. La imagen está disponible en el sitio web sobre especies de Costa Rica del Instituto Nacional de Biodiversidad (http://darnis.inbio.ac.cr/).

La Informática de la Biodiversidad (IB) La primera mención a la disciplina se dio en 1998 (Schalk, 1998). Ha sido impulsada por factores como: La necesidad de encontrar respuestas urgentes a la problemática de la biodiversidad (e.g. impacto del cambio climático, efecto de las especies invasoras). La disponibilidad a gran escala de datos primarios de biodiversidad (i.e. especímenes y observaciones de organismos) en formato digital. La disponibilidad a gran escala de información ambiental (e.g. sensores remotos) en formatos apropiados para manejarse con Sistemas de Información Geográfica (SIG). El desarrollo de herramientas de software apropiadas para almacenar, recuperar, analizar y visualizar esta información (e.g. PostgreSQL/PostGIS, SIG, R).

La Informática de la Biodiversidad La imagen es de Arthur D. Chapman.

Datos primarios Son textos digitales o registros de datos multimediales que detallan hechos acerca de la instancia u ocurrencia de un organismo, i.e. sobre el qué, dónde, cuándo, cómo y quién de cada ocurrencia (GBIF, 2010). Ejemplos Etiquetas de especímenes en herbarios y museos. Registros de observaciones de aves. Fotografías de cámaras trampa (camera trap). Fotografía de un tigre de Sumatra tomada con una cámara trampa. La imagen está disponible en Wikimedia (http://www.wikimedia.org/).

Datos primarios Espécimen de una planta de la familia Apocynaceae y su correspondiente etiqueta de herbario. La imagen es del Instituto Nacional de Biodiversidad de Costa Rica (INBio).

Fuentes de datos primarios Colecciones de historia natural en museos y herbarios. Registros de observaciones de vida silvestre (e.g. observadores de aves). Portales de biodiversidad en Internet. Arriba, colección de Lepidoptera del Museo de Historia Natural de Londres, imagen del periódico The Guardian ( http://www.guardian.co.uk/). Abajo, observadores de aves en el Parque Central de Nueva York, imagen disponible en Wikimedia (http://www.wikimedia.org/).

Datos secundarios Son síntesis basadas en datos primarios (Peterson et al., 2002). Ejemplos: Mapas de rangos de distribución. Listas de autoridad taxonómica y checklists. Descripciones de la historia natural de las especies.

Datos secundarios Mapa del rango de distribución de la lapa roja (Ara macao) en Costa Rica, confeccionado en el Instituto Nacional de Biodiversidad de Costa Rica (INBio).

Cómo se generan estos datos? El proceso comprende varias etapas (Chapman, 1995): Recolección. Digitalización. Edición, validación y curación. Presentación.

Etapa de recolección Las imágenes son del Instituto Nacional de Biodiversidad de Costa Rica (INBio). Se realiza en el campo. Se recolectan datos geográficos, taxonómicos, ambientales y morfológicos. Los datos que se omiten o se registran incorrectamente en esta etapa son difícilmente recuperables en las etapas posteriores.

Etapa de digitalización Las imágenes son del Instituto Nacional de Biodiversidad de Costa Rica (INBio). Suele ser un cuello de botella en muchas instituciones. Pueden producirse errores (ortográficos, geográficos, taxonómicos,...) que deben ser corregidos luego.

Etapas de edición, validación y curación Las imágenes son del Instituto Nacional de Biodiversidad de Costa Rica (INBio). Reidentificación. Georreferenciación. Detección y corrección de errores de etapas anteriores.

Etapa de presentación

Ciclo de vida de los datos de biodiversidad La imagen es de Arthur D. Chapman (1995).

Cómo estructurar los datos generados a través de todo este ciclo de vida? Hay varios estándares globalmente aceptados para los dos tipos de datos principales: Para ocurrencias de organismos (i.e. especímenes y observaciones): El Access to Biological Collections Data (ABCD, http://www.tdwg.org/activities/abcd/). El Darwin Core (DwC, http://www.tdwg.org/activities/darwincore/). Para descripciones de especies: El Plinian Core (PLIC, http://www.pliniancore.org/). El Species Profile Model (SPM, http://wiki.tdwg.org/twiki/bin/view/spm/webhome).

El Darwin Core Es un vocabulario o lista de más de 150 términos (i.e. conceptos o elementos) relacionados con la información contenida en colecciones biológicas. Los términos están agrupados en varias categorías: Record-level Terms: language, accessrights, Occurrence: catalognumber, sex, lifestage, Event: samplingprotocol, eventdate, habitat, Location: country, stateprovince, locality, decimallongitude, decimallatitude, GeologicalContext: earliestageorloweststage, latestageorhigheststage, Identification: identifiedby, dateidentified, identificationqualifier, Taxon: scientificname, kingdom, phylum,, genus, specificepithet, taxonrank, El Dwc funciona como una extensión del Dublin Core para aplicaciones de IB. Se pretende que funcione como una referencia estable y estandarizada para compartir datos de biodiversidad. Es un estándar de TDWG y es usado y soportado por las principales iniciativas de IB: GBIF, IABIN, ALA, VertNet, MaNIS, ORNIS, Fishnet 2,...

El Darwin Core Las columnas de una base de datos se mapean a los términos del DwC y así pueden compartirse y ser consultadas simultáneamente con otros recursos de información sobre biodiversidad. La base de datos de cada museo o herbario puede estar en cualquier formato: Excel, Access, FileMaker, BRAHMS, Specify, etc. Mapeo de las columnas de una base de datos particular con los términos del DwC. La imagen es de GBIF.

Libre acceso a datos de biodiversidad compartidos mediante estándares 6 registros Mostrar registros de ocurrencias de Ara macao 35 registros 17 registros Esquema del funcionamiento de un portal de datos de biodiversidad. El usuario realiza una consulta al portal desde su computadoray éste busca en todos los recursos de datos inscritos, los cuales publican sus datos mediante un estándar como DwC. El usuario recibe una respuesta consolidada, en diferentes formatos: texto, imágenes, mapas. La imagen de arriba está basada en una similar de GBIF. Portal 0 registros Bitácora de uso

Cuáles datos son importantes? Darwin Core tiene más de 150 campos de datos ( ABCD tiene más de 1200!). En el caso de la última versión del DwC, solo dos son obligatorios: catalognumber y basisofrecord. La importancia de cada campo está fuertemente relacionada con el uso que se le vaya a dar a los datos. En el caso de los modelos de distribución, tres campos son indispensables: scientificname. decimallongitude. decimallatitude.

Cuáles datos son importantes? Datos ambientales Datos interpolados de estaciones metereológicas: Datos de sensores remotos: WorldClim (http://www.worldclim.org/): 19 variables climáticas (temperatura, precipitación, altitud,...). Reverb (http://reverb.echo.nasa.gov/reverb/): datos de instrumentos de la NASA (Landsat, MODIS, LIDAR,...). Datos de estudios de campo: Ecomapas (http://www.inbio.ac.cr/ecomapas/introduccion.htm).

Teledetección pasiva y teledetección activa Pasiva: Activa: Radiación EM natural Radiación EM emitida por sensores e.g. rayos infrarojos, fotografías aéreas e.g. RADAR, LIDAR

Clasificación de los productos de datos sobre tierra de MODIS En la actualidad, MODIS ofrece 67 productos de datos para la tierra que pueden clasificarse de la siguiente forma: Variables relacionadas con el presupuesto energético: Reflexión de la superficie de la tierra. Temperatura de la tierra y emisividad. BRDF (Bidirectional Reflectance Distribution Function) y albedo (i.e. coeficiente de reflexión). Variables relacionadas con los ecosistemas: Índices de vegetación. Índice de superficie foliar y FPAR (Fraction of Absorbed Photosynthetically Active Radiation). Productividad Neta Primaria. Características de la cobertura de la tierra Anomalías térmicas e incendios. Cobertura de la tierra. Campos continuos de vegetación.

Modelos de Distribución de Especies Para construir un modelo de distribución se necesitan dos conjuntos de datos: los lugares (con coordenadas) en donde la especie ha sido vista o recolectada y las capas de variables ambientales que influyen en la distribución de la especie (expresados como mapas raster). Un mecanismo de inferencia (e.g. entropía máxima) toma ambos conjuntos y construye un modelo del nicho ecológico fundamental de la especie. La imagen fue confeccionada por Manuel Vargas, del Instituto Nacional de Biodiversidad de Costa Rica (INBio).

Impacto del cambio climático Amazilia boucardii Distribución potencial actual de A. Boucardii basada en datos climáticos de 1961-1990. El mapa fue confeccionado en el Instituto Nacional de Biodiversidad de Costa Rica (INBio).

Impacto del cambio climático Amazilia boucardii -100% Distribución potencial de A. Boucardii en 2030 basada en el escenario climático A2 del IPCC. El mapa fue confeccionado en el Instituto Nacional de Biodiversidad de Costa Rica (INBio).

Impacto del cambio climático 1961-1990 2030 Ara ambiguus -41,07% Los mapas fueron confeccionados en el Instituto Nacional de Biodiversidad de Costa Rica (INBio).

Impacto del cambio climático 1961-1990 2030 Caluromys derbianus +84,36% Los mapas fueron confeccionados en el Instituto Nacional de Biodiversidad de Costa Rica (INBio).

Recomendaciones para la toma de decisiones Identificación de corredores biológicos Imagen del proyecto GRUAS II: Propuesta de ordenamiento territorial para la conservación de la biodiversidad en Costa Rica.

La Informática de la Biodiversidad La imagen es de Arthur D. Chapman.

Bibliografía citada Chapman, A. D. (2005). Principles of Data Quality, version 1.0. Report for the Global Biodiversity Information Facility, Copenhagen. GBIF (2010). Best practice guide for Data Discovery and Publishing Strategy and Action Plans versión 1.0. Escrito por Chavan, V. S., Sood, R. K., and A. H. Arino. 2010. Copenhagen: Global Biodiversity Information Facility, 29 pp. ISBN: 87-92020-12-7. Disponible en http://www.gbif.org. Naciones Unidas (1992). Convenio sobre la diversidad biológica. (C. O. B. Diversity, Ed.) Programa de Naciones Unidas para el Medio Ambiente PNUMA, 1760(6005), 226-253. UICN. Disponible en http://www.cbd.int/convention/convention.shtml. Peterson, A. T., Stockwell D. R. B., & Kluza, D.A. (2002). Distributional prediction based on ecological niche modeling of primary occurrence data. En Scott, J. M., Heglund, P. J., & Morrison, M. L. [Eds.], Predicting species occurrences: issues of scale and accuracy. Island Press, Washington, DC. Schalk, P. (1998). Management of marine natural resources through by biodiversity informatics. Marine Policy, 22(3), 269-280. Disponible en http://linkinghub.elsevier.com/retrieve/pii/s0308597x9800013x.