E-Investigación desde la Astronomía Kathy Vivas (Centro de Investigaciones de Astronomía CIDA, Venezuela) 1
Qué tipo de datos usa un astrónomo? Imágenes: para medir el brillo de los objetos celestes y sus posiciones en el cielo, estudiar la morfología, etc 2
3
Qué tipo de datos usa un astrónomo? Espectros: determinar abundancias químicas, medir velocidades radiales (vía efecto Doppler), buscar líneas espectrales particulares, etc 4
Rango Espectral La información en diferentes longitudes de onda aporta ingredientes para entender mejor cada tipo de objeto celeste 5
6
7
Información Temporal Aunque la vida de una estrella es tan larga que no permite observar cambios en escalas de tiempo humanas, hay fenómenos que requieren información temporal 8
9
Datos Astronómicos Cada objeto celeste puede tener miles de atributos asociados La interpretación de esos datos, que incluye el uso de sofisticados modelos teóricos, permite a los astrónomos tener una idea de los fenómenos físicos que ocurren en el Universo. 10
La Simulación Millenium: Formación de galaxias en el Universo La simulación es hecha a muy alta resolución, con 10¹⁰ partículas. La salida de la simulación pesa ~25 Tbytes 11
Un poco de historia Hasta los años 70, los datos astronómicos se registraban en placas fotográficas. En su mayoría eran datos ópticos. La digitalización de esas placas permitió movilización de datos y análisis en computadoras. 12
Imágenes Digitales Detectores CCD Mosaico de detectores 13
Cámaras digitales hoy La cámara del sistema Pan-STARRS tiene 1.4 Gigapixeles Cada imagen tiene un tamaño de 2 Gbytes En una noche de obserciones con este telescopio se producen varios Terabytes de datos. 14
Gran Variedad de Instalaciones Astronómicas 15
Grandes Mapas del Cielo Por ejemplo, el Sloan Digital Sky Survey concluyó recientemente la imagen digital más grande del mundo. Cubre ¼ del cielo. 2MASS es un survey infrarojo de todo el cielo. 16
La Astronomía Observacional hoy en día Grandes telescopios con enormes detectores Enormes cantidades de datos ( Petabytes!) Modo servicio muy popular en la mayoría de los observatorios (único modo en telescopios espaciales) Archivos de datos públicos. Accesibles a traveś de la web Software automatizado para procesamiento y análisis de datos 17
La Astronomía Observacional hoy en día Era de observaciones de pocos objetos, seleccionados cuidadosamente, en unas pocas bandas del espectro electromagnético Era de estudios estadísticos de muestras de billones de objetos (probablemente sin sesgos en las muestras), multi-espectrales y multiépoca 18
El Astrónomo Observacional de hoy en día Es experto en computación (programación, bases de datos, tecnologías web, simulaciones numéricas) Es experto en estadística No necesita saber las constelaciones Tal vez nunca ha estado en un Observatorio Tal vez nunca ha visto una imagen del cielo 19
Manejo de datos astronómicos La comunidad astronómica ha sido siempre muy abierta Software libre, desarrollado por la comunidad Acceso libre a los datos Virtual Internacional Acceso a publicaciones (no tan libre como se quisiera) Observatorio En los 90, algunos observatorios (especialmente los espaciales) empezaron a hacer públicos sus archivos. Estas fueron las semillas del Observatorio Virtual. 20
Intereses de Investigación Tecnologías de la Información Observatorio Virtual 21
IVOA: International Virtual Observatory Alliance Creada en 2002 Cuenta actualmente con 19 miembros, 2 latinoamericanos Su misión es: facilitar la coordinación y colaboración internacional para desarrollar y lanzar herramientas, sistemas y estructuras organizativas necesarias para el uso internacional de archivos astronómicos como un observatorio virtual integrado 22
Qué es un Observatorio Virtual? Un conjunto de estándares internacionales para compartir datos Herramientas para trabajar con datos compartidos Un ambiente para publicar datos (imágenes, espectros, catálogos, modelos teóricos, simulaciones) Una manera de tener acceso a los archivos astronómicos desde cualquier parte del mundo Una herramienta educacional 23
Qué NO es un Observatorio Virtual? Un repositorio gigante de datos Una excusa para no seguir tomando observaciones o para construir nuevos telescopios y detectores Un controlador de la calidad de datos La cantidad de datos es tan grande que NO tiene sentido bajar a un disco local todos los datos para luego ver cuáles son relevantes. La computación va a los datos (servicios web) 24
El Desarrollo de Estándares Este es un aspecto crucial para compartir datos. En astronomía, algunos estándares ya definidos: Imágenes: formato FITS Catálogos: VOTables son tablas XML con una rica metadata Protocolos de búsqueda: Cone Search, SIAP (Single Image Access Protocol), SSAP (Single spectrum Access Protocol) Lenguaje de Base de datos: ADQL (Astronomy Data Query Language). Parecido al estándar SQL pero con funciones especiales para astronomía 25
Importancia de los datos históricos Ejemplo: la nebulosa McNeil fue descubierta en el 2004, como un objeto nuevo y brillante en la constelación de Orión. Observaciones de archivo del Observatorio Nacional de Llano del Hato permitieron recuperar los detalles de la explosión. 26
Importancia de los datos históricos Movimientos Propios: la estrellas están tan alejadas que sus desplazamientos en el cielo solo pueden notarse si ha pasado suficiente tiempo. El material antiguo es entonces importantísimo para determinar desplazamientos comparando con observaciones modernas Hay varias iniciativas para digitalizar y poner en el OV material fotográfico antiguo. 27
Cosas que puedo hacer en el Observatorio Virtual Investigación Bibliográfica Consulta de Catálogos ADS: Astrophysical Data System VizieR: Acceso a basicamente todos los catálogos publicados en revistas astronómicas Investigar sobre un objeto particular Teniendo el nombre o las coordenadas 28
Cosas que puedo hacer en el Observatorio Virtual Investigar sobre una zona en el cielo particular Teniendo coordenadas y tamaño de la zona a estudiar Correlacionar tu propio catálogo de objetos con una o más base de datos Extraer información de una imágen FITS propia y correlacionarla con una o más base de datos 29
Cosas que puedo hacer en el Observatorio Virtual Crear modelos teóricos que nos ayuden a interpretar los datos observacionales (no tantos modelos teóricos disponibles como uno quisiera) Realizar proyectos educativos y de divulgación con datos reales 30
Nota Importante Todo esto es gratis y disponible a todo el mundo a través de Internet 31
Herramientas Selecionadas (hay muchas más) ADS Topcat DataScope + Aladin + SIMBAD OpenSky Query SkyServer 32
ADS: Astrophysical Data System Sitio auspiciado por NASA y el Harvard Smithsonian Center for Astrophysics Es el portal para una biblioteca digital de astronomía y astrofísica Contiene 8.9 millones de registros Mantiene 3 bases de datos: Astronomía y Astrofísica Física ArXiv e-prints http://www.adsabs.harvard.edu/ 33
34
35
Topcat Tool for Operations on Catalogs And Tables Hace lo que quieras con tablas 36
* Fast access to large datasets (millions of rows/hundreds of columns) * View/edit table data in a scrollable browser * View/edit table and column metadata * Re-order and hide/reveal columns * Insert 'synthetic' columns defined by algebraic expression * Sort rows on the values in a given column * Define row subsets in various ways * Draw configurable plots of column-based quantities against each other distinguishing different data sets: o Plot types are histogram, 2-d scatter plot, Stacked Line Plot, 3-d Cartesian, 3-d spherical polar and 2-d density map o Features include variable transparency, error bars, point labelling and colour axes for higher-dimensional visualisation. * Calculate statistics on each column for some or all rows * Perform flexible and fast matching of rows in the same or different tables * Concatenate the rows of existing tables to create new ones * Cause various things to happen when a row or plotted point is selected. * Communicate with other applications using SAMP or PLASTIC * Acquire tables from a file (local disk, MySpace, SRB), URL, SQL query, VizieR, cone search, TAP, SIA or SSA services, etc * Perform multiple (per-row) cone search, SIA or SSA queries, to join a local to a remote catalogue or image/spectrum archive. * Write modified tables out in original or different format to file (local disk, MySpace, SRB) or an SQL database * Comprehensive documentation supplied within the application or off-line 37
DataScope: todo lo que quieras en una posición del cielo dada 38
39
SkyServer: herramienta para visualizar y obtener datos de SDSS 40