Investigación. Ciencia de Computación

Documentos relacionados
Bases de datos 1. Teórico: Introducción

Gestion y Modelación de Datos Sistemas de Información, Sistemas de BD

Lógica Proposicional IIC1253. IIC1253 Lógica Proposicional 1/64

Universidad de Costa Rica Sistema de Aplicaciones Estudiantiles SAE

BASE DE DATOS Modelos de Datos

Qué es SGBD? Mencionar 4 tipos de SGBD. SGBD de red. Román Gutiérrez Sosa. SGBD jerárquicos. Modelo de datos relacionales.

Bases de Datos OTROS ASPECTOS MODELO E-R

Tema II: Información Derivada: Vistas (2.6)

Gestion y Modelación de Datos Introducción

Nombre del documento: Programa de Estudio de asignatura de Especialidad

Teoría de Modelos Finitos: Motivación

Bases de Datos: Introducción

Métodos de Inteligencia Artificial

Matemática computable

UNIDAD 1: CONCEPTOS BA SICOS DE BASE DE DATOS

Los diagramas de clases y de objetos sirven para modelar diversos aspectos estructurales o estáticos de un sistema: Modelado - Vocabulario del Sistema

Materia requisito: DOMINIOS COGNITIVOS (Objetos de estudio, temas y subtemas) I. INTRODUCCION A LAS BASES DE DATOS

FACULTAD DE INGENIERÍA

Teoría de la Normalización

Métodos de Inteligencia Artificial

TÍTULO: MATEMÁTICA DISCRETA Y LÓGICA Disponibilidad

UC I. Rest. Ciclo Tipo UCR

El Modelo Relacional. Estática

Tema I: Introducción a las bases de datos. Curso Introducción a las bases de datos.

Semántica y Consistencia de Datos: Una Trayectoria de Investigación

Algoritmos. Medios de expresión de un algoritmo. Diagrama de flujo

Introducción a la Lógica y la Computación

BASES DE DATOS TEMA 1 PERSPECTIVA DEL ÁREA DE BASES DE DATOS

SISTEMAS INFORMÁTICOS PROGRAMACION I - Contenidos Analíticos Ing. Alejandro Guzmán M. TEMA 2. Diseño de Algoritmos

CARRERA DE INGENIERÍA CIVIL EN INFORMÁTICA COMPETENCIAS ESPECÍFICAS Y SUS NIVELES DE DOMINIO

Carrera: SCB Participantes. Representantes de la academia de sistemas y computación de los Institutos Tecnológicos.

Especialidades en GII-TI

TEMA 6: INTRODUCCIÓN A UML

RESUMEN DE LAS DIAPOSITIVAS DE BASE DE DATOS 1

Intensificación en "Lenguajes e Inteligencia Artificial"

BENEMÉRITA UNIVERSIDAD AUTÓNOMA DE PUEBLA FACULTAD CIENCIAS DE LA COMPUTACION

Algoritmos y programas. Algoritmos y Estructuras de Datos I

Modelos y Bases de Datos

Representación del conocimiento. Lógica y representación del conocimiento.

PERFIL PROFESIOGRÁFICO PARA IMPARTIR LAS ASIGNATURAS DE LA LICENCIATURA EN INFORMÁTICA (PLAN DE ESTUDIOS 2005)

Ingeniería de Requerimientos. requiere de un Sistema de Software.

PR1: Programación I 6 Fb Sistemas Lógicos 6 Obligatoria IC: Introducción a los computadores 6 Fb Administración de

Guía práctica de estudio 03: Algoritmos

Investigación Emergente en Bases de Datos y Aplicaciones

Unidad Académica Responsable: Departamento de Informática y Ciencias de la Computación CARRERA a las que se imparte: Ingeniería Civil Informática

UNIVERSIDAD DE GUADALAJARA

Inteligencia en Redes de Comunicaciones. Razonamiento lógico. Julio Villena Román.

LAS 14 AREAS TEMATICAS DE LA COMPUTACIÓN

Introducción a las bases de datos. TEMA I: Introducción a las bases de datos Sistema de información Sistema de información (SI)

Evolución del software y su situación actual

INGENIERIA. Reyes Marzano, Alejandro FISI-UNMSM

Autómatas Finitos Deterministicos (DFA)

Autómatas Finitos Deterministicos (DFA)

300CIG007 Computabilidad y Lenguajes Formales: Autómatas Finitos

Universidad Autónoma del Estado de México Licenciatura en Física Programa de Estudios: Física Térmica

UNIVERSIDAD TECNOLÓGICA DE PEREIRA FACULTAD DE CIENCIAS BÁSICAS DEPARTAMENTO DE MATEMÁTICAS PROGRAMACIÓN DE COMPUTADORES

Introducción a Bases de Datos

Dr. Carlos A. Coello Coello Departamento de Computación CINVESTAV IPN

Doctorado en Ciencias de la Ingeniería

Inteligencia de Negocios

LÓGICA COMPUTACIONAL

BASES DE DATOS TEMA 4 DISEÑO DE BASES DE DATOS RELACIONALES

Solución al parcial 14

GRADO EN INGENIERÍA INFORMÁTICA

Mención en Computación

Universidad Autónoma del Estado de México Licenciatura en Ingeniería en Sistemas Energéticos Sustentables

M.Sc ISMAEL HAERAZO OSPINO Ingeniero de sistemas

Unidad 1. CONCEPTOS DE BASES DE DATOS.

Unidad I Introducción a la programación de Sistemas. M.C. Juan Carlos Olivares Rojas

Temario. Índices simples Árboles B Hashing

como les va con las practicas?

Aprendizaje Computacional y Extracción de Información

<NOMBRE DE LA UNIVERSIDAD, Y NOMBRE DE LA COMUNIDAD>. <TITULO PROYECTO>

Tema 01: Algoritmia y diagramas de flujo. Estructuras de datos (Prof. Edgardo A. Franco)

Lógica proposicional. Ivan Olmos Pineda

Requerimientos de Software

Representación de Conocimientos

4. FUNDAMENTOS DEL MODELO RELACIONAL

1. Lenguaje de Definición de Datos. 2. Lenguaje de Manipulación de. Datos. M. C. Gustavo Alfonso Gutiérrez Carreón

Diseño Lógico Modelo Relacional. Ges3ón y Modelación de Datos María Constanza Pabón

EI MT1008 Programación II

Rational Unified Process

Proyectos Informáticos. Ing. Isabel León P.

Representación del Conocimiento Otros formalismos. Licenciatura en Ciencias de la Computación. Introducción a la Inteligencia Artificial.

Maestría en Bioinformática. Bases de Datos y Sistemas de Información. Diseño Lógico. Ing. Alfonso Vicente, PMP alfonso.vicente@logos.com.

DISEÑO DE BASES DE DATOS RELACIONALES

Carrera: SCM Participantes. Representantes de la academia de sistemas y computación de los Institutos Tecnológicos.

1.Introducción al Modelo Relacional.

Introducción a las Bases de Datos

Prueba Protocolo de Programación I

Nombre de la asignatura : Lenguajes y Autómatas. Carrera : Ingeniería en Sistemas Computacionales. Clave de la asignatura : SCB- 9324

Modelos de Datos. Modelo Entidad-Relación

relacionales Arquitecturas Distribuidas 09/10

Maestría en Ingeniería Énfasis en Sistemas y Computación

ALGORITMOS DIGITALES II. Ing. Hugo Fdo. Velasco Peña Universidad Nacional 2006

Base de datos relacional

Universidad de Cantabria

UNIVERSIDAD AUTÓNOMA DE CHIAPAS LICENCIATURA EN SISTEMAS COMPUTACIONALES

El Modelo Relacional. Carlos A. Olarte BDI

Guía práctica de estudio 03: Algoritmos

Transcripción:

Investigación en Ciencia de Computación y Manejo de Datos (visión y trayectoria personales) Leopoldo Bertossi

Contenido: A. Algunos aspectos de mi trayectoria académica B. Un área de investigación de los últimos años C. Proyección de mi investigación

3 A. Un Poco de Historia Personal (y algo más) Mi formación básica es en matemática Hice la licenciatura, magíster y doctorado en matemática, este último en lógica matemática Lógica matemática clásica, como usualmente desarrollada por matemáticos Estudiando con los métodos matemáticos los mismos métodos de la matemática Métodos? Entre ellos... Razonamiento matemático: las leyes/reglas que gobiernan el razonamiento matemático y la obtención de conclusiones de premisas dadas

Construcciones usuales en matemática Por ejemplo, construcciones algebraicas/conjuntistas de estructuras matemáticas a partir de otras La abstracción y estudio matemático general de estas construcciones constituyen la teoría de modelos Desde muy temprano en mi formación matemática me intereséen los aspectos lógico-matemáticos de la computación No en los computadores per se ni en la tecnología particular ni en la programación tradicional Síenlaciencia de computación: 4

Computabilidad: Modelos matemáticos de la noción intuitiva de algoritmo Modelos matemáticos de computación De lo computable y de lo no computable Complejidad computacional: Cuál es la dificultad intrínseca de un problema computacional? En tiempo, espacio, aleatoridad, etc.... 5 Y qué tiene esto que ver con la lógica matemática?

6 Lógica y Computación La ciencia de computación parte en los años 30 dentro de la comunidad de lógica matemática, y como parte de ésta K. Goedel, A. Turing, A. Church, S. Kleene, E. Post, etc. En gran parte por problemas propuestos expĺıcitamente a principios del siglo XX por D. Hilbert La lógica matemática está enlabaseyraíz mismas de la (ciencia de) computación La computación en la forma propuesta y desarrollada por J. von Neumann debe mucho a Goedel, Church y Turing La idea de almacenar programas en computadores generales ya está impĺıcita en Goedel, y expĺıcita en Church y Turing

Desdehacealgunasdécadas y especialmente hoy en día la lógica matemática es desarrollada principalmente en ambientes de ciencia de computación La ciencia y práctica de la computación han sido una fuente permanente de problemas y desafíosparalalógica matemática En un círculo virtuoso de retroalimentación positiva Similar a la relación estrecha entre física y matemática a principios del siglo XX (cuando era más difícil distinguirlas) 7

8 Lógica matemática tiene aplicación directa en computación Modelos de computación y complejidad computacional Lenguajes de programación, incluyendo semántica y lenguajes propiamente tales (e.g. LISP, Prolog) Ingeniería de software (e.g. especificaciones formales, verificación automatizada)... Representación del conocimiento: Cómo representar conocimiento en el computador y usarlo en sistemas computacionales? Inteligencia Artificial, Ontologías, Web Semántica, etc. Las bases de conocimiento son esencialmente teorías expresadas en lenguajes de la lógica matemática La extracción de conocimiento impĺıcito se hace mediante razonamiento lógico (muchas veces, no clásico)

9 Manejo de datos (data management) Como una extensión del área de bases de datos Las bases de datos relacionales nacen directa y expĺıcitamente de una aplicación de la lógica matemática Un éxito científico, tecnológico, y comercial! (E. Codd, 1970)

10 Volviendo a lo personal... Terminado mi doctorado en matemática me cambié a ciencia de computación, tanto en ambiente académicocomoenárea de investigación Un cambio natural que estuvo madurando por un cierto tiempo Conocimientos y destrezas adquiridas en lógica matemática me fueron fundamentales en ciencia de computación Mi principal área de investigación actual es data management Mi investigación sigue siendo de naturaleza matemática, en términos de problemas de investigación, métodos, y tipo de mis publicaciones

B. Manejo de Inconsistencia en BDs 11 Outside world correspondence Empleado Nombre Salario page 5K smith 3K stowe 7K Database with relations (model) Una base de datos (BD) relacional D es un modelo de una realidad externa El modelo está expresadoentérminos de relaciones finitas sobre un cierto dominio de valores Una restricción de integridad (RI) sobre D es una condición que D debería satisfacer para capturar la semántica del dominio de aplicación

12 Outside world correspondence Empleado Nombre Salario page 5K smith 3K stowe 7K Database with relations (model) Un conjunto de RI ayuda a mantener la correspondencia entre D y la realidad externa Por ejemplo, la siguiente es una típica RI, llamada dependencia funcional (DF): El salario depende funcionalmente del nombre o Cada nombre está asociadoalomás a un salario

13 Empleado Nombre Salario page 5K page 8K smith 3K stowe 7K DF expresada como fórmula de lenguaje simbólico de la lógica matemática: x y z(empleado(x, y) Empleado(x, z) y = z) (*) Por otro lado, una BD D es una estructura matemática: un conjunto (dominio o universo) con ciertas relaciones sobre él Como estructura matemática D puede satisfacer o no la RI (*) En el caso de arriba, no... La BD es inconsistente, lo que es indeseable...

14 Nuestra gran pregunta: (en algún momento) Si una BD es inconsistente, cuál es la información consistente en ella? Cuáles son los datos consistentes en una BD inconsistente? En particular: Cuáles son las respuestas consistentes a una consulta hecha a una BD inconsistente? Queremos obtener información consistente, pero: Cuál es ésa? Consistencia es global, y buscamos consistencia local... Caracterización precisa Propusimos una... (definición matemática)? (Arenas,Bertossi,Chomicki; PODS99)

Intuitivamente: Los datos consistentes en una BD inconsistente D son invariantes bajo todas las formas minimales de restitución de la consistencia de D Es decir, la información consistente persiste a través de todas las versiones mínimamente reparadas de D Estas últimas son las reparaciones de D 15 D X RI X Q consulta reparaciones

16 Ejemplo: La instancia D viola la DF x y z(empleado(x, y) Empleado(x, z) y = z) (*) Hay dos reparaciones (minimales) si se acepta sólo eliminaciones e inserciones de tuplas (filas) completas: Employee Name Salary page 5K page 8K smith 3K stowe 7K D 1 page 5K smith 3K Employee Name Salary stowe 7K D 2 page 8K smith 3K Employee Name Salary stowe 7K Cada una de estas reparaciones es consistente, satisface (*) Lo consistente es lo que tienen en común...

17 D 1 page 5K smith 3K Employee Name Salary stowe 7K D 2 page 8K smith 3K Employee Name Salary stowe 7K (stowe, 7K) persiste en todas las reparaciones: es información consistente (page, 8K) no lo es (no es verdadera en D 1 ) Una respuesta consistente a una consulta Q desde una DB D es una respuesta a Q que puede ser obtenida de manera usual a partir de toda posible reparación de D (con respecto a las RI) Q 1 : Empleado(x, y)? Respuestas consistentes: (smith, 3K), (stowe, 7K) Q 2 : yempleado(x, y)? Respuestas consistentes: (page), (smith), (stowe)

Nuestra definición de información consistente en una BD inconsistente es matemáticamente precisa 18 Es un modelo matemático, una abstracción, a partir de un problema práctico real El modelo matemático se puede investigar como tal... Ojalá dando aplicaciones de vuelta al problema que lo motivó Fue sólo el comienzo: Se abriótodaunárea de investigación matemática y computacional! Algunos problemas...

19 Propiedades del modelo? Propiedades de las respuestas consistentes? Si se actualiza la BD D, cómo cambian las respuestas consistentes? Computación incremental, sin partir de cero? Cómo podemos obtenerlas/computarlas? Idea ingenua: Producir todas las reparaciones de la BD inconsistente y ver qué tienenencomún... D X RI X Q consulta reparaciones

20 Mala idea: Demasiadas reparaciones! Dónde se crean y mantienen para consultarlas? Cuál es la complejidad intrínseca del problema de computar respuestas consistentes? Si es (demostradamente) alta... Hay clases de RI y consultas para las cuales el problema puede ser resuelto eficientemente? Se puede computar las respuestas consistentes a Q en D consultado sólo D? (sin producir las reparaciones) En algunos casos, reescritura...

21 Q nueva consulta D X RI X Q consulta X reparaciones Respuestas consistentes a Q 1 : Empleado(x, y)? Hágale a D la siguiente consulta y respóndala de manera usual: Q 1 : Empleado(x, y) z(empleado(x, z) y z)? Obtenida por interacción lógica entre la consulta original y la DF (*) Q 1 puede ser respondida eficientemente, como siempre, en un SABD (no hay necesidad de computar reparaciones)

Hay ĺımites, y cuáles,pareestemétodo de reescritura? 22 Sí los hay: para ciertas consultas y RI, se puede demostrar que la computación es intratable Para los casos duros : Alguna lógica con lenguajes más expresivos para reescritura de consultas? Todos estos son problemas matemáticos difíciles Aún hay muchos problemas abiertos Desde matemáticos, pasando por problemas de implementación, hasta problemas de aplicación... Con impacto en aplicaciones reales... Cómo podrían ser las cosas en la práctica?

Los SABD deberían proveer a los usuarios interfaces y mecanismos más flexibles 23 Que les permitan especificar sus RI de usuario junto con las consultas query pre processor? Select... From...... Cons/W... Un SQL extendido? SELECT FROM CONS/W Name, Salary Employee FD: Name -> Salary; (DF no mantenida por el SABDS) Select... From...... ICs Aunque las RI no sean satisfechas por la BD, un SABD debería entregar las respuestas consistentes Notar en cambio de paradigma: RI son restricciones sobre respuestas a consultas, y no sobre estados de la BD!

C. Un Par de Direcciones de Investigación 24 Hay varios temas de investigación en manejo de datos que he estado desarrollando Sin embargo, hay un par de temas nuevos en mi agenda de investigación (a) Complejidad Estructural y Contenido de Información Bases de datos (y sistemas de información) representan y almacenan información No han sido investigados en profundidad desde la perspectiva de la teoría de la información Como se la encuentra en sistemas termodinámicos y mecánica estadística

En general, la entropía juega un papel crucial, como medida de (des)orden y complejidad estructural Cómo aplicar la noción de entropía en BDs? Una BD es un objeto estructurado, con una complejidad intrínseca que refleja su organización interna Las restricciones de integridad (RI) imponen condiciones adicionales sobre esta estructura y organización Cómo cuantificar (modelar y estudiar matemáticamente) el grado de satisfacción de RI? Aplicaciones? Calidad de datos... 25

26 (b) La Emergencia del Contexto y el Sentido La noción de contexto aparece en muchas áreas de computación (context-aware devices...) Otra noción de aparición repetida es la de sentido (sense) Ambas aparecen a menudo en manejo de datos: La calidad de los datos depende del contexto (He hecho investigación inicial en este problema) La calidad de un dato depende de su sentido Sobre esta noción se define otros predicados de calidad, de más alto nivel Sentido parece depender del contexto...

Se requiere un tratamiento preciso, formal, matemático de contexto y sentido, al menos desde el punto de vista de la ciencia de computación (y manejo de datos, en particular) Cómo emergen los contextos a partir de interacciones sociales entre agentes computacionales? (o humanos) Cómo se usan en la interacción? Cómo modelar, representar, actualizar contextos, y usarlos computacionalmente? Cómo emerge la noción de sentido desde- y es determinada por contextos? Creo que la teoría de sistemas como se ha investigado y estudiado en biología y sociología tiene mucho que aportar a esta discusión... 27