La bioinformática como herramienta en el descubrimiento de nuevo medicamentos.

La bioinformática como herramienta en el descubrimiento de nuevo medicamentos. Una de las más claras señales del giro de que la biología moderna ha dado es la aparición de la bioinformática, este termino lo ayuda a acuñar Andrew Coulson en la universidad de Edimburgo, misma que fue una de las primeras en crear una unidad de biocomputación en Europa. La bioinformática cobija básicamente estudios relativos a enfoques sistemicos sobre datos biológicos, no se restringe únicamente a aquellos generados como parte del proyecto genoma, cobija igualmente estudios en ecología con la subsecuente generación de SIGs, pretende brindar una herramienta al biólogo atraves de la cual él pueda afrontar la integración coherente de grandes cantidades de datos, el permitir la organización del conocimiento en si mismo. Hasta el momento su área de mayor desarrollo ha estado ligada a la información proveniente de los distintos proyectos genoma, es así como dentro de las áreas que más apoyo y demanda tienen podemos citar: 1. Bases de datos 2. Software para visualización de estructuras moleculares 3. Sistemas de manejo integrado de laboratorios de R&D a nivel de industria Farmacéutica 4. Software para estudios de redes genéticas (Genetic Networks) 5. Desarrollo de nuevos algoritmos para estudios de estructura proteica Las áreas antes mencionadas describen de manera clara el interés general, se tienen grandes cantidades de datos que en si mimos no están dando una idea acerca del comportamiento del sistema como tal, es por ello que dentro del desarrollo de bases de datos (el área de mas y mayor impacto) se pretende integrar totalmente las distintas fuentes existentes, mediante el desarrollo de interfaces comunes tanto a nivel de usuario final como a nivel de plataformas de desarrollo, un ejemplo claro se tiene en desarrollos tipo SRS (Sequence Retrival System), aquí se pretendió dar una sola y clara manera de consulta y administración de sistemas de bases de datos en Biología molecular. En lo referente a estructuras moleculares y desarrollo de nuevos algoritmos para determinación de ultraestructura la preocupación es palpable tanto en las Universidades como en la Industria Farmacéutica, estos dos puntos tocan de manera directa los procesos de R&D en la búsqueda de nuevos medicamentos. Los estudios que actualmente se llevan a cabo en Redes Genéticas pretenden apartir de genomas completos dar una idea mas precisa acerca del comportamiento del sistema.

El interés en el uso de computadores para afrontar problemas biológicos empieza a finales de los años 60s y principios de los 70s, primeramente en los laboratorios de los Alamos, dentro del grupo inicial se cuentan nombres como el de Michael Waterman, Temple Smith, Paul Stein y otros, hacia los años 80s se empieza a contar con las herramientas a nivel de laboratorio para generación masiva de datos, y en los años 90 de la mano con la explosión de Internet se da el boom de la Bioinformática como tal. Esta relación no es gratuita, Internet proveyó el canal ideal para el avance de la Biocomputación. Un ejemplo claro de esta provechosa relación se ve en el desarrollo de bases de datos en biología molecular para consultas online, en la integración de sistemas de análisis sobre estas mismas bases de datos, sin embargo un ejemplo que muestra como Internet y la Biología in sillico van de la mano lo constituye la aparición de un programa que inicialmente se diseña como un simple visualizador de estructuras moleculares llamado RasMol, y que de la mano del desarrollo de las tecnologías de WEB llega a ser lo que hoy por hoy es... un plug-in que permite que esta visualización se de totalmente on line con todas las posibilidades de su antecesor, a este plug-in se le conoce como CHIME, y permite además total integración con la tecnología JAVA, hasta llegar al desarrollo de una herramienta como el Protein Explorer, que tiene integrados ciertos sistemas de análisis de estructuras proteicas. Tanto RasMol como Chime han tenido importantes progresos desde sus respectivas apariciones, en el primer caso se paso de una herramienta de visualización a una que permite hoy por hoy la creación de completos guiones explicativos sobre temas específicos, de manera básica un guión o script en RasMol es una película que permite mostrar diferentes operaciones sobre una molécula, a manera de ejemplo: Fig. 1a Fig. 1b

La figura 1a muestra una doble hélice de DNA, en la figura 1b se muestra la misma doble hélice con los nucleótidos Adenina que ella contiene, esta clase de manipulaciones no solamente son posibles so no que además su despliegue en una animación no es complicado. RasMol es un desarrollo que requiere cierto proceso de aprendizaje, y es por esta razón que para ambientes Microsoft se desarrollo un RasMol totalmente amigable, esta versión es de distribución gratuita y totalmente libre atraves de Internet (www.accefyn.org.co). Chime es un paso de RasMol hacia una total integración con la tecnología Web, con el objeto de no solamente visualizar moléculas y permitir la creación de películas sobre ellas si no de también el dar la posibilidad de llevar a cabo todas estas operaciones a nivel de Internet de manera más sencilla e Interactiva nace Chime, y dentro de su curva de desarrollo se tiene el Explorador de Proteínas como uno de sus puntos más altos. Ejemplo de pantalla del Protein Explorer. Fig. 2

La bioinformática y su relación con la Industria Farmacéutica El auge que experimenta la Bioinformática es visible en el surgimiento de compañías orientadas a prestar esta clase de servicios en el manejo de información biológica. Los datos en si mismos no son comercializables, pero la información implícita en ellos si lo es. Una ilustración de este proceso conceptual es: BioDatos BioInformacion BioConocimiento Procesos de R&D a nivel de Industria Farmacéutica Algunos interrogantes quedan aquí planteados, por lo cual se hacen necesarias algunas precisiones: Los datos son La información es: Hechos almacenados Hechos patentes, presentes, latentes Inactivos por sí mismos Activos en la medida en que permitan hacer algo con ellos Sustentados en tecnología, Orientados hacia aspectos más orientados hacia aspectos más prácticos y tecnológicos básicos de la investigación Tomados de varias fuentes El producto del procesamiento de los datos. A nivel de Industria Farmacéutica donde los procesos de R&D además de largos son sumamente costosos la Bioinformatica esta llamada a jugar un papel preponderante en el descubrimiento de nuevo medicamentos. Con el fin de ilustrar mejor este punto consideremos la Proteasa que es la razón de ser de muchas compañías farmacéuticas. Las proteasas son enzimas regulatorias cuya función básicamente es romper proteínas, se encuentran en el cuerpo y a nivel de enfermedades juegan un papel importante, por ejemplo en el caso del

HIV son ellas quienes se encargan de desmantelar proteínas sanas y usarlas para la construcción de nuevos virus. Las proteasas juegan también un papel principal en los procesos de reproducción, la cabeza de cada esperma esta empaquetada con una proteasa la cual es usada para atravesar el huevo y llevara así a feliz termino el proceso de fertilización. En este caso en particular como en muchos otros casos las proteasas se usan para inhibir estas acciones de las proteasas. Sin embargo el escollo más grande en el desarrollo de esta clase de moléculas esta dado por gran potencia y la gran variedad de funciones que cumplen las proteasas, es así como los efectos secundarios son frecuentes con esta clase de medicamentos. Dentro de los procesos de desarrollo de nuevas moléculas con propiedades farmacologicamente activas es usual el primero identificar el blanco de la molécula, su contraparte. Este proceso usualmente se enfocaba solamente a unas pocas moléculas, sin embargo y dado al auge en el acceso a la información de los proyectos genoma él numero de potenciales blancos para resolver ciertos problemas se ha incrementado de manera palpable. En tanto mas genes son secuenciados y conocidos los procesos de desarrollo de drogas tienen mas y más posibles rutas para dar solución a sus problemas de manera más directa. Pero al tiempo que las opciones crecen se hace también mas y más necesario el uso de herramientas para afrontar esta explosión de información. La Bioinformática en este contexto facilita la selección de los mejores blancos. Las posibilidades en desarrollos Bioinformaticos Estando la bioinformática íntimamente ligada a la biología molecular es conveniente aclarar que los costos de investigación y desarrollo son en la biocomputación sumamente bajos. El costo mas alto que en este campo se contempla no tiene relación alguna con equipos ni materiales, es el Know- How lo que cuneta. Internet, el estado de desarrollo de los proyectos GNU, y la inusitada importancia que actualmente esta cobrando el movimiento de libre acceso a los códigos fuente del software hacen que la materia prima esta dada para quien quiera investigar y desarrollar en bioinformática. El tener claro a donde se quiere ir es lo principal porque el resto de elementos son básicamente gratuitos.

Uno de los problemas que más interés acapara hoy por hoy la biocomputación es la integración de bases de datos, el desarrollo de plataformas unificadas de desarrollo para sistemas de información biológicos es un problema de alta prioridad por cuanto solo en al medida en que la información este altamente organizada se hará mas y más disponible a la comunidad en general. Como los bancos de datos han crecido de una manera alarmante un sistema que permita recopilar y consultar información de una manera uniforme de diferentes fuentes se hace necesario, y es precisamente de esa necesidad de donde nace el SRS (Sequence Retrival System). Este sistema no es un catalogo central de bases de datos, se trata de una interface única de consulta y presentación de resultados que facilita el acceso a diferentes recursos, tiene además un componente que le permite guardar registros automáticos de actualización con el propósito de ayudar al administrador a estar en contacto permanente con los otros administradores de sistemas SRS alrededor del mundo aprovechando su conocimiento, además de permitirle de igual manera el mantener las bases de consulta completamente actualizadas. El SRS da al usuario una gran flexibilidad al llevar a cabo sus búsquedas, la información acerca de los bancos de datos sobre los cuales el SRS lleva acabo sus búsquedas se encuentra disponible para el usuario, el administrados puede implementar consultas sobre mas de 350 bancos de datos diferentes. A pesar de las deferentes ventajas y soluciones que el SRS presenta a los problemas que los sistemas de información biológicos presentan el SRS en sí mismo no es una solución idónea, es aun palpable la falta de una plataforma común de desarrollo, de una adecuación de las estructuras de los sistemas de consulta SQL (Structured Query Language) a las necesidades particulares de esta clase de información. Algunas consideraciones finales La bioinformática en lo que atañe al descubrimiento de nuevas moléculas de interés farmacéutico esta estrechamente relacionada con las bases de datos y los sistemas de determinación y diseño de estructuras proteicas, es así como el desarrollo de software para extractar conocimiento de la información recabada en los laboratorios se tiene como una de las necesidades principales en la biocomputación. El éxito en las tares de R&D a nivel de industria farmacéutica esta dado en como se entienda el sistema genético y como seamos capaces de extraer de dicho sistema la información necesaria para inhibir ciertos procesos. Cierto es que un computador no puede reemplazar un

laboratorio y es por esto que los aportes tradicionales químicos y Farmacológicos continuaran siendo importantes, sin embargo es igualmente cierto que el uso de recursos informáticos minimiza tiempos en esta clase de procesos de R&D haciendo más atractiva la relación Costo-Efecto. Un punto importante que aun no se ha considerado en Latinoamérica es como se va a afrontar la formación de biólogos que estén en capacidad mas que de producir datos de analisarlos. Los aspectos educativos en biocomputación han sido estudiados en Europa desde hace mas de cinco años, España siendo uno de los nodos nacionales más jóvenes de la Red Europea de Biología Molecular ha producido documentos de gran interés en este sentido, todos ellos se encuentran disponibles atraves de Internet. Es importante aquí hacer notar que solamente dos países latinoamericanos son nodos de la red antes mencionada, ellos son Cuba y Argentina. Las herramientas para la formación de Bioinformaticos al igual que la investigación en bioinformática están disponibles en Internet, nuevamente es importante recalcar que al igual que en la investigación en los aspectos de formación no se contemplan costos altos mas que por las personas en sí mismas. Algunas direcciones de interés: Notaciones y propiedades de los aminoacidos : gopher://gopher.imbjena.de/00/ftp/images/proteins/amino_acids/amino_acid.txt Aminoacidos, analisis. http://www.embl-heidelberg.de/aaa.html Imagenes de AA con notaciones atomicas : gopher://gopher.imbjena.de/11/ftp/images/proteins/amino_acids Abrebiaciones de compuestos quimios : http://www.chemie.fuberlin.de/cgi-bin/abbscomp en aleman Libro de recetas en biologia molecular mantenido por el Cnentro de genoma australiano : http://morgan.angis.su.oz.au/www_recipe/top.html Atlas de interacciones de cadenas laterales en proteinas : http://www.biochem.ucl.ac.uk/bsm/sidechains/index.html# Libro de cocina de biocomputacion : http://www.ch.embnet.org/jam/int_unix/jaminx.html BioGuia : http://bioinformatics.weizmann.ac.il:70/1s/bioguide Curso de algoritmos para biologia molecular : http://www.math.tau.ac.il/~shamir/algmb.html Curso de biocomputacion : http://www.techfak.unibielefeld.de/bcd/original-welcome.html Curso de biologia celular : http://lenti.med.umn.edu/~mwd/cell_www/cell.html

Curso de genetica cuantitativa fundamental : http://nitro.biosci.arizona.edu/zbook/book.html Principios de estructura de proteinas : http://www.dl.ac.uk/cbmt/home.html Diccionario de biologia celular : http://macserver.molbio.gla.ac.uk/ Aspectos geometricos en la estructura de proteinas : http://www.chem.duke.edu/research/prisant/protein/protein.html Una guia para el RASMOL : http://www.cryst.bbk.ac.uk/ Secuencias en Harvard : http://twod.med.harvard.edu/seqanal/index.html Protocolos en biologia molecular : http://research.nwfsc.noaa.gov/protocols.html Para acceder a un completo manual de RasMol y Chime La academia Colombiana de Ciencias Fisicas Y Naturales presenta en la red un especial desarrollo. En esta misma direccion es posible consiguir una copia del RasMol amigable para ambientes Microsoft. http://www.accefyn.org.co