BASES DE DATOS DE INTERÉS EN BIOQUÍMICA



Documentos relacionados
BASES DE DATOS DE INTERÉS EN BIOQUÍMICA

La ventana de Microsoft Excel

UNIDAD 1. LOS NÚMEROS ENTEROS.

GUIA APLICACIÓN DE SOLICITUDES POR INTERNET. Gestión de Cursos, Certificados de Aptitud Profesional y Tarjetas de Cualificación de Conductores ÍNDICE

MANUAL BASICO DE WEBEX

Manual SBR. Pero antes de explicar las actividades que principalmente podemos desarrollar vamos a dar una visión global de la aplicación.

Estas prácticas tienen por objeto aprender a manejar la información contenida en el NCBI de una forma más o menos sencilla o elemental.

Guia de realización de un GIG personal en nuestra página web (

Alberto Marcano Díaz

9. Composer: Bugs y consejos.

MANUAL DE AYUDA HERRAMIENTA DE APROVISIONAMIENTO

Como verás pone Microsoft Office y si te colocas sobre esta línea debería salir:

Introducción a la Estadística con Excel

UTILIZACIÓN DE UNA CUENTA DE CORREO ELECTRÓNICO (NUEVO) Acceso al correo electrónico

SISTEMA DE SEGURIDAD 2FA PARA WINDOWS 8.

TUTORIAL PHP WEBQUEST

Aproximación local. Plano tangente. Derivadas parciales.

Página principal de Ensembl. Especies para las que mantiene información.

MÓDULO 3 HERRAMIENTAS EN LA NUBE: ANFIX

MANUAL BÁSICO DE WRITER

Curso Internet Básico - Aularagon

Cierre y Apertura de ejercicio. Gestión - Contabilidad

Roberto Quejido Cañamero

Capítulo 0. Introducción.

10. GENERADOR DE INFORMES.

V Manual de Portafirmas V.2.3.1

Manual de uso de la Web

Practica A. Crear y Administrar Grupos

Configuración de un APs D-Link DWL-2100AP.-

Programa diseñado y creado por Art-Tronic Promotora Audiovisual, S.L.

Cómo creo las bandejas del Registro de Entrada /Salida y de Gestión de Expedientes?

Año: 2008 Página 1 de 31

Manual de usuario Noticias y Accesos Directos en Facultades ÍNDICE

FORMACIÓN DE EQUIPOS DE E-LEARNING 2.0 MÓDULO DE DISEÑO Y PRODUCCIÓN DE MATERIALES UNIDAD 6 B

MANUAL PARA GESTIÓN DE INCIDENCIAS INFORMÁTICAS

TRABAJANDO CON BLOGGER

Región de Murcia Consejería de Educación, Ciencia e Investigación. Manual Usuario FCT

Departamento CERES Área de Tarjetas Inteligentes Manual de Usuario

3º Grado Educación Infantil Bilingüe Números. Método Singapur y F. Bravo E R

15 CORREO WEB CORREO WEB

Indicaciones específicas para los análisis estadísticos.

INSERTAR UNA GALERÍA DE FOTOS REALIZADA EN UNA WEB EXTERNA COMO SLIDE EN UNA PÁGINA O SECCIÓN DE LA WEB

Tutorial del administrador de la web del departamento

Un pequeñísimo tutorial para explicar cómo darse de alta al MEJOR SISTEMA de compartición, backup... en la web.

MANUAL DE AYUDA HERRAMIENTA DE APROVISIONAMIENTO

CREAR UN FORMULARIO PARA LA WEB DE NUESTRO CENTRO

CASO PRÁCTICO Nº 03. El desarrollo del Caso Práctico Nº 03, busca lograr los siguientes objetivos en el participante:

Históricos Impresión de Facturas

El proceso de edición digital en Artelope y CTCE

x

para jóvenes programadores

TUTORIAL ENVIO SMS MASIVOS. 1. Segmentación de la base de datos de clientes

Manual de guía para Clientes Sistema MoTrack

Tutorial DC++ Usarlo es muy sencillo y configurarlo también, aunque tiene algunos trucos importentes.

Internet como herramientas de comunicación: El correo electrónico

MANUAL DEL PROGRAMA DE ASESORAMIENTO (Asesores) Navegador y limpiar caché/cookies...2 Acceso al programa de Asesoramiento... 7

Guía para el tratamiento en Allegro de recibos para centros no pertenecientes a la Generalitat Valenciana.

La Revelación de la Unidad y la Benevolencia: Fundamento de la Creación Entradas 1-4


MANUAL DE USUARIO INTRANET

Actividades con GeoGebra

Paso 1 de 13. Paso 2 de 13. Guía de aprendizaje de Flash CS5 Tutorial 3. Creación de un logotipo textual.

1. Dominio, simetría, puntos de corte y periodicidad

TEMA 20 EXP. WINDOWS PROC. DE TEXTOS (1ª PARTE)

TEMA 5. INTRODUCCIÓN AL MANEJO DE ORIGIN 6.1

MANUAL DE PRACTICUM12 PARA UNIVERSIDADES ÁMBITO MÁSTER

La otra gran ventaja es que está vinculado con nuestra asesoría, gracias a esto se consigue:

ASÍ CONSIGUES QUE TU WEB FUNCIONE EN BUSCADORES:

BÚSQUEDA AVANZADA DE IMÁGENES CON GOOGLE

QUÉ ES LA RENTABILIDAD Y CÓMO MEDIRLA. La rentabilidad mide la eficiencia con la cual una empresa utiliza sus recursos financieros.

INDICE. 1. Introducción El panel Entities view El panel grafico Barra de botones Botones de Behavior...

2. Esto nos llevara a la pagina principal de neubox donde seguiremos los siguientes pasos

MANUAL DE CREACIÓN DE CARPETAS PARA ACCESO POR FTP DE CLIENTES EN UN NAS

2. Seleccionar Insertar función:

- saber qué son la World Wide Web y las páginas Web - aprender a usar el navegador Explorer - conocer el sitio Web del Portal EDUCANTABRIA

Análisis de los datos

CASO PRÁCTICO. CASOS PRÁCTICOS Internet (CP15 y CP16)

Dónde podemos encontrar su origen? El origen de las constelaciones encuentra en Bert Hellinger que las desarrolló en los años 80.

Aprender a usar correo electrónico

CRECE EN INTERNET. Llegar a buen puerto: buscando información

CASO PRÁCTICO. ANÁLISIS DE DATOS EN TABLAS DINÁMICAS

Ayuda para la instalación Componente Firma Digital INDICE. 1 Configuración previa Configuración Internet Explorer para ActiveX...

Tutorial de Introducción a la Informática Tema 0 Windows. Windows. 1. Objetivos

Configuración Y Diseño Del Correo Electrónico Y Web Personal De IESA

Cómo editar WIKIPEDIA

Creación paso a paso de Formularios con Google (Parte I) (AKA: no corrijo nunca más!)

Trazabilidad ERP Microsa Gestión de Lotes

MANUAL DE PRACTICUM12 PARA CENTROS EDUCATIVOS ÁMBITO MÁSTER

Ecuaciones de primer grado con dos incógnitas

GUÍA RED SOCIAL FACEBOOK

Autoguiado en 6 pasos

Indice. Cómo accedo al B2B? Acceso y Login. Pantalla de inicio. Vista rápida. Cómo hago los pedidos? Búsquedas y pedidos

Índice general de materias LECCIÓN 7 74

01 Índice. GESTOR DE CONTENIDOS Manual de uso 01 ÍNDICE OBJETO DEL DOCUMENTO ESTRUCTURA GRÁFICA DEL SISTEMA... 3

Tutorial de manejo de los portafolios de objetivonatural.com. Bienvenidos a Portafolios.objetivonatural.com

DEPARTAMENTO DE EDUCACIÓN FÍSICA CURSO 2011/2012

AGREGAR UN EQUIPO A UNA RED Y COMPARTIR ARCHIVOS CON WINDOWS 7

Plantillas Office. Manual de usuario Versión 1.1

Mejoras introducidas MARKETING GIO

Transcripción:

BASES DE DATOS DE INTERÉS EN BIOQUÍMICA Las técnicas de alto rendimiento desarrolladas en las últimas décadas han permitido la adquisición masiva de información de biología molecular que se depositan en bases de datos de crecimiento exponencial, la bioinformática se ocupa de su gestión, análisis e interpretación de los datos experimentales. Las principales bases de datos son: 1. NCBI (National Center for Biotechnology Information) (http://www.ncbi.nlm.nih.gov) 2. Ensembl (The Wellcome Trust Sanger Institute y European Bioinformatics Institute) (http://www.ensembl.org/index.html) Antes de entrar a explicar todas las aplicaciones y opciones de búsqueda que podemos encontrar en la página del NCBI es interesante mencionar que se pueden consultar los tutoriales que están disponibles en la propia página web. Para acceder a ellos basta con pinchar en el enlace EDUCATION:

Cuando pinchamos en el enlace aparece la siguiente página: Aquí tenemos acceso a todos los tutoriales para aprender a utilizar las herramientas que posee esta base de datos. Para aprender a utilizar las herramientas de las bases de datos vamos a poner un ejemplo de lo que suele ser el trabajo en un laboratorio de biología molecular. Supongamos que de nuestros experimentos, cualesquiera que sean, obtenemos la siguiente secuencia de nucleótidos (2142 pb): TGGGGTGTTCTGCTCTGGCGGCAGCGGCAGCGGCGGCGGGACGCGGAGGCTCCCCCGGGATTCGGCCTCA GCAGCGAGGCGGCGGCGGCGGCTGCGGAGGCGCAGGCAGCAACTGAGGCAGCGGCAGGCTCAGGTGCAGC CGCTGCTCAAAGAAAATGAACGGCACCCTGGACCACCCAGACCAACCAGATCTTGATGCTATCAAGATGT TTGTGGGCCAGGTTCCAAGGACCTGGTCTGAAAAGGACTTGCGGGAACTCTTCGAACAGTATGGTGCTGT GTATGAAATCAACGTCCTAAGGGATAGGAGCCAAAACCCGCCTCAGAGCAAAGGGTGCTGTTTTGTTACA TTTTACACCCGTAAAGCTGCATTAGAAGCTCAGAATGCTCTTCACAACATGAAAGTCCTCCCAGGGATGC ATCACCCTATACAGATGAAACCTGCTGACAGTGAGAAGAACAATGCAGTGGAAGACAGGAAGCTGTTTAT TGGTATGATTTCCAAGAAGTGCACTGAAAATGACATCCGAGTCATGTTCTCTTCGTTTGGACAGATTGAA GAATGCCGGATATTGCGGGGACCTGATGGCCTGAGCCGAGGTTGTGCATTTGTGACTTTTACAACAAGAG CCATGGCACAGACGGCTATCAAGGCAATGCACCAAGCACAGACCATGGAGGGTTGCTCATCACCCATGGT GGTAAAATTTGCTGATACACAGAAGGACAAAGAACAGAAGAGAATGGCCCAGCAGCTCCAGCAGCAGATG CAGCAAATCAGCGCAGCATCTGTGTGGGGAAACCTTGCTGGTCTAAATACTCTTGGACCCCAGTATTTAG CACTCCTTCAGCAGACTGCCTCCTCTGGGAACCTCAACACCCTGAGCAGCCTCCACCCAATGGGAGGGTT GAATGCAATGCAGTTACAGAATTTGGCTGCACTAGCTGCTGCAGCTAGTGCAGCTCAGAACACACCAAGT GGTACCAATGCTCTCACTACATCCAGCAGTCCCCTCAGCGTGCTCACTAGTTCAGGGTCCTCACCTAGCT CTAGCAGCAGTAATTCTGTCAACCCCATAGCCTCACTTGGAGCCCTGCAGACATTAGCTGGAGCAACGGC TGGCCTCAATGTTGGCTCTTTGGCAGGAATGGCTGCTTTAAATGGTGGCCTGGGCAGCAGTGGCCTTTCC AATGGCACCGGGAGCACCATGGAGGCCCTCACTCAGGCCTACTCGGGTATCCAGCAATATGCTGCTGCTG CGCTCCCCACTCTGTACAACCAGAATCTTCTGACACAGCAGAGTATTGGTGCTGCTGGAAGCCAGAAGGA AGGTCCAGAGGGAGCCAACCTGTTCATCTACCACCTGCCCCAGGAGTTTGGTGATCAGGACCTGCTGCAG ATGTTTATGCCCTTTGGGAATGTCGTGTCTGCCAAGGTTTTCATAGACAAGCAGACAAACCTGAGCAAGT GTTTTGGTTTTGTAAGTTACGACAATCCTGTTTCGGCCCAAGCTGCCATCCAGTCCATGAACGGCTTTCA GATTGGCATGAAGCGGCTTAAAGTGCAGCTCAAACGTTCGAAGAATGACAGCAAGCCCTACTGAGCGTGC TCCCCTCTGAGACTGGAGTGAGAGGGTCTTCTGATTCCTGCCGTTTGTTCATCGTTGTGCCTAAAGCATG TCGATGTGGCGTCAAGTACATCGTCCAAATCCCTGTCTCTTCAGCTTCTCTGATGCTTGAACTCTCACCT TTGACCTTGTGTTGACCTTTGATGCTGATGTGTATTTTTATTATGTTTGTTTCTTTCTTCGTTTTTTTTT CTTTTTTTCTTTCCTTTTTTTTTCCTTTTGTGCTGCCAAATTGGTTTTGCTAGAACGACTGCTGAAGGGG AAATATTTAAACTTGCATTTGAATATAAAAAAAATCTATTTTTCTAGAACTTCATAAGATAACCACTTGA

TTTTGTGATTCCAATTCTTTGTAATTGTCTTCAGAGCAGCCCTACTAGCACATACCGCGTGGTGTTTGTA TTTCTGTGAACACACAGCCAGTCCGTTTCTAGGCTTTGTTTCTCTGTGTGCTTAGTTTTAAAGACAACTT TGAAGTAAACAATGAAATAAAAGATGTCACTAAAACCTCTGA No tenemos ni idea de que se trata, ni siquiera sabemos si se trata de un fragmento de secuencia génomica, o si es un mensajero, y si es un mensajero no sabemos si está completo o sólo hemos obtenido una secuencia parcial. Cómo podemos obtener información acerca del origen de esta secuencia? En una primera aproximación podríamos hacer un BLASTn, este programa compara la secuencia que nosotros le introducimos con todas las secuencias que hay depositadas en la base de datos. Desde la página principal del NCBI pincharíamos en BLAST: Aparecerá la siguiente ventana, donde deberemos pinchar en nucleotide blast: Tras pinchar en el enlace podremos pegar nuestra secuencia en la ventana correspondiente:

Generalmente cuando trabajas en el laboratorio se suele tener claro la especie de la que procede la secuencia, pero supongamos por un momento que desconocemos por completo el origen de la secuencia. En ese caso debemos hacer un BLASTn contra Nucleotide Collection (nr/nt), pinchando en la ventana desplegable indicada con la fecha, porque se trata de la colección de todas las secuencias depositadas en la base de datos, de todas las especies y de todos los tipos. Entonces le damos al botón BLAST que hay en la parte inferior y esperamos hasta que aparezca la ventana de resultamos. Obtendremos un diagrama de resultados como el siguiente:

Este diagrama tiene un código de colores según la similitud entre la secuencia que nosotros hemos introducido en BLAST y las secuencias que ha encontrado. La primera barra roja que se nos muestra presenta un 100% de identidad con la secuencia que hemos introducido en toda su longitud. Si descendemos en la página podemos ver la siguiente representación: En esta segunda representación obtenemos algo más de información que en la primera. Nos da los mismos resultados con una pequeña descripción de las secuencias que ha encontrado el programa. Además, nos da algunos datos como: 1. Query coverage: es el porcentaje de la longitud de la secuencia que hemos introducido que ha conseguido encontrar en la base de datos. 2. Max. Ident.: se trara del porcentaje de identidad que posee la secuencia que hemos introducido y la secuencia de la base de datos, dentro de la longitud que ha encontrado. 3. E value: es un dato estadístico que representa cuanto se parecen nuestra secuencia con la que ha encontrado el software. Cuando más se acerque a cero más se parecerán ambas secuencias.

Pongamos un ejemplo para entender esto mejor: El primer resultado que nos muestra el programa posee un query coverage del 100%, que quiere decir que ha conseguido encontrar una secuencia en la base de datos de la misma longitud que la nuestra, 2142 pb, con la que comparar. Por otro lado, el valor de max. Ident. es también del 100%, lo que significa que en esas 2142 pb son idénticas a las de la secuencia que hemos introducido. Por tanto, el E value es 0, es decir, son totalmente idénticas. Sin embargo, en el segundo resultado el query coverage es sólo del 98%, esto quiere decir que el programa ha encontrado una secuencia de 2100 pb que se parece a una parte de nuestra secuencia, y como el valor de max. Ident. es del 100%, esas 2100 pb son idénticas a las de la secuencia problema. El E value en este caso también es 0, pero se refiere únicamente a las 2100 pb que son iguales. Volviendo al caso práctico, si pinchamos en la primera barra roja, del diagrama anterior, podremos ver lo siguiente: Aquí podemos conocer más detalles de la secuencia que ha encontrado el programa. Por un lado nos dice que es la secuencia que ha encontrado; en este caso Homo sapiens CUG triplet repeat, RNA binding protein 1(CUGBP1), que es el transcript variant 1 y que por lo tanto es un mrna (mensajero). Debajo, nos da la información del gen al que pertenece dicho mensajero. Después aparece nuevamente la información de cuán bueno ha sido el alineamiento entre las secuencias. Y, por último, aparece el alineamiento entre la secuencia que hemos introducido (query) y la que ha encontrado (Sbjct). Llegado este punto podemos asegurar que la secuencia que hemos obtenido es el mensajero que codifica la variante 1 del gen CUGBP. Si queremos conocer más información acerca del mrna o del mensajero podríamos pinchar en los link que aparecen arriba recuadrados. Si pinchamos en el primero aparecerá una página con información del mensajero:

En la parte superior aparece información del mrna: su tamaño, su nombre, el número de acceso, la especie a la que pertenece, etc. Un poco más abajo aparecen referencias bibliográficas en las que se habla del gen en cuestión. Si descendemos en la página aparece lo siguiente: Aparece aquí información del gen al que pertenece, si pinchamos sobre gene, se nos muestra una página similar a la que estamos viendo pero con información del gen (lo veremos un poco más tarde). En el recuadro rojo aparece resaltado la información que nos da la base de datos acerca de la posición de los exones en el mensajero. En el recuadro verde vemos la CDS (CoDing Sequence).

Si por el contrario hubiéramos pinchamos en BLAST el link del gen obtendríamos una página como la que sigue: En esta página podemos acceder a toda la información relacionada con este gen. Por un lado, podemos ver otros nombres de este gen (fecha roja), una breve descripción de la función del gen (fecha roja), las secuencias génica (de mrnas y de proteína derivadas de este gen) y su localización cromosómica (recuadros verdes), bibliografía relacionada y una serie de enlaces a otras páginas de interés (recuadros rojos). De los enlaces de interés vamos a consultar los siguientes: 1. Homologene: donde podremos consultar si existen homólogos de este gen en otras especies. 2. OMIN: aquí podremos conocer si el gen en cuestión ha sido relacionado con alguna enfermedad. 3. Pubmed: para búsquedas bibliográficas. 4. Ensembl: otra base de datos de la que luego hablaremos. 5. HGNC o HUGO: página internacional de nomenclatura de los genes.

Como podéis ver aparecen muchos otros enlaces, os animamos a que pinchéis sobre ellos para bucear por todas las páginas en las que podéis encontrar muchísima información de cualquier gen que os interese y desde muchos puntos de vista. Una vez que conocemos el gen al que pertenece la secuencia problema, CUGBP, podemos ir a la página de inicio del NCBI y escribir directamente en la barra de búsqueda el nombre de nuestro gen, y pinchamos en GO : En la ventana desplegable Search ponemos All Databases, todas las bases de datos, aunque si estamos buscando algo en particular podemos seleccionar en la ventana aquello que nos interese: Pubmed, protein, nucleotide, structure, etc.

En esta página se resume toda la información que contiene NCBI acerca del gen que le hemos introducido. Si pinchamos en los distintos apartados podremos acceder a ellos. Si pinchamos en Gene podremos acceder a la página anterior que obtuvimos tras hacer el BLASTn.

Ahora vamos a buscar información sobre nuestro gen en otra base de datos: Ensembl. Podemos acceder pinchando en el link que aparece en la página del NCBI o bien podemos ir a la página de inicio de Ensembl y poner en el buscador el nombre nuestro gen: Podemos seleccionar una especie en concreto o simplemente buscar en todas las especies:

Nos ha encontrado una entrada en Humano. Pinchamos: En esta página obtenemos de un vistazo gran información sobre el gen de interés. Por un lado nos da su localización cromosómica, una breve descripción de la función e información acerca de los mensajeros, proteínas que deriban del gen y un diagrama de la estructura de los mensajeros. Para ver de manera gráfica los exones e intrones de este gen podemos pinchar en sequence (Fecha naranja): Nos aparece la secuencia completa con los exones resaltados y los intrones sin subrayar.

Volviendo al planteamiento inicial: supongamos que después de haber hecho todas las búsquedas de información con la secuencia de nucleótidos que obtuvimos de nuestros experimentos no hemos conseguido ningún resultado. Qué podríamos hacer? En primer lugar deberíamos tratar de traducir la secuencia de nucleótidos a proteína (secuencia de animoácidos). Para ello utilizaremos el ORF Finder, una aplicación que está disponible en la página de inicio del NCBI, en los links de la parte derecha: Pinchamos en el enlace y copiamos en la ventana que aparece nuestra secuencia de nucleótidos (también podríamos poner el número de acceso de la secuencia si estuviera registrada):

Pinchamos en ORFind y esperamos a los resultados: El software nos devuélvela la información de todos los posibles ORF (Open Reading Frames, o marcos de lectura) que podría tener la secuencia de nucleótidos. En este caso el codón de inicio (ATG) está presente en la secuencia que poseemos, aunque eso no siempre es así, y quizás el marco de lectura podría ser uno que empezase en un punto anterior en la secuencia, que no poseyéramos. En cualquier caso, existen proteínas pequeñas, pero por lo general suelen tener más de 30-50 animoácidos (AA). En nuestro caso parece lógico que la ORF correcta es la más larga que aparece. Si pinchamos sobre ella:

Aparece en la parte inferior la traducción que ha hecho el programa en el marco +3. En la parte superior podemos ver que ha aparecido un enlace para poder realizar un BLAST, en este caso BLASTp, porque estamos trabajando con secuencia de proteína. Si le damos al botón BLAST, y luego a view report, obtenemos lo siguiente:

Mientras carga el programa ha reconocido en la secuencia de AA que existen ciertos fragmentos cuya secuencia recuerda a que secuencia que tienen los dominios RRM (dominio estructural de unión a RNA, luego hablaremos de estructura de proteínas). Tras la carga del programas obtenemos el siguiente diagrama: Se trata de un diagrama con las mismas características que el diagrama que obtuvimos al hacer el BLASTn, pero en este caso todo está referido a la secuencia de AA. Si descendemos en la página vemos el siguiente esquema: Donde podemos ver una pequeña descripción de las secuencias de AA que ha encontrado en la base de datos. Más abajo:

En este último punto se nos muestra el alineamiento de la secuencia de AA que nosotros hemos introducido (a través del ORF Finder) y la secuencia que ha encontrado en la base de datos. En el recuadro rojo, podemos ver los datos del alineamiento: 1. Identities: hace referencia al porcentaje de secuencia idéntica. 2. Positives: se refiere a las propiedades físico-químicas de los AA. Puede ocurrir que los AA no sean idénticos, pero de propiedades físico-químicas similares con lo cual ejercería un papel similar en la función y/o estructura de la proteína. 3. Gaps: son huecos en la secuencias, es decir, dentro de una región en la que la secuencia que hemos introducido es similar a la encontrada por base de datos, pero en esta última existe algún AA de más o de menos. En rojo, aparece resaltado un signo +, que quiere decir que pese a que lo AA comparados no son el mismo, si que poseen propiedades físico-químicas similares. En verde podemos ver un Gap en el alineamiento, a nuestra secuencia le faltan tres AA con respecto a la encontrada por el software. Si pinchamos el GENE ID iremos a la página del gen que ya consultamos anteriormente han hacer nuestra búsqueda por secuencia de nucleótidos. Sin embargo, si pinchamos en el enlace señalado por la fecha roja pasaremos a una página de información de la proteína en cuestión.

En esta ventana podemos conseguir información del número de AA que componen nuestra proteína, de la especie a la que pertenece, de referencias bibliográficas, de dominios estructurales (recuadro rojo) y la secuencia. Ahora ya sabemos muchas cosas acerca de la secuencia que hemos obtenido. Supongamos ahora que yo quiero hacer un estudio a nivel de proteína, porque estamos interesados en hacer un estudio funcional de ciertos mutantes, es decir, queremos conocer cómo ciertos cambios que pueden ocurrir en la secuencia de nucleótidos afectan a la estructura tridimensional de la proteína, puesto que esas mutaciones provocan un cambio de AA. Pues bien, lo primero que deberíamos hacer es conocer la estructura tridimensional de la proteína normal. Para ello vamos al NCBI escribimos CUGBP1 en la barra de búsqueda y pinchamos GO :

Ahora pinchamos en 3D Domains: Debido a la complejidad de algunas proteínas, y también de las técnicas para la obtención de estructuras de proteínas, no siempre encontraremos la estructura completa de nuestra proteína, sino que conseguiremos fragmentos o dominios estructurales por separado. Si tenemos suerte, quizás se conozca la estructura de todos los dominios, aunque quizás nos encontremos con que sólo hay algunos. O peor, quizás no se conozca nada. En nuestro caso están todos los dominios caracterizados. Si pinchamos sobre el primero pasamos a otra página con información de la publicación de la obtención de la estructura y un diagrama con los dominios que componen nuestra proteína.

Si pinchamos sobre el dominio que estamos consultando: En esta nueva ventana podemos ver un alineamiento de la secuencia que compone el dominio de nuestra proteína con las secuencias de otras proteínas que presentan la misma estructura, y por lo tanto suelen presentar funciones similares.

Por último, si pinchamos en structure y luego a structure view, y si disponemos del programa Cn3D (disponible gratis en la página del NCBI http://www.ncbi.nlm.nih.gov/structure/cn3d/cn3d.shtml) podemos ver la estructura en un programa de simulación. Para aprender el manejo del programa podéis consultar el tutorial disponible en la siguiente dirección http://www.ncbi.nlm.nih.gov/structure/cn3d/cn3dtut.shtml. Por último, podríamos acudir a la base de datos del PDB (Protein Data Bank http://www.rcsb.org/pdb/home/home.do). Escribir el nombre de nuestra proteína y buscar si existe alguna estructura relacionada. Obtenemos dos resultados:

Pinchamos en la primera: En esta página podemos obtener información de la estructura y de cómo ha sido obtenida experimentalmente. Además nos dan el enlace a la referencia de la publicación de la estructura.