Mapa global de la regulación de factores de transcripción tipo MADS-BOX en frutilla silvestre (Fragaria vesca).

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Mapa global de la regulación de factores de transcripción tipo MADS-BOX en frutilla silvestre (Fragaria vesca)."

Transcripción

1 Mapa global de la regulación de factores de transcripción tipo MADS-BOX en frutilla silvestre (Fragaria vesca). Gonzalo Arturo Sepúlveda Hermosilla Memoria para optar al título de Ingeniero en Bioinformática Profesor tutor: Dra. Daniela Urbina Alvear Profesor co-tutor: Yazmina Stappung González Profesor informante: Dr. José Antonio Reyes Suarez Talca Chile. 29/07/2014

2 I - Agradecimientos En primer lugar quisiera agradecer y si es posible, dedicar todo a mis padres y hermanos, parte fundamental de este proyecto, por haber contribuido con una base de confianza y apoyo constante, así como también por tolerar la ingratitud y ausencia durante el transcurso. También agradecer a mi polola Estefanie, por creer invariablemente en el éxito y buen término de este proceso. Dar gracias por la inmensa paciencia y dedicación a mis guías, Dra. Daniela Urbina y Yazmina Stappung que en conjunto con todo el Lab, se encargaron mediante consejos con forma jocosa pero fondo implacable, de dar pies a lo que aquí concluye. A todos los que me acompañaron en el proceso, mi ahijado Benjamín, HDC s, Cocktutores y más. Gracias a todos. Touché Cafesis! 2

3 II - Tabla de contenido I - Agradecimientos... 2 II - Tabla de contenido... 3 III - Índice de Figuras... 6 IV - Índice de tablas Resumen Abstract Introducción Regulación genética a través de Factores de Transcripción La familia de factores de transcripción MADS-BOX Funciones de MADS-Box en organismos vegetales Desarrollo floral MADS-BOX durante la maduración de frutos: modelos climatéricos y no-climatéricos Métodos experimentales para el estudio de interacción de DNA- Proteínas Inmuno precipitación de cromatina (ChIP) ChIP-Sequencing Herramientas y métodos para búsqueda de elementos en CIS de plantas Modelos HMM: Suite MEME BLAST: Índices de evaluación estadística E-value: P-value: Q-Value: Lenguajes de Programación

4 3.6.1 Perl & BioPerl: AWK: Categorización funcional Gene Ontology: Planteamiento del problema Hipótesis de trabajo Objetivo general Objetivos específicos Materiales y Métodos Base de datos de regiones promotoras Definición de los sitios de unión a MADS-Box (CArG-Box) Búsqueda sobre la base de datos de promotores de Fragaria vesca Metodología para el análisis de resultados Análisis de secuencias palíndromas Anotación por homología contra la base de datos NR Validación de predicción por referencia biológica Resultados Base de datos biológica Determinación de los motivos CArG-Box Búsqueda de secuencias Alineamiento de secuencias y determinación de CArG-Box Validación in silico de los motivos CArG-Box encontrados Búsqueda de los motivos en los promotores de Fragaria vesca Análisis y cuantificación de los resultados Promotores con presencia de sitios de unión Sitios de unión CArG-Box encontrados Secuencias palíndromas

5 9.4.4 Análisis de secuencias promiscuas Secuencias de unión más frecuentes Ubicación de los sitios de unión dentro de la región promotora Anotación por homología de secuencias Categorización funcional con Gene Ontology Proceso biológico: Función Molecular: Componente Celular: Reconstrucción de rutas metabólicas Validación por referencia biológica Discusión Conclusión Referencias: Anexos Presentación a congresos Material suplementario Rutas metabólicas Frecuencia de secuencias de unión para cada CArG-Box Gráficos de clasificación funcional de primer nivel Script eliminación de secuencias palíndromas Script de aislación de promotores Script parseo de resultados BLAST

6 III - Índice de Figuras Figura 1 Estructura y función de los dominios MADS-BOX tipo II: Figura 2 Logo de la secuencia consenso CArG-Box: Figura 3 Efectos fenotípicos de los factores de transcripción MADS-Box: Figura 4 Mapeo y anotación funcional del genoma de F. vesca Figura 5 Método Figura 6 Gráfica de región promotora: Figura 7 Formato de la base de datos de promotores de F. vesca Figura 8 Sitios de unión y promotores con presencia de CArG-Box: Figura 9 CArG-box promiscuos entre AP3, FLC, PI y SVP Figura 10 Sitios de unión exclusivos de SEP4, SRF y FLC: Figura 11 Sitios de unión más frecuentes: Figura 12 Distribución de CArG-Box en promotores: Figura 13 Clasificación ontológica de Proceso biológico Nivel 2: Figura 14 Clasificación ontológica de Proceso biológico Nivel 3: Figura 15 Clasificación ontológica de Función molecular Nivel 3: Figura 16 Clasificación ontológica de Función Molecular Nivel 2: Figura 17 Clasificación ontológica de Componente celular Nivel2: Figura 18 Clasificación ontológica de Componente celular Nivel 3: Figura 19 Clasificación ontológica de Componente celular Nivel 8: Figura 20 Ruta metabólica KEGG de Biosíntesis de Antocianinas: Figura 21 Poster Fruit Biotechnology: Figura 22 Ruta KEEG de interconversión entre pentosas y glucoronato: Figura 23 Ruta KEEG de Biosíntesis de ácido grasos: Figura 24 Ruta KEEG de metabolismo de purinas: Figura 25 Ruta KEEG de Degradación de valina, leucina e isoleucina: Figura 26 Ruta KEEG de biosíntesis de fenilpropanoides: Figura 27 Frecuencia de sitios de unión de SVP: Figura 28 Frecuencia de sitios de unión de SRF: Figura 29 Frecuencia de sitios de unión de SEP3: Figura 30 Frecuencia de sitios de unión de SEP4: Figura 31 Frecuencia de sitios de unión de AGAMOUS: Figura 32 Frecuencia de sitios de unión de AGL15: Figura 33 Frecuencia de sitios de unión de AP3: Figura 34 Frecuencia de sitios de unión de PI: Figura 35 Frecuencia de sitios de unión de FLC: Figura 36 Clasificación ontológica Función molecular: Figura 37 Clasificación ontológica Proceso biológico: Figura 38 Clasificación ontológica Componente celular:

7 IV - Índice de tablas Tabla 1: Descripción de genes del modelo de desarrollo floral ABCDE para Arabidopsis thaliana Tabla 2 Sitios CArG-Box, Búsqueda del motivo y Logo generado con MEME: 42 Tabla 3 Resultado general de búsqueda sobre base de datos de promotores: 44 Tabla 4 Análisis de promotor Antocianidina: Tabla 5 Resultados validación por referencia biológica:

8 1 Resumen Las interacciones entre proteínas y DNA son particularmente conservadas a lo largo de la evolución. El estudio de estas redes de interacción pueden dar pie al entendimiento de cómo se regulan los principales procesos celulares. Los factores de transcripción tipo MADS-BOX han sido descritos como reguladores maestros del desarrollo de flores y su arquitectura en angiospermas. Algunos de sus miembros como: APETALLA, AGAMOUS, FLOWERING LOCUS y, los pertenecientes a la subfamilia SEPALLATA entre otros, presentes en tomate, manzana y frutilla comercial; juegan un rol clave en los procesos de maduración del fruto. Fragaria vesca, cuyo genoma ha sido recientemente secuenciado y a diferencia de otras especies de este género, como la mencionada frutilla comercial (Fragaria x ananassa) y la frutilla chilena (Fragaria chiloensis), las cuales son altamente complejas a nivel genético, es una especie diploide lo que facilita su uso como modelo de estudio a nivel genético y fisiológico. El objetivo de esta investigación, es determinar los posibles genes regulados transcripcionalmente por los factores tipo MADS-BOX en Fragaria vesca, estableciendo la presencia y densidad de su correspondiente sitio de unión (CArG-BOX) dentro de las secuencias de 2Kb río arriba de cada uno de los genes anotados en este genoma. Esto se realizó mediante la utilización de la suite para el descubrimiento y búsqueda de patrones MEME. Los resultados basados en los nueve miembros de la familia MADS-Box analizados, muestran un total de regiones promotoras con presencia de sitios de respuesta afines, que se distribuyen de manera uniforme a lo largo de la región promotora a través de 64 secuencias de unión no siempre específicas para cada factor de transcripción. Dicha inespecificidad concuerda con el mecanismo de unión al DNA a través de multímeros, propio de esta familia. Los genes putativamente regulados por MADS-Box determinados en la presente investigación participan principalmente en procesos metabólicos con actividad catalítica o de unión, aunque se destacan 90 genes clasificados funcionalmente relacionados a desarrollo y 22 con rol de factores de transcripción. 8

9 Se encontraron tres enzimas que regulan el inicio de las cascadas metabólicas en la síntesis de antocianinas y fenilpropanoides. Así como otras que participan en la degradación de aminoácidos esenciales como valina, leucina e isoleucina. Dado los presentes resultados, se revela la importancia de la regulación de los factores de transcripción en dichos procesos metabólicos, los cuales tienen un rol directo en el cómo los frutos ejecutan los procesos que determinan su color (o la falta de este) durante su periodo de maduración. Se proyecta, la validación experimental de los elementos de unión predichos a través de modelos estructurales e interacción DNA-Proteína in silico. Esta validación sería el punto de partida para comprobar que dichos elementos en regulatorios, son funcionales y responsables de que factores de transcripción de la familia MADS-box regulen efectivamente dichos genes blancos. 9

10 2 Abstract Interactions between proteins and DNA are particularly conserved throughout evolution. The study of these interaction networks can unravel the key cellular processesthe MADS-box transcription factors have been described as master regulators of flower development in angiosperms and in its architecture, in which some of its members as APETALLA, AGAMOUS, FLOWERING LOCUS and, according to the results found in tomato, apple and commercial strawberry, those belonging to the subfamily SEPALLATA, among others, play a key role in the process of fruit ripening. Fragaria vesca, whose genome has recently been sequenced and, unlike other species of this genus as the mentioned commercial strawberry (Fragaria ananassa) and the Chilean strawberry (Fragaria chiloensis), it is a diploid species which facilitates its use as a model organism in genetics and at a physiological level. The objective of this research is to identify potential genes transcriptionally regulated by MADS-box transcription factors in Fragaria vesca, establishing the presence and density of its corresponding binding site, called CArG-box within 2Kb upstream sequences of each one of the 24,000 annotated genes in this genome. This was done using the suite for search and discovery of patterns MEME. The results based on the nine types of MADS-Box analyzed, which were defined based on information present in the current literature, shows a total of 5828 promoter regions with presence of at least one related response site, which are distributed uniformly along promoter regions through 64 specific sequences that are not always specific (shared) for each transcription factor, which matches with the DNA binding mechanism through self-multimers, common on this family. The genes putatively regulated by MADS-Box identified in this research are mainly involved in metabolic processes as binding or catalytic activity, although we also found 90 genes functionally related to development and 22 as transcription factors. Interestingly three enzymes which regulate the start of the metabolic cascade in anthocyanin and phenylpropanoid synthesis has been also found, as well as part of the breakdown of essential amino acids such as valine, leucine and isoleucine. Given these results, it s clear the importance of regulation of transcription factors in these metabolic processes, which have a direct role in how fruits acquire its color during the ripening period. As further work, it will be necessary to structurally model the binding sites candidates in order to measure the affinity of DNA-protein interaction to determine their viability and establish a starting point for the experimental validation of the best candidates here described 10

11 3 Introducción. 3.1 Regulación genética a través de Factores de Transcripción La expresión génica es la responsable de todos los mecanismos y características celulares en un momento determinado. Este proceso es usualmente mediado por proteínas, las cuales tienen una interacción específica ya sea con DNA, RNA, u otras proteínas. Dichas proteínas, ante un estímulo realizarán su actividad represora o activadora, regulando así la expresión génica. Las interacciones son específicas y particularmente conservadas en la evolución, inclusive aquellas que interactúan con miembros de su misma familia proteica; con las que generalmente forman complejos, los cuales comparten un determinado sitio de unión a DNA, requisito para ser considerado factor de transcripción (Latchman 1997). Los elementos de respuesta presentes en el DNA, conocidos como elementos en CIS, son secuencias específicas donde estos factores proteicos se unirán, mediante una combinación de fuerzas de Van der Waals, electroestáticas y los cofactores necesarios en el medio. Ejemplo de ello, es la proteína TBP que se une específicamente al elemento en CIS conocido como caja TATA, iniciando así su efecto activador de la transcripción (Osborne y cols. 2009) La familia de factores de transcripción MADS-BOX. Esta amplia familia de factores de transcripción se encuentran presentes en variados organismos, entre levaduras, plantas, insectos, anfibios y mamíferos, jugando roles regulatorios tan importantes como el factor de respuesta al suero humano (SRF), el que participa en la coordinación de la transcripción del protooncogen c-fos (Shaw y cols. 1989). Se ha demostrado que estos factores de transcripción están presentes en variados procesos biológicos como proliferación celular, desarrollo muscular (Molkentin & Olson 1996), entre otros. Por otra parte, en plantas se han visto involucrados en funciones como el desarrollo de órganos florales, en Arabidopsis thaliana, Petunia hybrida y Antirrhinium majus, así como también en la maduración de frutos en Oryza sativa y Solanum lycopersicum (Shore & Sharrocks 1995; Gramzow & Theissen 2010), entre otros. 11

12 Clasificación En plantas existen dos tipos de factores de transcripción tipo MADS-BOX, clasificados como tipo I y tipo II, estos se diferencian principalmente en el número de dominios estructurales presentes en cada caso (Gramzow & Theissen 2010). Estos genes son ortólogos del gen SRF de Homo sapiens y MCM1 de Saccharomyces cerevisiae, para las proteínas de tipo uno y tipo dos, respectivamente. En cuanto a sus dominios, para los de tipo I sólo se identifica un dominio SRF-Like (Gramzow & Theissen 2010). Por otra parte, las proteínas de tipo dos, poseen cuatro dominios conservados, MEF2-Like, Intervening, Keratin-like y por último el dominio C-terminal (Gramzow & Theissen 2010). Un estudio de similitud de secuencias hecho por TAIR (Lamesch y cols. 2012), consorcio de Arabidopsis thaliana, muestra que hay al menos 108 proteínas de esta familia en dicho organismo. (arabidopsis.org/browse/genefamily/ mads_tffamily.jsp) El dominio M o dominio MADS-BOX es común para ambos tipos de genes en plantas, en donde en ambos casos confiere la habilidad de unión a DNA, este tiene un largo aproximado de 60 aminoácidos.(muiño y cols. 2014) El dominio I o Intervening tiene un largo aproximado de 30 aminoácidos y no parece tener una función concretamente descrita, más que la de interconectar estructuralmente los dominios M y K. (Muiño y cols. 2014) El dominio K, del inglés, Keratin-Like, corresponde a una estructura secundaria del tipo coiled-coil, abarcando un total de 70 aminoácidos, el cual corresponde al dominio de interacción proteína-proteína. (Seymour y cols. 2011; Muiño y cols. 2014) El dominio C-terminal es de largo variable y otorga la función particular de cada gen de este tipo, es la zona menos conservada de la proteína. (Nam y cols. 2004). 12

13 Figura 1: Estructura y función de los dominios conservados de MADS-BOX tipo II: se definen cuatro dominios estructurales en la familia MADS-Box, (M) Dominio MADS, permite la interacción DNA-Proteína, (I) Dominio intermedio, confiere estabilidad estructural, (K) dominio keratatin-like permite la formación de dímeros Proteína-proteína y (C) Dominio-C-terminal: Define la particularidad de cada miembro de la familia MADS-Box. MADS-BOX tipo I: Este tipo de genes fue descubierto en primera instancia a través de análisis genómicos, luego se formalizó a través de estudios clásicos. Su importancia en plantas está relacionada con el desarrollo de semillas, el saco embrionario y el desarrollo del gametofito femenino (Gramzow & Theissen 2010; Yoo y cols. 2006). MADS-BOX tipo II: Los factores proteicos tipo II, llamados MIKC-type por sus dominios conservados, has sido exhaustivamente estudiados en distintos modelos genéticos como es en el caso de A. thaliana en donde se expresan comúnmente en esporofitos. Estudios de respuesta a estrés en tomate, indican que podrían también estar involucrados en el tiempo de floración (Arora y cols. 2007) CArG-BOX. La variabilidad del sitio de unión de MADS-Box ha resultado en que hasta el día de hoy sus redes regulatorias aún no estén claramente definidas. En plantas se han hecho algunos esfuerzos, como por ejemplo los estudios realizados por Ito y col. en 2008, sobre los factores MADS-BOX del tipo SEP4, conocidos como Ripening inhibitors (RIN) en tomate. Experimentalmente se ha determinado que los blancos moleculares de los factores de transcripción ubicados en las secuencias promotoras, están comúnmente compuestos por secuencias consenso conservadas que poseen una región común denominada CArG-BOX, las cuales estarían presentes en todas las secuencias promotoras, las que 13

14 responden a MADS-BOX (Ito y cols. 2008; Fujisawa y cols. 2013). Se ha establecido que para las proteínas de tipo II, estas secuencias siguen una estructura general en base a diez nucleótidos: CC(A/T)6GG (Miano 2010), en donde las letras representan los nucleótidos más frecuentes y las letras entre paréntesis y separadas por barra, representan la posibilidad de ocurrencia de dicho nucleótido en esa posición. Estudios similares se han realizado sobre A. thaliana (de Folter y cols. 2005), Malus x domestica (Ireland y cols. 2012) y Prunus persica (Tani y cols. 2009). Figura 2: Logo de la secuencia consenso CArG-BOX, establecida desde 242 secuencias más representativas - Adaptado de "Role of serum response factor in the pathogenesis disease" Laboratory investigation; a journal of technical methods and pathology 90(9): Como se puede ver en la Figura 2, los resultados del alineamiento múltiple entre 242 secuencias muestra el nivel de información en cada posición de la secuencia del motivo CArG-BOX, en donde se presenta una predominancia de adeninas y timinas en la zona central de la caja. El resultado del estudio de Miano en 2010, muestra que la secuencia concreta más conservada, es decir, el sitio de unión más frecuentemente encontrado, corresponde a CCTTTTATGG (Miano 2010). A pesar de lo anteriormente señalado, se han demostrado casos en donde la transcripción no está mediada por CArG-BOX o que dicho motivo no es suficiente por sí solo (Majesky 2002; Strobeck y cols. 2001; Sun y cols. 2006). Si bien es cierto, esto representa la forma canónica de CArG-Box, como sitio de unión para MADS-Box, es posible encontrar pequeñas variaciones en dicha secuencia que otorgará la selectividad para los distintos miembros de la familia MADS-Box, como por ejemplo para APETALLA, el cual modifica este patrón a 14

15 CC(A/C)A4(T/A)GG, donde, si bien se mantiene la longitud del motivo, tiene sutiles cambios en la frecuencia con que se distribuyen ciertos nucleótidos, ya que es mucho más probable encontrar en su zona central una alta concentración de adeninas careciendo de timinas como en la versión canónica. Estas diferencias se han hecho notar determinándose experimentalmente, para algunos de los distintos miembros de la familia, diferenciándolos como AG, AGL15, AP3, FLC, PI, SEP3, SEP4, SRF y SVP, entre otros. Se cree que estas diferencias podrían tener un fuerte impacto desde el punto de vista estructural, en cuanto a variaciones en la energía de interacción entre las distintas bases y los residuos de dominio M del factor de transcripción. 3.2 Funciones de MADS-Box en organismos vegetales Desarrollo floral El desarrollo floral corresponde al proceso mediante el cual las angiospermas expresan diferencialmente determinados genes que resultan en el desarrollo de sus órganos sexuales, las flores. Para el correcto crecimiento de los órganos, las plantas siguen una arquitectura floral la cual se ha descrito mediante el Modelo ABCDE el cual explica desde un nivel genético las bases biológicas de dicho proceso. El modelo ABCDE, establecido en Arabidopsis thaliana, A. majus y petunia, detalla cómo la expresión de una batería de genes homeóticos del tipo MADS-BOX, subdivididos en tipos A,B,C, D y E, conducen el desarrollo de la flor (Litt & Kramer 2010), en donde se asocia cada letra a una función. Dicha asociación se realizó mediante combinaciones de ensayos experimentales como ChIP-seq y mutagénesis sitio-dirigida, a través de las que se pudo apreciar fenotípicamente cómo la falta o modificación en dichos genes producían alteraciones en cada uno de los órganos florales. 15

16 Tabla 1: Descripción de la función de los genes que participan en el modelo de desarrollo floral ABCDE para Arabidopsis thaliana. Función Utilidad Genes asociados en A. thaliana A Identidad de verticilos del periantio. APETALA1 y APETALA2 B Diferenciación de pétalos y sépalos. APETALA1, PISTILLATA C Identidad de verticilos reproductivos. AGAMOUS D Desarrollo del óvulo. FBP1* y FBP7* E Desarrollo de todos los verticilos florales. SEPALLATA *genes ortólogos en petunia (Litt & Kramer 2010) MADS-BOX durante la maduración de frutos: modelos climatéricos y noclimatéricos La maduración en frutos puede ser vista como el periodo de vida en donde estos generalmente ganan dulzor, suavidad, se tornan más agradables al paladar y alcanzan su tamaño, forma y color definitivo, antes de pasar a etapas de pudrición. Este periodo, dependiendo de la especie, puede ocurrir mientras el fruto aún se encuentra en la planta o bien, separado de esta. Los frutos que continúan su maduración una vez separado de la planta son denominados climatéricos. Por el contrario, los que necesitan mantenerse en la planta para realizar este proceso, son denominados no climatéricos (Giovannoni 2004). Aunque en un principio estos conceptos hacían referencia al incremento de la tasa de actividad respiratoria durante la maduración, actualmente, desde un punto de vista fisiológico, representan a los frutos que incrementan, o no, sus niveles de etileno (como agente regulador de la maduración) después de su cosecha, continuando así su maduración (Giovannoni 2004). Ejemplo de frutos climatéricos clásico son: papaya, manzana, tomate, paltas y plátanos. Por otro lado, ejemplos de frutos no climatéricos son: frutilla, uva, aceituna, frambuesa y piña. 16

17 Estudios experimentales realizados a través del método de inmuno-precipitación de cromatina (ChIP), sobre la relación con la maduración del fruto y los factores de transcripción tipo MADS-BOX en tomate, muestran que los inhibidores de la maduración (RIN) forman dímeros entre proteínas similares a las del sub-género SEPALLATA, previamente descritos en A. thaliana. Se ha descrito, que estos factores de transcripción regulan la formación de la zona de abscisión del pedúnculo, ayudando en el mecanismo de cosecha (Ito y cols. 2008) y otros procesos fisiológicos como la acumulación de licopeno, producción de etileno y degradación de la clorofila (Fujisawa y cols. 2013), sugiriendo que la maduración estaría regulada por la interacción entre los factores RIN y la señalización del etileno. En el caso de la manzana, las investigaciones muestran que la supresión de distintos genes de tipo MADS-BOX influye en el control de dos aspectos críticos de la maduración, la carnosidad y la producción de sus semillas. Molecularmente, las modificaciones del gen MdPI, con alta similitud a PISTILLATA, producen frutos carentes de semillas, y la supresión de MADS8 y MADS9 (homólogos a SEP1 y SEP2) reducen la carnosidad de los frutos además de originar pétalos sepaloides (Figura 3) (Ireland y cols. 2012). Figura 3 Efectos fenotípicos de los factores de transcripción MADS-Box. Se muestra la disminución del pericarpio de la manzana. (a) estado nativo, (b) supresión de los genes SEP1 y SEP2 (Ireland y cols. 2012). 17

18 Por el contrario, en frutos no climatéricos, los procesos de maduración no son regulados por procesos dependientes de etileno ni aumentos en la tasa de respiración (Giovannoni 2004). En Fragaria x ananassa (frutilla comercial), la inhibición del gen FaMADS9, ortólogo o con alta similitud a SEPALLATA1/2, causa inhibición de la maduración en el tejido de pétalos, aquenios y receptáculo (Seymour y cols. 2011). Por lo tanto se puede inferir que los genes del tipo SEPALLATA están ligados a la maduración en ambos tipos de frutos. 3.3 Métodos experimentales para el estudio de interacción de DNA- Proteínas Inmuno precipitación de cromatina (ChIP). Esta técnica desarrollada en el año 1999 por Kuo y Allis (Kuo & Allis 1999; Bailey & Machanick 2012), consiste en el mapeo de las interacciones de DNA y proteínas en regiones específicas del genoma. Dada la asociación de DNA y las proteínas, usando típicamente formaldehido, la cromatina es cortada en pedazos por digestión enzimática u otros métodos como la sonicación y posteriormente precipitada de manera específica a través de anticuerpos. Luego que la unión entre el DNA y las proteínas es deshecha, el DNA se somete a amplificación por PCR usando partidores específicos para un locus genético de particular interés según la investigación. Si es que hay gran cantidad de proteínas que interactúen con dichos sitios específicos, más DNA será precipitado y luego amplificado, resultando en la identificación de segmentos genómicos de unión a determinados factores de transcripción. Esta técnica fue utilizada para la determinación del efecto transcripcional de las mutaciones sobre el factor de transcripción RIN en tomate (Ito y cols. 2008; Fujisawa y cols. 2013) 18

19 3.3.2 ChIP-Sequencing. Dado el método descrito anteriormente y en combinación con las recientes tecnologías de secuenciación de nueva generación, es posible detectar los sitios de unión de distintos tipos de proteínas, como los factores de trascripción; Y más importante aún, podemos conocer su secuencia nucleotídica para dar paso a análisis bioinformáticos como el mapeo contra el genoma del organismo, conociendo así el lugar, hebra y abundancia de aquellos sitios de unión. Esto permite establecer distintas hipótesis sobre redes de interacción o de regulación entre los distintos elementos, basándonos en evidencia experimental (Wong y cols. 2013). Esto se ha realizado con anterioridad en diversos organismos modelos como en Arabidopsis thaliana (Wuest y cols. 2012; Zhang y cols. 2012) con lo que se definió diversos elementos regulatorios y como estos afectan al desarrollo floral. 3.4 Herramientas y métodos para búsqueda de elementos en CIS de plantas. La búsqueda y determinación de los elementos en CIS es de gran importancia debido a que a través de estos se puede entender la función y evolución de los genomas. Extensos estudios han sido realizados con el fin de determinar el método que entrega mayor sensibilidad y especificidad. Sus resultados muestran que independiente de la complejidad del modelo diseñado, siempre dependerá del caso de estudio en el cual estos sean empleados (Weirauch y cols. 2013). Para esto existen bases de datos especializadas en la determinación de dichos elementos en plantas, como PlantPan (Chang y cols. 2008) y PLACE (Higo y cols. 1998). Estas proveen numerosos motivos encontrados en plantas, determinados de forma experimental, en reportes publicados. Bioinformáticamente se han desarrollado algunos métodos, dentro de los cuales predomina la aplicación de parámetros estadísticos. Los principales han sido analizados por Weirauch y colaboradores en 2013, donde los más destacables corresponde a los perfiles basados en modelos ocultos de Markov (HMM), K-mer y Position Weight Matrix (PWM) (Weirauch y cols. 2013). Estos métodos suponen una ventaja por sobre los métodos determinísticos, como por ejemplo la búsqueda por palabra clave, ya que al aplicar índices estadísticos en la búsqueda podemos discriminar fehacientemente la calidad del resultado 19

20 encontrado, lo que nos permite aplicar criterios de selección y establecer diferencias cualitativas del motivo de secuencia encontrado por sobre una secuencia originada aleatoriamente Modelos HMM: Los modelos ocultos de Markov, o HMM, por sus siglas en inglés, son modelos estadísticos de alineamientos múltiples entre secuencias, los cuales miden la información de conservación evolutiva para cada columna del alineamiento. Estos actualmente, son utilizados con mucho éxito en el reconocimiento de patrones en distintas áreas como el reconocimiento del habla, el etiquetado gramatical; ya para el año 1985 se comenzó a utilizar en el procesamiento de secuencias biológicas como en A. thaliana (Zhang y cols. 2012) y O. sativa (Arora y cols. 2007). Una característica relevante de los modelos ocultos de Markov, asociada a nuestra investigación, es que a diferencia de otros métodos como las matrices de posición específica, PSSM, estas consideran probabilidades de transición entre los estados, es decir, establece una relación estadística entre las bases adyacentes. Esto supone una ventaja en la identificación de sitios de unión en DNA ya que el orden de las bases, en un contexto biológico, es determinante para que sea posible la actividad biológica o la interacción entre las distintas moléculas. (Wong y cols. 2013) Suite MEME MEME, de la sigla en inglés, Multiple Expectation Maximization for Motif Elicitation es una completa suite para el descubrimiento, evaluación y búsqueda de motivos conservados entre grupos de secuencias, ya sea de DNA o proteínas (Bailey & Elkan 1994), así como para su búsqueda y validación en bases de datos. Dentro de los softwares incluidos en esta suite se destacan principalmente: MEME (Homónimo) (Bailey & Elkan 1994) para la definición de un motivo conservado dentro de un set de secuencias, TOMTOM (Gupta y cols. 2007) para la validación del motivo encontrado contra bases de datos públicas de motivos conservados comprobados experimentalmente como JASPAR (Sandelin y cols. 2004) y TRANSFAC (Wingender y cols. 2001), y por último, 20

21 FIMO (Grant y cols. 2011) para la búsqueda del motivo contra bases de datos de regiones promotoras o personalizadas BLAST: De sus siglas en inglés "Basic Local Alignment Search Tool", BLAST (Altschul y cols. 1990) es una herramienta bioinformática que permite la realización de alineamientos locales para todo tipo de secuencias biológicas contra distintas bases de datos científicas como Swissprot, NR, NT, etc., contra secuencias o genomas específicos. Debido a su naturaleza heurística, los alineamientos de BLAST son evaluados en relación a su significancia estadística. Debido al alto costo computacional que requiere BLAST, usualmente está ligado a clústeres de computadoras con alta capacidad de paralelización de procesos, lo que otorga una mejora considerable en la velocidad del algoritmo. A pesar de esto, existe la posibilidad de implementarlo de manera local lo que otorga la ventaja de realizar búsquedas extensas y personalizadas. 3.5 Índices de evaluación estadística Como es usual en estudios de esta índole, los resultados son presentados en base a índices estadísticos, dentro de los más relevantes están e-value, p-value y q-value. Con estos índices podremos interpretar la calidad de los resultados encontrados en relación a distintos parámetros como: el tamaño de la base de datos, largo de las secuencias y largo de los motivos; así como también establecer tasas de error. A continuación se describen dichos índices y su relevancia, individualmente. En particular, estos índices se utilizaron en la evaluación de los motivos encontrados y en su evaluación contra la base de regiones promotoras JASPAR E-value: E-value, o valor esperado, representa el índice de aleatoriedad de la variable, es decir, corresponde al valor que se esperaría encontrar dentro de un proceso infinito sobre secuencias al azar. Por lo tanto aplicado a la búsqueda de secuencias, a mayor e-value, es más probable que el resultado encontrado sea producto de un proceso azaroso, que por sobre una conservación biológica dentro de una base de datos determinada. (Schervish 2012) 21

22 3.5.2 P-value: Debido al azar relacionado las secuencias nucleotídicas, siempre podrá existir una secuencia que cumpla los requisitos para ser evaluada como un resultado positivo cuando en realidad no lo es (falso positivo). Aquella probabilidad de error es llamada p-value. Esta se calcula en relación a tres parámetros: la varianza de las muestras totales, el promedio de diferencias y el tamaño de las muestras (base de datos). Por lo tanto el valor de p-value indica efectivamente qué tan probable es obtener dicha secuencia si no existiera dicha variabilidad. En la práctica, se suele utilizar como valor de corte de los resultados a considerar como significativos, aquellos que posean un valor de p-value menor a 0.05, es decir un 5%, aunque en casos más estrictos este valor puede disminuir a 0.01 (1%) o (0,1%) lo que dependerá completamente del contexto de la investigación. (Schervish 2012; Storey & Tibshirani 2003) Q-Value: Q-value corresponde al nombre que reciben los p-values ajustados, como FDR (False Discovery Rate) o tasa de falsos descubrimientos dentro de los p-values significativos. A diferencia de los p-values, este índice no se basa en el total de posibilidades de ocurrencia, sino sólo entre las que superaron de manera exitosa el valor de corte de significancia establecido para los p-values. (Storey & Tibshirani 2003; Schervish 2012). De esta manera es posible realizar una estimación estadística de los resultados que se obtienen, aunque esto no implique una real certeza que aquellos resultados sean realmente falsos positivos o verdaderos descubrimientos, por lo que es necesario realizar un método de validación por inferencia biológica con el fin de evaluar los resultados finales. 22

23 3.6 Lenguajes de Programación Perl & BioPerl: El lenguaje de programación Perl (Practical Extraction and Report Language), diseñado por Larry Wall en 1987 bajo licencia GNU; fue desarrollado en sus inicios para el procesamiento de texto, por lo que hoy se convierte en una herramienta de gran utilidad en el manejo de archivos de secuencias biológicas. Por su parte Bioperl corresponde a un proyecto desarrollado por la fundación de Bioinformática Libre (open-bio.org), él que es capaz de procesar resultados específicamente bioinformáticos, como por ejemplo, de programas como BLAST, EMBOSS, HMMer y ClustalW, además de vincularse eficazmente con bases de datos como GenBank y SwissProt (Stajich y cols. 2002). Su utilidad en la presente investigación radica en su habilidad para el procesamiento de grandes flujos de datos biológicos y por sobre todo, la disponibilidad de una gran cantidad de módulos especialmente elaborados para el tratamiento, búsqueda y manejo de información genómica AWK: AWK debe su nombre a las iniciales de los apellidos de sus autores: Alfred Aho, Peter Weinberger, y Brian Kernighan. Corresponde a un lenguaje de programación de alto nivel el cual fue diseñado con el fin de dar solución a problemas basados en manejo de flujo de datos, tablas y ficheros. Su principal ventaja se debe a la rapidez que otorga en la extracción de datos, mediante la directa interpretación en un entorno de consola Unix. En la presente investigación fue utilizado asociándolo a otros programas de línea de comandos como grep, wc y sort; para el rápido manejo de tablas y cuantificación de datos (Aho y cols. 1987). 23

24 3.7 Categorización funcional La categorización por función biológica permite agrupar genes bajo un contexto común, donde se clasifiquen de manera estándar, según distintas categorías y subcategorías. La categorización funcional nos permite establecer un lenguaje común para la integración, recuperación y una óptima computación de la información biológica. Para esto se han desarrollado distintos proyectos de entre los cuales figura: Gene Ontology (GO) (Harris y cols. 2004), KEGG (Okuda y cols. 2004) y KOG (Tatusov y cols. 2000) Gene Ontology: Actualmente Gene Ontology es la opción más utilizada en proyectos de anotación biológica. Los resultados son posibles de visualizar mediante un grafo acíclico dirigido (DAG) el cual posee relaciones múltiples entre padre-hijo para poder realizar análisis de enriquecimiento genéticos a través de múltiples Categorías Ontológicas (Rhee y cols. 2008; Harris y cols. 2004). A modo de ejemplo, este sistema fue utilizado en la publicación del genoma de la frutilla silvestre, Fragaria vesca (Shulaev y cols. 2011), en donde se estableció de entre un total de genes anotados, que la mayor proporción de los genes expresados en fruto pertenecían a la categoría "Función molecular" (Figura 4). Concretamente, Gene Ontology establece para la clasificación ontológica, tres ramas principales de clasificación: Función molecular, Proceso biológico y Componente celular. Estas se distribuyen mediante distintos niveles de clasificación (especificidad). La clasificación de Función Molecular (MF) describe actividades como actividad catalítica, antioxidante, regulador de enzimas, transportador, etc. A su vez estas categorías poseen también sub-categorías como por ejemplo, carrier de protones, entre otros. La clasificación de Proceso Biológico (BP) describe las metas a un nivel macro en las que el gen está involucrado, ya sea individualmente o colectivamente. Ejemplos de ello son muerte celular y respuesta a estímulos. 24

25 Finalmente, la clasificación de Componente Celular (CC), describe el lugar en donde se encuentra el producto génico, expresado en terminología de estructuras subcelulares y/o complejos macromoleculares. Por ejemplo, Componente celular Organelo Organelo intracelular Organelo intracelular no unido a membrana Cromosoma, en donde cada término es una subcategorías del término anterior. Figura 4: Mapeo y anotación funcional del genoma de F. vesca, representación ontológica de los genes expresados en fruto. Coloración dependiente de la tasa de falso descubrimiento. Radio de círculos representa el número de genes por categoría. Adaptado de: The genome of woodland strawberry (Fragaria vesca). Nature genetics 43(2):

26 4 Planteamiento del problema Dentro de los frutos no climatéricos, la frutilla silvestre o Fragaria vesca es el modelo de estudio genético debido a la simplicidad de su genoma. Este es diploide con un total 7 cromosomas, su extensión no alcanza los 240 Mpb y cuenta con aproximadamente genes anotados. Estas razones suponen ventajas sustanciales en términos investigativos al compararlo con Fragaria x ananassa, la que ostenta uno de los genomas más complejos conocidos, el cual es octoploide. Adicionalmente, Fragaria vesca posee un corto tiempo de regeneración, es de fácil propagación vegetativa y tiene un tamaño herbáceo reducido comparado con uvas o cerezas (Shulaev y cols. 2011). El objetivo de esta investigación es establecer un mapa global de regulación transcripcional, es decir, identificar los posibles genes regulados transcripcionalmente por los factores de la familia MADS-BOX en Fragaria vesca, a través de la determinación de la presencia y densidad de elementos en CIS tipo CArG-BOX dentro de las secuencias de 2Kb río arriba de cada uno de los genes anotados en este genoma. Posteriormente, los posibles genes blancos se clasificaron por función biológica con el objetivo de categorizar los procesos celulares y fisiológicos posiblemente regulados por este tipo de factores de transcripción, generando finalmente un mapa transcripcional general para los factores de transcripción tipo MADS-BOX presentes en Fragaria vesca. Debido a esto, es muy importante una correcta determinación de la secuencia de los elementos en CIS para lograr la identificación y estimación de la densidad de estos de manera óptima, en especial en organismos como este, en donde no se conocen estudios previos al respecto. 26

27 5 Hipótesis de trabajo Existe un set de genes regulados transcripcionalmente por los factores de transcripción tipo MADS-BOX que tienen relación con procesos fisiológicos relevantes para el desarrollo de Fragaria vesca. 6 Objetivo general Construir un mapa global in silico de la regulación transcripcional de los factores de transcripción tipo MADS-BOX del genoma de Fragaria vesca. 7 Objetivos específicos Se han planteado los siguientes objetivos de manera específica para poder responder a dicha hipótesis: 1. Determinar, Aislar y Crear una base de datos biológica de las regiones promotoras de los genes anotados en el genoma publicado de Fragaria vesca de su versión Recopilar las secuencias nucleotídicas representativas, comprobadas experimentalmente, de los sitios de unión CArG-Box y con ellas determinar sus sitios de unión consenso. 3. Realizar una búsqueda estadística de los elementos en CIS CArG-Box en la base de datos de secuencias promotoras de Fragaria vesca, previamente creada. 4. Validar, analizar y cuantificar los elementos en CIS del tipo CArG-Box de los putativos genes regulados por MADS-Box encontrados y categorizarlos funcionalmente. 27

28 8 Materiales y Métodos La metodología aplicada para el desarrollo de la presente memoria es representada en la Figura 5, la cual puede ser sub-dividida en cuatro partes que irán dando solución a cada uno de los objetivos específicos planteados. Figura 5 Método: Flujo metodológico seguido durante el desarrollo del presente trabajo de investigación. Cada caja del diagrama se explica con mayor profundidad en el texto. 8.1 Base de datos de regiones promotoras En la figura número 5, los bloques unidos por conectores de color rojo, indican los pasos metodológicos correspondientes al primer objetivo. Para la determinación de la región promotora se utilizaron los archivos del genoma y de la predicción de secuencias codificantes de Fragaria vesca, disponibles en la base de datos Gene de NCBI (Shulaev y cols. 2011). En vista de la carencia de información sobre el sitio de inicio de la transcripción (TSS) en la anotación utilizada, es que se decidió considerar la región de 2000 pares de bases, rio arriba, del inicio de la traducción (ATG). En la Figura 6 se ejemplifica una hebra de DNA desde donde se señalan los sitios TSS y ATG de inicio de la transcripción y de traducción, respectivamente. Además, se muestran tres elementos de respuesta clásicos situados dentro de la región promotora marcada en el rango de 2kbp, con lo que se demuestra lo que se consideró como región promotora para la presente investigación. Para relacionar la información de las secuencias codificantes y el genoma, se desarrolló un script basado en el lenguaje BioPerl (Stajich y cols. 2002) (Anexo ), tomando ventaja de sus módulos específicos para manejo de secuencias, Bio Seq y Bio SeqIO, logrando identificar y extraer las regiones promotoras. 28

29 Esto generó como resultado un archivo multi-fasta el que posteriormente, mediante la herramienta MakeBlastDB perteneciente a la suite BLAST (Altschul y cols. 1990), quedó habilitado como base de datos biológica para realizar búsquedas por homología de secuencias. Figura 6 Gráfica de región promotora: se representa la ubicación de la región promotora relativa a la orientación de la hebra de DNA. Los motivos CAAT-Box y TATA-Box sólo figuran a modo de ejemplo. 8.2 Definición de los sitios de unión a MADS-Box (CArG-Box) Con el fin de definir el elemento de unión para los miembros de la familia de factores de transcripción MADS-Box (Figura 5, bloques unidos mediante enlaces azules), es que se da paso a realizar una búsqueda en literatura y bases de datos de secuencias de unión que hayan sido reportadas mediante algún método experimental. Con dichas secuencias se realizó un alineamiento múltiple de secuencias (MSA) mediante el software MEME (Bailey & Machanick 2012) utilizando los siguientes parámetros: E-value de corte igual o menor a 1e 07, el modo de búsqueda corresponde a OOPS o del inglés una ocurrencia por secuencia, debido a que sabemos que las secuencias con las que se realizará el alineamiento contienen sólo un motivo por secuencia. También sabemos que el largo del motivo CArG-Box es relativamente constante por lo que se fijó el parámetro de longitud (-W) en un valor de 10. Finalmente se fijó el número de procesadores a utilizar a través del parámetro (-P) a 4. Para visualizar gráficamente el resultado del alineamiento, se construyó un logo de secuencia con la herramienta web WebLogo (Crooks y cols. 2004). Esto se realizó mediante parámetros por defecto. Posteriormente se contrastó dichos alineamientos contra la base de datos JASPAR (Sandelin y cols. 2004) a través de la herramienta TOMTOM (Gupta y cols. 2007). 29

30 8.3 Búsqueda sobre la base de datos de promotores de Fragaria vesca Para realizar la búsqueda de CArG-Box en la base de datos creada previamente, se utilizó el software FIMO (Grant y cols. 2011) considerando como parámetros principales: un E-value de corte de 1e 06 y un modelo de Markov de fondo de sexto orden, el cual se desarrolló mediante el toolkit FASTA-GET-MARKOV (Bailey & Elkan 1994). Esta herramienta entrena un modelo markoviano del orden indicado a partir de un set de secuencias de entrada, en este caso las secuencias corresponden al genoma de Fragaria vesca. Se tomó en consideración la documentación del software, donde se indica utilizar un orden al menos cuatro veces menor al motivo más corto que se pretende encontrar con el fin de maximizar la sensibilidad, sin caer en una búsqueda demasiado estricta, por lo que se utilizó un modelo de orden Metodología para el análisis de resultados Luego de realizada la búsqueda se dio paso al análisis de los resultados obtenidos, los cuales fueron trabajados desde un enfoque cuantitativo, entre donde se analizaron los siguientes tópicos: 1. Análisis de secuencias palíndromas 2. Media de sitios de unión entre promotores 3. Frecuencia de ubicación dentro del promotor 4. Identificación de secuencias de unión más frecuentes 5. Identificación de secuencias promiscuas 6. Anotación por homología de secuencia de los genes candidatos 7. Anotación funcional de los genes candidatos 8. Ubicación de los sitios de unión dentro de la región promotora 9. Análisis de distribución por categorías funcionales 10. Reconstrucción de posibles rutas metabólicas asociadas Los tópicos relacionados a frecuencia (2, 3, 4, 9) fueron realizados mayoritariamente mediante el software MS Excel a través de las funciones matemáticas predefinidas de manera estándar y complementos de análisis de datos (histogramas). 30

31 En el caso de los análisis de secuencias (1, 5 y 8) se realizó mediante script desarrollados en el lenguaje AWK en entorno de consola para el manejo de archivos tabulares. La anotación y funcional y por homología, además de la reconstrucción de rutas metabólicas (6, 7 y 10), fue realizada mediante los softwares BLAST y BLAST2GO, respectivamente; en donde se utilizó la base de datos no redundante (NR) con el fin de asignar una putativa función a los genes asociados a los promotores con presencia de CArG-Box. Finalmente para lo relativo a las rutas metabólicas, estas se construyeron utilizando la integración de BLAST2GO con la base de datos KEEG Análisis de secuencias palíndromas Con el fin de buscar y eliminar posibles secuencias palíndromas que pudieran estar contaminando los resultados, se desarrolló un script basado en el lenguaje BioPerl, el cual revisó secuencialmente los resultados comparando la secuencia de los sitios de unión encontrados. Este script calculó la reversa complementaria y evaluó si es que dicha secuencia se encontraba generando un doble-hit, en donde en tales casos se eliminó del conteo y la secuencia se marcó como palíndroma. Se dejó registro en aquellos casos en las tablas de resultados, anotándose por el símbolo +/- en el campo que indica la hebra. Este script está disponible como anexo en el apartado Anotación por homología contra la base de datos no redundante. Con el fin de realizar una asignación de funcionalidad por homología a los resultados obtenidos, se utilizó la base de datos No Redundante (NR), a través de una implementación local de la herramienta BLASTx de la suite BLAST. Esto se realizó utilizando como parámetros: un E-value de corte de 1e-5, además de una salida en formato XML y paralelizado en 16 procesadores Intel Core i7-3770s x64 con una frecuencia de 3.10 GHz cada uno. 31

32 8.4.3 Validación de predicción por referencia biológica. Dada la poca información experimental disponible para Fragaria vesca, se tomó la determinación de inferir la posible validez de los resultados obtenidos, aplicando la misma metodología de búsqueda de sitios de unión contra el sistema modelo Arabidopsis thaliana. Se descargó la base de datos de regiones promotoras de A. thaliana provista por TAIR10 (Lamesch y cols. 2012), la cual contiene regiones promotoras de un largo de 3000 pares de bases rio arriba desde el inicio de la traducción (ATG). Para corregir la diferencia de longitud de las regiones promotoras, se utilizó una combinación entre herramientas de consola Unix como cut, el antes mencionado AWK y el programa Fasta_formatter perteneciente al set de herramientas FASTX-ToolKit. Sobre esta base de datos se realizó la búsqueda de los sitios de unión anteriormente definidos de igual manera que se hizo en Fragaria vesca. Luego de obtenido los resultados, se compararon con experimentos ChIP-seq disponibles en la base de datos Sequence read archive (SRA) (Leinonen y cols. 2011) de NCBI. En ésta se encontró información disponible para los CArG-Box del tipo AP3, PI y SEP3. Para realizar la comparación, en primera instancia se realizó un cambio de formato, transformando mediante la herramienta Fastqdump de la suite SRAToolkit (Leinonen y cols. 2011), modificando el formato de origen SRA al formato FASTQ el que nos permite trabajar directamente con las lecturas o reads, salidas de la plataforma de secuenciación. El segundo paso, corresponde al mapeo de las lecturas en la base de datos de A. thaliana. Esto se realizó con la herramienta Bowtie2 (Langmead & Salzberg 2012) bajo parámetros de sensibilidad estándar, lo que originó un archivo en formato SAM que provee la información de coordenadas de las lecturas dentro de las regiones promotoras. Finalmente, previa transformación de ambos archivos, SAM de ChIP-seq y GFF de la búsqueda de sitios de unión originada del presente trabajo, al formato BED mediante la herramienta Sam2Bed (Li y cols. 2009), se generó la intersección entre estos archivos lo que nos indicará qué resultados de nuestra búsqueda efectivamente corresponden a un sitio de unión para alguno de los tres tipos de CArG-Box validados. 32

33 Dicha intersección se realizó mediante la utilización del software IntersectBed de la suite BEDTools (Quinlan & Hall 2010) bajo el parámetro de sobrelapamiento exacto, es decir que el 100% de la secuencia de la predicción debe mapear dentro de la lectura de ChIP-seq. También, con los resultados obtenidos sobre la base de datos de Arabidopsis thaliana, se cuantificó la localización de los sitios de unión encontrados dentro de las regiones promotoras, determinando la distribución de frecuencias de los elementos. Para realizar dicha cuantificación se utilizó el software Microsoft Excel, con el cual se subdividió la región promotora en rangos de 100 pares de bases y luego se contabilizó la cantidad de sitios de unión encontrados en dichos rangos, a través de la función COUNT.IF. Los resultados de esta cuantificación posteriormente fue comparada con la obtenida de manera similar en los resultados de Fragaria vesca, lo que se representa en la Figura 12, en la sección de resultados. 33

34 9 Resultados A continuación se muestran los resultados de la presente memoria, distribuidos dentro de cuatro tópicos principales que se relacionan directamente con el objetivo específico al cual da solución. 9.1 Base de datos biológica Fue posible desarrollar un script basado en el lenguaje de programación Perl y BioPerl, con lo que se extrajo exitosamente la putativa región promotora de 2000pb rio arriba de todos los marcos de lecturas descritos en los archivos mencionados. Dicho script se encuentra disponible como material adjunto en el anexo número Se construyó un archivo siguiendo el formato multi-fasta, en donde se alojaron las secuencias promotoras marcadas con un encabezado, como se aprecia en la figura 7, compuesto por un identificador, el cual provee información relativa al número del ORF. Luego, se señala el cromosoma al que pertenece y su ubicación relativa dentro del mismo. Figura 7 Formato de la base de datos de promotores de F. vesca. Se presenta el identificador de la región promotora, su ubicación y hebra en la que se encuentra. Seguido de la secuencia nucleotídica de 2000 bp. Para finalizar, este archivo se indexó quedando habilitado para realizar análisis y búsquedas mediante las herramientas más utilizadas como BLASTn, BLASTx, tblastx, etc. 34

35 9.2 Determinación de los motivos CArG-Box Se realizó una búsqueda en la literatura en búsqueda de los sitios de respuesta a MADS-Box, con el fin de caracterizar las secuencias de unión representativas, así definiendo un motivo en particular para cada uno de los subtipos de MADS- Box Búsqueda de secuencias El resultado de esta búsqueda definió nueve motivos de unión a DNA (CArG- Box), para nueve miembros de la familia MADS-Box, estos corresponden a: AG, AGL15, AP3, PI, FLC, SEP3, SEP4, SVP y SRF. En general todos los sitios de unión de factores de transcripción de la familia MADS-Box, en conjunto con su contraparte proteico, juegan roles importantes dentro de los procesos biológicos que sufre la planta durante su tiempo de vida, abarcando desde la formación de sus órganos, tiempos de floración y modulación transcripcional de los genes asociados al modelo ABCDE de desarrollo floral. Los sitios de unión se definen a través de un logo de secuencia que representa el patrón de unión que podría dar origen a la interacción DNA-Proteína. Los patrones son determinados a través de un alineamiento múltiple de secuencias, las cuales necesariamente fueron determinadas mediante un método experimental como ChIP-seq (Bailey & Machanick 2012). A continuación se detallan sus características principales como: Nombre, Nombres alternativos, Organismo donde fue primeramente descrito, función, posible afinidad con otros factores para formar dímeros, etc., para cada uno de los nueve factores de transcripción MADS-Box encontrados. Si bien la familia MADS-Box es de gran importancia, según lo expuesto con anterioridad, aún no se cuenta con información basada en datos experimentales sobre los sitios de unión de todos los miembros de esta familia. Es por esto que la búsqueda sólo se acotó a los CArG-Box de los cuales se encontraba su información públicamente disponible al inicio de la investigación. 35

36 AGAMOUS Nombre proteico Nombres génicos Organismo Función Multimerización Tejido específico Referencia UniProt Floral homeotic protein AGAMOUS AG, At4g18960, F13C5.130 Arabidopsis thaliana Involucrado en el control de la identidad de órganos durante el desarrollo temprano de flores. Necesario para el desarrollo de estambres y carpelos en A. thaliana. Juega un rol clave la determinación del meristema floral. Actúa como represor de los genes homeóticos de clase A como AP1, permitiendo la expresión de los de clase C. Forma heterodímeros con SEP1, SEP2, SEP3, AGL6, AGL15 y AGL16 (de Folter y cols. 2005) Meristema floral, estambres y carpelos AGAMOUS-like MADS-box protein AGL15 Nombre proteico Nombres génicos Organismo Función Multimerización Tejido específico Referencia UniProt AGAMOUS-like MADS-box protein AGL15 AGL15, At5g13790, MXE10.6 Arabidopsis thaliana Involucrado en regulación negativa en procesos de floración, a través de la ruta fotoperiódica. Represor y activador de la transcripción, uniéndose sobre motivos CArG-Box específicos que siguen la forma general 5 - C(A/T)8G-3. Participa durante etapas tempranas del desarrollo embrionario. Previene senescencia prematura del periantio y la abscisión, así como también el desarrollo de frutos y la desecación de la semilla. Genera homodímeros que a su vez interactúan con SVP, AGL24, AP1, AGL6, AG, AGL1, AGL11, AGL5, AGL16, SOC1 y AGL21. Expresado en ápices y la base del pecíolo de la hoja 36

37 APETALLA3 Nombre proteico Floral homeotic protein APETALA 3 Nombres génicos Organismo Función Multimerización Tejido específico Referencia UniProt AP3, At3g54340, T12E18_30 Arabidopsis thaliana Posible factor de transcripción involucrado en el desarrollo de flores, en la versión nativa de A. thaliana. Heterodímeros con PISTILLATA y tetrámeros con AP1 y SEP3, Pétalos y estambres durante periodos de floración FLOWERING LOCUS Nombre proteico MADS-box protein FLOWERING LOCUS (C o F) Nombres génicos Organismo Función Multimerización Tejido específico FLC, FLF, At5g10140,T31P Arabidopsis thaliana FLC parece jugar un rol central en la regulación del tiempo de floración en fenotipos de floración tardía interactuando con otros factores de transcripción como FRI, mediante las vías de floración autónomas y de vernalización (habilidad de una planta de florecer en la primavera por exposición prolongada al frio del invierno). Forma heterodímeros al menos con SVP, SEP4 Altamente expresado tanto como en el ápice vegetativo como en los tejidos de raíz. Bajamente expresado en hojas y no ha sido detectado en tejidos jóvenes no florecientes. Antes de la fertilización se expresa en óvulos con excepción de polen y estambres. Luego de la vernalización, no es posteriormente detectado en óvulos. Referencia UniProt 37

38 PISTILLATA Nombre proteico Nombres génicos Organismo Función Multimerización Tejido específico Referencia UniProt Floral homeotic protein PISTILLATA PI,At5g20240,F5O Arabidopsis thaliana Factor de transcripción involucrado en el desarrollo de flores, en particular de pétalos y estambres, en la versión nativa de la planta, de tal manera que está descrito que entre los genes homeóticos AP3 y PI son, por si solos suficientes para proveer el desarrollo de los órganos de identidad floral clase B. También PISTILLATA participa en la auto-regulación entre MADS-Box, regulando AP3 y PI. Mutaciones sobre PI causa la transformación de pétalos a sépalos y estambres a carpelos Forma heterodímeros con AP3 y SEP3. También con AP1 o SEP3 para formar complejos tetraméricos. Usualmente encontrado en pétalos y tejidos apicales SEPALLATA3 Nombre proteico Developmental protein SEPALLATA 3 Nombres génicos AGL9, SEP3, At1g24260, F3l6.19 Organismo Arabidopsis thaliana Función Factor de transcripción activo en el desarrollo de inflorescencia y organogénesis floral. Cooperativamente con SEPALLATA1 (AGL2) y SEPALLATA2 (AGL4) contribuyen al correcto desarrollo de pétalos, estambres y carpelos, así como para prevenir el crecimiento indeterminado del meristema floral. Interactúa con AP1 y AG para regular el desarrollo del meristema. Multimerización Forma heterodímeros con AG, AGL1, AGL11, AP1, PI, SEU, SHP2, TT16, AGL16. Tejido específico Se ha reportado expresión sobre estambres, pétalos y sépalos de los carpelos. Mutaciones sobre SEP1, SEP2 y SEP3 producen una flor mutante con órganos sepaloides. Referencia UniProt 38

39 SEPALLATA 4 Nombre proteico Nombres génicos Organismo Función Multimerización Tejido específico Referencia UniProt Agamous-like MADS-box protein AGL3 SEP4, AGL3, At2g03710, F19B11.16 Arabidopsis thaliana Participa directamente del desarrollo de carpelos, pétalos, sépalos y estambres; Además de la mantención de la identidad del meristema floral Forma sólo homodímeros. Expresado en todos los órganos vegetativos sobre tierra, así como en flores pero no en raíces SHORT VEGETATIVE PHASE Nombre proteico Nombres génicos Organismo Función Multimerización Tejido específico Referencia UniProt MADS-box Protein SHORT VEGETATIVE PHASE SVP, At2g22540, F14M13.6 Arabidopsis thaliana Actúa de manera represiva, inhibiendo la ruta de floración, independiente de fotoperiodo y temperatura. También SVP, en conjunto con AGL24 y AP1 controla la identidad del meristema floral y regula la expresión de los genes de clase C y E. Forma heterodímeros con AP1, SVP y AGL15. Interactúa corepresivamente con el complejo SEU-LUG, cuando se forma dímeros con AP1 Hojas jóvenes y meristema apical previo a la etapa de atornillado. 39

40 SERUM RESPONSE FACTOR Nombre proteico Nombres génicos Organismo Función Multimerización Tejido específico Referencia UniProt Serum response factor SRF Homo sapiens Este factor de transcripción define el dominio MADS-Box de unión a DNA en su forma canónica, interactuando con el motivo CArG-Box más general, 5 -CCW 6GG3. Glicoproteína requerida para la diferenciación de tejidos cardiacos y su correcta maduración. Se une formando multímeros con: MLLT7, FOXO4, NKX3A y SSRP1 Cardiaco 40

41 9.2.2 Alineamiento de secuencias y determinación de los motivos CArG-Box El alineamiento de las secuencias encontradas se realizó mediante el software MEME (Bailey & Elkan 1994; Machanick & Bailey 2011) perteneciente a la suite homónima, el cual presentó los mejores resultados comparando con alineadores globales clásicos como Clustalw (McWilliam y cols. 2013), Probcons (Do y cols. 2005) y Muscle (Edgar 2004). Los resultados del alineamiento y su e-value, calculado en relación a las secuencias de entradas se muestran a continuación, en la Tabla 2. La cantidad de secuencias ingresadas proveen al software de alineamiento la información para generar la estructura y conservación de las respectivas bases dentro del motivo. Contar con una mayor cantidad de secuencias aumenta la cantidad de información, por lo que nos permite definir de manera más fidedigna el motivo de secuencia, acercándonos de mejor manera a lo que encontraríamos en la naturaleza y por consiguiente, el resultado de la búsqueda del motivo será de mejor calidad. En cuanto a los valores de e-value de los motivos al ser tan cercanos a cero, representan una muy baja probabilidad de ser originados por azar dentro del set de secuencias que se alinearon. 41

42 Tabla 2 Sitios de unión CArG-Box, Búsqueda del motivo y Logo generado con MEME: se muestra el motivo de secuencia resultante del alineamiento en conjunto con su e-value, además de la validación contra la base de datos JASPAR a través del software TOMTOM. Los símbolos ξ, ρ y φ corresponden a e-value, p-value y q-value, respectivamente. CArG- Box N de secuencias alineadas E-value MEME Motivos de secuencia encontrados Validación TOMTOM* AG e-076 ξ 4.80e-05 ρ 7.5e - 07 φ 4.1e-05 AGL e-032 ξ 8.94e-06 ρ 1.39e-07 φ 9.32e-06 AP e-061 ξ 7.19e-06 ρ 1.12e-07 φ 4.55e-06 FLC e-048 ξ 1.21e-6 ρ 1.89e-08 φ 2.12e-06 PI e-051 ξ 8.09e-07 ρ 1.26e-08 φ 1.23e-06 SEP e-035 ξ 4,38E-010 ρ 6.8e-12 φ 7.71e-10 SEP e-088 ξ 5.79e-06 ρ 9.04e-08 φ 4.83e-06 SVP e-039 ξ 2.4e-06 ρ 3.76e-08 φ 2.25e-06 SRF e ξ 1.34e-04 ρ 2.1e-05 φ 1.6e-4 42

43 9.2.3 Validación in silico de los motivos CArG-Box encontrados Con el fin de que estos motivos encontrados representan fidedignamente lo reportado en la literatura es que se realizó su validación a través del software TOMTOM (Tabla 2) (Gupta y cols. 2007). Este recibe como entrada el archivo de salida del software MEME en formato XML y realiza una búsqueda contra distintas bases de datos de motivos de unión a DNA como JASPAR2014 y TRANSFAC. En caso de ya existir entradas en dichas bases de datos, los resultados son reportados en torno a los indicadores estadísticos previamente descritos como e-value y q-value. Efectivamente se reportaron los resultados esperados, en donde TOMTOM mostró que los motivos identificados correspondían al motivo que se pretendía alinear, en los 9 casos. En la Tabla 2 se detalla el resultado de la validación donde se nos indica tres valores de e- value, p-value y q-value, desde donde sabemos que a menores valores, de manera general, los resultados tendrán una mayor validez estadística. 9.3 Búsqueda de los motivos en los promotores de Fragaria vesca. El resultado de la búsqueda arrojó un total de hits los cuales se distribuyen entre los 9 distintos CArGs como se muestran en la Tabla 3. La búsqueda se realizó tanto en la hebra codificante como en la complementaria de cada región promotora. Los sitios de unión más abundantes encontrados corresponde a los del tipo FLC con un total de 2047 sitios de unión y por el contrario, el menos representado en Fragaria vesca corresponde a los del tipo SRF con un total de 946 sitios de unión. Por otra parte, los sitios de unión se distribuyeron de manera proporcional en cuanto a la cantidad de promotores en los que se hallaron, demostrando una relación aproximada de un (1) sitio de unión por cada promotor (Figura 8). La búsqueda se realizó de manera independiente para los nueve miembros de la familia MADS-Box aquí estudiada. Posteriormente se dio paso al análisis de coincidencias entre los sitios de unión de los distintos tipos de MADS-Box encontrados. De esta manera se determinó las secuencias de sitios de unión aptas para más de un factor de transcripción (secuencias promiscuas) las que se detallan en las Figuras 9 y

44 Los CArG-Box que se encontraron con mayor variabilidad corresponden AG, AGL15, AP3 y PI, los cuales presentan 12 secuencias cada uno. A su vez, el CArG-Box al cual se le detectó menor variabilidad de secuencias corresponde a SEPALLATA4 con 5 secuencias, seguido de SEPALLATA3 con 7 secuencias exclusivas. Si bien esta cuantificación muestra la variación entre los distintos CArG-Box en cuanto a las secuencias mediante las que fueron identificados, esto no implica que dichas secuencias pudieran o no ser comunes y/o compartidas entre ellos. Dicho análisis y cuantificación se realizó y se detalla en profundidad en el apartado Análisis de secuencias promiscuas. Tabla 3 Resultado general de búsqueda sobre base de datos de promotores: Se muestra los sitios de unión encontrados por tipo de CArG-Box, cantidad de promotores y secuencias de unión. α El total de secuencias de unión considera las secuencias promiscuas que podrían ser compartidas por más de un CArG-Box. Φ El total representa el los promotores con presencia de al menos un (1) CArG-Box en la base de datos de promotores de Fragaria vesca.. CARGS Sitios de unión Secuencias de unión distintas AG AGL AP FLC PI SEP SEP SRF SVP Total α 5828 φ Promotores secuencias CArG-Box con 44

45 9.4 Análisis y cuantificación de los resultados Promotores con presencia de sitios de unión Posterior a la búsqueda se dio comienzo al análisis cuantitativo de los resultados, donde se apreció que un total de 5828 promotores contienen sitios de unión a MADS-Box los cuales serían posiblemente regulados por esta familia de factores de transcripción. La distribución respecto a cada uno de los distintos CArGs analizados se muestra en la Figura 8, aunque no es correcto señalar como resultado la suma de aquellos promotores ya que existe una redundancia entre ellos desde el punto en que pueden contener más de un sitio de unión tipo CArG- Box por promotor. En promedio, los resultados de la búsqueda sobre los promotores de F. vesca mostraron una relación directa CArG-Box/promotor. Figura 8 Sitios de unión y promotores con presencia de CArG-Box: Se muestra la cuantificación de sitios de unión para cada uno de los tipos de CArG-Box en estudio, donde las barras de color azul indican la cantidad de sitios de unión totales encontrados y las de color naranjo indica la cantidad de promotores en los que aquellos sitios de unión fueron encontrados AG AGL15 AP3 FLC PI SEP3 SEP4 SRF SVP Sitios de unión Promotores Sitios de unión CArG-Box encontrados. Se encontró un total de secuencias que constituyen un posible motivo de unión para los nueve distintos CArG-Box aquí estudiados. La cuantificación de estos sitios de unión se muestra en la Figura Secuencias palíndromas Las secuencias palíndromas son aquellas idénticas al compararlas con su reverso complementario. Para el tratamiento de las secuencias palíndromas, se generó un script desarrollado en lenguaje Perl, con el cual se filtraron los hits 45

46 bidireccionales. Además de eliminar la duplicación, se demarcó en estos casos que el hit corresponde a un hit bidireccional, sustituyendo con el símbolo +/- en la columna que indica a qué hebra es correspondiente. Los resultados de este filtro mostraron un total de 91 casos en donde el hit estaba siendo doblemente considerado al corresponder a una secuencia palíndroma. En particular, se identificaron las siguientes secuencias: CCTAATTAGG, CCTTATAAGG y CCATATATGG; Dichas secuencias corresponden a putativos sitios de unión comunes entre AG y SRF. Por lo tanto el número de CArG-Box disminuyó de a Análisis de secuencias promiscuas Dentro de los resultados, se puede observar algunas secuencias que son afines a más de un tipo de MADS-Box, esto se debe a las posibilidades que permite el motivo de secuencia, las cuales son posibles de apreciar en los anteriores logos de secuencias. Este tema y su importancia desde una mirada biológica serán abordados con mayor profundidad en el apartado 10 Discusión. La cuantificación de los sitios de unión encontrados de manera única, es decir, contabilizando cada sitio como una ocurrencia, independiente de que este sirviera como elemento de respuesta para más de un factor de transcripción, muestra un total de 9580 CArG-Box en Fragaria vesca. Se generaron diagramas de Venn a través del servicio web de la Universidad de Pretoria Venn Diagrams (bioinformatics.psb.ugent.be/webtools/venn/) con el fin de buscar secuencias de unión promiscuas entre distintos miembros de la familia MADS-Box estudiados. Se generó un gráfico común (Figura 9) en donde se aprecia en la intersección central, cuatro secuencias comunes para FLC, PI, SVP y AP3; así también 6 secuencias comunes entre AP3 y PI, entre otras. También se pudo apreciar que todos los sitios de unión encontrados definidos como AG, AGL15 y SEP3 son únicos y por lo tanto, no son compartidos con ningún otro subtipo de MADS-Box, por lo que no se incluyeron en los diagramas de Venn. En el caso de SEP4 este sólo comparte una secuencia con FLC (Figura 10). Respecto a SRF, también este sólo comparte una secuencia (aunque distinta) con FLC (Figura 10). 46

47 Figura 9 CArG-box promiscuos entre AP3, FLC, PI y SVP. Diagrama de Venn que muestra los elementos promiscuos entre los distintos tipos de MADS box graficados, el valor de la intersección de las regiones indica la cantidad de secuencias específicas de unión compartidas (secuencias promiscuas) entre los distintos CArG-Box. Figura 10 Sitios de unión exclusivos de SEP4, SRF y FLC: Diagrama de Venn que muestra las secuencias promiscuas y exclusivas entre estos tres tipos de MADS-Box Secuencias de unión más frecuentes Dentro de los sitios de unión encontrados para cada uno de los nueve CArG- Box, se identificaron las distintas secuencias que definen aquellos sitios de unión que, dado al logo de secuencia, no son únicas, por lo que varían entre 5 y 12 versiones para cada CArG-Box. En la Figura 11 se muestran las secuencias encontradas más frecuentes en la base de datos de promotores de Fragaria vesca, desde donde se puede apreciar que la secuencia más frecuente corresponde a una del tipo SEP3 con la secuencia CTTTTTTTGG con un total de 553 apariciones. De manera paralela, en el anexo , se adjuntan gráficos circulares que muestran la proporción de las secuencias encontradas para los nueve CArG-Box estudiados. 47

Análisis y cuantificación del Riesgo

Análisis y cuantificación del Riesgo Análisis y cuantificación del Riesgo 1 Qué es el análisis del Riesgo? 2. Métodos M de Análisis de riesgos 3. Método M de Montecarlo 4. Modelo de Análisis de Riesgos 5. Qué pasos de deben seguir para el

Más detalles

Elementos requeridos para crearlos (ejemplo: el compilador)

Elementos requeridos para crearlos (ejemplo: el compilador) Generalidades A lo largo del ciclo de vida del proceso de software, los productos de software evolucionan. Desde la concepción del producto y la captura de requisitos inicial hasta la puesta en producción

Más detalles

Diseño orientado al flujo de datos

Diseño orientado al flujo de datos Diseño orientado al flujo de datos Recordemos que el diseño es una actividad que consta de una serie de pasos, en los que partiendo de la especificación del sistema (de los propios requerimientos), obtenemos

Más detalles

forma de entrenar a la nuerona en su aprendizaje.

forma de entrenar a la nuerona en su aprendizaje. Sistemas expertos e Inteligencia Artificial,Guía5 1 Facultad : Ingeniería Escuela : Computación Asignatura: Sistemas expertos e Inteligencia Artificial Tema: SISTEMAS BASADOS EN CONOCIMIENTO. Objetivo

Más detalles

Decisión: Indican puntos en que se toman decisiones: sí o no, o se verifica una actividad del flujo grama.

Decisión: Indican puntos en que se toman decisiones: sí o no, o se verifica una actividad del flujo grama. Diagrama de Flujo La presentación gráfica de un sistema es una forma ampliamente utilizada como herramienta de análisis, ya que permite identificar aspectos relevantes de una manera rápida y simple. El

Más detalles

Entender el funcionamiento de los relojes permitiría lidiar con ciertas patologías en humanos. 28 ACTUALIDAD EN I+D RIA / Vol. 41 / N.

Entender el funcionamiento de los relojes permitiría lidiar con ciertas patologías en humanos. 28 ACTUALIDAD EN I+D RIA / Vol. 41 / N. 28 ACTUALIDAD EN I+D RIA / Vol. 41 / N.º 1 Entender el funcionamiento de los relojes permitiría lidiar con ciertas patologías en humanos Abril 2015, Argentina 29 Relojes biológicos en plantas Ajustar el

Más detalles

"Diseño, construcción e implementación de modelos matemáticos para el control automatizado de inventarios

Diseño, construcción e implementación de modelos matemáticos para el control automatizado de inventarios "Diseño, construcción e implementación de modelos matemáticos para el control automatizado de inventarios Miguel Alfonso Flores Sánchez 1, Fernando Sandoya Sanchez 2 Resumen En el presente artículo se

Más detalles

ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS

ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS 1) INTRODUCCIÓN El análisis de varianza es una técnica que se puede utilizar para decidir si las medias de dos o más poblaciones son iguales. La prueba se

Más detalles

Indicaciones específicas para los análisis estadísticos.

Indicaciones específicas para los análisis estadísticos. Tutorial básico de PSPP: Vídeo 1: Describe la interfaz del programa, explicando en qué consiste la vista de datos y la vista de variables. Vídeo 2: Muestra cómo crear una base de datos, comenzando por

Más detalles

Utilizando la formulación de problemas en la preparación de expedientes regulatorios. Mónica García-Alonso Estel Consult Ltd.

Utilizando la formulación de problemas en la preparación de expedientes regulatorios. Mónica García-Alonso Estel Consult Ltd. Utilizando la formulación de problemas en la preparación de Estel Consult Ltd. Utilizando la formulación de problemas en la preparación de Bases para un expediente regulatorio de alta calidad Utilización

Más detalles

HOJA INFORMATIVA DE HORTICULTURA

HOJA INFORMATIVA DE HORTICULTURA HOJA INFORMATIVA DE HORTICULTURA COSECHA Y POST-COSECHA: Importancia y fundamentos Alejandro R. Puerta Ing. Agr. Agosto 2002 La cosecha y post - cosecha es una etapa de fundamental importancia en el proceso

Más detalles

5.- ANÁLISIS DE RIESGO

5.- ANÁLISIS DE RIESGO 5.- ANÁLISIS DE RIESGO El módulo de Análisis de Riesgo se caracteriza por desarrollar una herramienta formativa para la gestión, que permite al usuario identificar, analizar y cuantificar el riesgo de

Más detalles

ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN SALUD Construcción de una Base de Datos

ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN SALUD Construcción de una Base de Datos Descargado desde www.medwave.cl el 13 Junio 2011 por iriabeth villanueva Medwave. Año XI, No. 2, Febrero 2011. ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN SALUD Construcción de una Base de Datos Autor:

Más detalles

Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322

Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322 Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322 Nicole García Gómez 2830047-6 Diego Riquelme Adriasola 2621044-5 RESUMEN.- La minería de datos corresponde a la extracción

Más detalles

Mesa de Ayuda Interna

Mesa de Ayuda Interna Mesa de Ayuda Interna Documento de Construcción Mesa de Ayuda Interna 1 Tabla de Contenido Proceso De Mesa De Ayuda Interna... 2 Diagrama Del Proceso... 3 Modelo De Datos... 4 Entidades Del Sistema...

Más detalles

SÍNTESIS Y PERSPECTIVAS

SÍNTESIS Y PERSPECTIVAS SÍNTESIS Y PERSPECTIVAS Los invitamos a observar, a identificar problemas, pero al mismo tiempo a buscar oportunidades de mejoras en sus empresas. REVISIÓN DE CONCEPTOS. Esta es la última clase del curso.

Más detalles

ANÁLISIS DE REDES SOCIALES

ANÁLISIS DE REDES SOCIALES Máster Universitario de Investigación en Tecnologías de la Información y las Comunicaciones Universidad de Valladolid Técnicas y herramientas de apoyo a la investigación (THAI) ANÁLISIS DE REDES SOCIALES

Más detalles

Introducción. Metadatos

Introducción. Metadatos Introducción La red crece por momentos las necesidades que parecían cubiertas hace relativamente poco tiempo empiezan a quedarse obsoletas. Deben buscarse nuevas soluciones que dinamicen los sistemas de

Más detalles

K2BIM Plan de Investigación - Comparación de herramientas para la parametrización asistida de ERP Versión 1.2

K2BIM Plan de Investigación - Comparación de herramientas para la parametrización asistida de ERP Versión 1.2 K2BIM Plan de Investigación - Comparación de herramientas para la parametrización asistida de ERP Versión 1.2 Historia de revisiones Fecha VersiónDescripción Autor 08/10/2009 1.0 Creación del documento.

Más detalles

Contenidos. INFORME ENCUESTA TELEFÓNICA. Curso 2009 10

Contenidos. INFORME ENCUESTA TELEFÓNICA. Curso 2009 10 ENCUESTA DE OPINIÓN DEL ALUMNADO SOBRE LA ACTUACIÓN DOCENTE DEL PROFESORADO UNIVERSIDAD DE SEVILLA Curso 2009-2010 ENCUESTA TELEFÓNICA Contenidos Introducción.... 4 El Cuestionario... 5 El muestreo...

Más detalles

Estas visiones de la información, denominadas vistas, se pueden identificar de varias formas.

Estas visiones de la información, denominadas vistas, se pueden identificar de varias formas. El primer paso en el diseño de una base de datos es la producción del esquema conceptual. Normalmente, se construyen varios esquemas conceptuales, cada uno para representar las distintas visiones que los

Más detalles

SISTEMAS DE INFORMACIÓN II TEORÍA

SISTEMAS DE INFORMACIÓN II TEORÍA CONTENIDO: EL PROCESO DE DISEÑO DE SISTEMAS DISTRIBUIDOS MANEJANDO LOS DATOS EN LOS SISTEMAS DISTRIBUIDOS DISEÑANDO SISTEMAS PARA REDES DE ÁREA LOCAL DISEÑANDO SISTEMAS PARA ARQUITECTURAS CLIENTE/SERVIDOR

Más detalles

Metodología básica de gestión de proyectos. Octubre de 2003

Metodología básica de gestión de proyectos. Octubre de 2003 Metodología básica de gestión de proyectos Octubre de 2003 Dentro de la metodología utilizada en la gestión de proyectos el desarrollo de éstos se estructura en tres fases diferenciadas: Fase de Éjecución

Más detalles

Administración por Procesos contra Funciones

Administración por Procesos contra Funciones La administración moderna nos marca que en la actualidad, las organizaciones que no se administren bajo un enfoque de procesos eficaces y flexibles, no podrán sobrepasar los cambios en el entorno y por

Más detalles

PRODUCTIVIDAD DE PROYECTOS DE DESARROLLO DE SOFTWARE: FACTORES DETERMINANTES E INDICADORES

PRODUCTIVIDAD DE PROYECTOS DE DESARROLLO DE SOFTWARE: FACTORES DETERMINANTES E INDICADORES PRODUCTIVIDAD DE PROYECTOS DE DESARROLLO DE SOFTWARE: FACTORES DETERMINANTES E INDICADORES Raúl Palma G. y Guillermo Bustos R. Escuela de Ingeniería Industrial Universidad Católica de Valparaíso Casilla

Más detalles

GANTT, PERT y CPM. Figura 5.3: Carta GANTT 3.

GANTT, PERT y CPM. Figura 5.3: Carta GANTT 3. GANTT, PERT y CPM Características Conseguir una buena programación es un reto, no obstante es razonable y alcanzable. Ella debe tener el compromiso del equipo al completo, para lo cual se recomienda que

Más detalles

BPMN Business Process Modeling Notation

BPMN Business Process Modeling Notation BPMN (BPMN) es una notación gráfica que describe la lógica de los pasos de un proceso de Negocio. Esta notación ha sido especialmente diseñada para coordinar la secuencia de los procesos y los mensajes

Más detalles

Sesión No. 4. Contextualización INFORMÁTICA 1. Nombre: Procesador de Texto

Sesión No. 4. Contextualización INFORMÁTICA 1. Nombre: Procesador de Texto INFORMÁTICA INFORMÁTICA 1 Sesión No. 4 Nombre: Procesador de Texto Contextualización La semana anterior revisamos los comandos que ofrece Word para el formato del texto, la configuración de la página,

Más detalles

2. MÉTODOS, INSTRUMENTOS Y ESTRATEGIAS

2. MÉTODOS, INSTRUMENTOS Y ESTRATEGIAS 2. MÉTODOS, INSTRUMENTOS Y ESTRATEGIAS Objetivo específico: El alumno conocerá la importancia de la investigación en psicología industrial/organizacional, su proceso y limitaciones. Asimismo entenderá

Más detalles

CONSTRUCCIÓN DEL PROCESO MESA DE AYUDA INTERNA. BizAgi Process Modeler

CONSTRUCCIÓN DEL PROCESO MESA DE AYUDA INTERNA. BizAgi Process Modeler CONSTRUCCIÓN DEL PROCESO MESA DE AYUDA INTERNA BizAgi Process Modeler TABLA DE CONTENIDO PROCESO DE MESA DE AYUDA INTERNA... 3 1. DIAGRAMA DEL PROCESO... 4 2. MODELO DE DATOS... 5 ENTIDADES DEL SISTEMA...

Más detalles

Instituto de Biomedicina y Biotecnología de Cantabria (IBBTEC) SERVICIO DE SECUENCIACIÓN MASIVA

Instituto de Biomedicina y Biotecnología de Cantabria (IBBTEC) SERVICIO DE SECUENCIACIÓN MASIVA 1. DESCRIPCIÓN DEL SERVICIO El servicio de Secuenciación Masiva tiene como finalidad el proporcionar asesoramiento y soporte técnico a los grupos de investigación interesados en realizar proyectos de ultrasecuenciación.

Más detalles

Genómica y transcriptómica para la generación de datos en Evolución

Genómica y transcriptómica para la generación de datos en Evolución recuadro Genómica y transcriptómica para la generación de datos en Evolución Gabriela Bedó Genómica. Sus objetivos Compilar todas las secuencias de un organismo Establecer la localización de los genes

Más detalles

Unidad VI: Supervisión y Revisión del proyecto

Unidad VI: Supervisión y Revisión del proyecto Unidad VI: Supervisión y Revisión del proyecto 61. Administración de recursos La administración de recursos es el intento por determinar cuánto, dinero, esfuerzo, recursos y tiempo que tomará construir

Más detalles

Metodología de construcción de Indicadores MODELO 3

Metodología de construcción de Indicadores MODELO 3 MODELO 3 El Departamento Administrativo de la Función Pública, elaboró el documento Guía para el Diseño de un Sistema de Evaluación y Control de gestión. El contiene las instrucciones para el diligenciamiento

Más detalles

Sistemas de Gestión de Calidad. Control documental

Sistemas de Gestión de Calidad. Control documental 4 Sistemas de Gestión de Calidad. Control documental ÍNDICE: 4.1 Requisitos Generales 4.2 Requisitos de la documentación 4.2.1 Generalidades 4.2.2 Manual de la Calidad 4.2.3 Control de los documentos 4.2.4

Más detalles

Capítulo 5: METODOLOGÍA APLICABLE A LAS NORMAS NE AI

Capítulo 5: METODOLOGÍA APLICABLE A LAS NORMAS NE AI Capítulo 5: METODOLOGÍA APLICABLE A LAS NORMAS NE AI La segunda fase del NIPE corresponde con la adecuación de las intervenciones de enfermería del sistema de clasificación N.I.C. (Nursing Intervention

Más detalles

Mesa de Ayuda Interna

Mesa de Ayuda Interna Mesa de Ayuda Interna Bizagi Suite Mesa de Ayuda Interna 1 Tabla de Contenido Mesa de Ayuda Interna... 3 Elementos del proceso... 5 Apertura del Caso... 5 Inicio... 5 Abrir Caso... 5 Habilitar Cierre del

Más detalles

activuspaper Text Mining and BI Abstract

activuspaper Text Mining and BI Abstract Text Mining and BI Abstract Los recientes avances en lingüística computacional, así como la tecnología de la información en general, permiten que la inserción de datos no estructurados en una infraestructura

Más detalles

Capítulo IV. Manejo de Problemas

Capítulo IV. Manejo de Problemas Manejo de Problemas Manejo de problemas Tabla de contenido 1.- En qué consiste el manejo de problemas?...57 1.1.- Ventajas...58 1.2.- Barreras...59 2.- Actividades...59 2.1.- Control de problemas...60

Más detalles

GUIA SOBRE LOS REQUISITOS DE LA DOCUMENTACION DE ISO 9000:2000

GUIA SOBRE LOS REQUISITOS DE LA DOCUMENTACION DE ISO 9000:2000 1 INTRODUCCIÓN Dos de los objetivos más importantes en la revisión de la serie de normas ISO 9000 han sido: desarrollar un grupo simple de normas que sean igualmente aplicables a las pequeñas, a las medianas

Más detalles

Caso práctico de Cuadro de Mando con Tablas Dinámicas

Caso práctico de Cuadro de Mando con Tablas Dinámicas 1 Caso práctico de Cuadro de Mando con Tablas Dinámicas Luis Muñiz Socio Director de SisConGes & Estrategia Introducción Hay una frase célebre que nos permite decir que: Lo que no se mide no se puede controlar

Más detalles

Bases de datos biológicas

Bases de datos biológicas Dr. Eduardo A. RODRÍGUEZ TELLO CINVESTAV-Tamaulipas 28 de mayo del 2013 Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) 28 de mayo del 2013 1 / 50 1 Introducción Desventajas de las bases de datos biológicas Recuperación

Más detalles

M.T.I. Arturo López Saldiña

M.T.I. Arturo López Saldiña M.T.I. Arturo López Saldiña Hoy en día, existen diversas aproximaciones al tema de cómo hacer que las personas trabajen dentro de una organización de manera colaborativa. El problema se vuelve más difícil

Más detalles

MEDICION DEL TRABAJO

MEDICION DEL TRABAJO MEDICION DEL TRABAJO Habíamos dicho al comenzar el curso que habían 4 técnicas que permiten realizar una medición del trabajo 1 Técnicas Directas: - Estudio de tiempos con cronómetro - Muestreo del trabajo

Más detalles

Diseño de un estudio de investigación de mercados

Diseño de un estudio de investigación de mercados Diseño de un estudio de investigación de mercados En cualquier diseño de un proyecto de investigación de mercados, es necesario especificar varios elementos como las fuentes a utilizar, la metodología,

Más detalles

Funcionalidades Software PROYECTOS GotelGest.Net Software para la gestión de Proyectos GotelGest.Net

Funcionalidades Software PROYECTOS GotelGest.Net Software para la gestión de Proyectos GotelGest.Net 2012 Funcionalidades Software PROYECTOS GotelGest.Net Software para la gestión de Proyectos GotelGest.Net Servinet Sistemas y Comunicación S.L. www.softwaregestionproyectos.com Última Revisión: Febrero

Más detalles

Ingeniería del Software I Clase de Testing Funcional 2do. Cuatrimestre de 2007

Ingeniería del Software I Clase de Testing Funcional 2do. Cuatrimestre de 2007 Enunciado Se desea efectuar el testing funcional de un programa que ejecuta transferencias entre cuentas bancarias. El programa recibe como parámetros la cuenta de origen, la de cuenta de destino y el

Más detalles

CAPÍTULO IV METODOLOGÍA PARA EL CONTROL DE INVENTARIOS. En este capítulo se presenta los pasos que se siguieron para la elaboración de un sistema de

CAPÍTULO IV METODOLOGÍA PARA EL CONTROL DE INVENTARIOS. En este capítulo se presenta los pasos que se siguieron para la elaboración de un sistema de CAPÍTULO IV METODOLOGÍA PARA EL CONTROL DE INVENTARIOS En este capítulo se presenta los pasos que se siguieron para la elaboración de un sistema de inventarios para lograr un control de los productos.

Más detalles

Metodología de la Investigación. Dr. Cristian Rusu cristian.rusu@ucv.cl

Metodología de la Investigación. Dr. Cristian Rusu cristian.rusu@ucv.cl Metodología de la Investigación Dr. Cristian Rusu cristian.rusu@ucv.cl 6. Diseños de investigación 6.1. Diseños experimentales 6.1.1. Diseños preexperimentales 6.1.2. Diseños experimentales verdaderos

Más detalles

CAPÍTULO 2. MODELOS Y ESTÁNDARES DE CALIDAD DE SOFTWARE

CAPÍTULO 2. MODELOS Y ESTÁNDARES DE CALIDAD DE SOFTWARE CAPÍTULO 2. MODELOS Y ESTÁNDARES DE CALIDAD DE SOFTWARE 2.1 Ingeniería de Software Los modelos y estándares de calidad de software forman parte de la ingeniería de software. Es por eso que comenzaremos

Más detalles

ANÁLISIS DE RIESGOS EN LA GESTIÓN DE PROYECTOS. Los riesgos son eventos o condiciones inciertas que, si se producen, tienen un

ANÁLISIS DE RIESGOS EN LA GESTIÓN DE PROYECTOS. Los riesgos son eventos o condiciones inciertas que, si se producen, tienen un ANÁLISIS DE RIESGOS EN LA GESTIÓN DE PROYECTOS Los riesgos son eventos o condiciones inciertas que, si se producen, tienen un efecto positivo o negativo sobre al menos un objetivo del proyecto, como tiempo,

Más detalles

PRUEBAS, CALIDAD Y MANTENIMIENTO DEL SOFTWARE

PRUEBAS, CALIDAD Y MANTENIMIENTO DEL SOFTWARE VI PRUEBAS, CALIDAD Y MANTENIMIENTO DEL SOFTWARE 6.1 PRUEBAS DEL SOFTWARE Una vez generado el código el software debe ser probado para descubrir el máximo de errores posibles antes de su entrega al cliente.

Más detalles

de la empresa Al finalizar la unidad, el alumno:

de la empresa Al finalizar la unidad, el alumno: de la empresa Al finalizar la unidad, el alumno: Identificará el concepto de rentabilidad. Identificará cómo afecta a una empresa la rentabilidad. Evaluará la rentabilidad de una empresa, mediante la aplicación

Más detalles

La Filogenia en nuestro ADN. Las huellas filogenéticas en nuestro ADN

La Filogenia en nuestro ADN. Las huellas filogenéticas en nuestro ADN 78 Hurvitz M. Filogenia en nuestro ADN La Filogenia en nuestro ADN Las huellas filogenéticas en nuestro ADN Hipótesis o Perspectiva Teórica Marcos Hurvitz Área de Biología Molecular Instituto de Coloproctología

Más detalles

Guías _SGO. Gestione administradores, usuarios y grupos de su empresa. Sistema de Gestión Online

Guías _SGO. Gestione administradores, usuarios y grupos de su empresa. Sistema de Gestión Online Guías _SGO Gestione administradores, usuarios y grupos de su empresa Sistema de Gestión Online Índice General 1. Parámetros Generales... 4 1.1 Qué es?... 4 1.2 Consumo por Cuentas... 6 1.3 Días Feriados...

Más detalles

Nuevos paneles de PCR Real Time: El diagnóstico molecular más rápido, fiable y eficaz

Nuevos paneles de PCR Real Time: El diagnóstico molecular más rápido, fiable y eficaz IDEXX VetLab Suite IDEXX SNAP Tests Laboratorio de Referencia IDEXX Nuevos paneles de PCR Real Time: El diagnóstico molecular más rápido, fiable y eficaz Obtenga respuestas definitivas con la IDEXX RealPCR

Más detalles

Datos estadísticos. 1.3. PRESENTACIÓN DE DATOS INDIVIDUALES Y DATOS AGRUPADOS EN TABLAS Y GRÁFICOS

Datos estadísticos. 1.3. PRESENTACIÓN DE DATOS INDIVIDUALES Y DATOS AGRUPADOS EN TABLAS Y GRÁFICOS .. PRESENTACIÓN DE DATOS INDIVIDUALES Y DATOS AGRUPADOS EN TABLAS Y GRÁFICOS Ser: Describir el método de construcción del diagrama de tallo, tabla de frecuencias, histograma y polígono. Hacer: Construir

Más detalles

CAPITULO 4 JUSTIFICACION DEL ESTUDIO. En este capítulo se presenta la justificación del estudio, supuestos y limitaciones de

CAPITULO 4 JUSTIFICACION DEL ESTUDIO. En este capítulo se presenta la justificación del estudio, supuestos y limitaciones de CAPITULO 4 JUSTIFICACION DEL ESTUDIO En este capítulo se presenta la justificación del estudio, supuestos y limitaciones de estudios previos y los alcances que justifican el presente estudio. 4.1. Justificación.

Más detalles

NORMA INTERNACIONAL DE AUDITORÍA 520

NORMA INTERNACIONAL DE AUDITORÍA 520 NORMA INTERNACIONAL DE AUDITORÍA 520 PROCEDIMIENTOS ANALíTICOS (En vigor para auditorías de estados financieros por periodos que comiencen en, o después del, 15 de diciembre de 2004)* CONTENIDO Párrafo

Más detalles

CONCEPTOS DE LA FUERZA

CONCEPTOS DE LA FUERZA CONCEPTOS DE LA FUERZA PAPEL DE LA FUERZA EN EL RENDIMIENTO DEPORTIVO La mejora de la fuerza es un factor importante en todas las actividades deportivas, y en algunos casos determinantes (en el arbitraje

Más detalles

Seis Sigma. Nueva filosofía Administrativa.

Seis Sigma. Nueva filosofía Administrativa. Seis Sigma. Nueva filosofía Administrativa. GIN. Filosofía de Calidad. El Seis Sigma es un parámetro cuya base principal es la desviación estándar y su enfoque es reducir la variación y/o defectos en lo

Más detalles

PRUEBAS DE SOFTWARE TECNICAS DE PRUEBA DE SOFTWARE

PRUEBAS DE SOFTWARE TECNICAS DE PRUEBA DE SOFTWARE PRUEBAS DE SOFTWARE La prueba del software es un elemento crítico para la garantía de la calidad del software. El objetivo de la etapa de pruebas es garantizar la calidad del producto desarrollado. Además,

Más detalles

3.1 INGENIERIA DE SOFTWARE ORIENTADO A OBJETOS OOSE (IVAR JACOBSON)

3.1 INGENIERIA DE SOFTWARE ORIENTADO A OBJETOS OOSE (IVAR JACOBSON) 3.1 INGENIERIA DE SOFTWARE ORIENTADO A OBJETOS OOSE (IVAR JACOBSON) 3.1.1 Introducción Este método proporciona un soporte para el diseño creativo de productos de software, inclusive a escala industrial.

Más detalles

Metodología Orientada a Objetos Clave 43100007 Maestría en Sistemas Computacionales

Metodología Orientada a Objetos Clave 43100007 Maestría en Sistemas Computacionales Metodología Orientada a Objetos Clave 43100007 Maestría en Sistemas Computacionales Modulo 03 UML: Vista de Casos de Uso Artefacto: Actores Catedrático MSC. Jose Juan Aviña Grimaldo e-mail josejuan_avina@gmail.com

Más detalles

Área Académica: Licenciatura Sistemas Computacionales. Profesor: Lic. Virginia Arguelles Pascual

Área Académica: Licenciatura Sistemas Computacionales. Profesor: Lic. Virginia Arguelles Pascual Área Académica: Licenciatura Sistemas Computacionales Materia: Gestión de Proyectos Profesor: Lic. Virginia Arguelles Pascual Periodo: Julio-Diciembre Tema: El proceso de software y métricas del proyecto.

Más detalles

http://www.nicasoft.com.ni

http://www.nicasoft.com.ni BSC-RH es un sistema automatizado de planificación estratégica y gestión, utilizado en empresas para direccionar las actividades del negocio a la visión y estrategia de la organización. Mejora la comunicación

Más detalles

2014 Néstor A. Jiménez J. Derechos reservados. Celular 3155003650

2014 Néstor A. Jiménez J. Derechos reservados. Celular 3155003650 Diplomado Práctico en NORMAS INTERNACIONALES DE INFORMACIÓN FINANCIERA (NIIF) Tema 24: Estados financieros separados NIC 27 Estados financieros consolidados NIIF 10 Estados financieros separados y consolidados

Más detalles

Gestión de la Configuración

Gestión de la Configuración Gestión de la ÍNDICE DESCRIPCIÓN Y OBJETIVOS... 1 ESTUDIO DE VIABILIDAD DEL SISTEMA... 2 ACTIVIDAD EVS-GC 1: DEFINICIÓN DE LOS REQUISITOS DE GESTIÓN DE CONFIGURACIÓN... 2 Tarea EVS-GC 1.1: Definición de

Más detalles

Cómo sistematizar una experiencia?

Cómo sistematizar una experiencia? Cómo sistematizar una experiencia? Una sistematización puede llevarse a cabo de múltiples formas, y además puede ser llevada a cabo por cualquier persona sin necesidad de ser especialista en la materia.

Más detalles

Qué es la Estadística Ambiental?

Qué es la Estadística Ambiental? Qué es la Estadística Ambiental? La Estadística Ambiental es simplemente la aplicación de la Estadística a problemas relacionados con el ambiente. Ejemplos de las actividades que requieren del uso de estas

Más detalles

4 Teoría de diseño de Experimentos

4 Teoría de diseño de Experimentos 4 Teoría de diseño de Experimentos 4.1 Introducción En los capítulos anteriores se habló de PLC y de ruido, debido a la inquietud por saber si en una instalación eléctrica casera que cuente con el servicio

Más detalles

TransUnion República Dominicana. Preguntas frecuentes sobre los modelos de score de TransUnion

TransUnion República Dominicana. Preguntas frecuentes sobre los modelos de score de TransUnion TransUnion República Dominicana Preguntas frecuentes sobre los modelos de score de TransUnion Los modelos de score de TransUnion El siguiente es un resumen para ayudarle a entender mejor cómo se puede

Más detalles

CAPÍTULO 4. FORMA DE EVALUACIÓN CMM. 4.1 Evolución de los métodos de valoración del SEI

CAPÍTULO 4. FORMA DE EVALUACIÓN CMM. 4.1 Evolución de los métodos de valoración del SEI CAPÍTULO 4. FORMA DE EVALUACIÓN CMM Tanto para el programa ALTA como para este trabajo de tesis, es importante conocer no sólo el modelo de Capacidad de Madurez, sino la forma en que se evalúa el nivel

Más detalles

Estadística con Excel Informática 4º ESO ESTADÍSTICA CON EXCEL

Estadística con Excel Informática 4º ESO ESTADÍSTICA CON EXCEL 1. Introducción ESTADÍSTICA CO EXCEL La estadística es la rama de las matemáticas que se dedica al análisis e interpretación de series de datos, generando unos resultados que se utilizan básicamente en

Más detalles

í Í 1.1.- Justificación e Importancia del presente Trabajo de Investigación La sociedad espera que el sector productivo contribuya al desarrollo económico y al progreso, reduciendo así sus efectos ambientales

Más detalles

Las bebidas Alcohólicas

Las bebidas Alcohólicas Las bebidas Alcohólicas Hecho por: - Elisa Gutiérrez - Guillermo Rivas-plata - Rodrigo Pumares - Beatriz Sánchez 1 Índice 1- Introducción... 3 2- Objetivos... 3 3- Preguntas de la encuesta... 4 4- Encuesta...

Más detalles

TEMA 4: Introducción al Control Estadístico de Procesos

TEMA 4: Introducción al Control Estadístico de Procesos TEMA 4: Introducción al Control Estadístico de Procesos 1 Introducción 2 Base estadística del diagrama de control 3 Muestreo y agrupación de datos 4 Análisis de patrones en diagramas de control 1. Introducción

Más detalles

GUIA COMPLEMENTARIA PARA EL USUARIO DE AUTOAUDIT. Versión N 02 Fecha: 2011-Febrero Apartado: Archivos Anexos ARCHIVOS ANEXOS

GUIA COMPLEMENTARIA PARA EL USUARIO DE AUTOAUDIT. Versión N 02 Fecha: 2011-Febrero Apartado: Archivos Anexos ARCHIVOS ANEXOS ARCHIVOS ANEXOS Son los documentos, hojas de cálculo o cualquier archivo que se anexa a las carpetas, subcarpetas, hallazgos u otros formularios de papeles de trabajo. Estos archivos constituyen la evidencia

Más detalles

DISEÑO DE FUNCIONES (TRATAMIENTOS)

DISEÑO DE FUNCIONES (TRATAMIENTOS) DISEÑO DE FUNCIONES (TRATAMIENTOS) Diseño Estructurado. Estrategias para Derivar el Diagrama de Estructura. Diseño de Módulos Programables. 1. DISEÑO ESTRUCTURADO El Diseño es el proceso por el cual se

Más detalles

SIIGO Pyme. Informes de Activos Fijos. Cartilla I

SIIGO Pyme. Informes de Activos Fijos. Cartilla I SIIGO Pyme Informes de Activos Fijos Cartilla I Tabla de Contenido 1. Presentación 2. Qué son Activos Fijos? 3. Qué son Informes? 4. Qué son Informes de Activos Fijos? 5. Cuál es la Ruta para Generar Informes

Más detalles

Entidad Formadora: Plan Local De Formación Convocatoria 2010

Entidad Formadora: Plan Local De Formación Convocatoria 2010 Entidad Formadora: Enterprise Architect Comenzando Puede iniciar Enterprise Architect desde el ícono que se creó en su escritorio de Windows durante la instalación, o alternativamente: 1. Abrir el menú

Más detalles

Traducción del. Our ref:

Traducción del. Our ref: Traducción del Documento: Our ref: Secretaría del ISO/TC 176/SC 2 Fecha: 15 de octubre de 2008 A los Miembros del ISO/TC 176/SC 2 - Gestión de la Calidad y Aseguramiento de la Calidad/ Sistemas de la Calidad

Más detalles

Conciliación bancaria en CheqPAQ Cargado de estado de cuenta

Conciliación bancaria en CheqPAQ Cargado de estado de cuenta Conciliación bancaria en CheqPAQ Cargado de estado de cuenta Introducción Con la finalidad de mantenerte informado respecto a todos los cambios y mejoras de los productos de CONTPAQ i, ponemos a tu disposición

Más detalles

Control Estadístico del Proceso. Ing. Claudia Salguero Ing. Alvaro Díaz

Control Estadístico del Proceso. Ing. Claudia Salguero Ing. Alvaro Díaz Control Estadístico del Proceso Ing. Claudia Salguero Ing. Alvaro Díaz Control Estadístico del Proceso Es un conjunto de herramientas estadísticas que permiten recopilar, estudiar y analizar la información

Más detalles

Planeación del Proyecto de Software:

Planeación del Proyecto de Software: Apéndice A. Cuestionarios del Sistema Evaluador Nivel2. Requerimientos de Administración: Goal 1: Los requerimientos del sistema asociados a software están bien controlados y existe un estándar para los

Más detalles

4.1.1_Reunión de Planificación de Sprint (Sprint Planning Meeting) 4.1.2_Objetivo del Sprint (Sprint Goal) 4.1.4_Revisión de Sprint (Sprint Review)

4.1.1_Reunión de Planificación de Sprint (Sprint Planning Meeting) 4.1.2_Objetivo del Sprint (Sprint Goal) 4.1.4_Revisión de Sprint (Sprint Review) 1_Visión general de SCRUM 2_Teoría de Scrum 3_El Equipo Scrum (Scrum Team) 3.1_El Dueño de Producto (Product Owner) 3.2_El Equipo de Desarrollo (Development Team) 3.3_El Scrum Master 4_Eventos de Scrum

Más detalles

7.012 Serie de ejercicios 5

7.012 Serie de ejercicios 5 Nombre Grupo 7.012 Serie de ejercicios 5 Pregunta 1 Al estudiar los problemas de esterilidad, usted intenta aislar un hipotético gen de conejo que explique la prolífica reproducción de estos animales.

Más detalles

REPRODUCCIÓN DE LAS TABLAS DE CRECIMENTO INFANTIL QUE UTILIZAN LOS PEDIATRAS CON LOS DATOS DE LOS NIÑOS DEL COLEGIO XX

REPRODUCCIÓN DE LAS TABLAS DE CRECIMENTO INFANTIL QUE UTILIZAN LOS PEDIATRAS CON LOS DATOS DE LOS NIÑOS DEL COLEGIO XX Página 1 de 12 REPRODUCCIÓN DE LAS TABLAS DE CRECIMENTO INFANTIL QUE UTILIZAN LOS PEDIATRAS CON LOS DATOS DE LOS NIÑOS DEL COLEGIO XX Autoras: Curso: 3º ESO Escuela: Tutora: Fecha: 08 Mayo 2015 Página

Más detalles

CURSO COORDINADOR INNOVADOR

CURSO COORDINADOR INNOVADOR CURSO COORDINADOR INNOVADOR PRESENTACIÓN La tarea que el Ministerio de Educación se propone a través de Enlaces, en relación al aseguramiento del adecuado uso de los recursos, con el fin de lograr un impacto

Más detalles

PROCEDIMIENTO ESPECÍFICO. Código S-VII-01 Edición 0

PROCEDIMIENTO ESPECÍFICO. Código S-VII-01 Edición 0 Índice 1. TABLA RESUMEN... 2 2. OBJETO... 2 3. ALCANCE... 2 4. RESPONSABILIDADES... 3 5. ENTRADAS... 3 6. SALIDAS... 3 7. PROCESOS RELACIONADOS... 3 8. DIAGRAMA DE FLUJO... 4 9. DESARROLLO... 5 9.1. PLANEACIÓN...

Más detalles

CONSTRUCCIÓN DEL PROCESO ADMINISTRADOR DE PROYECTOS SEIS SIGMA Bizagi Process Modeler

CONSTRUCCIÓN DEL PROCESO ADMINISTRADOR DE PROYECTOS SEIS SIGMA Bizagi Process Modeler ADMINISTRADOR DE PROYECTOS SEIS Bizagi Process Modeler Copyright 2011 - bizagi Contenido CONSTRUCCIÓN DEL PROCESO... 1 1. DIAGRAMA DEL PROCESO... 3 Sub proceso Fase... 4 Sub proceso Crear Entregable...

Más detalles

Prestamos injustos. Efectos raciales y del origen étnico en el precio de las hipotecas subpreferenciales

Prestamos injustos. Efectos raciales y del origen étnico en el precio de las hipotecas subpreferenciales Prestamos injustos Efectos raciales y del origen étnico en el precio de las hipotecas subpreferenciales Debbie Gruenstein Bocian, Keith S. Ernst y Wei Li Centro para Prestamos Responsables (Center for

Más detalles

Curso de MS Project. Objetivo

Curso de MS Project. Objetivo Curso de MS Project El objetivo de este curso es otorgar al alumno de la formación necesaria que le permita elaborar un plan y un proyecto ayudado del programa Microsoft Project, conociendo con detalle

Más detalles

ESTIMACIÓN. puntual y por intervalo

ESTIMACIÓN. puntual y por intervalo ESTIMACIÓN puntual y por intervalo ( ) Podemos conocer el comportamiento del ser humano? Podemos usar la información contenida en la muestra para tratar de adivinar algún aspecto de la población bajo estudio

Más detalles

ISO 9001:2000 DOCUMENTO INFORMATIVO DOCUMENTO ELABORADO POR CHRISTIAN NARBARTE PARA EL IVECE

ISO 9001:2000 DOCUMENTO INFORMATIVO DOCUMENTO ELABORADO POR CHRISTIAN NARBARTE PARA EL IVECE ISO 9001:2000 DOCUMENTO INFORMATIVO DOCUMENTO ELABORADO POR CHRISTIAN NARBARTE PARA EL IVECE MARZO 2007 Este documento contesta las preguntas más frecuentes que se plantean las organizaciones que quieren

Más detalles

Introducción a la Firma Electrónica en MIDAS

Introducción a la Firma Electrónica en MIDAS Introducción a la Firma Electrónica en MIDAS Firma Digital Introducción. El Módulo para la Integración de Documentos y Acceso a los Sistemas(MIDAS) emplea la firma digital como método de aseguramiento

Más detalles

Mediante la aplicación de la metodología a los datos disponibles para este estudio, esta

Mediante la aplicación de la metodología a los datos disponibles para este estudio, esta 6 Conclusiones Mediante la aplicación de la metodología a los datos disponibles para este estudio, esta investigación aporta evidencia de la existencia de cambios en los determinantes del desempleo durante

Más detalles

GENÉTICA MENDELIANA EL GEN. El gen Mendeliano es una unidad de función, estructura, transmisión, mutación y evolución, que se distribuye ordenada y linealmente en los cromosomas. A nivel genético el gen

Más detalles

PROGRAMACIÓN ORIENTADA A OBJETOS Master de Computación. II MODELOS y HERRAMIENTAS UML. II.2 UML: Modelado de casos de uso

PROGRAMACIÓN ORIENTADA A OBJETOS Master de Computación. II MODELOS y HERRAMIENTAS UML. II.2 UML: Modelado de casos de uso PROGRAMACIÓN ORIENTADA A OBJETOS Master de Computación II MODELOS y HERRAMIENTAS UML 1 1 Modelado de casos de uso (I) Un caso de uso es una técnica de modelado usada para describir lo que debería hacer

Más detalles

Actividades para mejoras. Actividades donde se evalúa constantemente todo el proceso del proyecto para evitar errores y eficientar los procesos.

Actividades para mejoras. Actividades donde se evalúa constantemente todo el proceso del proyecto para evitar errores y eficientar los procesos. Apéndice C. Glosario A Actividades de coordinación entre grupos. Son dinámicas y canales de comunicación cuyo objetivo es facilitar el trabajo entre los distintos equipos del proyecto. Actividades integradas

Más detalles