Pablo Vinuesa 2008, 1
|
|
- Juana Toledo Escobar
- hace 6 años
- Vistas:
Transcripción
1 Genómica Evolutiva I - Inferencia Filogenética y Evolución Molecular Semestre Pablo Vinuesa (vinuesa@ccg.unam.mx) Progama de Ingeniería Genómica, CCG-UNM, México Todo el material del curso (presentaciones, lecturas, ejercicios, tutoriales, URLs...) lo encontrarás en: Tema 4: 1. Para qué sirven los modelos en ciencia 2. Modelos paramétricos vs. empíricos de evolución de secuencias 3. Parametrización de los modelos de sustitución de DN 4. Condiciones (supuestos) de aplicabilidad de los modelos Derivación del modelo de Jukes y Cantor (1969) mediante el método de momentos 7. La familia GTR(+I+G) de modelos de sustitución para secuencias nucleotídicas Protocolo básico para un análisis filogenético de secuencias moleculares Colección de secuencias homólogas BLST y FST lineamiento múltiple de secuencias Clustal, T-Coffee... nálisis evolutivo del alineamiento y selección del modelo de sustitución más ajustado Tema 4: tests de saturación, modeltest,... Estima filogenética NJ, ME, MP, ML, Bayes... Pruebas de confiabilidad de la topología inferida proporciones de bootstrap probabilidad posterior... Interpretación evolutiva y aplicación de las filogenias Para el análisis filogenético de secuencias alineadas virtualmente todos los métodos describen la evolución de las secuencias usando un modelo que consta de dos componentes: Dimensiones de un modelo: cada parámetro en un modelo estadístico puede ser concebido como la adición de una nueva dimensión, tal y como se ilustra en el ejemplo siguiente: 1. un árbol filogenético 2. una descripción de las prob. (tasas de sustitución) con las que se dan las sustituciones en lassecuenciasindividualesa lo largo de lasramasde dichoárbol Porqué necesitamos modelos y para qué sirven - Los modelos nos sirven para interpolar adecuadamente entre nuestras observaciones con el fin de poder hacer predicciones inteligentes sobre observaciones futuras 2.8m 2m 2m 2.8m 2m 2m 0 m ajuste a los datos observados producidos por una función polinomial vs. una func. lineal añadir parámetros a un modelo generalmente mejora su ajuste a los datos observados modelos infra-parametrizados conducen a un pobre ajuste a los datos observados modelos supra-parametrizados conducen a una pobre predicción de eventos futuros existen métodos estadísticos para seleccionar modelos ajustados a cada set de datos En estemodelo 1D lo más cerca que podemos llegar al pto. marcado en un espacio 3D es 2.8 m En estemodelo 2D lo más cerca que podemos llegar al pto. marcado en un espacio 3D es 2 m En estemodelo 3D podemos aproximar el punto exactamente. El modelo 3D se ajusta 100% a la realidad espacial. En el caso de modelos de sustitución nunca obtendremos un ajuste del 100% entre el modelo y la realidad. Todos los modelos son sólo aproximaciones de la realidad, pero algunos modelos son útiles para describir el proceso de sustitución (y otros mucho menos) 1
2 Dimensiones de un modelo: en realidad, los parámetros de un modelo complejo no son siempre independientes, existiendo diversos grados de colinearidad. En el peor de los casos, dos parámetros pueden ser totalmente colineares, en cuyo caso uno de ellos es 100% redundante, por lo que no aporta nada a la fuerza del modelo para explicar los datos observados En estemodelo 3D existe un nivel significativo de colinearidad entre sus dimensiones (o parámetros) uno de los objetivos primordiales de los modelos de sustitución de nt y aa es el de incorporar los parámetros más relevantes, que expliquen características fundamentales de las secuencias cuya evolución tratan de modelar de la manera más realista posible Modelos de evolución del proceso de sustitución y métodos de reconstrucción filogenética: consideraciones generales 1.- La reconstrucción o estima filogenética es un problema de inferencia estadística, y como tal requiere un modelo de sustitución de resíduos (aa o nt), es decir, un modelo de evolución molecular de las secuencias. Todos los modelos, por no ser más que aproximaciones de los procesos naturales, hacen una serie de suposiciones (simplificaciones) 2.- Los modelos de evolución de secs. son usados en filogenética para describir las probabilidades con las que se dan los distintos eventos de sustitución entre aa o nt, con el fin de corregir o compensar las sustituciones no observadas a lo largo de la filogenia 3.- Mientras que los métodos de MP asumen un modelo implícito de evolución (número mínimo de sustituciones a lo largo de la filogenia), los métodos de distancia (UPGM, NJ), los de ML y Bayesianos requieren de un modelo explícito de evolución 4.- Los métodos de distancia estiman finalmente un sólo parámetro (no.esperado sust./sitio) dado el modelo y el valor de los parámetros del mismo; en cambio, los métodos de ML y Bayesianos pueden estimar el valor de cada uno de los parámetros del modelo explicitado, dada una topología y la matriz de datos (alineamiento) Modelos de evolución del proceso de sustitución y métodos de reconstrucción filogenética: consideraciones generales Corolario: 1. El grado de confianza que tengamos en una filogenia particular realmente depende de la que tengamos en el modelo subyacente 2. Por lo tanto, siempre que usemos un método de reconstrucción basado en un modelo explícito de evolución (NJ, ML, By) es necesario usar rigurosas pruebas estadísticas para seleccionar el modelo y el valor de sus parámetros que mejor se ajusten a la matriz de datos a analizar Modelos de evolución del proceso de sustitución y métodos de reconstrucción filogenética: consideraciones generales Existen dos aproximaciones para construir modelos de evolución de secuencias. 1. Construcción de modelos empíricos basados en propiedades del proceso de sustitución calculadas a partir de comparaciones de un gran número de alineamientos. Los modelos empíricos resultan en valores fijos de los parámetros, los cuales son estimados sólo una vez, suponiéndose que son adecuados para el análisis de otros sets de datos. Esto los hace fácil de usar e implementar en términos computacionales, pero su utilidad real para cada caso particular ha de ser evaluada críticamente. Se usan principalmente en el análisis evolutivo de secs. de s (modelos BLOSUM, PM, JTT, WG...) 2. Construcción de modelos paramétricos basado en el modelado de propiedades químicas o genéticas del aas y nts. Los modelos paramétricos tienen la ventaja de que los valores de los parámetros pueden ser inferidos de cada set de datos al hacer un análisis de los mismos usando métodos de ML o By, por tanto ajustándolos a cada matriz de datos particular. Usados principalmente en el análisis de secs. de nts. 2
3 de DN Modelos de evolución del proceso de sustitución nucleotídica y métodos de reconstrucción filogenética: consideraciones generales mbos métodos resultan en modelos de procesos de Markov, definidos por matrices que contienen las tasas relativas (nos. relativos, en promedio y por u. de t.) de ocurrencia de todos los tipos posibles de sustituciones La mayoría de los modelos asume que esta matriz es reversible, es decir, que no se puede definir de antemano la direccionalidad temporal del proceso evulutivo, resultando por lo tanto en árboles no enraizados. Para definir la polaridad o dirección evolutiva se requiere información biológica externa adiconal (p. ej registro fósil o grupo externo) Transiciones (ti) Φ -C entre purinas G Φ -C Transiciones (ti) entre pirimidinas C Φ C-G Φ C-T Φ -T T ΦG-T Transversiones (tv) pur. <-> pyr. de DN Modelos de evolución del proceso de sustitución: supuestos básicos Las sustituciones (reemplazos evolutivos de los estados de caracter) se describen como el el resultado de mutaciones al azar. Su aparición en cada posición de una secuencia a lo largo del tiempo es modelado por un proceso de Markov. La probabilidad de intercambio de un estado de caracter por otro viene modelada en esencia por una distribución de Poisson (de eventos raros) Proceso Markoviano: es un modelo matemático de eventos raros de cambios en estados (discretos o de caracter) a lo largo del tiempo, en el que los eventos futuros suceden por azar y dependen únicamente del estado actual, y no de la historia que llevó a dicho estado. En filogenética, los estados del proceso son los aas o nts presentes en una posición particular de una secuencia (estados de caracter) en un tiempo dado; los cambios de estado representan las mutaciones en dichas secuencias de DN Modelos de evolución del proceso de sustitución: el modelo markoviano de DN Modelos de evolución del proceso de sustitución: distribuciones de probabil. Unadistribución de probabilidad describe la frecuencia con la que ocurre cada evento. En filogenética y evolución molecular las distribuciones binomiales y de Poisson son las más frecuentemente empleadas contece una sustitución que cambia por G El linaje comienza G con en un sitio particular 0 t para predecir qué base ocupará el sitio después de un tiempo t sólo necesitamos conocer qué base lo ocupó en el tiempo 0 (G en este caso). El hecho que lo ocupó anteriormente es irrelevante en un modelo de Markov Los modelos filogenéticos de sustitución asumen un modelo de Markov homogéneo, es decir, que las probabilidades de sustitución no varían en diferentes partes del árbol La distribución binomial modela un proceso que sólo puede tener 2 resultados, el éxito o el fracaso, con probabilidades p y q de acontecer, respectivamente (p + q = 1). La distribución binomial da la probabilidad de obtener exactamente k éxitos en n repeticiones, que se calculan mediante la siguiente expresión: P(k) = (n repeticones) p k (1-p) n-k con media µ=np, y varianza V = npq La distribución de Poisson se emplea cuando la probabilidad de éxito (p ) es muy pequeña incluso cuando n es muy grande. Se define λ como el número esperado sucesos exitosos en un proceso de n repeticiones, es decir λ = np. Entonces, la probabilidad de observar k éxitos (eventos) viene dada por la distribución de Poisson como: P(k) = λ k e -λ k! con media x = λ, y varianza V = λ 3
4 de DN Modelos de sustitución de nucleótidos El modelado del proceso de sustitución nucleotídica se ha concentrado en la aproximación paramétrica. Se manejan tres tipos principales de parámetros en estos modelos: 1. parámetros de frecuencia 2. parámetros de tasas de intercambio 3. parámetros de heterogeneidad de tasas de sustitución entre sitios Modelos de evolución de sustitución de nucleótidos -modelos paramétricos Los parámetros de frecuencia describen las frecuencias de las bases (, C, G, T) promediadas sobre todas las posiciones y a lo largo del árbol. Estos parámetros representan constricciones a las sustituciones posibles debido a causas tales como el contenido de GC del genoma. Funcionan como factores de ponderación en el modelo al hacer unas sustituciones más probables que otras. Se trata de frecuencias relativas (sumatoria = 1). Los parámetros de tasa (de intercambiabilidad) describen las tendencias relativas de las bases de ser sustituídas unas por otras (hasta 6 parámetros que representan las tasas de sustitución relativas entre <->C, <->G, <->T, C<->G, C<->T y G<->T (esta última generalmente es definida como = 1). Generalmente a las ti se les asigna una tasa, κ, relativa a unatasade 1 paralastv, siendo generalmente κ >> 1 La aproximación más utilizada para modelar la heterogeneidad de tasas entre sitios es la de describir la tasa de sustitución de cada posición como una muestra aleatoria de una distribución GMM. El uso de esta distribución para modelar la heterogeneidad de tasas entre sitios representa un factor muy significativo para incrementar el ajuste entre los modelos y los datos. Esta distribución gamma se emplea en conjunción con los parámetros de frecuencia y tasa, describiéndose el modelo resultante como sufijo+g ó sufijo+τ (por ejemplo, TrN+G ó K2P+Τ) Modelos de evolución de sustitución de nucleótidos -modelos paramétricos los diversos modelos evolutivos se distinguen por su grado de parametrización I. Frecuencias de nt : π = πc = πg = πt = 0.25 ó π πc πg πt modelos de = frecuencia: JC69; K2P, K3P... modelos de frecuencia: F81, F84, HKY85, TrN93, GTR... II. Tasas de sustitución transicionales/transversionales Φ -G Φ -C ti (pur) G ti (pir) Φ -C C Φ C-G tv Φ C-T Φ -T T ΦG-T Existen 4 tipos de sustituciones ti y 8 tv; cuando ti/tv 0.5 existe un sesgo en sustituciones ti (o tv) en el set de datos. ti generalmente >> 1 los modelos evolutivos se diferencian también en la cantidad de parámetros que utilizan para acomodar diversas tasas de sustitución: tasas modelo 1 JC69 (ti=tv) 2 K2P, F84 (ti tv) 3 TrN ó K3P (2 ti, 1 tv) 6 GTR (cada sust. su tasa) Jukes-Cantor 1969 (JC69) igual frecuencia de bases: π = π C =π G = π T todas las sustituciones tienen igual tasa =β acomodan sesgo ti/tv Kimura 2 parameters (K2P) igual frec. de bases: π = π C =π G = π T distintas tasas de sustitución ti y tv; β acomodan frec. bases acomodan distintas frecuencias de bases Felsenstein 1981 (F81) distinta frec. de bases: π π C π G π T igual tasa de sustitución ti y tv; =β acomodan sesgo tasas sust. ti/tv distintas frecs. bases: π πc πg πt distintas tasas de sust. ti and tv; β Hasegawa-Kishino-Yano (HKY85), 2 tasas y Felsenstein 1984 (F84) o Tamura-Nei 1993 (TN93), 3 tasas o Modelo general tiempo reversible (GTR), 6 tasas 4
5 Subconjunto de modelos anidados la familia GTR o REV 1 parámetro () Modelos de evolución de sustitución de nucleótidos -modelos paramétricos Condiciones de aplicabilidad de los modelos (supuestos) Incremento en el número de parámetros modelos más generales 11 parámetros libres a estimar π, πc, πg a, b, c, d, e µ, Ι, Τ En total existen 203 modelos posibles en la familia GTR al combinar params. de frec., tasa, G e I La mayoría de ellos carecen de nombre 1.- Supuesto de independencia: las mutaciones en un sito no afectan a otros en la secuencia. Violado por ej. en el caso de rrns suelen seleccionarse mutaciones compensatorias (evolución covarariada entre sitios) 2.- Supuesto de homogeneidad de tasas de sustitución a lo largo del tiempo y entre linajes: en este supuesto se basa el reloj molecular y de su cumplimiento depende la posibilidad de poder utilizar un reloj molecular para datar clados 3.- Las frecuencias de nucleótidos son homogéneas entre linajes: este supuesto es frecuentemente violado cuando usamos secuencias de linajes muy distantes, particularmente en procariontes, ya que los contenidos de G+C de distintos grupos microbianos varía mucho, del 22 % (Wigglesworthia, gamma-proteobacteria ) al 75 % (naeromyxobacter, delta-proteobacteria) 4.- Las probabilidades de sustitución son las mismas para cada sitio: este supuesto es violado casi sin excepción. sí por ejemplo, las 3as. pos. de los codones acumulan mutaciones mucho más rápidadmente que la 2a y 1a. Los distintos dominios de una proteína o rrn también evolucionan con tasas distintas. Distribución Gamma (Γ) Condiciones de aplicabilidad de los modelos (supuestos) Condiciones de aplicabilidad de los modelos (supuestos) comodo de la heterogeneidad de tasas de sustitución entre sitios 1.- Supuesto de independencia y modelos de covarión: las mutaciones en un sito no afectan a otros en la secuencia. En el caso de rrns suelen seleccionarse mutaciones compensatorias (covariación de sitios). Existen modelos que acomodan este hecho. (I) acomoda las posiciones invariables (proporción de sitios invariantes) (Γ) acomoda la heterogeneidad de tasas de sust. entre las posiciones variables Substitution freq./site Heterogeneidad de tasas de sust. a lo largo de un aln. múltiple de 29 secuencias de rrs de bacterias del género Bradyrhizobium posición en el alineamiento de secs. rrs 5
6 Condiciones de aplicabilidad de los modelos (supuestos) 2.- Distribución gamma y heterogeneidad de tasas de sust. entre sitios: Para modelar con cierto realismo el proceso de sustitución es esencial acomodar adecuadamente la heterogeneidad de tasas de sustitución entre sitios de un alineamiento Para ello se asume generalmente una distribución Pdf(r) = r - 1 /exp(r) Γ() gamma (Γ) de las tasas y que cada sitio tiene una Diversas formas de la distribución tasa tomada aleatoriamente de dicha distribución, gamma (Γ) para un rango de valores del parámetro = 1/CV 2, donde e independientemente de los demás sitios. El CV = coef. de var. de las tasas. parámetro controla la forma de la distribución. sí para CV = 0.3, = 1/0.09 = Para > 1 la distribución tiene forma de campana y modela un nivel bajo de heterogeneidad. Para < 1 la distribución toma forma de L invertida, describiendo una situación de fuerte heterog. de tasas de sust. entre sitios. Para calcular el valor de se emplea generalmente una distribución Γ discreta con un número c finito de tasas des sust. equi-probables (q 1, q 2..., q c ). El uso de 4 a 8 categorías discretas permite obtener una buena aprox. de la distrib. contínua. Las distancias evolutivas se definen como el número esperado de sustituciones/sitio (se habla de sust. y no de mutaciones, ya que en filogenia se consideran las mutaciones fijadas por deriva o selección en los distintos linajes). 2 hrs Estacionamiento antes de ir a clases (t 0 ) Estacionamiento al regresar de la clase (t 1 ) Estimar distancias evolutivas es un problema similar al de estimar cuantos automóviles se han re-emplazdo en un estacionamiento durante un intervalo de tiempo La pregunta que nos hacemos es: Cuántos carros en las distintas posiciones del estacionamiento han cambiado de color No lo podemos saber con seguridad. Sólo podemos hacer una estima en base a los datos observados al regresar al estacionamiento (carros en sitios 1 y 6 han cambiado de color) Esto es muy similar al problema de estimar el no. de sust. que han acontecido entre dos secuencias Los modelos de sustitución empleados para hacer reconstrucciones filogenéticas mediante métodos de distancia o de máxima verosimilitud tienen La distancia evolutiva más sencilla es la basada en el modelo de Jukes y Cantor (JC69) - asume que todas las sustituciones ocurren con la misma tasa B la propiedad de reversibilidad temporal, lo que quiere decir que la probabilidad de cambio es - asume que los nts tienen la misma frecuencia 0.25 t t independiente del lugar donde esté la raíz. X Ello es muy conveniente, ya que permite trabajar: 1) con árboles no enraizados y 2) con caracteres no ordenados G El único parámetro del modelo JC69 es (tasa de sustitución instantánea) 2t B sí la línea que conecta a y B puede ser consideradacomola únicaramade un árbolno en- C T raizado que contiene sólo estos dos nodos 6
7 La tasa de sustitución ha de ser multiplicada por un intervalo de tiempo para poder obtener el no. de sustituciones acontecidas en dicho intervalo. Dado que tenemos que estimar la tasa, nunca podemos saber con exactitud el no. de sust. que han ocurrido entre 2 secuencias. De ahí que se habla del no. esperado de sustituciones, que a su vez es dependiente del modelo empleado para hacer la inferencia Si contamos con una estima de la tasa de sustitución y conocemos el intervalo de tiempo (t ), entonces podemos obtener la distancia evolutiva simplemente multiplicando la tasa x tiempo Los diversos modelos de la familia GTR se definen mediante la especificación de la matriz de sustitución instantánea Gráficade la función de probabilidad de transición (de la presencia de ) en función del tiempo P (t) comenzando con - la curva superior asume que partimos de ocupando una posición particular en el momento 0. Con el tiempo la probabilidad de continuar viendo una en ese sitio decae, ya que su tasa de sustitución a otro resíduo es (y de quedar igual es -3). estado hacia P (t) comenzando con C, G o T - partir de las tasas instantáneas de transic. podemos por tanto calcular la probabilidad de estado de matriz de sustitución instantánea para el modelo JC69 que podamos observar en un sitio particular después de un tiempo t Probabilidad de transición (de la presencia de ) en función del tiempo t 0 -Las probabilidades de transición son probabilidades condicionales: representan la probabilidad de observar un estado de caracter particular s j en el instante t, condicionado a que el proceso estuvo en el estado s i en el instante 0 (t 0 ) matriz de sustitución instantánea para el modelo JC69 estado hacia -3 t 1 C G T P (t) comenzando con P (t) comenzando con C, G o T - la curva inferior asume que partimos de un estado diferente a (C, G, T). Con el tiempo la probabilidad de observar una en ese sitio aumenta, y la tasa a la que la base actual mutará a es ) estado de t C G T - la frecuencia relativa de equilibrio de es 0.25 cuando el proceso estocástico ha alcanzado la estacionariedad: la distribución de frecuencias de los estados no varía más con el tiempo C G T 7
8 Estima de la distancia JC69 a partir de la matriz instantánea de sustitución matriz de tasas de sustitución instantánea para el modelo JC69 estado hacia - Por ello podemos calcular el no. esperado de sustituciones entre 2 bases ( -> C) por dt como: ε ( -> C por dt ) = ¼ dt d = (12) (¼)t = 3t Cómo podemos estimar el valor del parámetro t para calcular la distancia evolutiva d estado de - Hay 16 celdas, 12 de las cuales representan sustituciones (cambios de estado) tomemos como ej. la sust. -> C - Por definicion sólo pueden existir 1 ó 0 sustituciones por dt - esta expresión representa la probabilidad condicional de cambio a C en un instante de t (dt ) partiendo del estado - para estimar el numero esperado de dichas sust. en un intervalo dado de t simplemente integramos la expresión entre 0 y t ε ( -> C por t ) = - contabilizando las 12 vías de sustitución posibles obtenemos: d = (12) (¼)t = 3t En estadística existen tres aproximaciones básicas para obtener estimadores: 1.- El método de los mínimos cuadrados 2.- el método de máxima verosimilitud 3.- el método de momentos d = (12) (¼)t = 3t Usodel método de momentos para la estima de t El método de momentos se basa en la obtención de una expresión que iguala un valor observable con su valor esperado, donde este último viene expresado en función de un parámetro(s) de interés (t en nuestro caso) Usando la analogía del estacionamiento, en la que teníamos 2 observaciones, tratamos de estimar la tasa con la que los carros cambian de color en cada sitio del estacionamiento Bajo el modelo JC69, expresado en función de la proporción de diferencias p observadas entre dos secuencias, la distancia evolutiva entre ellas viene dada por: d = 3t = - inferencia de t mediante el método de momentos Modelos de evolución del proceso de sustitución: distribuciones de probabil. La distribución de Poisson se emplea cuando la probabilidad de éxito (p ) es muy pequeña y n es muy grande. Se define λ como el número esperado sucesos exitosos en un proceso de n repeticiones, es decir λ = np. Entonces, la probabilidad de observar k éxitos (eventos) viene dada por la distribución de Poisson como: Procesos de Poisson P(k) = λ k e -λ k! - Ej. Cálculo de la probabilidad de observar exactamente 1 accidente por semana en la glorieta de Zapata dados los siguientes valores de los parámetros: para p = µ = 0.2 accidentes/día (tasa de accidentes) y t = 7d, entonces el número esperado de accidentes por semana es: λ = np λ = 0.2 x 7 = 1.4 Por lo tanto, la probabilidad de observar exactamente 1 accidente por semana se calcula así: Pr(1 evento λ = 1.4) = (1.4) 1 e -1.4 = ! con media x= λ, y varianza V = λ 8
9 - inferencia de t mediante el método de momentos modelo de Markov y transiciones*: disrupciones vs. sustituciones - inferencia de t mediante el método de momentos modelo de Markov y cálculo de probabilidades de transición: disrupciones vs. sustituciones l acontecer una disrupción cualquier base puede aparecer en la posición afectada T C G Si la base reemplazante es a la original acontece una sustitución Distribución de Poisson P(k) = λ k e -λ k! Pr(0 eventos λ) = (λ) 0 e -λ = e -λ 0! C G T t Si las bases presentan la misma frecuencia (=0.25), entonces la tasa a la que acontece una sustitución particular será ¼ (tasa de disrupción ) Pr(al menos 1 evento λ) = 1 - e -λ *quí el término de transición se emplea en el contexto estadístico (no genético), aludiendo a un cambio de estado discreto (pueden ser ti o tv en el caso de mutaciones en el DN) - inferencia de t mediante el método de momentos - inferencia de t mediante el método de momentos Cálculo de la probabilidad de que la posición actualmente ocupada por vaya a ser sustituída por G en un lapso t cuando la tasa de esta sustitución particular es : Pr(cero disrupciones) = e -µt P G (t ) = 0.25 (1 - e -4 4t ) - esta fórmula da la probabilidad de observar un tipo particular de sustitución a lo largo de un intervalo arbitrario de tiempo (t ), la probabilidad de transición d = Pr(al menos 1 disrupción) = 1 - e -µt Pr(última disrupc. resulte en G) = 0.25 Pr(termina en G inicia en ) P G (t ) = 0.25 (1 - e -µt ) Nota: la tasa para cualquier tipo de sustitución = 0.25 µ (donde µ es la tasa de disrupción ) t -la probabilidad de transición representa una extrapolación de la matriz de sustitución instantánea a tiempos arbitrarios (no infinitesimales). La matriz completa de transiciones de un modelo evolutivo se obtiene computacionalmente en un solo paso usando álgebra matricial - la clave a recordar aquí es que la la matriz de sustitución instantánea contiene toda la información necesaria para especificar todas las probabilidades de transición. De igual modo, si tenemos la matriz de transición, podemos obtener la de sust. instantáneas. por lo tanto, si = 1/4 µ, 4 = µ y P G (t ) = 0.25 (1 - e -4 4t ) - de hecho lo que obtenemos del análisis comparativo de secuencias (o de la analogía del reemplazo de coches en un estacionamiento) son las probabilidades de transición. El valor p representa los resultados (proporción observada) de comparar dos secuencias ( o de contabilizar el no. de carros que han cambiado de color en nuestro estacionamiento después de 2 hrs.) 9
10 - inferencia de t mediante el método de momentos P G (t ) = 0.25 (1 - e -4t ) d = Para modelos sencillos como el de JC69 la probabilidad de transición podemos transformarla en una distancia evolutiva reuniendo los 12 tipos posibles de sustituciones en una sola expresión: p = (12) (¼) { (¼) (1-e -4at ) } = ¾ (1-e -4at ) (I) Tenemos dos términos de ¼ ya que tenemos que contabilizar la freq. con la que está la base en la secuencia 1 así como la probabilidad de cambiar de dicho estado al observado en la secuencia 2 Recordando que: ε ( -> C por t ) = - y contabilizando las 12 vías de sustitución posibles obtenemos: d = (12) (¼)t = 3t (II) - podemos llegar fácilmente a la forma explícita de la distancia de JC69 d = usando (I) y un poco de álgebra Jukes-Cantor (JC69) igual frecuencia de bases: π = π C =π G = π T todas las sustituciones tienen igual tasa =β acomodan sesgo ti/tv Kimura 2 parameter (K2P) igual frec. de bases: π = π C =π G = π T distintas tasas de sustitución ti y tv; β acomodan frec. bases distintas frecs. bases: π πc πg πt distintas tasas de sust. ti and tv; β acomodan distintas frecuencias de bases acomodan sesgo tasas sust. ti/tv Hasegawa-Kishino-Yano (HKY85), y Felsenstein 84 (F84) 2 tasas o Tamura-Nei 1993 (TN93), 3 tasas o General time reversible (GTR), 6 tasas Felsenstein (F81) distinta frec. de bases: π π C π G π T igual tasa de sustitución ti y tv; =β Matriz de tasas de sustitución instantáneas del modelo GTR 9 parámetros π π C π G a b c d e µ El método de momentos es de utilidad limitada en estadística (y filogenética) ya que no permite obtener una fórmula explícita para calcular la distancia entre secuencias usando modelos más complejos como el HKY85 o GTR La fórmula explícita de distancia para el modelo K2P es: d -µ (π c + π C e + π G f ) El modelo GTR es idéntico al de JC69 si a = b = c = d = e = f = 1 y todas las bases se asumen que tienen igual frecuencia (¼) -este modelo tiene 2 parámetros, P y Q (proporción de ti y tv en que difieren 2 secuencias, donde p = P + Q µ = tasa del proceso generador de todos los tipos de sustituciones a,... e = modificadores de tasa relativa de cada tipo particular de sustitución π = frecuencia de cada nt 10
11 Comparación de los modelos de JC69 y K2P en su capacidad de corregir distancias observadas (p ) entre pares de secuencias según su grado de divergencia Comparación de los modelos de JC69 y K2P en su capacidad de corregir distancias observadas (p ) entre pares de secuencias según su grado de divergencia d JC69 = vs. d K2P d JC69 = vs. d K2P EscenarioI: Escenario II: - sean 2 secs. de long. = 200 nt, que difieren en 20 ti y 4 tv por lo tanto L = 200, P = 20/200 = 0.1 y Q = 4/200 = sean 2 secs. de long. = 200 nt, que difieren en 50 ti y 16 tv por lo tanto L = 200, P = 50/200 = 0.25 y Q = 16/200 = 0.08 p = 24/200 = 0.12 d JC (sust./sitio) d K2P 0.13 (sust./sitio) p = 66/200 = 0.33 d JC (sust./sitio) d K2P 0.48 (sust./sitio) no. de sust. esperadas = 0.13 X no. de sust. esperadas = 0.13 X no. de sust. esperadas = 0.43 X no. de sust. esperadas = 0.48 X no. de diferencias en bases No. de sust. de nt entre pares de secs. de mtdn de bóvidos (684 pb gen COII ) contra el tiempo estimado de divergencia. Nótese la relación no lineal entre estos parámetros, lo que denota fenómenos de saturación (homoplasias) El objetivo de los modelos de sustitución es el de compensar para los eventos homoplásicos de múltiples sustituciones, y así obtener estimas de distancias evolutivas corregidas tiempo de divergencia (My de a) Seis tipos de sustituciónes. El nt ancestral en cada caso era. En todos los casos excepto (a) el no. de sust. observado es < que las que sucedieron en el transcurso de la e- volución de las secs. En los casos (d-f) los nt observados son =, pero esta similitud entre linajes no fue heredada directamente de la secuencia ancestral por las dos secs. descendientes y por lo tanto son homoplasias El númerode ti es generalmente > que el de tv, fenómeno que se acentúa cuanto mayor es la divergencia entre las secuencias a comparar. De ahí que en nuestro ejemplo las diferencias entre los escenarios I y II sólo se hicieron notar en el caso en el que la divergencia entre las secuencias era mayor (escenario II) 11
JUEGO DE BASKETBALL. Repaso de Distribuciones de Probabilidad Discretas y Continuas
JUEGO DE BASKETBALL Repaso de Distribuciones de Probabilidad Discretas y Continuas PREGUNTA #1 Qué es una variable aleatoria uniforme discreta? Cómo es su distribución? Qué es una variable aleatoria uniforme
Procesos estocásticos. Definición
Procesos estocásticos Definición http://humberto-r-alvarez-a.webs.com Definición de proceso estocástico Estudio del comportamiento de una variable aleatoria a lo largo del tiempo El ajuste de cualquier
Tema 5 Algunas distribuciones importantes
Algunas distribuciones importantes 1 Modelo Bernoulli Distribución Bernoulli Se llama experimento de Bernoulli a un experimento con las siguientes características: 1. Se realiza un experimento con dos
INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016
ANEXO ESTADÍSTICO 1 : COEFICIENTES DE VARIACIÓN Y ERROR ASOCIADO AL ESTIMADOR ENCUESTA NACIONAL DE EMPLEO (ENE) INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 9 de Abril de 016 1 Este anexo estadístico es una
Unidad Temática 3: Probabilidad y Variables Aleatorias
Unidad Temática 3: Probabilidad y Variables Aleatorias 1) Qué entiende por probabilidad? Cómo lo relaciona con los Sistemas de Comunicaciones? Probabilidad - Definiciones Experimento aleatorio: Un experimento
Algunas Distribuciones Continuas de Probabilidad. UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides
Algunas Distribuciones Continuas de Probabilidad UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides Introducción El comportamiento de una variable aleatoria queda
Estadística Aplicada
Estadística Aplicada Distribuciones de Probabilidad Variables aleatorias Toman un valor numérico para cada resultado de un espacio muestral Discretas. Sus valores posibles constituyen un conjunto discreto.
Prof. Eliana Guzmán U. Semestre A-2015
Unidad III. Variables aleatorias Prof. Eliana Guzmán U. Semestre A-2015 Variable Aleatoria Concepto: es una función que asigna un número real, a cada elemento del espacio muestral. Solo los experimentos
El Algoritmo E-M. José Antonio Camarena Ibarrola
El Algoritmo E-M José Antonio Camarena Ibarrola Introducción Método para encontrar una estimación de máima verosimilitud para un parámetro ѳ de una distribución Ejemplo simple 24 Si tiene las temperaturas
Modelos de probabilidad. Modelos de probabilidad. Modelos de probabilidad. Proceso de Bernoulli. Objetivos del tema:
Modelos de probabilidad Modelos de probabilidad Distribución de Bernoulli Distribución Binomial Distribución de Poisson Distribución Exponencial Objetivos del tema: Al final del tema el alumno será capaz
Teorema Central del Límite (1)
Teorema Central del Límite (1) Definición. Cualquier cantidad calculada a partir de las observaciones de una muestra se llama estadístico. La distribución de los valores que puede tomar un estadístico
Concepto de Probabilidad
Concepto de Probabilidad Prof. Miguel Hesiquio Garduño. Est. Mirla Benavides Rojas Depto. De Ingeniería Química Petrolera ESIQIE-IPN hesiquiogm@yahoo.com.mx mbenavidesr5@gmail.com PROBABILIDAD En cualquier
Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos
Agro 6998 Conferencia Introducción a los modelos estadísticos mixtos Los modelos estadísticos permiten modelar la respuesta de un estudio experimental u observacional en función de factores (tratamientos,
Unidad IV: Distribuciones muestrales
Unidad IV: Distribuciones muestrales 4.1 Función de probabilidad En teoría de la probabilidad, una función de probabilidad (también denominada función de masa de probabilidad) es una función que asocia
PROBABILIDAD Y ESTADÍSTICA
FACULTAD DE INGENIERÍA U N A M PROBABILIDAD Y ESTADÍSTICA Irene Patricia Valdez y Alfaro irenev@unam.mx T E M A S DEL CURSO 1. Análisis Estadístico de datos muestrales. 2. Fundamentos de la Teoría de la
Modelos Estocásticos I Tercer Examen Parcial Respuestas
Modelos Estocásticos I Tercer Examen Parcial Respuestas. a Cuál es la diferencia entre un estado recurrente positivo y uno recurrente nulo? Cómo se define el período de un estado? Demuestre que si el estado
TEMA 3. Algunos modelos de probabilidad de tipo discreto. 3.1 Al finalizar el tema el alumno debe conocer...
TEMA 3. Algunos modelos de probabilidad de tipo discreto En este capítulo se abordan «familias» muy específicas de probabilidad, que con cierta frecuencia se nos presentan en el mundo real. Van a ser distribuciones
Determinación del tamaño de muestra (para una sola muestra)
STATGRAPHICS Rev. 4/5/007 Determinación del tamaño de muestra (para una sola muestra) Este procedimiento determina un tamaño de muestra adecuado para la estimación o la prueba de hipótesis con respecto
CAPÍTULO 4 TÉCNICA PERT
54 CAPÍTULO 4 TÉCNICA PERT Como ya se mencionó en capítulos anteriores, la técnica CPM considera las duraciones de las actividades como determinísticas, esto es, hay el supuesto de que se realizarán con
SESION 12 LA DISTRIBUCIÓN BINOMIAL
SESION LA DISTRIBUCIÓN BINOMIAL I. CONTENIDOS:. La distribución omial.. Variables aleatorias en una distribución omial. 3. Descripciones de la distribución omial. 4. Distribución de Poisson. II. OBJETIVOS:
1. La Distribución Normal
1. La Distribución Normal Los espacios muestrales continuos y las variables aleatorias continuas se presentan siempre que se manejan cantidades que se miden en una escala continua; por ejemplo, cuando
INDICE. Prólogo a la Segunda Edición
INDICE Prólogo a la Segunda Edición XV Prefacio XVI Capitulo 1. Análisis de datos de Negocios 1 1.1. Definición de estadística de negocios 1 1.2. Estadística descriptiva r inferencia estadística 1 1.3.
Objetivos. 1. Variable Aleatoria y Función de Probabilidad. Tema 4: Variables aleatorias discretas Denición de Variable aleatoria
Tema 4: Variables aleatorias discretas Objetivos Dominar el uso de las funciones asociadas a una variable aleatoria discreta para calcular probabilidades. Conocer el signicado y saber calcular la esperanza
Tema 9: Contraste de hipótesis.
Estadística 84 Tema 9: Contraste de hipótesis. 9.1 Introducción. El objetivo de este tema es proporcionar métodos que permiten decidir si una hipótesis estadística debe o no ser rechazada, en base a los
INTERVALOS DE CONFIANZA. La estadística en cómic (L. Gonick y W. Smith)
INTERVALOS DE CONFIANZA La estadística en cómic (L. Gonick y W. Smith) EJEMPLO: Será elegido el senador Astuto? 2 tamaño muestral Estimador de p variable aleatoria poblacional? proporción de personas que
Árboles Filogenéticos. BT7412, CC5702 Bioinformática Diego Arroyuelo. 2 de noviembre de 2010
Unidad 6: Árboles Filogenéticos BT7412, CC5702 Bioinformática Diego Arroyuelo 2 de noviembre de 2010 Temario (Introduction to Computational Molecular Biology Setubal y Meidanis Capítulo 6) 1. Introducción
Tema 5. Muestreo y distribuciones muestrales
1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras aleatorias simples. Distribución de la media muestral: Esperanza y varianza. Distribución exacta en el caso normal. Distribución
Definición de probabilidad
Tema 5: LA DISTRIBUCIÓN NORMAL 1. INTRODUCCIÓN A LA PROBABILIDAD: Definición de probabilidad Repaso de propiedades de conjuntos (Leyes de Morgan) Probabilidad condicionada Teorema de la probabilidad total
ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua
ESTADÍSTICA Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal Cuantitativa discreta continua DISTRIBUCIÓN DE FRECUENCIAS Frecuencia absoluta: fi Frecuencia relativa:
Distribuciones de probabilidad
Distribuciones de probabilidad Prof, Dr. Jose Jacobo Zubcoff Departamento de Ciencias del Mar y Biología Aplicada Inferencia estadística: Parte de la estadística que estudia grandes colectivos a partir
3. ANÁLISIS DE DATOS DE PRECIPITACIÓN.
3. ANÁLISIS DE DATOS DE PRECIPITACIÓN. Teniendo en cuenta que la mayoría de procesos estadísticos se comportan de forma totalmente aleatoria, es decir, un evento dado no está influenciado por los demás,
Análisis de datos Categóricos
Introducción a los Modelos Lineales Generalizados Universidad Nacional Agraria La Molina 2016-1 Introducción Modelos Lineales Generalizados Introducción Componentes Estimación En los capítulos anteriores
Unidad 1: Espacio de Probabilidad
Unidad 1: Espacio de Probabilidad 1.1 Espacios de Probabilidad. (1) Breve introducción histórica de las probabilidades (2) Diferencial entre modelos matemáticos deterministicos y probabilísticos (3) Identificar
Variables aleatorias
Variables aleatorias DEFINICIÓN En temas anteriores, se han estudiado las variables estadísticas, que representaban el conjunto de resultados observados al realizar un experimento aleatorio, presentando
HOJA DE TRABAJO UNIDAD 3
HOJA DE TRABAJO UNIDAD 3 1. Defina que es probabilidad Es el estudio de experimentos aleatorios o libres de determinación, el resultado es al azar. Se refiere al estudio de la aleatoriedad y a la incertidumbre.
CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS
CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS 1 POR QUÉ SE LLAMAN CONTRASTES NO PARAMÉTRICOS? A diferencia de lo que ocurría en la inferencia paramétrica, ahora, el desconocimiento de la población que vamos
Otra característica poblacional de interés es la varianza de la población, 2, y su raíz cuadrada, la desviación estándar de la población,. La varianza
CARACTERÍSTICAS DE LA POBLACIÓN. Una pregunta práctica en gran parte de la investigación de mercado tiene que ver con el tamaño de la muestra. La encuesta, en principio, no puede ser aplicada sin conocer
Teoría de la decisión
1.- Un problema estadístico típico es reflejar la relación entre dos variables, a partir de una serie de Observaciones: Por ejemplo: * peso adulto altura / peso adulto k*altura * relación de la circunferencia
Curso de Estadística Aplicada a las Ciencias Sociales
Curso de Estadística Aplicada a las Ciencias Sociales Tema 6. Descripción numérica (2) Capítulo 5 del manual Tema 6 Descripción numérica (2) Introducción 1. La mediana 2. Los cuartiles 3. El rango y el
Tema I. Introducción. Ciro el Grande ( A.C.)
1.1. La ciencia de la estadística:. El origen de la estadística:. Ciencia descriptiva. Evaluación de juegos de azar Ciro el Grande (560-530 A.C.) Si tengo 1 As y 2 reyes, que descarte es mas conveniente
DISTRIBUCIÓN DE POISSON
DISTRIBUCIÓN DE POISSON P O I S S O N Siméon Denis Poisson, (1781-1840), astronauta francés, alumno de Laplace y Lagrange, en Recherchés sur la probabilité des jugements..., un trabajo importante en probabilidad
Econometría II Grado en finanzas y contabilidad
Econometría II Grado en finanzas y contabilidad Variables aleatorias y procesos estocásticos. La FAC y el correlograma Profesora: Dolores García Martos E-mail:mdgmarto@est-econ.uc3m.es Este documento es
Discretas. Continuas
UNIDAD 0. DISTRIBUCIÓN TEÓRICA DE PROBABILIDAD Discretas Binomial Distribución Teórica de Probabilidad Poisson Normal Continuas Normal Estándar 0.1. Una distribución de probabilidad es un despliegue de
Procesos estocásticos
Procesos estocásticos Las cadenas de Markov estudian procesos estocásticos Los procesos estocásticos son modelos matemáticos que describen sistemas dinámicos sometidos a procesos aleatorios Parámetros:
PATRONES DE DISTRIBUCIÓN ESPACIAL
PATRONES DE DISTRIBUCIÓN ESPACIAL Tipos de arreglos espaciales Al azar Regular o Uniforme Agrupada Hipótesis Ecológicas Disposición al Azar Todos los puntos en el espacio tienen la misma posibilidad de
Tema 4: Probabilidad y Teoría de Muestras
Tema 4: Probabilidad y Teoría de Muestras Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 4: Probabilidad y Teoría de Muestras Curso 2008-2009
La teoría de coalescencia
La teoría de coalescencia Proceso estocástico Es un linaje de alelos proyectado hacia el pasado (su ancestro común mas reciente) Aproximación básica usando el modelo de Wright-Fisher Modelo probabilístico
Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico
Formulario. Estadística Administrativa Módulo 1. Introducción al análisis estadístico Histogramas El número de intervalos de clase, k, se elige de tal forma que el valor 2 k sea menor (pero el valor más
Pronósticos, Series de Tiempo y Regresión. Capítulo 4: Regresión Lineal Múltiple
Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple Temas Modelo de regresión lineal múltiple Estimaciones de Mínimos Cuadrados Ordinarios (MCO); estimación puntual y predicción
Proyecto PropULSA: Estadística y Probabilidad Breviario Académico
Estadística y Probabilidad Breviario Académico Estadística: Es la ciencia que tiene por objetivo recolectar, escribir e interpretar datos, con la finalidad de efectuar una adecuada toma de decisiones en
Curso de Probabilidad y Estadística
Curso de Probabilidad y Estadística Distribuciones de Probabilidad Dr. José Antonio Camarena Ibarrola camarena@umich.mx Universidad Michoacana de San Nicolás de Hidalgo Facultad de Ingeniería Eléctrica
EXPERIMENTO ALEATORIO
EXPERIMENTO ALEATORIO En concepto de la probabilidad, un experimento aleatorio es aquel que bajo el mismo conjunto aparente de condiciones iniciales, puede presentar resultados diferentes, en otras palabras,
ESTADÍSTICA INFERENCIAL
ESTADÍSTICA INFERENCIAL ESTADÍSTICA INFERENCIAL 1 Sesión No. 4 Nombre: Distribuciones de probabilidad para variables Contextualización En la sesión anterior se definió el concepto de variable aleatoria
EL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD)
EL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD) Fortino Vela Peón fvela@correo.xoc.uam.mx FVela-0 Objetivo Introducir las ideas básicas del principio de máxima verosimilitud. Problema Considere el experimento
III Verano de Probabilidad y Estadística Curso de Procesos de Poisson (Víctor Pérez Abreu) Lista de Ejercicios
III Verano de Probabilidad y Estadística Curso de Procesos de Poisson (Víctor Pérez Abreu) Lista de Ejercicios Esta lista contiene ejercicios y problemas tanto teóricos como de modelación. El objetivo
Objetivo: Comprender la diferencia entre valor esperado, varianza y desviación estándar. Poner en práctica el teorema de Chebyshev
PROBABILIDAD Y ESTADÍSTICA Sesión MODELOS ANALÍTICOS DE FENÓMENOS ALEATORIOS CONTINUOS. Definición de variable aleatoria continua. Función de densidad y acumulatíva. Valor esperado, varianza y desviación
INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión
INTERPRETACIÓN DE LA REGRESIÓN Este gráfico muestra el salario por hora de 570 individuos. 1 Interpretación de la regresión. regresión Salario-Estudios Source SS df MS Number of obs = 570 ---------+------------------------------
CÁLCULO DE PROBABILIDADES
CÁLCULO DE PROBABILIDADES Tipo de asignatura: Troncal Anual. Créditos ECTS: 15 I.- INTRODUCCIÓN AL CÁLCULO DE PROBABILIDADES. (16 horas presenciales) Tema 1.- La naturaleza del cálculo de probabilidades.
Introducción a la Probabilidad
Introducción a la Probabilidad Tema 3 Ignacio Cascos Depto. Estadística, Universidad Carlos III 1 Ignacio Cascos Depto. Estadística, Universidad Carlos III 2 Objetivos Entender el concepto de experimento
Métodos, Algoritmos y Herramientas
Modelado y Simulación de Sistemas Dinámicos: Métodos, Algoritmos y Herramientas Ernesto Kofman Laboratorio de Sistemas Dinámicos y Procesamiento de la Información FCEIA - Universidad Nacional de Rosario.
MEDIDAS DE TENDENCIA CENTRAL
MEDIDAS DE TENDENCIA CENTRAL Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro
INSTITUTO POLITÉCNICO NACIONAL SECRETARIA ACADEMICA DIRECCIÓN DE ESTUDIOS PROFESIONALES EN INGENIERÍA Y CIENCIAS FÍSICO MATEMÁTICAS
ESCUELA: UPIICSA CARRERA: INGENIERÍA EN TRANSPORTE ESPECIALIDAD: COORDINACIÓN: ACADEMIAS DE MATEMÁTICAS DEPARTAMENTO: CIENCIAS BÁSICAS PROGRAMA DE ESTUDIO ASIGNATURA: ESTADÍSTICA APLICADA CLAVE: TMPE SEMESTRE:
LIGAMIENTO Y RECOMBINACIÓN
LIGAMIENTO Y RECOMBINACIÓN Los principales apartados de este tema serán: Introducción n y Estimación n de la fracción n de recombinación Ánálisis del ligamiento: Planteamiento directo Planteamiento inverso
Clasificación de sistemas
Capítulo 2 Clasificación de sistemas 2.1 Clasificación de sistemas La comprensión de la definición de sistema y la clasificación de los diversos sistemas, nos dan indicaciones sobre cual es la herramienta
Probabilidad y Estadística
Probabilidad y Estadística Programa Probabilidad Teoría de conjuntos Diagramas de Venn Permutaciones y combinaciones Variables aleatorias y distribuciones Propiedades de distribuciones Funciones generadoras
Probabilidad es una manera de indicar la posibilidad de ocurrencia de un evento futuro
Probabilidad es una manera de indicar la posibilidad de ocurrencia de un evento futuro La probabilidad nos proporciona un modelo teórico para la generación de los datos experimentales Medidas de la Posibilidad
Socioestadística I Análisis estadístico en Sociología
Análisis estadístico en Sociología Capítulo 4 TEORÍA DE LA PROBABILIDAD Y SUS PRINCIPIOS. ESTADÍSTICA INFERENCIAL 1. INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL En los capítulos anteriores, hemos utilizado
ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.
ANEXO 1. CONCEPTOS BÁSICOS Este anexo contiene información que complementa el entendimiento de la tesis presentada. Aquí se exponen técnicas de cálculo que son utilizados en los procedimientos de los modelos
Tema 1. Espacios Vectoriales Definición de Espacio Vectorial
Tema 1 Espacios Vectoriales. 1.1. Definición de Espacio Vectorial Notas 1.1.1. Denotaremos por N, Z, Q, R, C, a los conjuntos de los números Naturales, Enteros, Racionales, Reales y Complejos, respectivamente.
Método de Hennig. Método alternativo. 1) Definir la raíz (escogiendo grupo externo) 1) Identificar caracteres informativos
urso de Evolución 06 Facultad de iencias Montevideo, Uruguay http://evolucion.fcien.edu.uy/ http://eva.universidad.edu.uy/ Tema. Las filogenias como contexto de análisis de la evolución. Métodos de inferencia
ADMINISTRACION DE OPERACIONES
Sesión4: Métodos cuantitativos ADMINISTRACION DE OPERACIONES Objetivo específico 1: El alumno conocerá y aplicara adecuadamente los métodos de pronóstico de la demanda para planear la actividad futura
Preliminares Interpolación INTERPOLACIÓN Y APROXIMACIÓN POLINOMIAL
INTERPOLACIÓN Y APROXIMACIÓN POLINOMIAL Contenido Preliminares 1 Preliminares Teorema 2 Contenido Preliminares Teorema 1 Preliminares Teorema 2 Teorema Preliminares Teorema Teorema: Serie de Taylor Supongamos
ESTADÍSTICA DESCRIPTIVA
ESTADÍSTICA DESCRIPTIVA Medidas de tendencia central y de dispersión Giorgina Piani Zuleika Ferre 1. Tendencia Central Son un conjunto de medidas estadísticas que determinan un único valor que define el
Estadística Descriptiva
M. en C. Juan Carlos Gutiérrez Matus Instituto Politécnico Nacional 2004 IPN UPIICSA c 2004 Juan C. Gutiérrez Matus Desde la segunda mitad del siglo anterior, el milagro industrial sucedido en Japón, hizo
Modelos de dinámica de poblaciones aisladas Ecología (1861 y 1812) Grado de Biología y de Ciencias Ambientales. UMU
Modelos de dinámica de poblaciones aisladas Ecología (1861 y 1812) 215 16 Grado de Biología y de Ciencias Ambientales. UMU Contents 1 Introducción 1 2 Modelos de crecimiento 1 2.1 Érase una vez..............................................
Tema 8: Aplicaciones. Ecuaciones en. diferencias: modelos en tiempo discreto. 1 Modelo de crecimiento exponencial. 2 Sucesión de Fibonacci
8 de diciembre de 20 Contexto: Bloque de Álgebra Lineal Tema 6. Sistemas de ecuaciones lineales y matrices. Tema 7. Valores y vectores propios. Tema 8. Aplicaciones del cálculo de los valores y vectores
TEMA 8. GEOMETRÍA ANALÍTICA.
TEMA 8. GEOMETRÍA ANALÍTICA. 8..- El plano. Definimos el plano euclideo como el conjunto de puntos ( x, y) R. Así, cada punto del plano posee dos coordenadas. Para representar puntos del plano utilizaremos
2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...
Contenidos 1 Introducción al paquete estadístico S-PLUS 19 1.1 Introducción a S-PLUS............................ 21 1.1.1 Cómo entrar, salir y consultar la ayuda en S-PLUS........ 21 1.2 Conjuntos de datos..............................
UNIVERSIDAD AUTÓNOMA DE QUERÉTARO FACULTAD DE INGENIERÍA. práctica, Total: 85 Horas a la semana: 5 teoría: 4 prácticas: 1 Créditos:
UNIVERSIDAD AUTÓNOMA DE QUERÉTARO FACULTAD DE INGENIERÍA Probabilidad y Estadística 18/01/10 Clave: 214 Semestre: 1 Duración del curso: semanas: 17 horas: 68 de teoría y 17 de práctica, Total: 85 Horas
Tema 4. Probabilidad Condicionada
Tema 4. Probabilidad Condicionada Presentación y Objetivos. En este tema se dan reglas para actualizar una probabilidad determinada en situaciones en las que se dispone de información adicional. Para ello
INDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos
INDICE Prefacio VII 1. Introducción 1 1.1. Qué es la estadística moderna? 1 1.2. El crecimiento y desarrollo de la estadística moderna 1 1.3. Estudios enumerativos en comparación con estudios analíticos
Contrastes de Hipótesis paramétricos y no-paramétricos.
Capítulo 1 Contrastes de Hiptesis paramétricos y no-paramétricos. Estadística Inductiva o Inferencia Estadística: Conjunto de métodos que se fundamentan en la Teoría de la Probabilidad y que tienen por
1. VALORES FALTANTES 2. MECANISMOS DE PÉRDIDA
1. VALORES FALTANTES Los valores faltantes son observaciones que en un se tenía la intención de hacerlas, pero por distintas razones no se obtuvieron. Puede ser que no se encuentre a un encuestado, entonces
Genómica comparada. Brown 2002, págs
Genómica comparada 1. Teoría neutralista de la evolución molecular 2. Sustituciones nucleotídicas sinónimas y no-sinónimas. Interpretación de la razón Ka/Ks. 3. Duplicaciones y el destino de los genes
Espacios Vectoriales. AMD Grado en Ingeniería Informática. AMD Grado en Ingeniería Informática (UM) Espacios Vectoriales 1 / 21
Espacios Vectoriales AMD Grado en Ingeniería Informática AMD Grado en Ingeniería Informática (UM) Espacios Vectoriales 1 / 21 Objetivos Al finalizar este tema tendrás que: Saber si unos vectores son independientes.
TEMA 3: Probabilidad. Modelos. Probabilidad
TEM 3: Probabilidad. Modelos Probabilidad Fenómeno aleatorio: es aquel cuyos resultados son impredecibles. Ejemplos: Lanzamiento de una moneda: Resultados posibles: cara, cruz. Selección al azar de un
1/26/11! Taller Latinoamericano de Evolución Molecular! 2011! Relojes Moleculares:! Fechación de Clados con Datos Moleculares! EL RELOJ MOLECULAR!
Taller Latinoamericano de Evolución Molecular! 2011! Relojes Moleculares:! Fechación de Clados con Datos Moleculares! Prof. Susana Magallón! Enero 27, 2011! EL RELOJ MOLECULAR! La distancia genética entre
DISTRIBUCIÓN N BINOMIAL
DISTRIBUCIÓN N BINOMIAL COMBINACIONES En muchos problemas de probabilidad es necesario conocer el número de maneras en que r objetos pueden seleccionarse de un conjunto de n objetos. A esto se le denomina
OPTIMIZACIÓN Y SIMULACIÓN PARA LA EMPRESA. Tema 4 Optimización no Lineal
OPTIMIZACIÓN Y SIMULACIÓN PARA LA EMPRESA Tema 4 Optimización no Lineal ORGANIZACIÓN DEL TEMA Sesiones: El caso sin restricciones: formulación, ejemplos Condiciones de optimalidad, métodos Caso con restricciones:
T1. Distribuciones de probabilidad discretas
Estadística T1. Distribuciones de probabilidad discretas Departamento de Ciencias del Mar y Biología Aplicada Inferencia estadística: Parte de la estadística que estudia grandes colectivos a partir de
Medidas descriptivas I. Medidas de tendencia central A. La moda
Medidas descriptivas I. Medidas de tendencia central A. La moda Preparado por: Roberto O. Rivera Rodríguez Coaching de matemática Escuela Eduardo Neuman Gandía 1 Introducción En muchas ocasiones el conjunto
Tema 6. Estadística Descriptiva e Introducción a la Inferencia Estadística
Tema 6. Estadística Descriptiva e Introducción a la Inferencia Estadística Fuente de los comics: La Estadística en Comic. LarryGonicky Woollcatt Smith. Ed. ZendreraZariquiey, 1999 ESTADÍSTICA ESTADÍSTICA
Derivadas Parciales (parte 2)
40 Derivadas Parciales (parte 2) Ejercicio: Si donde y. Determinar Solución: Consideraremos ahora la situación en la que, pero cada una de las variables e es función de dos variables y. En este caso tiene
MATERIA: MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES II INSTRUCCIONES Y CRITERIOS GENERALES DE CALIFICACIÓN
UNIVERSIDADES PÚBLICAS DE LA COMUNIDAD DE MADRID PRUEBA DE ACCESO A LAS ENSEÑANZAS UNIVERSITARIAS OFICIALES DE GRADO MODELO DE EXAMEN CURSO 2014-2015 MATERIA: MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES
Conceptos básicos de filogenética molecular
Dr. Eduardo A. RODRÍGUEZ TELLO CINVESTAV-Tamaulipas 18 de julio del 2013 Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Conceptos básicos de filogenética molecular 18 de julio del 2013 1 / 43 1 Conceptos básicos
DIRECCIÓN ACADÉMICA PLANEACIÓN DIDÁCTICA
DEPARTAMENTO ACADÉMICO LICENCIATURA EN ACADEMIA ASIGNATURA SERIACIÓN CUATRIMESTRE EN QUE SE IMPARTE DIRECCIÓN de LICENCIATURAS EJECUTIVAS INGENIERÍA INDUSTRIAL y de SISTEMAS MATEMÁTICAS PROBABILIDAD y
3 PROBABILIDAD Y DISTRIBUCION NORMAL
3 PROBABILIDAD Y DISTRIBUCION NORMAL La probabilidad puede ser considerada como una teoría referente a los resultados posibles de los experimentos. Estos experimentos deben ser repetitivos; es decir poder
Análisis de. Análisis de. Decisiones:
Análisis de : Tablas de Pagos y Árboles de Decisión Fragoso Iñiguez I Marisol Salazar Rosales Leandro Julián Noviembre, 06 Tablas de Pagos Una situación de decisión en condiciones de incertidumbre puede
La reordenación aleatoria de un conjunto finito
La reordenación aleatoria de un conjunto finito Pérez Cadenas J. I. 0.06.2003 Resumen Al desordenar y, a continuación, reordenar aleatoriamente un conjunto finito es posible que algunos de sus elementos