GUÍA RÁPIDA DEL PROGRAMA NTSYSpc ver.2.20n.



Documentos relacionados
GUÍA RÁPIDA DEL PROGRAMA SPSS ver y superiores Programa para estudios estadísticos en general, muy completo pero de fácil manejo.

Práctica 2 Estadística Descriptiva

Práctica 1: Introducción a SPSS 1

II. CARACTERIZACIÓN MEDIANTE MARCADORES MOLECULARES. EJERCICIO 6. Análisis genético de poblaciones con un marcador codominante.

Análisis Factorial: Análisis de componentes principales

SESIÓN PRÁCTICA 7: REGRESION LINEAL SIMPLE PROBABILIDAD Y ESTADÍSTICA. PROF. Esther González Sánchez. Departamento de Informática y Sistemas

GRÁFICOS GRÁFICOS EN SPSS. Bakieva, M., González Such, J., Jornet, J., Terol, L.

METODO SIMPLEX ANALISIS DE SENSIBILIDAD Y DUALIDAD

Uso y Manejo Básico de Bases de datos en STATA 12

Capítulo 2. Cómo utilizar la ayuda

ν= 0.3; E=1.8e10; t= 0.05; q=-0.5;

Editor y manejo de Datos en SPSS. Favio Murillo García

GUÍA RÁPIDA DEL PROGRAMA SPAGeDI v.1.5

EJEMPLO DE SIMPLEX PARA PROBLEMA DE PROGRAMACIÓN LINEAL CASO DE MAXIMIZAR Prof.: MSc. Julio Rito Vargas Avilés

ANÁLISIS CUANTITATIVO DE DATOS EN CIENCIAS SOCIALES CON EL SPSS (I) Tablas de contingencia y pruebas de asociación

Introducción a la estadística básica, el diseño de experimentos y la regresión

INSTRUCCIONES PARA EL USO DEL SOFTWARE (IS)

FUNDAMENTOS METODOLÓGICOS EN PSICOLOGÍA ANÁLISIS BÁSICOS CON SPSS

A continuación, definimos el rango en el que están codificadas éstas variables

EJERCICIOS PARTE I: 1. Cómo se llamaba anteriormente a las hojas de cálculo? 2. Qué es una hoja electrónica de cálculo?

Conocer la forma de analizar las Medidas de Tendencia Central de una distribución con OpenOffice Calc.

Teoría de la decisión Estadística

TRABAJO PRÁCTICO ESTADISTICA APLICADA (746)

Manual avanzado Excel 2007

2.5. Asimetría y apuntamiento

5 Relaciones entre variables.

Distribuciones bidimensionales. Regresión.

Práctica 2: Intervalos de confianza y contrastes con SPSS 1

La herramienta ArtEM: Aritmética Entera y Modular

Guía Rápida de Ayuda SIGA

Tabla de contenido. P á g i n a 2

Materia Prima WhitePaper Noviembre de 2006

Módulo: Solicitud de Materiales, Hoja de Ruta

MODELO 347/415, CÓMO GENERARLO Y ENVIARLO

Iniciación a Microsoft Excel. Definición y descripción de una hoja de cálculo

Herramientas Estadísticas para la Gestión

ÍNDICE CAPITULO UNO CAPITULO DOS. Pág.

MANUAL DE AYUDA COMO HACER INVENTARIOS CON GOTELGEST.NET

GUÍA DEL SELLO DE EXCELENCIA EUROPEA

Medidas de asociación

Estadística Descriptiva

Tema 3. Análisis de riesgo. Tema 3. Análisis de riesgo

ESTADISTICA APLICADA: PROGRAMA

nom Manual de Cierre de Ejercicio 2015 GUÍA PRÁCTICA: PAGAS EXTRAS

MANUAL DE CÓDIGOS. Guía de implementación de códigos 2D Vol. 1

TEMA III MÉTODO SIMPLEX. CONCEPTOS BÁSICOS

CONTROL DE CRUCES DE FACTURAS DE VENTA

Entre las múltiples formas de baremar un test, destacamos las siguientes: - Baremos cronológicos: Edad Mental y Cociente Intelectual.

Prácticas de inferencia y muestreo.

LAS FUENTES DE ENERGÍA ÍNDICE. Guía del Profesor 1 CARACTERÍSTICAS DE LA APLICACIÓN

TEMA I EL SISTEMA SAP R/3

EJEMPLO DE ESTRUCTURA DEL REPORTE AL SISTEMA DE INFORMACIÓN DE PRECIOS DE MEDICAMENTOS- SISMED Dirección de Medicamentos y Tecnologías en Salud

La estadística en Internet

DaVinciTEXTIL. Codificación de artículos

Lección 10: Representación gráfica de algunas expresiones algebraicas

GUÍA PARA EL CONCURSO BOLSA MILLONARIA VALORES BANCOLOMBIA

Estadística Descriptiva. SESIÓN 12 Medidas de dispersión

Guía básica de implementación

OPA Guía de usuario. Cita Previa por Internet GUÍA DE USUARIO. Consejo Sanitario 1

Matrices causa-efecto. La Matriz de Leopold

INSTRUCTIVO PARA ACCESO AL RECIBO DIGITAL

CALIDAD 1 JOSÉ MANUEL DOMENECH ROLDÁN PROFESOR DE ENSEÑANZA SECUNDARIA

Examen de ideas previas

FUNCIONES. Definición de función. Ejemplos.

Laboratorio 2: Análisis de datos bivariantes

Tabla de Derivadas. Función Derivada Función Derivada. f (x) n+1. f (x) y = f (x) y = ln x. y = cotg f (x) y = ( 1 cotg 2 f (x)) f (x) = f (x)

Curso de Excel Completo Básico Intermedio - Avanzado

GENERACION DE CASHFLOW

Diplomado Centroamericano sobre Monitoreo y Evaluación De Políticas y Programas de VIH-sida

Guía rápida de ayuda ECOGAN

Determinante de una matriz

TEMA 11. LA FIABILIDAD DE LOS TESTS

1.- DATOS DE LA ASIGNATURA. Nombre de la asignatura: Probabilidad y Estadística. Carrera: Ingeniería en Materiales. Clave de la asignatura: MAM 0524

Definición de vectores

Gestión de datos con STATGRAPHICS

Benavides Muñoz Holger. Área de Ingeniería Hidráulica y Saneamiento. Unidad de Ingeniería Civil, Geología y Minas.

Tema Correlación. Correlación. Introducción

GUÍA FÁCIL CUMPLIMIENTO DE LOS DEBERES DE INFORMACIÓN Y ENTERAMIENTO DE RETENCIONES DEL IMPUESTO SOBRE LA RENTA

Debemos obtener las medidas estadísticas más comunes.

Microsoft Office Excel Nivel Básico

MANUAL DE EXCEL AVANZADO

Teoría 3_10 Gráficos!

Una población es el conjunto de todos los elementos a los que se somete a un estudio estadístico.

Procedimiento. Herramientas Estadísticas Básicas

CAPÍTULO III MOMENTO DE INERCIA EN ÁREAS PLANAS. Este capítulo comprende diversas propiedades geométricas de secciones (para casos

Sistemas de Ecuaciones Lineales

Caso 314: Cálculo de velocidades iniciales en Cinética. Discriminación entre modelos, cálculo de pendientes y asíntotas (F.J.

El uso de la Técnica de Regresión Lineal Múltiple para la evaluación de la dotación de personal en el I.N.S.S.

DOCUMENTO 3: DISTRIBUCIÓN DE PROBABILIDAD DE V. A. CONTINUA: LA DISTRIBUCIÓN NORMAL

UNIVERSIDAD DE CIENCIAS EMPRESARIALES Y SOCIALES

GUÍAS. Módulo de Razonamiento cuantitativo SABER PRO

Predicción de la relación entre el género, la cantidad de cigarrillos y enfermedades usando Máquinas de Vector Soporte

Guía de Referencia para la visualización y descarga de datos en ProSource Front Office

UNIDAD 1: QUÉ ES LA ESTADÍSTICA?

TUTORIAL PARA CREAR UNA PHPWEBQUEST

PROGRAMA DE AYUDA. DECLARACIONES

GUÍAS. Módulo de Razonamiento cuantitativo SABER PRO

Transcripción:

GUÍA RÁPIDA DEL PROGRAMA NTSYSpc ver.2.20n. Programa de análisis multivariante específicamente diseñado para estudios de caracterización de germoplasma vegetal.

INDICE DEL CONTENIDO 1. APLICACIÓN A DATOS FENOTÍPICOS MORFOLÓGICOS O MOLECULARES: MULTI-ESTADO CUALITATIVOS O CUANTITATIVOS, O DOBLE-ESTADO. Pg. 5 1.1. PREPARACIÓN DE LA MATRIZ BÁSICA DE DATOS. Pg. 5 1.2. ESTANDARIZACIÓN Y TRANSFORMACIONES EN LA MATRIZ BÁSICA DE DATOS. Pg. 6 1.2.1. Opción 1. Utilizar el módulo Standardization de NTSYS. Pg. 6 1.2.2. Opción 2. Utilizar el módulo Transformation de NTSYS. Pg. 7 1.3. ANÁLISIS DE COMPONENTES PRINCIPALES (DATOS CUANTITATIVOS). Pg. 8 1.3.1. Obtener una matriz de correlación entre caracteres o de varianzas covarianzas. Pg. 8 1.3.1.1. Opción 1: Calcular una matriz de correlación entre caracteres Pg. 8 1.3.1.2. Opción 2: Calcular una matriz de varianzas covarianzas. Pg. 9 1.3.2. Obtener los Componentes Principales sin rotar y el gráfico de las saturaciones factoriales Pg. 10 1.3.3. Obtener los Componentes Principales rotados y el correspondiente gráfico de saturaciones factoriales. Pg. 12 1.3.4. Proyectar cada una de las UBC sobre los tres o dos primeros componentes principales. Pg. 16 1.4. ANÁLISIS DE AGRUPAMIENTOS PARA DATOS MULTI-ESTADO. Pg.19 1.4.1. Agrupamiento en base a todos los caracteres analizados, cuando éstos son de tipo multi-estado cualitativo o cuantitativos. Pg.19 1.4.1.1. Estandarización y otras transformaciones en la matriz básica de datos. Pg.19 1.4.1.2. Determinar la matriz de similitud entre las UBC. Pg.19 1.4.1.3. Calcular y dibujar el dendrograma. Pg. 20 1.4.2. Agrupamiento en base a los primeros componentes principales (los que recogen una mayor variabilidad). Pg. 22 1.4.2.1. Determinar la matriz de similitud entre las UBC. Pg. 22 1.4.2.2. Calcular y dibujr el dendrograma y dibujarlo. Pg. 23 1.5. ANÁLISIS DE AGRUPAMIENTOS PARA DATOS DOBLE-ESATDO). Pg. 23 1.5.1. Determinar la matriz de similitud entre las UBC. Pg. 23 1.5.2. Calcular y dibujar el dendrograma. Pg. 24

2. APLICACIÓN A MARCADORES MOLECULARES CODOMIENTANTES INTERPRETADOS GENÉTICAMENTE.. Pg. 25 2.1. OBTENCION DE LAS FRECUENCIAS ALÉLICAS. Pg. 25 2.1.1. Preparación de la matriz básica de datos con 0/1/2 Pg. 25 2.1.2. Obtención de las frecuencias alélicas Pg. 30 2.2. DETERMINAR LA MATRIZ DE SIMILITUD GENÉTICA ENTRE LAS 2.3. CALCULAR Y DIBUJAR EL DENDROGRAMA Pg. 32 3. TEMAS COMPLEMENTARIOS. Pg. 33 3.1. VISUALIZACIÓN E IMPRESIÓN DE CUALQUIER ARCHIVO GENERADO POR ALGUNO DE LOS SUBPOGRAMAS. Pg. 33 3.2. VOLVER A DIBUJAR DENDROGRAMA O PROYECCIONES DE UBC SOBRE COMPONENTES PRINCIPALES. Pg. 34 3.3. VALIDACIÓN DEL ANÁLISIS DE CONGLOMERADOS Pg. 36 3.3.1. Cuantificación de la distorsión debida al método de agrupación empleado mediante la elaboración de la matriz cofenética. Pg. 36 3.3.1.1. Calcular la matriz de cofenética (matriz diagonal) a partir del fenograma. Pg. 36 3.3.1.2. Comparar la matriz de similitud original y la matriz cofenética. Pg. 36 3.3.2. Comparación de la similitud entre diferentes métodos de caracterización. Pg. 38 3.3.2.1. Opción 1: Comparar las matrices de similitud. Pg. 38 3.3.2.2. Opción 2: Medir la coincidencia entre las estructuras taxonómicas derivadas de las matrices de similitud. Pg. 39 3.3.3. Métodos de remuestreo en las matrices de datos: Bootstrapping. Pg. 40 3.3.3.1. Obtención de las matrices remuestreadas Pg. 40 3.3.3.2. Obtención de una matriz de similitud por cada una de las matrices remuestreadas. Pg. 41 3.3.3.3. Obtención de la matriz de similitud promedio. Pg. 42 3.3.3.4. Calcular y dibujar el dendrograma a partir de la matriz de similitud promedio. Pg. 43

1. APLICACIÓN A DATOS FENOTÍPICOS MORFOLÓGICOS O MOLECULARES: MULTI-ESTADO CUALITATIVOS O CUANTITATIVOS, O DOBLE-ESTADO. 1.1. PREPARACIÓN DE LA MATRIZ BÁSICA DE DATOS. Puede prepararse en el Editor de NTSYS (Ntedit) o en un archivo de MS Excel (recomendado). El programa por defecto considera que se situarán las Unidades Básicas de Caracterización (UBC) en columnas y los caracteres en filas. Pero puede hacerse al revés, como en el presente ejemplo. Tipo de matriz: Ver en Help Contents / Data File /File format Nº de filas, en este ejemplo UBC. Nº de columnas, en este ejemplo caracteres. Si faltaran datos aquí iría el código correspondiente a los datos que faltan (habitualmente 999 ).

1.2. ESTANDARIZACIÓN Y TRANSFORMACIONES EN LA MATRIZ BÁSICA DE DATOS. Si fuese necesario estandarizar la matriz de datos, la estandarización se haría por caracteres, ya que lo que se pretende es que los valores de todos los caracteres varíen entre los mismos límites. En función de cómo se haya construido la matriz básica de datos, la estandarización se hará por filas o por columnas. 1.2.1. Opción 1. Utilizar el módulo Standardization de NTSYS. Es un módulo que permite realizar transformaciones lineales del tipo: y' Para acceder a dicho módulo se entrará en los siguientes enlaces Transformation/Standardization y substract option divide option Las diferentes opciones de substract option y divide option pueden consultarse en Help / Parameters

1. 2.2. Opción 2. Utilizar el módulo Transformation de NTSYS. Es un módulo que permite realizar todo tipo de transformaciones, como por ejemplo transformaciones logarítimicas. Para acceder a dicho módulo se entrará en los siguientes enlaces Transformation/Transformation

Las diferentes opciones de Transformation codes pueden consultarse en Help / Parameters 1.3. ANÁLISIS DE COMPONENTES PRINCIPALES (DATOS CUANTITATIVOS). 1.3.1. Obtener una matriz de correlación entre caracteres o de varianzas covarianzas. 1.3.1.1. Opción 1: Calcular una matriz de correlación entre caracteres - Estandarizar la matriz básica de datos por caracteres (ver punto 2). - Calcular la matriz de correlación entre los caracteres. La matriz de correlación es un tipo de matriz de similitud, y su cálculo se hará a partir de la matriz básica de datos estandarizada, operando por filas o por columnas en función de la estructura que se dio a la matriz de datos, teniendo en cuenta que la similitud se calcula entre caracteres. Para calcular una matriz de correlación se utiliza el módulo Dis/similarity utilizando los siguientes enlaces Dis/similarity / interval data Para calcular la matriz de correlación, el coeficiente a utilizar será el de correlación Momento Producto de Pearson.

1.3.1.2. Opción 2: Calcular una matriz de varianzas covarianzas. En este caso se dan mayores pesos a las variables que presentan varianzas mayores. Sin embargo de nuevo esto implica que las variables o caracteres sean medidas en unidades comparables por lo que es necesario algún tipo de transformación como la estandarización o la transformación logarítmica. En un estudio morfométrico convencional mediante ACP basado en la matriz de varianzas covarianzas de los caracteres, los pasos a realizar son los siguientes: Realizar la transformación logarítimica de la matriz básica de datos (ver punto 2). Calcular la matriz de varianzas covarianzas de los caracteres. Curso Intensivo de Postgrado. UACH. Mxico México2012. 2014.

1.3.2. Obtener los Componentes Principales sin rotar y el gráfico de saturaciones factoriales. * * * Si se está trabajando con la matriz de varianzas covarianzas, aquí se introducirá dicha matriz La pantalla resultante es la que se presenta a continuación.

A partir del documento de salida anterior deben imprimirse directamente los eigen valores (valores propios) correspondientes a cada uno de los componentes principales, y los porcentajes de variación que recogen. Presionando en los botones que aparecen en la parte inferior izquierda, señalados en rojo en la pantalla anterior, se obtienen los diagramas de dispersión bidimensionales o tridimensionales del espacio factorial, donde se puede observar de manera gráfica la contribución de cada carácter o variable a cada uno de los factores, que en este caso son los componentes principales. Las coordenadas de un carácter o variable en cada factor (en este caso componente principal) se corresponden con las saturaciones de la variable en dichos factores, que se encuentran en la matriz factorial, y que se obtiene solicitando del programa los eiguen-vectores (ver apartado 1.3.3)

Para obtener lo eiguen-vectores es preciso solicitar del programa dicha salida. 1.3.3. Obtener los Componentes Principales rotado y el correspondiente gráfico de saturaciones factoriales. Cada vez se está imponiendo más la práctica de rotar la solución original con objeto de mejorar la interpretabilidad de los resultados (ver explicación teórica en la parte de teoría). La nueva versión de NTSYS permite realizar esta rotación. A continuación se describen los pasos para realizarla. La matriz de entrada debe ser la de eiguen-vectores. El método de rotación más utilizado entre los que siguen manteniendo la ortogonalidad de los factores es el Varimaz-Normalizado.

La pantalla resultante es la que se presenta a continuación.

Presionando en los botones que aparecen en la parte inferior izquierda, señalados en rojo en la pantalla anterior, se obtienen los diagramas de dispersión bidimensionales o tridimensionales del espacio factorial rotado, donde se puede observar de manera gráfica la contribución de cada carácter a cada uno de los factores.

Para obtener los valores de las proyecciones de cada carácter sobre los factores rotados, es preciso solicitar del programa la salida de los mismos. Si el objetivo del ACP es una reducción de datos, es decir reducir el número de caracteres inicialmente utilizados a un menor número de ellos, el uso del ACP habría llegado a su fin. Los componentes principales, en su forma original o rotados, pueden ser ahora las nuevas variables, para otros tipos de estudios como un análisis de agrupamientos. No hay que olvidar que los componentes principales son una combinación lineal de los caracteres originales que recogen mayor varianza. Sin embargo, el objetivo del ACP puede ser también visualizar en proyección tridimensional las Unidades Básicas de Caracterización sobre el conjunto de ejes definidos por los componentes principales. Esto se estudia en el punto siguiente.

1.3.4. Proyectar cada una de las UBC sobre los tres o dos primeros componentes principales. * * Si la proyección quiere hacerse sobre los ejes rotados, aquí deberá introducirse la matriz de componentes rotados, es decir los vectores propios de cada carácter con respecto de los ejes rotados. Dicha matriz se obtuvo con el modulo FRotate bajo la denominación de Output reference structure

La pantalla resultante es la que se presenta a continuación. Presionando en los botones que aparecen en la parte inferior izquierda, señalados en rojo en la pantalla anterior, se obtienen los diagramas de dispersión bidimensionales o tridimensionales de proyección de las Unidades Básicas de Caracterización sobre los componentes sin rotar o rotados, según que el Input factor matrix file haya sido la matriz de componentes sin rotar o rotados.

1.4. ANÁLISIS DE AGRUPAMIENTOS PARA DATOS MULTI-ESTADO. 1.4.1. Agrupamiento en base a todos los caracteres analizados, cuando éstos son de tipo multiestado cualitativo o cuantitativos (pueden requerir estandarización). 1.4.1.1. Estandarización y otras transformaciones en la matriz básica de datos. Ver punto 2. 1.4.1.2. Determinar la matriz de similitud entre las UBC. El cálculo de la matriz de similitud se hará a partir de la matriz básica de datos estandarizada, operando por filas o por columnas en función de la estructura que se dio a la matriz de datos, teniendo en cuenta que la similitud se calculará entre UBC. En este caso se trabaja con datos multiestado cualitativos o cuantitativos. Para calcular una matriz de similitud se utiliza el módulo Dis/similarity utilizando los siguientes enlaces Dis/similarity / interval data. El Input file será por tanto la matriz básica de datos estandarizada. Para información sobre los posibles coeficientes a utilizar consultar Help / Parameters

1.4.1.3. Calcular y dibujar el dendrograma. La pantalla resultante se muestra a continuación. Curso Intensivo de Postgrado. UACH. México212. 2014.

Presionando en el botón que aparece en la parte inferior izquierda, señalado en rojo en la pantalla anterior, se obtiene el dendrograma de las Unidades Básicas de Caracterización.

1.4.2. Agrupamiento en base a los primeros componentes principales (los que recogen una mayor variabilidad). 1.4.2.1. Determinar la matriz de similitud entre las UBC. El cálculo de la matriz de similitud se hará en este caso a partir de la matriz de proyección de las UBC sobre el número de componentes principales que el investigador quiera considerar, que en este caso harán las veces de caracteres. En consecuencia el Input file será el archivo de salida del programa PROJ. Todo puede hacerse referido a los componentes originales o rotados (ver apartado 1.3.4 Pág 15). Se operará por filas o por columnas en función de la estructura que tenga la matriz de entrada, teniendo en cuenta que la similitud se calculará entre UBC. En el ejemplo que se presenta a continuación se ha utilizado la matriz de proyección sobre los componentes rotados.

1.4.2.2. Calcular y dibujr el dendrograma y dibujarlo. Se seguirá el mismo procedimiento que el indicado en el punto 1.4.1.3. (Pág. 19) 1.5. ANÁLISIS DE AGRUPAMIENTOS PARA DATOS DOBLE-ESTADO. Es preciso indicar que algunos coeficientes admiten también datos multiestado cualitativos sin secuencia lógica. El aspecto de la matriz básica de datos será el siguiente: 1.5.1. Determinar la matriz de similitud entre las UBC. El cálculo de la matriz de similitud se hará a partir de la matriz básica de datos, operando por filas o por columnas en función de la estructura que se dio a la matriz básica de datos, teniendo en cuenta que la similitud se calculará entre UBC. Para calcular una matriz de similitud se emplea el módulo Dis/similarity utilizando los siguientes enlaces Dis/similarity / Qualitative data. Para información sobre coeficientes pueden consultarse en Help/ Parameters

La pantalla de entrada de datos se presenta a continuación: 1.5.2. Calcular y dibujar el dendrograma. Se seguirá el mismo proceso que el descrito en el apartado 1.4.1.3. (Pág. 19)

2. APLICACIÓN A MARCADORES MOLECULARES CODOMINANTES INTERPRETADOS GENÉTICAMENTE. 2.1. OBTENCION DE LAS FRECUENCIAS ALÉLICAS. 2.1.1. Preparación de la matriz básica de datos con 0/1/2. Puede prepararse en el Editor de NTSYS (Ntedit) o en un archivo de MS Excel. Son necearias 3 matrices Primera matriz. La primera fila indica el tipo de matriz, la segunda designa los loci presentes, y las siguientes representan los diferentes individuos. La primera columna indica la población de pertenencia de cada individuo. Las columnas a partir de la segunda representan cada una un alelo. Para el caso de un individuo diploide, el número 1 indica presencia de la banda correspondiente al alelo, el número 0 ausencia de dicha banda, y el número 2 se reserva para los homocigotos en el alelo en cuestión. Tipo de matriz: Ver en Help Contents / Data File / File format Nº de filas Nº de columnas Si faltaran datos código correspondiente a los datos que faltan Locus 1 con 3 alelos Locus 2 con 2 alelos Locus 3 con 2 alelos Locus 4 con 3 alelos 25 individuos que constituyen la población 1

Segunda matriz. El programa la denomina Name of sample ID array. Su utilidad es indicar al programa qué filas de la Primera matriz pertenecen a la población, 1, cuáles a la población 2, y cuáles a la 3. 25 individuos que constituyen la población 1 Tercera matriz. El programa la denomina Name of loci file. Su utilidad es indicar al programa qué columnas de la Primera matriz pertenecen al locus 1, cuáles al 2 y cuáles al 3.

Locus 1 con 3 alelos Locus 2 con 2 alelos Locus 3 con 2 alelos Locus 4 con 3 alelos 2.1.2. Obtención de la matriz de frecuencias alélicas.

Para obtener la matriz de frecuencias, es preciso solicitar del programa la salida de la misma. Locus 1 con 3 alelos Locus 2 con 2 alelos Locus 3 con 2 alelos Locus 4 con 3 alelos Pobl. 1 Pobl. 2 Pobl. 3 Antes de continuar puede ser interesante abrir esta matriz en el editor de NSTYS y etiquetar filas y columnas

La pantalla resultante es la que se presenta a continuación.

Pulsando en Row labs y Col labs se modificarán las etiquetas de las filas y de las columnas Como alternativa también es posible crear directamente en el programa una matriz de frecuencias alélicas, en lugar de crear una matriz de 0/1/2 y solicitar del programa el cálculo de la matriz de frecuencias alélicas. 2.2. DETERMINAR LA MATRIZ DE SIMILITUD GENÉTICA ENTRE LAS POBLACIONES. El cálculo de la matriz de similitud genética se hará a partir de la matriz de frecuencias alélicas, previamente obtenida, operando por filas o por columnas en función de la estructura que tenga dicha matriz, teniendo en cuenta que la similitud se calculará entre UBC (en este caso concreto poblaciones). Si se utilizan determinados coeficientes, el programa requerirá otras matrices adicionales, que en este módulo se denominan como: Name of loci array file que es exactamente la matriz que se describió en al apartado II/1.1 con el nombre de tercera matriz, denominada por el programa en esa ocasión Name of loci file. Name of N array. Es una matriz rectangular que indica el número de individuos que tiene cada una de las poblaciones. Su estructura se especifica en la siguiente figura.

Locus 1 con 3 alelos Locus 2 con 2 alelos Locus 3 con 2 alelos Número de individuos en cada población Locus 4 con 3 alelos Para calcular una matriz de similitud con datos genéticos se emplea el módulo Dis/similarity utilizando los siguientes enlaces Dis/similarity /Genetic distance Para información sobre coeficientes pueden consultarse en Help/ En este apartado también puede encontrarse información sobre los archivos de entrada requeridos en función de los coeficientes utilizados. La pantalla de entrada de datos se presenta a continuación. Parameters

2.3. CALCULAR EL DENDROGRAMA. Se seguirá el mismo proceso que el descrito en el apartado 1.4.1.3 (Pg. 19) A continuación se presenta un ejemplo del resultado final.

3. TEMAS COMPLEMENTARIOS. 3.1. VISUALIZACIÓN E IMPRESIÓN DE CUALQUIER ARCHIVO GENERADO POR ALGUNO DE LOS SUBPOGRAMAS. En cualquier momento se puede visualizar cualquiera de los archivos guardados, con el módulo Output Los archivos visualizados en el Report listing pueden guardarse en formato texto (=.txt) y posteriormente pueden ser recuperados en cualquier programa de tratamiento de textos

3.2. VOLVER A DIBUJAR DENDROGRAMA O PROYECCIONES DE UBC SOBRE COMPONENTES PRINCIPALES. Se puede volver a dibujar un dendrograma con el módulo Cluster utilizando el enlace Cluster / Tree plot.

Y un diagrama tridimensinal con el módulo Graphics utilizando el enlace Graphics / Mod3D plot.

3.3. VALIDACIÓN DEL ANÁLISIS DE CONGLOMERADOS. 3.3.1. Cuantificación de la distorsión debida al método de agrupación empleado mediante la elaboración de la matriz cofenética. 3.3.1.1. Calcular la matriz de cofenética (matriz diagonal) a partir del fenograma. 3.3.1.2. Comparar la matriz de similitud original y la matriz cofenética.

Los resultados obtenidos se presentan a continuación:

3.3.2. Comparación de la similitud entre diferentes métodos de caracterización. 3.3.2.1. Opción 1: Comparar las matrices de similitud. Los resultados obtenidos se presentan a continuación:

3.3.2.2. Opción 2: Medir la coincidencia entre las estructuras taxonómicas derivadas de las matrices de similitud. La pantalla resultante se muestra a continuación.

Presionando en el botón que aparece en la parte inferior izquierda, señalado en rojo en la pantalla anterior, se obtiene el dendrograma de consenso. 3.3.3. Métodos de remuestreo en las matrices de datos: Bootstrapping. 3.3.3.1. Obtención de las matrices remuestreadas El primer paso es realizar el remuestreo para lo que se emplea el módulo Transformation utilizando los siguientes enlaces Transformation / Resample La matriz de entrada Input data file es la matriz básica de datos. Lo que se remuestrean son los caracteres. En función de la estructura de la matriz básica de datos, el remuestreo deberá hacerse por filas o por columnas. El número de remuestreos debe ser como mínimo de 100.

3.3.3.2. Obtención de una matriz de similitud por cada una de las matrices remuestreadas. Se utiliza el mismo procedimiento descrito para el apartado 1.5.1 (Pág. 22). En este caso habrá 100 matrices de entrada, las obtenidas mediante la técnica de remuestreo. A efectos prácticos la salida del módulo anterior guarda las 100 matrices de forma que puedan ser directamente tomadas por el modulo Dis/similarity.

3.3.3.3. Obtención de la matriz de similitud promedio. Para esto se emplea el módulo Transformation mediante los siguientes enlaces Transformation / Summary La matriz de entrada Input file es la obtenida en el paso anterior

3.3.3.4. Calcular y dibujar el dendrograma a partir de la matriz de similitud promedio. Se seguirá el mismo proceso que el descrito en el apartado 1.4.1.3 (Pág. 19).