Curso de diseño experimental 2137 Juan C. Benavides Alberto Ramírez "Big" Biodiversity Experiment Universidad de Minnesota
Objetivos generales del curso Familiarizar al estudiante con las formas más comunes de diseño de experimentos en ecología general y de poblaciones, y su relación con los análisis estadísticos más adecuados para cada tipo de diseño
Métodos Clases practicas Lunes 11am-1 pm (J Benavides) Ejercicios Practica en R - experimentos simulados Revisión literatura Clases teóricas Martes 11am -1 pm (A Ramírez) Conceptos Practicas en Excel - experimentos simulados
Contenido Teoría estadística Muestreo Comparación de 2 promedios Comparación pareada Análisis de regresión lineal Análisis de correlación lineal Comparación de más de 2 promedios, ANOVA de 1 factor Comparación de medianas Comparación de más de 2 promedios, ANOVA de 2 factores ANOVAS anidados PCA - Análisis de Componentes Principales
Evaluación 3 talleres 30% cada uno 1er taller Temas: muestreos, comparación de dos promedios Fecha entrega: Ago 29 2º taller Temas: Regresion, correlacion, PCA Fecha entrega: Oct 10 3er taller Temas: Anovas (factorial, anidadas) Fecha entrega: Nov 7 Participación en clase 10% Discusión de artículos con técnicas estadísticas relevantes Taller en Sept 26
Contacto profesores Juan C. Benavides Correo e: jubenavides@javeriana.edu.co Pagina e: lepicolea.wordpress.com Blackboard Alberto Ramírez Correo e: alberto.ramirez@javeriana.edu.co Blackboard
Introducción a R Diseño experimental 2137 Juan C. Benavides
Porque R Es gratis El código es abierto (todos podemos ver cuales son los procedimientos específicos) Puede ser usado en múltiples plataformas Contiene herramientas de programación estadística Las gráficas son de alta calidad
R no es facil Una curva de aprendizaje muy lenta Usted trabaja mucho y ve pocos resultados Los resultados son en serie y no salen de una sola instrucción http://2.bp.blogspot.com/-waxzouu9d3y/utzbalvprvi/aaaaaaaaani/pb3p9nzt3om/s1600/steep+learning+curve.jpg
R no es facil Una curva de aprendizaje muy lenta https://sites.google.com/a/nyu.edu/statistical-software-guide/_/rsrc/1396388441453/summary/learningcurve2.png
R CRAN (Comprehensive R Archive Network) CRAN es una red que mantiene R y sus dependencias Stack overflow es una comunidad de usuarios que atienden preguntas sobre R todos los errores que puedas tener alguien ya los resolvió y seguro subió su solución a la red
Instalación Existen versiones para Windows, Mac y Linux Descarga en https://www.r-project.org/ Pero esto descarga solo el esqueleto del programa
1. Seleccionar sistema operativo 2. Seleccionar base (solo lo básico) 3. Descargar
1. Seleccionar directorio de descarga en mis documentos
Librerias adicionales = Packages R es desarrollado por personas como nosotros Tiene una base pero la mayor parte de desarrollos estadísticos los hizo alguien no afiliado a R Se encuentran almacenados en servidores alrededor del mundo Hay uno en la nacional de bogota
Instalación de librerias-packages
Ayuda en R?solve Si usa doble interrogante hace una busqueda complete del termin??
El espacio de trabajo: Workspace R tiene una memoria volátil No almacena objetos o procesos Al cerrar una sesión todo lo trabajado se evapora Excepto si explícitamente se guarda el espacio de trabajo R trabaja sobre directorios predefinidos que se seleccionan usando la instrucción: > setwd( dirección directorio de trabajo ) > wdir( c:/tesisfinalfinalfinal/ )
El espacio de trabajo: Workspace El workspace es un archivo binario Tiene la extensión *.Rdata Se salva en el directorio de trabajo
Directorios en R El directorio de trabajo es donde R lee los archivos de datos y donde guarda los archivos de resultados El directorio se define con setwd() Y si quieres saber cual es tu directorio actual escribes getdir() Para R / y \ son diferentes D:\Dropbox\JAveriana\clases\ Es diferente de D:/Dropbox/Javeriana/clases/ Este es el correcto
R como calculadora > 1550+2000 [1] 3550 O varias operaciones en una sola línea separadas por ; (punto y coma) > 2+3; 5*9; 6-6 [1] 5 [1] 45 [1] 0
Símbolos de operaciones Simbolo Significado + Suma - Resta * Multiplicación / División ^ Exponencial
Números en R: NAN y NA NAN (No un número) NA (missing value-valor no existente) R maneja de manera predeterminada los valores NA > x [1] 1 2 3 4 5 6 7 8 NA > mean(x) [1] NA > mean(x,na.rm=true) [1] 4.5
Objetos en R Los objetos tienen valores que son asignados La asignación se hace usando la configuración de asignacion <- (Tecla menor que y guion) También puede ser con la tecla = pero puede generar confusión Nunca usar caracteres copiados de Word (Smart tags) Reconoce mayúsculas y minúsculas BASE diferente de base o Base o BasE
R es un lenguaje orientado a objetos Numeros (0D) Vectores (1D) Matrices (2D) Arreglos (arrays)-(nd)
Funciones internas R tiene una cantidad de funciones internas Las funciones en R son seguidas por parentesis () Al interior de los parentesis van las condiciones y objetos sobre los que se realiza la function vector, matrix, array, dataframe
Vectores Vectores son variables con 1 o mas valores Una variable con un solo valor es un escalar A En R un escalar es un vector de longitud 1 Hay varias maneras de crear un vector: Lista de valores- c( ) Una sequencia (seq) Concatenar (paste) Scanear (scan) http://stackoverflow.com/questions/11488820 /why-use-c-to-define-vector
Vectores Un vector se crea usando la letra c(..) al inicio c de combine Los vectores pueden contener texto pero este va entre comillas http://stackoverflow.com/questions/11488820 /why-use-c-to-define-vector
Matrices Estructura en dos dimensiones (arregloarray) Colnames le da nombre a las columnas de una matriz
Arrays-arreglos Arrays son objetos númericos con un atributo de dimensión Arreglos tienen mas de dos dimensiones
Deconstruyendo las estructuras de datos Fijense en los corchetes [] en la imagen Los corchetes luego de un objeto nos permite extraer filas o columnas o ambos de un objeto
Deconstruyendo las estructuras de datos x<-c(2,5,7,9,10) x[3] #selecciona el tercer elemento de x
Deconstruyendo las estructuras de datos Una matriz esta compuesta de filas y columnas En R filas son el primer elemento y columnas el segundo a[x,y] #Primera fila de a es a[1,:] #Primera columna de a es a[,1]
Imágenes en RGB tienen 3 dimensiones
Tutoriales en PDF P. Kuhnert & B. Venables, An Introduction to R: Software for Statistical Modeling & Computing J.H. Maindonald, Using R for Data Analysis and Graphics B. Muenchen, R for SAS and SPSS Users W.J. Owen, The R Guide D. Rossiter, Introduction to the R Project for Statistical Computing for Use at the ITC W.N. Venebles & D. M. Smith, An Introduction to R
Interfaces Intermediarios que hacen la vida mas fácil R Studio https://www.rstudio.com/products/rstudio/download/ Notepad++ https://notepad-plus-plus.org/ Sublime https://www.sublimetext.com/3