PRÁCTICAS DE ESTADÍSTICA CON R

Documentos relacionados
Prácticas de Introducción a los Computadores Curso Hoja Gráficos: Hoja Regresión: ESPESOR 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 ESPESOR COSTES fij

PRÁCTICAS DE ESTADÍSTICA CON R

Introducción Excel 2007

Primeros Pasos con R. José Enrique Martín García Universidad Politécnica de Gimialcón (Copyright 2015)

MANUAL Y ACTIVIDADES. Edublogg.wordpress.com. Caeiro Fábregas - Pérez

Microsoft Word 2000 Laboratorio de Informática Facultad de Agronomía y Agroindustrias - Año 2006.

-- Hojas de cálculo. Aplicaciones Google. Fecha creación: 24/03/2017. Fecha revisión: 24/02/2017. Revisión: 01. Iker Landajuela <

PRÁCTICA: ESTADÍSTICA DESCRIPTIVA CON SPSS 1

ARCHIVOS DE LA APLICACIÓN DE TRATAMIENTOS DE TEXTOS, UBICACIÓN, TIPO Y OPERACIONES CON ELLOS

ALMACENAMIENTO Y RECUPERACIÓN DE UN LIBRO

Determinación experimental de la velocidad de propagación de la onda en instrumentos de cuerda

Data Science. Habilidades. Dificultad. Notas. Módulo 2. Introducción a RStudio. Lección 2.1. Herramientas

ESTADÍSTICA CON EXCEL

INDICE PARTE I AMBIENTE DE TRABAJO Instalación de Winplot 1.2. Conociendo Winplot Ambiente de trabajo. 1.4.

Puedes añadir nuevos programas desde un disco o una unidad de CD-ROM, por ejemplo, un juego o el nuevo programa de contabilidad.

Centrar Barra formato Formato de celdas Alineación Horizontal Derecha

UNIVERSIDAD NACIONAL DE INGENIERÍA Departamento de Lenguajes y Simulación Guía de laboratorio I

07 Variables. 7.1 Variables globales Definición

Freemind y Dia. Edición Abalar FERROL By Tino Fernández

OPENOFFICE CALC. Manejo básico de hojas de cálculo

Distribuciones de Probabilidad.

Excel Fundamentos de Excel. Área académica de Informática

Calc I Primeros pasos: Entorno de trabajo, celdas y. rangos

Manual Gran Hotel. En principio, una estacionalidad no tiene el fin marcado, puede ser válida para siempre.

Cada repuesta correcta suma 0,4 puntos. Cada repuesta incorrecta resta 0,1 puntos. La doble marca no puntúa

PYTHON. Programación básica

COMBINAR CORRESPONDENCIA

Unidad N 3. Operaciones con archivos.

Primer ha de saberse que las funciones son la herramienta más útil de. Excel, ya que con ella podemos realizar cálculos. Veamos a continuación

Concesionario de coches

Cómo crear una infografía sencilla en Excel 2013 y 2016

TUTORIAL SOBRE HOJAS DE CALCULO

Estadística I Guión de la Práctica 2 Probabilidad y modelos probabilísticos; Introducción a la inferencia estadística

Exámenes: creación. Creación de exámenes con la herramienta Exámenes. Lección 18 a

Manejo de la hoja de cálculo Calc. 1. Cómo abrir y guardar un archivo de Calc?

Práctica 1: Introducción a MATLAB.

TRABAJO PREVIO. En este apartado veremos de qué está compuesta una hoja de cálculo y cómo eso nos puede facilitar nuestro trabajo.

CALCULO GRADO EN INGEN. INFORM. DEL SOFTWARE PRACTICA 1. INTRODUCCIÓN A MATLAB

Tenemos varias opciones para abrir el programa. Una posibilidad es partir del botón Inicio.

CURSO DE EXCEL OPERACIONES CON ARCHIVOS

Curso de iniciación a las TIC en Educación Permanente CEP de Castilleja (Sevilla) (octubre/noviembre 2009) Calc. Eva Sánchez-Barbudo Vargas

Exámenes: creación. Creación de exámenes con la herramienta Exámenes. Lección 18 a

MATERIAL PREVIO A LA PRIMERA PRÁCTICA: INTRODUCCIÓN AL ENTORNO WINDOWS INTRODUCCIÓN AL PAQUETE ESTADÍSTICO SPSS

2.7.- Insertar Tablas

Pre-Laboratorio 1 MA-33A : Introducción a Matlab

Manual para la migración de correos desde Open WebMail a cuenta GMail provista por Google Apps para la Facultad de Ciencias Médicas de la U.N.C.

Performance9 v2.01. Guia de administrador

Manual de instalación de R y R Commander

Todas las tareas que se realizan en un computador implican el uso de archivos y carpetas.

SuperCOMPRAS-GOBIERNO GUÍA DE INSTALACIÓN

Este programa estadístico está organizado en dos bloques: el editor de datos y el visor de resultados.

1ª OPCION Exportando en el ordenador de origen e importando después en el de destino.

Manual de OpenOffice Impress

Cómo compilar un programa utilizando el Digital Visual Fortran Compiler? Seminario de Computación 2009 Juan Ruiz y Carlos Zotelo

OPENOFFICE IMPRESS. Creación básica de presentaciones digitales

biblioteca.unizar.es Introducción a RefWorks

UNIDAD 10. Introducción

Creación de formularios con Microsoft Forms

IS09. Introducción a los Computadores Práctica 1. Introducción al computador básico

Manual de instalación y configuración del programa de acceso a las cámaras. Localizamos el archivo que nos hemos descargado de la web.

SESIÓN 7 MANEJO DE DOCUMENTOS.

INSTITUCION EDUCATIVA MANUEL ANGEL ANACHURY AREA: TECNOLOGIA E INFORMATICA

1ª OPCION Exportando en el ordenador de origen e importando después en el de destino.

Las operaciones aritméticas básicas en MATLAB son las más sencillas que se pueden

MODIFICAR TABLA DE DATOS ACCESS Manual de Referencia para usuarios. Salomón Ccance CCANCE WEBSITE

MODIFICAR TABLA DE DATOS ACCESS Manual de Referencia para usuarios. Salomón Ccance CCANCE WEBSITE

Sesión 4 Introducción a Stata III

OneDrive. Descarga del contenido para móvil

Chapter 1. Introducción al Scientific Notebook 4-1

Configuración de puestos remotos en ITACTIL (Windows 10)

Vamos a profundizar un poco sobre los distintos tipos de datos que podemos introducir en las celdas de una hoja de cálculo

Desarrollo y Construcción de Prototipos Electrónicos

En esta práctica vamos a realizar una base de datos sencilla pero completa mediante Microsoft Access.

Crear una macro automáticamente

Módulo Instalación en ordenadores con conexión a Internet

Práctica: El gestor de base de datos FileMaker Pro 12

EJERCICIOS DE PUNTOS 1.1 Y 1.2. Ciudadano digital. Depto. de Ciencias de la Computación.

PREPARANDO EL ENTORNO DE DESARROLLO. DESCARGAR E INSTALAR NOTEPAD++ COMO EDITOR DE CÓDIGO (CU00708B)

Objetivos. Contenido. 5 Introducción de fórmulas

Iniciar una combinación de correspondencia

PERIODO 3 HOJA DE CÁLCULO CONCEPTOS INTERMEDIOS OPERACIONES CON CELDAS, FILAS Y COLUMNAS EN EXCEL SELECCIONAR COPIAR MOVER BORRAR

1.- CREACIÓN DE CONSULTAS.

CAPÍTULO 8 ANÁLISIS DE DATOS 1.- LECTURA DE DATOS 2.- GRÁFICOS 3.- MEDIDAS DE CENTRALIZACIÓN Y DE DISPERSIÓN 4.- DETECCIÓN DE DATOS ATÍPICOS

=A1+A2+A3+A4+A5+A6+A7+A8+B1+B2+B3+B4+B5+B6+B7+B8+C1+C2+C 3+C4+C5+C6+C7+C8

CONSTRUCCIÓN DE MODELOS DINÁMICOS CON VENSIM PLE

EDITORIAL TUTOR FORMACIÓN

Objetivos: Descripción del curso. Curso: Dirigido a: Microsoft Excel Básico 2016 UNIVERSIDAD NACIONAL DE INGENIERÍA

$0 Representa al parámetro cero o nombre del programa $1 Representa al parámetro uno $2 Representa al parámetro dos

MÓDULO V: GESTIONAR ARCHIVOS Y CARPETAS DE DOCUMENTOS

REPLANTEO REALIZADO POR JAVIER ERCE.

HERRAMIENTAS DEL PAINT

Manual de Administración Solución ADSL Profesional

NOCIONES BASICAS DE Miguel Iván Bobadilla

Tecnología ESO. Tareas para realizar con ordenador

Herramientas generales Mantenimiento de empresas

INTRODUCCIÓN AL MANEJO DE CARPETAS Y ARCHIVOS. Edublogg.wordpress.com. Caeiro Fábregas - Pérez

UNIDAD 6 TEMA 4: OFIMÁTICA AVANZADA. CLASE 04: PLANTILLAS

Boleta Digital 2009 Manual de Usuario

Transcripción:

PRÁCTICAS DE ESTADÍSTICA CON R

PRÁCTICA 1: INTRODUCCIÓN A R 1.1 Empezando a trabajar con R El programa R (software libre) se puede descargar en la siguiente dirección de internet: http://cran.r-project.org/. Para hacernos una idea de cómo trabaja R veamos un ejemplo de una sesión (tras teclear el texto en negrita pulsar Enter): <- rnorm(11) # Se generan 11 números aleatorios de una distribución N(0,1) [1] 1.248696794 1.270055408-1.846021426-0.878438503 0.278742064 [6] 2.219470550-0.028439195-1.142189194 0.357516150-0.873171993 [11] -0.582792094 En las líneas anteriores se observa que después de introducir las instrucciones (en negrita) y tras pulsar Enter el programa nos va devolviendo las salidas correspondientes a cada sentencia. Es de resaltar que la primera sentencia <- rnorm(11) al igual que ocurre con otras, no da directamente ninguna salida; sencillamente almacena el valor de x. Si queremos visualizar ese valor debemos ejecutar la siguiente sentencia que nos da los 100 valores de x que se habían almacenado en la sentencia anterior. Para empezar a trabajar con el programa realizaremos una de las tareas más sencillas que pueden ser llevadas a cabo en R; se trata de la introducción de una expresión aritmética y la obtención del resultado devuelto por el programa. Por ejemplo, > 5*8 [1] 40 > exp(1) [1] 2.718282 Para asignar un valor a una variable se utilizan los símbolos <-. Para insertar los comentarios que se deseen, basta anteponerles el símbolo #: > # Ahora vamos a definir la variable x <-5

[1] 5 ^3 [1] 125 *8 [1] 40 Cuando falta algo para completar una sentencia aparece el símbolo+: > sqrt(3 + Si completamos ahora la expresión, en este caso con el cierre del paréntesis, el programa escribe el resultado: > sqrt(3 + ) [1] 1.732051 1.2 Introducción de datos Para construir un vector se utiliza la sentencia c(): > pesoenkg<-c(5,2.8,3.7,4.6,8.1,3.2) > pesoenkg [1] 5.0 2.8 3.7 4.6 8.1 3.2 > pesoengr<-pesoenkg*1000 > pesoengr [1] 5000 2800 3700 4600 8100 3200 Para construir series de valores, por ejemplo los números impares comprendidos entre 1 y 65, hacemos: > seq(1,65,2) [1] 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 [26] 51 53 55 57 59 61 63 65 Mediante la función rep es posible repetir un patrón dado, incluso caracteres: > rep(8,4) [1] 8 8 8 8 > rep(98,5) [1] 98 98 98 98 98 > rep(c("sí","no"),3) [1] "sí" "no" "sí" "no" "sí" "no" 1.3 Lectura de datos de un archivo Si se desea cargar datos desde un archivo externo, por ejemplo si se quiere leer el archivo 2-Tensión de rotura.txt debemos especificar con total exactitud primero la ruta y finalmente el nombre del archivo, todo ello entre comillas. Es conveniente poner el símbolo \\ en lugar de \:

de También es posible crear un archivo en Excel (data frame o marco de datos) y pasarlo a R. Por ejemplo, creamos el archivo DF.txt y lo guardamos como Texto (delimitado por tabulaciones). Costo.unit Costo.mat Costo.mano.de.obra 13.59 87 80 15.71 78 95 15.97 81 106 20.21 65 115 24.64 51 128 Los puntos que aparecen, en lugar de los espacios de los nombres de las variables, deben ser colocados para que funcione la sentencia read.table. Ahora leemos el > tensión<read.table("c:\\estadística\\prácticas\\tensión rotura.txt") > tensión V1 1 4.05 2 4.58 3 4.42... 49 3.54 50 4.84 archivo DF.txt : >df<read.table("c:\\estadística\\prácticas\\df.txt",header =T) > df Costo.unit Costo.mat Costo.mano.de.obra 1 13.59 87 80 2 15.71 78 95 3 15.97 81 106 4 20.21 65 115 5 24.64 51 128 El argumento header=t significa que la primera línea del marco de datos contiene los nombres de las variables. Con attach las variables son accesibles por su nombre en la sesión de R y con names se consigue una lista de las variables: > attach(df) > names(df) [1] "Costo.unit" "Costo.mat" "Costo.mano.de.obra" > Costo.mat [1] 87 78 81 65 51

Si queremos conocer de qué tipo es una variable concreta hacemos > mode(costo.mat) [1] "numeric" 1.4 Cómo definir funciones Para definir nuevas funciones en R, como por ejemplo f(x) = 2x 5 3, se hace: > f<-function(x) 2*x^5-3 > f(3) [1] 483 También se pueden definir funciones de dos o más variables y aprovechar la forma en que trabaja R con vectores para realizar todas las operaciones con una sola evaluación. Supongamos, por ejemplo, que queremos evaluar la función x + y z = x + y 2 2 en 8 puntos (x,y). Podemos comenzar creando los vectores que contienen los valores de interés: <-1:8 [1] 1 2 3 4 5 6 7 8 > y<-rep(5,8) > y [1] 5 5 5 5 5 5 5 5 Definimos ahora la función z, cuyo valor será evaluado en los puntos (x,y) definidos anteriormente: > z<-(x^2+y^2)/(x+y) > z [1] 4.333333 4.142857 4.250000 4.555556 5.000000 5.545455 6.166667 6.846154 1.5 Cómo gestionar una sesión de R Al iniciar una sesión de R hay un directorio de trabajo donde el programa busca, por defecto, cualquier archivo que sea solicitado y donde coloca los archivos que se crean durante la sesión. Es conveniente utilizar distintos directorios para distintos proyectos. Para ver en qué directorio se está trabajando se hace > getwd() [1] "C:/Archivos de programa/r/r-2.3.1" Si queremos cambiar de directorio elegimos en el menú

File Æ Change dir Todos los objetos (variables) creados en R se almacenan en un workspace (puede haber varios) o espacio de trabajo común. Para ver qué objetos se han definido elegimos en el menú Misc Æ List objects y para eliminarlos todos Misc Æ Remove all objects Si sólo se quieren eliminar, por ejemplo, los objetos pesoenkg y pesoengr hacemos > rm(pesoenkg,pesoengr) Estas acciones y otras pueden ser llevadas a cabo también con los botones del menú, del mismo modo que hemos hecho para ver o eliminar los objetos del workspace. Es posible guardar el workspace en un archivo en cualquier momento haciendo File Æ Save Workspace El workspace está formado sólo por objetos, y no por ninguna entrada obtenida durante la sesión. Si se desean guardar las salidas hay que utilizar File Æ Save to File o bien Cortar y Pegar. La historia de los comandos introducidos en una sesión puede ser guardada y cargada mediante File Æ Save/Load History Para ver todos los comandos introducidos durante una sesión hacemos > history(inf) Algunos paquetes (packages) para aplicaciones especiales son parte de la instalación básica de R; otros pueden ser obtenidos en la misma página web de donde se descarga el programa. Para ver qué paquetes están instalados hacemos > library() y, por ejemplo, para cargar el paquete datasets, hacemos > library(datasets) o bien en el menú usamos la herramienta Packages. Para ver el contenido de datasets hacemos

> library(help=datasets) Una forma muy práctica de gestionar una sesión de R consiste en lo siguiente: una vez terminada la sesión, copiamos y pegamos la salida de la instrucción history(inf) en un editor de texto generando un archivo de extensión.txt. Este archivo es susceptible de ser manipulado, cambiando datos, introduciendo nuevas variables, etc. Posteriormente se copia y se pega en R obteniéndose las correspondientes salidas a los cambios efectuados. Veamos un ejemplo: Supongamos que partiendo de los datos del vector x queremos obtener sus cuadrados, sus cubos y la suma de todos los valores al cuadrado. Haríamos lo siguiente: <-c(1,-2,3,-8.23,9.06,-2.8,6,-0.5,3,-4) [1] 1.00-2.00 3.00-8.23 9.06-2.80 6.00-0.50 3.00-4.00 > y<-x^2 > y [1] 1.0000 4.0000 9.0000 67.7329 82.0836 7.8400 36.0000 0.2500 9.0000 [10] 16.0000 > z<-x^3 > z [1] 1.0000-8.0000 27.0000-557.4418 743.6774-21.9520 216.0000 [8] -0.1250 27.0000-64.0000 > sum(y) [1] 232.9065 > history(inf) La salida de la última instrucción la introducimos en un editor de texto obteniendo el archivo Documento1.txt : x<-c(1,-2,3,-8.23,9.06,-2.8,6,-0.5,3,-4) x y<-x^2 y z<-x^3 z sum(y) Supongamos ahora que el primer elemento del vector x lo cambiamos de 1 a 13 y que en vez de calcular las potencias cúbicas de x calculamos las potencias cuartas. Efectuamos esos cambios en el archivo Documento1.txt, después lo seleccionamos todo y lo pegamos en R obteniendo lo siguiente: <-c(13,-2,3,-8.23,9.06,-2.8,6,-0.5,3,-4)

[1] 13.00-2.00 3.00-8.23 9.06-2.80 6.00-0.50 3.00-4.00 > y<-x^2 > y [1] 169.0000 4.0000 9.0000 67.7329 82.0836 7.8400 36.0000 0.2500 [9] 9.0000 16.0000 > z<-x^4 > z [1] 28561.0000 16.0000 81.0000 4587.7457 6737.7174 61.4656 [7] 1296.0000 0.0625 81.0000 256.0000 > sum(y) [1] 400.9065

PRÁCTICA 1: EJERCICIOS ÉEjercicio 1-1: Considérese la siguiente tabla de valores: hora 1 3 5 7 9 11 13 15 17 19 nivel -20,5 23,2-88 -24,5 22 21-57 34,8 33-21,9 1º) Listar todos los objetos que estén en el workspace de R y eliminarlos. 2º) Con los datos de la tabla construir, mediante un editor de texto, el archivo de texto entrada.txt y guardarlo en el disco duro C. 3º) Leer el archivo anterior y generar un marco de datos, denominado datos. 4º) Obtener el cuadrado de cada uno de los valores de las dos variables y guardar los resultados construyendo el archivo de texto salida.txt. ÉEjercicio 1-2: Generar todos los números pares comprendidos entre 100 y 199. Realizar un gráfico en el que las abscisas sean estos valores y las ordenadas sus logaritmos naturales, y otro en el que las ordenadas sean sus cosenos. ÉEjercicio 1-3: Definir y representar gráficamente la siguiente función: x 1 si x (2,4) f( x) = 2 0 en otro caso ÉEjercicio 1-4: Generar una lista aleatoria de 100 números naturales comprendidos entre 1 y 10. Ordenar los valores obtenidos en orden creciente y decreciente. ÉEjercicio 1-5: La función mean está integrada en R y sirve para calcular la media aritmética de un conjunto de datos. Construir una función que haga lo mismo que la función anterior. Ilustrarlo con un ejemplo.