Prácticas Propuestas Tema 1 R

Documentos relacionados
Taller de Introducción a R 2. Manipulación de datos

Operadores aritméticos: suma (+), resta (-), producto (*), cociente (/) y potencia (**).

Curso. Análisis de datos con R.

UNIDAD 4: MATRICES, MARCOS DE DATOS Y LECTURA DE DATOS EN R

Aspectos Estadísticos de Microarrays TP 2 Dpto. de Matemática - Instituto de Cálculo 2do. Cuatr Dra. Diana M. Kelmansky

GUÍA TEÓRICO PRÁCTICA 2.

Rúbrica evaluativa. SUBPRODUCTO 1: Descripción de artículos

Taller 1 Utilización eficaz de hojas de cálculo Excel

Formato de Numero Microsoft Excel.

Ejercicios de R Alex Sánchez 28/03/2015

Nociones generales sobre R

Proyecto de Innovación Docente: Guía multimedia para la elaboración de un modelo econométrico.

SESIÓN PRÁCTICA 3: TRANSFORMACIONES DE DATOS PROBABILIDAD Y ESTADÍSTICA. PROF. Esther González Sánchez. Departamento de Informática y Sistemas

ULADECH Escuela Profesional de Contabilidad

Tutorial Ambiente de Trabajo en InfoStat

2).- Nombre de función. Para obtener una lista de funciones disponibles, haga clic en una celda y presione MAYÚSC+F3.

Introducción Comandos básicos en R. Introducción a R. Felipe Bravo Márquez. 13 de noviembre de 2013

MATERIAL INTRODUCTORIO ORACLE 11G

Manejo de Filas, Columnas, Celdas y Rangos

5.2. Combinar celdas Ajustar texto a la celda Insertar filas y columnas Insertar filas Insertar columnas. 5.5.

INSTRUCTIVO PARA LA PREPARACIÓN DE ARCHIVOS A REPORTAR EN MEDIOS MAGNETICOS

Introducción a Stata STATA

Este programa estadístico está organizado en dos bloques: el editor de datos y el visor de resultados.

Informática y Computación III Guía de Estudio (50 reactivos)

Práctica 2: Estadística Descriptiva (II)

Inicie R en el directorio en un directorio de trabajo específico y cargue el paquete marray

Information Retrieval:

Introducción a Stata - Segunda Parte

Venta de Pasteles. Piezas. 3 Leches Chocolate. Del 26 al 30 de Enero MICROSOFT GRAPH Conceptos básicos

Taller de análisis estadístico con R 2. Manipulación de datos

Lección 1. Estructura de las Tablas Bases de Datos para la creación de informes de Tabla Dinámica.

Instalación e introducción al software estadístico R y la librería R-Commander. Estadística descriptiva.

Registro electrónico

Crear una tabla dinámica

Maribel Martínez y Ginés Ciudad-Real Fichas para mejorar la atención MATRIZ DE LETRAS

Comenzando con R Commander Una vez cargado R Commander, aparecerá la siguiente ventana

Práctica 2 Estadística Descriptiva

Profa. Alice Contreras

Uso y Manejo Básico de Bases de datos en STATA 12

Microsoft Excel 2010 Nivel - Intereio CLASE 1 DE 4

Operaciones básicas con hojas de cálculo

Estadística Inferencial. Estadística Descriptiva

Módulo de Microsoft Excel 2010 CUADERNO DE PRÁCTICAS

... Bases de datos con Excel CAPÍTULO Creación de una Base de Datos

Análisis Exploratorio de Datos

Prácticas R. Grupo de investigación de Diseño y Análisis de Experimentos (OED) Red nacional de Bioestadística (BioStatNet)

1 Empecemos Manipulación de vectores. Introducción a R

CALIFICACIONES FINALES MANUAL PARA DOCENTES

ACCESS Duración en horas: 20

Tema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0

Computación II. Introducción a Visual Basic

Herramientas computacionales para la matemática MATLAB: Análisis de datos.

Tema 7. Más allá de VideoPoint.

Sistema de Registro, Derivación y Monitoreo Chile Crece Contigo

1 UNIDAD 4 - CREA TABLAS DINÁMICAS Y GRÁFICOS DINÁMICOS

Tecnología: desarrolla comprensión en el armado de un prototipo de robótica empleando sistemas mecánicos y eléctricos para generar su animación.

One way anova using SAS

HOJAS DE CÁLCULO (4º ESO)

UNIDAD 2- LA CREACIÓN DE TABLAS EN ACCESS 2010

Aplicaciones de Estadística Descriptiva

Tipos de gráficas y selección según los datos CIENCIA, TECNOLOGIA Y AMBIENTE

INTRODUCCIóN A LA PROGRAMACIóN APUNTES DE JAVA APUNTES DE JAVA

1. COMPARTIR Y MANTENER LIBROS

Ejemplos de análisis cluster

Estadística I. Finanzas y Contabilidad

Introducción al SPSS/PC. 1. El editor de datos. Taller de Estadística

MATEMÁTICA D INTRODUCCIÓN A SCILAB. Por: Dr. Javier Francesconi

Competencias TIC para profesionales Del Siglo 21

INTRODUCCIÓN AL ANALISIS ESTADISTICO CON R UNA MIRADA RAPIDA

Consultas SQL INNER JOIN

CIENCIAS BIOLÓGICAS 5º CURSO MODELOS LINEALES EN BIOLOGÍA. Práctica nº 2. Análisis de datos con SPSS

1. Introducción al programa R

Módulo Hojas de Cálculo

Escritura Básica de Sentencias SQL. Copyright Oracle Corporation, All rights reserved.

PLANOS. Técnicas de Representación Gráfica. Curso

Qué es una tabla dinámica? Para qué sirve una tabla dinámica?

Computación Aplicada. Universidad de Las Américas. Aula virtual de Computación Aplicada. Módulo de Excel 2013 LIBRO 7

Infraestructura y Características Socioeconómicas de las Localidades con menos de 5 mil habitantes. Manual del usuario

Introducción al uso de R-commander.

IIC Sistemas Recomendadores

Unidad 1. Obtención, Medición y Representación de Datos. Estadística E.S.O.

INSTRUCTIVO PARA CREAR ARCHIVO PLANO DESDE MICROSOFT EXCEL

Ciudad de México, de abril de 2012

TUTORIAL SOBRE HOJAS DE CALCULO

Computación Aplicada. Universidad de Las Américas. Aula virtual de Computación Aplicada. Módulo de Excel 2013 LIBRO 2

GUIA TEÓRICO PRÁCTICA 1: Primera Parte: Introducción al R

Temario 2012 para la certificación de MS Excel Nivel Fundamentos Para versiones de Ms Office 2007 y sucesivas

FÓRMULAS MATEMÁTICAS EXCEL Manual de Referencia para usuarios. Salomón Ccance CCANCE WEBSITE

Programación Modular. Informática aplicada al medio ambiente curso 2010/2011

FUNCIONES NUMÉRICAS EXCEL Manual de Referencia para usuarios. Salomón Ccance CCANCE WEBSITE

Oracle Database: Introducción a SQL

$0 Representa al parámetro cero o nombre del programa $1 Representa al parámetro uno $2 Representa al parámetro dos

INSTITUCIÓN EDUCATIVA LICEO DEPARTAMENTAL ÁREA DE TECNOLOGÍA E INFORMÁTICA

Informática I ACI-191. Taller de Informática

VISUALIZACIÓN DE DATOS A PARTIR DE VARIAS TABLAS

Práctica 1: Introducción a SPSS 1

Funciones avanzadas y Filtros.

Manual de ACCESS Intermedio

Bienvenidos a EVIEWS Pantalla del Menú (1) Principal

QUANTUM COMPUTACION CURSO DE PLANILLA ELECTRONICA MICROSOFT EXCEL 2013

Transcripción:

Prácticas Propuestas Tema 1 R Universidad de Granada M.Vargas Jiménez Prácticas Propuestas Tema 1 R 1/29

Prácticas iniciales 1 Uso de operadores Operadores de generación Operadores lógicos 2 Selección 3 Recodificación de variables Operaciones usuales de recodificación de datos Agrupación en intervalos 4 Operaciones con data.frames 5 Archivos Función read.table() 6 Gráficos M.Vargas Jiménez Prácticas Propuestas Tema 1 R 2/29

Prácticas iniciales 1 Uso de operadores Operadores de generación Operadores lógicos 2 Selección 3 Recodificación de variables Operaciones usuales de recodificación de datos Agrupación en intervalos 4 Operaciones con data.frames 5 Archivos Función read.table() 6 Gráficos M.Vargas Jiménez Prácticas Propuestas Tema 1 R 2/29

Prácticas iniciales 1 Uso de operadores Operadores de generación Operadores lógicos 2 Selección 3 Recodificación de variables Operaciones usuales de recodificación de datos Agrupación en intervalos 4 Operaciones con data.frames 5 Archivos Función read.table() 6 Gráficos M.Vargas Jiménez Prácticas Propuestas Tema 1 R 2/29

Prácticas iniciales 1 Uso de operadores Operadores de generación Operadores lógicos 2 Selección 3 Recodificación de variables Operaciones usuales de recodificación de datos Agrupación en intervalos 4 Operaciones con data.frames 5 Archivos Función read.table() 6 Gráficos M.Vargas Jiménez Prácticas Propuestas Tema 1 R 2/29

Prácticas iniciales 1 Uso de operadores Operadores de generación Operadores lógicos 2 Selección 3 Recodificación de variables Operaciones usuales de recodificación de datos Agrupación en intervalos 4 Operaciones con data.frames 5 Archivos Función read.table() 6 Gráficos M.Vargas Jiménez Prácticas Propuestas Tema 1 R 2/29

Prácticas iniciales 1 Uso de operadores Operadores de generación Operadores lógicos 2 Selección 3 Recodificación de variables Operaciones usuales de recodificación de datos Agrupación en intervalos 4 Operaciones con data.frames 5 Archivos Función read.table() 6 Gráficos M.Vargas Jiménez Prácticas Propuestas Tema 1 R 2/29

Ejemplos de uso de operadores Uso de los operadores :, rep(), seq() Operadores > seq(1,5,0.5) 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 > rep(8,10) 8 8 8 8 8 8 8 8 8 8 > 20:40 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 > seq(length=10,1,30) 1.000000 4.222222 7.444444 10.666667 13.888889 17.111111 20.333333 23.555556 26.777778 30.000000 M.Vargas Jiménez Prácticas Propuestas Tema 1 R 3/29

Operadores de generación Use los comandos siguientes :, rep(), seq() 1 n1:n2 2 rep(n1,n) 3 seq(n1,n2,incremento) Genera números de 2 a 20 con incrementos de 4 4 seq(length=n,n1,n2) Ejemplo Genere números consecutivos de 6 a 20 Repita 5 veces el valor 10 genere 10 valores reales entre 1 y 5 M.Vargas Jiménez Prácticas Propuestas Tema 1 R 4/29

Use ayuda para conocer mejor los comandos? Use? para pedir ayuda a R Por ejemplo, para mostrar lo que hace y cómo lo hace la función sample?sample sample(x, size, replace = FALSE, prob = NULL) M.Vargas Jiménez Prácticas Propuestas Tema 1 R 5/29

Operadores lógicos Con el vector x de valores Ejemplo de uso de operadores lógicos Operadores: ==,!=, <, >, >=,<= > x [1] 4 4 2 2 1 5 5 4 3 5 > x==4 [1] TRUE TRUE FALSE FALSE FALSE FALSE FALSE TRUE FALSE > x!=4 [1] FALSE FALSE TRUE TRUE TRUE TRUE TRUE FALSE TRUE > x>3 [1] TRUE TRUE FALSE FALSE FALSE TRUE TRUE TRUE FALSE > x<=5 [1] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE M.Vargas Jiménez Prácticas Propuestas Tema 1 R 6/29

Selección de elementos de variables y data.frames Selección Selección de elementos de un vector Selección de elementos de un data.frame Selección de filas de un data.frame Selección de columnas de un data.frame M.Vargas Jiménez Prácticas Propuestas Tema 1 R 7/29

Selección de elementos de variables y data.frames Con los objetos dtf y vect Selección Selecciona todas las columnas del dataframe dtf menos las 3 a 7 Selecciona los elementos del vector vect menos los 3 a 7 dtf[,-(3:7)] Selecciona las columnas 2 a 5 del dataframe dtf dtf[,(2:5)] vect[-(3:7)] Selecciona los elementos en posiciones pares de vect vect[2*(1:5)] M.Vargas Jiménez Prácticas Propuestas Tema 1 R 8/29

Ejemplo selección de elementos Selección Con el data.frama USArrests disponible en package data() de R, formado por 50 observaciones sobre 4 variables Selección de primeras 10 filas de la variable UrbanPop Selección de filas 4 y 7 de la variable UrbanPop Selección del elemento de fila 3 columna 4 del data.frame Selección de las últimas 10 filas del data.frame Selección de columnas 1 y 4 del data.frame Realice ejercicios similares con el data.frame swiss disponible también en package data de R M.Vargas Jiménez Prácticas Propuestas Tema 1 R 9/29

Ejemplo selección de casos que cumplen condiciones M.Vargas Realice Jiménez ejercicios Prácticas Propuestas similares Tema 1 R con el data.frame swiss disponible 10/29 Selección Con el data.frama USArrests disponible en package data() de R, formado por 50 observaciones sobre 4 variables Selección de filas cuyo valor de la variable UrbanPop supera 80 Selección de casos con 100 < Assault < 170 y UrbanPop > 70 Selección de filas que cumple 100 < Assault < 170 o UrbanPop > 70 Selección de los casos con valores en todas las variables por encima de los correspondientes cuartiles terceros. Use la función summary(usarrests) para determinarlos previamente.

Ejemplo selección de casos que cumplen condiciones Selección de casos Se hace más manejable con un nombre más corto. b= USArrests (Otra opción es usar la función attach de R que permite acceder a las variables sin especificar el nombre del data.frame) M.Vargas Jiménez Prácticas Propuestas Tema 1 R 11/29 Selección de filas cuyo valor de la variable UrbanPop supera 80. b[b$urbanpop > 80, ] (el operador lógico selecciona filas) Selección de casos con 100 < Assault < 170 y UrbanPop > 70 El operador lógico oplog es oplog=(100 < b$assault & b$assault < 170 ) & (b$urbanpop > 70) b[oplog, ]

Ejemplo continuación Selección de casos Selección de filas que cumple 100 < Assault < 170 o UrbanPop > 70 Selección de los casos con valores en todas las variables por encima de los correspondientes cuartiles terceros. Use la función summary(usarrests) para determinarlos previamente. Realice ejercicios similares con el data.frame swiss disponible también en package data de R M.Vargas Jiménez Prácticas Propuestas Tema 1 R 12/29

Recodificar variables Operaciones usuales de recodificación de datos Sustitución de categorías de un factor por otros niveles. Sustituye los niveles h y m de sexo por hombre mujer > sexo [1] m h m h m m m h Levels: h m > sexo2=factor(sexo,levels=c("h","m"), labels=c("hombre","mujer")) > sexo2 [1] Mujer Hombre Mujer Hombre Mujer Mujer Mujer Hombre Levels: Hombre Mujer M.Vargas Jiménez Prácticas Propuestas Tema 1 R 13/29

Sustitución de datos missing por códigos determinados Operaciones usuales de recodificación de datos Ejemplo 1: Sustituye 99 por NA en vector v v[v == 99] < NA Ejemplo 2: Sustituye NA por 999 en vector v v[is.na(v)] < 999 M.Vargas Jiménez Prácticas Propuestas Tema 1 R 14/29

Variables expresadas en intervalos La función cut() Permite agrupar en intervalos con extremos especificados Ejemplo > x [1] 1 4 5 5 2 4 4 1 2 3 > cut(x,br=c(0,2,5)) [1] (0,2] (2,5] (2,5] (2,5] (0,2] (2,5] (2,5] (0,2] (0,2] (2,5] Levels: (0,2] (2,5] > cut(x,br=c(1,2,5)) [1] <NA> (2,5] (2,5] (2,5] (1,2] (2,5] (2,5] <NA> (1,2] (2,5] Levels: (1,2] (2,5] > M.Vargas Jiménez Prácticas Propuestas Tema 1 R 15/29

Operaciones corrientes con data.frames Las más usadas Combinar data.frames por filas y columnas. rbind()y cbind() Uso de subset() para extraer parte de información del data.frame que cumple una determinada condición. subset(data.frame,operador lógico,select=var) División del data.frame con la función split según los niveles de un factor. split(data.frame,factor) División del data.frame con la función by(). by(data.frame,factor o lista de factores, función) División de data.frames con aggregate(). aggregate(data.frame,factor o lista de factores, función) Mezcla de data.frames con merge(). Una variable como clave permite relacionar los casos de ambos. merge(dt1,dt2,by.x= var,by.y= var ) M.Vargas Jiménez Prácticas Propuestas Tema 1 R 16/29

Ejemplos Data.frames con el mismo número de filas > a1 Provincia TasaParo 1 A 10 2 B 12 3 C 13 4 D 16 > a2 Poblacion 1 500 2 340 3 20 4 300 M.Vargas Jiménez Prácticas Propuestas Tema 1 R 17/29

Ejemplos con cbind() Resultado de unión de Data.frames por columnas > cbind(a1,a2) Provincia TasaParo Poblacion 1 A 10 500 2 B 12 340 3 C 13 20 4 D 16 300 > M.Vargas Jiménez Prácticas Propuestas Tema 1 R 18/29

Ejemplos: Uso de rbind() Data.frames con el mismo número de columnas > a1 Provincia TasaParo 1 A 10 2 B 12 > a2 Provincia TasaParo 3 C 13 4 D 16 > rbind(a1,a2) Provincia TasaParo 1 A 10 2 B 12 3 C 13 4 D 16 M.Vargas Jiménez Prácticas Propuestas Tema 1 R 19/29

Ejemplos: Uso de merge() Data.frames con variable Provincia identificando filas > b Provincia partido 1 A x 2 B x 3 C y 4 D y 5 E y > a Provincia TasaParo Poblacion 1 A 10 500 2 B 12 340 3 C 13 20 4 D 16 300 M.Vargas Jiménez Prácticas Propuestas Tema 1 R 20/29

Ejemplos: Resultado de mezcla merge() Data.frames con variable Provincia identificando filas > c=merge(a,b,by.x="provincia",by.y="provincia",all=t) > c Provincia TasaParo Poblacion partido 1 A 10 500 x 2 B 12 340 x 3 C 13 20 y 4 D 16 300 y 5 E NA NA y > M.Vargas Jiménez Prácticas Propuestas Tema 1 R 21/29

Ejemplos: Resultado de división split() división de data.frame c por partido split(c,c$partido) $x Provincia TasaParo Poblacion partido 1 A 10 500 x 2 B 12 340 x $y Provincia TasaParo Poblacion partido 3 C 13 20 y 4 D 16 300 y 5 E NA NA y > M.Vargas Jiménez Prácticas Propuestas Tema 1 R 22/29

Ejemplos: Resultado de división by() división de data.frame c por partido y resumen columnas 2 y 3 > by(c[,2:3],c$partido,summary) c$partido: x TasaParo Poblacion Min. :10.0 Min. :340 1st Qu.:10.5 1st Qu.:380 Median :11.0 Median :420 Mean :11.0 Mean :420 3rd Qu.:11.5 3rd Qu.:460 Max. :12.0 Max. :500 ----------------------------------------------------------- c$partido: y TasaParo Poblacion Min. :13.00 Min. : 20 1st Qu.:13.75 1st Qu.: 90 M.VargasMedian Jiménez Prácticas :14.50 Propuestas Tema Median 1 R :160 23/29

Ejemplos: Resultado de división aggregate() división de data.frame c3 por partido y resumen columnas 1 y 2 > c3 TasaParo Poblacion partido 1 10 500 x 2 12 340 x 3 13 20 y 4 16 300 y > aggregate(c3[,1:2],by=list(c3$partido),fun="mean") Group.1 TasaParo Poblacion 1 x 11.0 420 2 y 14.5 160 > $ M.Vargas Jiménez Prácticas Propuestas Tema 1 R 24/29

Lectura con read.table() mes ventas enero 1000 febrero 2000 marzo 1500 Lectura de archivo guardado con EXCEL como texto con tabulaciones > a=read.table("libro1.txt",head=t) > dim(a) [1] 3 2 > a mes ventas 1 enero 1000 2 febrero 2000 3 marzo 1500 M.Vargas Jiménez Prácticas Propuestas Tema 1 R 25/29

Lectura con read.table() El archivo Libro3 se guarda como texto con tabulaciones y contiene datos missing que se sustituiyen por NA en variables numéricas Lectura de archivo guardado con EXCEL como texto con tabulaciones > a=read.table("libro3.txt",head=t,sep="\t", na.strings="na") > a edad salario formacion 1 23 1500 a 2 45 3000 b 3 NA NA 4 45 1500 5 NA 3000 b M.Vargas Jiménez Prácticas Propuestas Tema 1 R 26/29

Otras variantes de read.table llevan opciones por defecto Guarde el file Libro4 como separado por comas desde Excel Luego lea con read.csv2() o con read.delim2() (aunque diga texto delimitado por comas lo guarda con punto y coma) Lectura de archivo guardado con EXCEL como delimitado por comas a=read.csv2("libro4.csv") > a=read.csv2("libro4.csv") > a edad salario formacion 1 23 1000.0 a 2 45 3000.0 b 3 NA NA 4 45 1500.0 5 NA 3000.0 b M.Vargas 6 Jiménez 34 Prácticas 3500.5 Propuestas Tema 1 R a 27/29

Representación gráfica de datos Dispositivos gráficos Un dispositivo gráfico es una ventana gráfica o un archivo. Los parámetros gráficos vienen dados por defecto, pero se pueden cambiar. > x=rnorm(100,30,5) > hist(x) > hist(x,freq=f) > hist(x,freq=f,col="red") > hist(x,freq=f,col="red",main="edad de Grupo") > Ejemplo histograma M.Vargas Jiménez Prácticas Propuestas Tema 1 R 28/29

M.Vargas Jiménez Prácticas Propuestas Tema 1 R 29/29