INTRODUCCIÓN AL AL MANEJO DE DE DATOS



Documentos relacionados
CONCEPTOS BASICOS. Febrero 2003 Página - 1/10

La ventana de Microsoft Excel

2_trabajar con calc I

Para crear una lista como la anterior, primero escribe la información, y después selecciona el texto y aplícale el formato de viñetas.

Sistema de Gestión Portuaria Sistema de Gestión Portuaria Uso General del Sistema

Operación de Microsoft Word

DOCUMENTOS COMPARTIDOS CON GOOGLE DOCS

MICROSOFT WORD 2007 AVANZADO. Unidad Didáctica Nº 1

Guía N 1: Fundamentos básicos(i)

TEMA 20 EXP. WINDOWS PROC. DE TEXTOS (1ª PARTE)

Accede a su DISCO Virtual del mismo modo como lo Hace a su disco duro, a través de:

MANUAL DE LA APLICACIÓN HELP DESK

APUNTES DE WINDOWS. Windows y sus Elementos INSTITUTO DE CAPACITACIÓN PROFESIONAL. Elementos de Windows

GENERACIÓN DE TRANSFERENCIAS

GENERACIÓN DE ANTICIPOS DE CRÉDITO

La pestaña Inicio contiene las operaciones más comunes sobre copiar, cortar y pegar, además de las operaciones de Fuente, Párrafo, Estilo y Edición.

WINDOWS. Iniciando Windows. El mouse

Fundamentos CAPÍTULO 1. Contenido

CASO PRÁCTICO. ANÁLISIS DE DATOS EN TABLAS DINÁMICAS

ESTÁNDAR DESEMPEÑO BÁSICO Recopila información, la organiza y la procesa de forma adecuada, utilizando herramientas tecnológicas.

COMISIÓN NACIONAL PARA EL AHORRO DE ENERGÍA

... Formas alternativas de escribir un texto. Columnas. anfora CAPÍTULO 4

1.- MENU DE CONTROL O MENU VENTANA: permite cerrar la ventana cambiarla de tamaño y pasar a otra ventana

POWER POINT. Iniciar PowerPoint

LABORATORIO Nº 2 GUÍA PARA REALIZAR FORMULAS EN EXCEL

Guía de Aprendizaje No. 1

UAM MANUAL DE EMPRESA. Universidad Autónoma de Madrid

Manual Oficina Web de Clubes (FBM)

Cómo creo las bandejas del Registro de Entrada /Salida y de Gestión de Expedientes?

PSI Gestión es un sistema multiusuario que le permite 2 tipos de configuraciones:

Programa diseñado y creado por Art-Tronic Promotora Audiovisual, S.L.

2. Seleccione OneDrive en la parte superior de los sitios de SharePoint u Office 365 de su organización.

Creando una webquests

Capítulo 9. Archivos de sintaxis

ICARO MANUAL DE LA EMPRESA

ORGANIZAR LA INFORMACIÓN: EL EXPLORADOR DE WINDOWS

MANUAL DE SHAREPOINT Por: Área de Administración de Aplicaciones.

ESCUELA SUPERIOR DE INFORMATICA Prácticas de Estadística UNA SESIÓN EN SPSS

Lic. Saidys Jiménez Quiroz Tecnología e Informática Grado 7 CESCOJ 2011

Microsoft Access proporciona dos métodos para crear una Base de datos.

Manual de operación Tausend Monitor

UNIDAD I PROCESADOR DE TEXTOS

MACROS. Automatizar tareas a través del uso de las macros.

WINDOWS XP REQUISITOS DEL HARDWARE PARA WIDOWS XP.

MANUAL TARIFICADOR. Clic aquí Descargar Tarificador

COMISIÓN NACIONAL PARA EL USO EFICIENTE DE LA ENERGÍA

Operación Microsoft Access 97

CAPÍTULO 4. EL EXPLORADOR DE WINDOWS XP

Manual de uso de la Consola de Administración para usuarios Administradores.

TEMA 5. INTRODUCCIÓN AL MANEJO DE ORIGIN 6.1

SMS Gestión. manual de uso

UNIVERSIDAD DE MEDELLÍN NUEVO PORTAL WEB MANUAL DE USUARIO GESTOR DE CONTENIDOS

MANUAL PARA GESTIÓN DE INCIDENCIAS INFORMÁTICAS

Guía para el tratamiento en Allegro de recibos para centros no pertenecientes a la Generalitat Valenciana.

Notas para la instalación de un lector de tarjetas inteligentes.

El programa Minitab: breve introducción a su funcionamiento. Para mostrar la facilidad con la que se pueden realizar los gráficos y cálculos

10. El entorno de publicación web (Publiweb)

Manual para usuarios USO DE ONEDRIVE. Universidad Central del Este

GESTIÓN DOCUMENTAL PARA EL SISTEMA DE CALIDAD

SISTEMA ACADEMICO-ADMINISTRATIVO MANUAL BÁSICO

GUIA COMPLEMENTARIA PARA EL USUARIO DE AUTOAUDIT. Versión N 02 Fecha: 2011-Febrero Apartado: Archivos Anexos ARCHIVOS ANEXOS

APLICACIONES INFORMÁTICAS de BASE de DATOS

TUTORIAL PRÁCTICO DE BASES DE DATOS EN ACCESS CREAR UNA AGENDA

Diplomado en. Servicio Nacional. De Facilitadores Judiciales

reemplaza menú archivo y esta situado en la esquina superior izquierda de estos programas de

TÉCNICAS DE GESTIÓN ADMINISTRATIVA PARA PEQUEÑAS EMPRESAS

La visualización de la ventana de Word tiene las siguientes partes:

Picasa es una herramienta ofrecida gratuitamente por Google. Su función es organizar, arreglar, ajustar y aplicar efectos a sus imágenes digitales.

Uso de Visual C++ Pre-Practica No. 3

Manual Web Alexia Profesor. Índice

MINI MANUAL PARA CREAR FORMULARIOS CON PHP Marzo 2007

Como crear carpetas. Abrir carpetas o archivos. La forma más sencilla y rápida para visualizar el contenido de una carpeta es la siguiente:

Procedimiento para realizar el proceso de cierre anual (Ajuste anual) en CONTPAQ i Nóminas.

Organizándose con Microsoft Outlook

RELACIÓN DE PRÁCTICAS DEL TEMA 2

LEY CONTRA EL DELITO DE LAVADO DE DINERO O ACTIVOS. CIRCULAR CNBS No. XXXX. CAPTURADOR Lavado de Activos v5.0

Tutorial de FrontPage

PESTAÑA DATOS - TABLAS EN EXCEL

Manual de NVU Capítulo 4: Los enlaces

Tutorial de Introducción a la Informática Tema 0 Windows. Windows. 1. Objetivos

Manual del usuario USO DEL MERCADO

Tutorial del administrador de la web del departamento

CAPÍTULO VI PREPARACIÓN DEL MODELO EN ALGOR. En este capítulo, se hablará acerca de los pasos a seguir para poder realizar el análisis de

BASES DE DATOS - Microsoft ACCESS 2007-

Introducción a Moodle

TEMA 5: HOJAS DE CÁLCULO. Edición de hojas de cálculo con OpenOffice Calc

MANUAL PARA OBTENER SELLOS DIGITALES

Tutorial: Primeros Pasos con Subversion

Combinar correspondencia (I)

Inventek Punto de Venta 7.0

GUÍA DE USUARIO: GOOGLE DRIVE

Al descomprimir su archivo en una carpeta podrá observar los documentos:

Sesión No. 4. Contextualización INFORMÁTICA 1. Nombre: Procesador de Texto

COMBINAR CORRESPONDENCIA EN MICROSOFT WORD

Práctica 3: Introducción a Word

Hay programas que convierten al PC en un equipo de música

Aplicación de protección con contraseña para los dispositivos flash USB de Verbatim

Qué es y para qué sirve Excel2007?

Manual de Procedimiento

Transcripción:

ISBN 978-607-425-104-3 INSTITUTO NACIONAL DE INVESTIGACIONES FORESTALES, AGRÍCOLAS Y PECUARIAS CENTRO DE INVESTIGACIÓN REGIONAL GOLFO CENTRO CAMPO EXPERIMENTAL LA POSTA INTRODUCCIÓN AL AL MANEJO DE DE DATOS UTILIZANDO SAS SAS Dra. Teresa Beatriz García Peniche Dr. Isaías López Guerrero

DIRECTORIO INSTITUCIONAL SECRETARÍA DE AGRICULTURA, GANADERÍA, DESARROLLO RURAL, PESCA Y ALIMENTACIÓN Ing. Alberto Cárdenas Jiménez Secretario Ing. Francisco López Tostado Subsecretario de Agricultura Ing. Antonio Ruiz García Subsecretario de Desarrollo Rural Lic. Jeffrey Max Jones Jones Subsecretario de Fomento a los Agronegocios INSTITUTO NACIONAL DE INVESTIGACIONES FORESTALES, AGRÍCOLAS Y PECUARIAS Dr. Pedro Brajcich Gallegos Director General Dr. Enrique Astengo López Coordinador de Planeación y Desarrollo Dr. Salvador Fernández Rivera Coordinador de Investigación, Innovación y Vinculación Lic. Marcial A. García Morteo Coordinador de Administración y Sistemas CENTRO DE INVESTIGACIÓN REGIONAL GOLFO CENTRO Dr. Vicente E. Vega Murillo Director Regional Dr. Sergio Uribe Gómez Director de Investigación Dr. Francisco Javier Ibarra Pérez Director de Planeación y Desarrollo C.P. Velia Martínez Castillo Directora de Administración Dr. Raúl Ríos Sánchez Director de Coordinación y Vinculación en Puebla M.C. Oscar G. Castañeda Martínez Director de Coordinación y Vinculación en Tabasco

CONTENIDO Pág. CAPÍTULO 1 Por qué SAS?...1 CAPÍTULO 2 Las ventanas de SAS...3 CAPÍTULO 3 Archivos permanentes en SAS...11 CAPÍTULO 4 Archivos temporales en SAS...15 Para hacer comentarios...16 Enhanced Editor...16 Creación de una base de datos en SAS...17 Mensajes del Log...18 Cambiando de archivos temporales a permanentes...20 Ver la base de datos...21 Guardar los códigos...22 Tamaño de las bases de datos guardadas en SAS...24 Acceso a los códigos guardados...24 CAPÍTULO 5 Los programas de SAS...25 Acerca de los comentarios...25 Recomendación...27 Procedimientos y órdenes (o instrucciones) de SAS...28 Manejo de los resultados...28 CAPÍTULO 6 La base de datos...31 1. Importar bases de datos de Excel...32 2. Exportar bases de datos de SAS hacia Excel...39 3. Otras formar de importar o exportar (sin Wizard)...43

CAPÍTULO 7 Más acerca de lectura de datos por SAS...47 1. Creando un archivo de datos con la orden DATA...47 2. Leyendo datos con señalador de columna...49 3. Leyendo datos escritos de corrido...50 4. Leyendo datos de archivos ASCII...51 Infile...52 Filename...52 5. Para saltar información que SAS no debe leer...53 CAPÍTULO 8. Algunos procedimientos de SAS...55 1. Para ordenar los datos...55 Proc sort...55 Para eliminar datos repetidos...56 2. Para verificar la calidad de los datos y/o resumir información de los datos crudos...56 Proc freq...56 Proc means...58 3. Para manejar la base de datos...61 Drop...61 Keep...62 Rename...62 4. Para crear variables por medio de operaciones matemáticas...63 5. Para unir dos o más bases de datos...65 Set...65 Merge...66 Otro uso de Merge...68 CAPÍTULO 9 Más de manejo de datos en SAS...71 Los condicionantes...71 If then...71 Else if then...73 If and/or.then...74 Algunas funciones de SAS...74 Fechas...74 Mes, año...75 Máximos, mínimos y sumatorias...76 Sumatoria...76

Máximos...76 Mínimos...77 Recomendaciones finales...77 CAPÍTULO 10. Algunos códigos de estadística...79 Proc glm...80 Proc mixed...84 Proc univariate...84 Prog reg...89 Para seleccionar el modelo de regresión múltiple más adecuado...92 Proc corr...93 Proc glm para análisis de varianza multivariado...94 Otras ordenes básicas...95 Where en proc means...95 Proc boxplot...95 Prueba de Chi-cuadrada en proc freq...95 CAPÍTULO 11 Algunos códigos de diseños experimentales...97 1. Diseño completamente al azar...97 2. Comparación de tratamientos...98 3. Comparaciones múltiples...99 4. Diseño de bloques completos al azar...99 5. Diseño de bloques al azar generalizados...100 6. Diseño de bloques incompletos, incluyendo el diseño de bloques completos al azar con observaciones perdidas...100 7. Diseño de cuadro latino...101 8. Diseño de cuadro latino con repeticiones...101 9. Diseño de parcelas divididas (ejemplos)...101 APÉNDICE...104 LITERATURA CITADA...105 RECONOCIMIENTO CRÉDITOS EDITORIALES DIRECTORIO INSTITUCIONAL

ÍNDICE DE FIGURAS Figura 1 Ambiente de trabajo de SAS como aparece al abrir el programa (después de oprimir el icono con el logotipo de SAS ). 5 Figura 2 Menú que se abre al oprimir la opción View del menú principal. 8 Figura 3 Ventana que se abre al oprimir el icono de creación de archivero nuevo (el dibujo del archivero amarillo con una estrella azul). 11 Figura 4 Ejemplo de código con datos escritos directamente (o copiados de algún editor de textos) en el Editor de SAS. 18 Figura 5 Contenido del Log después de ejecutar el código del ejemplo. 19 Figura 6 Archivo temporal que se encuentra dentro del archivero Work 21 Figura 7 Los datos abiertos del archivo Ejemplo que se encuentra dentro del archivero WORK. 22 Figura 8 Menú que se abre para guardar un código antes de cerrar la sesión de SAS. 23 Figura 9 Pantalla para dar nombre al código de SAS que se desee guardar. 23 Figura 10 Archivo de datos de Excel editado para ser exportado a SAS. 33 Figura 11 Utilización del Wizard para importar datos hacia SAS. 35 Figura 12 Selección del programa de donde se van a importar datos a SAS 35 Figura 13 Búsqueda de la localización del archivo a importar. 36 Figura 14 Selección del archivo a importar. 36 Figura 15 Aceptar el archivo seleccionado. 37 Figura 16 Selección del archivero donde se va a guardar el archivo a importar. 37 Figura 17 Mensaje que aparece en el Log después de una importación exitosa. 38 Figura 18 Verificando que los datos se hayan importado correctamente. 39 Pág.

Figura 19 Selección de la opción de exportar en el Wizard. 40 Figura 20 Utilización del Wizard para exportar datos de SAS. 41 Figura 21 Buscando el lugar donde se van a guardar los datos a exportar. 42 Figura 22 Dándole nombre al archivo a exportar. 42 Figura 23 Ejemplo de como de ven los datos de un archivo. 45 Figura 24 Ejemplo de la orden merge. 68 ÍNDICE DE CUADROS Cuadro 1 Algunas opciones de Means con el procedimiento glm. 3 Cuadro 2 Algunas opciones a usar con el procedimiento Univariate. 89 Cuadro 3 Algunas opciones de la instrucción Plot en el procedimiento Reg. 90 Cuadro 4 Algunas opciones que se utilizan con el procedimiento Corr. 94 Pág.

CAPÍTULO 1 Por qué SAS? En sus inicios, el programa SAS llevaba ese nombre por ser las siglas de Statistical Analysis System ( Sistema de Análisis Estadísticos ). Sin embargo, actualmente SAS incluye toda una familia de programas, por ejemplo, para análisis financieros y para manejo de datos sociales (entre muchos otros), y SAS/STAT es sólo uno más entre sus múltiples funciones, de manera que el nombre SAS es ahora sólo un nombre, sin que tenga un significado específico. El presente manual se refiere a algunas funciones básicas de SAS/STAT, con mayor probabilidad de utilizarse en investigación en las ciencias agropecuarias. SAS es el paquete estadístico de más prestigio, y se encuentra entre los más poderosos instrumentos de manejo y análisis de datos en el mundo. El programa SAS es distribuido en más de 120 países para aproximadamente 3.5 millones de usuarios. Este programa no puede comprarse, sólo se adquieren licencias de uso. Sin embargo, una vez que se adquiere una licencia, se pagan cuotas anuales que dan derecho a que automáticamente se tenga acceso a las novedades, adiciones o mejoras en el programa. Estas cuotas sirven, en gran parte, para financiar la investigación que mejora los programas. Los usuarios pueden opinar en qué ámbito requieren o preferirían modificaciones a los programas, si contactan ballot@sas.com. También es posible enviar sugerencias al correo suggest@sas.com. El Instituto SAS tiene su sede en Carolina del Norte, Estados Unidos. Su página, www.sas.com debe consultarse para adquirir licencias. El presente manual está dirigido a quienes deseen iniciarse en el uso de SAS, especialmente para quienes trabajan en ciencia biológicas y agropecuarias, y manejen datos de investigación. No se incluyen temas intermedios ni avanzados, 1

sino se trata de que los lectores se familiaricen con el ambiente Windows de SAS, y de que tengan a la mano un listado de códigos básicos y sencillos en lenguaje SAS para manejar cualquier cantidad de datos, ya sea para análisis directo en SAS, o para uso posterior de algún otro paquete de análisis especializado, por ejemplo, el ASREML (programa que se utiliza en análisis de genética cuantitativa). Los programas especializados suelen estar escritos en lenguaje Fortran, C, o C++. Sin embargo, típicamente, la capacidad de combinar o crear variables a partir de otras variables, o la capacidad de editar los datos, es decir, el manejo de los datos, es muy limitado en estos programas. Por esta razón, es conveniente preparar los datos primero usando un programa más amigable, como SAS. Con frecuencia, a las órdenes que se escriben para que SAS ejecute un procedimiento, se les llama programas o códigos (la palabra que se utilizará con más frecuencia será código ). Hay varias maneras de obtener un mismo resultado usando SAS, pero en general, se mencionará una sola forma, para que sirva más como una guía que como una fuente de confusión. Se incluyen algunos códigos de procedimientos estadísticos básicos. Su buen uso tiene como prerrequisito tener las bases suficientes de estadística para cada caso, o consultar a alguien versado en el tema. Esta obra dista mucho de ser un manual completo de SAS. Existen literalmente cientos de libros, y aún más sitios en Internet dedicados al uso de este poderoso programa. Sin embargo, esperamos que el contenido del escrito sea de utilidad a todos los lectores. 2

CAPÍTULO 2 Las ventanas de SAS Una vez adquirida la licencia, usted tendrá, ya sea un enlace para bajar el programa, o un número variable de CDs que contienen el programa de SAS, dependiendo de la versión, y del tipo de licencia que haya adquirido. La más básica, generalmente, es suficiente para trabajar en todo lo relacionado con la investigación en ciencias biológicas, agropecuarias y forestales. Uno de los CDs vendrá marcado como el apropiado para iniciar la instalación. Sólo hay que introducirlo en la PC y seguir los pasos que se vayan indicando. El SAS es un programa grande que requiere al menos de Windows 98, con mínimo de 10 GB de capacidad en disco duro y RAM de 512, de manera que en cualquier computadora actualmente puede instalarse el programa SAS. Se debe tomar en cuenta que la instalación puede tardar varios minutos. Una de las opciones de instalación es el idioma en que se desea trabajar en SAS. Sin embargo, sin importar que idioma se elija, todas las instrucciones que se escriban para SAS y la mayoría de la información que se obtiene de la ventana del Log deben y van a estar en inglés. Por lo anterior, y también para traducir ciertas opciones, el contenido de esta obra hará referencia a la versión en inglés del programa. Una vez instalado el SAS, en su computadora aparece un icono con el logotipo de la versión de SAS que se haya instalado, ya sea en el contenido de la computadora, o en el escritorio de la pantalla. Este icono sirve como atajo ( shortcut ) para inicializar el programa. En algunas versiones, basta un clic en el shortcut para que el programa abra, y en otras versiones, se necesita el doble clic. En caso de que se abran dos ventanas, cada una con el programa de SAS, se puede trabajar con los dos programas al mismo tiempo, pero esto puede ocasionar que la 3

computadora se bloquee, y se pierdan ambos trabajos. Además, a menos que se esté trabajando con varias decenas de millones de datos, o que se estén realizando miles de iteraciones (repeticiones de un procedimiento), el SAS es un programa muy rápido, y se perdería más tiempo maximizando y minimizando una ventana u otra de SAS, que utilizando una sola, por lo cual es preferible cerrar la ventana que no se vaya a utilizar. Al abrir SAS, se pueden ver varias ventanas y un menú (Figura 1). Las ventanas más importantes son la del contenido, la del Editor (o Enhanced Editor ), la del Log, y la del Output ; esta última, detrás de las dos anteriores. En algunas versiones, al abrir SAS aparece una ventana que ofrece tutorías en el uso del programa, en diversos niveles de complejidad a escoger. El usuario puede decidir abrir la ventana y aprovechar estas lecciones o cerrar la ventana e iniciar directamente con el trabajo en SAS. El ambiente de SAS, es decir, todo el conjunto de ventanas, puede encontrarse ya maximizado, o estar minimizado, al momento de iniciar la sesión. En la esquina extremo derecha se encuentran los símbolos para cerrar, minimizar y para maximizar el programa. Si se oprime el de cerrar, el programa pregunta: Are you sure you want to end the SAS session? ( Está usted seguro de que quiere cerrar la sesión de SAS? ). Si se oprime Yes ( sí ), entonces, le preguntará, en inglés, si quiere guardar los cambios, y después de guardarlos, o de que se le indique que no se desea guardar nada, sólo entonces, se cierra el programa. Las ventanas son: a) La ventana del Explorer que se encuentra, al abrir SAS, a la izquierda, en forma vertical, e incluye el Contenido del Ambiente SAS, el cual, a su vez, contiene Libraries (la biblioteca), que es en donde se guardan los archiveros generados por y para SAS. En las versiones más avanzadas, el Contenido del Ambiente SAS también incluye: File shortcuts, Favorite folders, y Mi PC, que es de donde pueden provenir bases de datos que se importen hacia SAS para trabajar con ellos. 4

Dentro de Libraries se encuentra, por default, el archivero llamado WORK ( trabajo ). Este archivero no debe borrase, porque es en donde se guardan en forma automática los archivos de trabajo que no son permanentes. Es decir, una vez que se cierra la sesión de SAS, todos los archivos que hayan sido guardados en WORK se borrarán. Figura 1. Ambiente de trabajo de SAS tal como aparece al abrir el programa (después de oprimir el icono con el logotipo de SAS ). La ventana de Log es en donde se encuentran las letras azules. La ventana del Editor se encuentra debajo de la del Log, y la ventana del Output está detrás de las dos anteriores. Otro archivero ya incluido se llama SASUSER ( usuario de SAS ) y puede usarse para guardar archivos permanentes, sin que el usuario tenga que crear un archivero nuevo (Ver Capítulo 3, acerca de creación de archiveros). 5

El usuario también puede crear sus propios archiveros, utilizando los nombres que desee. En libraries aparecerán todos los archiveros que el usuario haya creado para trabajar en SAS, además de SASUSER y WORK. b) La ventana del Log (ver Figura 1), que se encuentra arriba al abrir SAS, tiene información del copyright, de a quien pertenece la licencia de ese programa en particular, y detalles del uso de los recursos de la computadora en el programa SAS. Una vez trabajando, en Log van a aparecer los reportes del resultado del programa o código, incluyendo una copia del código usado, el número de observaciones leídas, los errores, si los hubiese, algunas veces con sus correspondientes sugerencias de corrección, y el tiempo utilizado en la ejecución del programa. En esta ventana también aparece la advertencia cuando la licencia de SAS está a punto de vencerse, y alerta de que después de la expiración, no se podrá utilizar el programa. En resumen, el Log contiene: la versión de SAS en uso, a quien pertenece la licencia, la plataforma de ejecución, el código usado, con cada línea numerada, el nombre del archivo leído y su ubicación. Si el programa no corrió (no se ejecutó), aparecen los errores o advertencias (con algunas advertencias el programa corre de todas maneras), y sugerencias para corregir el código. Si el código corre, aparecerán el número de observaciones leídas y el nombre del archivo creado. Las letras son azules cuando todo corre normalmente, rojas, si el programa no se ejecutó por errores graves del código, y de otro color, si hubo algún problema que el programa superó solo. c) La ventana del Editor (es la ventana de abajo), es donde se escriben los códigos y programas o se dan las instrucciones que se requiere sean ejecutadas. En las últimas versiones de SAS, que es a las que se refiere esta obra, el que se abre por default es el Enhanced Editor, que es una versión mejorada del Editor. Es muy útil porque las instrucciones o códigos que se escriben van en colores 6

diferentes, según sean palabras exclusivas de SAS (por ejemplo DATA o PROC ), o las palabras con que se identifican las variables o los nombres de archivo. También vienen en diferentes colores los números, y las palabras de uso exclusivo de SAS que fueron mal escritas. Puede haber más de una ventana del Editor abierta, cada una conteniendo diferentes códigos. Para hacer que un código específico se ejecute, primero de marca o sombrea el código utilizando el botón izquierdo del ratón, y luego oprimiendo el icono de orden de correr (el icono de Run, como veremos). Si por alguna razón, se cerrase(n) la(s) ventana(s) del Editor (o del Enhanced Editor ), y se deseara reabrirla(s), hay que hacer clic en View (una opción en el menú), y seleccionar Enhanced Editor. d) La ventana del Output se encuentra por default detrás de las de Log y del Editor mientras no haya resultados que mostrar. Cuando se corre un programa que genere resultados al Output, este se coloca por delante del Log y del Editor automáticamente. En esta ventana aparecen los resultados que se pueden imprimir. Esto no significa que de esta ventana sea posible imprimir directamente, sino que son resultados que aparecen, es decir, son impresos en forma virtual. Hay muchos resultados que no necesariamente aparecen en el Output, aunque muchos de ellos pueden solicitarse mediante un código. La manera que se sugiere aquí para imprimir los resultados a papel, es copiar el contenido del Output, pegarlo en Word, efectuar las ediciones necesarias; por ejemplo, cambiar color y tipo de letra, o cualquier otra edición que se desee, y finalmente, imprimir. En ambiente Windows, las ventanas horizontales (es decir, todas, excepto la del ambiente de SAS ) pueden arrastrarse y moverse con el Mouse, y todas las ventanas pueden abrirse o cerrarse, pero antes de cerrar la última ventana de SAS, el programa pregunta si quieres cerrar la sesión. Al menos una ventana debe permanecer abierta para continuar con el programa SAS en ejecución. 7

También existe una ventana de Results (Resultados) debajo de la ventana del Explorer, minimizada en el momento de abrir SAS. Esta ventana sirve como una tabla de contenido de los resultados que vayan saliendo en el Output. Si se oprime alguno de los resultados, esa porción aparece visible en el Output. Del menú principal, que es una lista de ocho palabras (File, Edit, View, Tools, Run, Solutions, Window, Help) que se encuentra horizontalmente al extremo izquierdo de la pantalla de SAS, quiero resaltar el uso de View. Si se oprime View, se abre el menú con el cual se pueden acceder todas las ventanas de SAS, como se observa en la Figura 2, y si se selecciona Contents only, aparece el contenido de Libraries, los archiveros. Figura 2. Menú que se abre al oprimir la opción View del menú principal. 8

Debajo del menú hay una ventana para escribir instrucciones y junto a ésta, dibujos de enlace; para elegir las instrucciones se oprime la tecla enter sobre ellos. Por lo tanto, existen tres formas de dar órdenes a SAS: Por medio de menús desplegables (File, Edit, View, Tools, etc), por medio de los dibujos (lo recomendado aquí), y escribiendo instrucciones en la ventanita de comando (no recomendable, pues es fácil equivocarse). También se puede oprimir el botón derecho del ratón y elegir entre alguna de las opciones que aparezcan. Escribir instrucciones u oprimir los dibujos da los mismos resultados, por lo que se recomienda utilizar los dibujos. Los dibujos del menú son prácticamente iguales a los de los programas de Microsoft Word ó Excel, etc. Incluyen, entre otros: 1. Documento nuevo 2. Abrir archivos 3. Guardar archivos 3. Imprimir 4. Copiar 5. Cortar 6. Pegar Todos éstos son muy útiles para guardar o modificar códigos, pero no se van a discutir aquí, pues es obvio su uso, como en el editor de textos Word. Exclusivos de SAS son los comandos de ejecutar o correr programa ( Run ), crear un archivo nuevo, ver la ventana del Explorer, y ayuda de SAS. El usuario deberá explorar poco a poco todas estas opciones. Sólo algunas de ellas, las más esenciales, se tratarán aquí. 9

10

CAPÍTULO 3 Archivos permanentes en SAS Para tener un lugar específico donde guardar las bases de datos permanentes para utilizarse en SAS, se utiliza el comando de creación de archiveros, cuyo dibujo de enlace es un archivero amarillo con una estrella azul arriba. Al oprimir este enlace, se abre una ventana o pantalla como la que se muestra en la Figura 3. Figura 3. Ventana que se abre al oprimir el icono de creación de archivero nuevo (el dibujo del archivero amarillo con una estrella azul). 11

Antes de utilizar la opción de crear un archivero nuevo es necesario tener perfectamente localizado el lugar dentro de la PC donde se encuentre. Para este propósito: 1. Crear un Nuevo Fólder o carpeta en algún lugar de la PC, del cual no se mueva. Puede ser en el escritorio, en Mis documentos o en cualquier otro lugar. Otra opción es seleccionar un fólder o carpeta ya existente, pero que dentro del cual se desee guardar las bases de datos permanentes que se tengan o que vayan generando con SAS. 2. A este fólder póngale un nombre sencillo, corto, de ocho ó menos dígitos. Se pueden combinar letras y números, e incluir guiones bajos, si se desea, pero no se pueden utilizar otros símbolos ni guiones, y el nombre debe de empezar con una letra o con un guión bajo (no con número). Se recomienda un nombre corto hecho únicamente de letras. 3. Cerrar el fólder si estaba abierto, así como cualquier base de datos que contenga. Hecho lo anterior, se procede en la forma siguiente: 1. Abrir SAS y oprimir el dibujo de creación de archivero nuevo (el dibujo del archivero amarillo, con su estrella azul), va a salir una pantalla como en la Figura 3. 2. En la primera ventanita Name (nombre), escribir el nombre del fólder recién creado o el fólder designado para contener los datos para trabajar en SAS. 3. La segunda ventanita, dejar Default. 4. Marcar el espacio en la ventanita Enable at startup (hacer disponible desde el inicio). 5. Debajo de Library information, en Path (camino), oprimir Browse (examinar) y encontrar el camino para llegar al fólder designado; por ejemplo, 12

podría estar en: Mis documentos, y la carpeta llamarse Datos, al seguir el enlace, automáticamente se escribiría: C:\Documents and Settings\Yo\Mis documentos\datos Lo anterior también es posible escribirlo directamente. Una vez definido este camino, SAS va a buscar la información en ese lugar únicamente; por eso, si se mueve el fólder de lugar, SAS no lo va a poder encontrar. 6. No escribir nada en Options 7. Oprimir Ok 8. Verificar que dentro de Libraries (Dentro de la ventana vertical a la izquierda, en SAS, ahora se encuentre un archivero llamado Datos. Si Libraries no está abierto, oprimir View, y después Contents only. Si no se desea tener bases de datos (a veces también le llamaremos archivos) permanentes en SAS, sino que se desea importar los datos de otro programa, como Excel por ejemplo, o escribir los datos para analizarse, no es necesario crear archiveros. SAS puede trabajar con datos temporales. Sin embargo, los archivos guardados en SAS con frecuencia son mucho más compactos que en hojas de cálculo o archivos de texto. Si el espacio fuese una limitante en memoria, guardar los datos en SAS economiza espacio y es muy fácil de usar. 13

14

CAPÍTULO 4 Archivos temporales en SAS En la ventana del Enhanced Editor (simplemente lo llamaremos Editor ), se escriben los códigos de programa para trabajar con una base de datos que: a) se encuentre en un archivero permanente de SAS ; b) se vaya a formar al escribir directamente los datos, o bien, c) se encuentre fuera de los archiveros de SAS, es decir, en alguna carpeta de la PC, en un CD, o en un dispositivo extraíble, por ejemplo. En este capítulo vamos a ver como crear una base de datos, en este caso, temporal (la opción b de la lista anterior). Una ligera modificación al código, indicándole a SAS donde guardar los datos (un archivero diferente de WORK ), da la orden de convertir la base de datos a permanente. Los archiveros que se crean como se describió en el capítulo anterior, sirven para guardar las bases de datos en forma permanente (aunque tanto los archivos como los archiveros se pueden borrar en el momento que se desee, con Delete ). Sin embargo, con frecuencia la base de datos es pequeña y no se requiere guardarla en SAS. Es posible que ya se encuentre en algún otro programa, en Excel, por ejemplo, y que no se desee tener la información repetida, o que sea preciso actualizar la información periódicamente, lo cual quizá resulte más fácil hacer en Excel que en SAS. En SAS no se puede modificar directamente la información en las bases de datos; es decir, si en una celda se encuentra el número 3.001, por ejemplo, y el número está mal, no se puede llegar a ese número en particular con el cursor, ni mediante algún otro artificio, y modificarlo directamente. Se puede, sin 15

embargo, modificar toda la columna y hacer operaciones o buscar el dato erróneo, siempre y cuando haya forma de determinar su posición y el dato sea único. Si en el menú (la línea que contiene las palabras: File, Edit, View, Tools, Run, etc.) se oprime View y después se selecciona Contents only, aparece a la izquierda (si no es que ya estaba ahí mismo, pues por default al abrir SAS aparece esta ventana vertical) el dibujo de un archivero amarillo (Libraries). Si se oprime este enlace aparecen los archiveros que se tienen. SAS incluye dos archiveros: SASUSER y WORK. Nos ocuparemos únicamente del archivero WORK. En WORK se guardan todas las bases de datos a las cuales no se les haya indicado en que archivero van. Mientras esté en proceso la sesión de SAS, las bases de datos están disponibles y pueden ser vistas al abrir el archivero WORK (sólo se da clic en WORK, y después en la base de datos que se desee ver). Para hacer comentarios Es muy útil añadir comentarios de lo que estamos haciendo. La forma correcta de hacerlo es escribir un código y junto a él, debajo o antes de él, hacer un comentario. Si se escribe: / comentario / o comentario; El comentario o cualquier otra cosa que se escriba entre los / / ó ; no va a ser leído por SAS. Incluso pueden escribirse códigos a usar bajo condiciones diferentes del análisis actual, que no se van a leer si se ponen entre los / / o ;. Aquí siempre se va a utilizar la forma comentario; para las notas o comentarios. Enhanced Editor Cuando empezamos a escribir el código en el Enhanced Editor (que, como ya se dijo, aquí llamaremos simplemente Editor ) lo primero que notamos es que las letras tienen colores: Los comandos de SAS, como DATA, INPUT, CARDS y RUN están en azul. De hecho, DATA y RUN, están en azul obscuro, e INPUT y CARDS, en azul 16

claro. Las palabras o datos que nosotros utilizamos, están en negro. El comentario (lo escrito dentro de ;) está en verde. Si aparece alguna palabra en rojo, significa que hay algún problema y que el programa no va a correr. Para este ejemplo se va a crear una base de datos. Se debe escribir todo lo que sigue exactamente como aparece aquí, en la ventana del Editor. O se puede escribir en Word y después copiar a la ventana del Editor. No importan lo espacios antes ó después de cada comando, ni si se escribe todo seguido o se pasa a la siguiente línea. Sin embargo, se recomienda poner cada frase en una línea, para que el código sea fácilmente legible. Creación de una base de datos en SAS Ejemplo de código para crear una base de datos escrita en SAS (Figura 4): DATA ejemplo; INPUT rana tam salto; CARDS; 1 1 16 2 2 18 3 3 17 4 1 12 5 2 17 6 3 21 7 1 15 8 2 16 9 3 17 ; tamaño 1= chico, tamaño 2 = mediano, tamaño 3 = grande; Run; 17

Para que el código corra, hay que oprimir el icono de ejecutar programa ( Run ), representado por el dibujo de la silueta de una persona corriendo. Figura 4. Ejemplo de código con datos escritos directamente (o copiados de algún editor de textos) en el Editor de SAS. Mensajes del Log En este caso, se observa que aparece un mensaje en la ventana del Log, como puede verse en la Figura 5 (la ventana del Log se hizo un poco más grande utilizando el ratón, para que se vea todo el contenido, para propósitos de este ejemplo); el contenido del Log se reproduce a continuación, para facilitar su lectura: 79 DATA ejemplo; 80 INPUT rana tam salto; 81 82 *tamaño 1= chico, tamaño 2 = mediano, tamaño 3 = grande; 18

83 84 CARDS; NOTE: The data set WORK.EJEMPLO has 9 observations and 3 variables. NOTE: DATA statement used (Total process time): real time 0.00 seconds cpu time 0.01 seconds 94 ; 95 96 *tamaño 1= chico, tamaño 2 = mediano, tamaño 3 = grande; 97 Run; Figura 5. Contenido del Log después de ejecutar el código del ejemplo. Se observa que: 1) las líneas están numeradas, en este caso, la numeración empieza del 79 porque había instrucciones anteriores que fueron borradas; 19

2) el código se repite, incluyendo el comentario, pero no los datos; 3) las Notas, que es el reporte de la ejecución del programa por parte de SAS están en azul buena noticia, porque si algo sale en rojo, significa que el código estaba mal escrito o que por alguna razón, no se pudo correr el programa, o corrió mal; 4) se menciona una base de datos llamada work.ejemplo, dando detalles del número de observaciones (hileras) y del número de variables (columnas); y 5) se dan detalles del tiempo de ejecución y a veces otros detalles técnicos. Cambiando de archivos temporales a permanentes El nombre de la base de datos work.ejemplo, significa que en el archivero WORK, existe una base de datos llamada ejemplo (Figura 6). Como se mencionó antes, todo el contenido del archivero WORK se borrará tan pronto termine la sesión de SAS. A continuación se indica la modificación al código para que la base de datos se guarde como permanente: En lugar de sólo poner el nombre de la base de datos ( ejemplo ), le ponemos el nombre del archivero donde queremos que se guarde y que NO sea en WORK. Digamos que el archivero se llama Ranas, y que lo creamos anteriormente, siguiendo los pasos del Capítulo 3. El código se modifica para que quede así (sólo se muestra el principio): DATA ranas.ejemplo; INPUT rana tam salto; CARDS; 1 1 16 2 2 18 etc. Para ver la base de datos o archivo (Figura 6), primero se abre la ventana de Libraries (si la ventana del SAS Environment se encuentra cerrada, el proceso es oprimir View, y después Contents Only, para que se abra Libraries ) y se hace 20

clic en el archivero WORK, en el caso del primer código, y/o en el archivero Ranas, en el caso del segundo código, y en cualquiera de los dos casos, se observa que contiene la base de datos llamada Ejemplo. Figura 6. Archivo temporal que se encuentra dentro del archivero WORK. Ver la base de datos Para ver los datos del archivo, se hace clic sobre el mismo (Figuras 6 y 7). Se pueden tener abiertas simultáneamente dos o más bases de datos, pero es preciso cerrarlas antes de que se ejecute un código. Es preferible abrir las bases de datos una por una, e irlas cerrando después de verlas, para no olvidar cerrar alguna antes de dar la instrucción de Run. 21

Siempre es aconsejable ver como quedó la base de datos para verificar que resultó lo que queríamos que sucediera. Los programas de cómputo, al menos hasta el momento de escribir esto, hacen siempre lo que se les indica, que a veces no es lo que el programador quería. Figura 7. Los datos abiertos del archivo Ejemplo que se encuentra dentro del archivero WORK. Guardar los códigos Para guardar el código (todo lo que escribimos; en este ejemplo, desde DATA hasta RUN;) se deber abrir el menú File, y seleccionar Save As (Figura 8). Luego se le da un nombre al código y se elige la carpeta donde queramos que se guarde (Figura 9), o bien, se puede crear una carpeta, tal como se hace en el programa Word. 22

Figura 8. Menú que se abre para guardar un código antes de cerrar la sesión de SAS. Figura 9. Pantalla para dar nombre al código de SAS que se desee guardar. 23

En todo caso, antes de cerrar SAS, sale un cuadro con la pregunta (en inglés, para las versiones que nos ocupan) equivalente a: Desea guardar lo que está escrito en el Editor? Si respondemos que sí (seleccionando y haciendo clic en YES ), van saliendo las opciones anteriormente descritas, y que se muestran para el ejemplo de las ranas en las Figuras 8 y 9. Tamaño de las bases de datos guardadas en SAS Prácticamente no hay límite para el tamaño de las bases de datos que se guarden en SAS. El límite es el tamaño del disco duro de la computadora. Por supuesto, para bases de datos muy grandes, los procesos del programa pueden tardar minutos, horas, o hasta días. Generalmente, esto sucede sólo cuando se manejan datos de poblaciones muy grandes, como por ejemplo, datos de los habitantes de países enteros. En ciencias agropecuarias, puede haber bases de datos muy grandes en análisis genéticos, pero, para la mayoría de la investigación en agronomía y ciencia animal, las bases de datos no son muy grandes, y el programa corre en fracciones de segundo. Acceso a los códigos guardados Los códigos guardados pueden encontrarse a través del dibujo del fólder amarillo abierto, o con File, y luego Open. Cuando se abre un código que se encuentra guardado, se abre en el Editor, por lo tanto, para ejecutarlo, basta oprimir Run; y se ejecutarán todos los códigos guardados, en el orden de aparición en el Editor. Por supuesto, si se desea ejecutar uno solo de una serie de códigos, basta con sombrearlo y luego oprimir Run;. 24

CAPÍTULO 5 Los programas de SAS En SAS las instrucciones (llamadas programas o códigos de SAS ) se escriben en la ventana del editor. El Enhanced Editor, disponible de la versión de SAS 8.2 en adelante, escribe en letras de colores que ayudan a verificar de un vistazo que el código esté correcto. Las porciones incorrectas quedan resaltadas en rojo. Las instrucciones de un código se van a ejecutar en el orden en el que se escriban (esto hay que tenerlo siempre presente). Todas las instrucciones, o el final de una serie de instrucciones deben terminar en punto y coma ( ; ). Por lo anterior, cuando un programa no corra bien, primero hay que verificar que: 1. No se haya olvidado una ; 2. Todas las palabras estén correctamente escritas, y 3. El orden de las palabras en los programas ó códigos. Acerca de los comentarios Dentro de un código pueden insertarse comentarios. Es aconsejable hacerlo, especialmente si se piensa utilizar el mismo código en un futuro, para tener una referencia de lo que hace cada parte del código. Dentro de un comentario ( comentario;), se puede escribir cualquier cosa; todo lo que se encuentre dentro de y ;, no va a ser leído por SAS. Sin embargo, con respecto a la escritura de códigos y comentarios, es preciso señalar que: a) LOS COMENTARIOS NO SE DEBEN DE COLOCAR EN MEDIO DE UNA INSTRUCCIÓN, 25

b) NO se deben UTILIZAR las PALABRAS de SAS como nombre de una variable, o como nombre de archivo, o como palabra alguna que sea para uso del programador, c) NO se debe usar para codificar (pero se puede utilizar dentro de un comentario), la LETRA ñ ; solo se pueden usar las 26 letras que existen en inglés, puesto que los programas están escritos en ese idioma. Por ejemplo: Si se quiere escribir: DATA run; INPUT rana tamaño salto; CARDS; También puede escribirse DATALINES ; 1 1 16 2 2 18 3 3 17 4 1 12 5 2 17 6 3 21 7 1 15 8 2 16 9 3 17 ; tamaño 1= chico, tamaño 2 = mediano; tamaño 3 = grande; Run; El programa no va a correr, porque: 1. El archivo se llama run (palabra SAS) 2. El nombre de la segunda variable (tamaño) tiene una ñ 3. Se escribió un comentario después de CARDS. La instrucción completa incluye la palabra CARDS y todos los datos hasta el final. Se trata de una sola 26

instrucción, aunque tenga intercalada un ; después de CARDS, por lo que al colocar el comentario en ese lugar, se interrumpe la instrucción. 4. Dentro del comentario: tamaño 1= chico, tamaño 2 = mediano; tamaño 3 = grande; se puso una ; de más, después de la palabra mediano. No importa si dentro de cada código se intercalan letras mayúsculas y minúsculas, ni se requiere dejar espacios antes o después de cada orden. Sin embargo, es mucho más fácil entender de qué se tratan los códigos, encontrar posibles errores, y/o modificar un código para utilizarlo en otra ocasión, si se sigue un cierto orden. Para algunos casos de manejo o de análisis de datos, quizá sea preferible utilizar códigos ya hechos con anterioridad, como una receta de cocina, que NO se debe variar, excepto para cambiar nombres de variables, de base de datos y de archivos. Recomendación Cuando se manejan datos, especialmente cuando las bases de datos tienen muchas observaciones y/o variables (miles o millones), a veces es necesario o aconsejable, inventar una pequeña base de datos, correrla con el código que esté a prueba, verificar que el código esté haciendo lo que se desea, y luego cambiar el nombre de la base de datos con la que verdaderamente se quiere trabajar. También se recomienda, antes de manejar los datos, hacer una copia de la base de datos original, y luego manejar la copia, para que si hubiese algún problema, se tenga un respaldo. Un código de trabajo en SAS usualmente incluye: DATA nombre el nombre del archivo o de la base de datos a trabajar; PROC nombre el nombre del procedimiento a utilizar (qué se va a hacer); run; indica el fin del código ; Algunos programadores acostumbran escribir run; quit;, y no solo run;, hasta el final del código. Esto es opcional. 27

Un nuevo paso o una nueva etapa del programa también puede indicarse al iniciar la siguiente línea con DATA o PROC, pero el fin final, debe tener run; o run; quit; Procedimientos y órdenes (o instrucciones) de SAS Un procedimiento es un programa prefabricado, que por su importancia, tiene un nombre para llamarlo y hacerlo que ejecute sobre una base de datos. Ejemplos son los análisis de regresión o los análisis de varianza. Algunas instrucciones, que generalmente realizan acciones menos complejas que los procedimientos, no están precedidas por la palabra PROC. Algunos procedimientos y órdenes son: Procedimientos (empiezan con PROC): a) para manejo de datos: freq, means, y sort. b) para análisis de datos: glm, reg, y mixed. Órdenes (van después de DATA): c) merge, set, if..then, drop, input, put, y rename Si los códigos son muy largos, pueden escribirse primero en Word y luego cortar y pegar en el Editor de SAS. Sin embargo, es preferible hacer códigos sencillos y cortos, y primero correrlos en archivos de prueba, que sirvan exclusivamente para verificar que los programas realicen lo que se espera que hagan. Una vez que el programa corrió con el archivo de prueba, se modifica la parte del código que se refiere a que archivo debe leer SAS, y se le escriben los comentarios apropiados. Manejo de los resultados Se recomienda ir copiando en Word los resultados que aparezcan en el Output, e ir limpiando la ventana del Output entre corridas. Alternativamente, en la ventana de Resultados (vertical, a la izquierda), se puede ir abriendo cada resultado, pues corresponde uno para cada código. 28

Existen varias opciones que controlan como saldrán los resultados de SAS al Output. Sólo unas cuantas son las que se utilizan en forma rutinaria para cambiar los defaults. Para ver la lista completa de opciones disponibles, se escribe: proc options; Run; Para utilizar una opción, escriba la palabra OPTIONS como parte del código de SAS, i.e. Options linesize= 80 nodate; En este caso, la opción va a dar un tamaño de línea de 80 caracteres. Nodate es una opción que pide no imprimir la fecha en las hojas de resultado de SAS. Las opciones se pueden poner en la primera línea que se escriba, pero puede estar en cualquier lugar del código, excepto en medio del mismo. Si se escribe otra opción después, se cancelan las primeras. NOTA IMPORTANTE: Si se desea detener la ejecución de un programa, se debe escribir QUIT, STOP, o ABORT, o mejor aún, esperar pacientemente hasta que SAS termine de ejecutar el programa. Nunca se debe cerrar SAS para tratar de detener un programa, pues los datos van a desaparecer hasta donde hayan sido leídos por el programa en ejecución. Es recomendable tener un respaldo de la base de datos original, y utilizar las copias para ejecutar todos los programas deseados, ya que un error de código puede hacer que se borren o se modifiquen los archivos. 29

30

CAPÍTULO 6 La base de datos Los archivos de datos en SAS tienen una estructura bien definida: las variables se encuentran en columnas (de hecho, a veces se les llama columnas ), mientras que las observaciones están en hileras, en forma parecida a las tablas de Excel, como se vio en el ejemplo de las ranas. Sin embargo, se pueden inter convertir las hileras en columnas con proc transpose (que no se va a tratar en esta obra). En caso de que se requiriese efectuar este tipo de manipulación de los datos, se recomienda utilizar Excel. Esto puede hacerse exportando los datos de SAS hacia Excel (también utilizando la función del Wizard, como se verá después para la importación de datos de Excel hacia SAS ), efectuar el manejo que se desee en los datos, y reimportando a SAS, o bien, manipulando los datos originales desde el principio en Excel. Sin embargo, en este caso (y siempre), se debe cuidar que todas las celdas de Excel tengan el formato correcto; es decir, que no vaya a haber un formato de texto donde debería haber un formato de fecha, o un formato de moneda donde deba ser de número, etc. Cuando esto sucede, parte de la información se va a transferir a SAS en forma incorrecta o simplemente no se va a transferir, ya sea toda, o parte de la tabla de Excel. Los datos pueden pegarse desde un editor de textos, escribirse directamente en la ventana del Editor de SAS, o bien, importarse del editor de textos o de una hoja de cálculo (como Excel ) a un archivo de SAS, y hacer este archivo, ya sea temporal o permanente. También se pueden exportar los datos. En el menú se encuentra un ayudante (Wizard) para importar o para exportar. 31

Como ejemplo, vamos a importar una base de datos desde Excel (un archivo de un experimento de maíz), y luego vamos a exportar una base de datos de vacas lecheras hacia Excel. 1. Importar bases de datos de Excel Supongamos que tenemos una base de datos Evaluación de genotipos de maíz en Excel (una porción de esta base de datos se encuentra en el Apéndice). Debemos importar esta base de datos hacia SAS. Esta base de datos se puede importar mediante un código escrito en el Editor para que quede en SAS un archivo igual al de Excel. Sin embargo, para analizar esos datos, los códigos a usar tendrían que ser mucho más complicados porque en el archivo hay comentarios (como se ve en el Apéndice), y los nombres de las variables no son los más adecuados para utilizar los procedimientos de SAS, por lo que es recomendable (aunque no siempre necesario, según la versión) limitarse a ocho letras, como se mencionó antes. Con una base de datos como la del Apéndice, habría que indicarle a SAS que líneas o hileras no debe leer, cual de las hileras contiene el nombre, y muchos otros detalles. Es preferible volver a guardar el archivo de Excel con las siguientes modificaciones: 1. Eliminar el título: Evaluación. 2. Hacer que los nombres de las columnas (variables) tengan ocho o menos letras y que no contengan espacios, guiones, puntos, etc. etc. El nombre debe empezar con una letra, y se pueden incluir números y guión bajo. 3. Que en los datos perdidos (inexistentes en esta base de datos) haya espacio en blanco, no puntos, ni ceros. 4. Que si hubiera alguna fecha (no en este caso) fuera seguro que el formato de celda en Excel, es de Fecha. 5. Eliminar los comentarios. 6. Eliminar las unidades de medida. Sólo deben quedar los nombres de las variables y las variables. 32

7. Guardar los cambios en Excel con otro nombre (porque este archivo tiene menos información que el original), para utilizar este archivo para SAS. Hay que cerrar el archivo antes de poder importarlo a SAS. Algunos programadores prefieren guardar sus bases de datos ya listas para ser exportadas a SAS, en formato CSV (comma delimited). Todas las instrucciones que siguen son válidas para esta opción, únicamente se elige, en lugar de Excel, CSV, y todo lo demás se hace exactamente igual. El archivo en Excel para este ejemplo, queda como se ve en la Figura 10. Figura 10. Archivo de datos de Excel editado para ser exportado a SAS. Para importar los datos de Excel (Figuras 11 a 17): a) en File del menú de SAS, buscar Import Data y hacer clic. 33

b) aparece una ventana (este es el Wizard ) con el default de importar los datos de Excel, oprimir NEXT. c) aparece otra ventana para escribir la localización del archivo en Excel ; es más fácil, sin embargo, oprimir BROWSE y buscar el archivo. d) localizar el archivo y oprimir ABRIR. e) en la ventana dar OK. f) seleccionar la hoja de Excel que se desea importar y dar NEXT. g) seleccionar el archivero en donde se desea guardar la base de datos. Si se selecciona el Default WORK, el archivo será temporal, por lo que se borrará tan pronto se termine de trabajar esa sesión de SAS. En esa misma ventana se le debe dar un nombre al archivo importado; en este caso, el nombre es Maiz1. Recuerde: sólo se permiten guiones bajos, y no se permite un nombre que contenga espacios. Sería incorrecto poner Maiz 1 o Maiz-1. También es mejor limitarse a ocho caracteres. Una vez seleccionado todo esto, oprimir NEXT. h) en la siguiente ventana oprimir FINISH. 34

Figura 11. Utilización del Wizard para importar datos hacia SAS. Figura 12. Selección del programa de donde se van a importar datos a SAS. 35

Figura 13. Búsqueda de la localización del archivo a importar. Figura 14. Selección del archivo a importar. 36

Figura 15. Aceptar el archivo seleccionado. Figura 16. Selección del archivero donde se va a guardar el archivo a importar. 37

Figura 17. Mensaje que aparece en el Log después de una importación exitosa. Sale un mensaje en el Log de que el archivo temporal Work.maiz1 fue exitosamente creado (Figura 17). Para ver el archivo vamos a la ventana vertical a la izquierda (la del ambiente de SAS ), en Libraries abrimos WORK y encontramos el archivo, tal y como se ve en la Figura 18. Si no se van a hacer todos los análisis en ese momento, es preferible guardar el archivo en forma permanente. Es muy fácil después borrarlo (con DELETE), pero por lo pronto conviene tenerlo disponible. Se recordará que ya habíamos creado el archivero EJS. Ese es el archivero que vamos a utilizar para guardar MAIZ1. Escriba lo siguiente en el Editor, y después oprima el dibujo de RUN: DATA ejs.maiz1; set maiz1; run ; y!listo! La base de datos es permanente. 38

Figura 18. Verificando que los datos se hayan importado correctamente. 2. Exportar bases de datos de SAS hacia Excel Una razón por la que se suelen exportar los datos de SAS a Excel, es porque las gráficas en Excel son más atractivas y fáciles de hacer. El procedimiento es prácticamente el mismo (en reversa) que para importar utilizando el Wizard (Figuras 19 a 22). Por ejemplo. Supongamos que tenemos una pequeña base de datos en SAS y que tenemos una base de datos más grande en Excel. Para unir esas bases de datos podemos: a) importar el archivo de Excel hacia SAS o b) exportar los datos de SAS hacia Excel. c) unir los dos archivos. 39

Supongamos que la base en Excel está en constante aumento. Puesto que aumentar datos es más fácil hacerlo en Excel, decidimos que es preferible exportar los datos que se tienen en SAS. El archivo en SAS se llama exportar y está en la carpeta Ejs. Vamos a File, export data y damos clic: Figura 19. Selección de la opción de exportar en el Wizard. Aparece una nueva ventana; ahí, debajo de Choose the source SAS dataset ( seleccione la base de datos de origen ), en donde dice Library: seleccionar EJS, y en donde dice: Member, seleccione el archivo llamado Exportar, y luego haga clic en Next : 40

Figura 20. Utilización del Wizard para exportar datos de SAS. Dejamos los defaults, que incluyen exportar a Excel y damos clic en Next. Entonces se abre la ventana que sirve para buscar la carpeta de Excel (haciendo clic en Browse ) en donde vamos a guardar la base de datos que queremos exportar. En este caso, la carpeta se llama Curso de SAS. Al archivo le nombramos Masdatos, y finalmente, damos clic en Guardar. 41

Figura 21. Buscando el lugar donde se van a guardar los datos a exportar. Figura 22. Dándole nombre al archivo a exportar. 42

En la siguiente ventana damos clic en Ok, y finalmente, en la próxima ventana ponemos un nombre (en este caso le pusimos maiz ) para completar el proceso y damos clic en Finish. El archivo en Excel se llama Masdatos. 3. Otras formas de importar o exportar (sin Wizard) Se pueden importar y exportar datos sin utilizar el Wizard. Esto es un poco más complicado y generalmente, el Wizard es la opción más indicada y suficiente. Sólo se ofrecen en este capítulo algunos comentarios y un ejemplo como información general. Para que SAS sepa que hacer con una base de datos hay que especificar: que tiene que ir a donde, o que tiene que venir de donde. Se puede utilizar la orden PUT para exportar o INPUT para importar. En estos casos es muy importante saber si los datos van a ser exclusivamente numéricos o si van a contener otros caracteres. Los datos numéricos contienen sólo números. Los números pueden ser positivos o negativos, y contener decimales. Se pueden realizar operaciones matemáticas con ellos, como sumas, restas, y todas las demás. Los datos de carácter pueden contener números y letras, guión bajo, o combinaciones de todo lo anterior, pero no se pueden realizar operaciones matemáticas con ellos. Por ejemplo, la identificación de animales (ID) puede contener sólo números: 00001, y a veces números y letras: 0001ENE_04, si se desea informar, por ejemplo, que es el primer animal o animal 1, y que nació en enero de 2004, o puede ser: 01HO_Ene05, para informar que fue el primer nacimiento, que fue Holstein, y que nació en enero de 2005. Por supuesto, esto es un ejemplo, pues la identificación de 43