Observa que el mismo contiene el espacio en blanco, SP, y el retorno de carro o carácter de nueva línea, CR.

Documentos relacionados
Ðand ±and+ Cig³e±a Cig_eÐa

Tema 1. Informática Básica

Representación de la Información (III)

Agenda. 0 Operaciones aritméticas 0 ASCII 0 UTF-8 0 Código Gray. 0 Números de punto flotante

TEMA 1. Informática básica. Introducción. 1.1 Informática básica

Lección 6 Codificación de caracteres

Unidad 1) Lenguajes de marcas

ESTRUCTURA Y TECNOLOGÍA DE COMPUTADORES

Sistemas Operativos. IES Pedro Espinosa. Relación de ejercicios Tema 1: Conceptos básicos de informática

Capítulo 8. Capa de Presentación 8.1 Representaciones comunes de los datos ASCII 7 bits ASCII 8 bits Unicode

Representación de la Información

Los tipos de datos primitivos

Informática Ingeniería en Electrónica y Automática Industrial

Tema 1. Informática Básica

Práctica 1 - Representación de la información

Colegio Diocesano San José de Carolinas

Tema 2: Sistemas de numeración

Datos y tipos de datos

Intérpretes. Programación de Sistemas. Representación (1/n) Representación (2/n) Ejemplo

Técnicas y Dispositivos Digitales 1. UNIDAD 3 Códigos Binarios

Fundamentos de la programación

Organización del Computador 1. Representación binaria de Números Reales Sistemas de Representación

INFORMÁTICA APLICADA A LA ECONOMÍA Tema 3: Representación de la Información. Verónica A. Bollati

UNIVERSIDAD DE SEVILLA PRÁCTICAS DE LABORATORIO ANÁLISIS LÉXICO (1) LENGUAJES FORMALES Y AUTÓMATAS CURSO 2006/2007

Compresión de Datos. Método de Huffman. Dpto. Informática

TEMA V SISTEMAS DE NUMERACIÓN

Representación Información

Unidad 2. La Información en los Ordenadores

Implantación de Sistemas Operativos 1º ASIR

Práctica 1. Sistemas de Numeración y Representación de la Información

Organización del Computador 1. Representación binaria de Números Reales Sistemas de Representación

ALMACENAMIENTO Y UNIDADES. Carpetas, archivos y tamaños

Laboratorio de Arquitectura de Redes. Entrada y salida estándar

Servicio de Notificaciones Electrónicas y Dirección Electrónica Habilitada

Definición. Vista general.

OBJETIVOS: Reconocer la aplicación de la tecla ALT y las utilidades del código ASCII

CURSO 2016/2017 INFORMÁTICA 1ºBCH. La codificación es. Por qué se. Fíjate en. la imagen de decirle que si. cero. decimal: 1* *2 3.

APUNTES DE CATEDRA: SISTEMAS DE NUMERACION - REPRESENTACION INTERNA DE NUMEROS Y CARACTERES

Representación de la Información en los Sistemas Digitales

TEMA 2. EL LENGUAJE C. ELEMENTOS BÁSICOS

Informática PRÀCTICA 9 Curs Práctica Nº 9: Rango y precisión de representación de números en el ordenador.

Datos y tipos de datos

Tema 2. Soporte Lógico de los Ordenadores

CODIFICACIÓN DE LA FUENTE

UF 6.2 Disseny per a multimedia interactiu. Módulo 6

Tema 2: Sistemas de numeración

INCIO DE WORD. Mis primeros pasos

03 Cadenas en Python 3. Diego Andrés Alvarez Marín Profesor Asociado Universidad Nacional de Colombia Sede Manizales

CHARSET: CODIFICACIÓN DE CARACTERES PARA GENERAR

UT01 03 Sistemas de codificación

EXAMEN ORDINARIO DE ORGANIZACIÓN DE COMPUTADORES

Comprender las diferencias entre tipos de datos primitivos similares, y aprender a elegir el tipo más conveniente en cada caso.

TEMA 1: EL ORDENADOR Y SUS COMPONENTES

Representación de la información

Cadenas de Caracteres

Pasos para realizar las pruebas de evaluación final virtuales

Titulación: Grado en Ingeniería Informática Asignatura: Fundamentos de Computadores

Clase 02: Representación de datos

A veces queremos almacenar algún elemento que es Verdadero o Falso. Este tipo de dato se llama Booleano y su representación es sencilla, para cada

COMUNICACIÓN CON PANTALLAS MP-MERCURY MEDIANTE PROTOCOLO TCP-ASCII

INFORMÁTICA. Clasificación de las medidas de almacenamiento de información

INSTALACIÓN DEL SOFTWARE DE FIRMA DIGITAL REFIRMA

HOJA DE PROBLEMAS 2. SISTEMA BINARIO DE REPRESENTACIÓN NUMÉRICA. 1. Convertir los siguientes números binarios a sus equivalentes decimales: a.

UNIDAD I CONCEPTOS GENERALES. Conceptos Generales Microprocesadores Otoño 2011

Informática I. Bases de Numeración. Alejandro Furfaro

INFORMATICA I EJERCICIOS PROPUESTOS Buscar en el diccionario Qué es INFORMÁTICA?, Qué es

Características de JavaScript

Comunicación y representación de la información

Navegadores. Los navegadores. Privacidad. Oscar Herrero INTERNET SEGURO CEIP ARCIPRESTE DE HITA. Fuente:OSI

NÚMEROS UTILIZADOS EN ELECTRÓNICA DIGITAL

Códigos Binarios de Representación de Datos

LÓGICA SECUENCIAL Y COMBINATORIA

Tema 2. Sistemas de representación de la información

Principios de Computadoras II

CONCEPTOS COMUNES A TODOS LOS MENSAJES

TEMA 2. CODIFICACIÓN DE LA INFORMACIÓN

Área Académica: Ingeniería en Computación. Profesor: M. en C. Evangelina Lezama León

Guía 01: Sistemas Numéricos

Definición(2) La base (r) de un sistema de numeración especifica el número de dígitos o cardinal* de dicho conjunto ordenado. Las bases más utilizadas

CAPÍTULO 5 GRACILEWeb: Traductor Japonés-Inglés en Internet

MODBus RTU en los registradores CAMRegis

Es un conjunto de palabras y símbolos que permiten al usuario generar comandos e instrucciones para que la computadora los ejecute.

Práctica de Arquitectura de Computadores Sistemas de Entrada/Salida: Entrada/Salida Programada Curso 2016/2017

Para convertir un decimal a un binario se necesita la siguiente tabla.

Examen Teórico (1/3 de la nota final)

Programación I Otoño 2017 FCFM - BUAP

Primera sesión de contenidos: El paquete estadístico SPSS: Descripción general y aplicación al proceso de datos

Computación I (CI-2125) Clase 1. Prof. Mireya Morales Primera

Tema 3. Aritmética y representación de la información en el ordenador. Informática Grado en Física Universitat de València

El ordenador. Codificación binaria. Código ASCII

4º ESO INFORMÁTICA TEMA 7: LENGUAJE HTML ACTIVIDADES. A continuación abriéremos el bloc de notas: Inicio>Programas>Bloc de notas.

Definición de Memoria

MANEJO DE EXPRESIONES REGULARES

Algoritmos y Estructuras de Datos I -2014

Tema IV. Manejo Interno de Datos

CREAR Y GUARDAR DOCUMENTOS

En la actualidad ASCII es un código de 8 bits, también conocido como ASCII extendido, que aumenta su capacidad con 128 caracteres adicionales

TEMA 1: FUNDAMENTOS DE LA INFORMÁTICA

Representación de datos y aritmética básica en sistemas digitales

Memoria de la Práctica de Ficheros

Transcripción:

Informática Grado en Ingeniería Agrícola Curso 2011/2012 Nombre: EJERCICIOS 1 TEMA 1. CODIFICACIONES DE CARACTERES 1. Nos encontramos con el siguiente repertorio de caracteres: {a,e,i,o,u,a,e,i,o,u,sp,b,c,d,f,g,h,j,k,l,b,c,d,f,g,h,j,k,l,cr} Observa que el mismo contiene el espacio en blanco, SP, y el retorno de carro o carácter de nueva línea, CR. a) Propón una tabla de caracteres para el mismo. b) Propón una regla de codificación de los mismos (de todos los caracteres), cuya longitud de palabra sea 2 bytes. Puedes utilizar sistema binario o hexadecimal. c) Con respecto a esa regla de codificación, escribe la representación en hexadecimal del contenido de un fichero de texto que contenga la siguiente cadena de caracteres: Coge el agua debajo Ulula la hoja d) Cuánto ocuparía (en bytes o en bits) el anterior fichero de texto (suponiendo que no se le añadan caracteres de control) al guardarlo en un dispositivo de almacenamiento? 2. Escribimos en un editor de texto la siguiente frase: En España hay cigüeñas pero no ñandús a) Puede guardarse el siguiente texto con codificación ASCII (128 caracteres)? b) Puede guardarse en codificación ISO 8859 1 (ISO Latin 1)? Cuánto ocuparía y por qué? c) Puede guardarse en codificación UTF 16? Cuánto ocuparía y por qué? 3. Alguien nos plantea un problema que le ha surgido con un fichero que le ha mandado un compañero. Lee el archivo con un editor de texto y ve lo siguiente: Su autor le jura que escribió lo siguiente: Ðand ±and+ Cig³e±a Cig_eÐa Ñandú ñandú Cigüeña CigÜeÑa Ayudado por la siguiente información explica detalladamente qué ha sucedido. 1-7

Tabla MSDOS 850: Tabla Windows 1252: 4. Define brevemente los siguientes conceptos y contesta a las preguntas formuladas: a) Unicode. b) UTF8 y UTF16. Cuáles son sus longitudes de palabra? Son compatibles (es decir, existen caracteres que comparten la misma representación en ambas codificaciones)? Hay alguna diferencia en el rango de caracteres que pueden representar? c) Observa el siguiente comentario extraído de un foro donde se trata de explicar las diferencias entre ISO 8859 1 y UTF8 a la hora de ser utilizados para construir páginas web (compara las afirmaciones vertidas con tu propia experiencia y tus conocimientos): Ventajas y desventajas de ISO 8859 1: 2-7

Todos los editores de texto, editores de html manejan sin problemas esta codificación con lo que te ahorras dolores de cabeza. Lo malo son los acentos, ya que si bien los puedes escribir tal cual no se verán correctamente y tendrás que usar á y demás. Realiza un comentario crítico sobre la anterior opinión, en especial de la segunda afirmación. d) Observa ahora lo que el mismo individuo comenta sobre UTF8 (sic): ventajas y desventajas de UTF8: Olvidate del lenguaje que lo escribas (salvo japones y demás idiomas idiogramáticos que usan UTF 16) porque te lo va a coger tal cual, podrás escribir directamente los acentos y siempre se verán correctamente. Realiza un nuevo comentario crítico sobre las dos afirmaciones que contiene el mismo. 5. Acabamos de guardar un texto en nuestro ordenador en tres ficheros distintos de texto. Nos encontramos con las siguientes propiedades de los mismos: a) Por qué los ficheros tienen distintos tamaños almacenando el mismo texto? b) Alguien nos dice que el texto en Prueba1.TXT ha sido guardado con una codificación de longitud de palabra 1. A cambio de su información nos formula las siguientes preguntas Qué codificación hemos usado, más probablemente, en Prueba3.TXT? Y en Prueba2.TXT? Cuántos caracteres especiales (no ASCII) hemos usado en el texto como máximo? 6. Responde cuáles de las siguientes afirmaciones son verdaderas o falsas. Todas las respuestas deben ir acompañadas de una justificación razonada para ser consideradas correctas: 3-7

a) Las codificaciones de longitud de palabra 1 byte pueden representar un máximo de 256 caracteres. b) Todas las codificaciones de la familia ISO 8859 representan el mismo repertorio de caracteres, aunque estos puedan encontrarse en distintas posiciones de sus correspondientes tablas. c) El repertorio de caracteres de UTF 16 y UTF 16BE es mayor que el de UTF 8. 7. El código fuente de la página web de la asignatura de nuestro compañero, a través del navegador, se ve de la siguiente forma: Él nos asegura que, como se puede observar, ha definido bien el meta correspondiente al charset. Hazle un diagnóstico de los errores que ha cometido, y cómo puede solucionarlo. A los pocos días nos lo volvemos a encontrar y nos cuenta que, tras varios días sin dormir, se ha dado cuenta de que si le indica al navegador que muestre la página con la codificación ISO 8859 1, lo que ve ahora es: Completa tu primer diagnóstico con una explicación completa de lo sucedido. 4-7

8. Las especificaciones HTML 4.01 indican lo recogido en el punto 5.4. Explica razonadamente dónde y cómo se aprecia su cumplimiento en la representación del siguiente fichero en IE y Mozilla Firefox. 5.4 Caracteres no representables Un agente de usuario puede no ser capaz de representar correctamente todos los caracteres de un documento, por ejemplo, porque el agente de usuario carezca de una fuente apropiada, porque un carácter tenga un valor que no pueda expresarse con la codificación de caracteres interna del agente de usuario, etc. Al haber tantas cosas diferentes que pueden hacerse en estos casos, este documento no prescribe ningún comportamiento por defecto. [ ] En ausencia de un comportamiento más sofisticado [ ], recomendamos el siguiente comportamiento a los agentes de usuario: 1. Adoptar un mecanismo claramente visible, pero no molesto, para alertar al usuario sobre los recursos ausentes. 9. Nos encontramos con el siguiente texto en formato Hexadecimal: 5-7

Su autor nos dice que ha usado la siguiente tabla para codificarlo (ISO 8859 1): Recupera el texto original (la posición 32 de la tabla corresponde con el espacio en blanco, y las posiciones 13 + 10 con el salto de línea propio de los sistemas Windows ). 10. Tenemos la siguiente descripción de la regla de codificación de UTF8 para caracteres Unicode: Los caracteres que en Unicode ocupan las posiciones (en Hexadecimal) entre 000000 hasta 00007F (dicho de otra forma, los 128 caracteres ASCII), se codifican en binario por medio de la secuencia de bits 0xxxxxxxx, donde xxxxxxx debe ser reemplazado por la codificación en binario de la posición en la tabla Unicode del carácter deseado; Los caracteres que en Unicode ocupan las posiciones (en Hexadecimal) entre 000080 (posición 129) hasta 0007FF (posición 2048) se codifican por medio de dos bytes de la forma 110xxxxx 10xxxxxx, donde xxxxx y xxxxxx son sustituidos por la codificación en binario de la posición en la tabla Unicode del carácter deseado. Aunque no forma parte de la regla, se sobreentiende que los bits sobrantes (por la izquierda) deben completarse con ceros. 6-7

A partir de la anterior información, muestra la representación binaria en UTF 8 de los siguientes caracteres: a) µ b) T c) æ d) & e) Ă La tabla Unicode tiene las siguientes posiciones: 7-7