Aceleradores Gráficos Su impacto en el BUS PCI: Soluciones Actuales. Autor : Ing. Juan Montenegro 1

Documentos relacionados
Buses y Subsistemas Internos de 32 bits

Organización n del Computador 1. C13 buses

Buses. Fernando Schapachnik 1 sobre trabajo previo de Juan Pablo Galeotti. Universidad de Buenos Aires, Buenos Aires, Argentina

ARQUITECTURA DE COMPUTADORES DESCRIPCIÓN BUS PCI (Tema 1: Conexión Externa de Procesadores. Buses)

Estructura general de una Computadora Arquitectura Estructura Von Neumann

Arquitectura de Computadoras. Anexo Clase 8 Buses del Sistema

Aceleradores gráficos. Su impacto en el bus del sistema.

Organización del Computador 1 Buses

Estructura y Tecnología de Computadores. Módulo D. Buses del computador

BUSES. Rosendo Pérez

Organización del Computador 1. C13 buses

ARQUITECTURA DE LOS SUBSISTEMAS DE BUSES Y ENTRADA/SALIDA

Arquitectura de placas

ARQUITECTURA DE LOS SISTEMAS BASADOS EN MICROPROCESADOR

Introducción a las Computadoras. Capítulo 3 Buses del Sistema

Velocidades Típicas de transferencia en Dispositivos I/O

Arquitectura de computadores I

Introducción a la Computación. Capítulo 7 Entrada/Salida

2º Cuatrimestre MÓDULO 12: Introducción al Subsistema de Entrada/Salida. fc 2

Motherboard. Daniel Rúa Madrid

Tema 1:Arquitectura de ordenadores

Montaje y Reparación de Sistemas Microinformáticos

Arquitectura de Computadoras 2011

Estructura de un Ordenador

Electrónica Digital II

Contenidos: Definiciones:

Entrada y Salida! EC-2721 Arquitectura del Computador I! Entradas/Salidas: Problemas. Entradas salidas: Criterios. Amplia variedad de periféricos!

Velocidades Típicas de transferencia en Dispositivos I/O

Tema 6 CONEXIÓN ENTRE SUBSISTEMAS: BUSES. Estructura de Computadores OCW_2015 Nekane Azkona Estefanía

Estructura de Computadores

GESTION DE ENTRADA Y SALIDA

1. Partes del ordenador. Nuevas Tecnologías y Sociedad de la Información

Partes de la Computadora: Equipo central. Partes de la Computadora: Equipo periférico

Consiste en un conjunto de circuitos impresos y conectores integrados en una única placa donde se alojan todos los componentes internos del ordenador

Controlador de Floppy Disk - DMA

TEMA 6.- INTERFACES PARA DISCOS DUROS. nexo de conexión que facilita la comunicación entre dos dispositivos

Tema: Microprocesadores

Bus PCI. Introducción

Arquitectura de Computadores. Tema 15. Buses

Integración de Equipos para Comunicaciones

Sist s em e a m s s O per e ativos o. s Unidad V Entrada Sali l d i a.

4. ORGANIZACIÓN DE LA ENTRADA/SALIDA

S u m a r i o SUMARIO CAPÍTULO 1 LOS COMPONENTES CAPÍTULO 2 EL MOTHERBOARD

1RA GENERACION. 2da GENERACION

ENTRADA-SALIDA. 2. Dispositivos de Carácter: Envía o recibe un flujo de caracteres No es direccionable, no tiene operación de búsqueda

Unidad IV. Chipset Controlador bus Puertos de E/S Controlador de Irrupciones

EJERCICIOS Buses. Indica e investiga la diferencia entre bus paralelo y bus serie.

Periférico: dispositivo que intercambia datos con la UCP o la memoria Problemas:

M O T H E R B O A R D

FUNDAMENTOS DE COMPUTADORES BUSES II

Tema 3. Características y protocolos de los buses

Memoria y Entrada/Salida Tecnología Organización - Expansión

COMPONENTES BÁSICOS DE UNA TARJETA MADRE

Práctica 9. Organización del Computador 1 2do. Cuatrimestre de 2005

Tutoría 2. Banco de memoria de 8 y 16 bits (8086)

Organización del Computador I. Introducción e Historia

Cuando la compañía INTEL decidió abandonar definitivamente el estándar VESA

Herramientas Informáticas I

TEMA 12: MEJORA DE LAS PRESTACIONES DE LA MEMORIA

ALMACENAMIENTO Y OTROS ASPECTOS DE LA ENTRADA/SALIDA. Ancho de banda máximo posible: una palabra por ciclo de reloj de manera sostenida, es decir:

BUSES. Una comunicación compartida Un conjunto de cables para comunicar múltiples subsistemas. Memoria

EL BUS I2C CARACTERISTICAS. Fernando Remiro

SELECCIÓN DE COMPONENTES PARA ENSAMBLE DE EQUIPOS DE COMPUTO. Ing. Eduardo Cruz Romero

(7) Unidad 7. Buses básicos de la arquitectura 80x86 SISTEMAS BASADOS EN MICROPROCESADORES. Grado en Ingeniería Informática EPS - UAM

Tema II. Unidad de memoria

ESTRUCTURA DE INTERCONEXIÓN DE UN COMPUTADOR

6. Entrada y Salida Explicación de la interfaz entre el computador y el mundo exterior.

MINISTERIO DE EDUCACIÓN PÚBLICA IPEC DE SANTA BÁRBARA MANTENIMIENTO DE EQUIPO DE COMPUTACIÓN. Tarjetas Madres Placas Base - Motherboard

ARQUITECTURA DE COMPUTADORES. 2º INGENIERIA INFORMATICA. Soluciones del BOLETIN 2: Tecnología de los sistemas de memoria. Curso 06/07.

Tema: Componentes físicos de un ordenador. Dónde se lleva a cabo el procesamiento de los datos en un ordenador? Qué unidades conforman el procesador?

Arquitectura de Computadoras 2011

En una placa base del ordenador personal, tenemos:

Periféricos Interfaces y Buses

Mejoras en el Sistema de E/S

Buses. Organización del Computador I. David Alejandro González Márquez

Estructura de Computadores 2 [08/09] Buses de interconexión

HARDWARE AVANZADO. Curso: 1º Bachillerato Año:2017/18. Adriana Ortega Gámez Kuni Gil López. Trabajo realizado por:

Estructura y Tecnología de Computadores. Módulo D. Buses del computador. Tema 6. Características y protocolos de los buses

Equipos microinformáticos

Tema 7. Entrada / Salida

También denominada adaptador de vídeo, es uno de los componentes más básicos e importantes del ordenador, ya que nos va a permitir visualizar toda la

Contenidos. Arquitectura de ordenadores (fundamentos teóricos) Elementos de un ordenador. Periféricos

2.- Se puede cambiar el puente norte en una placa si se estropea? 3.- La memoria caché, donde se encuentra y para qué sirve?

Tarjeta PCI Express de 4 Puertos USB con Puertos USB-A y 2 Canales Dedicados

En la Sección II, Datos de la Licitación, página 36, IAL 24.1

Arquitectura del Computador. Programación 1 er semestre 2013

SLOTS de expansión. Ranuras ISA. Técnico en Repatación de PC y Redes (intensivo)

PROBLEMAS TEMA 1: Estructuras de interconexión de un computador

Características de los Canales de E/S

Estructura y Tecnología de Computadores. Módulo E. El subsistema de E/S. Tema 9. Acceso directo a memoria (DMA) y procesadores de E/S

MULTIPROCESADORES COMERCIALES. José M. Cámara v. 2.0

Arquitectura de Computadores II Clase #7

Es un sistema de comunicación que transfiere datos entre una o varias computadoras

ACTIVIDAD 1 Anota en el recuadro el nombre del componente.

TEMA: RANURAS DE EXPANSIÓN, SOCKETS Y CONECTORES

MICROPROCESADORES I ELECTRONICA DIGITAL III INTERFASE PROGRAMABLE A PERIFERICOS PPI 8255

ANEXO CONVOCATORIA 256/2016 RENGLONES

Sistemas y Aplicaciones Informáticas. Tema 05. Microprocesadores. Estructura. Tipos. Comunicación con el Exterior.

Introducción a la Computación. Capitulo 4 Memoria Cache

Transcripción:

Aceleradores Gráficos Su impacto en el BUS PCI: Soluciones Actuales Autor : Ing. Juan Montenegro 1

Hoja de Ruta Que es PCI? Funcionamiento Aplicación: Procesadores Gráficos 3D Impacto en la tecnología PCI Soluciones Alternativas Autor : Ing. Juan Montenegro 2

Bus PCI (Periferical Component Interconnect) Se desarrolla debido a la baja velocidad del bus ISA, y las poco eficaces alternativas de alta velocidad. (la mayoría, caras y de poca escalabilidad) Intel en 1990 propone el borrador de la especificación 1.0: 32 líneas de datos 33MHz Posee una electrónica sencilla. Permite interconexión con otros buses (como ISA) Se forma PCISIG (PCI Special Interest Group como consorcio de fabricantes). Versión 2.0 66 MHz ->4.224 Gbps (528MB/s). Versión 2.1 64 bits de datos Autor : Ing. Juan Montenegro 3

Arquitectura PCI Autor : Ing. Juan Montenegro 4

PCI: estructura y señales: Se configura como bus de 32 ó 64 bits. 49 líneas de señal obligatorias. Sistema: reloj y reset 32 líneas multiplexadas (datos y direcciones) Líneas para interpretar y validar Control de interfaz: coordinan envío y recepción Arbitraje: pares de líneas dedicadas maestros-árbitro Señales de error (ej: paridad). Autor : Ing. Juan Montenegro 5

PCI: Señales obligatorias Autor : Ing. Juan Montenegro 6

PCI 64 bits Aparecen 51 señales opcionales. Interrupción: líneas dedicadas para cada dispositivo Soporte de caché para que se conecten al PCI 32 líneas multiplexadas (datos y direcciones) (adicionales) Líneas de interpretación y validación 2 líneas que permiten que 2 dispositivos PCI utilicen 64 bits. Terminales de test: estándar IEEE 1149.1 Autor : Ing. Juan Montenegro 7

PCI: Transferencia de Lectura Autor : Ing. Juan Montenegro 8

PCI: Transferencia de Lectura a) El master obtiene el control del bus, inicia la comunicación activando FRAME, que deberá permanecer activa hasta que este termine la comunicación. También coloca la dirección de inicio en el bus de direcciones en el flanco ascendente del primer ciclo de clock, y con C/BE (líneas de comandos / Byte Enable), establece la operación a realizar (lectura o escritura de memoria, o de entrada salida). Autor : Ing. Juan Montenegro 9

PCI: Transferencia de Lectura b) Al comienzo del clock 2, el dispositivo slave (del cual se leerán los datos) reconoce la dirección colocada en AD. Autor : Ing. Juan Montenegro 10

PCI: Transferencia de Lectura c) El master deja las líneas AD libres, cambia las líneas C/BE para indicar cuáles de los bytes de las líneas AD se utilizarán para transferir el dato direccionado. El master activa IRDY (Initiator ready) para indicar que está preparado para recibir datos. Autor : Ing. Juan Montenegro 11

PCI: Transferencia de Lectura d) El slave (dispositivo de lectura seleccionado) activa DEVSEL (Device Select) para indicar que ha reconocido las direcciones y va a responder. Coloca el dato solicitado en las líneas AD y activa TRDY (Target ready) para indicar que hay un dato válido en el bus. Autor : Ing. Juan Montenegro 12

PCI: Transferencia de Lectura e) El master lee el dato al comienzo del clock 4 y cambia las líneas de habilitación de byte según se necesite para la próxima lectura. Autor : Ing. Juan Montenegro 13

PCI: Transferencia de Lectura f) El slave necesita un tiempo adicional para preparar el segundo bloque de datos para la transmisión. Por consiguiente desactiva TRDY para señalar al master que no proporcionará un nuevo dato en el próximo ciclo. En consecuencia, el master no lee las líneas de datos al comienzo del clock 5 y no cambia la señal de habilitación de byte durante ese ciclo. El bloque de datos es leído al comienzo del clock 6. Autor : Ing. Juan Montenegro 14 Präsentat ion

PCI: Transferencia de Lectura g) Durante el clock 6, el slave sitúa el tercer dato en el bus. Pero (en este ejemplo específico) el master está ocupado y por lo tanto desactiva IRDY. Esto hará que el esclavo mantenga el tercer dato en el bus durante un ciclo de reloj extra. Autor : Ing. Juan Montenegro 15

PCI: Transferencia de Lectura h) El master sabe que el tercer dato es el último y por eso desactiva FRAME. Además, activa IRDY para indicar que está listo para completar esa transferencia. Autor : Ing. Juan Montenegro 16

PCI: Transferencia de Lectura i) El master desactiva IRDY, con esto hace que el bus vuelva a estar libre, y el slave desactiva TRDY y DEVSEL. Autor : Ing. Juan Montenegro 17

PCI: Arbitraje Arbitraje centralizado Cada maestro tiene dos líneas dedicadas REQ (petición del bus) GNT (concesión del bus) Transmisión Dispositivo PCI (o CPU) solicita bus activando REQ Espera GNT Usa el bus mientras tenga GNT Autor : Ing. Juan Montenegro 18

PCI: Arbitraje Árbitro de PCI GNT REQ Dispositivo PCI GNT REQ Dispositivo PCI GNT REQ Dispositivo PCI Autor : Ing. Juan Montenegro 19

Procesamiento 3D Autor : Ing. Juan Montenegro 20

Procesamiento 3D Modelado de escenas Uso de algoritmos matemáticos Consiste en representar todos los objetos mediante conjuntos de triángulos, formados por vértices (vertex) Se comienza agregando triángulos hasta representar superficies muy complejas... Autor : Ing. Juan Montenegro 21

Procesamiento 3D Autor : Ing. Juan Montenegro 22

Procesamiento 3D Luego el procesamiento continua con: Transformación de coordenadas Rotaciones Multiplicación Autor : Ing. Juan Montenegro 23

Procesamiento 3D Calculo de la Iluminación... Autor : Ing. Juan Montenegro 24

Procesamiento 3D Y continúa con: Simulación de la cámara o punto del observador Rasterización (determinación de superposiciones de píxeles de diferentes polígonos en la imagen) Texturado (aplicar texturas mediante mapas de bits) Calculo de superficies ocultas. Autor : Ing. Juan Montenegro 25

Procesamiento 3D Originalmente llevado a cabo mediante un pipeline de Hardware que implementaba en forma secuencial todos estos procesos tomando como entrada un stream o flujo continuo de vertex Stream de Vertex Procesador De Vertex Vertex Transformado Ensamblado De Triangulos Stream de Triangulos Iluminacion Texturado Stream de Fragmentos Rasterizado Stream de Triangulos visibles Proceso de ViewPort Pixel Stream Frame Buffer Imagen Display Autor : Ing. Juan Montenegro 26

Procesamiento 3D Nuevo enfoque: Multiprocesamiento Se utiliza una grilla de Unidades de Procesamiento multipropósito (UPs) agrupados en clusters Cualquiera de ellos puede implementar cualquiera de las antes mencionadas etapas del pipeline gráfico Cada uno de ellos cuenta con memoria cache propia, unidades de punto flotante y de Captura de Textruras (Texture Fetch) Calculo de Vertex Geometria Y transformaciones Rasterizador Calculo de iluminacion Diferentes procesamientos concurrentes Cluster de UPs Cluster de UPs Cluster de UPs Cluster de UPs GPU Cache L1 Cache L1 Cache L1 Cache L1 Autor : Ing. Juan Montenegro 27

Impacto en las diferentes tecnologías Autor : Ing. Juan Montenegro 28

Procesamiento de Video 3D en PCI Buffer Local de Texturas Monitor Buffer de trama Textura 2 Chip Gráfico RAM del Sistema a Local CPU Chipset PCI Memoria Del Sistema Textura 1 Textura 2 Los mapas de textura se leen del disco duro, y se cargan en la memoria del sistema, pero antes pasan a través de la interfaz IDE al bus y al chipset de video. Drive de DISCO BUS PCI Cuando se necesita una textura para una escena, el procesador lo toma de la memoria del sistema. Lo procesa y cachea en disco los resultados. Finalmente se almacena en memoria para que lo tome el Chip Gráfico Autor : Ing. Juan Montenegro 29

Bus AGP (Accelerated Graphics Port) Bus de alto rendimiento para controlador gráfico. AGP reduce cuellos de botella ya que es un bus dedicado de alta velocidad. Necesidades de las aplicaciones gráficas: Acceso rápido a memoria local de video (refresh) Elementos de píxel (3D) Información del eje Z Planos superpuestos Malla poligonales Texturas 32 líneas multiplexadas: direcciones/datos Alta velocidad (reloj del bus de la CPU) Transmisión: 528 MB/s ó 1 GB/s Autor : Ing. Juan Montenegro 30

Procesamiento de Video 3D con AGP Buffer de trama CPU Memoria Del Sistema Textura 1 Monitor Chip Gráfico AGP Chipset Textura 2 BUS PCI Drive de DISCO Autor : Ing. Juan Montenegro 31

Procesador Pentium III Cache L2 2.0 GB/s Core Memoria Local Acelerador Gráfico Intel 740 I/O 132 MB/s PCI AGP 528 MB/s I/O 800 MB/s Intel 440BX AGPset 800 MB/s Memoria del Sistema Texturas BUS AGP sobre Procesador Pentium III Autor : Ing. Juan Montenegro 32

Plataforma PCI: Arquitectura y Performance A medida que aumentan los requerimientos de ancho de banda de bus por parte de los dispositivos, las plataformas PCI evolucionaron en una arquitectura compuesta por dos puentes: Norte: representado por el Hub de Memoria. (North Bridge) Sur: representado por el Hub de E/S. (South Bridge) Los recursos de alta performance se conectan al N.B. Los de baja performance al S.B. Dentro de los recursos de baja performance del Hub Controlador de E/S, algunos requieren conexión de alta performance (p.ej. un CD) y otros se pueden utilizar como un segmento compartido del bus PCI (p.ej. Ethernet y SCSI) Autor : Ing. Juan Montenegro 33

Arquitectura PCI-X PCI-X fue desarrollado para extender la performance de PCI. El Bridge HOST/PCI-X representa una consolidación de los controladores de Hub en una estructura de Bridge único. Inicialmente PCI-X simplemente incrementa la frecuencia de la línea de la señal CLK respecto de PCI con el objeto de incrementar el ancho de banda del segmento del bus. Eventualmente PCI-X DDR y QDR proveen una fuente de sincronismo para mejorar el ancho de banda del segmento. D y Q se refieren a dual y quad como múltiplos respectivamente de la señal de strobe, dentro de un mismo período de la señal CLK. El incremento en el ancho de banda del segmento del bus reduce ampliamente el número de slots de conexión de placas por cada segmento de bus. El aumento en la performance de los PCI-X DDR y QDR resulta en interconexiones punto a punto. Autor : Ing. Juan Montenegro 34

Arquitectura PCI-X Autor : Ing. Juan Montenegro 35

Fin de la Clase!Muchas Gracias! Autor : Ing. Juan Montenegro 36