VOIP P. Martín Cañas Escuela Técnica Superior de Ingeniería-ICAI. Universidad Pontificia Comillas. Asignatura: Comunicaciones Industriales Avanzadas. Curso 2011-2012 RESUMEN Este trabajo trata de resumir el concepto de la tecnología VoIP (Voice over Internet Protocol), que es un grupo de recursos que hacen posible que las señales de audio viajen a través de Internet utilizando un protocolo IP. Esto significa que la señal de voz se envía de forma digital en paquetes de datos en lugar de enviarla de forma analógica a través de los circuitos de la telefonía convencional. Se analizará su funcionamiento, su estructura y los protocolos que utiliza, llegando a la conclusión de que esta nueva tecnología tendrá una gran repercusión en el mundo de las comunicaciones en un futuro próximo. 1. Introducción Con el desarrollo de las redes de ordenadores, se logró enviar información entre máquinas situadas muy distantes geográficamente. Los avances tecnológicos producidos a lo largo de los años han logrado mejorar esas redes dotándolas de altos anchos de banda que permiten enviar gran cantidad de información simultánea y rápidamente. Pronto se planteó la posibilidad de enviar voz o video, y se desarrollaron soluciones propias para conseguirlo. Pero todas eran caras, e incompatibles entre sí. Eso ocasionó que tuvieran poco éxito. Con la aparición de los sistemas multimedia (principalmente las tarjetas de sonido) y su bajada de precios, se ha llegado a una situación en la que es raro encontrar un ordenador que no disponga de la capacidad de reproducir sonido y de recogerlo, mediante un micrófono. Además, con la paulatina implantación de Internet, o de redes locales basadas en el mismo protocolo, la posibilidad de mantener conversaciones de voz sin utilizar la telefonía tradicional ha vuelto a cobrar sentido. La idea es sencilla. El origen solicita una conexión con el destino mediante envío de información a través de la red. Cuando la comunicación se acepta, se comienza a enviar la voz digitalizada desde cada extremo al opuesto, hasta que se finalice la llamada. La diferencia principal entre esta solución y la telefonía tradicional es que ahora no se reservan recursos en la red. Cada paquete con voz digitalizada sabe cual es su destino, y la red se encarga de que llegue sin necesidad de que vaya a través del mismo camino que el resto. Cuando uno de los extremos no habla, simplemente no se envía nada, y la red no se satura con canales que no se utilizan. Además, la voz puede ser comprimida, lo que baja el consumo de ancho de banda. El argumento en favor de esta forma de comunicación por voz se basa en la existencia de numerosas redes IP funcionando en los entornos corporativos de datos, así como en la suposición de que parte de la capacidad de esas redes se está desaprovechando. Es decir, la telefonía sobre IP tiene la ventaja de implantarse en la mayoría de las redes empresariales actuales, para aprovechar el ancho de banda que la transmisión de datos deja libre. 1
2. Descripción detallada de la tecnología 2.1 Definición de VoIP VoIP (Voz sobre IP) es una tecnología que permite que la voz viaje en paquetes de datos, obviamente a través de Internet. La telefonia IP conjuga la transmisión de voz y la transmisión de datos. Se trata de convertir la señal analógia de audio a una digital para posteriormente comprimirla y encapsularla y que esta se transmita en forma de paquetes de datos a través de la red, permitiendo así las llamadas que no son exclusivamente de voz entre dos puntos distantes. A través de una red convergente se pueda realizar todo tipo de comunicación, ya sea de datos, video o cualquier tipo de información. La VoIP es por tanto una tecnología que permite encapsular la voz en paquetes de datos que se transmitan por una red de datos sin necesidad de disponer de los circuitos conmutados que se utilizan para la comunicación telefónica convencional (PSTN). Esta es una de la grandes ventajas de la telefonía IP frente a la convencional, ya que en la última se desperdician los recursos, al ser necesario un circuito físico por el que circule la señal. Con PSTN cada comunicación tiene asignado un circuito por el que se transmiten las señales del receptor y el emisor. Este circuito esta asignado a esa comunicación y es usado únicamente por esos dos terminales (receptor y emisor) hasta que la comunicación finaliza, se este hablando o no. Esto supone el desperdicio de infraestructura comentado anteriormente, ya que se esta reservando parte de esta para una comunicación que en algunos momentos es inexistente. Al contrario de este caso encontramos la telefonía IP, que manda los paquetes de datos por la red, por la que viajan todas la comunicaciones enrutadas cada cual a su destino, pero sin ningún camino preestablecido, es decir, múltiples conversaciones empaquetadas se transmiten a través de un mismo canal codificadas en flujos independientes. La ventaja es por tanto, que con la misma infraestructura se pueden prestar más servicios, y además la calidad del servicio y la velocidad son mayores. 2.2 Componentes principales Servidor: es el punto intermedio de las transmisiones, se encarga de manejar la contabilidad, la recolección, el enrutamiento, la administración y control del servicio, el registro de los usuarios, etc.. Según el sistema en el que se base la comunicación recibe un nombre. Para H.323 se conoce como Gatekeeper, en SIP, servidor SIP y en MGCP o MEGACO se le denomina Call Agent Gateway: es el puente de comunicación entre todos los usuarios. Su función principal es la de proveer interfaces con los terminales, es decir, enlazar la red VoIP con la red telefónica convencional. Las llamadas de voz se digitalizan, decodifican y empaquetan en el Gateway de origen y se descomprimen, decodifican y rearman en el Gateway de destino (Más tarde veremos que estas labores pueden ser realizadas por distintos elementos, según la configuración de la red). Terminales: telefonos convecionales o aparatos con interfaz VoIP, por ejemplo, telefono IP, PC con interfaz VoiP. En el terminal de origen, la señal analógica se recibe a través del micrófono del terminal y en el terminal destino, la señal analógica recuperada, se reproduce a través de los altavoces. Red IP: puede ser tanto una red privada, como una Intranet o Internet. 2
Figura 1: Componentes principales de una red VoIP 2.3 Funcionamiento de una red VoIP Años atrás, se descubrió que enviar una señal a un destino remoto también se podría hacer de manera digital es decir, antes de enviar la señal se debía digitalizar con un dispositivo ADC (analog to digital converter), transmitirla y en el extremo de destino transformarla de nuevo a formato análogo con un dispositivo DAC (digital to analog converter). VoIP funciona de esa manera, digitalizando la voz en paquetes de datos, enviándola a través de la red y reconvirtiéndola a voz en el destino. Básicamente el proceso comienza con la señal análogica del teléfono que es digitalizada en señales PCM (pulse code modulación) por medio del codificador/decodificador de voz (codec). Las muestras PCM son pasadas al algoritmo de compresión, el cual comprime la voz y la fracciona en paquetes (Encapsulamiento). Estos paquetes se forman a partir de las muestras de voz que son primero encapsuladas en RTP (protocolo de transporte en tiempo real) y luego en UDP (protocolo de datagrama de usuario) antes de ser transmitidas en una trama IP a través de la red. En el otro extremo de la red se realizan exactamente las mismas funciones en un orden inverso. Dependiendo de la forma en la que la red este configurada, el Router o el gateway pueden realizar la labor de codificación, decodificación y/o compresión. Por ejemplo, si el sistema usado es un sistema análogo de voz, entonces el router o el gateway realizan todas las funciones mencionadas anteriormente. En cambio, si el dispositivo utilizado es un PBX digital, entonces es este el que realiza la función de codificación y decodificación, y el router solo se dedica a procesar y a encapsular las muestras PCM de los paquetes de voz que le ha enviado el PBX. Para el caso de transportar voz sobre la red pública Internet, se necesita una interfaz entre la red telefónica y la red IP, el cual se denomina gateway y es el encargado en el lado del emisor de convertir la señal analógica de voz en paquetes comprimidos IP para ser transportados a través de la red. Del lado del receptor el proceso es el inverso, por lo que descomprime los paquetes IP que recibe de la red de datos, y recompone el mensaje a su forma análogica original conduciéndolo de nuevo a la red telefónica convencional. Es importante tener en cuenta también que todas las redes deben tener de alguna forma las características de direccionamiento, enrutamiento y señalización. El direccionamiento es requerido para identificar el origen y destino de las llamadas, también es usado para asociar las clases de servicio a cada una de las llamadas dependiendo de la prioridad. El enrutamiento por su parte encuentra el mejor camino a seguir por el paquete desde la fuente hasta el destino y transporta la información a través de la red de la manera más eficiente, la cual ha sido determinada por el diseñador. La señalización alerta a las estaciones terminales y a los elementos de la red su estado y la responsabilidad inmediata que tienen al establecer una conexión. 3
2.4 Estándares asociados a la tecnología Actualmente existen, principalmente, dos arquitecturas de VoIP para la transmisión de voz por Internet que se utilizan de forma abundante, H.323 y SIP. H.323 Fue el primer estándar internacional de comunicaciones multimedia. H.323 es más una revisión arquitectónica de la telefonía de Internet que un protocolo específico ya que hace referencia a una gran cantidad de protocolos específicos para codificación de voz, establecimiento de llamadas, señalización, transporte de datos y otras funciones, en lugar de especificar él todas ellas. El modelo general se ilustra en la figura 2. En el centro se encuentra una puerta de enlace que conecta Internet con la red telefónica. Dicha puerta de enlace es el lugar donde se hace la traducción del lenguaje entre los protocolos H.323 en el lado de Internet y los protocolos PSTN en el lado del teléfono. Los dispositivos de comunicación se llaman terminales. Una LAN podría tener un gatekeeper, el cual controla los puntos finales bajo su jurisdicción, llamados zona. Figura 2: El modelo arquitectónico H.323 de la telefonía de Internet El VoIP/H.323 comprende una serie de protocolos que cubren los distintos aspectos de la comunicación: a) Direccionamiento: RAS (Registration, Admision and Status): Protocolo de comunicaciones que permite a una estación H.323 localizar otra estación H.323 a través del Gatekeeper. DNS (Domain Name Service): Servicio de resolución de nombres en direcciones IP con el mismo fin que el protocolo RAS pero a través de un servidor DNS. b) Señalización: H.225 (RAS): Protocolo que permite a los terminales hablar con el Gatekeeper, solicitar y regresar ancho de banda y proporcionar actualizaciones de estado. Q.931: Protocolo de señalización de llamadas, para establecer y liberar las conexiones con la red telefónica RTC. H.245: Protocolo de control de llamadas, permite a los terminales negociar ciertos parámetros como: el tipo de Codec, la tasa de bits. c) Compresión de voz: Requeridos: G.711 y G.723.1 Opcionales: G.728, G.729 y G.722 d) Transmisión de voz: UDP: La transmisión se realiza sobre paquetes UDP, pues aunque UDP no ofrece integridad en los datos, el aprovechamiento del ancho de banda es mayor que con TCP. 4
RTP (Real Time Protocol): Maneja los aspectos relativos a la temporización, marcando los paquetes UDP con la información necesaria para la correcta entrega de los mismos en recepción. e) Control de la transmisión: RTCP (Real Time Control Protocol): Es un protocolo de control de los canales RTP. Se utiliza principalmente para detectar situaciones de congestión de la red y tomar, en su caso, acciones correctoras. Figura 3: La pila de protocolos H.323 Para el mejor entendimiento del orden en que se usan los protocolos y sus funciones, describiré el proceso de una llamada desde un terminal PC a un terminal convencional mediante los siguientes pasos: a) Descubrimiento: Se utiliza el protocolo H.225 / RAS para descubrimiento del Gatekeeper. La PC difunde un paquete UDP de descubrimiento de Gatekeeper. El Gatekeeper responde indicando su dirección IP. La PC se registra con el Gatekeeper, enviándole un mensaje de registro RAS en un paquete UDP. En caso de aceptación, la PC solicita un ancho de banda al Gatekeeper, enviándole un mensaje de admisión RAS. Cuando se ha proporcionado el ancho de banda, la PC establece una conexión TCP con el Gatekeeper, para comenzar el establecimiento de llamada. b) Señalizacion: (Establecimiento de la conexión) Se utiliza el protocolo Q.931, para el establecimiento de llamada con el Gatekeeper. La PC envía un mensaje SETUP al Gatekeeper, especificando el número telefónico de destino (o la dirección IP y el puerto si el destino es una PC). El Gatekeeper responde con un mensaje CALL PROCEEDING para confirmar la recepción de la solicitud. Al mismo tiempo, el Gatekeeper reenvía el mensaje SETUP al Gateway. El Gateway establece una señalización con la central telefónica de destino, haciendo timbrar el teléfono. La central de destino envía un mensaje ALERT al PC a través del Gateway, indicando que ya se ha emitido el timbrado o sonido. Cuando el destino levanta el teléfono, la central de destino retorna un mensaje CONNECT al PC a través del Gateway, para indicar que tiene una conexión de capa física. En este punto el Gatekeeper no participa en la llamada. Los paquetes de datos subsiguientes van directo al Gateway. 5
c) Control de la llamada: Se utiliza el protocolo H.245 para negociar los parámetros de la llamada. Parámetros como: el tipo de Codec que soporta, la tasa de bits, video, llamadas de conferencia, etc. Terminado la negociación de parámetros, se establecen dos canales de datos unidireccionales (para enviar y recibir). d) Transmisión de voz: En este punto, pueden comenzar el flujo de datos a través de los canales de datos unidireccionales, utilizando el protocolo RTP. El flujo de datos se controla mediante el protocolo RTCP. Si existe flujo de video, RTCP maneja la sincronización de audio / video. e) Liberación de la coneción: Cuando una de las partes cuelga, se utiliza el canal de señalización Q.931 para terminar la conexión. La PC contacta al Gatekeeper con un mensaje RAS de liberación del ancho de banda asignado. De otro lado, puede realizar otra llamada. En la figura 4 se muestran los diversos canales lógicos establecidos durante una llamada. Figura 4: Canales lógicos entre el invocador y el invocado durante una llamada. SIP El procotolo SIP surge como consecuencia de la opinión colectiva de que H.323 era una protocolo complejo e inflexible. La IETF diseño una forma las simple y modular para transmitir voz sobre IP, que es el SIP (Protocolo de Inicio de Sesión), que se define completamente en la RFC 2543 y en la RFC 3261. Esta basado en el Protocolo de Transporte de correo simple (SMTP) y en el Protocolo de Transferencia Hipertexto (HTTP). SIP es un protocolo de la capa de aplicación independiente de los protocolos de paquetes subadyacentes (TCP, UDP, ATM, X.25). SIP esta basado en una arquitectura cliente servidor en la cual los clientes inician las llamadas y los servidores responden las llamadas. Es un protocolo abierto basado en estándares por lo que no es dependiente de un solo fabricante de equipos. SIP puede establecer sesiones de dos partes (llamadas ordinarias), de múltiples partes (en donde todos pueden oír y hablar) y de multidifusión (un emisor, muchos receptores). Las sesiones pueden contener audio, video o datos. Solo maneja establecimiento, manejo y terminación de sesiones, para el transporte de datos, se utilizan otros protocolos, como RTP/RTCP. SIP es un protocolo de capa de aplicación y puede ejecutarse sobre UDP o TCP. 6
Algunas de las características claves que SIP ofrece son: Resolución de direcciones, mapeo de nombres y redirección de llamadas. Descubrimiento dinámico de las capacidades media del endpoint, por uso del Protocolo de Descripción de Sesión (SDP). Descubrimiento dinámico de la disponibilidad del endpoint. Originación y administración de la sesión entre el host y los endpoints Algunos de los beneficios claves de SIP son: a) SIMPLICIDAD: SIP es un protocolo muy simple. El tiempo de desarrollo del software es muy corto comparado con los productos de telefonía tradicional. Debido a la similitud de SIP a HTTP y SMTP, el reuso de código es posible. b) EXTENSIBILIDAD: SIP ha aprendido de HTTP y SMTP y ha construido un exquisito grupo de funciones de extensibilidad y compatibilidad. c) MODULARIDAD: SIP fue diseñado para ser altamente modular. Una característica clave es su uso independiente de protocolos. Por ejemplo, envía invitaciones a las partes de la llamada, independiente de la sesión misma. d) ESCALABILIDAD: SIP ofrece dos servicios de escalabilidad: Procesamiento de Servidor; SIP tiene la habilidad para ser Stateful o Stateless. Arreglo de la Conferencia; Puesto que no hay requerimiento para un controlador central multipunto, la coordinación de la conferencia puede ser completamente distribuida o centralizada. e) INTEGRACION: SIP tienen la capacidad para integrar con la Web, E-mail, aplicaciones de flujo multimedia y otros protocolos. f) INTEROPERABILIDAD: porque es un estándar abierto, SIP puede ofrecer interoperabilidad entre plataformas de diferentes fabricantes. Parte de la simplicidad de SIP se basa en que cada usuario es identificado con una direccion definida como URL. Estas direcciones tienen el formato user@host, en la que el user puede ser un nombre o numero telefónico y el host el dominio (DNS) o la dirección de red (IP) El protocolo SIP se basa en texto y está modelado en HTTP. Una parte envía un mensaje en texto ASCII que consiste en un nombre de método en la primera línea, seguido por líneas adicionales que contienen encabezados para pasar los parámetros. Muchos de estos encabezados se toman de MIME para permitir que SIP interactúe con las aplicaciones de Internet existentes. Los métodos definidos por la especificación central son: INVITE: Solicita el inicio de una llamada. Los campos de la cabecera contienen: Dirección origen y dirección destino. El asunto de la llamada. Prioridad de la llamada. Peticiones de enrutamiento de llamada. Preferencias para la ubicación de usuario. Características deseadas de la respuesta. BYE: Solicita la terminación de una llamada entre dos usuarios. REGISTER: Informa a un servidor de registro sobre la ubicación actual del usuario. ACK: Confirma que se ha iniciado una sesión. CANCEL: Cancela una solicitud pendiente. OPTIONS: Solicita información a una Host acerca de sus propias capacidades. Se utiliza antes de iniciar la llamada a fin de averiguar si ese host tiene la capacidad de transmitir VoIP, etc. 7
Al igual que hice con el protocolo H.323, comentaré el proceso de una llamada entre PCs para la mejor compresión del protocolo. Esta consta de los siguientes pasos: Para establecer una llamada, el llamante crea una conexión TCP con el llamado y envía un mensaje INVITE en un paquete TCP, indicando la dirección de destino, la capacidad, los tipos de medios y los formatos del llamante. El servidor Proxy SIP investiga en donde esta el usuario y lo solicita en el servidor de localización. Si el llamado acepta la conexión(llamada), responde con un código de respuesta tipo HTTP (200 para aceptación). Opcionalmente también puede proporcionar información sobre sus capacidades, tipos de medios y formatos. El llamante responde con un mensaje ACK para terminar el protocolo y confirmar la recepción del mensaje 200. En este punto, pueden comenzar el flujo de datos utilizando el protocolo RTP. El flujo de datos se controla mediante el protocolo RTCP. Cualquiera puede solicitar la terminación de la llamada enviando un mensaje BYE. Cuando el otro lado confirma su recepción, se termina la llamada. En la figura 5 se muestra el proceso comentado anteriormente. Figura 5: Uso de servidores Proxy y de redirección con SIP. 3. Objetivos de la tecnología El objetivo principal de esta tecnología es sin ninguna duda, dar un servicio de comunicación tanto por voz como por imagen, que sea de buena calidad y sin retardo, además de que supone una opción mucho más económica de comunicación. Los problemas de la calidad del servicio en VoIP vienen derivados de dos factores principalmente: a) Internet es un sistema basado en conmutación de paquetes y por tanto la información no viaja siempre por el mismo camino. Esto produce efectos como la pérdida de paquetes o el jitter. b) Las comunicaciones VoIP son en tiempo real lo que produce que efectos como el eco, la pérdida de paquetes y el retardo o latencia sean muy molestos y perjudiciales y deban ser evitados. 8
Los factores a tener en cuenta a la hora de diseñar una red VoIP son: 1. Codec y Ancho de banda: Antes de que la voz sea transmitida sobre una red IP, primero debe ser digitalizada y comprimida. Dependiendo del codec utilizado y del número de muestras de voz que se quiera meter en cada paquete, el ancho de banda necesario puede aumentar bastante. La relación con la calidad de la voz es que cuanto mayor se la velocidad de transmisión, mejor será la calidad de la voz. La siguiente tabla (figura 6) muestra la variación del ancho de banda según el tipo de codec utilizado. Figura 6: Efectos en el ancho de banda del codec y del tamaño de la muestra. 2. Perdida de paquetes (Packet Loss): Las comunicaciones en tiempo real están basadas en el protocolo UDP. Este protocolo no está orientado a conexión y si se produce una pérdida de paquetes, estos no se reenvian. Además la perdida de paquetes también se produce por descartes de paquetes que no llegan a tiempo al receptor. Sin embargo la voz es bastante predictiva y si se pierden paquetes aislados se puede recomponer la voz de una manera bastante óptima. El problema es mayor cuando se producen pérdidas de paquetes en ráfagas. El valor establecido como máximo para que no se degrade una comunicación está establecido en el 1% de paquetes perdidos. El grado de deterioración tambien depende del codec utilizado, ya que cuanto más comprimido sea un paquete, más información lleva y por tanto la perdida de un paquete es más perjudicial. La mayoria de los paquetes se pierden a causa de la congestión en las redes. Para ayudar a que esto ocurra menos, existen detectores de actividad de la voz, lo que supone que los silencios no se retransmiten y se consigue disminuir bastante el tráfico, lo que ayuda a que la perdida de paquetes sea menor. 3. Retardo (Delay): Otra consideración importante en el diseño de una red VoIP es el efecto de retardo. Hay tres fuentes principales de retardo: Retardo Algorítmico: este es el retardo introducido por el codec y es inherente en el algoritmo de codificación. Fue explicado anteriormente junto con el ancho de banda. En la figura 6 se muestran los retardos asociados a los algoritmos más usados. 9
Retardo de Paquetización: es el tiempo para llenar un paquete de información (carga útil), de la conversación ya codificada y comprimida. Este retardo es función del tamaño de bloque requerido por el codificador de voz y el número de bloques de una sola trama. En RTP, las muestras de voz con frecuencia son acumuladas antes de ponerlo en una trama para trasmisión para reducir la cantidad de cabeceras (overhead). La RFC 1890 especifica que el retardo de paquetización por defecto debiera ser de 20 ms. Retardo de Propagación: es el tiempo requerido por la señal óptica o eléctrica para viajar a lo largo de un medio de transmisión y es una función de la distancia geográfica. La velocidad de propagación en el cable es aproximadamente de 4 a 6 Km/ms. Figura 7: Retardo de propagación según la velocidad y el tamaño de la trama. Retardo de Serialización: es un retardo fijo dependiente de los relojes de muestreo de la voz o de las tramas de red, esta relacionado directamente con la tasa del reloj de transmisión. Retardo de Componente: estos retardos son causados por varios componentes dentro del sistema de transmisión. Por ejemplo, una trama que esta pasando a través de un Router tiene que moverlo desde el puerto de entrada al puerto de salida a través del backplane. Hay algún retardo mínimo a la velocidad del backplane y algunos retardos variables debido al encolamiento y procesamiento en el router. 4. Eco: El eco se produce por un fenómeno técnico que es la conversión de 2 a 4 hilos de los sistemas telefónicos o por un retorno de la señal que se escucha por los altavoces y se cuela de nuevo por el micrófono. Cuando el retardo de extremo a extremo de una señal es corto, cualquier eco que es generado por el circuito de voz regresara al abonado llamante muy rapidamente y no será percibido. De hecho, la cancelación de eco no es necesario si el retardo de una via es menor que 25 ms. En otras palabras, si el eco regresa dentro de los 50 ms, no sera percibido. Sin embargo, el retardo casi siempre excederá los 25 ms, por lo que la cancelación de eco es siempre es requerida. Para solucionar este problema se suele recurrir a los canceladores de eco, que no son mas que un sistema por el cual el emisor almacena la señal que encía en memoria y la compara con la señal de vuelta por si en esta viene inherente algo de la señal enviada. Si es así, este dispositivo filtra la información cancelando las componentes de la señal enviada. 10
Figura 8: Eco causado por la impedancia de mismatch. 5. Variación del retardo (Jitter): Cuando las tramas son transmitidas a traves de una red IP, la cantidad de retardo experimentado por cada trama puede diferir. Esto es causado por la cantidad de retardo de encolamiento y tiempo de procesamiento que puede variar dependiendo del tráfico cargado en la red. Sin embargo el gateway fuente genera tramas de voz a intervalos regulares (es decir, cada 20 ms), el gateway destino tipicamente no recibira tramas de voz en intervalos regulares debido a este problema. El jitter es por tanto la diferencia de tiempos entre lo que se tarda en recibir el paquete y lo que se supone que debería de tardar en recibirse. Figura 9: Jitter. En la figura 9 se ilustra lo anteriormente comentado. En este caso el jitter del paquete c seria igual a D3-D2. En general, la estrategia en comunicación con el problema de jitter es almacenar las tramas recibidas en un buffer tan grande que permita a las tramas mas lentas llegar a tiempo para ser ubicadas en la secuencia correcta. El jitter mas grande debido a algunas tramas de mayor tamaño, serán almacenadas en el buffer lo cual introduce retardo adicional. Para minimizar el retardo debido al buffering, muchas aplicaciones usan un buffer jitter adaptivo. En otras palabras, si la cantidad de jitter en la red es pequeño, el tamaño del buffer será pequeño. Si el jitter se incrementa debido al aumento del tráfico en la red, el tamaño del buffer de destino se incrementara automáticamente para compensarlo. Por consiguiente, el jitter en la red empeorara la calidad de voz en la magnitud que crece el retardo de extremo a extremo debido al buffer de destino. 6. Retardo total (Delay Budget): El retardo total es la suma de todos los retardos que se pueden ocasionar desde que la voz del emisor es captada hasta que se reproduce la señal de audio al receptor. Esta compuesto por los retardos ocasionados en los codecs, los retardos de señalización, propagación, paquetización, los retados en los componentes que atraviesa la señal y el jitter. 11
La latencia o retardo entre el punto inicial y final de la comunicación debiera ser inferior a 150 ms. El oído humano es capaz de detectar latencias de unos 250 ms. Si se supera ese umbral, la comunicación se vuelve molesta. No hay una solución sencilla para abordar el problema del retardo total ya que son muchos los factores involucrados. La siguiente tabla muestra los retardos existentes y sus valores, que pueden ser fijos o variables. Por tanto, las soluciones que se puedan aportar a este problema dependen de aquellos factores variables, que son los que podemos intentar reducir. Figura 10: Delay Budget. 4. Estudio comparativo y razonado H.323 VS SIP El protocolo H.323 está más definido que el SIP, pero este último es más fácil de integrar. Ninguno es mejor ni peor, sino que uno es más útil que otro dependiendo de la utilización que le quieras dar. Analizaré las similitudes y diferencias que hay entre ellos con el objetivo de tener una comparación razonada: Similitudes: Ambos permiten llamadas de dos partes y múltiples partes utilizando las computadoras y los teléfonos como puntos finales. Ambos soportan negociación de parámetros, codificación y los protocolos RTP y RTCP. Diferencias: H.323 es un estándar grande, complejo y rígido, que especifica toda la pila de protocolos en cada capa lo que facilita la tarea de interoperabilidad pero es difícil de adaptar a aplicaciones futuras. Codifica los mensajes en binario, lo que es adecuado para conexiones de gran ancho de banda. SIP es un protocolo de Internet que funciona intercambiando líneas cortas de texto ASCII (fácil de leer por los usuarios), por lo que interactúa bien con otros protocolos de Internet. Es altamente modular y flexible, y se puede adaptar con facilidad a las nuevas aplicaciones. Para el direccionamiento, SIP solo trabaja con URLs mientras que H.323 tiene mecanismos de señalización flexibles. Protocolo de transporte: H.323 utiliza TCP para la señalización, que es fiable y SIP utiliza UDP, que no es fiable. H.323 soporta cualquier tipo de codec mientras que SIP solo soporta codecs IANA-registered o código privados de mutuo acuerdo. 12
En cuanto al desarrollo a futuro, todos los protocolos suelen ser actualizados cada algunos años, por lo que la diferencia entre el éxito de uno u otro lo marcará el usuario con sus preferencias. En la figura 11 se observa la comparativa de los aspectos más importantes de los protocolos. Figura 11: Comparación entre H.323 y SIP. 5. Conclusiones Para llegar a una conclusión razonada, enumeraré las ventajas y desventajas de VoIP. Ventajas: Es un servicio de bajo coste comparado con la telefonía convencional, especialmente en la llamadas internacionales. Reúne en una misma red todo tipo de comunicaciones: voz, datos, video Es independiente del hardware utilizado. La telefonía IP no requiere el establecimiento de un circuito físico durante el tiempo que toma la conversación, por lo tanto, los recursos que intervienen en la realización de una llamada pueden ser utilizados en otra cuando se produce un silencio, lo que implica un uso más eficiente de los mismos. Las redes de conmutación por paquetes proveen alta calidad telefónica utilizando un ancho de banda menor que el de la telefonía clásica, ya que los algoritmos de compresión pueden reducir hasta 8kbps la rata para digitalización de la voz produciendo un desmejoramiento en la calidad de la misma apenas perceptible. 13
Desventajas: Se transporta la información dividida en paquetes, por lo que una conexión suele consistir en la transmisión de más de un paquete. Estos paquetes pueden perderse, y además no hay una garantía sobre el tiempo que tardarán en llegar de un extremo al otro de la comunicación. Hay aspectos de la comunicación que no están optimizados ya que la tecnología esta en pleno desarrollo (todavía no se ha encajado completamente la red IP con VoIP), como la calidad del sonido, la demora en la transmisión.. Es insegura. Pueden darse casos de robo de datos, suplantación de identidad, virus expandidos a través de las conexiones El ancho de banda creciente a nivel mundial, y la optimización de los equipos de capa 2 y 3 para garantizar la calidad de los servicios de voz en tiempo real hace que el futuro de la Voz sobre IP sea muy prometedor. El auge de la telefonía IP es algo evidente y la principal razón es el reaprovechamiento de los recursos y la disminución en el coste de llamadas a través de Internet. La telefonía IP acabará por hacer desaparecer a la telefonía convencional, pero ese cambio no se realizará a corto plazo ya que aún quedan aspectos de la tecnología por perfeccionar, tales como la calidad de la voz (todavía es superior en la telefonía convencional) y el retardo y con la situación económica mundial actual se ralentiza el proceso de desarrollo tanto de la tecnología como de los equipos o aplicaciones necesarios para utilizarla. 6. Bibliografía Voice over IP Fundamentals. Jonathan Davidson and James Peters Redes de Computadoras. Andrew S. Tanenbaum (4ª Edición) Carrier Grade over IP. Daniel Collins (2ª Edición) Consultas generales. www.voipforo.com. Ultima consulta: 02/05/2012 Referencias: Figura 1: www.elricondelvago.com Figura 2: Figura 7-64 de Redes de Computadoras. Figura 3: Figura 7-65 de Redes de Computadoras. Figura 4: Figura 7-66 de Redes de Computadoras. Figura 5: Figura 7-68 de Redes de Computadoras. Figura 6: Tabla 9-1 de Voice over IP Fundamentals. Figura 7: Figura 9-5 de Voice over IP Fundamentals. Figura 8: Figura 8-3 de Voice over IP Fundamentals. Figura 9: Figura 8-2 de Voice over IP Fundamentals. Figura 10: Figura 9-1 de Voice over IP Fundamentals. Figura 11: Figura 7-69 de Redes de Computadoras. 14