DISEÑO DE UNA TÉCNICA QUE PERMITA REDUCIR EL ESPACIO DE ALMACENAMIENTO EN VIDEOS CAPTURADOS MEDIANTE CÁMARAS IP USADOS EN VIDEO-VIGILANCIA



Documentos relacionados
CAPITULO I INTRODUCCION. Conforme la informática avanza, las imágenes se han convertido en un área muy

GUÍAS FÁCILES DE LAS TIC

Qué son las cámaras ip?

CAPÍTULO I. Sistemas de Control Distribuido (SCD).

Actividades para mejoras. Actividades donde se evalúa constantemente todo el proceso del proyecto para evitar errores y eficientar los procesos.

Tecnología IP para videovigilancia... Los últimos avances han hecho posible conectar cámaras directamente a una red de ordenadores basada en el

PRINCIPIOS SOBRE FORMATOS DIGITALES Y HD

Colección de Tesis Digitales Universidad de las Américas Puebla. Morales Salcedo, Raúl

Barrido progresivo frente al barrido entrelazado

Policía Local de Santurtzi

4. DESARROLLO DEL SISTEMA DE INFORMACIÓN REGISTRAL AUTOMATIZADO

Introducción. Ciclo de vida de los Sistemas de Información. Diseño Conceptual

La radiología digital. sencilla.

ALTA DEFINICIÓN: NUEVAS TENDENCIAS

Características y ventajas de WinZip

RECOMENDACIONES DE INVESTIGACIÓN FUTURA.

5. Despliegue en la PC

Formatos y Compatibilidad. Años anteriores al 2005 los formatos analógicos más comunes eran:

ESCUELA SECUNDARIA TECNICA No. 54 JAIME TORRES BODET SISTEMA DE VIDEO VIGILANCIA EN LABORATORIOS

Qué es lo que su empresa necesita? Productividad? Organización? Eficiencia? Ahorro? Control? Seguridad?

Capítulo 6: Conclusiones

GUÍA TÉCNICA PARA LA DEFINICIÓN DE COMPROMISOS DE CALIDAD Y SUS INDICADORES

Resumen Ejecutivo. Sistemas de Gestión, Conversión y Difusión de Contenidos Audiovisuales 3D para Pantallas Autoestereoscópicas

Tecnología de los medios: Sistemas y formatos de video digital definición standar (II) Autor: Javier Fombona Cadavieco

1. Conociendo el equipo

Proyecto de Digitalización del Archivo Histórico de las Compañias

PUERTOS DE COMUNICACIÓN EXTERNOS TIPO VELOCIDAD DESCRIPCION GRAFICO

UNIDAD DE TRABAJO Nº2. INSTALACIONES DE MEGAFONÍA. UNIDAD DE TRABAJO Nº2.1. Descripción de Componentes. Simbología AURICULARES

INDICADORES. PROBLEMAS ASOCIADOS A SU SELECCIÓN PARA MEDIR SUSTENTABILIDAD Y EFICIENCIA AMBIENTAL

ISO14001: disponer de un certificado bajo la versión de 2008 en vigor - superar una auditoria bajo los requisitos de la nueva versión

Para tener una visión general de las revistas de estadística, ir a:

GUÍA RÁPIDA DE TRABAJOS CON ARCHIVOS.

Digitalización de imágenes con ayuda del histograma

Solución de telefonía para empresas TL Presentación de producto. Telefonía IP

Capítulo 5: Pruebas y evaluación del sistema. A continuación se muestran una serie de pruebas propuestas para evaluar varias

Figura 1.12 Señalización analógica y digital de datos analógicos y digitales.

INTRODUCCION AL CONTROL AUTOMATICO DE PROCESOS

La revolución del contenido multimedia de pies a cabeza.

Transparencia Salamanca: Portal de Transparencia en pequeños municipios.

CÁMARAS DE VIGILANCIA

CURSO BASICO CCTV CCTV-0901A

Nueva generación de materiales. Sincronismo video/web

Capítulo 1. Introducción

4. EVALUACIÓN DEL PROGRAMA DE CAPACITACIÓN

digital binaria (0 Proporcionalidad La proporcionalidad es la razón entre la anchura y

1. La nueva interfaz del programa

Capítulo 1 CAPÍTULO 1-INTRODUCCIÓN-

Eficacia operativa en el sector público. 10 recomendaciones para reducir costes

Manual del Profesor Campus Virtual UNIVO

OBJETIVOS Conocer el concepto de vídeo digital. Digitalizar vídeo digital. Distinguir los formatos de vídeo. Editar vídeo.

I NTRODUCCIÓN 1. ORDENADOR E INFORMÁTICA

BASES DE DATOS TEMA 3 MODELO ENTIDAD - RELACIÓN

Diseño de una estrategia tecnológica de Customer Relationship Management (CRM) para la empresa BPM de México. CAPITULO 6

SISTEMA DE CIRCUITO CERRADO CCTV Y SISTEMAS BIOMÉTRICOS DE CONTROL DE ASISTENCIA Y CONTROL DE ACCESO

Caso práctico de Cuadro de Mando con Tablas Dinámicas

En este capítulo se describe la forma de cómo se implementó el sistema de video

Programa Tracker : Cómo generar Vectores y sumarlos

Guía de selección de cámaras. Factores que se deben tener en consideración al seleccionar las cámaras de videovigilancia

I N T R O D U C C I Ó N

Barrido progresivo y HDTV

MICRÓFONOS. Conceptos básicos

WHITE PAPER. Convertir un Sistema de CCTV Analógico en uno de Vigilancia-IP

LA FOTOGRAFÍA CLÍNICA EN ODONTOLOGIA

Capítulo I Introducción

Qué ventajas tienen las cámaras ip frente a los sistemas de vigilancia CCTV tradicionales?

Creado dentro de la línea de sistemas operativos producida por Microsoft Corporation.

4 Teoría de diseño de Experimentos

Manual de usuario para Android de la aplicación PORTAFIRMAS MÓVIL

TECNOLOGÍAS DE LA INFORMACIÓN Y LA COMUNICACIÓN (4º ESO, 1º y 2º BACHILLERATO) INTRODUCCIÓN

Centrados en sus objetivos SERVICIOS Y SOPORTE DE AGILENT RESUMEN DE POSIBILIDADES

CAPÍTULO 4. DISEÑO CONCEPTUAL Y DE CONFIGURACIÓN. Figura 4.1.Caja Negra. Generar. Sistema de control. Acumular. Figura 4.2. Diagrama de funciones

P9: ENSAYO DE VACÍO Y CORTOCIRCUITO DEL TRANSFORMADOR MONOFÁSICO FUNDAMENTOS DE TECNOLOGÍA ELÉCTRICA

Por qué es importante la planificación?

Utilización de Tecnologías de la Información y las Comunicaciones (TICs) en las empresas industriales argentinas

Métricas, Estimación y Planificación en Proyectos de Software

Seminario Electrónico de Soluciones Tecnológicas sobre. Acceso a Internet. 1 de 12

Las TIC se constituyen como herramienta esencial para que las empresas aragonesas puedan continuar compitiendo en el mercado

IMAGE RESIZER FOR WINDOWS, ÚTIL PARA REDUCIR EL TAMAÑO O REDIMENSIONAR IMÁGENES Y FOTOGRAFÍAS (DV00409C)

Unidad VI: Supervisión y Revisión del proyecto

El muestreo archivístico, que es una de las técnicas de la Valoración Documental, ha sido

PRC-DTI-006 Administración de Roles de los Sistemas de Información de la DTI Procedimiento Dirección de TI - COSEVI

CAPÍTULO 2 ANTECEDENTES

TRABAJO COOPERATIVO EN ROBOTS

Rendimiento y eficacia

GERENCIA DE INTEGRACIÓN

El proceso de edición digital en Artelope y CTCE

ORDEN ORGANIZACIÓN ESTANDARIZACIÓN LIMPIEZA INTEGRACIÓN

CAPÍTULO III MARCO TEÓRICO. Cada día cambian las condiciones de los mercados debido a diferentes factores como: el

Software Junto con el Kit se incluyen 2 programas para sacar el mayor provecho del sistema.

UNIVERSIDAD DE ORIENTE FACULTAD DE ICIENCIAS ECONOMICAS LAS REDES I. Licda. Consuelo Eleticia Sandoval

Woxter i-video Capture 100 Guía rápida de instalación (Para Windows)

Lincamiento técnico para la migración de equipos de cómputo de la Universidad de Costa Rica, hacia el Sistema Operativo Windows 10.

CAPÍTULO 3 3 DISEÑO DE UN MECANISMO DE DETECCIÓN DE TRÁFICO MALICIOSO PARA REDUNAM

ORIENTACIONES SIMCE TIC

Manual TMPGEnc Por Krator

Un par de ideas sobre la cámara fotográfica

Anexo I. La visión. El proceso de la visión. 1. Introducción. 2. La visión

Direccionamiento IPv4

Una experiencia en la enseñanza de los primeros cursos del área matemática.

Servicio de hospedaje de servidores

Transcripción:

UNIVERSIDAD NACIONAL DE TRUJILLO FACULTAD DE CIENCIAS FISICAS Y MATEMATICAS ESCUELA ACADEMICO PROFESIONAL DE INFORMÁTICA DISEÑO DE UNA TÉCNICA QUE PERMITA REDUCIR EL ESPACIO DE ALMACENAMIENTO EN VIDEOS CAPTURADOS MEDIANTE CÁMARAS IP USADOS EN VIDEO-VIGILANCIA Trabajo de Graduación Autores: Asesor: Alama Rodríguez, Kevin Ashley Grados Caballero, Julio Giampiere Ing. Salazar Campos, Juan Orlando Trujillo Perú 2014

Índice General RESUMEN... 5 INTRODUCCIÓN... 6 CAPITULO I: GENERALIDADES DEL PROYECTO... 7 1.1 Problema... 7 1.1.1 Realidad Problemática... 7 1.1.2 Formulación... 8 1.2 Antecedentes del Proyecto... 8 1.2.1 Internacionales... 8 1.2.2 Nacionales... 9 1.3 Hipótesis... 9 1.4 Identificación de Variables.... 10 1.4.1 Variable Independiente.... 10 1.4.2 Variable Dependiente.... 10 1.5 Objetivos... 10 1.5.1 Objetivo General... 10 1.5.2 Objetivos Específicos.... 10 1.6 Justificación de la Investigación... 10 1.6.1 Económico... 10 1.6.2 Tecnológico... 10 1.6.3 Operativo... 10 1.6.4 Académico... 11 1.6.5 Personal... 11 1.6.6 Social... 11 CAPITULO II: MATERIALES Y MÉTODOS... 12 2.1 Población y Muestra.... 12 2.1.1 Población.... 12 2.1.2 Muestra.... 12 2.2 Técnicas e Instrumentos.... 13 2.2.1 Técnicas.... 13 2.2.2 Instrumentos.... 13 2.3 Fuentes... 13 2.4 Análisis e Interpretación de Resultados.... 13 2.4.1 Diseño de Contrastación... 13 2.4.2 Indicadores... 13 2

CAPITULO III: MARCO TEÓRICO REFERENCIAL... 14 3.1 Video vigilancia... 14 3.1.1 Definición... 14 3.1.2 Características... 14 3.1.3 Funcionamiento... 15 3.1.4 Hardware pare realizar video-vigilancia (VideoCamaras, 2011)... 15 3.1.5 Aplicaciones para supervisión y vigilancia... 15 3.2 Videos... 16 3.2.1 Historia... 16 3.2.2 Definición... 16 3.2.3 Características... 17 3.2.4 Estructura de los videos... 21 3.2.5 Formatos de almacenamiento... 22 3.2.6 Compresión de videos... 23 3.2.7 Visión general de las técnicas de compresión... 23 3.2.8 Aplicaciones... 25 3.3 Técnica de procesamiento de videos... 26 3.3.1 Fases de procesamiento de videos... 26 3.4 Algoritmos de comparación de imágenes... 32 3.4.1 Detección de duplicados... 32 3.5 Definiciones de términos usados... 36 CAPITULO IV: DESARROLLO METODOLÓGICO... 37 4.1 Análisis para la captura del video... 37 4.2 Análisis de algoritmos de pre-procesamiento... 39 4.3 Análisis para algoritmos de comparación de imágenes en la fase de segmentación. 40 4.4 Descripción... 40 4.5 Diseño de la técnica.... 40 4.6 Conclusiones... 42 REFERENCIAS BIBLIOGRÁFICAS... 43 ANEXOS... 45 3

ÍNDICE DE FIGURAS Figura 1: Fotogramas que conforman un video.... 17 Figura 2: (a) barrido progresivo y (b) barrido entrelazado... 18 Figura 3: Estructura de un archivo de video.... 22 Figura 4: Óptimo pipeline para procesamiento digital de videos dentro de una cámara.... 28 Figura 5: Clasificación de filtros nombrados lineales y no lineales... 29 Figura 6: La compresión del rango dinámico adaptivo (Algoritmo Iridix) en una iluminación muy desigual, (a) imagen original y (b) imagen tratada.... 30 Figura 7: Ventana W de filtrado.... 30 Figura 8: Persona caminando capturado en un conjunto de fotogramas.... 32 Figura 9: Procedimiento del método 1.... 34 Figura 10: Imágenes de bloques DCT Y, Cr y Cb... 34 Figura 11: Procedimiento del Método 3... 36 Figura 12: Diseño arquitectónico de la técnica... 40 Figura 13: Diagrama de flujo de técnica planteada... 41 Figura 14: Tasa de víctimas del área urbana por tipo de hecho delictivo. Semestre: octubre 2013 marzo 2014. (Porcentaje)... 45 Figura 15: Población de 15 y más años de edad, víctima de algún hecho delictivo, por ámbito de estudio. Semestre: octubre 2013 marzo 2014. (Porcentaje)... 45 Figura 16: Gráfico MYPE, según segmento empresarial, 2012. Total de 10444 empresas. (Porcentaje)... 45 ÍNDICE DE TABLAS Tabla 1: Resultados de entrenamiento del Método 1... 34 Tabla 2: Resultados de entrenamiento del Método 2... 35 Tabla 3: Resultados de entrenamiento del método 3.... 36 Tabla 4: Valores de evaluación de cuadros comparativos... 37 Tabla 5: Fases de la técnica propuesta... 37 Tabla 6: Cuadro comparativo de formas de captura... 38 Tabla 7: Cuadro comparativo de cámaras IP para captura.... 38 Tabla 8: Cuadro comparativo de formato de imágenes de salida.... 39 Tabla 9: Cuadro comparativo de filtros para reducción de ruido.... 39 Tabla 10: Cuadro comparativo de métodos de detección de duplicados.... 40 4

RESUMEN A medida que surgen nuevos cambios en la tecnología informática, también surgen nuevas necesidades de servicios, nuevas formas de mejorar el almacenamiento de la información del servicio que estemos utilizando. El presente trabajo de graduación tiene como objetivo de diseñar una técnica que permita reducir el espacio de almacenamiento en videos capturados mediante cámaras IP usados en video-vigilancia. Para implementar esta técnica fue necesario conocer las distintas características de videovigilancia, como su funcionamiento y los dos tipos de cámaras que se utilizan para ello. De lado de los videos consideramos necesario conocer sus características, estructura y los formatos existentes para los videos. La técnica requería conocer también, las distintas técnicas de procesamiento de videos y algoritmos de comparación de imágenes, para con ello, poder realizar la selección de acuerdo a las técnicas de procesamiento de video el algoritmo adecuado. 5

INTRODUCCIÓN Actualmente las empresas necesitan de un control para monitorear tanto a los empleados como a cada uno de los departamentos que la conforman. Es por esta razón que se ven obligados a adquirir un sistema de seguridad conocido como video-vigilancia. Estos sistemas están conformados por cámaras de grabación, internas o externas, diurnas o nocturnas, así como también de iluminación y captación infrarroja, para lugares estratégicos en los cuales es necesario un nivel de seguridad. En el mercado existen distintos tipos de cámaras, de los cuales se puede elegir la más adecuada, dependiendo de la arquitectura del edificio, la calidad y nivel de seguridad deseados y por último, de las posibilidades de control. Para poder controlar cada uno de las actividades que se realizan en las empresas, es necesario un programa computacional aplicado, que desarrolle el proceso de video-vigilancia, de los cuales tenemos de distintos tipos en el mercado tecnológico actual. Pero a todo esto, se le suma una complicación, pues el almacenamiento de video obtenido a través de video-vigilancia, es muy amplio, llegando a veces ser no útil para la empresa. Es por esto que ante la necesidad de contar con una técnica que solo obtenga del video los registros necesarios al ocurrir algún movimiento. Y así se podrá aplicar a los videos de video-vigilancia de cualquier parte del mundo con la seguridad de que se obtendrá del video información relevante para el análisis. Es el problema a solucionar a lo largo de este trabajo empleando un sistema de monitoreo, es obtener una técnica que reduzca el espacio de almacenamiento. La forma en que se abordará el problema será identificando los factores que lo provocan, para determinar posibles soluciones. Posteriormente se determinará por medio de comparación, la mejor solución, que en este caso es, mediante algoritmos de comparación de imágenes. Para alcanzar el objetivo, el trabajo de graduación tomará en cuenta las distintas características de video-vigilancia, videos y demás factores que intervienen en la problemática planteada. Con esto optar por la técnica de procesamiento de video más adecuado, de igual manera el o los algoritmos de comparación de imágenes que necesitemos. Finalmente, se obtendrá la técnica a usar en el proceso de video-vigilancia, que usaremos reduciendo el espacio de almacenamiento en videos. 6

CAPITULO I: GENERALIDADES DEL PROYECTO 1.1 Problema 1.1.1 Realidad Problemática Actualmente la inseguridad en nuestro país independientemente de la ciudad estudiada es muy alta, pues el 33.1% de la población de 15 años y de más edad afirman que han sido víctimas de algún evento que atentó contra su seguridad (INEI, 2014) (Anexo: Figura 2); en nuestro campo de estudio el 60% del total de delitos fueron registrados en Trujillo a nivel de región, esto causa que los habitantes no se sientan seguros, pues teme ser víctima de algún acto delictivo (Zubieta, 2014). Todo domicilio, edificio, local comercial, fábrica, etc., es vulnerable a sufrir daños o pérdidas por actos delincuenciales, no solamente económicos sino también físicos, psicológicos, emocionales, organizacionales, entre otros; daños que afectarán a la eficiencia y productividad del lugar. Pese a la legislación actual Peruana, los servicios públicos de la Policía no resuelven los problemas de inseguridad actual, no se dan abasto en un gran porcentaje; y es que, es indiscutible que el área de vigilancia y acción que debe cubrir la policía nacional es muy grande, por lo que son poco eficientes en relación a las zonas vulnerables y preparación contra la delincuencia. Para ello también se midió la efectividad de la Policía Nacional del Perú. Y las cifras halladas de los Trujillanos encuestados son que el 61% señaló que el trabajo que desempeña la Policía es regular, el 1% muy bueno, bueno 3%, malo 17% y 8% muy malo (Rey Manrique, 2011). Lamentablemente, la delincuencia ha convertido a Trujillo en una ciudad sombría en la que reina la inseguridad. Si es cierto contamos con 10 mil empresarios (pequeños, medianos) en la región (Anexo: Figura 3), estos son amenazados por la delincuencia organizada (Gobierno Regional, 2012), consecuentemente dichos empresarios en normal actitud de defensa recurren a productos como revólveres y servicios de seguridad de una gama no muy amplia existente a disposición en el mercado local, y a pesar de existir un sin número de empresas dedicadas a ello, los productos y servicios disponibles son similares y el cliente se ve obligado a elegir estos servicios, pero la complicación es el almacenamiento de dicha información obtenida por las cámaras, por lo que la técnica a diseñar intenta solucionar este problema, obteniendo la información necesaria para el cliente. Asimismo, los servicios de seguridad física disponibles con la presencia de personal armado, son muy costosos y por consiguiente reducido únicamente a un mercado de alto poder adquisitivo. Para un más amplio mercado existen los servicios de monitoreo de alarmas que a pesar de ser accesible son poco eficientes, vulnerables y de parcial protección. Debido a esta situación, este nuevo producto dará más opciones de servicios en el mercado local, complementará a los servicios de seguridad existentes, hará participe al cliente en la protección de su patrimonio, será accesible a más personas y empresas, será mucho más eficiente y dará más protección a los bienes custodiados. 7

1.1.2 Formulación Cómo reducir el espacio de almacenamiento en videos capturados mediante cámaras IP usados en video-vigilancia? 1.2 Antecedentes del Proyecto 1.2.1 Internacionales Gutiérrez Alonso, Esther (2007). En su tesis Aplicación de las máquinas de soporte vectorial para el reconocimiento de matrículas, presenta un reconocimiento de matrículas y propone una alternativa a la técnica usualmente utilizada, las redes neuronales artificiales por máquinas de soporte vectorial, esta última ha demostrado ser superior en varios campos, como el reconocimiento facial, tiene como objetivo analizar las prestaciones de la técnica en el reconocimiento de matrículas y evaluar sus resultados. Como metodología usa el entorno de programación Matlab, tiene la ventaja de contar con una librería destinada a la manipulación y procesamiento de imágenes. El proyecto obtuvo porcentaje de acierto elevados en el reconocimiento, se demuestra que las máquinas de soporte vectorial tienen gran capacidad para reconocer imágenes siempre y cuando se empleen las variables adecuadas. Aporta a la investigación dando conocimientos en el uso de máquinas de soporte vectorial sobre múltiples clases. España Madrid. Bello, José A. (2007). En su tesis Dispositivo de detección y rastreo de movimiento autónomo para cámaras de video, presenta el problema de las cámaras de vigilancia que tienen movimiento pero que son dependientes de la aplicación y del sistema operativo que utilicen y tiene como objetivo principal aportar una solución sencilla y económica al rastreo de objetos en movimiento. Lo novedoso de este dispositivo es que el mismo debe moverse, siguiendo un foco de movimiento, en forma autónoma y sin perjudicar la señal de video de entrada. Este objetivo, junto con todos los enumerados en el segundo capítulo, fueron alcanzados exitosamente y, teniendo en cuenta la escasa disponibilidad de recursos, dentro de la planificación prevista. Más allá de la utilización del dispositivo en el ámbito de los sistemas de seguridad, la utilización de una red neuronal tiene por objeto brindar al dispositivo un mecanismo para tomar decisiones en tiempo real, reaccionando ante un estímulo visual, como lo haría un ojo real. El aporte de este punto permite, al integrar una red neuronal en un sistema embebido, dar un paso hacia el campo de la robótica. Aporta a la investigación dando una solución sencilla y económica al rastreo de objetos en movimiento. Buenos Aires Argentina. 8

1.2.2 Nacionales Gigi Vanessa Laura Namuche (2013). En su tesis Diseño de un sistema de video-monitoreo IP para la sala de manufactura del centro de tecnologías avanzadas de manufactura (CETAM), presenta el diseño de un sistema de video-monitoreo IP en el Laboratorio de Manufactura del Centro de Tecnologías Avanzadas de Manufactura (CETAM) que se encuentra ubicado en la Pontificia Universidad Católica del Perú (PUCP), el cual basa su funcionamiento en el desarrollo de un prototipo conformado por cámaras IP, las cuales serán los dispositivos de transmisión de video; inyectadores PoE, encargados de transmitir energía eléctrica a través de cable de datos Ethernet; un switch; servidores de Streaming y Web para la transmisión de datos a través de Internet. Se detallan las herramientas y tecnologías que se han estudiado y elegido para la selección de las cámaras IP, cuál es el funcionamiento de los inyectores PoE, cómo se van a programar las páginas web básicas que contendrán los videos de las cámaras del prototipo y por último, cuál será la función de los servidores para que se pueda transmitir esta información y que los usuarios externos al laboratorio sean capaces de visualizar los videos. El trabajo concluye corroborando que las herramientas seleccionadas para el desarrollo del sistema planteado han sido las adecuadas y que el prototipo es capaz de transmitir los videos en tiempo real. Aporta a la investigación dando conocimientos sobre una interfaz web basándose en un servidor de streaming y servidor web para el sistema de video-monitoreo IP. Lima Peru. Luis Sergio Dulanto Ramos (2014). En su tesis Diseño de un sistema de monitoreo remoto de parámetros ambientales críticos de la planta piloto de acuicultura de la PUCP, presenta un estudio sobre sistemas integrados de monitoreo aplicados en la acuicultura, el diseño de los módulos encargados de la adquisición y acondicionamiento de las señales correspondientes a los parámetros críticos de la Planta. También se seleccionó el Módulo integrado encargado de procesar las señales adquiridas y enviarlas a dispositivos que se encuentran en red. Finalmente se implementó el sistema completo en la Planta, y se probó su funcionalidad con la visualización de los parámetros en una computadora personal instalada en el pabellón de la especialidad. Aporta a la investigación en el desarrollo de módulos de procesamiento, posibilitando el diseño de un sistema de monitoreo de manera remota. Lima Peru. 1.3 Hipótesis El diseño de una técnica permitirá reducir el espacio de almacenamiento en videos capturados mediante cámaras IP usados en video-vigilancia. 9

1.4 Identificación de Variables. 1.4.1 Variable Independiente. Técnica 1.4.2 Variable Dependiente. Reducción del espacio de almacenamiento en videos capturados mediante cámaras IP usados en video-vigilancia. 1.5 Objetivos 1.5.1 Objetivo General. Diseñar una técnica que permita reducir el espacio de almacenamiento en videos capturados mediante cámaras IP usados en video-vigilancia. 1.5.2 Objetivos Específicos. Obtener información de empresas que ofrezcan el servicio y productos de video vigilancia con cámaras IP en el país. Estudiar las diferentes necesidades técnicas que permitan reducir el almacenamiento de información obtenida del software de vigilancia a través de cámaras IP. Diseñar la técnica para la reducción del espacio de almacenamiento. Desarrollar un prototipo que permita evaluar la técnica de video vigilancia con una cámara IP por internet, que permita el acceso a las cámaras IP por medio de un software desarrollado. Evaluar los resultados obtenidos. 1.6 Justificación de la Investigación 1.6.1 Económico El presente proyecto se justifica económicamente porque facilitará a las distintas empresas de Trujillo a lograr menores gastos en planteamiento de seguridad, dando la garantía de invertir en el software que se realizará. 1.6.2 Tecnológico El proyecto se justifica tecnológicamente porque permitirá a las empresas de Trujillo contar con un software de seguridad en sus instalaciones donde podrá realizar la captura de información de manera que en la base de datos sólo se almacene capturas que sirvan a la empresa, de otro lado se plantea establecer este sistema con cámaras IP que ayuden a un fácil monitoreo. 1.6.3 Operativo El proyecto facilitará el uso de la información obtenida por cámaras de video-vigilancia, lo cual hará más eficaz y más sencillo el trabajo de vigilancia. 10

1.6.4 Académico Este proyecto se justifica académicamente porque se pondrá en práctica los conocimientos aprendidos en nuestra formación profesional. 1.6.5 Personal Con el desarrollo del presente proyecto aplicaremos conocimientos de la carrera universitaria, ganaremos experiencia profesional y creceremos profesionalmente. 1.6.6 Social El presente proyecto se justifica socialmente porque ayudará a las empresas a brindar un servicio y mantenerse seguros ante cualquier acto delictivo, más aun cuando el cliente se siente amenazado de realizar cualquier actividad económica en algún establecimiento, este software ayudara a la protección del mismo. 11

CAPITULO II: MATERIALES Y MÉTODOS 2.1 Población y Muestra. 2.1.1 Población. Secuencias de videos de video-vigilancia adquiridos cámaras IP con las siguientes características: por medio de Resolución de imagen : VGA (640 x 480 px). Formato de compresión de imagen : M-JPEG, H264. Formato de video : AVI, MP4. Tamaño de video : 200 a 400 MB aproximadamente. Duración de video : 10 a 40 minutos aproximadamente. 2.1.2 Muestra. Al ser nuestra población de cantidad indefinida, calculamos el tamaño de la muestra con la siguiente fórmula: n Z P Q e Donde: : muestra. : es el grado de confiabilidad deseado para la muestra. : proporción de la población que tienen las característica de interés. : (1 - P), proporción de la población que no tienen las características. : error permitido. El nivel de confianza es el 95% que se aplicará de ahí se deduce que: Z = 1,96 Proporción de la población que tiene la característica P. Si no se conoce el valor de P se asume que es el 50%, entonces: P = 0.5 Proporción de la población que no tiene las características Q: Q = 1 - P Q = 1 0.5 Q = 0.5 El margen de error es de 5%, entonces: e = 0.05 12

Aplicando la fórmula: De esta manera de la fórmula se obtiene que el valor de la muestra n es de 384 videos. 2.2 Técnicas e Instrumentos. 2.2.1 Técnicas. Observación. 2.2.2 Instrumentos. Lista de cotejo. 2.3 Fuentes Organizaciones que trabajan con video-vigilancia. 2.4 Análisis e Interpretación de Resultados. 2.4.1 Diseño de Contrastación Para dicho análisis se aplicará el diseño Experimental, el cual se encuentra representado por el siguiente gráfico: Donde: X : Diseño de una técnica utilizando sustracción de imágenes y máquinas de soporte vectorial. O1 : Observación del resultado aplicando X en el mismo grupo. O2 : Observación del resultado sin la aplicación de X en el mismo grupo. 2.4.2 Indicadores. Porcentaje de reducción de espacio de almacenamiento. Nivel de significancia del video. 13

CAPITULO III: MARCO TEÓRICO REFERENCIAL 3.1 Video vigilancia 3.1.1 Definición Video-vigilancia consiste en instalar cámaras de vídeo que son grabadas en un grabador digital y que pueden ser vistas en un monitor central. Los sistemas de video-vigilancia son muy sencillos de utilizar ya que se manejan de forma similar a un vídeo doméstico (Governo De Portugal, 2014). Video-vigilancia IP es una tecnología de vigilancia visual que combina los beneficios analógicos de los tradicionales CCTV (Circuito Cerrado de Televisión) con las ventajas digitales de las redes de comunicación IP (Internet Protocol), permitiendo la supervisión local y/o remota de imágenes y audio así como el tratamiento digital de las imágenes, para aplicaciones como el reconocimiento de matrículas o reconocimiento facial entre otras. Cuando se trata de video-vigilancia se habla en un sistema de control de vídeo, que consiste en una o más cámaras para recoger imágenes de un espacio determinado, ya sea en interiores o al aire libre, y la gente que está en movimiento durante un determinado período de tiempo limitado o indefinido. El modo de funcionamiento de estos sistemas varían, pero la mayoría de las ofertas disponibles en la actualidad sobre el software de la vigilancia del mercado se unió al equipo de base, como las capacidades de Internet, lo que permite el control de la cámara y la distancia de visualización de las imágenes en tiempo real. Hoy en día, es común encontrar soluciones para los paquetes de videovigilancia "llave en mano", dirigido a las diferentes necesidades de protección. El costo de los sistemas está asociada con el tipo y el número de cámaras necesarias, dependiendo también contrató el equipo restante, que puede implicar para los monitores de visualización locales, aparatos de vídeo o servidores, elementos que varíen la solución está diseñada para aplicaciones de casa o negocio. Las soluciones existentes en el mercado también tienden a referirse a las suscripciones de acceso a los portales de Internet, desde donde se puede acceder a la visualización de imágenes que aún no se han recogido por todas las cámaras, así como la instalación de equipos. 3.1.2 Características La grabación se realiza continuamente, obteniendo un video. Marca de tiempo opcional en los fotogramas del vídeo grabado. Panel de control web le permite acceder y ver las grabaciones remotamente por Internet. Alarmas de aviso de intrusión. Guardar imágenes de vídeo a una carpeta en red. Hacer copias de seguridad de las grabaciones vía FTP. El vídeo puede ser visto en vivo a medida que está siendo grabado. Buscar y reproducir las grabaciones organizadas por cámara, fecha, 14

duración y detección de movimiento Inteligente, simple y fácil de usar para la operaciones cotidianas. 3.1.3 Funcionamiento Un sistema de video-vigilancia funciona para muchas cosas, por ejemplo permite grabar las imágenes de las cámaras mientras no estamos, también permite ver en tiempo real lo que está haciendo cada uno, controlar las diferentes dependencias y rincones sin tener que movernos y tener una visión global de todas nuestras instalaciones. Las cámaras de video-vigilancia además también tienen efecto disuasorio contra los robos y el vandalismo. En el caso de los robos funciona tanto con los clientes externos, como con los propios empleados tal y como lo demuestran los estudios de seguridad en el comercio realizado por la universidad de Florida en 2005, en el que se detalla que el 47% de las pérdidas por robo en los comercios proceden de los propios empleados. La gran ventaja de tener grabaciones disponibles de todo lo que sucede, es que no tenemos que estar físicamente presente para poder ver las cosas. Cada vez que ocurre algún incidente, podemos revisar las grabaciones para comprobar por nosotros mismos que ha ocurrido. Los grabadores digitales suelen ser de 4, 8 o 16 cámaras por lo que podemos ver en una sola pantalla hasta 16 cámaras de forma simultánea. 3.1.4 Hardware pare realizar video-vigilancia (VideoCamaras, 2011) Cámaras análogas: estas cámaras son unidas por un cable coaxial a un televisor o un monitor, donde las imágenes se muestran. Envían flujos continuos de datos (barrido) a un dispositivo de almacenamiento (registrador digital). Cámaras IP: la cámara IP permiten una conexión a una red informática (conectada a Internet) o por cable Ethernet o por Wi-Fi (inalámbrica). Las imágenes filmadas pueden ser registradas y consultadas en tiempo real desde una PC o un smartphone vía Internet. 3.1.5 Aplicaciones para supervisión y vigilancia Supervise edificios de oficinas después de las horas por seguridad Utilice la grabación de vigilancia en vídeo para disuadir el robo en las tiendas Simple y eficaz sistema de seguridad en vídeo para el hogar Sistema de vigilancia de mascotas: supervise a sus mascotas cuando no se encuentra cerca Utilice en conjunto con una alarma de seguridad para reproducir imágenes de seguridad y determinar si se justifica una llamada de seguridad 15

3.2 Videos 3.2.1 Historia Una señal de vídeo es el término utilizado para describir cualquier secuencia de imágenes variables en el tiempo. Una imagen fija es una distribución espacial de intensidades que permanecen constantes con el tiempo mientras que una imagen variable tiene una distribución de intensidad espacial que varía con el tiempo. Películas y la televisión son dos ejemplos de las señales de vídeo como son las señales que impulsan los monitores de ordenador, portátiles y PDA pantallas. Es ampliamente esperado que las comunicaciones de vídeo en particular sean la próxima aplicación de conducción móvil. (Kokaram, 2008) a. Historia de grabación de video Dispositivos de grabación de vídeo vinieron mucho más tarde que la TV. Los primeros dispositivos se inventaron en la década de 1950 y RCA desarrollaron una máquina con una velocidad de cinta de 6 metros/seg. Ellos utilizan la grabación longitudinal de la señal en la cinta, por lo que se requieren velocidades rápidas para grabar la señal de ancho de banda de televisión. La primera grabadora de vídeo práctica fue desarrollada en 1953 por Ampex Corporation. Se utiliza la disposición de exploración helicoidal que permanece con nosotros hoy y permite la grabación más alta efectiva velocidades sin una aterradora velocidad de la cinta. El primer equipo de vídeo a casa fue desarrollado por Philips en 1972, que fue rápidamente superado por las máquinas de VHS de Panasonic y las máquinas de Betamax de Sony en 1978. La llegada de estos formatos marcó el inicio de la era de vídeo doméstico. La capacidad para grabar y editar programas realizados por el usuario doméstico aumentó la popularidad de la televisión. Sony perdió la ahora famosa guerra de marketing para 1980 cuando VHS había convertido en el estándar principal para los usuarios de vídeo doméstico, principalmente debido a su tiempo de reproducción más prolongado. Esto a pesar de la calidad superior del formato Betamax. 3.2.2 Definición Un video es una secuencia de imágenes, una imagen está representada por un arreglo de pixeles y cada pixel está conformado por un número de bits. 16

3.2.3 Características Figura 1: Fotogramas que conforman un video. Fuente: (J.Rekha, Bhattacharya, & Majumder, 2011) a. Número de fotogramas por segundo Velocidad de carga de las imágenes (cadencia): número de imágenes por unidad de tiempo de vídeo, para viejas cámaras mecánicas cargan de seis a ocho fotogramas por segundo (fps) o 120 imágenes por segundo o más para las nuevas cámaras profesionales. Los estándares PAL (Europa, Asia, Australia, etc.) y SECAM (Francia, Rusia, partes de África, etc.) especifican 25fps, mientras que NTSC (EE. UU., Canadá, Japón, etc.) especifica 29,97fps. El cine es más lento con una velocidad de 24fps, lo que complica un poco el proceso de transferir una película de cine a vídeo. Para lograr la ilusión de una imagen en movimiento, la velocidad mínima de carga de las imágenes es de unas quince imágenes por segundo, sin embargo el ojo humano puede distinguir movimiento mucho más fluido por encima de los 48 fotogramas por segundo. b. Sistema de barrido Progresivo En los sistemas de barrido progresivo, en cada período de refresco se actualizan todas las líneas de exploración como se puede apreciar en la figura 2(a). El desarrollo de sistema de representación de imagen diferentes al tubo de imagen, como las pantallas de TFT y de plasma, han permitido desarrollar sistemas de televisión de barrido progresivo. Un procedimiento conocido como desentrelazado puede ser utilizado para transformar el flujo entrelazado, como el analógico, el de DVD, o satélite, para ser procesado por los dispositivos de barrido progresivo, como el que se establece en los televisores TFT, los proyectores y los paneles de plasma. Entrelazado Con el fin de evitar el parpadeo o "flicker" que se produce en una imagen de televisión cuando es reproducida en un tubo de imagen debido a la persistencia de los luminofósforos que componen la pantalla del mismo (cuando se estaban trazando las 17

últimas líneas las primeras ya se habían desvanecido) se desarrolló la exploración entrelazada. La exploración entrelazada 2/1, característica de los sistemas de televisión PAL, NTSC y SECAM así como de algunos otros desarrollados posteriormente, consiente en analizar cada cuadro (frame) de la imagen en dos semicuadros iguales denominados campos (field), de forma que las líneas resultantes estén imbricadas entre si alternadamente por superposición. Uno de los campos contiene las líneas pares, se le denomina "campo par", mientras que el otro contiene la impares, se le denomina "campo impar" al comienzo de cada uno de ellos se sitúa el sincronismo vertical. Hay un desfase de media línea entre un campo y otro para que así el campo par explore la franja de imagen que dejó libre el campo impar. La exploración entrelazada de un cuadro de dos campos exige que el número de líneas del cuadro sea impar para que la línea de transición de un campo al otro sea divisible en dos mitades, se muestra un gráfico en la figura 2(b). Las especificaciones abreviadas de la resolución de vídeo a menudo incluyen una i para indicar entrelazado. Por ejemplo, el formato de vídeo PAL es a menudo especificado como 576i50, donde 576 indica la línea vertical de resolución, i indica entrelazado, y el 50 indica 50 cuadros (la mitad de imágenes) por segundo. Figura 2: (a) barrido progresivo y (b) barrido entrelazado Fuente: (Kokaram, 2008) c. Resolución de video El tamaño de una imagen de vídeo se mide en píxeles para vídeo digital, o en líneas de barrido horizontal y vertical para vídeo analógico. En el dominio digital, (por ejemplo DVD) la televisión de definición estándar (SDTV) se especifica como 720/704/640 480i60 para NTSC y 768/720 576i50 para resolución PAL o SECAM. Sin embargo, en el dominio analógico, el número de líneas activas de barrido sigue siendo constante (486 NTSC/576 PAL), mientras que el número de líneas horizontal varía de acuerdo con la medición de la calidad de la señal: aproximadamente 320 píxeles por línea para calidad VCR, 400 píxeles para las emisiones 18

de televisión, y 720 píxeles para DVD. Se conserva la relación de aspecto por falta de píxeles «cuadrados». Los nuevos televisores de alta definición (HDTV) son capaces de reproducir en resoluciones de hasta 1920 1080p60, es decir, 1920 píxeles por línea de barrido por 1080 líneas, a 60 fotogramas por segundo. La resolución de vídeo en 3D para vídeo se mide en voxels (elementos de volumen de imagen, que representan un valor en el espacio tridimensional). Por ejemplo, 512 512 512 voxels, de resolución, se utilizan ahora para vídeo 3D simple, que pueden ser mostrados incluso en algunas PDA. d. Relación de aspecto La relación de aspecto se expresa por la anchura de la pantalla en relación a la altura. El formato estándar hasta el momento en que se comenzó con la estandarización de la televisión de alta definición tenía una relación de aspecto de 4/3. El adoptado es de 16/9. La compatibilidad entre ambas relaciones de aspecto se puede realizar de diferentes formas. Una imagen de 4/3 que se vaya a ver en una pantalla de 16/9 puede presentarse de tres formas diferentes: Con barras negra verticales a cada lado (letterbox). Manteniendo la relación de 4/3 pero perdiendo parte de la zona activa de la pantalla. Agrandando la imagen hasta que ocupe toda la pantalla horizontalmente. Se pierde parte de la imagen por la parte superior e inferior de la misma. Deformando la imagen para adaptarla al formato de la pantalla. Se usa toda la pantalla y se ve toda la imagen, pero con la geometría alterada (los círculos se ven elipses con el diámetro mayor orientado de derecha a izquierda). Una imagen de 16/9 que se vaya a ver en una pantalla de 4/3, de forma similar, tiene tres formas de verse: Con barras horizontales arriba y abajo de la imagen (letterbox). Se ve toda la imagen pero se pierde tamaño de pantalla (hay varios formatos de letterbox dependiendo de la parte visible de la imagen que se vea (cuanto más grande se haga más se recorta), se usan el 13/9 y el 14/9). Agrandando la imagen hasta ocupar toda la pantalla verticalmente, perdiéndose las partes laterales la imagen. Deformando la imagen para adaptarla a la relación de aspecto de la pantalla se ve toda la imagen en toda la pantalla, pero con la geometría alterada (los círculos se ven elipses con el diámetro mayor orientado de arriba a abajo). 19

e. Espacio de color y bits por pixel El nombre del modelo del color describe la representación de color de video. El sistema YIQ se utilizó en la televisión NTSC. Se corresponde estrechamente con el sistema YUV utilizado en la televisión NTSC y PAL; y con el sistema YDbDr utilizado por la televisión SECAM. El número de colores distintos que pueden ser representados por un pixel depende del número de bits por pixel (bpp). Una forma de reducir el número de bits por píxel en vídeo digital se puede realizar por submuestreo de croma (por ejemplo, 4:2:2, 4:1:1, 4:2:0). f. Calidad del video La calidad de vídeo se puede medir con métricas formales como PSNR o subjetivas con calidad de vídeo usando la observación de expertos. La calidad de vídeo subjetiva de un sistema de procesamiento de vídeo puede ser evaluada como sigue: Eligiendo las secuencias de vídeo (el SRC) a usar para la realización del test. Eligiendo los ajustes del sistema a evaluar (el HRC). Eligiendo un método de prueba para presentar las secuencias de vídeo a los expertos y recopilar su valoración. Invitando a un número suficiente de expertos, preferiblemente un número no menor de 15. Realizando las pruebas. Calculando la media para cada HRC basándote en la valoración de los expertos o no expertos. Hay muchos métodos de calidad de vídeo subjetiva descritos en la recomendación BT.500. de la ITU-T. Uno de los métodos estandarizados es el Double Stimulus Impairment Scale (DSIS). En este método, cada experto ve una referencia intacta del vídeo seguida de una versión dañada del mismo video. El experto valora entonces el vídeo dañado utilizando una escala que va desde los daños son imperceptibles hasta los daños son muy molestos. g. Método de compresión de video Se usa una amplia variedad de métodos para comprimir secuencias de vídeo. Los datos de vídeo contienen redundancia temporal, espacial y espectral. En términos generales, se reduce la redundancia espacial registrando diferencias entre las partes de una misma imagen (frame); esta tarea es conocida como compresión intraframe y está estrechamente relacionada con la compresión de imágenes. Así mismo, la redundancia temporal puede ser reducida registrando diferencias entre imágenes (frames); esta tarea es conocida como compresión interframe e incluye la compensación 20

de movimiento y otras técnicas. Los estándares por satélite, y MPEG-4 usado para los sistemas de vídeo domésticos. h. Tasa de bits La tasa de bits es una medida de la tasa de información contenida en un flujo o secuencia de video. La unidad en la que se mide es en bits por segundo (bit/s o bps) o también Megabits por segundo (Mbit/s o Mbps). Una mayor tasa de bits permite mejor calidad de vídeo. Por ejemplo, el VideoCD, con una tasa de bits de cerca de 1Mbps, posee menos calidad que un DVD que tiene una tasa de alrededor de 20Mbps. La VBR (Variable Bit Rate Tase de Bits Variable) es una estrategia para maximizar la calidad visual del vídeo y minimizar la tasa de bits. En las escenas con movimiento rápido, la tasa variable de bits usa más bits que los que usaría en escenas con movimiento lento pero de duración similar logrando una calidad visual consistente. En los casos de vídeo streaming en tiempo real y sin buffer, cuando el ancho de banda es fijo (por ejemplo en videoconferencia emitida por canales de ancho de banda constante) se debe usar CBR (Constant Bit Rate Tasa de Bits Constante). 3.2.4 Estructura de los videos Un contenedor de video es el formato de archivo que incluye los metadatos, video, audio e información de sincronización y corrección de errores. El trabajo del contenedor es envolver las transmisiones de video y audio, así como proporcionar sincronización y soporte de streaming. Las pistas de vídeo y audio suelen ir comprimidas, siendo los distintos códecs utilizados dentro de cada uno de los contenedores los encargados de descomprimir la información en aras a su reproducción. Cuando se crea un contenedor, en primer lugar se produce la codificación de las pistas y posteriormente son "unidas" (multiplexadas) siguiendo un patrón típico de cada formato. Cuando un archivo debe ser reproducido, en primer lugar actúa un divisor (splitter), el cual conoce el patrón del contenedor, y "separa" (desmultiplexa) las pistas de audio y vídeo. Una vez separadas, cada una de ellas es interpretada por el decodificador y reproducida. Un contenedor de video por lo general contiene un flujo de video y un flujo de audio, sin embargo multiples flujos pueden ser incluidos. Por ejemplo, el video 3D puede contener dos flujos de video independientes, es decir, uno para cada ojo. 21

3.2.5 Formatos de almacenamiento a. Codificación Figura 3: Estructura de un archivo de video. Fuente: (Systemic Pty Ltd, 2014) Todos los formatos actuales, que se enumeran a continuación, están basados en PCM (Modulación por impulsos codificados). CCIR 601 usado para estaciones de difusión MPEG-4 bueno para la distribución en línea de vídeos grandes y vídeo grabado en memoria flash MPEG-2 usado para DVD y Super-VCD MPEG-1 usado para video CD H.261 H.263 H.264 también conocido como MPEG-4 Part 10, o AVC Theora estandarizado pero aún en desarrollo. Usado para vídeo sobre Internet. b. Cintas Betacam, Betacam SP, Betacam SX, Betacam IMX, Betacam Digital, o DigiBeta Sistemas de vídeo comerciales de Sony, basados originalmente en la tecnología Betamax D1, D2, D3, D5, D9 (también conocido como Digital-S) varios estándares SMPTE comerciales de vídeo digital DV, MiniDV usado en la mayoría de las videocámaras basadas en cinta de vídeo del mercado de consumo de hoy en día; diseñado para alta calidad y fácil edición; puede también grabar datos de alta definición (HDV) en formato MPEG-2 DVCAM, DVCPRO usado en operaciones de difusión profesionales; similar al formato DV pero generalmente considerado más robusto; aunque son compatibles con DV, estos formatos manejan mejor el audio Digital8 Datos en formato DV grabados en cintas compatibles con Hi8; en gran parte un formato para el mercado de consumo 22

MicroMV Datos en formato MPEG-2 grabados en una cinta muy pequeña del tamaño de una caja de cerillas; obsoleto D-VHS Datos en formato MPEG-2 grabados en una cinta similar al S-VHS c. Discos Video CD (VCD) DVD HD DVD Blu-ray Sony ProDATA Panasonic P2 RED Cam XDCam XDCam HD 3.2.6 Compresión de videos Las técnicas de compresión están basadas en un conocimiento preciso y exhaustivo de cómo el cerebro y los ojos trabajan en combinación para formar el complejo sistema visual humano. Como resultado de estos estudios se produce una reducción significativa del tamaño del archivo de video sin prácticamente ningún efecto para la calidad visual. Un video es una secuencia de imágenes, una imagen está representada por un arreglo de pixeles y cada pixel está conformado por un número de bits, las técnicas de compresión reducen el número de bits necesarios para representar cada píxel de una imagen. A finales de los 80, se formó el Motion Picture Expert Group (MPEG, Grupo de Expertos en Imágenes en Movimiento) con el propósito de definir un estándar para la codificación de imágenes en movimiento y audio. Desde entonces ha producido los estándares para MPEG-1, MPEG-2 y MPEG-4. Para reducir las sobrecargas del medio en la distribución de esas secuencias y con el fin de conseguir la reducción deseada de los datos de las imágenes se emplean los siguientes criterios (Ortega Bernal, 2010) : Reducir matrices de color en la imagen. Reducir la resolución de color respecto a la intensidad de luz prevaleciente. Reducir partes pequeñas, invisibles de la imagen. En el caso de una secuencia de vídeo, las partes de una imagen que no cambian se dejan en su forma original. 3.2.7 Visión general de las técnicas de compresión Al digitalizar una secuencia de video analógica se puede llegar a tener un archivo de millones de bits por cada segundo, lo cual implicaría un gran ancho de banda a utilizar en una transmisión multimedia, para resolver el problema en la actualidad existen diferentes técnicas de compresión, muy utilizadas en la 23

Internet para la transmisión de las aplicaciones multimedia. Como son los que se mencionaran en los siguientes puntos. a. H.261 y H.263 Son recomendaciones de la ITU. Ambos están basados en la misma técnica que los estándares MPEG y pueden ser interpretados como versiones simplificadas de la compresión de vídeo MPEG. Fueron diseñados originalmente para video conferencia sobre líneas telefónicas con poco ancho de banda. En cualquier caso no utiliza alguna de las técnicas más avanzadas de MPEG para el mejor aprovechamiento del ancho de banda. b. MPEG-1 Está centrado en streams de bits de aproximadamente 1,5 Mbps y originalmente para el almacenamiento de vídeo digital en CD s. Se enfoca más en la compresión, que en la calidad de las imágenes. Puede ser considerado como la calidad tradicional del VCR pero en formato digital. c. MPEG-2 Se centró en la ampliación de la técnica de compresión MPEG-1 para cubrir imágenes más grandes y mayor calidad, pero con un menor coeficiente de compresión y por consiguiente mayor uso de ancho de banda. MPEG-2, ISO/IEC 13818, también ofrece técnicas más avanzadas para mejorar la calidad del vídeo con la misma cantidad de bits. El inconveniente es la necesidad de un equipamiento más complejo. En cualquier caso estas características suelen adaptarse a su uso en aplicaciones en tiempo real. Un ejemplo de su uso son las películas en DVD que están comprimidas utilizando las técnicas del MPEG-2. d. MPEG-4 La tercera generación de MPEG está basada en la misma técnica. Una vez más, el nuevo proyecto se enfocó en los usos de nuevas aplicaciones, las nuevas características más importantes de MPEG-4, ISO/IEC 14496, relacionadas con la compresión de vídeo son el soporte de aplicaciones con menor consumo de ancho debanda, como por ejemplo: unidades móviles, reproductores de video; por otro lado, las aplicaciones con una calidad extremadamente alta y sin casi limitar de ancho de banda es sin duda lo que ha originado su consumismo en el mercado. MPEG-4, además soporta contenidos en 2D y 3D. Ofrece mayor versatilidad en cuanto a relaciones de trasmisión, con una relación de transmisión muy baja (desde 2 Kb/s para conversación, 5 Kb/s para vídeo) hasta relaciones muy altas (5 Mb/s para vídeo con calidad transparente, 64 Kb/s por canal para audio con calidad similar al CD). A todo ello, el MPEG-4 ofrece una administración y protección mejorada de la propiedad intelectual. MPEG-4, ha sido diseñado tanto para la teledifusión como para la difusión por la Web, mejorando la convergencia de ambos canales, ya que permite la integración de contenidos provenientes de ambos en la 24

misma escena multimedia. Esta facilidad de difusión viene provista gracias a las diferentes relaciones en la transmisión que el estándar permite. Para la difusión de video con flujos muy bajos (VLBV, very low bit rate video) están disponibles diversos algoritmos y herramientas para aplicaciones que trabajen con flujos entre los 5 y 64 Kbps/s. Un ejemplo es claramente la difusión por la Web. Esta posibilidad soporta la secuencia de imágenes con resoluciones espaciales muy bajas (desde pocos píxeles por línea y filas hasta resolución CIF) y relación de cuadro baja (desde los 0 Hz para imágenes fijas hasta los 15 Hz). Las aplicaciones básicas que soportan esta aplicación pueden codificar secuencias de imagen rectangular con una alta eficiencia de codificación y una alta resistencia a los errores, bajo tiempo de recuperación de datos y una baja complejidad para aplicaciones de comunicación multimedia a tiempo real. Además pueden ofrecer el acceso remoto, avance rápido y retroceso rápido para aplicaciones de almacenaje y acceso multimedia. La versión MPEG-4 parte 14 permite la transmisión de flujos por Internet tiene como extensión oficial MP4. e. H.264 H.264 o MPEG-4 parte 10 es una norma que define un códec de vídeo de alta compresión, desarrollada conjuntamente por el ITU-T Video Coding Experts Group (VCEG) y el ISO/IEC Moving Picture Experts Group (MPEG). La intención del proyecto H.264/AVC fue la de crear un estándar capaz de proporcionar una buena calidad de imagen con tasas binarias notablemente inferiores a los estándares previos (MPEG-2, H.263 o MPEG-4 parte 2). La robusta transmisión a través de las redes se basa en el estándar que está diseñado para facilitar la aplicación para la más amplia gama de plataformas. 3.2.8 Aplicaciones Video-vigilancia (Video analisys overview), esta es una aplicación tradicional de los videos, incluyen todas las tareas de investigación; la extracción de datos biométricos es una sub-área de esta aplicación. (Chellapa & Theodoridis, 2014) Social media e Internet, la preponderancia de los videos y la manera en la que son cargados y usados, en Internet provee nuevos retos para indexar y buscar tales repositorios de grandes datos. Comunicación móvil, los avances en video análisis permiten una mejor eficiencia en el uso de ancho de banda y poder en dispositivos móviles, como smartphones. Realidad Virtual. Aplicaciones biométricas. 25

3.3 Técnica de procesamiento de videos 3.3.1 Fases de procesamiento de videos a. Adquisición Tipos de hardware: i. Cámaras digitales Una cámara digital es una cámara fotográfica que, en vez de captar y almacenar fotografías en película química como las cámaras fotográficas de película fotográfica, recurre a la fotografía digital para generar y almacenar imágenes. Las cámaras digitales modernas generalmente son multifuncionales y contienen dispositivos capaces de grabar sonido y/o video además de fotografías. Actualmente se venden más cámaras fotográficas digitales que cámaras con película ii. Cámaras análogas Su principal característica es la necesidad de conectar su cable. El cable utilizado para las cámaras analógicas es el coaxial, lo cual lo hace algo incómodo para manejarlo. Ya que se debe enviar por cada cámara un cable, y hacer una conexión punto a punto, por lo tanto si son varias cámaras, se va incrementando el diámetro del canal por donde se envía el cable. En la actualidad se pueden utilizar baluns para transmitir el video analógico, voltaje de alimentación y datos sobre un cable de red, con las limitaciones del estándar TIA/EIA. Es un dispositivo que captura imágenes convirtiéndolas en señales eléctricas, en la mayoría de los casos a señal de vídeo, también conocida como señal de televisión. En otras palabras, una cámara de vídeo es un transductor óptico. Presentan las siguientes características: Objetivos e iluminación. El lux (lúmenes por metro cuadrado) mide la sensibilidad en condiciones de poca luz. Indican la cantidad de luz que necesita una cámara de vídeo para grabar una imagen. Zoom óptico y digital. Las cámaras tienen dos tipos de zoom: óptico y digital. El zoom óptico indica cuántas veces un objetivo se puede ampliar sin perder calidad o nitidez de la imagen. El zoom digital, sin embargo, amplía los píxeles y puede distorsionar las imágenes de forma abrupta. Sensores y Resolución La calidad de las películas depende de la CCD (Charge Coupled Device) de la cámara. El CCD es un sensor electrónico que convierte la energía luminosa en los pixeles para obtener imágenes. Cuanto mayor sea el número de píxeles, mayor es la resolución, y una alta resolución 26

corresponde a una mejor calidad. Información ampliado en sensor imagen Visores y LCD (pantalla de visión). La mayoría de cámaras disponen de un visor, un pequeño monitor a través del cual enmarcar lo que se está visionando. Una pequeña pantalla LCD tiene la misma función que un visor, pero las imágenes mostradas son más grandes. Micrófonos y sonido de alta calidad. Los micrófonos están situados en la parte delantera de la cámara. iii. Ambas tienen en común Diafragma y obturador. Las lentes y el sistema de enfoque (el autoenfoque) y zoom. Fotómetro. Todos estos elementos que hemos citado se encuentran tanto en las cámaras digitales como en las analógicas. Las dos reciben la luz a través de las lentes con las que logran la imagen. El obturador y el diafragma cumplen la función de medir la luz dependiendo de la sensibilidad de la cámara. iv. Diferencias entre cámara análoga y cámara digital (DigitalFotoRed, 2005) La cámara digital prescinde del tradicional carrete o película de fotos utilizando en su lugar un sensor de imagen. La imagen captada por una cámara digital se encuentra unida a la tecnología informática, su tratamiento y retoque es a través de las computadoras u ordenadores. La fotografía o imagen digital puede retocarse de forma inmediata, la fotografía tradicional no. La foto digital consta de un monitor LCD, con muchas funciones. El revelado funciona de forma digital sin carrete, en las cámaras tradicionales la película se revela en el cuarto oscuro v. Cámara IP Captura el vídeo y el audio (en caso de incorporar entrada y salida de audio) y puede ser fijas o móviles, estando conectadas por cable o en modo inalámbrico a una red de datos IP, a través de la cual se puede controlar y almacenar información en NVRs (Network Video Recorder) o servidores de vídeo en red. Las cámaras IP presentan las siguientes características: Resolución megapixel. Permite visualizar detalles imposibles de ver con cámaras analógicas y/o VGA tradicionales. Zoom óptico. Acercamiento de imagen mediante el objetivo y sin pérdida de calidad de imagen. 27