Capítulo 2. Las Redes Neuronales Artificiales



Documentos relacionados
I SEMANA ELECTRONICA REDES NEURONALES

CAPITULO 6 SISTEMA DE DETECCION DE INTRUSOS

CAPITULO 3 REDES HIBRIDAS-COMPLEJAS. 3.1 Descripción de la Red Híbrida Compleja (HCNN)

forma de entrenar a la nuerona en su aprendizaje.

Herramienta no-convencional para modelado en Comunicaciones móviles: Redes Neuronales Artificiales Georgina Stegmayer

4. Programación Paralela

CAPÍTULO 4: ALGORITMOS DE APRENDIZAJE

Clasificación de Música por Genero Utilizando Redes Neuronales Artificiales. Elkin García, Germán Mancera, Jorge Pacheco

Diseño orientado al flujo de datos

7. Conclusiones. 7.1 Resultados

Medias Móviles: Señales para invertir en la Bolsa

Una investigación australiana reveló que posiblemente la disminución

Unidad I. 1.1 Sistemas numéricos (Binario, Octal, Decimal, Hexadecimal)

CAPÍTUL07 SISTEMAS DE FILOSOFÍA HÍBRIDA EN BIOMEDICINA. Alejandro Pazos, Nieves Pedreira, Ana B. Porto, María D. López-Seijo

Capitulo I. Introducción

La presente tesis pretende que los estudiantes observen la teoría de las acciones de control

UNIVERSIDAD AUTONOMA DEL ESTADO DE MEXICO CENTRO UNIVERSITARIO UAEM ATLACOMULCO REPORTE DE INVESTIGACION

"Diseño, construcción e implementación de modelos matemáticos para el control automatizado de inventarios

Covarianza y coeficiente de correlación


RELACIONES DE RECURRENCIA

CAPÍTULO 3 RED NEURONAL PARA EL RECONOCIMIENTO DE ROSTROS

Redes de Kohonen y la Determinación Genética de las Clases

VENTAJAS Y DESVENTAJAS DE LAS TECNOLOGIAS

ANÁLISIS DE DATOS NO NUMERICOS

5.4. Manual de usuario

Inteligencia artificial: todo comienza con una neurona.

App para realizar consultas al Sistema de Información Estadística de Castilla y León

CAPITULO 4 JUSTIFICACION DEL ESTUDIO. En este capítulo se presenta la justificación del estudio, supuestos y limitaciones de

Aproximación local. Plano tangente. Derivadas parciales.

Decisión: Indican puntos en que se toman decisiones: sí o no, o se verifica una actividad del flujo grama.

Introducción. Ciclo de vida de los Sistemas de Información. Diseño Conceptual

Capítulo 2. Técnicas de procesamiento digital de imágenes y reconocimiento de patrones.

José Ignacio Latorre Universidad de Barcelona

Los mayores cambios se dieron en las décadas de los setenta, atribuidos principalmente a dos causas:

CAPÍTULO 4. FORMA DE EVALUACIÓN CMM. 4.1 Evolución de los métodos de valoración del SEI

Conclusiones. Particionado Consciente de los Datos

Unidad 1. Fundamentos en Gestión de Riesgos

Parámetros con la ventana de selección de usuario, reglas, texto y descomposición (IVE)

Capítulo VI. Estudio de Caso de Aplicación del Integrador de Información Desarrollado

Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322

activuspaper Text Mining and BI Abstract

INTRODUCCIÓN: LA FÍSICA Y SU LENGUAJE, LAS MATEMÁTICAS

TRANSMISION DIGITAL. PCM, Modulación por Codificación de Pulsos

Métodos Iterativos para Resolver Sistemas Lineales

La toma de decisiones está presente dentro de la vida de la mayoría de las personas. Los

Correspondencias entre taxonomías XBRL y ontologías en OWL Unai Aguilera, Joseba Abaitua Universidad de Deusto, EmergiaTech

CLASIFICACIÓN NO SUPERVISADA

Aprendizaje Automatizado. Redes Neuronales Artificiales

3.1 JUSTIFICACION E IMPORTANCIA DEL PRESENTE TRABAJO DE

by Tim Tran:

TEMA 3. EL PROCESO DE COMPILACIÓN, DEL CÓDIGO FUENTE AL CÓDIGO MÁQUINA

Transformación de binario a decimal. Transformación de decimal a binario. ELECTRÓNICA DIGITAL

La nueva arquitectura del paquete AMORE (A MORE Flexible Neural Network)

Modificación y parametrización del modulo de Solicitudes (Request) en el ERP/CRM Compiere.

Un filtro general de respuesta al impulso finita con n etapas, cada una con un retardo independiente d i y ganancia a i.

MÁQUINA DE VECTORES DE SOPORTE

QUÉ ES LA RENTABILIDAD Y CÓMO MEDIRLA. La rentabilidad mide la eficiencia con la cual una empresa utiliza sus recursos financieros.

CAPITULO 4: LA UPS SOLAR Y SISTEMAS PARECIDOS EN EL MERCADO

ES A1 B42F 5/00. Número de publicación: PATENTES Y MARCAS. Número de solicitud: Int. Cl. 7 : B42D 1/

CAPITULO I. Introducción. En la actualidad, las empresas están tomando un papel activo en cuanto al uso de sistemas y

Su éxito se mide por la pertinencia y la oportunidad de la solución, su eficacia y eficiencia.

Capítulo 5. Cliente-Servidor.

Interoperabilidad de Fieldbus

Diseño de una estrategia tecnológica de Customer Relationship Management (CRM) para la empresa BPM de México. CAPITULO 6

CRIPTOGRAFÍA SIMÉTRICA Y ASIMÉTRICA

Datos estadísticos PRESENTACIÓN DE DATOS INDIVIDUALES Y DATOS AGRUPADOS EN TABLAS Y GRÁFICOS

Administración del conocimiento y aprendizaje organizacional.

SEDO: SOFTWARE EDUCATIVO DE MATEMÁTICA NUMÉRICA. Lic. Maikel León Espinosa.

SISTEMAS INTELIGENTES

CAPÍTULO 1 INTRODUCCIÓN

Enterprise Resource Planning (ERP) SISTEMA DE PLANEACIÓN DE RECURSOS MASTER: ALFREDO CASTRO JIMENEZ

Introducción al Cálculo Simbólico a través de Maple

Profunda comprensión de que valores son o podrían ser percibidos por los clientes.

Patrones de software y refactorización de código

SISTEMAS DE NUMERACIÓN. Sistema decimal

Ciclo de vida y Metodologías para el desarrollo de SW Definición de la metodología

UNIDADES FUNCIONALES DEL ORDENADOR TEMA 3

3. Métodos para la evaluación de proyectos

Capítulo V Resultados y conclusiones

TEMA 8: SISTEMA DE COSTES POR PROCESOS. INDICE. 1.- Caracteristicas generales de los sistemas de costes por procesos.

Revisión del Universo de empresas para la Estimación de los Datos Del Mercado Español de Investigación de Mercados y Opinión.

Estas visiones de la información, denominadas vistas, se pueden identificar de varias formas.

CAPITULO V. Conclusiones y recomendaciones. Este capítulo tiene como objetivo mostrar las conclusiones más significativas que se

Puedes Desarrollar Tu Inteligencia

Día :00h Lugar: Obra Social Ibercaja, Sala De actos, Rambla Ferran 38, 3º, Lleida

Tipos de computadoras

Los estados financieros proporcionan a sus usuarios información útil para la toma de decisiones

ARREGLOS DEFINICION GENERAL DE ARREGLO

Funciones, x, y, gráficos

ADALINE Y PERCEPTRON

A continuación pasaremos a detallar cuáles son los elementos más relevantes dentro de la comunicación y pondremos ejemplos aplicados a la venta.

Educación y capacitación virtual, algo más que una moda

Prensas troqueladoras mecánicas actuadas mediante un servo motor. Por Dennis Boerger, Gerente de Producto: AIDA-America Corporation

EN LA LA EMPRESA EMPRESA

UNIDADES DE ALMACENAMIENTO DE DATOS

8. CONCERTACIÓN MULTISECTORIAL PARA LA LUCHA CONTRA LAS DROGAS EN EL

Fundamentos del diseño 3ª edición (2002)

Colección de Tesis Digitales Universidad de las Américas Puebla. Morales Salcedo, Raúl

Transcripción:

Capítulo 2. Las Redes Neuronales Artificiales 13

Capitulo 2. Las Redes Neuronales Artificiales 2.1 Definición Redes Neuronales Artificiales El construir una computadora que sea capaz de aprender, y de entender el significado de las formas en imágenes visuales, o incluso distinguir entre distintas clases de objetos similares son parte de la problemática a la que se enfrentan los que diseñan computadoras, los ingenieros y los programadores [Freeman & Skapura, 1991]. La incapacidad de la generación actual de computadoras para interpretar el mundo en general no indica, sin embargo, que éstas sean completamente inadecuadas. Generalmente los problemas se presentan cuando tratamos de resolver problemas que involucran un procesamiento en paralelo, utilizando una herramienta de tipo secuencial, la computadora. Uno de los problemas que implican un tipo de procesamiento como el mencionado anteriormente, es el reconocimiento visual de imágenes. Para una computadora el reconocer imágenes aún muy diferentes, es una tarea sumamente difícil, lo que en el caso de los humanos es algo relativamente sencillo. Esto se debe a que los sistemas biológicos poseen una arquitectura distinta (paralelismo masivo) a la de una computadora moderna. Por esta razón es que se han tratado de simular algunas características de la fisiología del cerebro humano para elaborar nuevos procesos de elaboramiento [Freeman & Skapura, 1991]. 14

Podemos definir a una Red Neuronal Artificial (RNA en adelante) como modelos matemáticos inspirados en sistemas biológicos, adaptados y simulados en computadoras convencionales [Lara, 1998]. Las RNAs están inspiradas en el sistema biológico natural. Como es conocido, en este sistema la neurona es la unidad de procesamiento, y aunque las RNAs sean mucho menos complejas que una red neuronal biológica, también realizan cálculos complejos para procesar información. 2.1.1 La computación convencional y la biológica La computación convencional se caracteriza por el desarrollo de una formación matemática del problema, el desarrollo de un algoritmo para implementar una solución, la codificación del mismo para una máquina específica y por último la ejecución de dicho código. Como se ha observado, este tipo de procesamiento es muy exitoso para resolver modelos matemáticos complejos y de simulación, para realizar tareas repetitivas, rápidas y bien definidas. Sin embargo, cuando éste se lleva a otros ámbitos computacionales, se muestra incapaz de resolver eficientemente problemas de reconocimiento de imágenes, de voz, y de entendimiento de lenguaje natural. También resulta ineficiente en problemas de percepción, adaptación y aprendizaje [Lara, 1998]. Por otro lado, la computación biológica (derivada del procesamiento en sistemas biológicos) se caracteriza por ser masivamente paralela, adaptativa, lenta, altamente interconectada y tolerante al ruido en el medio ambiente y en sus componentes. 15

De acuerdo con la prensa, publicaciones, y conferencias, las redes neuronales (como parte de la computación biológica) han tenido aplicaciones en el área de procesamiento de imágenes y visión computacional [Schalkoff, 1997], específicamente en el análisis de segmentación. Es por ello que en este proyecto uno de los algoritmos a probar para segmentar palabras estará basado en RNAs o la combinación de estas con otra técnica desarrollada. 2.1.2 Definición y descripción de una Red Neuronal Artificial Una Red Neuronal Artificial es una estructura compuesta de un número de unidades interconectadas (neuronas artificiales). Cada unidad posee una característica de entrada/salida e implementa una computación local o función. La salida de cualquier unidad esta determinada por su característica de entrada/salida, su interconexión con otras unidades, y (posiblemente) de sus entradas externas. Sin embargo es posible un trabajo a mano, la red desarrolla usualmente una funcionalidad general a través de una o más formas de entrenamiento [Schalkoff, 1997]. El cerebro humano contiene más de 100 billones de elementos de procesos llamados neuronas, que se comunican a través de conexiones llamadas sinapses. Cada neurona esta compuesta por tres partes fundamentales: el cuerpo, dendritas y axón. El cuerpo en su capa externa tiene la capacidad única de generar impulsos nerviosos. Las dendritas que son como las ramas que salen del cuerpo, poseen algunas conexiones sinápticas en donde se reciben señales que generalmente vienen de otros axones. El axón 16

se encarga de activar o inhibir otras neuronas las cuales a su vez son activadas por cientos o miles de otras neuronas. El funcionamiento de un neurón artificial está basado en este diseño. Básicamente consiste en aplicar un conjunto de entradas, cada una representando la salida de otro neurón, o una entrada del medio externo, realizar una suma ponderada con estos valores y filtrar este valor con una función como se puede observar en la figura 2.1 [Gómez, 1999]. F Salida Figura 2.1 Cálculo de salida de un neurón artificial [Gómez, 1999] Cada neurón artificial recibe un vector X de entrada que corresponde a todas aquellas señales que llegan a la sinápsis. Cada una de estas señales se multiplica por un peso que tiene asociado W 1,W 2,W 3 W n. Al conjunto de pesos se le denomina vector W. Cada peso representa la intensidad o fuerza de conexión de una sinápsis en un neurón 17

biológico. Los resultados de éstas multiplicaciones se suman. Esta sumatoria simula vagamente al cuerpo de una neurona biológica. Neta i = X j W ij 2.1.3 Función de Activación Una vez que la entrada neta ha sido calculada, se transforma en el valor de activación, o activación simplemente y una vez hecho esto se puede aplicar la función de salida que es la encargada de transformar el valor de la entrada neta en el valor de salida del nodo [Freeman & Skapura, 1991]. La función de activación F puede ser lineal o no lineal. Existen varios tipos de funciones de activación: -Función Lineal: OUT= K(NET) donde K es una constante y NET es una señal -Función squash, sigmoide o función logística: F(X)= 1 _ (1+e NET ) 18

-Función de tangente hiperbólica: OUT= Tanh (NET) -Función umbral: OUT = 1 si NET>T donde T es un valor de umbral 0 si no 2.1.4 Clasificacion de las redes neuronales de acuerdo a su complejidad Los neurones se relacionan entre sí formando redes que pueden llegar a ser tan complejas como el neocognitrón, o tan simples como el perceptrón. Las RNAs de un nivel (o de una capa). es el modelo más simple según se observa en la Figura 2.2. 19

X I W 11 W 12 W 13 Y 1 X 2 W 21 W 22 W 23 Y 2 X 3 W 31 W 32 W 33 Y 3 Nodos de Entrada (No hacen nada) Figura 2.2 Red Neuronal de 1 nivel [Gómez, 1999] Las RNAs de varios niveles se puden visualizar como lo muestra la figura 2.3. Si existen varios niveles o capas, la función de activación debe ser no lineal, ya que de no ser así una red con varios niveles equivaldría a una red con un nivel. 20

Figura 2.3 Ejemplo de una RNA de varios niveles 2.1.5 Tipos de entrenamiento El entrenamiento es una de las herramientas que las RNAs nos proporcionan para agilizar el aprendizaje. Este proceso consiste en ir ajustando los pesos W gradualmente hasta que el vector de salida resultante coincida con el vector de salida deseado. El entrenamiento supervisado parte de un vector de entrada del cual se conoce su vector de salida deseada o al menos una aproximación a él. Al par de vectores representando los valores de entrada y salida deseada se le denomina par de entrenamiento. Este proceso consiste en aplicar el vector de entrada a la red. La diferencia o cambio existente entre el vector de salida y el vector de salida deseada se reduce a través de diversos algoritmos existentes. Se continúa probando diversos vectores de entrada ajustando pesos, hasta que la diferencia con la salida deseada es mínima. 21

En el entrenamiento no supervisado se desconoce la salida, únicamente se proporciona un vector de entrada. Lo que se busca es generar después de varios vectores de entrada, salidas que sean consistentes. Es decir, que los pesos se vayan ajustando poco a poco a través de el reconocimiento de patrones, regularidades, propiedades estáticas, etc. Así, las entradas similares producirán el mismo tipo de salida. Otra forma de explicar esto es, que este proceso extrae propiedades estadísticas del conjunto de entrenamiento. Actualmente la mayoría de los algoritmos de entrenamiento se basan en el trabajo desarrollado por D.O. Hebb, quien propuso un algoritmo de entrenamiento sin supervisión donde los pesos W se incrementan si tanto el neurón emisor como el receptor están activados. Este tipo de aprendizaje es el que se adquiere cuando un humano repite una misma tarea. Un ejemplo que se puede mencionar se presenta en los inicios de la medicina, en el que era muy común que un médico buscara constantemente la combinación exacta de ciertas sustancias para lograr que un paciente se curara. La tarea era repetida constantemente hasta que después de varios intentos se descubrían los tipos y cantidades exactos para curar a un paciente en general. Como se puede observar no existía una receta deseada con la cual comparar la salida, sino simplemente se obtuvieron patrones. 22

2.1.6 Modelo de Retro-Propagación Este es un algoritmo de aprendizaje que es utilizado para entrenar redes de varios niveles. Fue ideado por E. Rumelhart, G.E. Hinton y R.J. Williamsen 1986 [Gómez, 1999]. Este algoritmo posee una base matemática bastante sólida y que es considerado como una generalización de la regla delta. Esta técnica minimiza el error promedio al cuadrado entre la salida real y la esperada, aplicando el concepto de gradiente descendiente. El objetivo de Retro-propagación es que los pesos de los niveles escondidos generen una representación interna adecuada al problema a resolverse. Estas características y su porcentaje de éxito lo han convertido en uno de los algoritmos de aprendizaje más populares. 2.2 Segmentación de palabras usando RNAs Los investigadores han utilizado diferentes técnicas tanto para tareas de segmentación como para tareas de reconocimiento de palabras. Algunos de ellos han utilizado técnicas heurísticas convencionales para la segmentación y el reconocimiento, mientras que otros han usado técnicas heurísticas seguidas de una RNAs basadas en métodos para el reconocimiento de caracteres/palabras. Para escritura impresa o manuscrita, algunos de los resultados más exitosos se han obtenido con el uso de técnicas 23

que usan componentes combinados. Estas técnicas son léxico-dirigidas y arrojan las mejores imágenes de palabras o caracteres segmentados, las subimágenes de una palabra pueden ser armadas y comparadas para representar una posible palabra dentro de un léxico. Estas técnicas no emplean algoritmos de segmentación muy complicados. Como resultado, el número de puntos de segmentación son muchos. Si se emplean técnicas de segmentación más poderosas es posible reducir el número de puntos de segmentación falsos. Esto puede elevar la velocidad y la eficiencia de los sistemas reduciendo el número de combinaciones primitivas que necesitan ser armadas y comparadas contra el léxico de las palabras. Recientemente, muchos investigadores han puesto especial atención a las RNAs para ayudar al proceso de segmentación [Blumenstein & Verma, 1999]. Desafortunadamente solo han sido algunos cuantos autores que han detallado sus descubrimientos en letras cursivas. Es por ello que la mayoría de las técnicas de segmentación no están generalmente explicadas en el contexto de un sistema completo, los investigadores tienden a medir el éxito de sus sistemas en base a sus descubrimientos en las fases de reconocimiento de caracteres o palabras. En resumen podemos inferir que el campo de segmentación de palabras a través de RNAs (o sistemas híbridos que las utilicen) es aún muy amplio y no muy desarrollado debido a que la atención de los investigadores está centrada en el reconocimiento de la palabra, sin tomar la debida importancia a una de las fases más importantes de este proceso: la segmentación. 24