CONDICIONAMIENTO Y APRENDIZAJE 3 1. Concepto, tipos y factores de aprendizaje 2. Condicionamiento clásico 3. Aprendizaje por ensayo y error. Condicionamiento operante 4. Aprendizaje por insight 5. Aprendizaje significativo 6. Aprendizaje social
3. EL APRENDIZAJE POR ENSAYO Y ERROR, CONDICIONAMIENTO OPERANTE O INSTRUMENTAL THORNDIKE SKINNER 3.1 Los Experimentos De Thorndike 3.2 Las Cajas De Skinner 3.3 Programas De Refuerzo 3.4 Generalización, Discriminación E Indefensión Aprendida 3.5 Aplicaciones Del Aprendizaje Por Ensayo Y Error
3. EL APRENDIZAJE POR ENSAYO Y ERROR, CONDICIONAMIENTO OPERANTE O INSTRUMENTAL THORNDIKE SKINNER A diferencia del condicionamiento CLÁSICO en el que el sujeto se limita a reaccionar pasivamente, en el condicionamiento OPERANTE el sujeto para aprender debe actuar (operar) como medio para alcanzar los fines propuestos (pag. 114)
3. EL APRENDIZAJE POR ENSAYO Y ERROR, CONDICIONAMIENTO OPERANTE O INSTRUMENTAL THORNDIKE EEUU, 1874-1949 THORNDIKE Video
3.1 LOS EXPERIMENTOS DE THORNDIKE THORNDIKE (1874-1949). Estadounidense TEORÍA DEL APRENDIZAJE POR ENSAYO Y ERROR: El animal (o persona) efectúa una serie de movimientos al azar hasta que, por casualidad, da con la solución adecuada. LEY DEL EJERCICIO: Aumenta la probabilidad de una respuesta en función de las veces que se ha dado una situación parecida en el pasado LEY DEL EFECTO: El aprendizaje está controlado por sus consecuencias. Un comportamiento que va seguido de una recompensa (refuerzo) tiende a repetirse. Se aprenden las conductas acompañadas de refuerzo (http://www.youtube.com/watch?v=bdujdolre-8)
SKINNER EEUU, 1904-1990 El fin último de Skinner era la elaboración de una tecnología de la conducta que permitiera predecir, controlar y dirigir las acciones de los humanos El objetivo, poder programar una sociedad más feliz. Sus ideas sobre un mundo planificado según procedimientos conductistas fueron plasmadas en su novela Walden dos.
3.2 LAS CAJAS DE SKINNER. IDEAS Quién es SKINNER y en qué consisten sus cajas? En qué leyes profundizó y qué nuevas aportaciones hizo? Qué pretendía Skinner? Qué técnicas utiliza para modificar las conductas? Tipos de consecuencias Qué es el Estímulo discriminativo? qué diferencias hay entre el condicionamiento clásico y el operante?
3.2 LAS CAJAS DE SKINNER SKINNER (1904-1990) Estadounidense Inventor de las cajas de Skinner, diseñadas para animales para observar su comportamiento y condicionar algunas de sus respuestas. Comprobó que el animal disminuía las conductas al azar Profundizó en las leyes de Thorndike del aprendizaje animal y probó experimentos en áreas específicamente humanas como educación intelectual o conductas sociales y lingüísticas Para modificar las conductas utiliza REFUERZOS (premios) y CASTIGOS
DIFERENCIA ENTRE REFUERZO (PREMIO) Y CASTIGO REFUERZO (PREMIO): Es una consecuencia o un estímulo que AUMENTA la probabilidad de que una conducta sea repetida en el futuro. Por ejemplo CASTIGO: Es una consecuencia o un estímulo que DISMINUYE la probabilidad de que una conducta sea repetida en el futuro. Por ejemplo
REFUERZO POSITIVO Se administra al sujeto una recompensa cuando ha llevado a cabo la conducta deseada Ejemplo CONDUCTA DESEADA: Comer verdura REFUERZO POSITIVO (+): chuchería de postre Decir otros ejemplos
REFUERZO NEGATIVO Se suprime algo desagradable para el sujeto cuando ha llevado a cabo la conducta deseada. SITUACIÓN: Una rata está sometida permanentemente a una descarga eléctrica dentro de una caja de Skinner en la que hay tres palancas de colores: V, A, R CONDUCTA DESEADA: que la rata pulse la palanca verde REFUERZO NEGATIVO (-): se suprime la descarga sólo cuando pulse la palanca verde Decir ejemplos
CASTIGO POSITIVO Se administra al sujeto un CASTIGO + cuando ha llevado a cabo la conducta que se desea ELIMINAR CONDUCTA: Un niño pequeño toca un enchufe CASTIGO: Se le grita un fuerte y contundente NO! Decir ejemplos:
CASTIGO NEGATIVO Se RETIRA al sujeto algo agradable cuando ha llevado a cabo la conducta que se desea ELIMINAR CONDUCTA: Un niño pequeño muerde a otro CASTIGO: Dejarlo sin recreo Decir ejemplos:
Se ha confirmado experimentalmente que es mucho más efectivo el aprendizaje alcanzado mediante REFUERZOS que el conseguido para evitar CASTIGOS.
SEÑAL O ESTÍMULO DISCRIMINATIVO Es aquel que el animal (o persona) debe aprender a reconocer para saber cuándo debe emitir la respuesta. Equivale (aproximadamente) al EC del condicionamiento clásico EJEMPLO Un niño debe saber que comiendo verdura (SEÑAL O ESTIMULO DISCRIMINATIVO) va a recibir una golosina (PREMIO) Actividad 8
EQUIVALENTE ENTRE CONDICIONAMIENTO CLÁSICO Y OPERANTE SEÑAL/ESTÍMULO DISCRIMINATIVO EC REFUERZO/PREMIO EI EJEMPLO SEÑAL O ESTIMULO DISCRIMINATIVO (EC) verdura PREMIO (EI) golosina
SEMEJANZAS Y DIFERENCIAS condicionamiento clásico condicionamiento operante EI (golosina) EN (verdura) EI (golosina) RI (comer) RI (comer) SEÑAL O ESTÍMULO DISCRIMINATIVO (verdura) REFUERZO POSITIVO (golosina) EC (verdura) RC (comer)
3.3. PROGRAMAS DE REFUERZO Programa de refuerzo es la técnica que consiste en distribuir los refuerzos en el proceso de aprendizaje para conseguir los efectos deseados. Clases: - Programas de Refuerzo continuo. El refuerzo es administrado siempre que se produzca la conducta deseada - Programas de Refuerzo parcial. No se refuerzan todas las conductas adecuadas sino parte de ellas
PROGRAMAS DE REFUERZO PARCIAL Se administra el refuerzo: - Programas de razón (nº) fija: tras un nº, siempre el mismo de respuestas adecuadas. Por ejemplo, se refuerza cada 3 conductas adecuadas. - Programas de intervalo (tiempo) fijo. Cada cierto tiempo. Por ejemplo, se refuerza cada semana la conducta adecuada - Programas de razón variable: el número de respuestas adecuadas es variable pero en torno a un valor promedio o de forma ascendente - Programas de intervalo variable. Tras un periodo de tiempo en torno a un promedio o de forma ascendente - Actividades de mínimos 9, 10 y 11
PROGRAMAS DE RAZÓN FIJA CONDUCTA: Comer lo que se le ponga en el plato Queremos aplicar 8 refuerzos positivos (8 puntos) Elegimos una razón FIJA, puede ser 3 Multiplicamos 3x8=24 3 + 3 + 3 + 3 + 3 + 3 + 3 + 3 24
PROGRAMAS DE RAZÓN VARIABLE CONDUCTA: Comer lo que se le ponga en el plato Queremos aplicar 8 refuerzos positivos (8 puntos) Elegimos una razón, puede ser 3 Multiplicamos 3x8=24 2 + 4 + 3 + 4 + 2 + 5 + 1 +? 24
PROGRAMAS DE INTERVALO FIJO CONDUCTA: Hacer las tareas de clase Queremos aplicar 8 refuerzos positivos (8 puntos) Elegimos un intervalo de tiempo fijo: mirar cada 3 días Multiplicamos 3x8=24 3 + 3 + 3 + 3 + 3 + 3 + 3 + 3 24
PROGRAMAS DE INTERVALO VARIABLE CONDUCTA: Hacer las tareas de clase Queremos aplicar 8 refuerzos positivos (8 puntos) Elegimos un intervalo de tiempo variable en torno a 3 días Multiplicamos 3x8=24 2 + 4 + 3 + 4 + 2 + 5 + 1 +? 24
3.4 GENERALIZACIÓN, DISCRIMINACION E Discriminación y generalización de estímulos y de respuestas. Leer ejemplos de la pag. 116 INDEFENSIÓN APRENDIDA: Cuando a una conducta no le sigue ningún refuerzo positivo o negativo (no puede evitar una situación desagradable) deja de aprender y sigue una actitud pasiva que le puede incapacitar para otros aprendizajes. Leer el ejemplo INDEFENSIÓN APRENDIDA Actividad 12 NO
3.5. APLICACIONES DEL APRENDIZAJE POR ENSAYO Y ERROR (CONDICIONAMIENTO OPERANTE) Sus investigaciones se siguen aplicando con éxito: En el adiestramiento de animales (perros policía, para ayuda a personas discapacitadas ) En educación: técnicas de modificación de conducta Ver Hans el caballo listo Actividad 13
Ejercicios de final del tema TODOS EXCEPTO 12 ENTREGAR EL JUEVES, último día
TRABAJO parejas ANALIZAR CONDUCTAS. Buscar 1 conducta que queramos eliminar. Pensar en Antecedente, Conducta y Consecuencia Buscar 1 conducta que queramos reforzar o enseñar. Pensar en Antecedente, conducta y consecuencia. A Antecedente B Conducta C Consecuencia
CONDICIONAMIENTO OPERANTE POSICIÓN AMBIENTALISTA: El A-B-C de la Ψ las conductas de los organismos están determinadas por las condiciones ambientales. Transformando estas condiciones (antecedente y/o consecuencia) modificaremos el comportamiento. A (antecedente) Aburrimiento en clase B (behavior/conducta) Hablar con el compañero C (consecuencia) Llamada de atención, negativo