Complemento a: Pavlov y Skinner Prof. Eddie Marrero Historia de la Psicología Depto. Ciencias Sociales UPR,Mayaguez
Aprendizaje por Condicionamiento Clásico (CC)
Introducción Pavlov: estudia el proceso de salivación como parte de la digestión Experimentos fisiológicos con mediciones y control sistemático Resultados inesperados De problema a empresa investigativa y formulación teórica: es posible aprender a emitir respuestas reflejas ante estímulos no naturales
Conceptos Básicos Repuesta refleja natural o incondicionada - es una respuesta automática, no aprendida (natural) que se emite ante estímulos naturales específicos. Ej. comida en la boca salivar En este caso se dice que la respuesta de salivar es natural ante el estímulo de la comida, a sea, que esa respuesta no es aprendida.
Conceptos Básicos (cont.) Según la teoría, lo que se puede es aprender a salivar ante estímulos no naturales. Ej. El sonido de una campana Esto es posible pareando el estímulo no natural (o condicionado) con el estímulo natural o incondicionado (Ej. parear sonido de la campana y comida). Con el tiempo, se saliva solo de oír la campana. En este caso se dice que la respuesta de salivar es una respuesta condicionada o sea, aprendida
Tipos de pareos entre EI - EC Demorado el EC se presenta ligeramente antes que el EI; por un momento coinciden y luego se deja de mostrar el EC. Este es el tipo de pareo más efectivo porque el EC se convierte en un anticipador del EI. EC EI=====>RI
Tipos de pareos entre EI - EC Simultáneo - se presentan simultáneamente el EC y el EI. Este tipo de pareo es menos efectivo que el demorado. La fuerza del EC es menor porque queda opacado por el EI. Al ser simultáneos el EC no sirve para predecir el EI. EC EI ====> RI
Tipos de pareos entre EI - EC de huella - En este se presenta el EC primero y luego el EI. Entre el primero y el segundo se deja pasar algún tiempo, de manera que no coincidan. Este tipo de pareamiento tiene muy poco efecto EC EI =====> RI
Tipos de pareos entre EI - EC Retrospectivo - La presentación del EC se hace después del EI. Con este tipo de pareo no se logra aprendizaje alguno. EI =======> RI EC
Otros conceptos relacionados Generalización - La respuesta condicionada se emite ante estímulos que se parecen al EC (Ej. campana - timbre) Discriminación - La respuesta condicionada se emite ante ciertos estímulos pero no ante otros (Ej. elipses vs. Círculos y neurosis experimental) Extinción - La respuesta condicionada desaparece por razón de que cesa el pareamiento entre el EC y el EI. Hay técnicas para lograr la extinción que se aplican en psicoterapia
Otros conceptos relacionados Recuperación espontánea - Luego de haberse logrado la extinción es posible que la repuesta condicionada reaparezca. Si por casualidad esa reaparición esta acompañada del EI la extinción se hace posteriormente más difícil. Condicionamiento de segundo orden: Es cuando un EC sirve de base para una nueva respuesta condicionada. Ej. El perro puede aprender a salivar ante el sonido de la campana y hasta de solo ver la campana.
Aversión Gustativa Es una situación de condicionamiento clásico particular en la que un solo evento resulta suficiente para producir la RC. La respuesta es una de nauseas, mareos y vómitos ante una comida que puede haber estado dañada o que no es compatible con el organismo. Luego, la reacción aversiva puede surgir de solo ver, oler, probar o imaginar la comida en cuestión. Presentar ejemplos
Aprendizaje por Condicionamiento Operante (CO)
Introducción No todas nuestras conductas se basan en respuestas reflejas como es la base del condicionamiento clásico. De hecho, la mayor parte de nuestras conductas parecen ser producto de nuestra voluntad (Ej. levantarnos para ir a la universidad, tomar o no un taxi que nos lleve, copiar o no lo que se dice en clase, por mencionar solo algunos ejemplos sencillos). La pregunta fundamental es: cómo adquirimos y mantenemos los diferentes patrones de conductas que llevamos a cabo día a día? Para los llamados conductistas adquirimos y preservamos todas nuestras conductas como resultado de las consecuencias ambientales de los mismos. Examinemos esta idea.
Trasfondo histórico: Experimentos de Thorndike
Trasfondo histórico: Experimentos de Thorndike Explicar sus experimentos con gatos: el concepto de jaula problema los comportamientos exitosos tienden a repetirse el gato pasa más tiempo cerca de la salida presiona en diferentes lugares con su pata a ver que efecto tiene luego de varios días su conducta dentro de la jaula se limita a aquellas acciones más efectivas para salir de la misma
La ley del efecto En un determinado ambiente, aquellas conductas o respuestas que sean seguidas de consecuencias beneficiosas tenderán a repetirse, mientras que aquellas respuestas que no tengan consecuencias alguna o consecuencias desfavorables tenderán a no repetirse.
El conductismo según expuesto por B.F. Skinner:
Conceptos fundamentales Respuesta (Re)- Cualquier conducta que lleva a cabo un organismo en un determinado ambiente ya sea por casualidad o inducido a hacerlo Refuerzo (Rf)- Cualquier evento ambiental que aumenta la probabilidad de que una conducta se repita Estimulo discriminativo (Ed)- Cualquier evento ambiental que este dentro de las capacidades preceptúales de un organismo y que le sirve de señal para emitir una conducta. Respuesta operante (Ro) - Cualquier conducta cuya expresión ha quedado bajo el control de un estimulo por causa de un refuerzo
Conceptos fundamentales De lo anterior se puede construir el siguiente algoritmo: Ed -------> Ro Rf el cual puede ser leída de la siguiente forma: nuestras conductas se producen ante determinados estímulos por causa de un refuerzo. O dicho de otra forma, todos nuestros comportamientos consistentes se expresan ante determinadas señales porque han sido reforzados.
Conceptos fundamentales Lo más importante del algoritmo señalado es que permite: explicar, predecir y controlar. Por ejemplo, permite decir que una determinada conducta se expresa en un determinado momento por causa de un refuerzo. Además, si quiero controlar la expresión de la conducta debo presentar el estimulo discriminativo; si esta presente el estimulo discriminativo puedo predecir la aparición de la respuesta. También, si tengo control del refuerzo puedo controlar la conducta ya sea para que se manifieste o para eliminarla (eliminando el refuerzo). Parece complicado y lo es!
Conceptos fundamentales Al modelo de condicionamiento operante también aplican los conceptos de: generalización discriminación extinción recuperación espontánea Explicar estos conceptos con el ejemplo clásico de la caja de Skinner
Programas de refuerzo Se refiere a la manera en que se puede administrar el refuerzo respecto a la conducta deseada. Los programas de refuerzo se dividen a base de tiempo (intervalo) o de cantidad (razón) y si son fijos o variables. La combinación de cada categoría da como resultado cuatro programas de refuerzo Intervalo Razon Fijo Variable x x x x
Programas de refuerzo Intervalo fijo - aquí el refuerzo se da luego de transcurrido un tiempo fijo tras emitir la respuesta. Por ejemplo: 2.5 horas de trabajo, 15 minutos de receso. Otro ejemplo: 2 horas de estudio, 2 horas de descanso (incluyendo juego o TV). Intervalo variable - El refuerzo se da tras espacios variables de tiempo luego de manifestarse la conducta. Por ejemplo: 15 minutos de estudio, media hora de juego; otro día, media hora de estudio, media hora de descanso (la cantidad de tiempo de estudio se refuerza de manera variable)
Programas de refuerzo razón fija - El refuerzo se da luego de ocurrir la conducta un número fijo de veces. Por ejemplo: 12 piezas terminadas, se paga por las mismas. Otro ejemplo: aprendizaje asistido por computadoras: se refuerza cada vez que el aprendiz conteste correctamente. razón variable - El refuerzo se da luego de ocurrir la conducta un número variable de veces. Por ejemplo: las tragamonedas: el refuerzo (ganar) se produce luego de un numero variable de veces de repetirse la conducta (jugar), a veces gana a los 3 intentos, luego a los diez, luego a los 2, luego a los 15, luego a los 30, luego a los 2 y así variablemente.
Programas de refuerzo Cada programa de refuerzo resulta mas practico para distintas circunstancias. Sin embargo, en términos generales podemos decir que los programas variables producen conductas mas difíciles de extinguir ya que suscitan el fenómeno "expectativa", esto es, continuar repitiendo la conducta esperando que en algún momento el refuerzo aparezca
Refuerzo Primario y Secundario Refuerzo primario - Es aquel que adquiere su capacidad de actuar como refuerzo por estar directamente relacionado a la satisfacción de las necesidades naturales del organismo (ej. alimento, contacto, afecto) Refuerzo secundario - Es aquel que adquiere su capacidad de fungir como refuerzo porque el organismo lo ha relacionado con la adquisición de refuerzos primarios. Por ejemplo: el dinero.
Refuerzo negativo En términos básicos, se define el refuerzo negativo como aquella situación en que la remoción de algo aumenta la probabilidad de que ocurra una conducta. Por ejemplo: una campana suena y no cesa hasta que se pone el cinturon digamos que un profesor establece que la evaluación de un curso se hará basado en la calificación obtenida en 4 exámenes de los cuales 3 son parciales y uno es final general. Luego, establece la siguiente condición: si al momento del final su promedio en la clase es de sobre 90%, pues esta eximido de tomar el final. Así, la potencial remoción del final aumentara la probabilidad de que ocurra la conducta de estudiar intensamente. Pague antes del 15 de abril y evite recargos y penalidades
Refuerzo negativo El refuerzo negativo se diferencia del refuerzo positivo en que en el refuerzo positivo se da algo mientras que en el negativo se quita algo. Sin embargo, en ambos casos lo que se da o lo que se quita, tiene como consecuencia aumentar la probabilidad de que una determinada conducta se repita. Esto diferencia al refuerzo negativo del castigo.
El castigo En términos generales podemos decir que el castigo reviste dos cualidades principales (que a su vez lo diferencian del refuerzo positivo y del negativo). Primero - El castigo es en si un evento que resulta desagradable (doloroso, lastimoso) a quien lo recibe. Segundo - El propósito fundamental del castigo es evitar que una conducta se repita; o sea que, el castigo no incentiva conductas sino que quiere reprimirlas.
El castigo Dentro del condicionamiento operante (básicamente skinneriano) no se recomienda el castigo como estrategia de modificación de conducta porque el mismo puede tener efectos secundarios no deseados; entre ellos: No siempre queda claro cual es la conducta que se quiere reprimir. Como resultado de lo anterior puede suceder que se repriman otras conductas que no son supuestamente las deseadas (Ej. un padre castiga a su hijo porque interrumpe sus conversaciones, como resultado el hijo se desarrolla como una persona poco comunicativa). No necesariamente deja claro cuales son las conductas alternas que se quieren promover (pues las mismas no se están reforzando). Puede promover la conducta violenta y agresiva. La conducta se evita solo en presencia de quien castiga