lunes, 1 de agosto de 2016

Los programas de refuerzo.

El reforzamiento hace algo más que moldear la conducta; también mantiene conductas establecidas. Si se pretende comprender la extensión y complejidad de las actividades de una persona, deberán estudiarse las contingencias de reforzamiento. Para saber por qué una determinada conducta se mantiene en una persona, una conducta indeseable, por ejemplo, lo fundamental es averiguar cómo se está produciendo el reforzamiento de esa conducta, ya que una conducta que no se refuerza de algún modo no se continúa realizando. En la mayoría de los casos es extremadamente difícil especificar tales condiciones según se dan en el mundo real, pero hasta un análisis superficial sobre cómo y cuándo tiene lugar el re­fuerzo suele revelar determinantes muy significativos de la conducta.

Algunas conductas se refuerzan cada vez que se emiten; a esto se le llama reforza­miento continuo. A menudo, las conductas que se refuerzan de manera continua son aquellas que actúan sobre el ambiente físico; empujar o tirar de una puerta tiene como resultado coherente abrirla o cerrarla y si se abre un grifo la consecuencia será el flujo de agua. Estos son ejemplos sencillos de casos en los que ciertos resultados (refuerzo) se dan cada vez que se lleva a cabo una respuesta en particular. El refuerzo continuo también mantiene actividades físicas más complejas; algunas respuestas tie­nen como resultado que se patine, esquíe, monte en bicicleta, escriba, nade, etc., de manera exitosa; de este modo continuamos emitiendo las conductas adecuadas para lograr esto. Las conductas que se mantienen en un programa de reforzamiento continuo se extin­guen rápidamente cuando los reforzadores ya no están disponibles. 

Si el reforzamiento no se produce cada vez que se emite un tipo particular de conducta, estará operando un programa de reforzamiento intermitente, y las conductas que mantienen dichos programas son, por lo general, más resistentes a la extinción que las mantenidas por el refuerzo continuo. Un "gran seductor", acostumbrado a tener siempre éxito con las mujeres, renunciará probablemente a sus intentos de seducción más rápidamente que una persona que ha tenido una historia de éxitos y fracasos.

Una paloma cuya conducta de picotear palancas se ha reforzado continuamente po­dría llegar a hacerlo de 50 a 200 veces después de cesar el refuerzo. Sin embargo, en un programa intermitente se podrían emitir de 4.000 a 10.000 picotazos durante el pe­riodo de extinción. Si las rabietas de un niño se mantienen la atención de los padres cada vez que ocurren (reforzamiento continuo) éstas desaparecerán en un lapso de tiempo relativa­mente corto cuando los padres comiencen a ignorarlas (extinción). Sin embargo, si las rabietas se mantienen con un programa intermitente; es decir, si algunas veces reciben atención y otras no, será más difícil para los padres extinguirlas. La conducta muy per­sistente suele ser el resultado de programas de reforzamiento intermitente.

Gran parte de la conducta humana se mantiene por reforzamiento intermitente. Esto se da generalmente en los casos en los que otras personas están implicadas. Rara vez tenemos certeza total en nuestras interacciones con otros. Incluso nuestros mejo­res amigos no siempre reaccionan favorablemente a nuestras conductas amistosas; sin embargo, persistimos. Hay muchos otros ejemplos de la efectividad del reforzamiento intermitente: los atletas que continúan compitiendo aunque no siempre ganen; los es­critores que siguen escribiendo aunque no logren que se les publiquen obras con fre­cuencia; los cocineros que siguen innovando a pesar de los platos fallidos que abundan entre sus éxitos, etc. En pocas palabras, las conductas humanas se mantienen en muchos de los casos gracias al reforzamiento que tiene lugar sólo ocasionalmente.

Hay dos tipos principales de programas de reforzamiento intermitente: 
  • Programas de intervalo: Los programas de intervalo están basados en el paso del tiempo, como cuando una paloma en una caja de Skinner recibe un poco de ali­mento a cambio de pulsar una palanca, después de pasar cierto intervalo de tiempo. Di­cho intervalo puede ser constante o variar con cierto promedio. La persona que recoge su correspondencia todos los días exactamente a las 10 a.m., debido a que la entrega del correo es muy regular y por tanto su conducta siempre recibe refuerzo a esa hora, está actuando bajo un programa de intervalo fijo. Compara la con­ducta de esta persona con la de alguien que opera bajo un programa de intervalo variable en relación con la recogida del correo. Imaginemos que el cartero llega como promedio a las 10 a.m., pero algunos días a las 9:30, otros a las 10:30 más o menos. Esta persona irá probablemente a ver su correo cuando sean las 9:30 y continuará haciéndolo hasta que finalmente se refuerce su conducta (hasta que llega el correo). Un programa de intervalo variable produce una tasa de respuesta más constante que uno de intervalo fijo. Nuestra hipotética persona que está en el programa de intervalo variable suele ir con regularidad al buzón hasta que finalmente obtiene su correo, mientras que la otra persona sólo irá una vez. Algunas conductas a las que nos referimos como "ansiosas" (por ejemplo, ir a ver continuamente el buzón, mirar en repetidas ocasiones a través de la ventana para ver si regresa algún miembro de la familia o ir a la cocina una y otra vez para ver si está hirviendo el agua) son resultado de programas de intervalo variable. 
  • Programas de razón: en este tipo de programas, la cantidad o intensidad del refuerzo depende de la repetición de la conducta. Es el caso de los hábitos alimenticios compulsivos, por ejemplo: comemos chocolate, lo que nos proporciona un refuerzo placentero, para aumentar la cantidad e intensidad del refuerzo, aumentamos nuestra conducta (comemos más veces). La diferencia fundamental entre los programas de intervalo y los de razón es que, en el primer caso, el refuerzo no es dependiente de las veces que repitamos la conducta, pero en el segundo sí se da tal dependencia. Podemos distinguir también entre programas de razón fija y programas de razón variable. En los primeros, el refuerzo se da proporcionalmente al aumento o disminución de nuestra conducta; por ejemplo, cuando comemos chocolate, si queremos aumentar el refuerzo, no tenemos más que aumentar la conducta. En los programas de razón variable, lo que ocurre es que el aumento de la conducta produce un aumento variable de las recompensas; por ejemplo, un seductor, el aumento de su despliegue de seducción a veces tiene más resultados y a veces menos. Un ejemplo clásico de conducta humana que se mantiene en tasa alta en un pro­grama de razón variable es el juego. La ruleta, las carreras de caballos, las tragape­rras y otros juegos proporcionan refuerzos de razón variable: el resultado de cualquier apuesta en particular es impredecible. Hay otros, muchos ejemplos de con­ductas que se refuerzan en razón variable: conocer a extraños, cazar y pescar, ir al cine, cenar fuera de casa, jugar al golf, asistir a fiestas, escribir cartas, cocinar, reparar viejos aparatos electrodomésticos, ver televisión y otras actividades. De estos programas de mantenimiento de la conducta, son más fuertes (hacen que la conducta sea más persistente) en el caso de los programas de razón que en los programas de intervalo; además la persistencia de la conducta aumenta en los casos de conductas variables frente a conductas fijas.

No hay comentarios:

Publicar un comentario

Lo más visto...