martes, 22 de noviembre de 2016

Skinner y el Condicionamiento Operante

          
             Burrus Frederic Skinner, nació en 1904 en Susquehanna, Pennsylvania. Luego de fallar en sus intentos de ser escritor cambió a la psicología, de lo cual sólo tenía una vaga idea. Obtuvo su doctorado en 1931.


            Escribió en 1938 el libro titulado “La Conducta de los Organismos”, en la cual introdujo sus estudios sobre el condicionamiento operante, luego escribió Walden II en 1948, si intento era describir la utilización de un diseño para la buena vida en una comunidad regida por los principios del conocimiento operante. Después le siguieron numerosos escritos, hasta su deceso el 18 de agosto de 1990.


            Para Skinner la unidad simple de la conducta es el reflejo y a éste lo define como cualquier correlación entre estímulo y respuesta. Los reflejos se hallan íntimamente ligados al bienestar del organismo.


             Descripción del Condicionamiento Operante:


            El condicionamiento operante es un proceso de ejercer control sobre la conducta de un organismo en un cierto ambiente, por medio de la aplicación del refuerzo. Incluye máxima flexibilidad y adaptabilidad (Ardila, 1981). 


            Es la teoría psicológica del aprendizaje que explica la conducta voluntaria del cuerpo, en su relación con el medio ambiente, basados en un método experimental.


            Es decir, que ante un estímulo, se produce una respuesta voluntaria, la cual, puede ser reforzada de manera positiva o negativa provocando que la conducta operante se fortalezca o debilite. Skinner afirmaría que “el condicionamiento operante modifica la conducta en la misma forma en que un escritor moldea un montón de arcilla”, puesto que dentro del condicionamiento operante el aprendizaje es simplemente el cambio de probabilidades de que se emita una respuesta.


Elementos fundamentales del Condicionamiento Operante:




1.- Respuesta operante: Toda conducta mediante la cual el individuo manipula el ambiente para conseguir un objetivo.


2.- Reforzador o recompensa: Es todo aquello que aplicado después de la emisión de una conducta (es decir, las consecuencias producidas por una conducta) aumenta la probabilidad de que esa conducta se repita en el futuro. Es el concepto central de la teoría de Skinner (1953) y del que derivan los siguientes:





   Conceptos claves:

-Extinción: Es un procedimiento en el cual una conducta operante que ha sido reforzada deja de serlo y que produce el fin de la respuesta.


-Olvido: Todas las conductas que no reciben o que dejan de recibir reforzamiento tienden a disminuir su frecuencia de aparición y a desaparecer.


-Discriminación: Es cuando un organismo se comporta de manera diferente en presencia de dos estímulos similares.


-Distinción diferencial: Las similitudes entre dos estímulos desaparecen y el organismo responde de manera distinta ante cada uno sin esfuerzo para diferenciarlos.


-Desvanecimiento: Es la capacidad de reconversión entre una fuerte discriminación y una clara distinción diferencial.


-Generalización del estímulo: se presenta cuando ante varios estímulos parecidos se da la misma respuesta.


-Generalización de la respuesta: se da cuando ante un mismo estimulo se dan respuestas parecidas.


-Reforzadores incondicionados o primarios: Son estímulos, que tienen la propiedad de reforzar la conducta sin que el organismo haya tenido experiencia previa de ellos.

            Ejemplo: El agua y la comida.


-Reforzadores condicionados o secundarios: Son estímulos que adquieren la  propiedad de reforzar a lo largo de la vida del organismo.
            Ejemplo: El dinero es el principal reforzador condicionado del hombre.

Tipos de refuerzos:



1.- Refuerzo positivo: Cuando se incrementa la frecuencia de la respuesta por la presentación de un evento,

            Ejemplo: Los aplausos del público incrementan el buen  desempeño del artista




2.- Refuerzo negativo: Cuando se incrementa la frecuencia de la respuesta por el retiro del evento.

            Ejemplo: El quitarle una espina clavada en la pata de un perro, hace que éste acuda con mayor entusiasmo a la presencia de su amo. 




3.- Castigo positivo: Consiste en presentar un estímulo o situación desagradable para el individuo tras lo cual se espera que disminuya su conducta.



4.- Castigo negativo: Éste procedimiento supone la retirada de una situación o estímulo agradable para el sujeto tras la realización de la conducta problemática. Lo que se pretende es disminuir la frecuencia de la conducta castigada negativamente.


             
         El refuerzo siempre va después de emitida la conducta. La inmensa mayoría de nuestras conductas aprendidas las hemos adquirido por medio de este procedimiento.



            Programas de reforzamiento (Ferster y Skinner. 1957):



1.- Programa de refuerzo continuo: Se refuerzan todas las respuestas de un determinado tipo. El comportamiento es fácil de adquirir y extinguir.


2.- Programas de refuerzo intermitente: Se refuerzan sólo un cierto número o una fracción de respuestas de un tipo.

 Pueden presentar diversas formas:

- Refuerzo de razón fija: Se refuerza un comportamiento después de un cierto número de respuestas.
          Ejemplo: El dueño de la fábrica premia al obrero cada vez que le presenta 10 pares de zapatos terminados. Esquema: RF10 (razón fija 10).


- Refuerzo de razón variable: Se refuerza un comportamiento al azar, pero en torno a un cierto promedio.
         Ejemplo: El dueño de la fábrica premia al obrero a veces cuando le presenta 15 pares de  zapatos terminados. A veces cuando le presenta 25. A veces cuando le presenta 18. El promedio es 20. Esquema: RV20 (razón variable 20).


- Refuerzo de intervalo fijo: se refuerza un comportamiento después de un determinado tiempo, no después de un determinado número de respuestas.              
           Ejemplo: Al final de cada mes se le paga al obrero.  Esquema: IF1 (intervalo fijo 1). 


- Refuerzo de intervalo variable: se refuerza un comportamiento en tiempos variables, pero en torno a un cierto promedio.
            Ejemplo: Después de dos meses de trabajo se da un premio extra al obrero,  otras veces después de cuatro meses, otras veces después de 3 meses... el promedio será 3 meses. Esquema: IV3 (intervalo variable 3).


Procedimientos básicos del Condicionamiento Operante:



1.- Condicionamiento instrumental de recompensa: Basado en la utilización del refuerzo positivo.


2.- Condicionamiento  instrumental de escape: Basado en el empleo del refuerzo negativo. El sujeto evita la situación desagradable abandonando el medio en que se produce.


3.- Condicionamiento instrumental de evitación: Basado también en el empleo del refuerzo negativo. En este tipo de condicionamiento, se le proporciona al sujeto una posibilidad de evitar el estímulo aversivo.

4.- Condicionamiento instrumental de castigo: Basado en la utilización del castigo.


                 El castigo:

            Skinner (1974) ha sido un estudioso del castigo. Afirma que el castigo solo tiene efectividad pasajera sobre la conducta que se castiga, más aun, esa conducta castigada reaparece más tarde.
 

           
          Efectos del castigo:

-EI castigo hace que la conducta castigada desaparezca para luego aparecer cuando el castigo ha cesado. 

-Una conducta severamente castigada hace resurgir "predisposiciones" emocionales intensas (culpa, vergüenza, sensación de pecado), que luego en el futuro se pueden presentar de nuevo en circunstancias extremas parecidas aunque no se ponga en práctica otra vez la conducta castigada.

-Cualquier conducta que reduzca la estimulación negativa obra  como un refuerzo. 

-Aparece una especie de conflicto entre la respuesta que suscita el castigo y la que lo evita, se producen ansiedad, miedo y hasta enfermedades "psicosomaticas", y a veces no se da puerta de salida.

            Skinner propone alternativas para el castigo: 

-Modificar las circunstancias que llevan al castigo.

-Permitir un estado de saciedad  que hace que la conducta se extinga.

-Usar la extinción (no reforzamiento).

-Condicionar una conducta incompatible mediante el reforzamiento.
            Ejemplo: Premiar al niño siempre que se lava las manos, lo cual es incompatible con tener las manos sucias).