resumen principios de aprendizaje y conducta 1 9

86
Principios de Aprendizaje y conducta CAPITULO 1: INTRODUCCIÓN A) ANTECEDENTES HISTÓRICOS Los inicios del aprendizaje tienen su raíz en la filosofía de René Descartes. Dualismo Cartesiano: 2 tipos de conducta 1) Conducta Involuntaria: Respuestas automáticas a los estímulos externos y está mediada por un mecanismo llamado reflejo. 2) Conducta Voluntaria: No requiere de la intervención de estímulos externos sino que se debe a la voluntad consciente de actuar de una determinada forma. Diagrama del dualismo cartesiano Mundo fisico (causa de la acción inv.) Desarrollo histórico del estudio de la mente Innatismo: (Descartes) Nacemos con ideas innatas acerca de ciertas cosas. Es lo que se conoce como Postura nativista. Empirismo: (John Locke) Todas las ideas de las personas eran aprendidas directa o indirectamente a través de experiencias posteriores al nacimiento. Modelo adoptado por filósofos británicos entre XVII-XIX. A los seguidores se les conocería como Empiristas británicos. Descartes también pensaba que la mente no operaba de forma predecible y ordenada. El Hedonismo surge como una alternativa a este pensamiento. Hedonismo: (Thomas Hobbes) Para los hedonistas, la mente opera de forma predecible y conforme a leyes. Las personas siempre tratarán de lograr el placer y evitar el dolor. Órganos sensoriales Cerebro Glandula Pineal Mente Musculos Acción voluntaria o involuntaria (causa de la acción voluntaria) Nervios

Upload: xose-httpkatharoooblogspotcom

Post on 20-Jun-2015

23.833 views

Category:

Documents


10 download

TRANSCRIPT

Page 1: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 1: INTRODUCCIÓN

A) ANTECEDENTES HISTÓRICOS Los inicios del aprendizaje tienen su raíz en la filosofía de René Descartes. Dualismo Cartesiano: 2 tipos de conducta 1) Conducta Involuntaria: Respuestas automáticas a los estímulos externos y está mediada por un mecanismo llamado reflejo. 2) Conducta Voluntaria: No requiere de la intervención de estímulos externos sino que se debe a la voluntad consciente de actuar de una determinada forma. Diagrama del dualismo cartesiano Mundo fisico (causa de la acción inv.) Desarrollo histórico del estudio de la mente Innatismo: (Descartes) Nacemos con ideas innatas acerca de ciertas cosas. Es lo que se conoce como Postura nativista. Empirismo: (John Locke) Todas las ideas de las personas eran aprendidas directa o indirectamente a través de experiencias posteriores al nacimiento. Modelo adoptado por filósofos británicos entre XVII-XIX. A los seguidores se les conocería como Empiristas británicos. Descartes también pensaba que la mente no operaba de forma predecible y ordenada. El Hedonismo surge como una alternativa a este pensamiento. Hedonismo: (Thomas Hobbes) Para los hedonistas, la mente opera de forma predecible y conforme a leyes. Las personas siempre tratarán de lograr el placer y evitar el dolor.

Órganos sensoriales

Cerebro

Glandula Pineal

Mente

Musculos

Acción voluntaria o involuntaria

(causa de la acción voluntaria)

Nervios

Page 2: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 1: INTRODUCCIÓN

Concepto de asociación: Concepto importante para los empiristas británicos para explicar el funcionamiento de la mente. Las sensaciones simples se combinan hasta formas ideas complejas por medio de asociaciones. Ejemplo - Idea simple: Oir la palabra coche - Idea simple: Recuerdo que evoca la palabra coche sobre experiencias anteriores que hemos vivido con los coches. Estas dos ideas simples se combinan y tenemos: - Idea compleja: Nos formamos una idea de su apariencia, de su utilidad y de cómo nos sentiríamos sentados en el. Leyes de asociación Leyes primarias: (Origen en Aristóteles) contigüidad, similitud y contraste

- Contigüidad: La más importante en el estudio de las asociaciones. Si dos eventos ocurren juntos en el espacio o en el tiempo de forma repetida quedarán asociados.

Ejemplo: Si nos encontramos con el olor de la salsa de tomate y los espaguetis con frecuencia, pensaremos en espaguettis con el mero olor de la salsa de tomate.

- Similitud y contraste: Dos ideas se asocian si son similares en algún aspecto (las dos son rojas) o si tienen alguna característica contraria (diferencia de tamaño).

Leyes secundarias: (Thomas Brown 1778-1820). La formación de asociaciones entre dos sensaciones estaba influida por un número de factores, incluyendo la intensidad de las sensaciones y la frecuencia y recencia con que las dos sensaciones ocurrían conjuntamente. Además se consideraba que la formación de una asociación entre dos eventos dependía del número de asociaciones anteriores en las que cada uno de dichos eventos estaba involucrado, y la similitud entre estas asociaciones pasadas y la que se forma en el presente. Sin embargo los empiristas británicos no estudiaron en profundidad las leyes de asociación…hasta que llegó el psicólogo alemán Hermann Ebbinghaus!!! (1850-1909) quien inventó las Sílabas sin sentido…¿y qué es esto??? Sílabas sin sentido: Combinaciones de 3 letras (bap por ejemplo) despojadas de cualquier significado que pudiera influir en cómo se reaccionaba entre ellas. El alemán este, Ebbinghaus, se utilizó a si mismo para medir su capacidad de recordarlas en diferentes condiciones experimentales. Comprobó que la fuerza de las asociaciones mejoraba con el entrenamiento y que las sílabas que aparecían

Page 3: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 1: INTRODUCCIÓN

cercanas en una lista quedaban asociadas con mayor fuerza que las que estaban distantes. Esto lo veo un poco de cajón, pero el libro tampoco da más datos… Desarrollo histórico del estudio de los reflejos Descartes pensaba que los mensajes que iban de los órganos de los sentidos al cerebro y los mensajes motores que iban del cerebro a los músculos viajaban por los mismos nervios. Descartes Pensaba que los nervios eran tubos huecos por los que se desplazaban unos gases llamados espíritus animales…no comment.

Como es obvio, siglos posteriores a la muerte de Descartes, todas estas ideas acerca de los reflejos resultaron ser erróneas.

Charles Bell y François Magendie demostraron que eran fibras nerviosas distintas las que se encargaban de transmitir la información sensorial desde los órganos de los sentidos hasta el sistema nervioso central y otras fibras que transmitían la información motora desde el sistema nervioso central hasta los músculos. - En 1669 John Swamerdamm mostró que la irritación mecánica de un nervio era suficiente para producir una contracción muscular, asi que lo de los espiritus animales desde la glandula pineal era innecesario. - Posteriormente, Francis Glisson demostró que las contracciones musculares no se debían a que los músculos fueran hinchados por un gas. Osea que toda esta gente tiró por tierra las elaboradas suposiciones que siglos antes había formulado Descartes…

Sistema nervioso central

Músculos

Órganos de los

sentidos

Información sensorial Información

Motora

Page 4: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 1: INTRODUCCIÓN

Y con todo esto llegamos al siglo XIX y los rusos entran en acción:

- I.M Sechenov (1829-1905) – Propuso que los estímulos no siempre elicitan respuestas reflejas de forma directa. En algunos casos un estímulo puede liberar una respuesta que estaba inhibida y la fuerza de la respuesta no dependerá de la intensidad del estímulo. Ejemplo: Pequeñas partículas de polvo pueden liberar un potente estornudo. Según Sechenov, la conducta voluntaria y los pensamientos están en realidad elicitados (generados) por estímulos débiles y apenas visibles.

Sin embargo el trabajo de Sechenov tenía un fallo: No tuvo en consideración que a lo largo de la vida de un individuo, su respuesta ante un estímulo puede variar debido a la experiencia. Y aquí es donde llegá el padre del cordero (o mejor dicho, del perro): Ivan Pavlov

- Ivan Pavlov (1849 – 1936): Demostró experimentalmente que no todos los reflejos son innatos. Mediante mecanismos asociativos se pueden establecer nuevos reflejos para estímulos. Su papel fue similar al del alemán que hablabamos antes, Ebbinghaus, pero Pavlov realizó su trabajo desde la tradición filosófica de la reflexología.

B) EL AMANECER DE UNA NUEVA ERA La cognición comparada y la evolución de la inteligencia Descartes pensaba que los humanos eran los únicos animales que poseían mente. Y cómo no, no tardaron en surgir autores que dejaran por el suelo al pobre Descartes.

- Darwin criticó duramente esta idea y en su libro “el origen del hombre” postuló que el hombre desciende de algún ser más primitivo, a pesar de que por el momento se desconozcan los eslabones intermedios”. En opinión de Darwin, la mente humana es producto de la evolución y si el ser humano tiene habilidades mentales como hacerse preguntas, memorizar, o razonar, el resto de animales posee también dichas habilidades.

- George Romanes: Definió la inteligencia a partir de la capacidad de aprender.

Esta definición fue ampliamente aceptada a finales del XIX y principios del XX.

Page 5: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 1: INTRODUCCIÓN

Neurologia funcional Nervismo: (Pavlov) – De acuerdo con el nervismo, las principales funciones fisiológicas están controladas por el sistema nervioso. Sin embargo…años más tarde (1902) surgen dos investigadores británicos (Bayliss y Starling) demostraron que el páncreas estaba controlado parcialmente por factores hormonales y no neurales. Este nuevo descubrimiento le llevó a Pavlov a pensar que por ahí no iban los tiros y abandonar su investigación sobre la fisiología del sistema digestivo y centrarse en los reflejos condicionados. Pavlov consideró los estudios de condicionamiento como un medio para obtener información sobre las funciones del sistema nervioso. Ejemplo: El psicólogo del comportamiento es como un conductor que trata de descrubir el funcionamiento de un coche conduciéndolo en lugar de estudiando el motor. Modelos animales de la conducta humana Se pensaba que la investigación con animales podría proporcionar información útil para la comprensión del comportamiento humano. Los modelos animales permiten investigar problemas que son difíciles o imposibles de estudiar directamente en personas. Un modelo permite realizar la investigación en condiciones más sencillas, mejor controladas y más económicas. Por ejemplo: La similitud entre las ratas y los humanos en la forma de evitar comidas peligrosas hace que la rata sea un modelo válido para investigar el aprendizaje de aversión a la comida en humanos. El hecho de que las ratas tengan cola y de que caminen a 4 patas es irrelevante para el estudio de la selección de alimentos. Lo más importante a la hora de construir un modelo animal útil es identificar las similitudes relevantes entre el modelo animal y la conducta humana en cuestión. Dollard y Miller fueron partidarios de una integración en la que los estudios de laboratorio realizados con animales no humanos se usaran para aislar e identificar los fenómenos que podrían ser estudiados posteriormente con éxito en las personas. Modelos animales y robótica La meta de la robótica es hacer máquinas tan inteligentes como sea posible. Los ingenieros actuales contemplan la capacidad de recordar y aprender a partir de la experiencia como un rasgo importante de los sistemas artificiales inteligentes.

Page 6: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 1: INTRODUCCIÓN

(esto guarda relación con la definición comentada anteriormente de Romanes sobre la inteligencia) C) DEFINICIÓN DE APRENDIZAJE Según Domjan: “El aprendizaje es un cambio duradero en los mecanismos de conducta que implica estímulos y/o respuestas específicas y que es resultado de la experiencia previa con esos estímulos y respuestas o con otros similares” Distinción entre aprendizaje y ejecución Acerca de la definición anterior es importante puntualizar que atribuye el aprendizaje a un cambio en los mecanismos de conducta, no a un cambio directo en la conducta. Esto es importante ya que pueden haber cambios en la conducta que no sean consecuencia de un aprendizaje Ejecución: Se refiere a las acciones de un organismo en un momento concreto. Que hagamos (o no) algo depende de muchas cosas, como la motivación, capacidades sensoriales, etc, además del aprendizaje. Que un niño se tire (ejecución) a una piscina es algo que está determinado por otras cosas (lo fria que esté el agua, la motivación por tirarse, la profundidad etc.), además del aprendizaje. No podemos afirmar que el hecho de tirarse se deba exclusivamente al aprendizaje. El aprendizaje y otras fuentes de cambio conductual Existen cambios en la conducta tan breves que no pueden ser considerados como ejemplos de aprendizaje: Fatiga: El esfuerzo físico debilita gradualmente la fuerza de una respuesta. Cambio en las condiciones estimulares: Encender las luces a mitad de la película en el cine provoca una respuesta en los espectadores. Estado Fisiológico o motivacional del organismo: El hambre y la sed provocan respuestas que no se observan en otros momentos. Maduración: Un niño crece y alcanza una estantería a la que antes no llegaba. No se considera aprendizaje ya que es un cambio debido al paso del tiempo.

Page 7: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 1: INTRODUCCIÓN

Diferentes tipos de mecanismos causales Existen 4 tipos de causas descritos por Aristóteles: Causa eficiente: Es la experiencia anterior con estímulos y/o respuestas específicos que produce el cambio en la conducta que señala la presencia del aprendizaje. Causa material: Hacen referencia a los cambios físicos en el sistema nervioso que median en el aprendizaje. Causa formal: Las causas formales son las teorías o modelos de aprendizaje. Estas terorías o modelos pueden expresarse en términos matemáticos o computacionales. Causa final: La causa final de un comportamiento o de cualquier proceso biológico es cómo ese proceso contribuye al éxito reproductivo del organismo. La causa final se mide a partir del número de descendientes de un organismo. D) ASPECTOS METODOLÓGICOS DEL ESTUDIO DEL APRENDIZAJE El aprendizaje como ciencia experimental Los investigadores del aprendizaje han centrado su atención en las causas eficientes, materiales y formales. Las causas no pueden observarse directamente. Tan sólo pueden ser inferidas a partir de los resultados de las manipulaciones experimentales. Si una persona entra en una habitación a oscuras, pulsa un interruptor y se enciende la luz, no podemos concluir que accionar el interruptor sea la causa de que la luz se haya encendido. Puede haber un detector de movimiento que haya detectado la presencia de la persona y haya encendido la luz. Para descartar esta posibilidad, la persona debería entrar de nuevo a la habitación y no pulsar el interruptor para ver qué ocurre. Para identificar una causa se requiere la realización de una prueba en ausencia de dicha causa. Entonces podremos comparar los resultados obtenidos en presencia y en ausencia de la presunta causa. La pregunta típica es si un procedimiento produce un efecto de aprendizaje en particular. Para responder a esta pregunta, hay que comparar las acciones de los individuos que previamente han sido expuestos al procedimiento en cuestión con las acciones de los individuos que no han sido expuestos a dicho procedimiento.

Page 8: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 1: INTRODUCCIÓN

La perspectiva de proceso general en el estudio del aprendizaje Elementos de la perspectiva de proceso general La característica más obvia de la naturaleza es su diversidad. Sin embargo todos los científicos han optado por fijarse en los aspectos comunes a la hora de estudiarla. Han tratado de formular leyes generales con las que organizar y explicar la diversidad de los eventos del universo. Los investigadores del aprendizaje animal han seguido esta tradición. Un presupuesto fundamental en la perspectiva de proceso general es que los fenómenos estudiados son el resultado de procesos más elementales. Además se supone que estos procesos elementales operan de forma similar independientemente de donde se encuentren. Los investigadores del condicionamiento y el aprendizaje se han adherido a esta perspectiva de proceso general desde los comienzos de esta área de estudio en psicología. Darwin, Pavlov o C. Lloyd Morgan seguían esta perspectiva. Creían en la existencia de leyes universales (por ejemplo las leyes de asociación) para todas las especies, aunque también afirmaban que cada especie podía tener un ritmo diferente de aprendizaje para unas mismas leyes elementales. Implicaciones metodológicas de la perspectiva de proceso general La principal implicación metodológica de esta perspectiva es que se pueden descubrir los principios de aprendizaje estudiando cualquier especie o sistema de respuesta que demuestre aprendizaje. Esta implicación ha llevado a una estandarización en la comunidad científica de los paradigmas experimentales. (pedazo frase esta última que no hay por dónde cogerla…viene a decir algo así como que todos los científicos utilizan más o menos los mismos experimentos a la hora de realizar sus estudios. El libro habla sobre la Paloma en su caja de Skinner típica que dependiendo del botón que pulse recibirá alimento o no…) Demostración de la generalidad de los fenómenos de aprendizaje Es importante tener en mente que la adopción de la perspectiva de proceso general no prueba la generalidad de los procesos de aprendizaje. Una teoría general no puede verificarse empíricamente utilizando unos pocos paradigmas experimentales estandarizados. La generalidad del aprendizaje debe probarse realizando estudios en distintas especies y situaciones.

Page 9: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 1: INTRODUCCIÓN

E) USO DE ANIMALES NO HUMANOS EN LA INVESTIGACIÓN SOBRE APRENDIZAJE. Razones del uso de animales no humanos en la investigación sobre aprendizaje Con los animales de laboratorio los científicos pueden estudiar cómo se aprenden las reacciones emocionales intensas. Sin embargo, con las personas, los investigadores se ven limitados a tratar de modificar las respuestas emocionales inadaptadas una vez que éstas ya han sido aprendidas. Para modificar esta respuesta tienen que comprender cómo se aprendió, y es por esta razón por la que se estudian las respuestas emocionales en los animales de laboratorio y extrapolan la conclusión a los seres humanos. Una de las preguntas fundamentales acerca de la naturaleza humana es cómo evolucionaron la cognición y la inteligencia. Por ello la investigación sobre la evolución de la cognición y la inteligencia se apoya fuertemente en estudios de aprendizaje realizado con animales. Ventajas de utilizar animales de laboratorio en lugar de personas

- Los procesos de aprendizaje suelen ser más simples - El comportamiento de los animales no se ve complicado por procesos

lingüísticos - No es necesario hacer peticiones explícitas a los sujetos - El investigador no debe preocuparse sobre si los actos de los participantes

no están influidos por el deseo de complacer al investigador. Los animales de laboratorio y la conducta normal La ética de la investigación con animales de laboratorio Han surgido reglas estrictas que obligan a los laboratorios a tratar bien a los animales. Sin embargo se olvida que aunque no existan estas reglas, los científicos siempre los tratarían bien, ya que la información extraída a partir de experimentos a animales enfermos o ansiosos no es fiable. Por lo tanto los propios científicos son los primeros interesados en el bienestar de sus sujetos experimentales. A veces los experimentos conllevan incomodidades, como la privación de comida o estimulos aversivos. Algunos temas importantes, como el castigo o el condicionamiento del miedo no pueden estudiarse sin alguna incomodidad por parte del sujeto. Los estudios de aprendizaje del miedo utilizan a menudo descargas eléctricas, pero de baja intensidad.

Page 10: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 1: INTRODUCCIÓN

¿Qué constituye un trato humano a los animales? Asumiendo que una especie merece el trato que establezcan las normas oficiales, ¿cuáles deberían ser esas normas? A menudo se describe el “trato humano” como el tratamiento apropiado para los animales de laboratorio. Sin embargo las ratas prefieren vivir en madrigueras oscuras hechas de basura y los humanos en habitaciones limpias e iluminadas…y así es precisamente como se tiene a las ratas en los laboratorios. Quizá el “trato humano” que les damos no es precisamente el que las ratas preferirían… ¿Deben los seres humanos beneficiarse del uso de otros animales? Muchos animales domésticos también se benefician de la relación con los humanos, de hecho algunos no existirían. Se trata de una relación simbiótica. Además el uso de animales de laboratorio representa tan sólo una pequeña parte del uso que otros humanos hacen de los animales domésticos, incluyendo su uso como fuente de alimentación. Dato curioso: En 1997 se utilizaron en EEUU 8,5 mil millones de animales en alimentación. Sin embargo solo se utilizaron 8,5 millones en laboratorio. Esto tan sólo constituye un 0,1% del número total de animales empleados en ganadería. Si a estos datos sumamos el impacto en su habitat que tiene la construcción de carreteras, viviendas, etc o los miles de animales muertos por insecticidas, etc. La proporción de los utilizados en laboratorios es aún más insignificante. Alternativas a la investigación con animales Russell y Burch (1959) formularon las 3 “R” de la investigación con animales.

- Reemplazamiento del uso de animales por otras técnicas de estudio - Reducción del número de animales empleados por medio de técnicas estadísticas - Refinamiento de los procesos experimentales para causar menos sufrimiento

Algunas de las alternativas propuestas son las siguientes:

1. Técnicas observacionales: No se puede. Los estudios de aprendizaje requieren manipulaciones experimentales de la experiencia pasada.

2. Uso de plantas: No se puede estudiar el aprendizaje ya que carecen de sistema nervioso.

3. Cultivo de tejidos: El funcionamiento de estos procesos celulares en el organismo intacto solo puede estudiarse en el organismo intacto.

4. Simulaciones informáticas: La preparación de un programa informático que simule un fenómeno natural requiere un conocimiento profundo del fenómeno en cuestión. No pueden utilizarse para generar hechos anteriormente desconocidos sobre la conducta. Eso sólo puede hacerse estudiando a los organismos vivos.

Page 11: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 1: INTRODUCCIÓN

Conn y parker (1998): “los científicos dependen de los ordenadores para procesar los datos que ya poseen, pero no pueden usarlos para explorar lo desconocido en busca de nueva información” TÉRMINOS CLAVE Aprendizaje: Cambio duradero en los mecanismos de conducta que implica estímulos y/o respuestas específicos y que es resultado de la experiencia previa con esos estímulos y respuestas o con otros similares. Asociación: Conexión entre la representación mental de dos eventos (dos estímulos o un estímulo y una respuesta) de forma que la ocurrencia de uno de los eventos activa la representación del otro. Dualismo: Visión de la conducta según la cual las acciones pueden dividirse en dos categorías: conducta voluntaria controlada por la mente y conducta involuntaria controlada por mecanismos reflejos. Ejecución: Actividades de un organismo en un momento particular. Empirismo: Corriente filosófica según la cual todas las ideas de la mente tienen su origen en la experiencia. Fatiga: Disminución temporal de la conducta provocada por el uso excesivo o repetido de los músculos involucrados en ella. Hedonismo: Postura filosófica propuesta por Hobbes según la cual las acciones de un organismo están enteramente determinadas por la persecución del placer y la evitación del dolor. Maduración: Cambio en la conducta causado por el desarrollo físico o fisiológico del organismo en ausencia de experiencia con eventos particulares del ambiente. Innatismo: Postura filosófica según la cual los seres humanos nacen con ideas innatas. Nervismo: Postura filosófica adoptada por Pavlov según la cual todos los procesos conductuales y fisiológicos están regulados por el sistema nervioso. Reflejo: Mecanismo que permite que un evento específico del ambiente elicite una respuesta específica. Sílaba sin sentido: Combinación de 3 letras ( dos consonantes separadas por una vocal) sin significado.

Page 12: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 2: CONDUCTA ELICITADA – HABITUACIÓN Y SENSIBILIZACIÓN

A) LA NATURALEZA DE LA CONDUCTA ELICITADA Gran parte de la conducta de los animales tiene lugar como respuesta a estímulos, es decir, ocurre de forma elicitada. El concepto de reflejo

Un soplo de aire dirigido a la córnea provoca un parpadeo. Esto es un reflejo. Un reflejo se compone de dos elementos, un estímulo elicitante y su correspondiente respuesta. Estos dos elementos se comprenden bien mediante la organización del sistema nervioso. En los vertebrados los reflejos simples están mediados por 3 neuronas: Neurona sensorial (aferente): capta el estimulo ambiental y transmite el mensaje a la medula espinal. Neurona motora (eferente): Activa el músculo involucrado en la respuesta refleja. Interneurona: Neurona encargada de transmitir los impulsos entre los dos tipos de neuronas anteriores. Arco reflejo: Es el conjunto formado por la neurona sensorial, la interneurona y la neurona motora. En los vertebrados, el arco reflejo representa el numero mínimo de conexiones neuronales necesarias para que tenga lugar el acto reflejo. La mayor parte de los reflejos contribuyen al bienestar del organismo. Si pongo la mano en el fuego la quitaré rápidamente, de lo contrario me quedaría sin mano, algo malo para el organismo. Un reflejo importante en los recién nacidos es el reflejo de oclusión respiratoria: si algo (prendas, mucosidades) tapona la nariz del bebé, su reflejo será echar la cabeza hacia atrás buscando aire, si sigue sin encontrar aire comenzará a llorar, lo que provocará una expulsión vigorosa del aire eliminando cualquier obstrucción de las vias respiratorias. Esto es especialmente importante cuando le deis (me refiero a las mujeres) de mamar a vuestro bebé, ya que al no poder respirar por la boca (ya que está ocupada por el pezón) tendrá que respirar por la nariz y el resto del pecho no debe taponarla, de lo contrario empezará a llorar, no querrá comer y no sabréis porqué. Los consejos son gratis.

Page 13: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 2: CONDUCTA ELICITADA – HABITUACIÓN Y SENSIBILIZACIÓN

Pautas de acción modal Las pautas de acción modal (PAMs) son respuestas típicas de especies particulares. Como ejemplo tenemos la respuesta de succión en mamíferos a la hora de buscar alimento. El libro pone más ejemplos pero no los considero importantes y si los pusiera todos esto no sería un resumen. Con captar la idea es suficiente. Una de las características de las PAMs es que el umbral de estimulación necesario para que éstas se pongan en marcha varía en función de las circunstancias. El estímulo puede tener efectos diversos dependiendo del estado fisiológico del animal y de las acciones que haya realizado recientemente. Un pez espinoso no mostrará su respuesta sexual hasta que la hembra no haya terminado de construir el nido. De la misma manera que no nos lanzamos ante una persona del sexo opuesto en una primera cita, aunque el impulso inicial sea exactamente ese. Las PAMs fueron originariamente identificadas por los etólogos, científicos interesados en la evolución del comportamiento. Inicialmente eran conocidas como “pautas de acción fija” pero posteriormente se pensó que eran más bien variables, por lo que se aceptó el término “pautas de acción modal”. Estimulos elicitantes de las pautas de acción modal Un estímulo elicitante se identifica fácilmente cuando se trata de reflejos simples, ante un ruido mostraremos una respuesta de sobresalto. En cambio los estimulos elicitantes de las PAMs son más complejos. Como ejemplo hablaremos de la alimentación de la gaviota. Las crias picotean un punto rojo en el pico de su progenitor, lo cual hace que regurgite la comida para ellos. Ahora bien, qué es lo que provoca que las crias hagan este picoteo?? El color?? La forma?? La longitud del pico de sus progenitores?? Para hallar la solución a este problema hicieron experimentos y concluyeron que un objeto alargado (en forma de pico) apuntando hacia abajo y con un punto rojo, era lo que más elicitaba la conducta de los polluelos, es decir, lo que provocaba un picoteo más fuerte por parte de ellos. Los rasgos específicos que se requieren para elicitar la conducta de picoteo reciben colectivamente el nombre de estimulo señal o estimulo desencadenante. Un estímulo señal o desencadenante es suficiente para elicitar una pauta de acción modal, sin embargo una determinada pauta de acción puede estar controlada por varios rasgos del estímulo de forma aditiva. Además el estímulo que elicita con mayor efectividad la pauta de acción no tiene porqué ser el que ocurra con mayor probabilidad en condiciones naturales. Me da en la nariz que este último párrafo es importante.

Page 14: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 2: CONDUCTA ELICITADA – HABITUACIÓN Y SENSIBILIZACIÓN

Estimulos supranormales: Son estímulos inusualmente efectivos. Aquí volvieron a estudiar a las gaviotas, en concreto cuales eran los huevos que más protegían. Huevos verdes, grandes y moteados eran sus preferidos. Entonces los científicos crearon un super huevo verde artificial y lleno de motas que era mucho más efectivo que el natural a la hora de elicitar la respuesta de acción. La organización secuencial de la conducta Las respuestas no tienen lugar aisladas unas de otras sino que se organizan en secuencias de comportamiento funcionalmente efectivas. Para obtener comida una ardilla tiene que subir al arbol, alcanzar un fruto, romperlo, etc. Toda conducta dirigida a metas involucra secuencias de acciones sistemáticamente organizadas. Los etólogos denominaron conducta apetitiva a los primeros componentes de la secuencia del comportamiento y conducta consumatoria a los ultimos. Las conductas apetitivas son menos estereotipadas y dependen del entorno(una ardilla puede buscar comida de muchas formas, puede subir desde un arbol o saltar desde otro cercano) sin embargo las conductas consumatorias son especificas de cada especie y mucho más estereotipadas (roer, masticar, tragar). Pasando a los seres humanos, dependiendo de la etnia cocinamos la comida de forma diferente (conducta apetitiva) pero todos masticamos y tragamos de la misma forma (conducta consumatoria). Lo de masticar y tragar de la misma forma es cuestionable… Secuencia de respuestas de búsqueda de comida con el ejemplo de la ardilla. Modo de búsqueda general: Antes de que la ardilla pueda identificar un nogal se moverá buscando posibles fuentes de alimentación. Modo de búsqueda focalizada: Al encontrar un nogal pasará al modo focalizado en el que sólo buscará nueces en ese árbol. Modo de manipulación de alimento (o consumatorio): Obtener la nuez y masticarla. B) EFECTOS DE LA ESTIMULACIÓN REPETIDA Descartes pensaba que una respuesta elicitada ocurre automáticamente siempre que se presentara el mismo estímulo elicitante. Falso. Si esto fuera verdad un bebé chuparía siempre con la misma intensidad al presentarse un pezón. Por lo tanto la respuesta puede variar, y aquí es donde nos encontramos con uno de los rasgos más característicos de la conducta elicitada: su plasticidad. Y aquí es donde entendemos el título de este apartado: La conducta elicitada puede variar como resultado únicamente de la presentación repetida del estímulo elicitante.

Page 15: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 2: CONDUCTA ELICITADA – HABITUACIÓN Y SENSIBILIZACIÓN

Atención visual en los bebes humanos Aquí se habla de un experimento en bebés que visualizaban varios tableros de ajedrez y su respuesta de atención visual variaba dependiendo de la naturaleza del estímulo (había tableros de 4x4 y tableros de 12x12) y de la repetición del mismo. Conclusión: La atención visual provocada por un estímulo novedoso cambia a medida que el bebé se familiariza con el estímulo. Con un patrón 4x4 relativamente sencillo, la atención visual se reduce progresivamente. Con un patrón 12x12 más complejo, la atención se incremente inicialmente y después se reduce. Salivación y evaluación del sabor en humanos El sabor de la comida elicita la salivación como respuesta refleja. En un estudio se midió la respuesta de salivación de 8 mujeres ante el sabor del zumo de limón y el zumo de lima. La salivación como respuesta al sabor disminuía con cada ensayo, pero después de 10 ensayos con limón, se introducía lima en el ensayo 11 y los sujetos volvían a salibar de nuevo. Conclusión: (atención a esto que me parece bastante interesante) Los resultados indican que las personas encuentran el sabor de una comida específica menos placentera cuanto más la comen. Estos hallazgos sugieren que la sobrealimentación puede reducirse no variando los alimentos disponibles para su consumo. Respuesta de sobresalto en ratas La respuesta de sobresalto se da en muchas especies, incluida la humana. Consiste en un salto repentino y una contracción de los músculos de la parte superior del cuello. En las ratas puede medirse esta respuesta mediante la cámara estabilimétrica que mediante sensores mide la intensidad de la reacción de sobresalto. Se metía a las ratas en la cámara y mediante sonidos y luces se les daba sustos para medir su respuesta de sobresalto. Conclusión: Las repeticiones de los sustos generaban cada vez respuestas más débiles de sobresalto por parte de las ratas. (quizá porque las estaban matando poco a poco…es broma, esto es cosa mia) . Por el contrario cuando el sonido era más intenso, las repeticiones de tono provocaron reacciones de sobresalto cada vez más vigorosas.

Page 16: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 2: CONDUCTA ELICITADA – HABITUACIÓN Y SENSIBILIZACIÓN

C) LOS CONCEPTOS DE HABITUACIÓN Y SENSIBILIZACIÓN Efecto de habituación: Disminución de la tendencia a responder producido por la estimulación repetida. Efecto de sensibilización: Incremento en la tendencia a responder producido por la estimulación repetida.

Adaptabilidad y generalidad de la habituación y sensibilización En nuestro día a día estamos bombardeados por multitud de estímulos, olores, imágenes, texturas, etc. Los efectos de habituación y sensibilización nos ayudan a decidir qué estímulos ignorar y a cuáles responder, de lo contrario nuestra conducta sería desorganizada y caótica. Ejemplo: Hace dos años que me compré una vivienda en una urbanización, mi bloque en concreto da a una carretera bastante transitada. Al principio me costó acostumbrarme a dormir por las noches, hoy en día ni siquiera oigo los coches. Seguro que todos tenemos múltiples ejemplos sobre este tema. El libro pone más ejemplos pero creo que el concepto está bastante claro. Diferencias entre habituación, adaptación sensorial y fatiga La habituación no es el único efecto que da lugar a una disminución en la respuesta. Un reflejo también puede provocar una disminución en la respuesta. Recordemos que el reflejo consta de 3 componentes:

- Un estímulo que activa los órganos sensoriales - Interneuronas que transmiten los mensajes sensoriales a los órganos motores - Impulsos nerviosos que activan los músculos

Sin embargo, a pesar de todo esto, puede no darse una respuesta si por alguna razón los órganos sensoriales pierden temporalmente sensibilidad a la estimulación. Una persona puede quedar temporalmente cegada por una luz brillante (adaptación sensorial) y una respuesta tampoco tendrá lugar si los músculos involucrados quedan incapacitados por la fatiga. - La adaptación sensorial ocurre en los órganos sensoriales - La fatiga de la respuesta tiene lugar en los músculos efectores - La habituación y sensibilización tienen lugar en el sistema nervioso

Page 17: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 2: CONDUCTA ELICITADA – HABITUACIÓN Y SENSIBILIZACIÓN

¿Cómo distinguimos todo esto?

- La habituación se distingue de la adaptación sensorial en que la habituación es específica de la respuesta. Si el profesor da un aviso en medio del examen levantamos la vista por un momento pero luego la bajamos y podemos seguir escuchando lo que dice.

- La habituación se distingue de la fatiga en que la habituación es específica del estímulo. Esto se explica con el ejemplo de la salivación y el limón, cuanto más nos exponemos al limón, menos salibamos y menos notamos su sabor, pero si de repente nos introducen lima volvemos a recuperar la respuesta. La pérdida de respuesta no venía condicionada por la fatiga.

Teoría del proceso dual de habituación y sensibilización Y me da a mi que aquí se empieza a poner la cosa suave… Esta teoría fue formulada por Groves y Thompson (1970). La teoría del proceso dual presupone que los incrementos y disminuciones en la tendencia a responder a un estímulo son producto de procesos neurales diferentes. El proceso de habituación provoca una disminución en la tendencia a responder, en cambio, el proceso de sensibilización produce un incremento en la tendencia a responder. Sin embargo ambos procesos están relacionados y pueden estar activos al mismo tiempo ante un mismo estímulo. Linea Verde: Sensibilización Linea Roja: Habituación Linea Negra: NETO (resultado entre la verde y la roja) Linea Azul: Ni caso, es el eje 0

Cambio en la magnitud de la respuesta

Ensayos

+

-

0

Ensayos

+

-

0

Page 18: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 2: CONDUCTA ELICITADA – HABITUACIÓN Y SENSIBILIZACIÓN

Podemos observar que en el panel izquierdo una repetición hipotética del estímulo intensifica el proceso de habituación (la línea roja). Decimos que lo intensifica porque el Neto está más cerca de la línea roja. En el panel de la derecha ocurre lo contrario, el neto está mas cerca de la línea verde, lo cual indica que intensifica el proceso de sensibilización. Aquí es importante señalar que un aumento (sensibilización) o disminución (habituación) de la respuesta, viene dado por la suma resultado de los procesos de sensibilización y habituación juntos. No caigamos en el error de pensar que la sensibilización viene dada únicamente por el proceso de sensibilización, ya que el proceso de habituación también tiene su función. Groves y Thomson sugirieron que los procesos de habitación y sensibilización tienen lugar en diferentes partes del sistema nervioso:

- Proceso de habituación: tiene lugar en el sistema E-R (estimulo respuesta) - Proceso de sensibilización: tiene lugar en el sistema de estado. Este

sistema abarca otras partes del sistema nervioso que determinan el nivel general de disposición a responder. Las drogas pueden alterar la tendencia a responder.

Implicaciones de la teoría del proceso dual

- El sistema E-R se activa siempre que un estímulo elicita una respuesta ya que es el circuito neuronal que lleva los impulsos desde la entrada sensorial hasta la salida conductual.

- El sistema de estado sólo interviene en circunstancias especiales. Algunos eventos externos (como un ruido intenso) pueden incrementar el estado de alerta del individuo y sensibilizar el sistema de estado.

La teoría del proceso dual de habituación y sensibilización ha tenido una gran influencia en el estudio de la plasticidad de la conducta elicitada. Pues sí, tenía razón, todo esto del proceso dual ha sido bastante suave… D) CARACTERÍSTICAS DE LA HABITUACIÓN Y SENSIBILIZACIÓN 1. Curso temporal

La mayor parte de los cambios conductuales se mantiene durante períodos largos. Curso temporal de sensibilización Por lo general los procesos de sensibilización tienen efectos temporales. En todos los sistemas de respuesta la duración de los efectos de sensibilización está determinada

Page 19: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 2: CONDUCTA ELICITADA – HABITUACIÓN Y SENSIBILIZACIÓN

por la intensidad del estimulo. Los estímulos más intensos producen mayores incrementos de la tendencia a responder y una sensibilización más persistente. Curso temporal de la habituación 2 tipos de efectos de habituación cualitativamente distintos:

- La habituación a corto plazo (desaparece en segundos o minutos) - La habituación a largo plazo (persiste durante muchos días)

Aquí es importante quedarnos con el concepto de: Recuperación instantánea: Recuperación de una respuesta habituada o de una respuesta extinguida tras un período de descanso. La recuperación instantánea es la característica principal del efecto de habituación a corto plazo. La habituación a corto plazo suele tener lugar cuando el estímulo elicitante se presenta frecuentemente. Por el contrario, la habituación a largo plazo es más probable cuando las presentaciones del estímulo están más separadas. 2. Especificidad del estimulo Especificidad del estimulo en la habituación La habituación es específica del estímulo que ha sido presentado repetidamente. Una respuesta a un estímulo previamente habituada puede manifestarse plenamente alterando alguna característica importante del estímulo. (si nos acostumbramos al sonido de un reloj que tengamos por casa poco a poco dejamos de oirlo, pero si de repente notamos que se rompe y hace un ruido diferente es probable que volvamos a prestar atención.) Generalización del estímulo de habituación: Seguimos con el ejemplo del reloj. Si nos habituamos a su sonido y nos presentan otro reloj diferente pero con un sonido similar, es posible que tampoco lo oigamos. Especificidad del estimulo de sensibilización La sensibilización no es muy específica del estímulo. Si un animal se activa o sensibiliza por alguna razón, su reactividad se incrementará para toda una variedad de estímulos, no sólo para el causante de su sensibilización.

Page 20: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 2: CONDUCTA ELICITADA – HABITUACIÓN Y SENSIBILIZACIÓN

3. Efecto de un estímulo externo intenso Deshabituación: Una respuesta habituada puede restablecerse sensibilizando al organismo con la exposición a un estímulo externo. Es importante tener en cuenta que la deshabituación hace referencia a la recuperación de la respuesta al estímulo previamente habituado. Con el ejemplo del ajedrez y los niños, cuando les habian mostrado el ajedrez 8 veces y ya prácticamente no le prestaban atención, de repente en la vez 9 se lo mostraron acompañado de un sonido. Esto les hizo recuperar parte de la atención en la vez 10 y 11. E) APLICACIÓN A LAS EMOCIONES Y LA CONDUCTA MOTIVADA Hasta ahora se ha hablado de cambios en la conducta con respuestas sencillas, ahora veremos las más complicadas como el miedo, euforia, terror, etc. Reacciones emocionales y sus efectos posteriores Solomon y Corbit destacaron que las reacciones emocionales intensas a menudo constan de dos fases. Una emoción tiene lugar durante la presentación del estímulo elicitante y la opuesta se observa cuando el estímulo desaparece. (efecto sedante, relajante y agradable del alcohol al principio, en contraposición al dolor de cabeza y nausea de la resaca). Otra característica de las reacciones emocionales es que cambian con la experiencia. La reacción primaria se hace más débil y su postefecto se hace más fuerte. (un bebedor habitual no queda tan debilitado por pocas cervezas pero sin embargo tendrá síntomas más agudos tras beber) Puede tener resacas más severas irritabilidad e incluso sufrir agitaciones alucinaciones o incluso delirius tremens. (Para quien le guste el cine, dos grandes películas de alcohólicos son “Días sin Huella” (Billy Wilder) y “Leaving Las Vegas” protagonizada por Nicholas Cage” En ambas películas podemos observar los estragos que hace el delirius tremens) Tolerancia a la droga: Habituación de la primera reacción a la droga También podemos encontrar esta misma analogía de dos procesos en el amor y el apego. Las parejas con el tiempo dejan de darse los signos de amor del principio e incluso dejan de sentir ese enamoramiento principal, debido a la habituación. Sin embargo cuanto más tiempo lleve una pareja junta, más difícil será la perdida de uno de ellos para el otro.

Page 21: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 2: CONDUCTA ELICITADA – HABITUACIÓN Y SENSIBILIZACIÓN

La teoría del proceso oponente Esta teoría se diseñó para explicar los 3 rasgos característicos de las emociones. (los vuelvo a poner a continuación pero básicamente se han explicado a lo largo del punto anterior)

1. Las reacciones emocionales son bifásicas; a una reacción primaria sigue un postefecto opuesto.

2. La reacción primaria de debilita con la estimulación repetida. 3. El debilitamiento de la reacción primaria va acompañado de un fortalecimiento

del postefecto.

La teoría asume que los mecanismos neurofisiológicos involucrados en la conducta emocional tratan de mantener la estabilidad emocional, se trata de minimizar las desviaciones intentando volver a la neutralidad de nuestro estado emocional. Por esta razón decimos que es una teoría homeostática. La teoría asume que un estímulo emocional activador desvía de la neutralidad el estado emocional de una persona. Se asume que este desplazamiento con respecto a la neutralidad emocional pone en marcha un proceso oponente (contrario) que compensa el cambio). Me pongo súper contento con el alcohol…mi mecanismo neurofisiológico detecta que esto no es normal y me provoca una resaca de cojones para volver a mi estado normal. Y según esto y siguiendo con la teoría… Encontramos dos tipos de procesos: Proceso primario o proceso a: Es el responsable de la naturaleza del estado emocional que tiene lugar en presencia del estímulo (la alegría). Proceso oponente o proceso b: Es el que genera la reacción emocional opuesta (por ejemplo tristeza). Más que con la resaca quizá esto tenga más relación con el “bajón” emocional que algunas personas sufren al día siguiente de haber tenido una borrachera. El proceso oponente es ligeramente ineficiente ya que no logra contrarrestar del todo al proceso primario. Sin embargo con la repetición logramos una sensibilización de este proceso y por lo tanto un mayor efecto. (lo que hemos hablado antes de resacas más fuertes en bebedores habituales). Los dos mecanismos que vienen a continuación son un cacao de narices a primera vista (por lo menos para mi) … pero tras unos minutos analizando los gráficos de la página 54 y 55 del libro no son tan difíciles. En la siguiente hoja doy una pequeña ayuda sobre cómo leer esos gráficos.

Page 22: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 2: CONDUCTA ELICITADA – HABITUACIÓN Y SENSIBILIZACIÓN

Mecanismos oponentes durante la exposición inicial al estímulo En la primera presentación del estímulo el proceso b no es lo suficientemente fuerte para compensar por completo la respuesta emocional primaria, que persiste mientras esté presente el estímulo elicitante. Cuando el estímulo se retira, el proceso a se detiene rápidamente pero el proceso b permanece por algún tiempo y se hace evidente por primera vez. Mecanismos oponentes tras la exposición prolongada al estímulo El proceso b se fortalece con la exposición prolongada al estímulo, por el contrario se asume que el proceso a permanece inalterado. Por tanto, tras la presentación repetida de un estímulo, la respuesta emocional primaria queda compensada de forma más efectiva por el proceso oponente. Ayuda para comprender los gráficos: La parte de arriba del gráfico es la conducta observable de la persona, y la parte de bajo son los mecanismos oponentes que están por debajo de la conducta y no se ven. Si lo viéramos desde el punto de vista matemático, la parte de arriba es el resultado (es lo que vemos) mientras que la parte de bajo es la suma y la resta (que no observamos) pero que dan lugar al resultado. Si miráis las líneas, realmente parece que las dos líneas de bajo (a y b) dan como resultado la línea superior (a-b). Espero haberos ayudado…he sido lo más explícito posible. Motivación y postefecto oponente Si los consumidores habituales de drogas cada vez notan menos placer al consumirlas ¿porqué se hacen adictos? La teoría del proceso oponente sugiere que la adicción a las drogas es un intento de reducir la aversión producida por el postefecto afectivo de las drogas (bajón, irritabilidad, malestar). Hay dos formas de reducir el postefecto, una es simplemente esperar a que pase el efecto oponente (pasar el mono) pero muchas veces el mono es tan largo que la otra forma de pasarlo es volver a consumir la droga. Este mecanismo es lo que hace que la gente se haga adicta, no por el placer directo que obtienen de la droga, sino para reducir los efectos de retirada. Valoración general de la teoría del proceso oponente Esta teoría no ha conseguido explicar tantas cosas como prometía. Lo más destacable es que ha supuesto una importante contribución al aplicar el concepto de regulación homeostática al análisis de las emociones y la motivación.

Page 23: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 2: CONDUCTA ELICITADA – HABITUACIÓN Y SENSIBILIZACIÓN

Variaciones en la conducta dirigida a metas Responder para escapar de la molestia producida por la retirada de un estímulo es solo uno de los tipos de conducta motivada o dirigida a metas. En los siguientes temas veremos más ejemplos de este tipo de conductas, prestando especial atención a las situaciones en las que los individuos dan una respuesta para alcanzar un estímulo gratificante. Este objeto meta recibe el nombre de reforzador. TÉRMINOS CLAVE Adaptación sensorial: Reducción temporal en la sensibilidad de los órganos sensoriales provocada por la estimulación repetida o excesiva. Arco reflejo: Estructura neural que consiste en una neurona aferente (sensorial), una interneurona y una neurona eferente (motora) y que permite que un estímulo pueda elicitar una respuesta refleja. Conducta apetitiva: Conducta que tiene lugar al principio de una secuencia natural de conducta y que sirve para poner al organismo en contacto con un estímulo desencadenante. Conducta consumatoria: Conducta que lleva a consumar o completar una secuencia natural de conducta. Las respuestas consumatorias son, por lo general, patrones de acción modal específicos de la especie. Deshabituación: Recuperación de una respuesta habituada como resultado de la presentación de un estímulo externo e intenso. Efecto de habituación: Disminución progresiva en el vigor de la conducta elicitada que puede tener lugar con la presentación repetida del estímulo elicitante. Efecto de sensibilización: Incremento en el vigor de la conducta elicitada que puede resultar de la presentación repetida del estímulo elicitante o de la exposición a un estímulo externo intenso. Estímulo desencadenante: Lo mismo que estímulo señal Estímulo señal: Rasgo específico de un objeto o animal que elicita una pauta de acción modal en otros organismos. También llamado estímulo desencadenante. Estímulo supranormal: Estímulo señal artificialmente agrandado o exagerado que elicita una respuesta inusualmente vigorosa. Fatiga: Disminuación temporal de la conducta causada por el uso repetido o excesivo de los músculos involucrados en la conducta.

Page 24: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 2: CONDUCTA ELICITADA – HABITUACIÓN Y SENSIBILIZACIÓN

Interneurona: Neurona de la médula espinal situada entre la neurona aferente (o sensorial) y la neurona eferente (o motora) en el arco reflejo. Modo de búsqueda focalizada: Segundo componente de la secuencia de conducta de alimentación, tras la búsqueda general, en el que el organismo pone en marcha una conducta centrada en la localización de un estímulo particular que indica la presencia de alimento. La búsqueda focalizada es una forma de conducta apetitiva más directamente relacionada con el alimento que la búsqueda general. Modo de búsqueda general: Primer componente de la secuencia de conducta de alimentación, en la que el organismo pone en marcha una conducta motora sin dirección fija. La búsqueda general es una forma de conducta apetitiva. Modo de manipulación del alimento: Último componente de la secuencia de conducta de alimentación en el que el organismo manipula y consume el alimento. Es similar a lo que los etólogos llaman conducta consumatoria Neurona aferente: Neurona que transmite mensajes de los órganos de los sentidos al sistema nervioso central. También recibe el nombre de neurona sensorial. Neurona eferente: Neurona que transmite los impulsos a los músculos. También llamada neurona motora. Neurona motora: Lo mismo que neurona eferente. Neurona sensorial: Lo mismo que neurona aferente. PAM: Abreviatura de pauta de acción modal. Pauta de acción modal: Patrón de la respuesta exhibido de forma similar por la mayoría de los miembros de una misma especie. Las pautas de acción modales utilizan como unidades básicas de conducta en las investigaciones etológicas del comportamiento. Proceso a: Lo mismo que proceso primario en la teoría del proceso oponente de la motivación. Proceso b: Lo mismo que proceso oponente en la teoría del proceso oponente de la motivación. Proceso de habituación: Mecanismo neural activado por la repetición de un estímulo que reduce la magnitud de las respuestas elicitadas por ese estímulo. Proceso de sensibilización: Mecanismo neural que incrementa la magnitud de las respuestas elicitadas por un estímulo.

Page 25: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 2: CONDUCTA ELICITADA – HABITUACIÓN Y SENSIBILIZACIÓN

Proceso oponente: Mecanismo compensatorio que tiene lugar en respuesta al proceso primario elicitado por eventos biológicamente significativos. El proceso oponente provoca cambios fisiológicos y conductuales opuestos a los que provoca el proceso primario. Proceso primario: Primer proceso elicitado por un evento biológicamente significativo. Recuperación espontánea: Recuperación de una respuesta habituada o de una respuesta extinguida tras un período de descanso. Reforzador: Estímulo cuya administración inmediatamente posterior a una respuesta incrementa la probabilidad futura de dicha respuesta. Sistema de estado: Estructuras neurales que determinan el nivel general de responsividad o tendencia a responder del organismo. Sistema E-R: Ruta neural más corta que conecta los órganos sensoriales estimulados por un estímulo elicitante con los músculos involucrados en la producción de la respuesta elicitada. Tolerancia a la droga: Reducción en la efectividad de una droga como resultado del uso repetido de la droga.

Page 26: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 3: CONDICIONAMIENTO CLÁSICO – FUNDAMENTOS

A) LOS PRIMEROS AÑOS DEL CONDICIONAMIENTO CLÁSICO Los primeros estudios comenzaron con el trabajo de Pavlov. Otro científico llamado Edwin B. Twitmyer también lo descubrió de manera independiente a Pavlov. Los estudios de Pavlov sobre el condicionamiento clásico fueron una extensión de su investigación sobre el proceso de digestión. Experimentaba mucho con perros. Los técnicos de su laboratorio pronto descubrieron que los perros secretaban jugos gástricos en respuesta a la mera visión de la comida o de la persona que los alimentaba. Llamaron a estos jugos “secreciones psíquicas” Los descubrimientos de Vul´fson y Snarskii Fueron los primeros en estudiar el condicionamiento clásico en el laboratorio de Pavlov. Siguieron experimentando con los perros y su salivación. Estímulos orofaringeos: Algunas sustancias provocan en la boca sensaciones de textura y sabor características. Estas sensaciones reciben el nombre de estímulos orofaringeos. Los perros salivaban cuando se les ponía arena en la boca, posteriormente la sola visión de la arena les hacía salivar. Este tipo de aprendizaje se denomina aprendizaje de objeto ya que requiere asociar diferentes características de un mismo objeto. El paradigma de condicionamiento clásico El procedimiento de Pavlov constaba de dos estímulos: -Luz que no provoca salivación al principio del experimento. Se trata del estímulo condicional ya que su efectividad depende de su emparejamiento con el ácido. Provoca una respuesta condicional -Solución ácida situada en la boca. Se trata del estímulo incondicional ya que no depende de nada para producir saliva. Provoca una respuesta incondicional. B) LOS PRIMEROS AÑOS DEL CONDICIONAMIENTO CLÁSICO Condicionamiento del miedo Watson y Rainer (1920). Pensaban que los niños estaban muy limitados para dar respuestas emocionales distintas. Se dieron cuenta que mediante el condicionamiento clásico podían “despertar” este abanico de emociones. Y no tuvieron mejor cosa que hacer que condicionar la respuesta de miedo a un niño de 9 meses ante la presentación de una rata blanca. Le ponían la rata delante y hacían sonar justo detrás de su cabeza una barra de hierro muy fuerte y se asustaba, al poco tiempo la sola presencia de la rata hacia que se asustase. Este miedo se generalizó a otros objetos peludos como un conejo, un abrigo de piel o un mascara de santa Claus.

Page 27: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 3: CONDICIONAMIENTO CLÁSICO – FUNDAMENTOS

Más tarde se dieron cuenta que quizá no era tan buena idea estudiar el condicionamiento del miedo en seres humanos, probablemente por los graves trastornos psicológicos que sufrirían los pacientes. Entonces comenzaron a utilizar ratas y descargas eléctricas en las patas como estímulo incondicional aversivo. Ante una descarga eléctrica la rata se paraliza por el miedo. Sin embargo para medir la respuesta de miedo utilizaban la técnica REC (respuesta emocional condicionada). Para explicar en qué consiste el REC en un experimento concreto con ratas, el libro lo hace un poco lioso desde mi punto de vista. Lo explicaré por puntos porque es muy fácil:

1. Se enseña a las ratas a presionar una palanca para obtener comida 2. Se muestra un EC (estimulo condicionado) que puede ser una luz o un pitido seguido de

una descarga eléctrica. 3. La rata se paraliza y no puede acceder a la palanca. 4. Finalmente la sola presencia del EC (sin la descarga) hace que la rata se paralice.

Para ponerle números a todo esto se calcula algo llamado “Razón de supresión” Razón de supresión = Respuestas durante EC (Respuestas durante EC + Respuestas durante Pre – EC) Entendiendo por “respuestas” el número de presiones de la palanca. Cuanto menor es la razón de supresión, menor es la respuesta del animal. Entendiendo por razón de supresión = 0 una parálisis total de su respuesta. Aparte del experimento de la palanca también utilizaban la supresión condicionada del lameteo en el cual ratas sedientas bebían de un tubo que desprendía agua y mediante el EC se paralizaban y no bebían. Condicionamiento del parpadeo Conocido como reflejo palpebral.

1. Presentación de un estímulo condicionado – Tono 2. Soplo de aire a los ojos – estímulo incondicionado – Se produce el parpadeo. 3. El sujeto aprende a parpadear ante la sola presencia del estímulo condicionado

Ejemplo con niños de 5 meses. Se crearon 2 grupos. En un primer grupo hubo un tono seguido de un soplo de aire. En el segundo grupo hubo mayor intervalo de tiempo entre el tono y el soplo de aire, por lo tanto ambos estímulos no quedaban emparejados. Conclusiones:

a) Para que se produzca condicionamiento clásico debe haber emparejamiento entre EC y EI.

b) b) El aprendizaje inicial puede no ser directamente observable.

Page 28: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 3: CONDICIONAMIENTO CLÁSICO – FUNDAMENTOS

Recuadro 3.2 El condicionamiento palpebral y la búsqueda del engrama Aviso a navegantes: Debido al carácter explicativo y ejemplificativo de los recuadros, es realmente difícil resumir de la misma manera que el resto del texto, ya que todo parece importante y existe una cantidad de datos por m2 abrumadora. Asi que toca leerlos con calma. De todas maneras intentaré extraer los puntos esquemáticos más importantes. Cuando un organismo aprende algo, la red de neuronas que almacena esta nueva información se llama engrama. ¿Dónde se encuentra el engrama? Richard Thompson ha buscado la respuesta durante casi 4 décadas. La búsqueda del engrama comenzó por el hipocampo. Sin embargo comprobaron en animales que si les extirpaban el hipocampo la capacidad de aprendizaje condicionado no se alteraba. Entonces concluyeron que el engrama se encontraba en el cerebelo … Y a partir de aquí todo se complica y no queda más remedio que echarle unos minutos para leer con tranquilidad la página 68 mientras que al mismo tiempo se analiza el gráfico de la 69. Estímulo incondicionado – La señal llega al cerebelo a través de fibras trepadoras Estímulo condicionado – La señal llega al cerebelo a través de fibras musgosas Seguimiento del signo Pavlov pensaba que el condicionamiento solo se daba en sistemas de respuesta reflejos, sin embargo después apareció el paradigma de seguimiento del signo o automoldeamiento que explicaba cosas diferentes. Los animales se aproximan a estímulos que señalan la disponibilidad de alimento. Un halcón predice que puede alimentarse al ver el movimiento de un ratón. ¿Cómo comprobaban el seguimiento del signo en el laboratorio? Con Palomas dentro de una caja. Había una tecla (EC) que se iluminaba durante 8 segundos y a continuación se administraba comida (EI) en un pequeño comedero (no era necesario pulsar la tecla para administrar comida, ya que el procedimiento era automático). Sin embargo con las repeticiones, cada vez que la tecla se encendía, las palomas picoteaban la tecla. En otro experimento la tecla y la comida estaban bastante alejados, y la comida se presentaba solo durante poco tiempo, por lo cual la paloma tenía que ser rápida para poder comer. Sin embargo cada vez que la tecla se encendía, la paloma corría a picotear la tecla (totalmente innecesario) y luego corría hacia el comedero. Podía haberse quedado esperando todo el tiempo delante del comedero sin necesidad de moverse de un lado para otro, pero este experimento demuestra que tenían una atracción irresistible a las señales de comida condicionadas clásicamente, es decir, a la tecla (EC).

Page 29: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 3: CONDICIONAMIENTO CLÁSICO – FUNDAMENTOS

Aprendizaje de aversión al sabor El acto de comer proporciona numerosas oportunidades para el aprendizaje de asociación. La aversión a un sabor puede aprenderse si la ingestión de un sabor nuevo va seguida de enfermedad o de otras circunstancias negativas. Por el contrario la preferencia por un sabor va acompañada de sensaciones de saciedad u otras circunstancias positivas. En el caso de aversión a un sabor por haber enfermado, lo curioso es que el 20% de los casos las personas estaban seguras que su enfermedad no tenía que ver con la comida, y sin embargo le cogieron aversión. Esto demuestra que el aprendizaje de aversión al sabor es independiente de los procesos racionales. Como ejemplo se investigó que pacientes con cancer desarrollaban aversión a comidas que tomaban antes de una sesión de quimioterapia (estas sesiones suelen provocar vómitos y malestar). Otros trastornos como la anorexia nerviosa o la depresión severa pueden incrementar la capacidad de desarrollar aversión a la comida. Para probar esto en animales se les daba una comida con sabor distintivo (EC) y a continuación se les inyectaba una droga (EI) que les provocaba malestar. Características de la aversión al sabor

- Un único emparejamiento entre EC y EI puede provocar la aversión (eso también puede suceder con el aprendizaje del miedo). Sin embargo se necesitan más emparejamientos en el condicionamiento palpebral, el condicionamiento salival o el seguimiento del signo.

- Se produce aversión aunque la enfermedad se presente horas después de haber comido. Es lo que se conoce como “Aprendizaje demorado”.

Ejemplo del aprendizaje demorado en ratas: Se les daba a beber agua con sacarina y luego en diferentes grupos las sometían a radiación en intervalos de tiempo distintos. El grupo que se sometió a radiación 6 horas después de beber desarrolló mayor aversión al agua que el grupo que se le dio radiación 12 horas después y este a su vez mayor aversión que el grupo de las 24 horas. C) PROCEDIMIENTOS DE CONDICIONAMIENTO PAVLOVIANO EXCITATORIO Aquí el libro explica que todos los procedimientos de aprendizaje del punto anterior son ejemplos de condicionamiento pavloviano excitatorio. Y parece que este punto se va a centrar en analizar las características comunes de todos ellos para establecer leyes generales sobre este tipo de condicionamiento.

Page 30: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 3: CONDICIONAMIENTO CLÁSICO – FUNDAMENTOS

Procedimientos típicos de condicionamiento pavloviano Es muy importante la ordenación temporal del estímulo condicionado y el estímulo incondicionado. Intervalo entre ensayos: Tiempo entre el final de un ensayo de condicionamiento y el inicio del siguiente. Intervalo entre estímulos: Tiempo entre el EC y el IE. Para que haya respuesta de condicionamiento, el intervalo entre estímulos debe ser mucho menor que el intervalo entre ensayos. 5 procedimientos comunes de condicionamiento clásico (no sigáis leyendo sin mirar el gráfico de la página 75 porque os será muchísimo más fácil de entender)

1. Condicionamiento de demora corta: Se presenta el EC y al poco tiempo y sin que haya finalizado, se presenta el EI.

2. Condicionamiento de huella: Se presenta el EC y cuando ha acabado se presenta el EI. Al intervalo entre ambos se le llama intervalo de huella.

3. Condicionamiento de demora larga: Como el de demora corta pero el EC dura mucho más tiempo. Entonces se presenta el EI antes de que EC acabe.

4. Condicionamiento simultáneo: EC y EI se presentan a la vez. 5. Condicionamiento hacia atrás: Al revés que todos los anteriores. Se presenta el EI y

luego el EC. Medida de las respuestas condicionadas Ensayo de prueba: Ensayo en el que se presenta el EC sin el EI. Esto permite medir la respuesta condicionada en ausencia de la respuesta incondicionada. Son fundamentales en para evaluar el aprendizaje en el condicionamiento simultáneo y hacia atrás. Magnitud: Cantidad de conducta que tiene lugar (por ejemplo el número de gotas de saliva del perro de Pavlov) Fuerza de la respuesta: Se mide por la frecuencia con la que el EC provoca una respuesta condicionada. Muy relacionada con la probabilidad (cómo de probable es que el EC de una respuesta condicionada) Latencia: Cantidad de tiempo que pasa entre el principio del EC y la aparición de la respuesta condicionada. Procedimientos de control en el condicionamiento clásico En los primeros capítulos veíamos que los procedimientos de control de la habituación y la sensibilización eran muy simples ya que únicamente consistían en la ausencia de exposición al estímulo. Sin embargo los procedimientos de control del condicionamiento clásico con más complicados ya que se produce una asociación entre un EC y un EI y esto es más complejo de estudiar.

Page 31: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 3: CONDICIONAMIENTO CLÁSICO – FUNDAMENTOS

Pseudocondicionamiento: Casos en los que la mera exposición al Estímulo Incondicionado da lugar a respuestas similares a la respuesta condicionada. Es algo así como un falso condicionamiento. Si a un perro hambriento se le presenta comida (EI) puede incrementar la conducta provocada por un estímulo menos efectivo como un tono (EC), sin que se haya establecido ninguna asociación entre los dos estímulos. Para saber si se trata de un pseudocondicionamiento o realmente un condicionamiento clásico (asociación entre EC y EI) son necesarios los procedimientos de control. Control aleatorio: Procedimiento en el que los estímulos condicionado e incondicionado se presentan en momento aleatorios uno con respecto a otro. Sin embargo este tipo de control puede dar lugar a aprendizaje asociativo. Control desemparejado explícito: EC y EI se presentan lo suficientemente separados para evitar que se asocien. Eficacia de los procedimientos típicos de condicionamiento Trataban de averiguar cual de los 5 procedimientos de condicionamiento vistos en la hoja anterior daba más muestras de aprendizaje. Para ello lo primero que hay que tener en cuenta es el intervalo entre estímulos o intervalo EC-EI.

- Simultaneo: Poco condicionamiento en el condicionamiento simultaneo en los que el intervalo EC-EI es 0.

- Demora corta: facilita la respuesta condicionada - Demora larga: Disminuye la respuesta condicionada - De huella: Se genera un intervalo de huella. Al igual que en demora larga, cuanto

más separados están EC y EI, se produce menos condicionamiento. - Hacia atrás: Ofrece resultados ambiguos. Se ha observado condicionamiento

excitatorio o inhibitorio. Todo esto es de cajón, cuanto más separados en el tiempo estén dos estímulos, menos posibilidades hay de que yo los relacione, es decir, hay menos posibilidades de que se produzca condicionamiento. 2 ideas que debemos recordar a modo de conclusión: - El condicionamiento es más efectivo cuando el EC es una buena señal de que el EI aparecerá pronto. - Se produce mejor condicionamiento cuando el intervalo EC-EI es corto. Hipótesis de codificación temporal: El sujeto no sólo aprende a relacionar EC y EI, sino que dependiendo del procedimiento utilizado (de los 5 que hemos visto) también aprenderá cúando en el tiempo va a ocurrir EI. (esto se verá en profundidad en el tema 4)

Page 32: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 3: CONDICIONAMIENTO CLÁSICO – FUNDAMENTOS

D) CONDICIONAMIENTO PAVLOVIANO INHIBITORIO Este tipo de condicionamiento pretende predecir la ausencia del estímulo incondicionado. ¿Porqué nos interesa predecir la ausencia de algo? Por ejemplo para los ataques de pánico. Está demostrado que las personas que saben cuándo van a tener uno de estos ataques, su nivel de ansiedad desciende después de tenerlo. Por el contrario los ataques imprevisibles hacen aumentar el nivel de ansiedad. Estímulos condicionados inhibitorios: Señales que predicen la ausencia de un estímulo aversivo. Procedimientos de condicionamiento inhibitorio (con calma) El condicionamiento excitatorio puede proceder sin condiciones previas especiales, sin embargo para que se dé el condicionamiento inhibitorio hay un requisito importante: el EI debe ocurrir periódicamente en la situación. Si vamos a una gasolinera esperamos encontrar gasolina (EI) sin embargo si vemos el cartel “No hay gasolina” nos sentiremos frustrados. En este ejemplo el cartel es una señal de condicionamiento inhibitorio. Procedimiento estándar de inhibición condicionada (gráfico pág 82) Este procedimiento consta de dos ensayos diferentes que se intercalan. Ensayo A (condicionamiento excitatorio)

- Tenemos un EC+ y un EI. Es un ensayo de tipo excitatorio como los que vimos al principio. El Estímulo incondicionado ocurre inmediatamente después del estímulo condicionado y de esta manera quedan asociados. (ponemos un signo positivo al EC+ para diferenciarlo del estímulo inhibitorio (EC-) que vemos en el siguiente ensayo)

Ensayo B (condicionamiento inhibitorio)

- A diferencia del ensayo A, aquí no se presenta el EI. Tan sólo tenemos un EC+ y un EC- que se presentará en el contexto excitatorio proporcionado por el EC+. Pero no se empareja con el EI. Por lo tanto decimos que el EC- es un inhibidor condicionado.

No nos confundamos al pensar que el procedimiento estándar de inhibición condicionada consta de dos tipos distintos de ensayo, sino que los dos ensayos forman parte del mismo procedimiento. Es decir, el procedimiento siempre va a constar de dos fases, una fase inicial en la que creamos un condicionamiento excitatorio y una segunda fase en la que utilizamos el condicionamiento de la fase anterior para construir la inhibición.

Page 33: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 3: CONDICIONAMIENTO CLÁSICO – FUNDAMENTOS

Contingencia o correlación negativa entre el EC y el EI (gráfico pág 83) Una contingencia o correlación negativa indica que el EI es menos probable tras el EC que en otro momento. En el gráfico podemos observar que la presencia de EC predice la ausencia del EI durante un tiempo. En este tipo de procedimiento, el EI aversivo puede aparecer de vez en cuando tras el EC, pero con una probabilidad pequeña. Medición de la inhibición condicionada La inhibición condicionada produce cambios en la conducta observable, pero ¿Cómo podemos observar estos cambios? Hay 3 métodos

A) Sistemas de respuestas bidireccionales Se puede medir fácilmente en aquellos sistemas que tengan una línea base. El ritmo cardiaco o la respiración nos permite saber si sus valores suben o bajan, o un animal que se acerca o se aleja de un estímulo. En estos casos la excitación condicionada da lugar a un cambio conductual en una dirección y la inhibición condicionada la lugar a un cambio en la dirección opuesta. Limitaciones

- Sólo funciona con respuestas que pueden ir en direcciones opuestas. - Sólo muestra el efecto neto (resultado) entre la excitación y la inhibición.

B) La prueba del estímulo compuesto o sumación

Volviendo al ejemplo del conejo y el parpadeo: Si hemos condicionado un estímulo para inhibir la respuesta de parpadeo, obviamente no lo veremos parpadear, entonces ¿cómo podemos medir la eficacia que tiene nuestro estímulo inhibidor? Mediante la “Prueba de sumación o del estímulo compuesto” La prueba de sumación implica la presentación de dos estímulos, un EC+ y un EC- juntos. La idea es que cada estímulo produce su propia reacción asociativa (excitación e inhibición) y que cada reacción se suma de forma algebraica. Puesto que son procesos antagónicos, la asociación inhibitoria suprime la excitatoria. Este efecto se cuantifica midiendo la fuerza del estímulo condicionado excitatorio (EC+) sin emparejar, evaluándolo de nuevo en combinación con el estímulo condicionado inhibitorio (EC-), y calculando después la diferencia. Si un EC- carece de fuerza inhibitoria, se observa toda la fuerza de la reacción excitatoria en ambos casos. Sin embargo, si el estímulo condicionado inhibitorio es fuerte (produce RC inhibitoria), se observa una disminución del nivel de excitación del EC+ al presentar los estímulos simultáneamente

Page 34: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 3: CONDICIONAMIENTO CLÁSICO – FUNDAMENTOS

C) La prueba del retraso en la adquisición

Si un estímulo inhibe de forma activa una respuesta particular, entonces debería ser especialmente difícil de condicionar ese estímulo para que provoque la conducta. Es decir, la velocidad de adquisición de una respuesta excitatoria debería disminuir si el EC es un inhibidor condicionado. Sin lugar a dudas estos 3 métodos que acabamos de ver sobre inhibición condicionada es lo que más me ha costado comprender desde que me he puesto a estudiar esta asignatura. Tendré que pegarle un repaso profundo de cara al examen. E) PREDOMINIO DEL CONDICIONAMIENTO CLÁSICO Aparece con mayor probabilidad cuando un evento predice a otro regularmente y con una demora corta entre el EC y el EI. Un área de investigación importante es cómo las personas llegan a considerar que un evento es la causa de otro. Hay una gran concordancia en los resultados de los experimentos sobre juicios de causalidad y los de condicionamiento pavloviano. Por lo tanto los mecanismos asociativos de Pavlov pueden tener un papel importante en nuestras vidas (y no solo en la de los perros) Algunos ámbitos de la vida en los que se desarrolla el condicionamiento de Pavlov: - Aversiones y preferencias alimenticias - Adquisición de miedos. - Tolerancia y adicción a las drogas - Respuestas de los niños y de las madres durante la lactancia - Situaciones sexuales

Page 35: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 4: CONDICIONAMIENTO CLÁSICO – MECANISMOS

A) ¿A QUÉ DEBEN SU EFICACIA LOS ESTÍMULOS CONDICIONADOS E INCONDICIONADOS? Respuestas iniciales a los estímulos Pavlov: El EC inicialmente no provoca la respuesta condicionada pero adquiere la capacidad de hacerlo como resultado del desarrollo de una asociación con el EI. Sin embargo la identificación de EC y EI es relativa ya que un evento puede servir de EC respecto a un estímulo y de EI respecto a otro. En experimentos con ratas la sacarina es un EC si posteriormente se inyecta una droga que produce malestar (EI), entonces las ratas aprenden a no tomar la sacarina. Sin embargo en un experimento en el que se proyecta una luz (EC) justo antes de suministrar sacarina (EI) las ratas aprenden a acercarse a la luz cada vez que aparezca. Por lo tanto esto es un ejemplo de que un estímulo (sacarina) puede actuar como condicionado o incondicionado, dependiendo de su relación con el otro estímulo. La novedad de los estímulos condicionados e incondicionados Cuando los estímulos son novedosos, el aprendizaje se desarrolla más rápido. A la hora de experimentar sobre la novedad o familiaridad de los estímulos, se realiza en dos fases:

a) Se expone repetidamente a los sujetos al estímulo que luego será EC. b) EC se empareja con un EI

Sin embargo se observa que la familiaridad que el sujeto tiene con EC (ya que se le ha repetido muchas veces en la fase a) hace que el emparejamiento con el estímulo incondicionado sea más lento. Este fenómeno se denomina efecto de preexposición al EC o efecto de Inhibición latente. La Habituación sirve para sesgar la conducta elicitada a favor de los estímulos novedosos. La Inhibición latente sirve para sesgar el aprendizaje a favor de los estímulos novedosos. Es la habilidad de inconscientemente ignorar los estímulos que son percibidos como irrelevantes para lo que uno necesita. (¿alguien veía Prison Break? En la serie el protagonista sufre de un trastorno llamado Inhibición latente baja, al ser baja él no ignoraba absolutamente ningún estímulo y por eso era tan máquina y tan detallista a la hora de construir cosas o trazar planes. Supongo que en la vida real este trastorno no debe ser tan beneficioso para quien lo sufra como lo pintan en la serie) Si el experimento lo hacemos con un EI, el resultado es el mismo. Quien estaba familiarizado con el estímulo incondicionado tardará más en relacionarlo con el EC. Esto recibe el nombre de Efecto de preexposición al EI.

Page 36: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 4: CONDICIONAMIENTO CLÁSICO – MECANISMOS

2 Mecanismos para explicar los dos efectos de preexposición Interferencia asociativa: Las preexposiciones a EC o EI disminuyen la capacidad de estos estímulos para participar en nuevas asociaciones. Interferencia de memoria: Los participantes recuerdan que en la fase “a” el estímulo se les presentada aislado y este recuerdo altera la respuesta condicionada. Intensidad y saliencia del EC y del EI La intesidad de los estímulos es una variable importante que recibe el nombre de saliencia del estímulo. El aprendizaje se llevará a cabo de manera más rápida cuanto mayor sea la saliencia del estímulo. Ratas con deficit nutricional de sal prestan más atención al sabor de la sal (aquí se ha aumentado la saliencia del estímulo en relación a las necesidades biológicas del organismo). Relevancia o pertinencia EC – EI Es otra variable que afecta a la velocidad de aprendizaje del condicionamiento clásico La relevancia es el grado en el que el EC es relevante con respecto al EI. En un ambiente natural, es normal que las ratas enfermen tras tomar un alimento en mal estado. También es normal que sufran algún daño tras ser perseguidas por un animal al que pueden oir. Ambas hipótesis son trasladadas al laboratorio donde se ponen en práctica para demostrar la relevancia Hipótesis 1: Daño por animal al que pueden oir Experimento A- Ratas lamiendo agua salada + luz que acompaña al lameteo = descarga eléctrica Luego se repetía el proceso pero cada estímulo por separado: B- Ratas lamiendo agua salada + ausencia de luz = descarga eléctrica C- Ratas lamiendo agua sin sabor + luz que acompaña al lameteo= descarga eléctrica La medición del aprendizaje se hacía midiendo la supresión de volver a beber. (es decir, cual de los dos estímulo hará que la rata tenga menos tendencia a beber) Conclusión: Demostraban mayor supresión con el estímulo audiovisual. Hipótesis 2: Enfermar tras tomar un alimento en mal estado Lo mismo que antes pero en lugar de la descarga eléctrica se las hacía enfermar con drogas. La conclusión es que haciéndolo de esta manera demostraban mayor supresión al estímulo gustativo. Todo esto de la relevancia tiene mucho que ver con la naturaleza y con la predisposición genética. A la hora de aprender relaciones entre estímulos, no hay que olvidar las leyes naturales, ya que pueden influir en nuestro aprendizaje. El libro pone unos cuantos ejemplos más sobre palomas y monos.

Page 37: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 4: CONDICIONAMIENTO CLÁSICO – MECANISMOS

Recuadro 4.1 Aproximaciones conductuales al control del tabaquismo Destacar que las técnicas más efectivas para dejar de fumar son aquellas en las que el estímulo aversivo es “relevante” en relación a la situación. El concepto de fuerza biológica La fuerza biológica es la fuerza que tiene cada estímulo (EC y EI) ante nosotros por naturaleza. Pavlov sugirió que para que un estímulo se condicionara debía tener una fuerza biológica menor que el estímulo incondicionado. Condicionamiento de orden superior (es como un condicionamiento al cuadrado. Aquí se empieza a poner la cosa suave) Situación: a) Un tono se empareja fuertemente con la comida. b) La sola presencia del tono produce salivación. (condicionamiento de 1er orden) c) Empezamos a emparejar el tono (que produce salivación) con una luz d) Al final la sola presencia de la luz producirá salivación (condicionamiento de 2º orden) Podemos seguir y volver a la rata loca y emparejar la luz por ejemplo con un olor, (emparejamiento de tercer orden) Nomenclaturas para no liarnos EC1 (también EC+) =Es el primer estímulo condicionado, osea, el tono EC2 (también EC-) = Es el segundo estímulo condicionado, osea la luz. Recuadro 4.2 Condicionamiento de orden superior del miedo Los miedos irracionales suelen desarrollarse por medio del condicionamiento de orden superior. Se explica el ejemplo de una mujer con miedo a las multitudes cuyo miedo se extendió a otros estímulos en principio inocuos, como ir al cine. Contracondicionamiento Dos estímulos pueden quedar asociados el uno con el otro aunque ambos eliciten inicialmente respuestas intensas. La respuesta que un animal da a un EC se invierte o contrarresta emparejando ese estímulo con un EI que provoca una reacción opuesta. Precondicionamiento sensorial Se pueden aprender asociaciones entre estímulos que tan sólo elicitan una breve respuesta de orientación antes del condicionamiento. Si asociamos los sabores de canela y vainilla como algo que siempre va junto en los helados, y de repente nos sienta mal la canela, también rechazaremos la vainilla. Es parecido al condicionamiento de orden superior pero aquí hay cierta similitud en los estímulos (dos sabores). Por eso se llama “sensorial”, es decir, tus sentidos los perciben de manera similar.

Page 38: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 4: CONDICIONAMIENTO CLÁSICO – MECANISMOS

B) ¿QUÉ DETERMINA LA NATURALEZA DE LA RESPUESTA CONDICIONADA? El modelo de sustitución del estímulo A partir de ahora tanto EC como EI los voy a poner en negrita para diferenciarlos del determinante masculino “el” ya que lía un poco cuando va en mayúscula. Pavlov: Un EC adquiere la capacidad de funcionar de forma similar a como el EI lo hacía previamente. El EC activa los circuitos neuronales que previamente sólo activaba el EI. El EC se convierte en un sustituto del EI. eI EI como factor determinante de la RC Aquí habla de que la forma de la respuesta condicionada va a tener algo de relación con que tipo de EI haya. Ejemplo en Palomas Las Palomas abren el pico más cuando van a comer grano que cuando van a beber. EI = Grano EI = Agua EC= Tecla que se ilumina antes de dar agua o grano RC= Respuesta de picoteo a la tecla (este ejemplo lo vimos en un tema anterior) 2 grupos de Palomas, uno con agua y otro con grano. Se demostró que el grupo que había relacionado el grano con la tecla, picoteaba la tecla con el pico más abierto que el grupo que había relacionado la tecla con el agua (este grupo hacía una especie de movimiento de succión a la tecla). Por lo tanto dependiendo del EI (agua o grano) tendremos una RC (picoteo grande o succión) al EC (tecla) diferente. Aprendizaje y homeostasis: Un caso especial de sustitución del estímulo Como hablábamos en temas anteriores, homeostasis = equilibrio. La homeostasis se refiere a los mecanismos fisiológicos que mantiene los aspectos críticos del cuerpo dentro de los límites aceptables. Cualquier amenaza a nivel homeostático pone en marcha una reacción compensatoria que neutraliza la alteración. Esta reacción funciona por procesos de retroalimentación negativa (Walter Cannon). La exposición al frío produce escalofríos para incrementar la temperatura del cuerpo. Dworkin señaló que las alteraciones en la homeostasis pueden compensarse más efectivamente si pueden anticiparse. Si los sujetos pueden aprender qué claves señalan cuándo van a tener frío, pueden realizar ajustes compensatorios que se anticipen al frío. Esto recibe el nombre de respuesta homeostática condicionada. (a continuación vamos a relacionar este tipo de respuestas con la administración de drogas psicoactivas en sujetos. Particularmente el punto que viene a continuación me resulta muy interesante.)

Page 39: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 4: CONDICIONAMIENTO CLÁSICO – MECANISMOS

Las drogas suelen provocar alteraciones fisiológicas de la homeostasis que activan reacciones compensatorias condicionadas. Las claves que se asocian a esta alteración pueden elicitar estas reacciones compensatorias como respuestas condicionadas anticipatorias.

A) Proceso normal=Drogas - Alteración homeostasis – reacciones compensatorias condicionadas

Tomo la droga, me altera la homeostasis y eso provoca una reacción compensatoria condicionada.

B) Proceso en el que pienso en la droga pero no la tomo = Claves de droga (drogas-alteración homeostasis) – reacciones compensatorias condicionadas – respuestas condicionadas anticipatorias.

Pienso en que es un buen momento para tomar la droga pero aún no la tomo. El hecho de pensar lo relaciono directamente con su efecto y con el contraefecto que da mi cuerpo y se produce la reacción compensatoria condicionada y por lo tanto la respuesta condicionada anticipatoria. La ansiedad por consumir droga que suelen mostrar los consumidores habituales es una manifestación de estas respuestas condicionadas anticipatorias. En un experimento con consumidores habituales de cocaína y no consumidores, les presentaban imágenes relacionadas con el consumo de cocaína e imágenes sin relación con la droga. Al grupo de consumidores les aumentaba el ritmo cardiaco con las imágenes relacionadas con el consumo. El modelo de condicionamiento de tolerancia a las drogas Siempre se ha considerado que la tolerancia a las drogas se debía a procesos farmacológicos, sin embargo Shepard Siegel encuentra otra explicación basada en el condicionamiento clásico… La explicación se basa en el concepto de homeostasis aprendida. Tomamos droga y se producen unos cambios fisiológicos en nuestro organismo (son el EI). Entonces se ponen en marcha unos ajustes para compensar esos cambios, son la respuesta incondicionada (RI). Entonces… Mediante el condicionamiento pavloviano o clásico, los estímulos que acompañan a la administración de droga se asocian con el EI. Estos estímulos condicionados pueden ser la hora del día, o el lugar donde se consume droga habitualmente. Por lo tanto - Droga provoca EI - EI provoca RI - EI siempre va con EC (lugar y hora) -EC provoca RI (es decir, el lugar y la hora provocan mi respuesta fisiológica para compensar los cambios que me producirá la droga, por lo tanto tomar droga en sitios habituales me “colocará” menos).

Page 40: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 4: CONDICIONAMIENTO CLÁSICO – MECANISMOS

el EC como determinante de la forma de la RC Lo que hemos visto antes de las Palomas y la tecla pero con el EC de protagonista. Ejemplo en ratas. Para variar A una rata A se le presentaba otra rata B atada que actuaba como EC, 10 segundos antes de presentarle la comida. A fuerza de presentarle la rata B (EC) antes de la comida (EI) se quería observar si la respuesta normal que daría la rata A ante la comida (morder, roer) comenzaría a darla con la sola visión de la otra rata. Sin embargo esto no fue así, sino que la rata A mostraba actitudes sociales ante la rata B. Por lo tanto estas actitudes sociales estaban sin duda determinadas por la naturaleza del EC (la rata B). Conducta condicionada y sistemas de conducta Un sistema de conducta consiste en una serie de modos de respuesta, cada uno de ellos con sus propios estímulos y respuestas relevantes, dispuestos con determinado orden espacial y/o secuencial. Esta teoría asume que la presentación de un EI activa el sistema de conducta (formado por uno o varios EC) para ese EI. La presentación de un estímulo sexual para la codorniz macho (EI) activa una secuencia de: Conducta de búsqueda general (EC), Conducta de búsqueda focal (EC) Conducta consumatoria (EI) La forma de la RC depende del intervalo EC-EI que se utilice. La razón es que el intervalo EC-EI determinará el lugar en el que se incorporará el EC dentro de la secuencia de respuestas del sistema de conducta. El EC no sustituye ni compensa al EI. En lugar de eso, sustituye a un estímulo en un punto del sistema de conducta determinado por el intervalo EC-EI. Aprendizaje E-R frente a aprendizaje E-E Aprendizaje E-R: Este aprendizaje establece una nueva conexión Entre el EC y la RC Aprendizaje E-E: Es una visión más moderna, en la que los individuos aprenden una asociación entre el EC y el EI. Los sujetos responden al EC, no porque éste elicite directamente la RC sino porque el EC hace que el sujeto piense en EI. ¿Cómo pueden los investigadores decidir entre estas dos interpretaciones? Mediante la técnica de la devaluación del EI, que consiste en la reducción del atractivo de un estímulo incondicionado, normalmente obtenida mediante la aversión o la saciedad.

Page 41: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 4: CONDICIONAMIENTO CLÁSICO – MECANISMOS

C) ¿CÓMO SE ASOCIAN LOS ESTÍMULOS CONDICIONADO E

INCONDICIONADO? El efecto de bloqueo Si tenemos dos estímulo A y B y emparejamos fuertemente el estímulo A con un EI, provocando una respuesta condicionada intensa, y luego presentamos los dos estímulos (A y B) conjuntamente junto al EI, se observa que el condicionamiento de A no se extiende a B. Ejemplo con el pastel de la abuela Todos los domingos visito a mi abuela y me hace un pastel de arroz (A) que me sienta mal (EI). Aprendo a tenerle aversión al pastel de arroz. Tiempo después me sorprende un día al acompañar el pastel de arroz de galletas (B). Me vuelve a sentar mal (EI) pero pienso que sigue siendo culpa del pastel de arroz y no de las galletas. ¿Porqué la presencia del estímulo A previamente condicionado bloquea la adquisición de la respuesta a B? Kamin señala que el EI debe ser sorprendente. Es decir si el EI va señalado por un estímulo previamente condicionado (A), no sorprenderá al sujeto y, por tanto no funcionará bien a la hora de condicionar al estímulo añadido (B). En el ejemplo anterior soy consciente de que cuando tome el pastel de arroz me sentará mal, asi que el hecho de acompañarlo con galletas no lo atribuiré a mi malestar. Recuadro 4.3 El problema dibujo-palabra en la enseñanza de la lectura: Una forma de bloqueo. El aprendizaje de la lectura mediante la presentación de palabras y dibujos puede producir procesos similares al bloqueo. Por esta razón hay que utilizar estos métodos con precaución ya que pueden dificultar el aprendizaje en lugar de facilitarlo. El modelo de Rescorla y Wagner (esto con muuuuucha calma y leyendo el libro detenidamente ya que los siguientes puntos son casi imposibles de resumir. He extraído las ideas principales) Se trata de un modelo matemático que explica porqué la efectividad de un EI está determinada por el grado en que resulta sorprendente. Pueden haber: - EI inesperadamente grandes: Son la base del condicionamiento excitatorio - EI inesperadamente pequeños: Son la base del condicionamiento inhibitorio Y todo esto se puede explicar mediante una fórmula matemática: ΔV = k( λ - V ) λ : Asíntota de aprendizaje V: Valor asociativo de los estímulos que preceden al EI k: Constante relacionada con la saliencia del EC y del EI ΔV: Cambio en el valor asociativo de un estímulo

Page 42: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 4: CONDICIONAMIENTO CLÁSICO – MECANISMOS

Al principio del aprendizaje V está cercano a 0 ya que los estímulos que preceden al EI no los relaciono para nada con EI (por eso es una sorpresa). Como V está cerca de 0, el resultado de ( λ - V ) será bastante grande. Por lo tanto ΔV (la sorpresa) será mayor al principio del aprendizaje. Sin embargo conformen vayamos haciendo ensayos, V va creciendo al incrementarse su valor de asociación con el EI. Como V va creciendo, el resultado ( λ - V ) será menor. Por lo tanto ΔV (la sorpresa) será menor al final del aprendizaje. Aplicación al efecto de bloqueo Final de la primera fase: VA = λ Segunda fase: No hay condicionamiento del estímulo B en la fase 2, ya que el EI es predecible por la presencia del estímulo A: EI = (λ-VA+B) = 0 Pérdida del valor asociativo a pesar de los emparejamientos con el EI El modelo Rescola-Wagner predice que los estímulos perderán valor asociativo si se presentan juntos en un ensayo de condicionamiento después de haber sido entrenados por separado. Fase 1

- Asociamos el estímulo A con una bolita de comida (EI) - Paralelamente asociamos el estímulo B con la misma bolita de comida (EI)

Ambos estímulos se han condicionado perfectamente, de manera que predicen perfectamente el EI de una bolita de comida, es decir, VA = VB = λ Fase 2

- Presentamos ambos estímulos conjuntos (A y B) con la bolita de comida (EI) Al no haber cambios en el EI, las propiedades de A y B adquiridas en la fase 1 deberían mantenerse, y sin embargo el modelo predice que se van a reducir. ¿porqué sucede esto? Porque la expectativa basada en los estímulos individuales son 2 bolitas de comida y sin embargo se le presenta 1 única bolita. Por lo tanto existe una discrepancia entre lo que se espera (2 bolitas) y lo que se presenta (1 bolita). Los participantes encuentran que el EI es sorprendentemente pequeño, por lo tanto para ajustar la expectativa a lo que realmente ocurre, A y B perderán valor. Inhibición condicionada (mirar el gráfico de la página 82 del tema 3 para recordar qué era la inhibición condicionada) La inhibición condicionada consta de dos tipos de ensayos:

- Ensayos reforzados: Se presenta el EI - Ensayos no reforzados: Se omite el EI

Page 43: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 4: CONDICIONAMIENTO CLÁSICO – MECANISMOS

Para poder anticipar el EI en los ensayos reforzados, el EC+ debe adquirir propiedades excitatorias. Por el contrario, en los ensayos no reforzados, el EI no ocurre (a pesar de que lo esperamos como consecuencia de nuestro aprendizaje en los ensayos reforzados). Se trata de un caso de expectativa excesiva. Para predecir con exactitud la ausencia de EI en los ensayos no reforzados, los valores asociativos de EC+ y EC- tienen que sumar cero. Extinción de la excitación y la inhibición (gráfico pág 115) Excitación: En este procedimiento, el estímulo condicionado se presenta repetidamente con el EI. Como el EC ha adquirido fuertes propiedades excitatorias, la primera vez que se presenta solo el EC habrá un exceso de expectativa a que también se presente el EI. Conforme se siga presentado el EC solo, la expectativa de que aparezca EI se va acercando a 0. Inhibición: Es un poco lo contrario que el caso anterior. Aquí el EC- comienza con un valor asociativo negativo que se considera una predicción excesivamente baja del EI. Para ajustarse a las expectativas, el valor asociativo negativo del EC- se va perdiendo hasta llegar a 0. Problemas del modelo de Rescorla y Wagner 1º Problema: Su análisis de la extinción de la inhibición condicionada es incorrecto (no tenemos suficiente con estudiar a los que acertaron…). El modelo predice que la presentación repetida de un inhibidor condicionado (EC-) sin el EI debería dar lugar a una pérdida de la inhibición condicionada, pero esto no sucede. 2º Problema: El modelo considera la excitación como lo opuesto a la extinción. Y no debe verse así. 3º Problema: El modelo solo permite que los EC tengan un único valor asociativo (EC+ o EC-) sin embargo se ha descubierto que en ciertas condiciones puede tener ambos. 4º Problema: El modelo tiene dificultades para explicar hallazgos recientes obtenidos en los paradigmas de aversión al sabor y el olor. Concretamente tiene problemas para explicar el efecto de aumento o contrabloqueo. (el estímulo previamente condicionado aumenta el condicionamiento del EC añadido) Otros modelos de condicionamiento clásico Modelos atencionales de condicionamiento Para que el condicionamiento tenga lugar, los sujetos deben prestar atención al EC.

- Se asume que el grado de atención que un animal presta al EC en un ensayo determinado depende del grado en el que el EI haya sido sorprendente en el ensayo anterior.

Page 44: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 4: CONDICIONAMIENTO CLÁSICO – MECANISMOS

- La sorpresividad del EI en un ensayo determinado altera el grado de atención

dedicado al EC en los ensayos siguientes. Por lo tanto la sorpresividad del EI tiene sólo un efecto prospectivo o proactivo sobre la atención y el condicionamiento (esta es la principal diferencia con el modelo de nuestros amigos Rescorla y Wagner)

Factores temporales y respuesta condicionada

- Ninguno de los modelos vistos hasta ahora explica los efectos del tiempo sobre el condicionamiento. Sin embargo el intervalo EC-EI es una variable temporal importante ya que los intervalos EC-EI más largos producen menos respuestas. (la respuesta es inversamente proporcional a la duración del intervalo)

- Otra variable importante es el intervalo entre ensayos sucesivos. Se observa una mayor respuesta condicionada cuando se utilizan procedimientos en los que los ensayos están más separados entre sí.

Experimento en ratas Se presentaba comida (EI) en un comedero y cada presentación de la comida va precedida por un ruido blanco (EC). A medida que avanza el experimento, las ratas comienzan a ir al comedero y a explorarlo tan pronto escuchan el sonido. IEE: Intervalo entre ensayos ED: Duración del ensayo (es decir, la duración que tiene el sonido) La conclusión es que para cada grupo de sujetos, el tiempo dedicado a explorar el comedero durante la presentación del EC, varía según la duración del EEI y el ED. Existen distintas interpretaciones sobre porqué la respuesta condicionada está tan fuertemente determinada por la razón IEE/DE. Vamos a ver dos hipótesis a continuación. Hipótesis del tiempo de espera relativo Un EC proporciona información acerca de la aparición del EI, sólo si el sujeto tiene que pasar menos tiempo esperando al EI tras la presentación del EC que cuando está simplemente expuesto al contexto experimental. -Razón IEE/DE baja = tiempo de espera similar al contexto = EC da poca info sobre aparición EI -Razón IEE/DE alta= tiempo de espera menor que el contexto= EC da mucha info sobre aparición EI Hipótesis del comparador La respuesta condicionada depende no sólo de la asociación entre el EC y el EI, sino también de todas las posibles asociaciones que puedan establecerse entre las claves contextuales y el EI. Ejemplo gráfico de una balanza en página 120: Se compara el “peso” o valor del EC crítico frente al valor excitatorio de las claves contextuales. A diferencia de la hipótesis del tiempo de espera relativo, la hipótesis del comparador se centra más en las asociaciones que se puedan producir.

Page 45: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 4: CONDICIONAMIENTO CLÁSICO – MECANISMOS

Se asume que los organismos aprenden 3 asociaciones en el curso del tiempo (gráfico 121: 1ª asociación: Une el EC crítico (X) con el EI. (de forma directa) 2ª asociación: Une el EC crítico con las claves contextuales de comparación 3ª asociación: Une los estímulos de comparación y el EI (de forma indirecta)

- La hipótesis del comparador no indica cómo se establecen las asociaciones, se trata de una teoría de ejecución, no de aprendizaje.

- La comparación entre las asociaciones (EC-EI) y (contexto-EI) se realiza en el momento de la prueba.

- También se ha probado esta hipótesis en estudios sobre inhibición condicionada. Atribuye la inhibición condicionada a situaciones en las que la asociación del EC crítico con el EI es más débil que la asociación de las claves contextuales con el EI. (esto se entiende observando la balanza de la página 120, en el medio tenemos un medidor apuntando al 0 y dependiendo de lo que tenga más valor se desplazará hacia la izquierda (inhibición) o hacia la derecha (excitación).

- Es la única hipótesis que predice que la extinción de la inhibición condicionada se puede lograr no presentando el EC- de forma aislada, sino extinguiendo las claves que sirven de EC+ y que proporcionan el contexto excitatorio para el condicionamiento inhibitorio del EC-.

- El modelo predice también que incrementar el valor excitatorio de las claves contextuales tras el tratamiento reducirá la respuesta condicionada del EC crítico.

- Otra contribución ha sido suponer que las diferencias en la respuesta condicionada pueden reflejar diferencias en la ejecución más que en el aprendizaje.

Visión general de las alternativas teóricas (un poco resumen de lo visto) - Hipótesis del tiempo: Se centra en la distribución temporal - Hipótesis del comparador: Es una teoría de la ejecución más que del aprendizaje - Modelos atencionales: Se parece más a Rescorla-Wagner pero también comparte sus limitaciones. Sin embargo ninguna de estas 3 tuvo tanta fama en el condicionamiento clásico como el modelo Rescorla-Wagner en los setenta.

Page 46: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conducta

CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL – FUNDAMENTOS A diferencia de los capítulos anteriores, en este tema los estímulos a los que un organismo se enfrenta son resultado de su conducta. Es lo que se conoce como “conducta dirigida a una meta”. Un estudiante estudiará para obtener mejores notas. Este tipo de conducta se utiliza porque ha servido previamente como instrumento para conseguir lo mismo y recibe el nombre de “conducta instrumental”. A) PRIMERAS INVESTIGACIONES SOBRE CONDICIONAMIENTO INSTRUMENTAL Comienzan con Thorndike. Su intención original era estudiar la inteligencia animal. Sus experimentos se basaban en introducir animales hambrientos en cajas con comida en el exterior y a la vista del animal. El animal debía aprender cómo salir de la caja. Los resultados son obvios, con la repetición elanimal cada vez tarda menos tiempo en repetir la acción que abre la caja. Sin embargo hay que hacer una puntualización, Thorndike no explicaba que los animales compredieran el funcionamiento del mecanismo que abría la caja, sino que la abrían como una asociación estímulo-respuesta. Es decir, un gato por ejemplo daba muchas respuestas al introducirlo en la caja, alguna de estas respuestas (de casualidad) abrían la caja, por lo tanto el animal poco a poco iría aprendiendo esta asociación y comenzaría a dar con mayor frecuencia el tipo de respuestas encaminadas a volver a abrirla. Yo no entiendo cómo se abre la puerta de mi coche con el mando a distancia…pero cada vez que quiero abrirla le doy al botón porque es lo que he aprendido. Ley del efecto: Si una respuesta en presencia de un estímulo es seguida por un suceso satisfactorio, la asociación entre el estímulo (E) y la respuesta (R) se fortalece. Si la respuesta es seguida por un suceso molesto, la asociación E-R se debilita. La ley del efecto implica un aprendizaje E-R.

B) APROXIMACIONES MODERNAS AL ESTUDIO DEL CONDICIONAMIENTO INSTRUMENTAL

Procedimientos de ensayo discreto Normalmente se llevan a cabo en laberintos W.S. Small (1899-1900) creó laberintos para estudiar la conducta de las ratas. Uno tenía forma de T (para estudiar la conducta de elección )y otro era simplemente alargado con forma de I (gráficos pág 129). Con los laberintos se puede medir la velocidad de la carrera (desde la salida hasta la meta) y el tiempo de latencia (tiempo que tarda en abandonar la salida e iniciar la carrera).

Page 47: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conducta

CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL – FUNDAMENTOS Procedimientos de operante libre Skinner (1938). Se permite que el animal repita la respuesta una y otra vez sin restricciones.(a diferencia de los laberintos en T en que el animal era sacado del laberinto al llegar a meta). Skinner quería obtener una respuesta más natural en los experimentos. La observación informal sugiere que la conducta en curso es un continuo, una actividad sigue a la otra. Skinner propuso el concepto de operante como la forma de dividir la conducta en unidades medibles con significado. Foto página 131: Rata hambrienta en una caja de Skinner. Hay una palanca conectada a un dispensador de comida. Cuando la rata aprieta la palanca cae comida. La respuesta operante (presionar la palanca) se define a partir del efecto que produce en el ambiente. El operante de presión de la palanca se define como una presión hacia abajo suficiente para que cause el cierre del microinterruptor. Da igual si la presión la hace con la pata izquierda, derecha o con la cola, se trata del mismo operante. Entrenamiento y moldeamiento al comedero Es la primera fase. Se realiza un seguimiento del signo mediante un sonido (condicionamiento clásico) para que el animal se dirija al comedero. (esto es el entrenamiento al comedero). Tras este entrenamiento el animal está preparado para aprender la respuesta instrumental. Si la respuesta NO ES ALGO que el animal ya realiza ocasionalmente NUNCA sucederá por si misma la respuesta que produce el reforzador. Es decir, para empezar le daremos comida a la rata cada vez que se levanta sobre sus dos patas de forma natural (obviamente si en lugar de una rata fuera una rana, nunca podrá ponerse a dos patas). Cuando hemos conseguido la respuesta de alzamiento entonces daremos un paso más y le daremos la comida SOLO SI realiza la respuesta de alzamiento sobre la palanca. Poco a poco vamos produciendo un moldeamiento hasta conseguir la respuesta buscada. Esta dos fases que hemos visto del modeamiento son: “reforzamiento de aproximaciones sucesivas” y “no reforzamiento de las formas de respuesta tempranas Moldeamiento y nueva conducta Toda la nueva unidad conductual de la rata está formada por un conjunto de respuestas preexistentes (alzamiento, presión, etc). Es decir, se le enseña una nueva combinación de respuestas familiares en una nueva actividad. Es importante señalar que el moldeamiento aprovecha la variabilidad inherente de la conducta. Es decir, se puede variar la conducta en una dirección u otra. El libro habla de un experimento sobre el picoteo en palomas en el que dependiendo del reforzador conseguían que su conducta tendiera a ir cerrando más el pico con el picoteo o lo contrario, ir abriendo más el pico con el picoteo. Con el mismo experimento se obtenían resultados que explicaban que el moldeamiento puede producir nuevas formas de respuesta nunca antes realizadas por el organismo. Antes de los experimentos las palomas conseguían abrir el pico 10 mm, pero tras el moldeamiento llegaban hasta 20 mm. La tasa de respuesta como medida de la conducta operante Los experimentos con operante libre permiten una observación continua durante largos periodos (a diferencia del ensayo discreto). Skinner propuso la “tasa de ocurrencia” (frecuencia de la respuesta por

Page 48: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conducta

CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL – FUNDAMENTOS minuto) como medida de la probabilidad de una respuesta. Las respuestas más probables ocurren con frecuencia y muestran una tasa alta.

C) PROCEDIMIENTOS DE CONDICIONAMIENTO INSTRUMENTAL

Antes de empezar con los procedimientos (que son 4) vamos a explicar 4 conceptos:

- Estimulo apetitivo: Una consecuencia placentera. - Estímulo aversivo: Una consecuencia molesta. - Contingencia positiva: La respuesta instrumental proporciona el estímulo (un

chico corta el césped y recibe dinero) - Contingencia negativa: La respuesta instrumental evita el estímulo (cierro la

ventana y no entra lluvia) Importante la tabla de la página 134 Y ahora los 4 procedimientos que dan título al apartado: Reforzamiento positivo: Un padre da una galleta a su hija cuando hace los deberes. La respuesta instrumental produce un estímulo apetitivo. Por lo tanto existe contingencia positiva entre la respuesta y el estímulo. Castigo: Un jefe te critica por llegar tarde a una reunión. La respuesta instrumental produce un estímulo aversivo. Y OJO: Aquí también se produce una contingencia positiva entre la respuesta y el estímulo. (llegar tarde produce que el jefe te riña) Reforzamiento negativo: Se trata de un procedimiento en el que la respuesta instrumental finaliza o previene la entrega de un estímulo aversivo. Hay dos tipos de reforzamiento negativo:

A) Escape: Se presenta el estímulo aversivo pero puede ser eliminado por la respuesta instrumental. Se puede escapar del sonido molesto de una radio apagándola.

B) Evitación: Implica la programación de un estímulo aversivo para ser presentado en algún momento del futuro. La gente pone a punto su coche para evitar averías.

Entrenamiento de omisión: La respuesta instrumental previene la presentación de un estímulo apetitivo. Se le dice a un niño que se vaya a su habitación cuando ha hecho algo malo no porque la habitación sea algo aversivo sino para evitar estímulos apetitivos como ver la televisión o que lo llamen sus amigos. El entrenamiento de omisión también recibe el nombre de “reforzamiento diferencial de otras conductas” o RDO. El RDO refleja el hecho de que el individuo recibe un estímulo apetitivo periódicamente a condición de que se dedique a realizar otra conducta diferente a la anterior. Aunque ya lo he señalado antes, pero repito la importancia del cuado de la página 134 para evitar confusiones con estos términos.

Page 49: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conducta

CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL – FUNDAMENTOS

D) ELEMENTOS FUNDAMENTALES DEL CONDICIONAMIENTO INSTRUMENTAL

El condicionamiento instrumental consta de 3 elementos claves:

- Una respuesta - Una consecuencia (el reforzador) - Relación (o contingencia) entre la respuesta y la consecuencia 1. La respuesta instrumental

Variabilidad conductual versus estereotipia Los experimentos de Thorndike y Skinner enfatizaron que el reforzamiento incrementa la probabilidad de que la respuesta instrumental se repita en el futuro. Es decir, repeticiones de la misma respuesta. Sin embargo esto no significa que el condicionamiento instrumental no pueda producir también respuestas creativas o variables. Los organismos pueden aprender a obtener reforzamiento en una situación donde se requiere hacer algo nuevo. Por lo tanto la variabilidad de la respuesta puede ser la base para el reforzamiento instrumental. Y esto se demostró con un experimento en palomas: Page y Neuringer (1985) – Experimento en Palomas. Las palomas tenían que picotear 2 teclas durante 8 veces para obtener comida. Podían alternar los picoteos como quisieran siempre que fuesen 8 entre dos teclas. Tras 50 ensayos solo recibirían comida si no repetian ninguna de las combinaciones de los 50 ensayos del principio. Paralelamente un grupo de control recibía comida independientemente de si repetía o no. Los resultados demostraron que el grupo que no tenía que repetir las combinaciones daba mucha más variabilidad en su respuesta que el grupo de control, creando combinaciones nuevas. Por lo tanto:

- La variabilidad de la respuesta puede mantenerse e incrementarse por reforzamiento.

- En ausencia de reforzamiento explícito de la variabilidad, la respuesta llega a ser más estereotipada con un condicionamiento instrumental continuado.

Relevancia o pertinencia en el condicionamiento instrumental Esto es muy parecido a lo que vimos en el condicionamiento clásico cuando hablábamos de facilidad de aprendizaje cuando el EC era relevante para el EI en temas anteriores. En el condicionamiento instrumental ocurre algo parecido, Thordike estudió las respuestas de gatos atrapados en cajas. Primeramente condicionó el rascado y el bostezo como respuestas instrumentales para escapar y en otros experimentos condicionó manipular un picaporte o tirar de una anilla. Demostró que cuando se trataba del picaporte o la anilla, la respuesta era mucho más vigorosa que cuando se trataba del bostezo y el rascado. La evolución natural del gato hace que manipular un picaporte y empujar una anilla son respuestas que están relacionadas de forma natural con escapar de la trampa. Con esto se explica el concepto de pertinencia.

Page 50: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conducta

CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL – FUNDAMENTOS Deriva instintiva: Breland y Breland observaron varias limitaciones y problemas a la hroa de entrenar animales para realizar exhibiciones en circos. Observaron que los animales realizaban conductas relacionadas con su forma de alimentación en lugar de reproducir la conducta buscada por los educadores. Sistemas de conducta y limitaciones en el condicionamiento instrumental De acuerdo con la teoría de los sistemas de conducta, cuando un animal está privado de comida y se encuentra en una situación donde podría encontrarla, su sistema de alimentación se activa y se dedica a otras actividades relacionadas con la comida. De acuerdo con la aproximación de los sistemas de conducta, deberíamos ser capaces de predecir qué respuestas se incrementarán con un reforzamiento de comida mediante el estudio de lo que los animales hacen cuando su sistema de alimentación está activado en ausencia de condicionamiento instrumental. Esto suena un poco lioso pero se entiende con el siguiente ejemplo: Cuando un hamster tiene comida suficiente se dedica a otras actividades como el autocuidado (lavarse, etc) pero cuando está hambriento su sistema de conducta se centra en otras actividades como rascar o comer. Por lo tanto podemos concluir que el autocuidado no está relacionado con su sistema de conducta de la alimentación y que el reforzamiento de comida podría producir incrementos en actividades como cavar y escarbar pero no en lavarse la cara y rascarse.

2. El reforzador instrumental Cantidad y naturaleza del reforzador Las dos características están muy relacionadas. Tener un reforzador más grande o más sabroso (en el caso de la comida) provocará respuestas más intensas en los sujetos. Cambios en la naturaleza y cantidad del reforzador Esto está relacionado con el modelo Rescorla-Wagner visto en el tema anterior. Si el EI es mayor de lo esperado, producirá condicionamiento excitatorio. Si por el contrario el EI es menor de lo esperado, producirá condicionamiento inhibitorio. Si trabajas por 9 euros/hora durante 6 meses y el septimo mes te siguen pagando lo mismo, será menos emocionante que trabajar 6 meses a 8 euros y luego a partir del septimo mes subirte a 9 euros. Es probable que los trabajadores del segundo grupo sean más productivos (para quien tenga psicología de la motivación, en la PEC 1 hay un ejercicio que trata este tema) Contraste positivo: Se refiere a una elevada respuesta por una recompensa favorable resultado de una experiencia anterior con una consecuencia menos atractiva. Contraste negativo: Se refiere a una respuesta disminuida por una recompensa desfavorable debido a una experiencia anterior con una consecuencia mejor. Contraste sucesivo (positivo o negativo): Dos condiciones de respuesta en diferentes fases del experimento y sólo un cambio en la magnitud de la recompensa para los grupos de cambio.

Page 51: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conducta

CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL – FUNDAMENTOS Contraste conductual simultáneo: Efectos de contraste conductual (contraste positivo y negativo) que están producidos por frecuentes cambios entre una condición de recompensa favorable y una desfavorable, con cada condición de recompensa asociada a su propio estímulo distintivo. Todos los efectos de contraste ilustran que la efectividad de un reforzador en una situación está determinada en parte por las experiencias del organismo con reforzadores en otras situaciones.

3. La relación respuesta-reforzador

En algunos casos hay una fuerte relación entre lo que una persona hace y la consecuencia que sigue, en otros casos no hay ninguna relación y en otros casos la relación puede ser probabilística. Un organismo debe organizar su tiempo para enfrentarse a varios retos y debe hacerlo de manera que lleve a cabo el mejor uso de su tiempo y energía. 2 tipos de relaciones entre una respuesta y un reforzador

a) Relación temporal (o contigüidad temporal): Tiempo que transcurre entre la respuesta y el reforzador. En la “Contigüidad temporal” el reforzador se entrega inmediatamente después de la respuesta.

b) Relación causal: (o contingencia respuesta-reforzador). Se refiere al hecho de que la respuesta instrumental es necesaria y suficiente para la ocurrencia del reforzador.

Efectos de la contigüidad temporal El reforzamiento inmediato es preferible al demorado. Proporcionar el reforzador inmediatamente después de la ocurrencia de la respuesta instrumental facilita el aprendizaje. Hay varios factores que explican porqué el condicionamiento instrumental es tan sensible a la demora del reforzamiento:

- Una demora larga hace que el sujeto no sepa cual de sus respuestas haya sido la que ha producido el reforzador. Es decir, la rata levanta una palanca pero pasan 30 segundos hasta que se muestra una bolita de comida, durante estos 30 segundos la rata sigue haciendo otras cosas como pueden ser saltar, morder, etc., de repente surge la bolita y la rata ya no asocia la bolita con la palanca inicial ya que después ha seguido dando una serie de respuestas (saltar, morder, etc.) y no sabe cual de ellas ha sido la que ha propiciado la salida de la bolita.

- Para resolver este problema se entrega un reforzador condicionado o

secundario inmediatamente después de la respuesta instrumental y que ha sido asociado previamente con el reforzador. Por ejemplo en el adiestramiento verbal de animales se dice “bueno” o “eso es” y cuando acabe la exhibición se le dará la comida.

- Otra manera de resolver el problema es mediante un “procedimiento de

marcado” de la respuesta instrumental correcta. Experimento en ratas. Una caja con un brazo negro y otro blanco. El blanco es la respuesta correcta, el grupo de

Page 52: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conducta

CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL – FUNDAMENTOS

ratas que daba la respuesta correcta se dividió en 2 subgrupos, uno de estos subgrupos era extraido de la caja en el momento de entrar en el brazo blanco y llevado a otra caja a experar la comida. El otro subgrupo no era extraído de la caja, sino que esperaba a recibir la comida en ella durante 60 segundos. Se demostró que el grupo que era “extraído” (marcado) de la caja, tenía un porcentaje de respuestas correctas superior en experimentos posteriores que el grupo que no había sido extraído. Es decir, hay que hacer algo inmediatamente después de la respuesta instrumental para que el animal se percate de que lo que acaba de hacer es la elección correcta.

La contingencia respuesta-reforzador Repite lo anterior al principio del apartado pero añade que: Aunque la relación causal sea perfecta, el condicionamiento no ocurrirá si el reforzamiento es demorado durante demasiado tiempo. El experimento de superstición de Skinner Muy interesante y gracioso: Metió a 8 palomas en 8 cajas distintas que estaban programadas para dar comida cada 15 segundos independientemente de lo que estuviesen haciendo las palomas. Al rato volvío y comprobó que cada paloma estaba haciendo una cosa, unas daban vueltas otras picoteaban, etc, como si su comportamiento condicionara el hecho de que apareciese o no apareciese comida. Skinner denominó a esto conducta supersticiosa. Seguro que más de uno hacemos cosas parecidas. Skinner explica esta conducta mediante la idea del reforzamiento accidental o adventicio que se refiere al emparejamiento accidental de una respuesta con la entrega del reforzador. Este experimento sugería que una contingencia positiva respuesta-reforzador no es necesaria para el condicionamiento instrumental. Reinterpretación del experimento de superstición: Staddon y Simmelhag profundizaron un poco más en el experimento de Skinner y dieron nombre a las conductas de las palomas. Denominaron respuestas terminales a las que se daban al final del intervalo comida-comida y respuestas de interín a las que se daban en medio del intervalo. Las Palomas solían coincidir en el tipo de respuestas terminales y en el tipo de respuestas interín. Por lo tanto hay algo de contingencia entre el tipo de respuestas y el reforzador (al contrario de cómo sugería Skinner) Explicación de la periodicidad de las respuestas de interín y terminales: Staddon y Simmelhag sugirieron que las respuestas terminales son respuestas típicas de la especie que reflejan la anticipación de comida a medida que el tiempo se encuentra más cerca de la próxima presentación de comida. En contraste, las respuestas interín son una manifestación de otras fuentes de motivación que eran más importantes al comienzo del intervalo entre comidas, cuando la presentación de comida era improbable.

Page 53: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conducta

CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL – FUNDAMENTOS El tipo de respuestas que se dan en el intervalo se agrupan en 3 subgrupos siguiendo el orden temporal tras la última aparición de comida:

a) – Búsqueda focalizada poscomida (cerca del cuenco) b) – Búsqueda general (lejos del cuenco) c) - Búsqueda focalizada (cerca del cuenco otra vez)

Efectos de la controlabilidad de los reforzadores Con una contingencia fuerte, que el reforzador suceda depende de si ha ocurrido la respuesta instrumental. Un hallazgo importante en experimentos con perros fue que la exposición a una descarga incontrolable dificultaba el aprendizaje posterior. Este efecto recibe el nombre de efecto de indefensión aprendida. Y ahora 6 puntos que tienen que ver con el efecto de indefensión aprendida: 1. El diseño triádico: (tabla página 153) Los experimentos de indefensión aprendida se realizan utilizando el diseño triádico. Contiene 2 fases:

a) Exposición Grupo de ratas E: Expuesto a descargas periódicas de las que pueden escapar. Grupo de ratas A: Cada sujeto del grupo A es acoplado a cada sujeto del grupo E y recibe las mismas descargas pero no pueden escapar de ellas. Grupo C: No recibe descargas pero está confinado en el aparato tanto tiempo como los otros.

b) Condicionamiento Los 3 grupos reciben entrenamiento de escape – evitación Resultados: La exposición a una descarga incontrolable (Grupo A) produce peores resultados en el aprendizaje escape-evitación que el resto de los grupos. La diferencia en la tasa de aprendizaje entre los grupos muestra que los animales son sensibles a la contingencia respuesta-reforzador. 2. Hipótesis de la indefensión aprendida: Esta hipótesis asume que durante la exposición a descargas incontrolables, los animales aprenden que las descargas son independientes de su conducta, no pueden hacer nada para controlarlas. Esto dificulta el aprendizaje ya que la falta de control sobre la situación hace que descienda la motivación de los sujetos para realizar una respuesta instrumental. No confundir con el efecto de indefensión aprendida que explica el patrón de resultados obtenido con el diseño triádico. 3. Deficit de actividad: Las ratas del Grupo A aprendían a ser inactivas en respuesta a la descarga durante la fase de exposición.

Page 54: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conducta

CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL – FUNDAMENTOS 4. Deficit atencional: Una descarga inescapable hace que los animales presten menos atención a sus acciones (ya que han aprendido que van a recibir la descarga hagan lo que hagan). Sin embargo marcar la respuesta instrumental supera el déficit de indefensión aprendida. 5.Relaciones estimulares en el condicionamiento de escape: El rasgo definitorio de la conducta de escape es que la respuesta instrumental tiene como consecuencia la terminación del estímulo aversivo. Además, la respuesta de escape tiene como resultado claves internas de retroalimentación de la respuesta. Hay dos:

- Claves de retroalimentación de la terminación de la descarga. (al comienzo de la respuesta de escape)

- Claves de retroalimentación de la señal de seguridad. (cuando el animal completa la respuesta)

Estas claves contextuales llegan a convertirse en inhibidores condicionados del miedo y limitan el miedo elicitado por las claves contextuales de la cámara experimental. Hay mayor probabilidad que las claves contextuales de la cámara en la que se administran las descargas queden condicionadas para elicitar miedo cuando las descargas son inescapables. Para finalizar y a modo de conclusión: El diseño triádico ha sido de un valor incalculable para considerar la posible importancia de las contingencias respuesta-reforzador.

Page 55: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 6: PROGRAMAS DE REZORZAMIENTO Y CONDUCTA DE ELECCIÓN

En el mundo real la contingencia perfecta entre la respuesta y el reforzamiento es rara. No siempre que pasemos muchas horas estudiando obtendremos una buena nota. Para estudiar esta relación tan compleja se crean los programas de reforzamiento: Programa de reforzamiento: Programa o regla que determina la forma en que se relacionan las presentaciones del reforzador con las ocurrencias de la respuesta instrumental. La entrega del reforzador puede depender de varios factores, número de respuestas, paso del tiempo, etc. Los programas de reforzamiento se investigan normalmente en cajas de Skinner que permiten una observación continua de la conducta, por lo que pueden observarse y analizarse los cambios en la tasa de respuesta. Proporcionan más información sobre los factores que controlan el mantenimiento de la conducta. A) PROGRAMAS SIMPLES DE REFORZAMIENTO INTERMITENTE Son programas en los que un solo factor determina qué ocurrencia de la respuesta instrumental se refuerza. Programas de razón El reforzamiento depende del número de respuestas. Reforzamiento continuo: Una sóla respuesta provoca la entrega del reforzador. Reforzamiento parcial o intermitente: La respuesta se refuerza sólo alguna vez. Razón fija: Entrega del reforzador cada X respuestas, (5, 10 etc). Se representa mediante RF5, RF10, etc. Otros conceptos importantes Registro acumulativo de la conducta: Es una forma especial de representar la forma de repetirse una respuesta a lo largo del tiempo. Se utilizaba sobre todo antes de la existencia de los ordenadores. (gráfico pág 165). La pendiente de la línea trazada representa la tasa de respuesta. Pausa posreforzamiento: Es la tasa de respuesta 0 que se observa justo después del reforzamiento. Carrera de la razón: La tasa de respuesta alta y estable que completa cada requerimiento de la razón. ¿Qué ocurre cuando el requerimiento de la razón se incrementa un poco? Es decir, pasar por ejemplo de RF 120 a RF 150

- Con mayores requerimientos de la tasa, tienen a ocurrir pausas posreforzamiento más largas.

Page 56: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 6: PROGRAMAS DE REZORZAMIENTO Y CONDUCTA DE ELECCIÓN

- Si el incremento es muy grande (de RF120 a RF500), es probable que el animal

realice una pausa periódica cada vez que complete la razón requerida. Es lo que se conoce como tensión de razón.

Razón variable: Número de respuestas distinto para la entrega del reforzador. Se representa por RV y en el caso de RV10 quiere decir que su media es 10 (imaginemos que en un primer ensayo se necesitaban 13 respuestas, en un segundo ensayo 7 respuestas y en el ensayo final 10 respuestas. La media total de los 3 ensayos es RV 10. Las pausas predecibles en la tasa de respuesta son menos probables con los programas de razón variable que con los programas de razón fija. Los organismos suelen responder a una tasa claramente estable en los programas de RV. Programas de intervalo Cuando ocurre cierta cantidad de tiempo desde la última entrega del reforzador. Intervalo fijo (IF): El tiempo no varía de una ocasión a la siguiente. Festón del intervalo fijo: A medida que el tiempo para la disponibilidad del próximo reforzador se acerca, la tasa de respuesta aumenta. Este aumento en la tasa de respuesta se manifiesta como una aceleración en el registro acumulativo hacia el final del IF. Esto demuestra una habilidad del sujeto para contar el tiempo. OJO!!! : Un programa de IF no garantiza que el reforzador se proporcionará a en algún momento a lo largo del tiempo, el intervalo determina sólo cuándo el reforzador estará disponible, no cuando se entrega. Es decir, además del paso del tiempo, sigue siendo necesaria algún tipo de respuesta por parte del sujeto para acceder al reforzador. Por ejemplo, cada 4 minutos estará disponible comida para la paloma siempre y cuando haya dado 20 picotazos previamente. Intervalo variable (IV): El tiempo varía de una ocasión a la siguiente. Se representa por (IV 5), (IV 10), etc. Entendiendo este número como la media de todos los intervalos, de la misma manera que hablábamos más arriba de la razón variable. Los programas de IV mantienen tasas de respuesta constantes y estables sin pausas regulares. (al igual que los programas de razón variable) Programas de intervalo y espera limitada: Esto tiene relación con el OJO!! que marcaba antes. En la espera limitada el reforzador está disponible durante un tiempo X, si pasado ese tiempo el sujeto no ha dado el número de respuestas necesario, el reforzador deja de estar disponible. Siguiente el ejemplo anterior, cada 4 minutos estará la comida disponible durante 1 minuto. Si durante ese minuto de disponibilidad de la comida (+ los 4 minutos anteriores de cada intervalo) la paloma no ha llegado a 20 picotazos no podrá acceder a ella y dejará de estar disponible, comenzando a contar de 0.

Page 57: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 6: PROGRAMAS DE REZORZAMIENTO Y CONDUCTA DE ELECCIÓN

Comparación de los programas de razón y de intervalo Similitudes Razón fija e intervalo fijo: - Producen una pausa posreforzamiento después de la administración de cada reforzador. - Producen altas tasas de respuesta antes de la administración del siguiente reforzador. Razón variable e intervalo variable:

- Mantienen tasas estables de respuesta, sin pausas predecibles.

Diferencias

- Activan diferentes cambios neuroquímicos en el cerebro - Los programas de intervalo están relacionados con el sentido temporal del

organismo. En un experimento con palomas, una reforzada con RV y la otra con IV, se comprobó que la paloma reforzada con el programa de RV respondió a una tasa mucho más alta que la paloma reforzada con el programa de IV. El programa de RV motivó una conducta instrumental mucho más vigorosa. Reforzamiento diferencial del tiempo interrespuesta: El intervalo entre una respuesta y la siguiente se denomina tiempo interrespuesta o TIR. Un sujeto que produce TIR cortos responderá a una tasa alta y si produce TIR largos, su tasa será baja. Un programa de razón favorece los TIR cortos (es la respuesta del sujeto la que determina cuando accederá a la comida, por lo tanto cuanto más rápida se produzca esa respuesta (TIR corto), antes accederá a la comida. Por el contrario, un programa de intervalo favorece los TIR largos. Programas de reforzamiento de tasas de respuesta Los programas de tasas de respuesta requieren específicamente que el organismo responda a una tasa particular para obtener el reforzador. Es como una mezcla de los dos anteriores (tiempo y número). Por ejemplo un programa de reforzamiento en el que una respuesta se refuerce sólo si ocurre dentro de los 5 segundos siguientes a la respuesta precedente. Si el animal realiza una respuesta cada 5 segundos, su tasa de respuesta será de 12 por minuto. Por lo tanto habrá reforzamiento si la tasa de respuesta es de 12 por minuto o mayor. Si la tasa de respuesta es menor, el organismo no será reforzado. Esto recibe el nombre de Reforzamiento diferencial de tasas altas, o RDA. Reforzamiento diferencial de tasas altas (RDA): Una respuesta se refuerza sólo si ocurre antes de que haya transcurrido cierta cantidad de tiempo tras la respuesta precedente. Estos programas fomentan que los sujetos respondan rápidamente. Reforzamiento diferencial de tasas bajas (RDB): Una respuesta se refuerza sólo si ocurre después de que haya transcurrido cierta cantidad de tiempo tras la respuesta precedente. Estos programas fomentan que los sujetos respondan lentamente.

Page 58: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 6: PROGRAMAS DE REZORZAMIENTO Y CONDUCTA DE ELECCIÓN

B) CONDUCTA DE ELECCIÓN: PROGRAMAS CONCURRENTES Los experimentos en los que sólo se mide una respuesta (los vistos hasta ahora) no proporcionan una visión completa de la conducta. En la vida real los organismos ocupan si tiempo en muchas actividades y están continuamente estableciendo elecciones entre varias conductas. Las situaciones de elección pueden ser bastante complicadas y muy diferentes. Por esta razón los psicólogos han desarrollado el estudio de situaciones más simples. La situación de elección más simple consta de dos respuestas alternativas, cada una de estas seguida por un reforzador de acuerdo con su propio programa de reforzamiento. Históricamente se utilizaban laberintos T para estudiar la conducta de elección. Hoy se utilizan cajas de Skinner equipadas con dos teclas. Responder en cada tecla es reforzado según algún programa de reforzamiento. Los dos programas funcionan concurrentemente, por eso reciben el nombre de programa concurrente. Ejemplo página 173 (gráfico). Programa concurrente. Los picotazos sobre la tecla A siguen un programa IV 60 seg. Los de la tecla B siguen un programa RF 10. El objetivo del experimento es ver cómo la paloma distribuye sus picotazos en las dos teclas y cómo influye el programa de reforzamiento propio de cada tecla en las elecciones del animal. Medidas de la conducta de elección Se puede medir de varias formas: Tasa relativa de respuesta de cada alternativa: La tasa relativa de respuesta en la tecla A se calcula dividiendo la tasa de respuesta en la tecla A por la tasa total de respuesta (suma de la tasa A + la tasa B)

Tasa relativa de respuesta (A) = RA/ (RA+RB)

- Si la paloma picotea igualmente en las dos teclas de respuesta, la razón será 0,5. - Si la tasa de respuesta es mayor en A que en B, la razón será mayor que 0,5. - Si la tasa de respuesta es menor en A que en B, la razón será menor que 0,5.

La forma en que un organismo distribuye su conducta entre las dos alternativas de respuesta está muy influida por el programa de reforzamiento que funciona para cada respuesta. Tasa relativa de reforzamiento: Es la frecuencia con la que el individuo obtiene recompensas en cada lado. Se calcula de igual manera a la tasa relativa de respuesta. (pero con una “r” minúscula)

Tasa relativa de reforzamiento (A) = rA/ (rA+rB)

Page 59: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 6: PROGRAMAS DE REZORZAMIENTO Y CONDUCTA DE ELECCIÓN

La ley de igualación (de Herrnstein) En el punto anterior (medidas de la conducta de elección) en los ejemplos se utilizaba el mismo programa de reforzamiento (IV 60 seg) para las dos teclas. Por lo tanto la tasa relativa de respuesta y la tasa relativa de reforzamiento daba 0,5 ya que los programas eran iguales… ¿Pero qué ocurre si los programas son diferentes? Experimento en palomas: Tecla A: IV 6 min = Pulsando siempre a esta tecla obtendría un máximo de 10 reforzadores por hora. Tecla B: IV 2 min= Pulsando siempre a esta tecla obtendría un máximo de 30 reforzadores por hora. ¿Cómo fue la respuesta de las palomas? La tasa relativa de respuesta en una alternativa dada estaba siempre muy cercana a igualar la tasa relativa de reforzamiento logrado en esa alternativa. Si las palomas obtenían una proporción mayor de reforzadores en A, picoteaban más en A. Por lo tanto, la tasa relativa de respuesta en una alternativa se iguala con la tasa relativa de reforzamiento en esa alternativa. Esto es la ley de igualación.

RA/ (RA+RB) = rA/ (rA+rB) Otra forma de escribir esta fórmula es: RA/ RB = rA/rB Infraigualación, supraigualación y sesgo de respuesta A pesar de lo que hablábamos de la ley de igualación, las tasas relativas de respuesta no siempre se igualan con exactamente con las tasas relativas de reforzamiento. Esto lo vamos a estudiar añadiendo dos parámetros “b” y “s” a la ecuación.

RA/ RB = b (rA/rB)s

s= sensibilidad de la conducta de elección a las tasas relativas de reforzamiento para las alternativas de respuesta. Si s es menor que 1,0 = infraigualación. Sensibilidad reducida a la tasa relativa de reforzamiento. Si s es mayor que 1,0 = supraigualación. Sensibilidad aumentada a la tasa relativa de reforzamiento. La infraigualación se encuentra más a menudo que la supraigualación. b = sesgo de respuesta(bias en inglés, por eso la b) Los sesgos de respuesta influyen en la elección cuando las alternativas de respuesta son diferentes (picotear y presionar con la pata). El sesgo también adquiere importancia cuando el reforzador es diferente (grano de trigo y semillas). En ausencia de sesgos, b=1. Dependiendo de la naturaleza del sesgo o de la preferencia, b será mayor o menor que 1.

Page 60: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 6: PROGRAMAS DE REZORZAMIENTO Y CONDUCTA DE ELECCIÓN

La ley de la igualación y el valor del reforzador: La tasa relativa de respuesta es una función de la cantidad relativa de cada reforzador, de la demora y de la palatabilidad. Cuanto mayores, más sabrosos y más inmediatos sean los reforzadores, serán de mayor valor. La ley de la igualación y los programas simples de reforzamiento: Incluso las situaciones de respuesta única pueden involucrar una elección entre realizar la respuesta especificada (picotear o presionar una palanca) u ocuparse de otras actividades (caminar, acicalarse, etc) Según esto, la ley de la igualación quedaría así:

RA / (RA+RO) = rA / (rA+rO)

Despejando RA = RA =(RA+RO) rA / (rA+rO) RA= Tasa de respuesta del programa RO= Tasa de respuesta de las otras actividades rA = Reforzamiento explícito del programa rO = Reforzamiento de las otras actividades Y para liar un poco más las cosas… Si consideramos que (RA+RO) es una constante que no guarda relación con el reforzador, podemos llamarla constante k. La fórmula quedará de la siguiente manera: RA = krA / (rA+rO) Esta última ecuación proporciona dos maneras de modificar la tasa de una respuesta:

- Mediante el cambio de su tasa de reforzamiento - Mediante el cambio de la tasa de las otras fuentes de reforzamiento

Mecanismos de la ley de la igualación 3 mecanismos:

1. Maximización molecular 2. Maximización molar 3. Mejoramiento

Antes de entrar en detalle con cada uno de ellos. Vamos a explicar un concepto importante para entender el 1 y el 2: Igualación y maximización de las tasas de reforzamiento: Los organismos distribuyen sus acciones entre las alternativas de respuesta para recibir la máxima cantidad posible de reforzadores en cada situación. Y ahora sí, pasamos a explicar cada uno de los mecanismos:

Page 61: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 6: PROGRAMAS DE REZORZAMIENTO Y CONDUCTA DE ELECCIÓN

1. Maximización molecular: Los organismos siempre eligen cualquier alternativa de respuesta con mejores probabilidades de que sea reforzada en ese momento. Experimento en palomas con dos teclas (A y B) y programa IV-IV. Cuanto más tiempo permanezca la paloma en la tecla A, más probabilidad habrá de que transcurra el intervalo para la tecla B y que por lo tanto el reforzamiento esté disponible para B. 2. Maximización molar: El organismo distribuye sus respuestas entre las varias alternativas a fin de maximizar la cantidad de reforzamiento que consiguen a la larga. Se utilizó para explicar los programas de razón en los que los organismos rara vez cambian de alternativa, simplemente responden a la alternativa que requiera menor número de respuestas (RF10 frente a RF20) Sin embargo la maximización molar encuentra problemas a la hora de explicar la conducta de elección en programas de intervalo (IV-IV) y para programas razón-intervalo (RF-IV). 3. Mejoramiento: Los mecanismos de mejoramiento operan a una escala temporal de las teorías molas y molecular. El término “mejoramiento” se refiere a hacer algo mejor que el pasado reciente. No se refiere a elegir la mejor alternativa en ese momento. Término importante sobre el mejoramiento: Tasa local de respuesta y reforzamiento: Las tasas locales están calculadas sólo sobre el período de tiempo que un sujeto dedica a una alternativa particular de respuesta. Si la situación incluye dos opciones (A y B), la tasa local de respuesta en A se calcula dividiendo la frecuencia de respuesta en A por el tiempo que el sujeto dedica a responder en A. Ejemplo numérico (que siempre ayudan)

- Un organismo da 75 respuestas en 20 minutos en la alternativa A - La tasa global en A será de 75 respuestas/hora (puede que el resto del tiempo se

haya dedicado a responder en B) - Sin embargo la tasa local en A sera de 225 respuestas/hora (75 cada 20 minutos)

La teoría del mejoramiento asume que los organismos cambian de una alternativa de respuesta a otra para mejorar la tasa local de reforzamiento que están recibiendo. El mecanismo de mejoramiento da como resultado la igualación. Esta teoría sostiene que un organismo cambiará su preferencia en favor de la alternativa de respuesta que arroje la tasa local de reforzamiento más alta. C) ELECCIÓN CON COMPROMISO En nuestra vida diaria, en ocasiones elegir una alternativa hace que otras no estén disponibles. De igual forma, las elecciones importantes en la vida a menudo implican un beneficio pequeño a corto plazo frente a un beneficio más demorado pero mayor. Es complicado extrapolar este tipo de decisiones al laboratorio para poder estudiarlas, por ello los científicos han desarrollado el programa concurrente encadenado de reforzamiento.

Page 62: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 6: PROGRAMAS DE REZORZAMIENTO Y CONDUCTA DE ELECCIÓN

Programa concurrente encadenado (gráfico pág 183) Este programa involucra al menos dos fases o eslabones: 1ª fase: Eslabón de elección: Se permite al participante elegir entre dos programas alternativos realizando una de dos respuestas. 2ª fase: Eslabón terminal: Una vez que el participante ha elegido uno de los dos eslabones de elección, irá al eslabón terminal que está formado por dos programas de reforzamiento dependiendo de qué opción haya escogido en la 1ª fase. (esto es como lo que comentábamos antes de la vida real, en ocasiones elegir una opción hace que otras opciones no estén disponibles) Los estudios de este tipo han demostrado que los sujetos prefieren la alternativa de razón variable (RV) ya que proporciona reforzamiento por un número relativamente pequeño de respuestas. El estímulo del eslabón terminal se convierte en un reforzador condicionado. Por lo tanto un programa concurrente se caracteriza en que las respuestas al eslabón inicial se refuerzan por la presentación de un reforzador condicionado. Las diferencias en el valor del reforzador condicionado determinarán entonces la tasa relativa de cada respuesta de elección en el eslabón inicial. (el programa (eslabón terminal) que suscite más valor a la paloma será el que elija al principio en el eslabón de elección) Estudios de autocontrol El autocontrol a menudo supone elegir una recompensa grande demorada en lugar de una recompensa pequeña inmediata. Experimento en palomas: (gráfico pág 185) Utilizando el programa concurrente encadenado. En cada uno de los programas terminales responder era recompensado o bien mediante el acceso a una pequeña cantidad de grano (alternativa A) o el acceso a una mayor cantidad de grano que estaba demorada 4 segundos (alternativa B). Estudiaron la conducta de elección en dos circunstancias diferentes:

1. Procedimiento de elección directa: (dibujo superior de la 185). No existe eslabón de elección, directamente se accede a la recompensa. En este ejemplo las palomas no mostraban autocontrol y directamente seleccionaban la recompensa pequeña inmediata.

2. Procedimiento concurrente encadenado (dibujo inferior de la página 185, la foto de la tia no, sino el de la paloma). En este ejemplo, los componentes terminales estaban demorados después de que las palomas realizaran su elección inicial. Si la demora era suficiente antes de los componentes terminales, las palomas mostraban autocontrol y elegían la recompensa grande demorada.

Conclusiones: (este párrafo lo copio tal cual del libro sin resumir porque me parece interesante e importante): Las preferencias cambian a favor de cualquier recompensa

Page 63: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 6: PROGRAMAS DE REZORZAMIENTO Y CONDUCTA DE ELECCIÓN

grande demorada si se requiere que los participantes esperen más tiempo para recibir cualquier recompensa tras realizar su elección. Si las recompensas se entregan rápidamente tras una respuesta de elección, los sujetos generalmente prefieren una recompensa pequeña inmediata más que una recompensa grande demorada. Sin embargo, si se añade una demora constante a la entrega de ambas recompensas, es más probable que los individuos muestren autocontrol y prefieran la recompensa grande demorada. Explicaciones del autocontrol: El valor de un reforzador se reduce en función del tiempo que haya que esperar para obtenerlo. La función matemática que representa esto se llama función descontadora del valor. V = M / (1+KD) (esta función recibe el nombre de función del decaimiento hiperbólico) V= valor del reforzador M= Magnitud de la recompensa D= Demora de la recompensa K= Parámetro de la tasa descontadora Si el reforzador es entregado sin demora (D=0), el valor del reforzador estará directamente relacionado con su magnitud. Cuanto más se demora el reforzador menor es su valor. La función descontadora del valor explica el problema del autocontrol en el gráfico de la página 186. Me ha costado un poco entenderlo pero es bastante sencillo. Tenemos una línea horizontal que es el tiempo y una vertical que es el valor de la recompensa. También tenemos 2 momentos en el tiempo (T1 y T2). Dependiendo de qué momento escojamos elegiremos una recompensa u otra. Así por ejemplo en T1 vemos que la línea que lleva a la recompensa pequeña está por encima (tiene más valor) que la línea que lleva a la recompensa grande. Por lo tanto en T1 escogeremos la recompensa pequeña. Por el contrario en T2 la línea que lleva a la recompensa grande está por encima y escogeremos esta opción. La opción T2 es la opción de autocontrol Las funciones descontadotas y los problemas de autocontrol en la adicción a la droga: Cuando más acusada sea la función descontadora de la demora de una persona, más dificultad tendrá para mostrar autocontrol (seleccionando una recompensa mayor demorada) en lugar de impulsividad (seleccionando una recompensa más pequeña pero más rápida). Experimentos para medir el autocontrol en personas dependientes de la heroína demostró que tenían más impulsividad que el resto de las personas. (gráfico de la izquierda en 187). Para los dependientes de la heroína, el valor del dinero (con el que se realizaba el experimento) disminuyó muy rápido si iban a tardar en dárselo.

Page 64: Resumen principios de aprendizaje y conducta 1 9

Principios de Aprendizaje y conductaCAPITULO 6: PROGRAMAS DE REZORZAMIENTO Y CONDUCTA DE ELECCIÓN

¿Puede entrenarse el autocontrol? La respuesta es sí. Ejemplo con niños. 3 fases. Fase 1- Pretest: Se les pregunta a los niños si quieren 2 centimos ahora o 3 centimos al final del día. A los que eligen los 2 céntimos se les dan enseguida, a los que eligen los 3 centimos se les dan al final del día. Fase 2- Sesión de entrenamiento: Dependiendo de la elección en la fase 1, se hacen 2 grupos y se comienza con la sesión de entrenamiento. Deben resolver problemas sencillos para obtener la recompensa, las respuestas correctas del grupo de los 2 céntimos recibirán el dinero al instante. Las respuestas correctas del grupo de los 3 céntimos recibirán el dinero al final del día. Fase 3 – Postest: se les vuelve a preguntar a los niños lo mismo que en la fase 1. El hallazgo fue que había mayor cantidad de niños escogiendo la recompensa más grande demorada (3 céntimos) en el postest. Por lo tanto, siempre y cuando las tareas de entrenamiento (fase 2) impliquen bajo esfuerzo, el entrenamiento con la recompensa demorada incrementará la preferencia por la recompensa más grande demorada. Todo esto del autocontrol lo encuentro bastante relacionado con alguno de mis artículos:

- “Voluntad vs Hábito: el desafío de los 30 días” (21 Octubre 2009) - “Cómo aumentar tu autodisciplina” (26 y 30 Octubre 2009)

Page 65: Resumen principios de aprendizaje y conducta 1 9

Psicología del AprendizajeCAPITULO 7: COND. INSTRUMENTAL: MECANISMOS MOTIVACIONALES

Un sujeto está motivado para obtener un reforzador. Pero ¿qué significa estar motivado? Existen dos perspectivas que intentan dar solución a este problema:

1. Estructura asociativa del condicionamiento instrumental: (Thorndike). Toma una perspectiva molecular. Se centra en las respuestas individuales y sus antecedentes estimulares y consecuencias específicas.

2. Regulación conductual: (tradición skinneriana): El condicionamiento instrumental se considera desde un contexto más amplio, es decir, desde una perspectiva molar. Se analizan las opciones conductuales del organismo para alcanzar las metas, por lo tanto es una perspectiva más funcional.

Y ahora vamos a ver cada una de las dos en mayor profundidad… 1.ESTRUCTURA ASOCIATIVA DEL CONDICIONAMIENTO INSTRUMENTAL Thorndike: El condicionamiento instrumental incluye algo más que una respuesta y un reforzador. Deben considerarse 3 sucesos en el análisis del condicionamiento instrumental:

- Contexto estimular (E) - Respuesta instrumental (R) - Consecuencia de la respuesta o reforzador (C)

Estos 3 sucesos se relacionan entre sí creando distintos tipos de relaciones que vamos a ver a continuación. La asociación E-R y la ley del efecto El papel del reforzador (C) es establecer una asociación entre las claves contextuales (E) y la respuesta instrumental (R). La ley del efecto asume que el único papel del reforzador es crear una asociación E-R, ya que el reforzador (C) no participa en esta asociación. Expectativa de recompensa y la asociación E-C Los procesos pavlovianos son importantes en este tipo de asociación. El reforzamiento de la respuesta (R) producirá una asociación entre el contexto estimular (E) y la consecuencia de la respuesta (C). Hull estableció que la respuesta instrumental era motivada por dos factores:

a) (E) evoca la respuesta directamente por asociación con (R) b) La actividad instrumental también llega a realizarse en respuesta a la expectativa de

recompensa debido al establecimiento de una asociación R-C. La teoría moderna de los dos procesos: Esta teoría asume que hay 2 tipos de aprendizaje, el condicionamiento pavloviano y el instrumental y están relacionados de una forma especial:

Page 66: Resumen principios de aprendizaje y conducta 1 9

Psicología del AprendizajeCAPITULO 7: COND. INSTRUMENTAL: MECANISMOS MOTIVACIONALES

Durante el condicionamiento instrumental, (E) se relaciona con (C) a través de condicionamiento pavloviano. Entonces tenemos la asociación (E-C). A través de esta asociación, (E) motiva la conducta instrumental mediante la activación de un estado emocional central que dependerá de la naturaleza del reforzador (como puede ser la esperanza de obtener comida). Entonces dieron un paso más… ¿Cómo podían demostrar que este estado de esperanza finalmente motivaría la conducta instrumental? La tasa de una respuesta instrumental será modificada por la presentación de un estímulo clásicamente condicionado. Reforzar una presión de palanca con comida crea la expectativa de comida y la emoción de esperanza. Por lo tanto la presentación de un EC+ clásicamente condicionado con comida durante la ejecución de una respuesta reforzada debería aumentar la esperanza y por lo tanto incrementar la respuesta. Resultados consecuentes con la teoría moderna de los dos procesos Experimento de transferencia de control: (consta de 3 fases) Fase 1: Condicionamiento instrumental de una respuesta operante utilizando algún procedimiento de reforzamiento positivo o negativo. Fase 2: Se entrena a los participantes con un condicionamiento clásico en el cual se asocia un EC explícito con la presencia o ausencia de un estímulo incondicionado. Fase 3: Es la fase de transferencia crítica. Se permite a los participantes que realicen la respuesta instrumental y se presenta el EC de la fase 2 para comprobar su efecto en la tasa de conducta instrumental. Interacciones de respuesta en los experimentos de transferencia de control Un estímulo clásicamente condicionado puede influir sobre la conducta instrumental a través de las respuestas abiertas que elicita. Situación hipotética: Un estímulo condicionado clásicamente hace que un animal permanezca quieto y su respuesta instrumental es saltar hacia delante y hacia atrás. La consecuencia es que el EC disminuirá la respuesta instrumental y saltará menos. ¿Estados emocionales centrales condicionados o expectativas específicas de recompensa? En ciertas circunstancias los animales adquieren expectativas específicas del reforzador en lugar de un estado emocional más general de “esperanza” durante el condicionamiento instrumental y clásico. Relaciones R-C y E(R-C) en el condicionamiento instrumental En los dos tipos de asociaciones que hemos visto antes (Throndike E-R y asociación E-C) no se incluía de forma directa una relación entre la respuesta (R) y el reforzador (C). Esto es importante ya que de forma informal nosotros responderíamos que estamos realizando una determinada conducta (R) para conseguir una determinada consecuencia o reforzador (C), sin embargo ninguno de los dos modelos contempla está asociación directa R-C.

Page 67: Resumen principios de aprendizaje y conducta 1 9

Psicología del AprendizajeCAPITULO 7: COND. INSTRUMENTAL: MECANISMOS MOTIVACIONALES

Evidencia de asociaciones R-C: Una técnica para probar la asociación respuesta-consecuencia consiste en devaluar el reforzador después del condicionamiento clásico para ver si esto disminuye la respuesta instrumental. La devaluación de un reforzador debilita selectivamente la respuesta particular que ha sido entrenada con ese reforzador. Evidencia del aprendizaje de una relación jerárquica E-(R-C): Las asociaciones R-C no pueden actuar aisladamente para producir la conducta instrumental. Se necesita un factor adicional para activar la asociación R-C. Y este factor es el estímulo (E). 2. REGULACIÓN CONDUCTUAL Los análisis de la regulación conductual se centran en cómo las contingencias instrumentales ponen limitaciones a las actividades de un organismo. Antecedentes de la regulación conductual Al principio se consideraba que los reforzadores eran unos estímulos especiales que fortalecían la conducta instrumental. La teoría de la respuesta consumatoria: (Fred Sheffield)- Las respuestas consumatorias típicas de la especie (comer, beber, etc) son en sí mismas el rasgo crítico de los reforzadores. Se consideró que las respuestas reforzadoras eran especiales porque involucraban la consumación o completamiento de una secuencia instintiva de conducta. El principio de Premack: Las respuestas incluidas en los reforzadores comúnmente utilizados son actividades que es altamente probable que realicen los animales (respuesta de comer en una rata privada de comida). Por el contrario las respuestas instrumentales son actividades que normalmente ocurren a una baja probabilidad (respuesta de presionar una palanca). Y a continuación el enunciado de este principio como Dios manda: “Dadas dos respuestas de diferente probabilidad, A y B, la oportunidad para realizar la respuesta de alta probabilidad A después de la respuesta de baja probabilidad B tendrá como resultado el reforzamiento de la respuesta B. La oportunidad para realizar la respuesta B de baja probabilidad después de la respuesta A de alta probabilidad no dará como resultado el reforzamiento de la respuesta A”

(B→ A refuerza B)

(A→ B no refuerza A) Comer reforzará la presión de la palanca porque comer es normalmente más probable que presionar la palanca. Sin embargo, la presión de la palanca no puede reforzar el comer. Por todo esto, el principio de Premack también recibe el nombre de principio de la probabilidad diferencial.

Page 68: Resumen principios de aprendizaje y conducta 1 9

Psicología del AprendizajeCAPITULO 7: COND. INSTRUMENTAL: MECANISMOS MOTIVACIONALES

En resumen: El principio de Premack significó un avance importante en el pensamiento científico sobre el reforzamiento. Estimuló la consideración de los reforzadores como respuestas más que como estímulos. Con este principio cualquier actividad podía servir como reforzador siempre y cuando fuera más probable que la respuesta instrumental. La Hipótesis de la privación de respuesta: (Timberlake y Allison): La restricción de la respuesta reforzadora es el factor crítico para el reforzamiento instrumental. Incluso el acceso a una respuesta de baja probabilidad puede servir como reforzador siempre y cuando los sujetos tuvieran la restricción de realizar esa respuesta. Por lo tanto esto entra en conflicto con el principio de Premack al mostrar que la privación de respuesta es más básica para la motivación de la conducta instrumental que la probabilidad diferencial de la respuesta. Tanto la teoría de Premack como la hipótesis de la privación de respuesta sugieren que los reforzadores no existen en sentido absoluto. Regulación conductual y el punto de deleite conductual El concepto de regulación está muy relacionado con la homeostasis. Los organismos tienen una distribución de actividades preferida que luchan por mantener frente a los cambios. Si se perturba este nivel de actividades óptimo, se supone que la conducta cambiará para regular la desviación. Punto de deleite conductual: Si los organismos son libres para distribuir sus respuestas entre varias alternativas, lo harán de forma en que sea más cómodo para ellos. Este punto puede identificarse mediante la frecuencia relativa de ocurrencia de todas las respuestas de un organismo en una situación sin restricciones. (gráfico pág 205) Imposición de una contingencia instrumental: (seguimos observando el gráfico de la 205) La contingencia consiste en un programa mediante el cual se le pide al estudiante que estudie la misma cantidad de tiempo que dedica a ver la television. (es la línea que parte del origen con un ángulo de 45º). Una contingencia instrumental no permite volver al punto de deleite. Sin embargo el punto de deleite conductual sigue teniendo importancia ya que proporciona la motivación para la conducta instrumental. Volver al punto conductual sigue siendo una meta en la distribución de respuestas. Modelo de desviación minima (Staddon): La introducción de una contingencia respuesta-reforzador provoca que los organismos redistribuyan sus conductas entre las respuestas instrumentales y contingentes de manera que se minimice la desviación total de las dos respuestas con respecto al punto óptimo o de deleite. (es el punto negro de la línea del gráfico de la página 205) Explicación de los efectos del reforzamiento: El efecto de reforzamiento se identifica por un incremento en la ocurrencia de una respuesta instrumental sobre el nivel de esa conducta en ausencia de la contingencia respuesta-reforzador. Siguiendo con el ejemplo del estudiante, para acercarse al punto de deleite conductual, el estudiante tiene que

Page 69: Resumen principios de aprendizaje y conducta 1 9

Psicología del AprendizajeCAPITULO 7: COND. INSTRUMENTAL: MECANISMOS MOTIVACIONALES

aumentar su estudio para obtener más oportunidad de ver la television. Y al aumentar el estudio se produce el reforzamiento que es lo que buscamos. Una vision sobre las contingencias de reforzamiento en un contexto conductual más amplio: El contexto también influye en todo esto ya que las contingencias instrumentales no suceden en un vacío, ocurren en un contexto en el que se puden dar una variedad de respuestas y reforzadores. Si el estudiante prefiere escuchar la radio en lugar de ver la TV, no aumentará su conducta de estudio como para conseguir su cantidad de tiempo preferida de TV. Y ahora nos van a relacionar todo esto con la economía… Conceptos económicos y distribución de respuesta “La economía es el estudio de la distribución de la conducta dentro de un sistema de restricciones” Economía: Las restricciones de la conducta se imponen por los ingresos de un individuo y el precio de los bienes que se quiere obtener. Psicología: En las situaciones de condicionamiento instrumental, las restricciones están proporcionadas por el número de respuestas que un organismo es capaz de realizar y el número de respuestas requerido para obtener el reforzador. Demanda del consumidor: Es fundamental la relación entre el precio de una comodidad y cuánto se obtiene, esto se denomina curva de la demanda Elasticidad de la demanda: Grado en el cual el precio influye en el consumo. La demanda de caramelos es mu elástica, quiere decir que conforme más suba el precio de los caramelos más descenderá su compra. (gráfico pág 209) ¿Y cómo relacionamos todo esto con el reforzamiento instrumental?: ESTABLECIENDO ANALOGÍAS.

- El número de respuestas (o tiempo dedicado a responder) es el dinero. - El “precio” de un reforzador es el tiempo o número de respuestas requeridas para

obtener (adquirir) el reforzador. La meta es comprender cómo la conducta instrumental (gasto) está controlada por las contingencias instrumentales (precios). Determinantes de la elasticidad de la demanda: Existen 3 factores que influyen en cómo las restricciones de un programa moldean la redistribución de la conducta: 1. Disponibilidad de sustitutos: El grado en que los aumentos en el precio de un artículo producen una disminución en el consumo depende de la disponibilidad (y precio) de otros bienes que puedan utilizarse en sustitución del artículo original. La disponibilidad de sustitutos aumenta la sensibilidad del artículo original a los precios altos. Si algo aumenta de precio y yo tengo una alternativa, dejaré de comprarlo rápidamente y adquiriré la segunda alternativa. (el café es sustituto del te ya que ambos contienen cafeina).

- Economía abierta: A los animales se les da comida fuera de las sesiones experimentales

Page 70: Resumen principios de aprendizaje y conducta 1 9

Psicología del AprendizajeCAPITULO 7: COND. INSTRUMENTAL: MECANISMOS MOTIVACIONALES

- Economía cerrada: Los animales no reciben alimentación suplementaria.

2. Rango de precios: Un aumento en el precio tiene menos efecto en precios bajos que en precios altos. En un rango de precios bajos, la demanda de comida no es elástica. (no olvidemos que cuando hablamos de precio nos estamos refiriendo al número de respuestas para obtener un reforzador). 3. Nivel de ingresos: Cuanto más salario, menos se desanimará un consumidor con los incrementos del precio. Extrapolando esto a los programas de reforzamiento, el número de respuestas o el tiempo disponible para responder corresponde a los ingresos, por lo tanto cuantas más respuestas o tiempo tengan disponibles los animales, menos estará su conducta influida por los aumentos en el coste del reforzador. Problemas con las aproximaciones de regulación conductual

- El punto de deleite es una característica molar de la conducta. Se basa en una medida de cada respuesta acumulada a lo largo de un bloque temporal amplio. En el ejemplo del niño que estudiaba y veía TV, el punto de deleite lo podía haber alcanzado viendo todo el tiempo la TV antes de estudiar o alternando ambas respuestas. Desde la aproximación punto de deleite conductual no importa que estrategia utilizara, sin embargo sí que es importante desde el punto de deleite molar.

- Otro problema es que las respuestas durante un período de línea de base libre no siempre tienen el mismo valor como respuestas que ocurren como parte de una contingencia instrumental impuesta. Es decir, debemos asumir que estudiar en ausencia de una restricción de respuesta impuesta externamente tiene que tener el mismo valor que estudiar para obtener acceso a la TV. Sin embargo esto es incorrecto, correr por placer es diferente que cuando se requiere por una contingencia instrumental impuesta (correr en una clase de gymnasia).

- La regulación conductual no estudia los procesos conductuales moleculares, por lo

tanto no dice nada acerca de cómo los organismos defienden una combinación preferida de bienes o actividades.

Contribuciones de la regulación conductual

1. La regulación conductual y el principio de Premack nos alejó de la consideración de los reforzadores como tipos especiales de estímulos o como tipos especiales de respuestas.

2. Los procedimiento de condicionamiento instrumental ya no se considera que “estampan” o “fortalecen” la conducta instrumental, en su lugar es visto como una nueva distribución de respuestas.

3. No existe una distinción fundamental entre las respuestas instrumentales y las reforzadoras. Se distinguen únicamente por los papeles asignados a ellas mediante un procedimiento de condicionamiento instrumental.

4. La regulación conductual y la economía conductual aceptan la idea de que los organismos responden para maximizar sus beneficios

Page 71: Resumen principios de aprendizaje y conducta 1 9

Psicología del AprendizajeCAPITULO 7: COND. INSTRUMENTAL: MECANISMOS MOTIVACIONALES

5. La regulación conductual y la economía conductual han proporcionado caminos

nuevos para describir las restricciones que imponen varios procedimientos de condicionamiento instrumental en el repertorio de conducta de un organismo.

3. COMENTARIOS FINALES En este apartado se realiza una comparación a nivel general entre el punto 1 y el 2 de este tema, es decir, la estructura asociativa y la regulación conductual. Características propias de cada teoría que no comparte con la otra Asociacionismo

- Concepto de asociación - Exploración de los circuitos neuronales - Nivel molecular: El objetivo son los estímulos específicos, las respuestas y sus

conexiones. - Está relacionada con procesos específicos (asociaciones E-R, E-C, R-C, etc)

Regulación conductual

- Concepto de regulación conductual (puntos de deleite y restricciones del programa) - Poca aplicación neurológica - Nivel molar de agregados de conducta. - Está relacionada con metas a largo plazo

Page 72: Resumen principios de aprendizaje y conducta 1 9

Psicología del AprendizajeCAPITULO 8: EL CONTROL DE LA CONDUCTA POR EL ESTÍMULO

Respondemos de distinta manera dependiendo del estímulo que se nos presente. La supervivencia de los animales depende de su habilidad para responder apropiadamente a la situación. 1. IDENTIFICACIÓN Y MEDIDA DEL CONTROL POR EL ESTÍMULO ¿Cómo podemos afirmar que una respuesta instrumental está bajo el control de ciertos estímulos? Respuesta diferencial y discriminación de estímulos Experimento en palomas: Reforzamiento consistente en picotear un triángulo rojo con fondo rojo. Cuando la paloma aprendió a picotear de forma estable el triángulo con fondo rojo se separaron los estímulos (por un lado el triángulo y por otro el fondo rojo) y se midió la respuesta en cada uno de ellos. El resultado fue que picoteaba mucho más el fondo rojo que el triángulo. Por lo tanto decimos que el fondo rojo controla la conducta de picoteo mejor que el triángulo. Otro concepto importante aquí es el de discriminación de estímulos: Un organismo muestra discriminación de estímulos si responde de forma diferente a dos o más estímulos. En realidad al hablar del control y de la discriminación estamos hablando de lo mismo pero desde diferentes puntos de vista. Uno no existe sin lo otro. Además, en ausencia de procedimientos especiales, los investigadores no siempre pueden predecir cuál de varios estímulos de aquellos que un organismo experimenta adquirirá control sobre su conducta instrumental. Generalización de estímulos Se dice que un organismo muestra generalización de estímulos si responde de forma similar a dos o más estímulos. Pavlov descubrió esto al observar cómo después de utilizar un estímulo como EC, sus perros también daban la respuesta condicionada a otros estímulos semejantes. Gradiente de generalización de estímulos: Experimento en Palomas: Picoteaban una tecla de 580nm de longitud de onda, se demostró que ante variaciones de la longitud entre 570 y 590 seguían respondiendo de la misma forma. El intervalo donde se generalizan las respuestas (570-590) es lo que se conoce como gradiente de generalización del estímulo. Los gradientes de generalización del estímulo como medidas del control por el estímulo Los gradientes facilitan información acerca del grado de sensibilidad de la conducta de un organismo antes la variación de un aspecto particular del ambiente. Los investigadores pueden determinar exactamente el grado en que tiene que modificarse un estímulo para producir un cambio en la conducta.

- Si un gradiente es muy plano (gráfico pág 222) quiere decir que el rasgo que se varía en la prueba de generalización no controla la conducta instrumental. Por ejemplo, las palomas ciegas como no veían las diferencias en los colores, seguían

Page 73: Resumen principios de aprendizaje y conducta 1 9

Psicología del AprendizajeCAPITULO 8: EL CONTROL DE LA CONDUCTA POR EL ESTÍMULO

picoteando de igual forma aunque el estímulo se saliese del gradiente, y por lo tanto la línea del gradiente es prácticamente plana.

- Por el contrario, si el gradiente es muy acusado (gráfico 221) quiere decir que el organismo responde en mayor medida a algunos estímulos de prueba que a otros.

Resumiendo: “Lo acusado del gradiente de generalización de un estímulo proporciona una medida precisa del grado de control del estímulo”. La generalización y la respuesta diferencial son fenómenos opuestos. 2. FACTORES DEL ESTÍMULO Y LA RESPUESTA EN EL CONTROL POR EL ESTÍMULO En el experimento de las palomas era muy fácil dividir las características del estímulo (triángulo y fondo rojo), sin embargo en la vida real es mucho más dificil dividir las características ya que las situaciones son mucho más complejas. Por lo tanto…¿Qué es lo que determina que una de las muchas características de una situación estimular adquiera control sobre la conducta instrumental? Lo vamos a ver a continuacion: Capacidad sensorial y orientación La capacidad sensorial y de orientación determinan qué estímulos se incluyen en el mundo sensorial de un organismo. Lo que esté fuera de su rango sensorial no existe para un organismo (los seres humanos no podemos oir los ultrasonidos, sin embargo los perros sí) Facilidad relativa del condicionamiento de varios estímulos Aparte de tener la capacidad sensorial, la intensidad con que los organismos aprenden sobre un estímulo depende de la facilidad relativa de condicionamiento de otras claves presentes en la situación. Esto se conoce como ensombrecimiento. Ejemplo de un niño que aprende a leer viendo los dibujos de un libro ignorando las frases. Luego al ir describiendo los dibujos parecerá que está leyendo cuando en realidad no es así. Cuanto más intenso sea el estímulo, más rápido se condicionará y ensombrecerá el aprendizaje del estímulo más débil. Tipos de reforzamiento Es más probable que ciertos tipos de estímulos adquieran control sobre la conducta instrumental con reforzamiento positivo que con reforzamiento negativo. Ejemplo en Palomas

- Reforzamiento positivo (comida) con tono y luz roja: Respondieron más a la luz roja - Reforzamiento negativo (descarga) con tono y luz roja: Respondieron más al tono

Esto se puede explicar por los sistemas de conducta que se activan en cada caso. En el caso de la alimentación las claves visuales son más dominantes (luz roja) mientras que en

Page 74: Resumen principios de aprendizaje y conducta 1 9

Psicología del AprendizajeCAPITULO 8: EL CONTROL DE LA CONDUCTA POR EL ESTÍMULO

el caso de evitar el peligro son más importantes los tonos (el animal oye a un depredador acercarse) Por lo tanto, para una misma combinación de estímulos se pueden dar respuestas diferentes dependiendo del tipo de condicionamiento empleado, debido al sistema de conducta que se activa en cada caso. Tipos de respuesta instrumental Otro factor importante es el tipo de respuesta requerida para el refozamiento. En un experimento con perros se demostró que las respuestas que se diferencian por la localización (levantar la para derecha/levantar la pata izquierda) es más probable que estén bajo el control de la característica especial de las claves auditivas. Por el contrario las respuestas que se diferencian por la naturaleza (hacer/no hacer) es más probable que lleguen a estar bajo el control de la naturaleza de la clave auditiva. Respuestas de localización (levantar derecha o izquierda) – Localización clave auditiva Respuestas de naturaleza de la acción (hacer o no hacer) – Tipo de clave auditiva Aunque esto parezca un poco complejo de entender, en realidad es bastante sencillo. El experimento en perros que se explica en las páginas 226-228 lo deja bastante claro. A todo este fenómeno lo llamamos: efecto de la naturaleza-localización El efecto de naturaleza-localización es un ejemplo de asociación selectiva. Hay otros ejemplos de asociación selectiva: Claves relacionadas con el sabor – Asociadas con la enfermedad Claves audiovisuales – Asociadas con descarga eléctrica Elementos del estímulo frente a claves configuracionales en los estímulos compuestos Aproximación elemental del estímulo: Los distintos elementos que forman un estímulo (localización, color, sonido, etc) son tratados por el organismo como rasgos distintivos y sepadados del ambiente. Aproximación de la clave configuracional: (es lo contrario a lo anterior): Los estímulos son percibidos como un todo integral y no se dividen en partes más pequeñas. Ejemplo metafórico con una orquesta: Como aproximación elemental sería fijarnos en como suena la música que emite cada integrante (flauta, clarinete, tambores, etc) y como aproximación configuracional sería analizar cómo suena la pieza musical en sí cuando todos la tocan al unísono. Aunque parezcan aproximaciones opuestas, se han elaborado teorías para unificarlas. Se piensa que en ciertas circunstancias predomina el control elemental mientras que en otras condiciones predomina el control de las características configuracionales.

Page 75: Resumen principios de aprendizaje y conducta 1 9

Psicología del AprendizajeCAPITULO 8: EL CONTROL DE LA CONDUCTA POR EL ESTÍMULO

3. FACTORES DE APRENDIZAJE EN EL CONTROL POR EL ESTÍMULO El hecho de que ciertos estímulos puedan percibirse no asegura que llegarán a controlar la conducta (un niño puede ver un debate Rajoy-Zapatero y no distinguir diferencias entre ellos). Para que ciertos estímulo lleguen a controlar la conducta, también depende de lo que el organismo haya aprendido de ellos. Pavlov: La generalización del estímulo se da porque el aprendizaje sobre el EC llega a tranferirse a otros estímulos. Lashley y Wade (contrarios a Pavlov): La generalización del estímulo ocurre si los organismos no han aprendido a distinguir las diferencias entre estímulos. Por lo tanto la generalización del estímulo refleja ausencia de aprendizaje. Entrenamiento en discriminación de estímulos Los participantes se exponen a dos estímulos diferentes (luz roja y otra verde) pero solo se les refuerza en uno de los dos colores. Figura 8.7 pág 231: La luz roja señala la disponibilidad de reforzamiento para la respuesta. La luz verde señala que la respuesta no sera reforzada. El estímulo que señala disponibilidad de reforzamiento se denomina E+ o ED (e de) El estímuo que señala la falta de reforzamiento se denomina E- o

E Δ (e delta) A medida que progresa el entrenamiento, la respuesta de los organismos en presencia de E+ aumenta mientras que la respuesta en presencia de E- declina. Cuando tanto E+ como E- han adquirido control sobre la conducta del organismo, se llaman estímulos discriminativos. Programa múltiple de reforzamiento: el procedimiento de la figura 8.7 es un ejemplo de este tipo de programa. En un programa múltiple funcionan diferentes programas de reforzamiento en presencia de diferentes estímulos. (Por ejemplo que esté funcionando un programa de IV de reforzamiento cuando se enciende una luz y un programa de RF cuando se presenta un tono) Efectos del entrenamiento en discriminación sobre el control por el estímulo Para poder hacernos una idea de la precisión de control que el E+ adquiere sobre la conducta instrumental no basta con solamente observar la respuesta diferencial ante E+ y E-. Se debe también determinar lo acusado del gradiente de generalización. Varios experimentos realizados por Jenkins y Harrison aportaron las siguientes conclusiones:

- El entrenamiento en discriminación aumenta el control por el estímulo de la conducta instrumental

- Una dimensión particular del estímulo (como la frecuencia tonal) es más probable que adquiera control sobre la respuesta si el E+ y el E- difieren a lo largo de la dimensión del estímulo

Page 76: Resumen principios de aprendizaje y conducta 1 9

Psicología del AprendizajeCAPITULO 8: EL CONTROL DE LA CONDUCTA POR EL ESTÍMULO

Rango de posibles estímulos discriminativos Los procedimientos de discriminación pueden ser utilzados para situar la conducta instrumental de un organismo bajo el control de una amplia variedad de estímulos (palomas aprendiendo a distinguir diapositivas de Monet y Picasso, o distinguiendo la música de Bach de la de Stravinsky). Estos procedimientos se utilizan a menudo para evaluar la capacidad sensorial de los animales. También se realizaron experimentos inyectando cocaína a Palomas para ver si podían distinguir las sensaciones internas que les provocaba esa droga. La conclusión fue que efectivamente el entrenamiento en discriminación sí que aumentó el control de la conducta por las sensaciones internas creadas por la cocaína. ¿Qué se aprende en el entrenamiento por discriminación? Tenemos un E+ (luz roja) y un E- (tono intenso) Un organismo puede aprender 3 cosas diferentes con prácticamente los mismos resultados:

1- Responder sólo ante la presencia de E+ y no aprender nada acerca de E- 2- Aprender a suprimir la respuesta durante E- pero no aprender nada acerca del E+ 3- Aprender el significado tanto de E+ como de E-

Teoría de Spence del aprendizaje de discriminación Se basa en la tercera opción que acabamos de ver. La mera observación de que los organismos responden más al E+ que al E- no es suficiente para probar que han aprendido algo acerca de ambos estímulos. Por lo tanto haremos experimentos donde utilizaremos los gradientes de generalización del estímulo. Gradiente de generalización del estímulo excitatorio: Si se ha condicionado una tendencia excitatoria al E+, debe observarse un gradiente de generalización acusado con la mayor cantidad de respuesta ante el E+. Gradiente de generalización del estímulo inhibitorio: Si se ha condicionado una tendencia inhibitoria al E-, entonces los estímulos que difieran progresivamente del E- deberían ser cada vez menos efectivos en inhibir la respuesta instrumental. Algunos experimentos relacionados con esto muestran que el entrenamiento en discriminación puede producir tanto condicionamiento excitatorio al E+ como condicionamiento inhibitorio al E-.

Page 77: Resumen principios de aprendizaje y conducta 1 9

Psicología del AprendizajeCAPITULO 8: EL CONTROL DE LA CONDUCTA POR EL ESTÍMULO

Interacciones entre el E+ y el E-: desplazamiento del máximo Lo que se aprende el sujeto sobre el E+ puede influir en la respuesta al E- y viceversa, sobre todo si ambos se encuentran relacionados de alguna manera. Discriminación intradimensional: Se produce cuando el E+ y el E- son semejantes excepto por un rasgo o atributo. La discriminación intradimensional es una forma de ejecución experta. (cuando dos cosas son muy parecidas, hace falta ser un experto para poder captar las diferencias sutiles) Por ejemplo, si entrenamos una luz de 500 nm como E+ y una luz de 600 nm como E-, y luego presentamos 4 luces de 450, 490, 590 y 650 nm cómo estímulos de prueba. El máximo de respuesta no se emite ante la luz de 490 nm (que es valor más parecido al E+ original: 500 nm), sino ante un valor distinto en dirección opuesta al E-, en este caso: 450 nm. Explicación de Spence del desplazamiento del máximo: La explicación de Spence a este fenómeno se basa en la interacción en forma de superposición matemática de los valores absolutos de los E+ y E- originales (los que han participado en el entrenamiento). En otras palabras, Spence considera que, independientemente de los estímulos que se presenten en la prueba de generalización, es posible calcular el valor del rasgo del estímulo hacia el que va a desplazarse el máximo de respuestas atendiendo exclusivamente a los valores netos de los E+ y E- originales. Por ejemplo, si el E+ es una luz de 100 nm y el E- una luz de 50 nm, puede deducirse que el máximo de respuesta se emitirá ante una luz de 150 nm, independientemente del valor que tengan en ese rasgo los estímulos de prueba que se presenten. Explicaciones alternativas del desplazamiento del máximo: La explicación alternativa asume que los organismos aprenden a responder a un estímulo basándose en la relación de ese estímulo con otras claves de la situación (a diferencia del modelo de Spence que es un modelo de aprendizaje absoluto del estímulo) Entrenamiento de equivalencia de estímulos De la misma forma que el entrenamiento en discriminación potencia la respuesta diferencial, el entrenamiento en equivalencia potencia la respuesta generalizada o equivalencia de estímulos. El emparejamiento de estímulos diferentes con la misma consecuencia crea equivalencia funcional entre esos estímulos con la consecuencia de que una respuesta condicionada a uno de ellos se generalizará a los otros. Se dice que existe una clase de equivalencia si sus miembros poseen 3 propiedades matemáticas:

1) Reflexividad o igualdad (A=A, B=B, C=C) 2) Simetría (si A lleva a B, diremos que también B lleva a A) 3) Transitividad (Si A lleva a B y B lleva a C, diremos que A lleva a C)

Page 78: Resumen principios de aprendizaje y conducta 1 9

Psicología del AprendizajeCAPITULO 8: EL CONTROL DE LA CONDUCTA POR EL ESTÍMULO

4. CLAVES CONTEXTUALES Y RELACIONES CONDICIONALES Estímulo discreto: Aquel que se presenta durante un breve período de tiempo y tiene un comienzo y un final claros. Sin embargo los estímulos discretos suceden en presencia de un fondo de claves contextuales que también pueden proporcionar una fuente importante de información acerca de la conducta aprendida. Control por claves contextuales Las claves contextuales pueden llegar a controlar la conducta de varias formas. En un experimento con codornices macho, mostraban predilección por contextos en los que previamente se les habían presentado una hembra sexualmente receptiva. Por lo tanto las asociación de claves contextuales con el reforzamiento sexual aumentó la preferencia por estas claves. Este experimento muestra que las claves contextuales pueden llegar a controlar la conducta si sirven como señal para un EI o un reforzador. Entonces…¿Sirven las claves conductuales para controlar la conducta cuando no señalan ningún reforzamiento, sino que simplemente son estímulos de fondo? En varios experimentos se concluyó que efectivamente las claves contextuales (sin reforzador) también pueden llegar a controlar la conducta instrumental. Además el control contextual por el estímulo puede ocurrir sin que un contexto esté más fuertemente asociado con el reforzamiento que otro. Control de las relaciones condicionales Relaciones binarias: Son las relaciones entre dos eventos (un EC y un EI) Modulador: En ciertas circunstancias la naturaleza de una relación binaria está determinada por un tercer suceso llamado modulador. (en los experimentos anteriores el contexto ejercía de modulador) Relación condicional: Es la relación de un modulador con la relación binaria que señala. Control condicional en el condicionamiento pavloviano: El concepto fundamental del control condicional es que un evento señala la relación entre otros dos eventos. Ejemplo con EC (luz naranja) y la presentación de comida (EI) Establecer una relación condicional requiere introducir un tercer suceso (modulador) que indica cuándo la presentación de luz en la tecla terminará con comida. Podría ser un estímulo auditivo. Los resultados muestras que los pájaros picoteaban la tecla naranja mucho más cuando se presentaba después de la presentación del modulador que cuando se presentaba como un elemento aislado. Por lo tanto la presencia del modulador facilita la respuesta al EC de la luz de la tecla.

Page 79: Resumen principios de aprendizaje y conducta 1 9

Psicología del AprendizajeCAPITULO 8: EL CONTROL DE LA CONDUCTA POR EL ESTÍMULO

Un estímulo discriminativo facilita la respuesta instrumental mientras que el modulador facilita la respuesta elicitada por el EC. Estímulos discriminativos: Reciben este nombre los moduladores (E+ y E-) en los procedimientos de discriminación instrumental. Otras terminologías: (En el condicionamiento pavloviano) Facilitación: Es otro nombre con el que se conoce al control condicional de la respuesta, debido a que el modulador facilita la respuesta al EC. Facilitador: Otro nombre con el que se conoce al modulador. (en el condicionamiento clásico) Establecimiento de la ocasión: lo mismo que facilitación Establecedor de la ocasión: lo mismo que facilitador Distinción entre la excitación y la modulación

- La extinción es un procedimiento en el cual un estímulo previamente condicionado se presenta repetidamente pero se omite el EI. El resultado típico de la extinción es que disminuye la respuesta condicionada.

La diferencia en los efectos de un procedimiento de extinción sobre los estímulos condicionados excitatorios y los establecedores de la ocasión está relacionada con lo que se señala en cada uno de los procedimientos (y aquí es donde encontramos la distinción): - Un estímulo condicionado excitatorio señala la próxima presentación del EI. La ausencia del EI después de la presentación del EC durante la extinción es una violación de esa expectativa. Por lo tanto el valor como señal del EC tiene que reajustarse en la extinción para estar en consonancia con la nueva realidad. Un reajuste como éste no se requiere en un procedimiento de extinción de un establecedor de la ocasión. Por otro lado…

- Un establecedor de la ocasión señala una relación entre un EC y un EI. La ausencia del EI cuando se presenta el establecedor de la ocasión (o modulador) por sí solo durante la extinción no significa que la relación entre el EC y el EI haya cambiado. En consecuencia la habilidad del modulador para promover la respuesta elicitada por el EC permanece intacta durante la extinción.

Modulación frente a condicionamiento configuracional: Antes veíamos un experimento con modulador (sonido) junto a un EC (luz naranja) y un EI (presetnación de comida). Para que el sonido sirva como una señal de que la luz de la tecla se emparejará con la comida, el sonido y la luz de la tecla tiene que ser tratados como elementos independientes más

Page 80: Resumen principios de aprendizaje y conducta 1 9

Psicología del AprendizajeCAPITULO 8: EL CONTROL DE LA CONDUCTA POR EL ESTÍMULO

que como una clave configuracional combinada. Por tanto, los efectos modulatorios requieren la respuesta al compuesto estimular como constituido por elementos independientes estimulares. Compuesto serial: Para promover que los organismos traten los compuestos estimulares como construidos por elementos independientes, los investigadores presentan los elementos uno tras otro, en lugar de simultáneamente.

Page 81: Resumen principios de aprendizaje y conducta 1 9

Psicología del AprendizajeCAPITULO 9: EXTINCIÓN DE LA CONDUCTA CONDICIONADA

La extinción implica la omisión del EI o reforzador.

- Extinción en el condicionamiento clásico: incluye presentaciones repetidas del estímulo condicionado por sí solo.

- Extinción en el condicionamiento instrumental: Implica no volver a presentar el reforzador como una consecuencia de la respuesta instrumental.

El resultado es que la respuesta condicionada (ya sea clásica o instrumental) disminuye. Por ello se piensa que la extinción es lo contrario a la adquisición (como en el Modelo de Rescorla y Wagner) sin embargo esto es incorrecto. Diferencia entre extinción y olvido Extinción: Se produce por la omisión del EI que sigue a las presentaciones del EC o la omisión del reforzador que sigue a la respuesta instrumental. Olvido: Disminución de la respuesta condicionada que se da con el paso del tiempo. 1. EFECTO DE LOS PROCEDIMIENTOS DE EXTINCIÓN

- La respuesta disminuye cuando no vuelve a producir reforzamiento - Además la variabilidad de la respuesta aumenta (si la llave de mi casa un día no

abre la puerta intentaré introducirle de distintas maneras a ver si lo consigo) Estos efectos se muestran en un experimento con ratas en el que la extinción produjo una disminución en el número de secuencias de respuesta que los sujetos realizaban pero aumentó la variabilidad de esas secuencias. Sin embargo es importante señalar que aparte de la variabilidad de respuestas también seguía dándose la respuesta inicial previa a la extinción, por lo tanto podemos decir que la estructura básica de la conducta instrumental se altera muy poco por el hecho de introducir la extinción. Por lo tanto: La extinción disminuye la tasa de respuesta e incrementa la variabilidad de respuesta, pero no altera de otro modo la estructura de la conducta. Además de estos efectos podemos encontrar otros efectos emocionales como consecuencia de la extinción: Frustración: Reacción emocional inducida por la falta de un reforzador esperado. Puede derivar en agresión. 2. EXTINCIÓN Y APRENDIZAJE ORIGINAL Aquí vamos a ver varios ejemplos que explican porqué la extinción no elimina por completo lo que se aprendió originalmente: Recuperación espontánea Recuperación espontánea tras el condicionamiento pavloviano: El efecto de la extinción se pierde con el tiempo. Por lo tanto la respuesta condicionada volverá a estar

Page 82: Resumen principios de aprendizaje y conducta 1 9

Psicología del AprendizajeCAPITULO 9: EXTINCIÓN DE LA CONDUCTA CONDICIONADA

presente si el sujeto se pone a prueba tras una demora que siga al procedimiento de extinción. Recuperación espontánea tras el condicionamiento instrumental: (la explicación es más o menos la misma que en el ejemplo pavloviano anterior). En un experimento con ratas se demostró que la respuesta cuya recuperación se comprobó tras un período de descanso posterior a la extinción (R-Descanso) se dio a una tasa mucho más alta que la respuesta cuya recuperación se midió sin un período de descanso posterior a la extinción (R-No descanso). Por lo tanto: La introducción de un período de descanso tras la extinción produjo una recuperación sustancial en la respuesta. Renovación del condicionamiento excitatorio original Renovación: Se refiere a la recuperación de la ejecución propia de la adquisición que se da cuando se cambian las claves contextuales que estaban presentes durante la extinción. En un experimento con ratas se comprobó que un miedo condicionado y posteriormente extinguido se renovava cuando se retiraba al grupo de ratas del nuevo contexto y se volvía a introducir en el contexto original de aprendizaje. Por lo tanto: El hecho de que el miedo condicionado se renovara, indica que la pérdida de supresión durante la fase de extinción no refleja desaprendizaje de la respuesta de miedo condicionado. Es decir, a pesar de la extinción y de que las ratas han dejado de dar la respuesta, al cambiarlas de contexto la recuperan, por lo tanto nunca la desaprendieron. La renovación también puede darse si el sujeto se retira del contexto de adquisición a un contexto alternativo que no es el de la adquisición original. Sin embargo en este caso la renovación no es tan sólida como cuando se lleva al contexto original. Otra explicación de la renovación: propiedades excitatorias condicionadas del contexto de renovación: 1) Contexto A: Adquisición original 2) Contexto B. Extinción 3) Vuelta al contexto A que tiene propiedades excitatorias ya que es ahí donde se produjo la adquisición. Sin embargo algunos experimentos han demostrado que esto no es así…¿entonces para qué nos lo hacen estudiar???? Implicación en la terapia de conducta: Aunque un procedimiento terapeútico sea efectivo extinguiendo una fobia en la seguridad de una sala de consulta del terapeuta, el miedo condicionado puede volver a presentarse cuando el paciente se enfrente con un EC de miedo en un contexto diferente. Para reducir el efecto de renovación, investigadores han llevado a cabo la extinción en distintos contextos.

Page 83: Resumen principios de aprendizaje y conducta 1 9

Psicología del AprendizajeCAPITULO 9: EXTINCIÓN DE LA CONDUCTA CONDICIONADA

Restauración de la ejecución propia de la extinción Como ya hemos visto antes: La renovación implica la reactivación de la memoria del condicionamiento original mediante la retirada del sujeto de las claves contextuales presentes durante la extinción. Y ahora lo mismo dicho de otra manera: La renovación reactiva una conducta aprendida previamente mediante el cambio del contexto a condiciones más aproximadas a las presentes cuando la conducta se adquirió con anterioridad. Hasta aquí nada nuevo, se trata de lo mismo que hemos visto en el punto anterior. Sin embargo… De la misma forma que recuperamos la respuesta original, también podemos recuperar la respuesta de la extinción, (osea la “no respuesta”) Esto tiene mucho que ver con la recuperación espontánea ya que la conducta propia de la extinción puede restaurarse (contrarrestando la recuperación espontánea) presentando las claves que estaban presentes durante la fase de extinción. Nota para los que tengan mala memoria (como yo): Recuperación espontánea: Implica la recuperación de la conducta condicionada originalmente que sigue a la extinción si transcurre un período suficiente de tiempo tras la fase de extinción. Restablecimiento de la excitación condicionada Restablecimiento: Procedimiento que sirve para restaurar la respuesta a un estímulo condicionado extinguido. Ejemplo con patatas fritas: Si cojo aversión a las patatas fritas porque me puse enfermo en un viaje tras comerlas, la aversión se extinguirá comiendo patatas fritas en varias ocasiones sin caer enfermo. Sin embargo, el fenómeno del restablecimiento sugiere que si se cae enfermo otra vez por alguna razón, la aversión a las patatas fritas podría reaparecer aunque la enfermedad no tuviera nada que ver con ellas. Al igual que ocurría con el efecto de renovación, es importante considerar si el efecto del restablecimiento puede ser un resultado del condicionamiento contextual. El condicionamiento contextual es un posible factor contribuyente debido a que las presentaciones del EI que se dan durante la fase de restablecimiento pueden producir un condicionamiento de las claves contextuales de la situación experimental. Diversos estudios han demostrado que el papel del contexto en estos casos es suprimir la ambigüedad de significado de un estímulo que tiene una historia mezclada de condicionamiento y extinción. El contexto tiene un efecto pequeño en los estímulos que tienen una historia sólo de condicionamiento. En realidad se considera el restablecimiento como una forma de renovación: las claves contextuales condicionadas proporcionan algunas de las claves contextuales para la respuesta excitatoria en circunstancias normales. Estas claves contextuales se extinguen cuando se presenta el EC por sí solo durante la extinción.

Page 84: Resumen principios de aprendizaje y conducta 1 9

Psicología del AprendizajeCAPITULO 9: EXTINCIÓN DE LA CONDUCTA CONDICIONADA

Sensibilidad a la devaluación del reforzador Por más que he leido este apartado me cuesta mucho entenderlo por el libro. Asi que voy a poner directamente la explicación de un docente que he encontrado en el foro:

En una contingencia operante (instrumental), el procedimiento de devaluación de un reforzador consiste en asociar de forma pavloviana el estímulo que se está usando para reforzar una conducta (comida, por ejemplo) con algún otro estímulo de naturaleza inversa, es decir, aversivo (cloruro de litio, por ejemplo). El efecto resultante es una disminución de la respuesta operante que ha sido reforzada con el reforzador devaluado aunque ésta respuesta nunca haya sido contingente con el estímulo aversivo, ni siquiera con el reforzador tras el proceso de devaluación.

En una contingencia clásica (pavloviana, respondiente), el procedimiento es muy similar y consiste en asociar el EI (con el que se estaba condicionando el EC) con otro EI de naturaleza inversa. De nuevo, el efecto encontrado es una disminución de la RC ante el EC, aunque el EC nunca se haya relacionado directamente con el EI aversivo.

Lo relevante para el capítulo que nos ocupa (Extinción de la conducta condicionada) es que este efecto (el de la devaluación del reforzador) se observa también en estímulos (en el caso del condicionamiento clásico) y respuestas (en el caso del condicionamiento operante) que han sido sometidas a procedimientos de extinción. Es decir, que después de extinguir un EC, por ejemplo, si devaluamos el EI con el que se condicionó, la RC ante ese EC será todavía menor que si simplemente lo hubiésemos extinguido.

Este fenómeno se usa como evidencia para defender que los procesos de extinción no eliminan las asociaciones realizadas durante el condicionamiento. Es decir, que las asociaciones establecidas (EC-EI o R-Er) durante el aprendizaje no desaparecen durante la extinción, aunque el sujeto no emita la RC o la R.

3- ¿QUÉ SE APRENDE EN LA EXTINCIÓN? Asociaciones E-R inhibitorias La falta de reforzamiento produce una asociación E-R inhibitoria. ¿porqué ocurre esto? En realidad la extinción implica un tipo especial de ausencia de reforzamiento, es decir, se trata de ausencia de reforzamiento tras una historia de reforzamiento. La ausencia de reforzamiento sin esta historia previa no es extinción, sino más bien habituación. La ausencia de reforzamiento resulta aversiva sólo después de darse una historia de reforzamiento. Por lo tanto los efectos emocionales de la ausencia de reforzamiento dependen de forma crítica de la historia previa del sujeto. Si tu pareja nunca te ha hecho café por la mañana, no te sentirás desilusionado cuando te despiertes y veas que no hay café. Los efectos de la extinción son tanto conductuales como emocionales. Los efectos emocionales se originan en la frustración que se desencadena cuando un reforzador esperado no llega. Se supone que la ausencia de reforzamiento cuando se espera

Page 85: Resumen principios de aprendizaje y conducta 1 9

Psicología del AprendizajeCAPITULO 9: EXTINCIÓN DE LA CONDUCTA CONDICIONADA

recompensa desencadena una reacción frustrante aversiva incondicionada. Esta emoción aversiva sirve para que se deje de responder durante el curso de la extinción mediante el establecimiento de una asociación E-R inhibitoria. Efectos paradójicos de la recompensa Cuanto más entrenamiento con reforzamiento se proporciona, más fuerte será la expectativa de recompensa, y en consecuencia más fuerte será la frustración que se da cuando se introduce la extinción. Efecto de sobreentrenamiento en la extinción: Si la disminución en la respuesta se debe a los efectos frustrantes de la ausencia de recompensa, un entrenamiento más extenso debería producir una extinción más rápida. Es paradójico ya que el sentido común nos diría que un entrenamiento más extenso debería crear una respuesta más fuerte y más resistente a la extinción, pero sucede lo contrario. Efecto de la magnitud del reforzamiento en la extinción: La respuesta disminuye más rápido durante la extinción que sigue a un reforzamiento con un reforzador mayor. La ausencia de reforzamiento resulta más frustrante si el individuo espera una gran recompensa que si espera una pequeña. Efecto del reforzamiento parcial en la extinción (ERPE): (es el efecto más estudiado). Los efectos de la extinción serán diferentes dependiendo del programa de reforzamiento usado. La extinción es más lenta y produce menos reacciones de frustración si había un programa de reforzamiento parcial (o intermitente) en lugar de uno continuo. Un buen ejemplo de esto es el caso de los jugadores habituales ya que están a merced del reforzamiento intermitente. Las ganancias ocasionales les animan a seguir jugando a pesar de largos períodos de pérdidas. Mecanismos del efecto de reforzamiento parcial en la extinción Hipótesis de la discriminación: La ausencia de reforzamiento es mucho más fácil de detectar tras el reforzamiento continuo. El reforzamiento parcial parece enseñar a los sujetos a no rendirse ante la ausencia del reforzador, y esta persistencia aprendida se mantiene aun cuando los sujetos posteriormente experimenten una cadena ininterrumpida de sucesos. ¿Qué aprenden los sujetos durante el reforzamiento parcial que les hace más persistentes al enfrentarse a una racha de mala suerte o de fracasos?: 2 teorías que vamos a ver a continuación: Teoría de la frustración: Los sujetos aprenden sobre los efectos emocionales de la ausencia de recompensa durante el entrenamiento en reforzamiento parcial. Teoría secuencial: Está basada en lo que los sujetos aprenden sobre la memoria de la ausencia de recompensa. Y ahora vamos a ver estas teorías con más profundidad: Teoría de la frustración (Abraham Amsel): La persistencia en la extinción es resultado del aprendizaje de algo paradójico, es decir, continuar respondiendo cuando se espera no ser reforzado o ser frustrado. La teoría de la frustración asume que el reforzamiento

Page 86: Resumen principios de aprendizaje y conducta 1 9

Psicología del AprendizajeCAPITULO 9: EXTINCIÓN DE LA CONDUCTA CONDICIONADA

intermitente da como resultado aprender a responder a pesar de esperar la ausencia de reforzamiento. El reforzamiento intermitente da como resultado el aprendizaje de realizar la respuesta instrumental como reacción a la expectativa de ausencia de recompensa. Por el contrario, no existe nada en la experiencia del reforzamiento continuo que motive a los sujetos a responder cuando esperan ausencia de recompensa. El reforzamiento continuo no produce persistencia en la extinción. Teoría secuencial: (Capaldi) Esta teoría está formulada en términos de conceptos de memoria. Asume que los sujetos pueden recordar si fueron reforzador por realizar la respuesta instrumental en el pasado reciente. El sujeto aprende a responder siempre y cuando recuerde no haber sido reforzado en los ensayos precedentes. D. RESISTENCIA AL CAMBIO Y MOMENTO CONDUCTUAL Momento conductual: Este concepto se basa en el concepto de momento de la física newtoniana. El momento de un objeto físico es el producto de su peso (o masa) por su velocidad. Esta hipótesis dice que la conducta que posee un momento elevado también será difícil de “parar” o interrumpir por las manipulaciones. La investigación sobre el momento conductual se ha llevado a cabo utilizando programas múltiples de reforzamiento ya que capacitan a los investigadores para comparar la susceptibilidad de la conducta a la interrupción bajo dos condiciones diferentes en la misma sesión. Diversos experimentos concluyen que:

- El modelo conductual está relacionado directamente con la tasa de reforzamiento. Una tasa más alta de reforzamiento produce una conducta que tiene un mayor momento y que es menos susceptible a la interrupción.

- El momento conductual no está relacionado con la tasa de respuesta, es decir, do conductas que se dan a tasas semejantes no es preciso que tengan grados similares de momento conductual.

- Los programas que proporcionan tasas similares de reforzamiento pero tasas diferentes de respuesta tienen similares momentos o resistencias al cambio.

La idea del momento conductual resulta intrigante porque intenta captar en un único concepto la resistencia de la conducta a diversas posibilidades de cambio. El concepto “fuerza de la respuesta” está relacionado con esto.