¿Qué tipo de estímulo da como resultado una curva de aprendizaje óptima para ratas y ratones?

Cuando se usa el condicionamiento operante para entrenar ratones o ratas, ¿qué tipo de estímulo es más efectivo? Por ejemplo, ¿el refuerzo negativo de un ruido fuerte tiene un efecto más profundo que el refuerzo negativo del dolor? ¿Qué pasa con el refuerzo positivo? ¿Es el placer más poderoso que la comida? ¿Qué tipo de estímulo se considera óptimo para el aprendizaje?

Respuestas (1)

Primero, el concepto de optimalidad de una curva de aprendizaje no está bien definido. Puede medir al menos 3 aspectos diferentes del aprendizaje:

  1. Velocidad de aprendizaje
  2. Tiempo antes de la extinción
  3. Rendimiento al máximo

Por supuesto, también puede haber otras medidas, y cualquier combinación de tales medidas también puede ser una medida legítima para ciertos usos.

La aversión condicionada al gusto (CTA, por sus siglas en inglés) es una forma de aprendizaje en la que los animales (y los humanos) aprenden a evitar un tipo de alimento después de consumirlo y sufren síntomas parecidos a una intoxicación alimentaria poco después. En ciertos casos, el aprendizaje puede tomar una sola prueba, hacer que el animal evite completamente la comida y durar toda la vida [1] , lo que hace que este sea un aprendizaje óptimo en todas las 3 medidas anteriores.

Sin embargo, CTA es un tipo de aprendizaje muy especial y específico, y no te ayudará a enseñarle a tu rata a caminar en un laberinto... No he encontrado una comparación metodológica de diferentes tipos de refuerzos, y sospecho que tal la comparación puede ser muy difícil o incluso imposible , porque la eficacia de un refuerzo (positivo) se ve muy afectada por el "apetito" del animal por él: por ejemplo, para utilizar la comida como refuerzo, las ratas suelen pasar hambre (el término técnico es " mantenido en un programa de privación de alimentos") durante unos días. Para utilizar el agua como refuerzo, las ratas se mantienen en un programa de privación de agua. ¿Cómo equipararías el nivel subjetivo de hambre y sed?

Otros aspectos del programa de aprendizaje se han estudiado más a fondo. Por ejemplo, para producir un aprendizaje duradero (medida de aumento n.° 2) en la expansión de la velocidad de aprendizaje (medida n.° 1) y el rendimiento máximo (n.° 3), puede proporcionar un refuerzo parcial: refuerce al animal solo en algunas de las pruebas. [2] .


[1] Aversión al gusto condicionada: Memoria de un tipo especial. Bures, enero; Bermúdez-Rattoni, Federico; Yamamoto, Takashi; Oxford University Press, 1998 doi: 10.1093/acprof:oso/9780198523475.001.0001

[2] Refuerzo parcial: revisión y crítica. Jenkins, William O.; Stanley Jr., Julián C; Boletín Psicológico, Vol 47(3), Mayo 1950 doi: 10.1037/h0060772