Instrumentelle Konditionierung für Hunde

Was ist die instrumentelle Konditionierung im Unterschied zur klassischen oder operanten?

Von:
Zuletzt aktualisiert am: 19.12.2023

Hundeerziehung mit Sitz Ausschnitt.jpg

Die instrumentelle Konditionierung Edward Lee Thorndikes bildet gemeinsam mit der klassischen Konditionierung die Grundlage für die behavioristischen Lerntheorien und kann als Vorläufer der operanten Konditionierung verstanden werden. Alle drei behavioristischen Lerntheorien haben großen Einfluss auf die viele moderne Trainingsmethoden. Sie benötigen den unklaren Begriff der Instinkte nicht, erklären aber nicht den Vorgang der Prägung.

Thorndikes Doktorarbeit mit dem Titel „Animal Intellicence“ im Fach Psychologie beschäftigte sich bereits mit der Intelligenz der Tiere. Ihn interessierte die Frage, auf welche Weise Lebewesen lernen. Hierüber stellte er zwei gegensätzliche Hypothesen auf, die er später experimentell überprüfte. Einerseits wäre es möglich, dass Lebewesen durch Erkenntnis lernen. In dem Fall würde eine neue Fähigkeit oder ein neues Verhalten gewissermaßen von einem auf den anderen Moment auftauchen und gezeigt werden.

Thorndike war aber sehr beeindruckt von Darwins Evolutionstheorie, die seine zweite Hypothese beeinflusste und der zufolge Variationen von Lebewesen entstehen, was zu einer gewissen Bandbreite zur gleichen Zeit lebenden Organismen führt. Im Laufe der Zeit werden jedoch diejenigen Variationen, die gegenüber anderen einen leichten Überlebensvorteil haben, häufiger auftreten und die weniger angepassten seltener bis gar nicht mehr. Diese Wirkweise kann als Versuch und Irrtum beschrieben werden: Das Entstehen einer Art stellt einen Versuch dar. Das Aussterben einer (weniger angepassten) Art wäre also die Korrektur eines Irrtums. Übrig bleiben dann die angepassteren und somit erfolgreicheren Arten. Bezogen auf Thorndikes Forschungsthema bedeutet das, dass Lebewesen vielleicht durch Versuch und Irrtum lernen, dabei müsste dann die Begriffe "Art" und "Lebewesen" durch Verhaltensweise zu ersetzt werden.

Zur experimentellen Überprüfung, welche seiner beiden Arbeitshypothesen zutreffend ist, entwickelte er den von ihm „Puzzle Box“ genannten Problemkäfig. Hierbei handelt es sich um Käfige, die über sich von innen über einen Mechanismus öffnen lassen, beispielsweise, indem an einer Schnur gezogen oder ein Hebel heruntergedrückt wird. 

In diese Käfige sperrte er seine Versuchstiere, zumeist freiheitsliebende und hungrige Katzen und stellte sie vor das Problem des Freiheitsentzugs (Problemreiz), das noch dadurch verstärkt wurde, dass vor dem Käfig Futter platziert wurde. An dieses kamen die Katzen nur dann, wenn sie eine besondere Reaktion zeigten: Nämlich das Herunterdrücken des Hebels, der den Türöffnungsmechanismus in Gang setzte und sowohl Freiheit als auch Zugang zum Futter (beides ebenfalls Reize) ermöglichte. Der gesamte Vorgang kann daher als Reiz-Reaktion-Reiz-Kopplung betrachtet werden. 

Nun sperrte er in einer Versuchsreihe unterschiedliche Katzen wiederholt allein in die Box, um deren Verhalten zu beobachten und die Zeit zu messen, die es jeweils dauerte, bis sie die richtige Reaktion zeigten und sich der Käfig öffnete. Thorndike stellte nun fest, dass die Katzen im ersten Durchgang viele verschiedene, teils panische Verhaltensweisen zeigten und durchschnittlich sehr lange brauchten, bis sie die richtige Reaktion zeigten und sich der Käfig öffnete. Allerdings konnte er im Laufe der vielen Durchgänge auch feststellen, dass diese Zeit sich stetig mit jedem neuen Versuch verringerte, bis schließlich nach vielen Wiederholungen einige Tiere zielgerichtet nur noch das erfolgreiche Verhalten zeigten.

Für kein einziges Tier konnte er eine sprunghafte Abnahme der benötigten Zeit von einem zu anderen Durchgang feststellen, sondern bei allen nahm die benötigte Zeit kontinuierlich ab. Hieraus konnte also geschlossen werden, dass die Tiere über im Laufe der vielen Wiederholungen durch Versuch und Irrtum gelernt hatten.

Aus diesen Experimenten heraus formulierte Thorndike drei Gesetze, die die instrumentelle Konditionierung im Grunde definieren.

  1. Das Gesetz der Bereitschaft, das besagt, dass ein Lebewesen nur dann Verhalten erlernt, wenn es dazu bereit ist. Diese Bereitschaft ergibt sich aus Sicht Thorndikes aus einem zu lösenden Problem, wie er es für seine Versuchstiere in der Problembox durch den Freiheitsentzug und das nur durch Selbstbefreiung erreichbare Futter geschaffen hatte. Dieses Problem stellt einen Reiz dar. Nach diesem Verständnis wird also Verhalten nur dann gelernt, wenn die entsprechende Reaktion als Werkzeug oder Instrument zur Lösung eines Problems gesucht wird. 
  2. Das Gesetz der Auswirkung besagt, dass in Anlehnung an das erste Gesetz die Wirksamkeit der Reaktion oder des Verhaltens als Problemlöser darüber entscheidet, ob ein Verhalten bei Darbietung ähnlicher Reize mit höherer oder niedrigerer Wahrscheinlichkeit gezeigt wird: Erweist sich seine Auswirkung nicht als problemlösend, wird es seltener gezeigt, löst es das Problem, wird es häufiger gezeigt.
  3. Das Gesetz der Übung, das besagt, dass es vieler Wiederholungen bedarf, um aus den anfänglich vielen verschiedenen Reaktionen die richtige und wirksame Reaktion herauszufiltern.

Insgesamt betrachtet Thorndike Verhalten primär als ein Instrument, das einem Lebewesen dazu dient, Problemreize zu beseitigen und die Lebensumstände zu verbessern. Hieraus ergibt sich auch die Bezeichnung „Instrumentelle Konditionierung“. Dargestellt wird der Lernvorgang als Reiz-Reaktions-Kopplung, wobei der Reiz das Problem darstellt und die Reaktion das problemlösende Verhalten. Wird der Reiz mit der entsprechenden Reaktion gekoppelt, ist das Ergebnis, dass bei Auftreten des speziellen Reizes mit erhöhter Wahrscheinlichkeit die spezielle, erfolgreiche Reaktion zeigt.

B. F. Skinner griff diesen Ansatz auf und entwickelte ihn zur operanten Konditionierung weiter, indem er sich auf das Gesetz der Auswirkung konzentriert. 

Die wissenschaftliche Entwicklung von der klassischen Konditionierung inklusive aller Facetten der operanten Kondtionierung beschreiben wir im esten Teil unserer dreiteiligen Serie über die modernen Trainingsmethoden. Der zweite Teil führt diese mit den wissenschaftlichen Erkenntnissen zusammen, was wodurch die tieferen Zusammenhänge klar und Methoden besser anwendbar werden. Der dritte Teil gibt einen Überblick über die Trainingsmethoden und anzustrebende -atmosphäre.

Hat dir der Inhalt gefallen? Dann teile ihn doch auch mit anderen:

VGWort Zählpixel