Konsequenz beim Hund

Was ist Konsequenz und wie wirkt Inkonsequenz auf den Hund?

Von:
Zuletzt aktualisiert am: 19.12.2023

Boxer mit gelbem Halstuch sitzt auf einem gruenen Teppich vor seinem Menschen und schaut ihn aufmerksam an.jpg
Synonyme
  • fehlende Konsequenz
  • Folge
  • Inkonsequenz
  • nicht konsequentes Verhalten
  • unkonsequentes Verhalten
  • Verhaltenskonsequenz

Konsequenz (von lat. consequens „in richtiger Folge stehend“) beschreibt einerseits die im Kontingenzschema dargestellten Folgen eines operanten Verhaltens. Die Folge eines bestimmten Verhaltens muss in der Lern- und vor allem der Löschungsphase immer dieselbe sein. Daher ist für erfolgreiche Hundeerziehung inkonsequentes menschliches Verhalten sehr hinderlich.

Die vier Verhaltenskonsequenzen des Kontingenzschemas in der Umwelt

Die operante Konditionierung, auf der die meisten modernen Trainingsmethoden basieren, erklärt, dass Verhalten in der Umwelt entweder gar keine oder eine von vier möglichen Folgen oder Konsequenzen erzielt. Zwei dieser Folgen stellen Strafen dar und lassen das Verhalten künftig seltener auftreten. Die beiden anderen verstärken Verhalten, lassen es also künftig häufiger auftreten. 

Folgt einem Verhalten ein unangenehmer oder gar schmerzhafter Reiz, liegt eine positive Strafe vor, z. B. fasst ein Kind in ein Kerzenlicht und verbrennt sich. Eine negative Strafe entzieht in Folge eines Verhaltens einen angenehmen Reiz: Ein Kind trödelt morgens im Winter und verpasst den warmen Schulbus. Bei der der negativen Verstärkung werden als Folge eines Verhaltens unangenehme Reize beendet, z. B. wenn ein Hund Pfötchen gibt und einen eingelaufenen, schmerzhaften Dorn entfernen lässt. Beginnt in Folge eines Verhaltens ein angenehmer Reiz, handelt es sich um positive Verstärkung: Reißt ein Wolf ein Reh, liegt der angenehme Reiz in der Verfügbarkeit einer Mahlzeit.

Die vier Verhaltenskonsequenzen des Kontingenzschemas im verhaltensaufbauenden Training

Alle genannten möglichen Verhaltenskonsequenzen treten zwar ständig in der allgemeinen Umwelt auf und helfen, die Entstehung bestimmter Verhaltensweisen zu erklären. B. F. Skinner erkannte aber, dass derjenige, der diese Verhaltensfolgen kontrolliert, auch Verhalten kontrollieren kann. Dazu muss er konsequent und invollem moralischen Bewusstsein einem bestimmten Verhalten eine immer gleiche Konsequenz folgen lassen. So gab Skinner Trainern und Lehrern ein Werkzeug an die Hand. 

Unter Verhaltensaufbau wird in der operanten Konditionierung die Steigerung der Auftretenswahrscheinlichkeit eines Verhaltens verstanden. Das Gegenteil hiervon ist die im letzten Absatz dieses Lexikoneintrags beschriebene Löschung. Eine Steigerung kann mit Strafen nicht erreicht werden, denn diese senken die Auftretenswahrscheinlichkeit eines Verhaltens. Verhaltensaufbau kann also nur mit der negativen oder der positiven Verstärkung erfolgen. Gemeinsam mit den beiden Strafen bildet die negative Verstärkung das Werkzeugset der aversiven Verhaltenskonktrolle. Die mit der Anwendung dieser drei verbundenen erheblichen Risiken inkl. der entsprechenden Experimente stellt dieser Absatz des ersten Teils unserer dreiteiligen Serie zur Lerntheorie dar.

So bleibt für den planvollen Aufbau gewünschten Verhaltens im Hundetraining oder -erziehung die daher oft verwendete positive Verstärkung übrig.

Die Steigerung der Auftretenswahrscheinlichkeit eines Verhaltens erfolgt in der Akquisitionsphase durch die Bildung einer Kopplung zwischen Verhalten und der ihr folgenden, angenehm-belohnenden Konsequenz. Dies stellt den ersten Teil eines Trainingsprogramms da, das viele einzeln zu trainierende Aspekte eines Verhaltens umfasst. Diese Kopplung entsteht aber nur, wenn dem Verhalten eine Kontiguität genannte Vorhersagekraft für die Folgen des Verhaltens innewohnt: Dem Tier muss klarwerden, dass dem bestimmten Verhalten eine Belohnung folgt und sich dieses Verhalten daher lohnt. Damit diese Vorhersagekraft schnell erkannt werden kann, muss die Belohnung konsequent jedes Mal eintreten, wenn das gewünschte Verhalten gezeigt wurde und dabei den Grundsätzen der Kontiguität entsprechen: Die Belohnung muss gegeben werden, bevor ein anderes Verhalten gezeigt wird: Die Folge wird immer dem letzten gezeigten Verhalten zugeordnet. Daher soll eine Belohnung innerhalb einer Sekunde nach dem gewünschten Verhalten gegeben werden.

Bei manchen Trainingsmethoden, z. B. dem Locken kann zeitgleich, bei anderen erst nach erfolgreicher Kopplung von Verhalten und Belohnung, durch die Einführung des Signals oder Kommandos die Basis für die Signalkontrolle gelegt werden. In beiden Fällen wird jeder erfolgreiche Durchgang konsequent belohnt.

Nach erfolgreicher Akquisitionsphase für die Dreierkopplung aus Signal („Sitz“) – Reaktion (Hund setzt sich) – belohnendem Verstärker (Hund bekommt ein Leckerchen) führt der Hund das gewünschte Verhalten in 9 von 10 Fällen aus, wenn das entsprechende Signal gegeben wird. Wird allerdings das Verhalten nicht mehr belohnt, kann eine Verhaltenslöschung eintreten, sodass das Verhalten seltener oder gar nicht mehr gezeigt wird.

Damit der Hund auch dann folgsam ist und das aufgebaute Verhalten zeigt, wenn eine Zeitlang keine Belohnung möglich ist, weil beispielsweise die Leckerchen ausgegangen sind, ist eine planvolle Inkonsequenz bei der Belohnung wichtig.

Belohnungs- und Verstärkerpläne: planvolle Inkonsequenz führt zu belohnungsfreiem Verhalten

In der letzten Phase eines Trainingsprogramms soll erreicht werden, dass der Hund auch dann hört, wenn er nicht immer oder sogar fast nie für ein abgerufenes Verhalten belohnt wird. Viele Hundetrainer bezeichnen diesen Übergang vom konsequenten und vorhersehbaren Belohnen hin zu einer inkonsequenten und nicht mehr vorhersehbaren Belohnungsfrequenz als „Ausschleichen der Belohnung“. Diese Umschreibung wird allerdings der tatsächlichen Wirkung dieser planvollen Inkonsequenz, die variabler Quotenverstärkerplan oder Belohnungsplan genannt wird, bei weitem nicht gerecht, denn er kann Verhaltensweisen hervorbringen, die so löschungsresistent sind wie die Glückspielsucht: Die Belohnung ist der Gewinn und der wird nach einem variablen Quotenplan ausgeschüttet. 

Im Hundetraining wird dazu nicht mehr jedes Mal eine Belohnung gegeben, wenn das entsprechende Verhalten erfolgreich abgerufen wurde. Vielmehr wird zunächst nur noch jeder zweite erfolgreiche Durchgang belohnt. Das entspricht einem Belohnungsplan oder Verstärkerplan mit einer fixen Quote von zwei Wiederholungen (des Verhaltens) für eine Belohnung. 

Nach einiger Zeit kann nun von einem fixen auf einen variablen Quotenplan umgestellt werden. Das bedeutet, dass nun nicht mehr jedes zweite erfolgreich abgerufene Verhalten belohnt wird, sondern nur noch durchschnittlich jedes zweite Mal belohnt wird: Wird 10mal erfolgreich das Signal für „Sitz“ gegeben, müssen 5 Belohnungen mit unregelmäßigem Abstand zueinander hierauf verteilt werden. So könnten die ersten fünf Wiederholungen alle, die letzten fünf gar nicht belohnt werde. Oder die ersten beiden und die letzten drei. Wichtig hierbei ist, dass alle denkbaren Kombinationen verwendet werden, damit alle erkennbaren Muster verschwinden. Da unsere Phantasie leicht in solche Muster verfällt, kann die Verteilung der 5 Belohnungen auf die kommenden 10 Wiederholungen vor Übungsbeginn über 10 Münzwürfe entschieden werden: Jeder Münzwurf steht dabei für einen erfolgreichen Abruf des gewünschten Hundeverhaltens, verstärkt und belohnt wird aber nur, wenn Kopf zu sehen ist. 

Nun wird die Quote nach einiger Zeit immer wieder erhöht, sodass bald drei, dann vier, fünf, sechs und immer mehr Wiederholungen des gewünschten Verhaltens nötig sind, um einmal belohnt zu werden. Die wechselnde Anzahl an Wiederholungen zwischen den jeweiligen Belohnungen kann auch ausgewürfelt werden: Soll im Durchschnitt jede 6. Wiederholung belohnt werden, wählt man eine Zahl zwischen eins und sechs, würfelt 120mal, zählt die Würfe mit und notiert sich die Würfe, bei denen die gewählte Augenzahl zu sehen war. 

Im beispielhaften Eigenversuch habe ich zweimal 100mal hintereinander gewürfelt und nur die Würfe mit 6 Augen gezählt. Erst der vierte Wurf brachte die 6 Augen: Also würde ein Hund im Training erst nach dem vierten erfolgreichen Abruf eines bestimmten Verhaltens belohnt. Folgende Tabelle zeigt in der linken Spalte die fortlaufende Nummer des Würfelwurfs und in der rechten die notwendigen Wiederholungen des Verhaltens vor der nächsten Belohnung:

fortlaufende Nummer Wiederholungen bis zur nächsten Belohnung fortlaufende Nummer Wiederholungen bis zur nächsten Belohnung
4 4 20 20
9 5 23 3
12 3 24 1
16 4 26 2
20 4 38 12
22 2 46 8
30 8 57 11
32 2 58 1
34 2 65 7
47 13 68 3
55 8 70 2
56 1 72 2
69 13 73 1
75 6 80 7
88 13 87 7
100 12 92 5
Durchschnittliche Anzahl an Wiederholungen zwischen den Belohnungen: 6,4 96 4
    98 2
    Durchschnittliche Anzahl an Wiederholungen zwischen den Belohnungen: 5,4

 

Solch unterschiedliche Verteilungen und Muster von Belohnungen und Verhaltenswiederholungen sind bewusst schwer herbeizuführen, machen aber gerade die „hoffnungsvolle“ Unvorhersehbarkeit aus, die ein Verhalten, trotz immer seltener werdender und inkonsequenter gewährter Belohnungen, sehr stabil auftreten lässt.

Inkonsequenz während der Löschung unerwünschter Verhaltensweisen verfestigen auch diese

Um ein unerwünschtes Verhalten des Hundes abzustellen, stellt die Verhaltenslöschung ein porbates Mittel dar. Auch sie basiert auf der operanten Konditionierung und geht davon aus, dass jedes Verhalten durch positive oder negative Verstärkung verstärkt wird und es daher aus Sicht des Hundes gar kein „unerwünschtes“ Verhalten gibt, denn er zeigt nur Verhalten, das sich für ihn lohnt. Somit kann der Effekt der Löschung noch verstärkt werden, wenn sie mit dem Abruf eines bereits gut trainierten ,aber in der speziellen Situation immer belohnten Alternativverhaltens (Sitz o. ä.) kombiniert wird.

Experimentell konnte Skinner zeigen, das über positive Konditionierung aufgebautes Verhalten recht schnell nicht mehr gezeigt wird, wenn dem Verhalten keine Verhaltensverstärkung oder Belohnung mehr folgt. Dieser Umstand wird als Verhaltenslöschung bezeichnet. 

In der Praxis lässt sich die Verhaltenslöschung vom Menschen gegem nicht erwünschtes Hundeverhalten nur einsetzten, wenn der Mensch den Verhaltensverstärker bzw. die Belohnung kontrollieren kann: Liegt der Verhaltensverstärker in dem angenehmen Reiz, der vom Anblick flüchtenden Wildes oder in dem Spaß, der von einem lustigen Spiel mit Artgenossen ausgeht, hat der Hundemensch kaum Einfluss auf diese Verhaltensverstärker.

Vergeben aber andere Menschen oder gar der Hundemensch selbst die verhaltensverstärkende Belohnung, kann die Löschung gelingen. Dazu muss dann diese Belohnung konsequent vorenthalten werden. Bettelt der Hund beispielsweise am Tisch, wird er das nicht mehr tun, wenn er konsequent NIE MEHR Futter am Tisch bekommt. 

Wird allerdings inkonsequenter Weise in seltenen Fällen doch etwas vom Tisch verfüttert, wird das das bettelnde Hundeverhalten extrem löschungsresistent machen, denn dann liegt ein variabler Verstärkerplan vor.

Warum ein vom Hundemenschen unerwünschtes Verhalten über Löschung und den Abruf eines Alternativverhaltens unterbunden werden sollte und nicht über Strafen abgebaut werden sollte, kann aus den drastischen Experimenten abgeleitet werden, die in diesem Abschnitt des ersten Teils unserer dreiteiligen Serie über die wissenschaftlichen Grundlagen der modernen Trainingsmethoden nachgelesen werden.

Im zweiten Teil der Serie werden die wissenschaftlichen Erkenntnisse auf die Trainingsmethoden übertragen, damit geneigte Leser künftig wissen, warum sie welche Methode zu welchem Zweck anwenden können, während der dritte Teil einen Überblick über die Trainingsmethoden und anzustrebende Trainingsathmospähre liefert.

Hat dir der Inhalt gefallen? Dann teile ihn doch auch mit anderen:

VGWort Zählpixel