Positive Verstärkung im Hundetraining

Was ist positive Verstärkung in der Hundeerziehung?

Von: Ulf Weber
Zuletzt aktualisiert am: 18.9.2024

Ein beiger Labrador mit Halsband bekommt von einer Menschenhand ein Leckerchen.jpg

Synonyme

positive Bestärkung
positive Konditionierung

Modernes Hundetraining basiert auf der positiven Verstärkung. Diese stellt in der von Skinner entwickelten operanten Konditionierung eine der vier im Kontingenzschema dargestellten Verhaltenskonsequenzen dar. Diese Konsequenzen beeinflussen die Auftretenswahrscheinlichkeit von Verhalten. Die positive Verstärkung steigert diese Wahrscheinlichkeit, wirkt belohnend. Sie ist zur Verwendung in der Hundeerziehung besonders geeignet und beschreibt, wie Lebewesen in der Natur aus ihren Erfolgen lernen.

Die operante Konditionierung, die von der Prägung zu unterscheiden ist, ist eine Lerntheorie des Behaviorismus, die von B. F. Skinner in der ersten Hälfte des 20. Jahrhunderts entwickelt und von nachfolgenden Forschern erweitert wurde. Skinner vertrat als radikaler Behaviorist die Auffassung, dass die Verhaltenspsychologie nur dann als Wissenschaft zu betrachten sei, wenn sie ausschließlich messbare Ereignisse in Theorien einfließen lässt und glaubensähnliche Annahmen über innere Vorgänge, wie beispielsweise Instinkte, unterlässt. Messbar und in Experimenten erforschbar sind die Wechselwirkungen zwischen beliebigen Reizen und Reaktionen in ebenfalls beliebiger Reihenfolge. Skinner erforschte zunächst erxperimentell, wie sich Reize, die als Konsequenz auf ein zufällig gezeigtes Verhalten folgen, auf die künftige Auftrittswahrscheinlichkeit dieses Verhaltens auswirken.

Im Ergebnis beschrieb er den Vorgang des Lernens oder der Verhaltensakquisition im Rahmen der positiven Verstärkung als Bildung einer Reaktion-Reiz-Kopplung. Bei der Reaktion handelt es ich um ein Verhalten, dem als Konsequenz ein Reiz folgt. Dieser Konsequenzreiz erhöht und verstärkt die Auftretenswahrscheinlichkeit des gezeigten Verhaltens, er ist der Verhaltensverstärker. Das Wort „positiv“ wird hier mathematisch verwendet und bedeutet, dass dieser Reiz auftritt oder beginnt und nicht etwa auf Grund des Verhaltens endet. Die Tatsache, dass ein in Folge eines Verhaltens auftretender Reiz dieses Verhalten künftig öfter auftreten lässt, lässt den Schluss zu, dass dieser Reiz als angenehm empfunden wurde: Das Verhalten wird erneut gezeigt, damit der angenehme Reiz auftritt. Die positive Verstärkung stellt die Basis dessen dar, was wir als Belohnung im Hundetraining nutzen, auch wenn heute davon ausgegangen werden kann, dass häufig nicht der Reiz, sondern die durch den Reiz ermöglichte Reaktion belohnend wirkt: Der Konsequenzreiz "Leckerli vor der Nase" ermöglicht die Reaktion "Fressen aufnehmen".

In weiteren Experimenten erforschte er die Wirkung von Hinweisreizen. Dies führte dazu, dass Verhalten nun als Reiz-Rektion-Konsequenz-Kopplung beschrieben wurde, wobei der Hinweisreiz die Funktion hat, anzuzeigen, welche Konsequenz einer bestimmten Reaktion folgen wird. Im Hundealltag umfassen solche Hinweisreize beispielsweise unsere Kommandos und die berüchtigten Ablenkungen, aber auch der im vorangehenden Absatz dargestellte Konsequenzreiz ist ein Hinweisreiz: er zeigt an, dass gefressen werden kann.

Die Theorie der positiven Verstärkung stellt den Lernvorgang also als Bildung einer Kopplung eines Hinweisreizes mit einem bestimmten Verhalten und einer bestimmten Konsequenz dar. Unabhängig davon, welcher Art der Hinweisreiz, das Verhalten oder die Konsequenz sind, stellen die zentrale Herausforderung für den Lernenden, in unserem Falle also für den zu erziehenden Hund, folgende dar:

In einer an Reizen reichen Umwelt den Reiz herauszufiltern, der ein von uns bewusst gegebener Befehl und Hinweisreiz ist. Aus diesem Grund wird häufig geraten, die ersten Trainingseinheiten aus einem Trainingsprogramm in reizarmer Umgebung durchzuführen: Je weniger Reize gleichzeitig wirken, desto weniger Reize muss der Hund als "unwichtig" verwerfen.
In einer Flut ständig gezeigter Verhaltensvarianten dasjenige zu erkennen, das mit dem Hinweisreiz und der Konsequenz verbunden ist.

Großen Einfluss auf die Verringerung dieser Herausforderungen haben die folgenden beiden Punkte, da sie das Muster aus Hinweisreiz/Signal, Verhalten und Verhaltensverstärker besonders deutlich und damit erkennbar machen, was die Grundvoraussetzung für die Bildung und Festigung der Kopplung ist.

Zeitpunktgenaue Verstärkung erhöht die Lerngeschwindigkeit

Wie die Forschung zur Kontiguität zeigt, ist in diesem Zusammenhang die Vermeidung zeitlicher Verzögerung zwischen Verhalten und Belohnung besonders wesentlich: Die Konsequenz muss innerhalb einer Sekunde erfolgen, damit das Tier den Zusammenhang noch herstellen kann. Auch, damit er nicht vor der Verstärkung schon ein anderes Verhalten zeigt: Die Konsequenz wird immer mit dem zuletzt gezeigten Verhalten verbunden.

Wiederholte Durchläufe mit Immer-Verstärkung erhöht die Lerngeschwindigkeit

Auch hat sich herausgestellt, dass das Muster aus Hinweisreiz/Signal, Verhalten und verstärkender Belohnung dann besonders schnell erfolgen kann, wenn diese Abfolge immer erfolgt. Mit anderen Worten muss ein Verhalten jedes Mal belohnend verstärkt werden, damit für den Hund erkennbar wird, dass das spezielle Verhalten sich lohnt.

Leider hat aber Skinner schon experimentell nachgewiesen, dass ein immer belohntes oder verstärktes Verhalten schnell nicht mehr gezeigt wird, wenn keine Belohnung oder Verstärkung mehr erfolgt. Hierbei spricht man von Verhaltenslöschung. Aus diesem Grund forschte und entwickelte er neben der Immer-Verstärkung auch andere Verstärkerpläne. Diese werden heute im Fortgang des Trainingsprogramms die „Belohnung ausschleichen“ genannt und sollen das Auftreten der Verhaltensverstärker unberechenbarer werden lassen und dadurch das Verhalten löschungsresistenter machen. Eine Möglichkeit, dies zu erreichen und gleichzeitig einige Faktoren im Verhalten, beispielsweise die Distanzkontrolle, zu steigern, bietet die 300-Pick-Methode.

Praktische Beispiele aus dem Hundealltag

Zwei praktische Beispiele positiver Verstärkung, wie sie im Leben eines Hundes denkbar sind, sollen zur Verdeutlichung dienen. Sieht ein Hund andere Hunde, kann das als Hinweisreiz dienen, dass die Reaktion „hinlaufen“ mit dem angenehmen Reiz der Nähe zu anderen Hunden. Diese Nähe wiederum ermöglicht ein gemeinsames Spiel. Daher kann der Reiz der Nähe zu anderen Hunden als Hinweisreiz für ein Spiel verstanden und das Gesamtverhalten als Verhaltenskette verstanden werden. Auch hier ist es so, dass jede Wiederholung der Abfolge aus Hinweisreiz-Verhalten-Konsequenz das Verhalten festigt.

Demgegenüber stehen die von uns ausgehenden Hinweisreize wie „Sitz“, die wir als Kommando, Befehl oder Signal bezeichnen und denen ein bestimmtes Verhalten des Hundes (hinsetzen) folgen soll, die wir beispielsweise mit einem Leckerchen belohnend positiv verstärken. Diesen Ablauf üben wir wiederholt, ebenfalls um das Verhalten zu festigen und um es als „Alternativverhalten“ abzurufen, damit der Hund sich hinsetzt und nicht, wie im ersten Beispiel, unkontrolliert wegläuft.

Unter „Hinweisreize“ im praktischen Alltag sind also neben unseren Kommandos und Signalen an unsere Hunde auch in der Natur vorkommende Reize zu verstehen, die von uns gerne als Ablenkungen bezeichnet werden und im Falle der positiven Verstärkung eine Belohnung für ein bestimmtes zu zeigendes Verhalten anzeigen.

Nehmen wir ein anderes Beispiel aus dem Leben der Vorfahren unserer Hunde, den Wölfen, um unregelmäßige Verstärkerpläne zu erläutern. Nicht jede Jagd führt zu Beute, sondern nur ein gewisser, unregelmäßig auftretender Anteil der Versuche ist erfolgreich. Dennoch wird niemand bestreiten, dass die Tiere immer wieder auf die Jagd gehen. Solche Beobachtungen und Überlegungen ließen Skinner zum Thema „Verstärkerpläne“ forschen. Ihn interessierte, wie sich unterschiedliche Regeln, nach denen Verhalten verstärkt werden kann, auf die durch die Akquisitionsrate bemessene Lerngeschwindigkeit und die mit der Extinktionsrate gemessene Löschungsresistenz eines Verhaltens auswirkt. Das erfolgreich erreichte Ziel seiner Forschung war es, Verstärkerpläne zu entwickeln, die einerseits eine hohe Lerngeschwindigkeit erlauben, andererseits aber ein sehr löschungsresistentes Verhalten hervorbringen.

In unserer dreiteiligen Artikelserie kannst Du die wissenschaftlichen Grundlagen der Lerntherorie bis zur praktischen Umsetzung durch die modernden Trainingsmethoden nachlesen. Die theoretische Grundlage mit vielen praktischen Beispielen zur Hundeerziehung erleichtern die Suche nach Antworten auf die eigenen Trainings- und Erziehungsfragen.

Lerntheorie I: Die wissenschaftlichen Grundlagen modernen Hundetrainings - Pawlow, Skinner & Co.

Lerntheorie II: Clicker- & Targettraining, Shaping & Chaning, Capturing & Co. als angewandte Wissenschaft

Lerntheorie III: Der Kurzüberblick über die Trainingsmethoden der modernen Hundeerziehung

Weitere Artikel

Hat dir der Inhalt gefallen? Dann teile ihn doch auch mit anderen: