Die Akquisition in der Konditionierung von Hunden

Was sind Verhaltens- und Reizakquisition in der Hundeerziehung?

Von:
Zuletzt aktualisiert am: 23.4.2024

Drei Hunde machen Sitz vor einem Mann mit Baseballkappe und Sonnenbrille Ausschnitt.jpg
Synonyme
  • Lernen
  • Verhaltensakquisition
  • Verhaltensaufbau

Die klassische Konditionierung erklärt Verhalten als reflexhafte Reaktionen auf Reize. Durch die Kopplung zweier verschiedener Reize kann derselbe Reflex ausgelöst werden. Die operante Konditionierung erklärt Verhalten durch die Verknüpfung von Hinweisreizen mit Verhaltensweisen und Konsequenzen, wie beispielsweise dem Reiz einer Belohnung. Unter Lernen oder Akquisition wird in diesen beiden Lerntheorien die Bildung der entsprechenden Verknüpfungen und Kopplungen verstanden. 

Neben diesen behavioristischen Erklärungsansätzen für da Lernen existieren weitere Lerntheorien, die den Lernprozess anderes definieren und erklären.

Die Akquisition in der klassischen Konditionierung

Der Aufbau oder die Akquisition einer Reiz-Reiz-Kopplung kann seitens eines Lehreres oder Trainers gewollt oder ungewollt geschehen.

Als ein im mordernen Hundetraining häufig vorkommendes und gewolltes Beispiel kann der Klicker dienen. Wird ein unbedeutender und daher neutraler Reiz, wie das Geräusch eines Klickers, mit einem bedeutenden und unkonditionierten Reiz, der immer einen Reflex auslöst, wie ihn die Verfügbarkeit von Futter darstellt, gekoppelt, entspricht das einer klassischen Konditionierung. Erkennbar ist die erfolgreiche klassische Konditionierung in diesem Fall daran, dass der Hund bereits beim Geräusch des Klickers seinen Speichelreflex zeigt, weil das Klickgeräusch zum konditionierten Reiz wurde.

Die Akquisition unerwünschter Reiz-Reiz-Kopplungen wird häufig von unangenehmen Reizen ausgelöst. Angenommen, das Verhalten eines Hundes wird durch einen bestimmten Hinweisreiz wie den Anblick der immer gleichen Ablenkung (z. B. Postbote, Kinder etc.) unkontrollierbar. Für dieses unkontrollierbare und unerwünschte Verhalten wird der Hund immer wieder mit einem eher unangenehmen unkonditionierten Reiz (z. B. ein „Klapps“ mit der Zeitung etc.) positiv bestraft. Ziel der Strafe ist, dass eine Akquisitionsphase ausgelöst wird, in der der Hund den unangenehmen und unkonditionierten Reiz der Strafe entsprechend der operanten Konditionierung als eine Konsequenz seines Verhaltens wahrnimmt und verknüpft, wodurch das Verhalten unanttraktiver und seltener oder gar nicht mehr gezeigt wird.

Nun kann es aber passieren, dass nicht die just beschriebene Verknüpfung akquiriert wird, sondern der unangenehme Strafreiz entsprechend der klassischen Konditionierung mit einem neutralen Reiz verknüpft wird. Dieser bisher neutrale Reiz löst künftig dieselben Gefühle aus, wie bisher der Strafreiz. Als eigentlich neutrale Reize kommen hier die Ablenkung oder der Mensch, der den Hund bestraft, in Frage. In dem Fall wird der klassisch konditionierte Reiz (die Ablenkung oder der bestraftende Mensch) zum Hinweisreiz für eine Angstreaktion, die ggf. eine operante Reaktion sein kann kann, wie sie das Vermeidungsverhalten darstellt.

Sowohl erwünschte als auch unerwünschte Reiz-Reiz-Kopplungen können wieder gelöscht werden.

Die Akquisition in der operanten Konditionierung

In der Verhaltenswissenschaft kann der Begriff der Akquisition oder Verhaltensakquisition mit Verhaltenserwerb übersetzt werden und meint damit den Vorgang des Erlernens eines Verhaltens. Die Verhaltenswissenschaft hat unterschiedliche Lerntheorien, wie das Modelllernen oder die operante Konditionierung, entwickelt. Auf der operanten Konditionierung, die weitgehend ohne Annahmen über Instinkte und andere innere Vorgänge auskommt, basieren viele der hier detailliert beschriebenen moderne Trainingsmethoden zur Hundeerziehung. Die operante Konditionierung ist vom Begriff der Prägung zu unterscheiden.

Der Begriff der Verhaltensakquisition bezieht sich innerhalb der operanten Konditionierung den Aufbau oder das Entstehen Kopplungen aus Hinweisreiz, Reaktion und Konsequenz. Anders ausgedrückt, muss der Lernende den ursächlichen Zusammenhang zwischen Hinweisreiz, Verhalten und Konsequenz erkennen. Dieser Vorgang, der das Erkennen des Musters in dieser Abfolge darstellt, ist die Verhaltensakquisition. Um zufällige Erfolge von regelmäßigen unterscheiden zu können, sind Wiederholungen der Abfolge nötig, bei denen derselbe Hinweisreiz in Kombination mit einem Verhalten immer zur selben Konsequenz führt.

Die Darstellung des Akquisitionsprozesses im Rahmen der operanten Konditionierung liefert eine Erklärung dafür, wie Lebewesen in einer auf sie über Reize einwirkenden Umwelt Verhalten erlernen, das sich für sie lohnt. 

Der Prozess der Verhaltensakquisition kann aber durch den bewussten Einsatz der operanten Konditionierung von einem Trainer, Lehrer oder Hundehalter gesteuert werden. Jeder Trainer sollte die Verhaltensakquisition vom Begriff der Verhaltensperformance abgrenzen. Die Verhaltensperformance beschreibt, ob ein gelerntes Verhalten ausgeführt wird. 

Die Verhaltensakquisition in der Umwelt ohne Trainer

Die Umwelt ist für einen lernenden Organismus ein sehr komplexer Raum, der die Erkennung der Zusammenhänge zwischen einem bestimmten Hinweisreiz, einer Verhaltensweise und einer Konsequenz erschwert. Einerseits wirken zu jedem Zeitpunkt viele Reize auf ein Lebewesen ein und bilden gemeinsam eine Situation, in der ein zufälliges Verhalten gezeigt wird, dem eine der vier möglichen Konsequenzen des Kontingenzschemas folgt. Das folgende Gedankenspiel aus dem möglichen Leben eines Wolfs verdeutlicht die Herausforderungen.

Ein Wolf sieht im Mondlicht den Pfad eines Wildwechsels (Reiz), auf dem er auch verschiedene Düfte, vielleicht von Rehen, Füchsen und Hasen, aber nicht den eines Schweins wahrnimmt. Er folgt dem Wildwechsel (Reaktion oder Verhalten) in eine zufällige Richtung, in dem Fall bergauf, was kurz vorher auch ein Reh getan hat, weshalb der Reh-Duft mit jedem Schritt stärker wird. Irgendwann erreicht (Reiz) er aber einen schlafenden Frischling, der den Wechsel wohl aus der anderen Richtung belaufen haben muss. Der Wolf reißt (Reaktion) ihn und kommt so zu seiner Beute (Konsequenz). Da der nun beginnende Reiz, der vom jetzt verfügbaren Futter ausgeht, angenehm empfunden werden wird, liegt eine positive Verhaltensverstärkung vor, die das vorher gezeigt Verhalten häufiger auftreten lassen wird. Was war aber der Reiz, der den späteren Erfolg anzeigt: Der Anblick des Wildwechsels oder die Düfte, die er auf ihm wahrnahm? In welcher Richtung muss dem Wechsel gefolgt werden: Dorthin, wo der Rehduft stärker wird oder immer bergauf? Da der Frischling den Abschnitt des Wechsels nicht belaufen hatte, nahm der Wolf den Duft des Frischlings dort nicht wahr: Kann trotzdem der Duft des Frischlings der Hinweisreiz sein?

Aus diesem einen Erlebnis den für zuverlässigen Jagderfolg entscheidenden Zusammenhang zu erkennen, ist unmöglich: Folge der Duftspur eines speziellen Tieres und erbeute es. Im besten Fall entsteht als Annäherung an den perfekten Ablauf folgende Kopplung: Einen Wildwechsel belaufen lohnt sich und führt zu einem Frischling. Wäre das so, bestünde die Möglichkeit, dass der Wolf auf dem Wechsel häufiger den Duft eines Frischlings wahrnimmt, bevor er ihn reißt und somit aus der Flut von Reizen den richtigen als den entscheidenden Hinweisreiz identifiziert. Denkbar wären aber auch unsinnige Kopplungen wie

  1. bergauflaufen ist entscheidend
  2. der Duft von Reh führt zu einem Frischling

Einige Tage später bewegt sich der Wolf wieder auf einem Wildwechsel. Fast alles läuft genauso ab, wie vorher. Allerdings scheint jetzt die Sonne und er stößt diesmal auf einen starken Keiler, der den Wolf sofort angreift und verletzt. Diese Verhaltenskonsequenz entspricht einer positiven Strafe, denn es beginnt in Folge des Verhaltens ein unangenehmer Reiz, der das Verhalten seltener auftreten lässt. Da alle Reize, bis auf den Sonnenschein, dieselben sind wie vorher, scheint der Sonnenschein darüber zu entscheiden, ob dasselbe Verhalten mit Futter positiv verstärkt oder positiv bestraft wird. Tatsächlich ist es aber so, dass Keiler und Frischlinge sich stark unterscheiden und entsprechend unterschiedliche Reize abgeben: Sie duften z. B. ähnlich, aber nicht gleich, was eine Reizunterscheidung oder Reizdiskrimination notwendig macht.

Um die erfolgversprechendsten Kopplungen zu erstellen und zu festigen, sind also sehr viele Wiederholungen nötig, wobei aber in der Natur fast keine Situation exakt einer schon erlebten Situation entspricht, sodass der Prozess hier relativ lange dauert.

Wenn die „richtigen“ Kopplung vorhanden und die Akquisition damit abgeschlossen ist, heißt das aber nicht, dass das entsprechende Verhalten immer gezeigt wird: Die Umwelt wartet ständig mit vielen Reizen auf und da ist es immer möglich, dass zwei Hinweisreize gleichzeitig wahrgenommen werden. Da nur ein Verhalten ausgeführt werden kann, hängt also die Performance von weiteren Faktoren ab.

Dieses Gedankenspiel ist stark vereinfacht dargestellt, da ein komplexes Verhalten, wie es das Jagdverhalten ist, einer Verhaltensverkettung entspricht und das Thema Reizgeneralisierung keine und -diskrimination nur kurze Beachtung findet. 

Die beschleunigte Verhaltensakquisition im Training

Der Prozess der Verhaltensakquisition kann deutlich beschleunigt werden. Um die Akquisitionsrate bzw. die Lerngeschwindigkeit zu steigern, müssen möglichst viele Variablen auf Seiten der Hinweisreize, des Verhaltens und der Konsequenzen entfernt werden, da hierdurch das Muster klarer wird.

Bezogen auf die Konsequenzen eines Verhaltens greifen die modernen Trainingsmethoden auf die umgangssprachlich als Belohnung bezeichnete positive Verstärkung zurück: Dem zu fördernden Verhalten folgt eine angenehme Konsequenz. In der Akquisitionsphase muss das entsprechende Muster aus Verhalten und Konsequenz vom Lernenden erkannt werden. Es ist daher sinnvoll, nach einem Immer-Verstärkungsplan zu belohnen. Hierbei kommt es darauf an, dass einem Verhalten entsprechend der Kontiguität zeitnah die Konsequenz folgt: Sie sollte innerhalb einer Sekunde folgen. Zeigt der Hund vor der Belohnung bereits ein anderes Verhalten, wird beim Verhalten eine Variable hinzugefügt und es wird schwieriger zu erkennen, welches Verhalten das lohnende war.

Bei Verhaltensweisen, die hin und wieder gezeigt werden und daher eine Basisrate aufweisen, die höher als 0 ist, kann die Trainingsmethode des Capturen oder das Capturing angewendet werden. Diese setzt, wie auch das Shaping, explizit darauf, zunächst eine Kopplung von Verhalten und belohnendem Verstärker zu bilden. Dadurch wird die Basisrate des belohnten Verhaltens gesteigert: Es wird häufiger gezeigt, weil es sich immer lohnt. Erst, wenn das erreicht ist, wird die nun bestehende Kopplung mit einem Hinweisreiz bzw. dem gewünschten Signal verknüpft.

Unter anderem, um die Zahl der gleichzeitig auftretenden und als Hinweisreize in Betracht kommenden Reize zu senken, wird häufig empfohlen, neue Verhaltensweisen in einer reizarmen Umgebung zu trainieren, deren Reize immer dieselben sind und die der Hund lange kennt: Er weiß bereits, dass an all die dort vorhandenen Reize an keine spezifischen Verhaltensweisen gekoppelt sind. Der einzige Reiz, der hier nicht immer vorhanden ist, ist das Signal, das mit dem Verhalten und der Belohnung gekoppelt werden soll. Aus demselben Grund soll auch immer dasselbe Signal für ein Verhalten verwendet werden. Dieses ist leicht von den anderen, immer vorhandenen Reizen zu unterscheiden, was die Kopplung vereinfacht und daher die Akquisitionsrate steigert.

Dies gilt auch dann, wenn Trainingsmethoden verwendet werden, die sofort alle drei Elemente, nämlich Signal, Verhalten und belohnende Verhaltenskonsequenz verknüpfen wollen.

Dass diese Kopplungen nun konditioniert sind und die Akquisition somit erfolgt ist, bedeutet nicht, dass das Verhalten immer ausgeführt oder performt wird, wenn das Signal kommt. Die Performance, also die Ausführung eines Verhaltens, kann aus verschiedenen Gründen verringert werden. Wirken beispielsweise gleichzeitig auch andere, natürliche Hinweisreize, die wir Ablenkungen nennen, auf den Hund ein, ist klar, dass nur ein Verhalten gezeigt werden kann. Dieser Umstand nötigt dem Hund die Entscheidung darüber ab, auf welchen Hinweisreiz er nun reagiert.

Zur Steigerung der Performance des von uns bevorzugten Verhaltens sind weitere Trainingsmaßnahmen unter Verwendung anderer Verstärkerpläne notwendig, die in vielen Trainingsplänen unmerklich ineinander übergehen.

In unserer dreiteiligen Artikelserie kannst Du die wissenschaftlichen Grundlagen der Lerntherorie bis zur praktischen Umsetzung durch die modernden Trainingsmethoden und vielen praktischen Beispielen zur Hundeerziehung nachlesen.

Lerntheorie I: Die wissenschaftlichen Grundlagen modernen Hundetrainings - Pawlow, Skinner & Co.

Lerntheorie II: Clicker- & Targettraining, Shaping & Chaning, Capturing & Co. als angewandte Wissenschaft

Lerntheorie III: Der Kurzüberblick über die Trainingsmethoden der modernen Hundeerziehung

Hat dir der Inhalt gefallen? Dann teile ihn doch auch mit anderen:

VGWort Zählpixel