logo Stottertheorie.de



 

1. Normales Sprechen und die Rolle der auditiven Rückmeldung

1. 1. Sprechen als sequenzielles Verhalten

Wenn eine Aktion aus mehreren Teilaktionen zusammengesetzt ist, die in einer bestimmten zeitlichen Ordnung aufeinander folgen, spricht man von einer Verhaltenssequenz. Auch das zusammenhängende (gebundene) Sprechen kann man als eine spezielle, sehr komplexe Form von sequenziellem Verhalten betrachten: Das Produzieren eines Lautes, einer Silbe, eines Wortes, einer Phrase (zusammenhängende Wortgruppe) oder eines Satzes sind Teilaktionen einer längeren Äußerung. Während in einfachen Bewegungsfolgen, z.B. beim Binden einer Schleife, die Reihenfolge der Teilaktionen genau festgelegt ist, ist das beim Sprechen nicht generell der Fall: Die Reihenfolge der Laute in einem Wort ist festgelegt – für die Reihenfolge der Wörter in einem Satz gibt es zwar Regeln, die jedoch Freiraum für Variabilität lassen. Während das Resultat der Sequenz „Schleife-Binden“ nach erfolgreichem Abschluss immer eine Schleife ist, kann das Resultat einer Sprachsequenz ein nie zuvor ausgesprochener Satz sein.

Die Frage, die uns hier besonders interessiert, ist: Wie werden Verhaltenssequenzen vom Gehirn gesteuert, sodass sie flüssig ausgeführt werden können? In der ersten Hälfte des 20. Jahrhunderts glaubte man, Verhaltenssequenzen würden über die sensorische Rückmeldung gesteuert. Man nahm also an, der Start der nächsten Teilaktion einer Sequenz sei eine Reaktion auf die Wahrnehmung, dass die vorausgegangene Teilaktion beendet ist.

Dagegen spricht jedoch, dass die Reaktion auf eine Sinneswahrnehmung eine gewisse Zeit beansprucht: Vom Reiz bis zur Reaktion vergehen ca. 150 Millisekunden oder mehr. Diese Reaktionszeit führt dazu, dass eine allein über die Rückmeldung gesteuerte.Sequenz gerade nicht flüssig ausgeführt wird. Ein weiteres wichtiges Argument gegen die rückmeldungsbasierte Steuerung ist, dass Bewegungssequenzen, nachdem sie einmal erlernt sind, oft auch dann ausgeführt werden können, wenn die sensorische Rückmeldung unterbrochen ist. Das gilt auch für das Sprechen. Deshalb nahm Karl Lashley an, dass Verhaltenssequenzen durch Pläne oder Programme „vorwärtsgesteuert“ werden – im Fall komplexer Sequenzen durch ein hierarchisches System solcher Programme [1]. Lashleys Ansicht kann heute als bestätigt gelten [2].

Was allerdings das Sprechen betrifft, so hat Bernhard S. Lee bereits 1951 entdeckt, dass der Sprachfluss gesunder Personen durch die Verzögerung der auditiven Rückmeldung (delayed auditory feedback, abgekürzt DAF) gestört werden kann [3]  (mehr...) . Später haben Theodor Kalveram und Lutz Jänke gezeigt, dass bereits ein DAF von 40 Millisekunden (unterhalb der Schwelle der bewussten Wahrnehmung) die Phonationsdauer lang-betonter Silben verlängert [4]. Das sind deutliche Zeichen dafür, dass das Sprechen kein rein vorwärtsgesteuertes Verhalten ist – dass vielmehr die auditive Rückmeldung – das Hören der eigenen Sprache – in die Steuerung des Sprechens eingreift.

Was für das Hören der eigenen Sprache gilt, das gilt gewiss auch für das Spüren der Sprechbewegungen – etwa der Bewegungen von Zunge und Lippen oder der Berührung von Zunge und Gaumen. Man spricht hier von propriozeptiver, taktiler und kinästhetischer Rückmeldung. Man stelle sich vor, wie sich die Betäubung von Zunge, Lippen und Gaumen auf die Artikulation auswirken würde! Wenn ich hier auf diese Formen der sensorischen Rückmeldung nicht weiter eingehe, so deshalb, weil ich nicht annehme, dass das Spüren der Sprechbewegungen bei Stotterern beeinträchtigt ist. Später werde ich noch einmal auf das Thema zurückkommen.

Sehen wir uns kurz an, wie eine Verhaltenssequenz erlernt wird. Nehmen wir als einfaches Beispiel wieder das Schleife-Binden: Man lernt zunächst, die einzelnen Teilaktionen Schritt für Schritt nacheinander auszuführen. Zumindest in der Anfangsphase dürfte es hilfreich sein, zu kontrollieren, ob eine Teilaktion erfolgreich beendet ist, bevor die nächste begonnen wird. Falls ein Fehler passiert ist, kann man ihn dann rechtzeitig korrigieren und muss nur die letzte Teilaktion wiederholen und nicht womöglich die gesamte Sequenz. Diese begleitende Kontrolle bezeichnet man üblicherweise als Monitoring.

Während die Teilaktionen einer Sequenz sowie deren Reihenfolge vorwärts- oder programmgesteuert sind, stellt das Monitoring ein Element von rückmeldungsbasierter Steuerung dar. In der Lernphase wird das Monitoring meist bewusst durchgeführt, oft mit der Folge, dass die Sequenz nicht flüssig ausgeführt werden kann. Wird die Sequenz dann sicher beherrscht, läuft das Monitoring automatisch nebenher: Beim Schnüren der Schuhe kontrolliert man nicht mehr bewusst, ob jede Teilaktion des Schleife-Bindens erfolgreich war. Doch wenn etwas schiefgegangen ist, spürt man es und bricht die Bewegungssequenz ab, um den misslungenen Teilschritt zu wiederholen.

Beide Formen der Steuerung sind in Abbildung 1 veranschaulicht. Oben eine Sequenz am Beginn der Lernphase. Die Steuerung erfolgt stark über die Rückmeldung; der Erfolg jeder Teilaktion wird bewusst wahrgenommen (Pfeil zum Monitor), erst danach wird als Reaktion darauf die nächste Teilaktion gestartet (Pfeil vom Monitor). Nach einem Fehler wird die fehlerhafte Teilaktion wiederholt. Unten eine bereits automatisierte Sequenz: Der Monitor kontrolliert, ob die Teilaktionen erfolgreich beendet sind, doch der Start der nächsten Aktion erfolgt durch das Programm (horizontaler Pfeil, der zugleich die Zeitachse symbolisiert). Stellt der Monitor einen Fehler fest, bricht er nach einer Reaktionszeit die Sequenz ab. Danach wird die fehlerhafte Teilaktion wiederholt. Der Monitor ist in beiden Fällen auf die gleiche Weise dargestellt, denn die Art der sensorischen Rückmeldung (visuell, auditiv, taktil usw.) muss sich nicht unterscheiden. Der Unterschied ist vielmehr, dass im Fall A die Aufmerksamkeit auf die Rückmeldung gerichtet ist, im Fall B dagegen nicht.

Sequenzierung / Sprachproduktion: rückmeldungsbasierte Steuerung (A) und Vorwärtssteuerung mit parallel laufendem Monitoring

Abbildung 1: Rückmeldungsbasierte Steuerung (A) und Vorwärtssteuerung mit parallel laufendem Monitoring (B). T = Teilaktion, R = Reaktionszeit. Erläuterung im Text.

 

Man kann also sagen: Das Monitoring ist ein begleitendes rückmeldungsbasiertes Steuerungselement für das sequenzielle Verhalten. Das Monitoring stellt sicher, dass die Teilaktionen in der richtigen Reihenfolge ablaufen, und dass die nächste Teilaktion nur dann ausgeführt wird, wenn die aktuelle erfolgreich beendet wurde. Nachdem die Sequenz erlernt ist, greift der Monitor nur noch ein, wenn er einen Fehler feststellt. Er unterbricht dann den Handlungsfluss – allerdings erst nach einer Reaktionszeit, was oft dazu führt, dass die nächste Teilaktion noch gestartet werden kann, dann aber abgebrochen wird.

Willem Levelt's „Perceptual Loop Theory“ und seine „Main Interruption Rule“ [5], die im übernächsten Abschnitt näher betrachtet werden, können als Spezialfall einer solchen begleitenden rückmeldungsbasierten Steuerung im Bereich der Sprachproduktion angesehen werden: Ein meist automatisch und unbewusst arbeitender Monitor überprüft laufend die gesprochenen, auditiv wahrgenommenen Wörter und Sätze und unterbricht den Sprachfluss, wenn ein Fehler registriert wird.

Es war mir wichtig, in diesem Abschnitt deutlich zu machen, dass das Monitoring nicht nur ein Mechanismus zur Fehlererkennung ist. Es trägt vielmehr wesentlich zum korrekten Erlernen und Automatisieren von Verhaltenssequenzen – also auch des Sprechens – bei und ist in diesem Sinne ein Element der Sprechsteuerung.

 nach oben 

 nächste Seite 


 

Fußnoten

Lee-Effekt

Dabei spricht die Person in ein Mikrofon und hört die eigene Sprache über Kopfhörer mit einer Verzögerung von ungefähr Silbenlänge (1/4 – 1/5 Sekunde). Es treten Wiederholungen und Dehnungen von Lauten und Silben auf. Diese Wirkung wird heute „Lee-Effekt“ genannt; Lee selbst bezeichnete sie als „künstliches Stottern“ (artificial stutter). Die Symptome unterscheiden sich aber deutlich von echtem Stottern: Es fehlen Muskelanspannungen, und Wiederholungen treten eher an den Endsilben der Wörter auf und nicht, wie meist beim Stottern, am Beginn.  (zurück) 
 

Das Modell von Willem Levelt

Es ist wohl das zur Zeit bekannteste und gebräuchlichste Modell der Sprachverarbeitung. Da ich im weiteren Text häufig darauf Bezug nehmen werde, stelle ich es hier kurz vor. Die Abbildung zeigt eine vereinfachte, auf die Sprachproduktion und die Rückmeldeschleifen beschränkte Variante und entspricht Fig. 12.3 auf Seite 470 in Levelts Buch „Speaking“ [5].
 

Levelt (1995) Fig. 12.3
 
 
Der Vorzug dieses Modells ist, dass es den Zusammenhang zwischen der Sprachproduktion und der auditiven Rückmeldung darstellt. Allerdings werde ich das Modell in einigen Punkten abwandeln bzw. ergänzen (siehe besonders Abschnitt 1.3.).  (zurück) 
 

 nach oben 

 nächste Seite 

Quellen

  1. Lashley (1951)
  2. Rosenbaum et al. (2007)
  3. Lee (1951)
  4. Kalveram (1984), Kalveram & Jänke (1989), Jänke (1992)
  5. Levelt (1995)

 zum Literaturverzeichnis