Mikrovariationen der gesunden Stimme

Keywords:
Mikrovariation: voice perturbation
Mikrovariation der Frequenz: fundamental frequency perturbation = Jitter
Mikrovariation der Amplitude: amplitude perturbation = Shimmer
motorische Einheit: motor unit ( = efferenter Nerv und die und die mit ihm verbundenen Muskelfasern)
Nervenimpulse i.d. Muskeln: neuromuscular firing
musculus thyroarytaenoideus = Muskel zwischen Schild - u. Stellknorpel
Inhaltsverzeichnis:
    1.) Einführung 2.) Shimmer 3.) Jitter 4.) Ursachen der Mikrovariationen 4.i.) Der Einfluß des Pulsschlags 4.ii) Nervenimpulse 4.iii) Struktur der Stimmlippen 5.) Einflüsse und Abhängigkeiten 6.) Versuche und Meßverfahren 7.) Formeln und Vergleichswerte 8.) Literatur

1.) Einführung
Auch bei lange gehaltenen Vokalen ist das Oszillogramm nicht streng periodisch, sondern es treten Abweichungen der Periode (Jitter) und Abweichungen der Amplitude (Shimmer) auf. Dies ist sowohl bei gesunden Sprechern als auch bei Patienten, die an einer Stimmstörung leiden, der Fall. Standardabweichungen von <= 2% vom Durchschnittswert des Sprechers gelten als "normal", Mikrovariationen von mehr als 2% werden als pathologisch eingestuft.
Aus diesem Sachverhalt erklärt sich auch die primäre Bedeutung der Mikrovariationen. Sie sind zwar so gering, dass sie rein auditiv schwer zu bestimmen sind, jedoch mit entsprechender akustischer Analyse sind sie gut zu analysieren und stellen dann ein Merkmal zur Früherkennung von Larynxerkrankungen dar.
Weiterhin muss man die Mikrovariationen der Stimme zu erkennen und zu deuten wissen, wenn man Untersuchungen zur Prosodie o.ä. vornimmt, um eine Verfälschung des Ergebnisses zu vermeiden.
Schließlich können die Mikrovariationen auch für Spracherkennung und Sprachsynthese von Bedeutung sein, da sie nach Lyberg für die Natürlichkeit und die Erkennbarkeit von Sprachsignalen eine Rolle spielen.
2.) Shimmer
Definiert ist Shimmer als die durchschnittliche Differenz (in dB) zwischen aufeinanderfolgenden Amplituden, wobei Amplitude ihrerseits als "peak - to - peak distance" verstanden wird.
Der Durchschnittswert für Shimmer einer gesunden Stimme liegt zwischen 0.05 und 0.22 dB. (Nach Haji et al.,1986)
Nach Titze ist der Shimmer in Verbindung mit dem Elektroglottographen eigentlich geeigneter zur Bestimmung von Irregularitäten bei der Stimmlippenvibration ( besonders bei der hoarse - voice, der heiseren Stimme) jedoch bisher beschäftigte sich die Forschung weitgehend mit der Periodenvariation, dem Jitter, von dem deshalb hier auch hauptsächlich die Rede sein wird.
3.) Jitter
Unter Jitter versteht man die Mikrovariation der Grundfrequenz (F0). Durchschnittswerte finden sich in der Tabelle am Ende des Referates.
Bei Stimmkrankheiten erhöht sich die Abweichung, vor allem bei Krankheiten, die die Symmetrie ( die Spannung oder die Masse) der Stimmlippen betreffen.
Auch ist zu beobachten, dass der Jitter zu Beginn und am Ende eines gehaltenen Tones besonders hoch ist.
4.) Ursachen der Mikrovariationen
4.i ) Der Einfluß des Pulsschlags
Vermutung : Die Blutzufuhr bläht die Stimmlippen auf und verändert somit periodisch die Stimmlippenbewegung .
Untersuchungen von Orlikoff/Baken ergaben, dass sich die Schwankungen der Grundfrequenz tatsächlich periodisch wiederholten, wobei die Periodendauer etwa dem zeitlichen Abstand zwischen den Pulsschlägen entsprach.
Nach Orlikoff/Baken belief sich der Beitrag des Pulsschlags zum gesamten Jitter auf 0.5 - 20.0 % :
bei Männern auf durchschnittl. 6.9 %
bei Frauen auf durchschnittl. 2.4 %
insgesamt also auf 4.6 %
Die Dauer betrug im Schnitt bei Männern 3.7 µs, bei Frauen 0.9µs = insges. 2.3 µs.
Vor allem betroffen ist der musculus thyroarytaenoideus (vocalis), der zwischen Schild - und Stellknorpeln verläuft.
(Dem Problem, dass die gehaltene Phonation eine Atemhalteübung darstellt und sich daher dabei auch der Herzschlag ändert, wurde übrigens dadurch entgegengewirkt, dass jeder F0 - Wert relativ zum Grundfrequenz - Mittelwert ( pro 'cardiac cycle') gesehen wurde).
4.ii) Nervenimpulse
Das Auftreten von Nervenimpulsen scheint zu bewirken, dass sich die Stimmlippen rhythmisch zusammenziehen.
Die Impulse in den motorischen Einheiten ( s.o.) führen dazu, dass der musculus thyroarytaenoideus zu zucken beginnt (für diesen Muskel wurde es genauer untersucht, ist aber wohl für andere laryngale Muskeln in ähnlicher Weise anzunehmen (Titze 1991)).
Der dadurch entstehende Jitter hängt ab von
    der Anzahl der motorischen Einheiten (viele m.E. können das "Zucken" einer einzigen gewissermaßen "ausgleichen") der Frequenz der Impulse (der Jitter wird geringer, wenn mehr als 50 Reize pro Sekunde erfolgen, da dann dem Muskel nicht genug Zeit bleibt zu erschlaffen und es einfach zu einer Dauerverkürzung (Tetanus) kommt. der Längenvariation der motorischen Einheiten (je unterschiedlicher die Längen der Muskelfasern, desto größer ist der Jitter [exponentieller Zusammenhang]) der Impulsvariation (wie bei Längenvariation)
4.iii ) Struktur der Stimmlippen
Eine weitere Erklärung für Jitter und Shimmer ist die Struktur der Stimmlippen. Es könnte nämlich sein, dass sie "innerlich vibrieren".
Je kleiner und fester ("rigid") die Stimmlippen sind, desto geringer wäre demzufolge die Mikrovariation.
Darauf deutet ebenfalls hin, dass der Jitter mit steigender Grundfrequenz - bei der die Stimmlippen immer gespannter werden - abnimmt. Auch sind verschiedene Werte des Jitters bei unterschiedlichen Vokalen beobachtet worden ( aber hierzu s.u. Einfluß des Alters).
5.) Einflüsse und Abhängigkeiten
Zungenbewegung
Der Kehlbereich ist ein hochkomplexes System aus Bändern Knorpeln und Muskeln, auf das sogar weitentfernte Muskelpartien Einfluß haben (z.B. wirkt sich die Körperhaltung auf die Phonation aus).
Dass sich die Jitter - Werte für die verschiedenen Vokale so deutlich unterscheiden, könnte an der variierten Zungenstellung / - bewegung liegen.
Geschlecht ?
Nein. Die durchschnittlichen Jitter - Werte für Männer und Frauen unterscheiden sich zwar, jedoch ist dies höchstwahrscheinlich auf die allgemein höhere Grundfrequenz der weiblichen Probanden zurückzuführen.
Gesundheit
Larynxerkrankungen haben, wie gesagt, erhöhte Mikrovariationen zur Folge. Aber auch schon eine Erkältung kann die "speechwave" wegen der Bewegung der relativ großen Menge Schleims auf den Stimmlippen beeinflussen.
Alter
Prinzipiell kann man sagen, dass jüngere Menschen geringere Mikrovariationen aufweisen als ältere. Aber eine Studie von Linville (1987) zeigt, dass dabei zwischen den jeweiligen Vokalen zu differenzieren ist:
Ältere Frauen Weisen bei /a / einen höheren Jitter als bei / i / und /u / auf ; bei jüngeren Frauen verhält es sich genau umgekehrt.
6.) Versuch und Meßverfahren
Probanden: Nichtraucher, keine Stimmausbildung, keine Stimmerkrankungen zum Zeitpunkt des Versuchs oder in der Vergangenheit.
Versuch: Ein Vokal sollte solange wie möglich gehalten werden, bei bestimmter Frequenz (visuelles Feedback: Voltmeter) und bestimmter Lautstärke (zum Messen und Anzeigen des Luftstroms).
Diese Laborsituation hat den Vorteil, dass Koartikulation und prosodische Erscheinungen, wie sie z.B, in der gesprochenen Sprache auftreten, ausgeschlossen werden können.
Das Signal wird in ein Mikrophon 'gesprochen', die Analyse erfolgt digital.
Bisweilen wird auch ein Elektroglottograph (EGG) verwendet, der sehr gut geeignet ist, Unregelmäßigkeiten der Stimmlippenvibration - bes. der Amplitude - anzuzeigen. Die einfache EGG - Welle erleichtert die digitale Analyse; außerdem werden noch weitere Aspekte angezeigt, deren Bedeutung bisher nicht gänzlich geklärt ist (z.B. die Art u. Weise der Stimmlippenberührung).
Die Vorteile der Mikrovariationsbestimmung als diagnostisches Mittel bestehen zum einen in der angenehmen - da äußerlichen - Anwendung (es wird kein Gegenstand in den Rachenraum eingeführt) und zum anderen in den relativ geringen Kosten (was die Gerätschaften und ihre Anwendung betrifft).
Nachteile:
Die Versuche zum Problem der Mikrovariationen sind sehr aufwendig, vor allem ist der Zeitaufwand sehr groß. Daher wurden stets weniger als 20 Probanden, von denen immer mehrere Aufnahmen gemacht werden müssen, untersucht.
Die Bestimmung von Jitter und Shimmer erfolgt in der Forschung bisher leider sehr uneinheitlich. Die verschiedenen Meßgeräte und die unterschiedliche Analyse - Software führen zu abweichenden Ergebnissen.
Die Studie von Karnell et al. (1991) zeigt das sehr deutlich am Beispiel der 'voice - laboratories' von Chicago, Denver und Pine Brook. Auch die Tabelle am Ende dieses Beitrags lässt dies vermuten. Daraus folgt, dass alle angegebenen Werte nur unter Vorbehalt zu akzeptieren sind. Das primäre Ziel weiterer Forschungsarbeit sollte also darin bestehen, bessere / einheitliche Meßverfahren zu finden.
7.) Formeln und Vergleichswerte
Zum Schluß seien noch drei Formeln zur Bestimmung des Jitters aufgeführt:
Der prozentuale Jitter - Faktor (Hollien et al., 1973)
durchschnittl. Abweichung von der Periodendauer * 100) JF = ______________________________________________________, durchschnittl. Periodendauer des Signals
der "Pitch Perturbation Quotient" (Davis, 1976) als das Verhältnis der Summe von Periodendifferenzen mit einem gleitenden Periodenmittelwert zur mittleren Periodendauer:


und der "Directional Perturbation Factor" (Hecker/Kreul, 1971) Anz. Vorzeichenwechsel DPF = __________________________________, Anz. möglicher Vorzeichenwechsel
der unter Verwendung der beobachteten Vorzeichenwechseln (bei Differenzen aufeinanderfolgender Perioden) und den möglichen Vorzeichenwechseln von der individuellen Grundfrequenz unabhängig ist.
Die folgende Tabelle zeigt die in verschiedenen Versuchen bestimmten JF für /i/ und /u/. Die Vokale wurden jeweils von weiblichen Versuchspersonen gebildet, deren Alter in eckigen Klammern angegeben ist.
Vokal Linville(1987) Higgins/Saxman(1989) Casper(1983) Sorensen/Horii(1983/84)
[18 - 22 J.] [19 - 26 J.] [22 - 29 J.] [25 - 49 J.] /i/ 0,97% 0,41% 0,55% 0,96% /u/ 0,84% 0,43% 0,56% 0,86%


Literatur

Haji, T. et al. (1986) Frequency and amplitude perturbation analysis of electroglottograph during sustained phonation, JASA, 80:1, S.58 - 62
Higgins, M.B.; Saxman, J.H. (1989) A comparison of intrasubject variation across sessions of three vocal fundamental perturbation indices, JASA, 86:3, 911 - 916
Karnell, M.P. et al. (1991) Comparison of Acoustic Voice Perturbation Measures Among Three Independent Voice Laboratories, JSHR, 34, 781 - 789
Linville, S.E. (1988) Intraspeaker variability in fundamental frequency stability: An age - related problem?, JASA, 83:2, 741 - 745
Orlikoff, R. - F.; Baken, R.J. (1989) The Effect of the Heartbeat on Vocal Fundamental Frequency Perturbation, JSHR, 32:3, S.576 - 582
Schoentgen, J. (1990) Acoustic features of dysphonic voices, Rapport - d'Activites - de - l'Institute - de - Phonetique, 26, S. 87 - 112
Titze, I. (1991) A Model for Neurologic Sources of Aperiodicity in Vocal Fold Vibration, JSHR, 34:3, S.460 - 472

134 Worte in "deutsch"  als "hilfreich"  bewertet