eBooks

Phonetische und linguistische Aspekte der Akzentimitation im forensischen Kontext

2012
978-3-8233-7687-3
Gunter Narr Verlag 
Sarah Neuhauser

Forensisch-phonetische Analysen kommen immer dann zum einsatz, wenn lautsprachliche Äußerungen im Kontext einer Straftat stehen. sie werden durch eine Reihe von Störeinflüssen erheblich erschwert, z.B. durch die bewusste Verstellung von Merkmalen der Stimme, sprache oder Sprechweise eines Sprechers. diese Arbeit untersucht die Imitation fremdsprachiger Akzente als eine mögliche Verstellungsart. Die Form und Variation bestimmter phonetischer Merkmale im Deutschen gesprochen mit einem imitierten französischen Akzent von deutschen Muttersprachlern und mit einem authentischen Akzent von französischen Muttersprachlern werden auf Basis eines umfangreichen Korpus systematisch analysiert. Über Perzeptionsexperimente wird außerdem die Fähigkeit deutscher Höher untersucht, imitierte und authentische fremdsprachige Akzente zu identifizieren und nach ihrer authentizität zu beurteilen.

Sara Neuhauser Phonetische und linguistische Aspekte der Akzentimitation im forensischen Kontext Produktion und Perzeption Phonetische und linguistische Aspekte der Akzentimitation im forensischen Kontext Produktion und Perzeption Sara Neuhauser Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http: / / dnb.dnb.de abrufbar. © 2012 · Narr Francke Attempto Verlag GmbH + Co. KG Dischingerweg 5 · D-72070 Tübingen Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Gedruckt auf säurefreiem und alterungsbeständigem Werkdruckpapier. Internet: http: / / www.narr.de E-Mail: info@narr.de Printed in Germany ISSN 0564-7959 ISBN 978-3-8233-6687-4 Inhaltsverzeichnis 1. Einleitung 1 I. Theoretische Grundlagen und Stand der Forschung 2. „Stimmverstellung“ 9 2.1. Definition und Klassifikation . . . . . . . . . . . . . . . . . . . . . 9 2.2. Frequenz verschiedener Verstellungen . . . . . . . . . . . . . . . . 13 2.3. Effektivität von Verstellungen und Identifikation als Stimmverstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 3. Verstellung durch einen fremdsprachigen Akzent 21 3.1. Fremdsprachiger Akzent . . . . . . . . . . . . . . . . . . . . . . . . 21 3.1.1. Fremdsprachiger Akzent und seine möglichen Einflussfaktoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 3.1.2. Beurteilung eines fremdsprachigen Akzents . . . . . . . . 23 3.1.3. Phonetische Korrelate eines fremdsprachigen Akzents . . 24 3.2. Fremdsprachiger Akzent im forensischen Kontext . . . . . . . . . 26 3.2.1. Fremdsprachen und fremdsprachige Akzente im forensischen Kontext . . . . . . . . . . . . . . . . . . . . . . . . . . 26 3.2.2. Imitierte regionale Dialekte . . . . . . . . . . . . . . . . . . 31 3.2.3. Imitierte fremdsprachige Akzente . . . . . . . . . . . . . . 35 3.3. Empirische Studien zur Verstellung durch einen fremdsprachigen Akzent . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 3.4. Motivation und Ziele für die weitere Forschung . . . . . . . . . . 45 II. Methodik und Korpus 4. Korpusvorbereitung 49 4.1. Befragung zur Akzentimitation: Methode . . . . . . . . . . . . . . 49 4.2. Befragung zur Akzentimitation: Ergebnisse . . . . . . . . . . . . . 50 5. Korpusbeschreibung 53 5.1. Sprecher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 5.2. Akzente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 5.3. Texte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 5.4. Sprachaufnahmen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 5.4.1. Sprachaufnahmen für deutsche Muttersprachler . . . . . . 56 5.4.2. Sprachaufnahmen für nicht-deutsche Muttersprachler . . 57 5.4.3. Übungsaufwand . . . . . . . . . . . . . . . . . . . . . . . . 58 v . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.5. Korpusgruppe: Französischer Akzent . . . . . . . . . . . . . . . . 59 5.5.1. Deutsche Muttersprachler . . . . . . . . . . . . . . . . . . . 60 5.5.2. Französische Muttersprachler . . . . . . . . . . . . . . . . . 63 6. Korpusaufbereitung 69 6.1. Allgemeine Vorarbeiten und Transliteration . . . . . . . . . . . . . 69 6.2. Annotation des Sprachmaterials . . . . . . . . . . . . . . . . . . . 70 6.3. Veröffentlichung des Korpus . . . . . . . . . . . . . . . . . . . . . 73 III. Phonetische und phonologische Grundlagen 7. Lautlicher Vergleich des Deutschen und Französischen 77 7.1. Phonetik und Phonologie des Deutschen . . . . . . . . . . . . . . 79 7.1.1. Phonetische Beschreibung des deutschen Konsonantensystems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 7.1.2. Phonetische Beschreibung des deutschen Vokalsystems . 84 7.2. Phonetik und Phonologie des Französischen . . . . . . . . . . . . 88 7.2.1. Phonetische Beschreibung des französischen Konsonantensystems . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 7.2.2. Phonetische Beschreibung des französischen Vokalsystems 92 7.2.3. Zu erwartende Abweichungen in Deutsch als L2 . . . . . 94 IV. Produktion 8. Eingrenzung der phonetischen Analyse 101 9. Stimmeinsatzzeit und Stimmbeteiligung bei Plosiven 105 9.1. Variation der Stimmeinsatzzeit in Fortis-Plosiven . . . . . . . . . 114 9.1.1. Methode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 9.1.2. Ergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 9.1.3. Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . 131 9.2. Variation der Stimmbeteiligung bei Lenis-Plosiven . . . . . . . . . 132 9.2.1. Methode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133 9.2.2. Ergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 9.2.3. Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . 150 9.3. Zusammenfassung und Diskussion . . . . . . . . . . . . . . . . . 151 10. Glottalisierung und glottale Friktion 155 10.1. Glottalisierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 10.1.1. Methode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 10.1.2. Ergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163 10.1.3. Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . 175 vi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.2. Glottale Friktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 10.2.1. Methode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 10.2.2. Ergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181 10.2.3. Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . 205 10.3. Zusammenfassung und Diskussion . . . . . . . . . . . . . . . . . 207 11. Artikulatorische Variation am Beispiel der Endsilbenrealisierung 211 11.1. Methode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213 11.2. Ergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216 11.2.1. Vergleich der verstellten und unverstellten Produktionen deutscher Muttersprachler . . . . . . . . . . . . . . . . . . 216 11.2.2. Vergleich der Akzentimitationen mit den deutschen Produktionen französischer Muttersprachler . . . . . . . . . . 218 11.2.3. Konsistenz in der Realisierung . . . . . . . . . . . . . . . . 221 11.3. Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . 224 V. Perzeption 12. Perzeptionsexperiment I 227 12.1. Methode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228 12.1.1. Hypothesen . . . . . . . . . . . . . . . . . . . . . . . . . . . 228 12.1.2. Stimuli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230 12.1.3. Hörer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231 12.1.4. Durchführung . . . . . . . . . . . . . . . . . . . . . . . . . . 232 12.2. Ergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233 12.2.1. Teilexperiment 1 - Authentizitätsbeurteilung . . . . . . . . 233 12.2.2. Teilexperiment 2 - Identifikation . . . . . . . . . . . . . . . 236 12.2.3. Zusammenführung der Ergebnisse beider Teilexperimente 240 12.3. Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . 242 13. Phonetische Korrelate der Akzent-Authentizität 245 13.1. Realisierung des / h/ und Glottalisierung in Vokaljunkturen . . . 246 13.2. Realisierung der Endsilbe / -@n/ . . . . . . . . . . . . . . . . . . . . 248 13.2.1. Methode - Perzeptionsexperiment II . . . . . . . . . . . . 250 13.2.2. Ergebnisse - Perzeptionsexperiment II . . . . . . . . . . . 252 13.2.3. Diskussion - Perzeptionsexperiment II . . . . . . . . . . . 254 13.3. Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . 255 VI. Schluss 14. Zusammenfassung und Diskussion 259 Literaturverzeichnis 269 vii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A. Fragebogen zur Akzentermittlung 285 A.1. Fragebogen der ersten Probandengruppe . . . . . . . . . . . . . . 285 A.2. Fragebogen der Kontrollgruppe . . . . . . . . . . . . . . . . . . . . 287 B. Probandenbefragung der Sprecher 289 B.1. Fragebogen für die Experimentteilnehmer . . . . . . . . . . . . . 289 B.2. Fragebogen zum Übungsaufwand . . . . . . . . . . . . . . . . . . 290 C. Texte 291 C.1. Text 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291 C.2. Text 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291 C.3. Text 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292 C.4. Text 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292 C.5. Aufgabenstellung zum Schreiben eines eigenen Textes . . . . . . 293 C.6. Aufgabenstellung zum Schreiben eines eigenen Textes für Nicht- Muttersprachler des Deutschen . . . . . . . . . . . . . . . . . . . . 294 C.7. Transliterationsproben . . . . . . . . . . . . . . . . . . . . . . . . . 295 D. Fragebogen für Perzeptionsexperiment I und II 297 E. Tabellen 299 viii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Abbildungsverzeichnis 4.1. Gesamtverteilung der Stimmen auf die Akzente . . . . . . . . . . . 52 5.1. Zusammensetzung der Probandenbezeichnung . . . . . . . . . . . . 54 5.2. Selbsteinschätzung der deutschen Muttersprachler zur Authentizität ihrer produzierten französischen Akzente (links) und zur Fähigkeit, imitierte von authentischen französischen Akzenten zu unterscheiden (rechts) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 5.3. Regionale Herkunft der französischen Muttersprachler . . . . . . . 64 6.1. Überblick über eine Etikettierung mit Praat . . . . . . . . . . . . . . 72 7.1. Schematische Darstellung der wichtigsten monophthongischen und diphthongischen Vokalallophone der deutschen Vokalphoneme 85 7.2. Schematische Darstellung der wichtigsten Vokalallophone der französischen Vokalphoneme . . . . . . . . . . . . . . . . . . . . . . . . . 94 9.1. Segmentierung zur Messung der VOT beispielhaft an einem Ausschnitt von kommen der Sprecherin Ff02 . . . . . . . . . . . . . . . . 116 9.2. Vergleich der gemittelten VOT-Werte aller Tokens in unverstellter und verstellter Version gesprochen von deutschen Muttersprachlern 119 9.3. Interindividuelle Variabilität der VOT dargestellt als Mittelwertsdifferenz zwischen verstellter und unverstellter Produktion . . . . . 123 9.4. Stimmhafte Realisierung des / k/ in kommen in der verstellten Version der Sprecher Ff10 und Fm03 . . . . . . . . . . . . . . . . . . . . 125 9.5. Vergleich der gemittelten VOT-Werte aus den verstellten und unverstellten Produktionen der deutschen Muttersprachler mit den deutschen Produktionen der französischen Muttersprachler . . . . 127 9.6. Gemittelte VOT-Werte der deutschen und französischen Produktionen der französischen Muttersprachler . . . . . . . . . . . . . . . . . 129 9.7. Vor Verschlusslösung einsetzende Stimmhaftigkeit in der verstellten Version von gehen . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 9.8. Pränasalierte Realisierung von / d/ in den verstellten Versionen der Sprecherin Ff11 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 10.1. Vergleich des phraseninitialen Vokaleinsatzes der Sprecherinnen Ff11 und Ff15 in der unverstellten Version des Wortes ohne . . . . . . . . 158 10.2. Phraseninitialer Vokaleinsatz der Sprecher F-nf02 und F-nm02 in après159 10.3. Verschiedene Formen junktureller Glottalisierung in nur einmal (Ausschnitt) gesprochen von Ff04, Ff07, Ff05, Ff01 (unverstellte Version) 165 10.4. Oszillogramme verschiedener Formen junktureller Glottalisierung in nur einmal (Ausschnitt) gesprochen von Ff04, Ff07, Ff05, Ff01 (unverstellte Version) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166 ix 10.5. Vergleich der unterschiedlichen Realisierung der Vokaljunktur in die Angestellten (Ausschnitt) gesprochen von Ff12 in unverstellter Version . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 10.6. Glottalisierter Vokaleinsatz in Bank et gesprochen von F-nm02 . . . 169 10.7. Gegenüberstellung von glottalisiertem Vokaleinsatz in unverstellter Version und nicht glottalisiertem Vokaleinsatz in verstellter Version der Phrase die anderen (Ausschnitt) gesprochen von Ff07 . . . . . . . 170 10.8. Gegenüberstellung von glottalisiertem Vokaleinsatz in unverstellter Version und nicht glottalisiertem Vokaleinsatz in verstellter Version der Phrase nur einmal gesprochen von Fm04 . . . . . . . . . . . . . . 170 10.9. Nicht glottalisierte, mit konsonantischem / r/ realisierte Form von verurteilt gesprochen von Fm03 in verstellter Version . . . . . . . . . 173 10.10. Gegenüberstellung von nicht glottalisiertem (a) und glottalisiertem (b) Vokaleinsatz in verurteilt (Ausschnitt) gesprochen von F-nf01. . . 174 10.11. Gegenüberstellung von glottalisiertem (a) und nicht glottalisiertem (b) Vokaleinsatz in verurteilt (Ausschnitt) gesprochen von F-nf02. . . 175 10.12. Jahre hinter in unverstellter Version gesprochen von Fm03 . . . . . . 183 10.13. Ausschnitt aus Jahre hinter in unverstellter und verstellter Version gesprochen von Fm03 . . . . . . . . . . . . . . . . . . . . . . . . . . . 184 10.14. Behauchte Stimmhaftigkeit mit anschließender Glottalisierung in moderne Hosen (Ausschnitt) gesprochen von Ff09 (unverstellte Version)185 10.15. Glottalisierung und anschließende stimmhafte glottale Friktion in Mann hat (Ausschnitt) gesprochen von Ff10 (unverstellte Version) 186 10.16. Glottalisierte Behauchung in finaler Position in in Haft gesprochen von Fm07 (unverstellte Version) . . . . . . . . . . . . . . . . . . . . . 187 10.17. Oszillogramme verschiedener Realisierungsformen des / h/ in alle haben (Ausschnitt) gesprochen von Ff02, Ff04, Ff10 und Ff09 (verstellte Version) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189 10.18. Ausschnitt aus langen Haftstrafen gesprochen von Ff02 (verstellte Version) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193 10.19. alle haben gesprochen von Fm07 (verstellte Version) . . . . . . . . . . 193 10.20. Behauchte Glottalisierung in Jahre hinter (Ausschnitt) gesprochen von Ff07 (verstellte Version) . . . . . . . . . . . . . . . . . . . . . . . 194 10.21. Unterschiedliche Realisierungsformen des / h/ in zur Haltestelle (Ausschnitt) gesprochen von französischen Muttersprachlern . . . . . . 196 10.22. Stimmlose glottale Friktion mit unterschiedlich langen Phasen vorausgehender behauchter Stimmhaftigkeit in den Produktionen (Ausschnitte) von in Haft (a) und Mann hat (b) gesprochen von F-nm01 und Überfällen hatten (c) und langen Haftstrafen (d) gesprochen von F-nf02 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198 10.23. Supraglottale Friktion bei Sprecher F-nm01 in den Phrasen Jahre hinter (a) und zweihunderttausend (b) . . . . . . . . . . . . . . . . . . 201 10.24. Realisierung des / h/ in zur Haltestelle (Ausschnitt) gesprochen von F-nm01 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202 x 10.25. langen Haftstrafen (Ausschnitt) gesprochen von F-nm01 und F-nm02 203 10.26. erwartete erhöhte gesprochen von F-nf01 . . . . . . . . . . . . . . . . . 204 11.1. Prozentualer Anteil reduzierter Endsilben in den unverstellten und verstellten Produktionen der deutschen Muttersprachler . . . . . . 217 11.2. Reduzierte und volle Realisierung der Endsilben in haben und Banken gesprochen von Ff04 in unverstellter (oben) und verstellter Version (unten) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219 11.3. Prozentualer Anteil reduzierter Endsilben in den deutschen Produktionen französischer Muttersprachler und bei der Akzentimitation durch deutsche Muttersprachler . . . . . . . . . . . . . . . . . . 220 11.4. Prozentualer Anteil reduzierter Endsilben in den deutschen Produktionen französischer Muttersprachler und in den unverstellten Produktionen deutscher Muttersprachler . . . . . . . . . . . . . . . . 222 11.5. Vergleich des prozentualen Anteils an reduzierten Endsilben zwischen der 1. und der 2. Aufnahme (Texte 1-3) für französische und deutsche Muttersprachler (verstellt) . . . . . . . . . . . . . . . . . . . 223 12.1. Anzahl falscher Authentizitätsbeurteilungen in der Gruppe deutscher Muttersprachler, die französischen Akzent imitieren . . . . . 234 12.2. Anzahl falscher Authentizitätsbeurteilung in der Gruppe deutscher Muttersprachler, die amerikanisch-englischen Akzent imitieren . . . 235 12.3. Verteilung der falschen Authentizitätsurteile für die Gruppe der nicht-deutschen Muttersprachler . . . . . . . . . . . . . . . . . . . . 236 12.4. Anzahl korrekter Akzentidentifikationen in den Gruppen „französischer Akzent“ und „amerikanisch-englischer Akzent“ . . . . . . . 237 12.5. Zusammenhang zwischen Authentizitätsbeurteilung und korrekter Akzenteinschätzung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241 13.1. Zusammenhang zwischen Authentizitätsbeurteilung und Realisierung der Endsilben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250 13.2. Vergleich der Authentizitätsbeurteilungen für die unmanipulierten Stimuli zwischen Perzeptionsexperiment I und II . . . . . . . . . . . 253 13.3. Vergleich der Authentizitätsbeurteilungen für die unmanipulierten und die manipulierten Stimuli aus Perzeptionsexperiment II . . . . 254 D.1. Fragebogen der Perzeptionsexperimente I (Teilexperiment 1 - Authentizitätsbeurteilung) und II exemplarisch an Durchgang 1 dargestellt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 297 D.2. Fragebogen des Perzeptionsexperiments I (Teilexperiment 2 - Identifikation) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 298 xi Tabellenverzeichnis 2.1. Weite Klassifizierung der Stimmverstellungen . . . . . . . . . . . . . 10 2.2. Detaillierte Klassifikation der vorsätzlichen nicht-elektronischen Stimmverstellungsarten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 4.1. Verteilung der Stimmen auf fremdsprachige Akzente in der ersten Befragung (links) und in der Befragung der Kontrollgruppe (rechts) 51 9.1. Vereinfachter Vergleich der VOT-Systeme Deutsch-Französisch . . . 111 9.2. Vergleich der VOT-Systeme Englisch-Französisch-Bilingual . . . . . 113 9.3. Gruppierung der gemessenen VOT nach Artikulationsort und Vokalkontext (Text 1 und 3) . . . . . . . . . . . . . . . . . . . . . . . . . . 118 9.4. Gruppierung der gemessenen VOT nach Artikulationsort und Vokalkontext (Text 4, Französisch) . . . . . . . . . . . . . . . . . . . . . . 118 9.5. Gemittelte VOT-Werte der deutschen Muttersprachler (N=22) in unverstellter und verstellter Version der Texte 1 und 3 (1. Aufnahme) 120 9.6. Vergleich der VOT-Mittelwerte deutscher Muttersprachler in unverstellter und verstellter Version in ms . . . . . . . . . . . . . . . . . . . 120 9.7. Vergleich der Aspirationsdauer (AD) initialer Fortis- und Lenis-Plosive deutscher Sprecher aus Künzel (1977), Braun (1988) und Jessen (1998) mit den VOT-Werten initialer Fortis-Plosive aus der vorliegenden Studie (SN). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 9.8. Ergebnisse des Shapiro-Wilk-Tests auf Normalverteilung der VOT- Werte der deutschen Muttersprachler jeweils in verstellter und unverstellter Version mit dem Wahrscheinlichkeitswert p und der Prüfgröße W . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 9.9. Ergebnisse der Signifikanztests auf Verringerung der VOT bei der Imitation eines französischen Akzents unter Angabe des Wahrscheinlichkeitswertes p und der Prüfgrößen t bzw. V . . . . . . . . . . . . . 122 9.10. Vergleich der gemittelten VOT der deutschen Muttersprachler in verstellter und unverstellter Version mit denen der französischen Muttersprachler im Deutschen in ms . . . . . . . . . . . . . . . . . . . 126 9.11. Vergleich der gemittelten VOT der französischen Muttersprachler in ihren deutschen und französischen Produktionen in ms . . . . . . . 128 9.12. Vergleich der Aspirationsdauer (AD) aus Künzel (1977) mit den VOT- Werten der vorliegenden Studie (SN) sowie aus Abdelli-Beruh (2004) für französische initiale Fortis-Plosive gesprochen von französischen und deutschen Muttersprachlern bzw. bei der Akzentimitation . . . 130 9.13. Datenbasis zur Messung der VOT bei Lenis-Plosiven gruppiert nach Artikulationsstelle des Plosivs . . . . . . . . . . . . . . . . . . . . . . . 135 xiii 9.14. Anzahl der Realisierungen der Lenis-Plosive mit und ohne Stimmbeteiligung in der verstellten (verst.) und unverstellten (unverst.) Version pro Sprecher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 9.15. VOT-Mittelwerte (in ms) der Fortis- und Lenis-Plosive in verstellter und unverstellter Version unter Berücksichtigung des Sprechergeschlechts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 9.16. Zusammenfassung der Ergebnisse der statistischen Testverfahren hinsichtlich der VOT-Unterschiede in verstelltem (verst.) und unverstelltem (unverst.) Modus und zwischen den Sprechergeschlechtern 139 9.17. Verteilung der mit Stimmbeteiligung realisierten Lenis-Plosive nach Artikulationsort . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 9.18. Gegenüberstellung der Lenis-Plosiv-Realisierungen der deutschen Produktionen französischer Muttersprachler den verstellten und unverstellten Produktionen der deutschen Muttersprachler . . . . . . . 149 9.19. Realisierung der Lenis-Plosive in der französischen Textproduktion (Text 4) französischer Muttersprachler . . . . . . . . . . . . . . . . . . 151 10.1. Anzahl (N) der mit und ohne Glottalisierung (Glott.) realisierten Vokaleinsätze pro Sprecher in der unverstellten und in der verstellten Version . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 10.2. Anzahl (N) der mit und ohne Glottalisierung (Glott.) realisierten Vokaleinsätze pro französischen Muttersprachler in der deutschen Produktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 10.3. Anzahl (N) der verschiedenen Realisierungen für / h/ pro Sprecher 188 10.4. Verteilung der stimmhaften (sth.) und stimmlosen (stl.) Realisierungen glottaler Friktion in den verstellten Produktionen deutscher Muttersprachler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190 10.5. Anzahl (N) der verschiedenen Realisierungen für / h/ nach Tokens sortiert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190 10.6. Anzahl (N) der verschiedenen Realisierungen für / h/ pro französischen Muttersprachler . . . . . . . . . . . . . . . . . . . . . . . . . . . 195 10.7. Verteilung der stimmhaften (sth.) und stimmlosen (stl.) Realisierung glottaler Friktion in den deutschen Produktionen französischer Muttersprachler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199 11.1. Anzahl (N) der Endsilben in den Texten 1-3 . . . . . . . . . . . . . . 214 11.2. Auflistung der auf Realisierung der Endsilben zu analysierenden Wörter und Anzahl (N) ihres Vorkommens in den Texten 1-3 . . . . 215 11.3. Vergleich der gemittelten Anzahl an reduzierten Endsilben in den verstellten und unverstellten Produktionen der deutschen Muttersprachler und in den deutschen Produktionen der französischen Muttersprachler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221 xiv 12.1. Anzahl der korrekt und falsch / nicht zugeordneten Akzente in der Gruppe „französischer Akzent“ . . . . . . . . . . . . . . . . . . . . . 238 12.2. Anzahl der korrekt und falsch / nicht zugeordneten Akzente für die Gruppe „amerikanisch-englischer Akzent“ . . . . . . . . . . . . . . . 239 12.3. Anzahl der korrekt und falsch / nicht zugeordneten Akzente in der Foils-Gruppe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239 E.1. VOT-Werte der deutschen Muttersprachler (N=22) in unverstellter (uv.) und verstellter (fr.) Version der Texte 1 und 3 (1. Aufnahme); geordnet nach Plosiv-Vokal-Kontext . . . . . . . . . . . . . . . . . . . 299 E.2. VOT-Mittelwerte der deutschen Muttersprachler (N=22) in unverstellter (uv.) und verstellter (fr.) Version der Texte 1 und 3 (1. Aufnahme) mit der Mittelwertsdifferenz und dem Standardfehler (SE) der Mittelwertsdifferenz . . . . . . . . . . . . . . . . . . . . . . . . . . 300 E.3. VOT-Werte initialer Fortis-Plosive im Französischen und Deutschen gesprochen von französischen Muttersprachlern . . . . . . . . . . . . 301 E.4. Stimulus-Sprecher im Perzeptionsexperiment . . . . . . . . . . . . . . 301 xv Abkürzungsverzeichnis AE Amerikanisch-Englisch Anm. Anmerkung Aufl. Auflage BKA Bundeskriminalamt bzgl. bezüglich bzw. beziehungsweise d. h. das heißt Diphth. Diphthong(e) erw. erweiterte F; franz.; fr(z) Französisch ggf. gegebenenfalls HV hintere(r) Vokal(e) Hrsg. Herausgeber insges. insgesamt ms Millisekunde Mspr. Muttersprachler Mw arithmetisches Mittel n.s. nicht signifikant S. Seite s Standardabweichung u. a. unter anderem überarb. überarbeitete uv. unverstellt V Vokal(e) v. a. vor allem vgl. vergleiche VOT Voice Onset Time vs. versus z. B. zum Beispiel ZV zentrale(r) Vokal(e) xvii Danke Das vorliegende Buch ist eine geringfügig veränderte Version meiner Dissertation, die im November 2010 von der Philosophischen Fakultät der Universität Jena angenommen wurde. Das Promotionsverfahren wurde im Mai 2011 abgeschlossen. Ich möchte mich bei all denen bedanken, die mich während der Arbeit an meiner Dissertation und dieser Publikation unterstützt haben. Ich danke Prof. Dr. Peter Gallmann, Prof. Dr. Hermann J. Künzel und Prof. Dr. Baldur Neuber für die Betreuung und Begutachtung dieser Arbeit sowie für die Ratschläge, Hinweise und Anregungen. Diese Arbeit wurde durch das ProChance-Programm 2009 und 2010 des Prorektorats für Forschung der Universität Jena durch Sachmittel unterstützt und profitiert auch von den Diskussionen mit Kollegen und Kolleginnen auf Fachtagungen. Ein großer Dank geht an die zahlreichen Probanden, die entweder als Sprecher zur Verfügung standen oder an Befragungen und Hörexperimenten teilgenommen haben. Sie haben die experimentellen Untersuchungen erst ermöglicht. Außerdem haben mich Susanne Friedrich, Judith Hellmann, Anne-Katrin Leich und Toni Linke als studentische Hilfskräfte bei der Korpuserstellung durch Aufnahmen von Probanden und durch Hilfe bei der Annotation unterstützt - vielen Dank dafür. Für ihren kritischen Blick und das sorgfältige Korrekturlesen bedanke ich mich besonders bei Ramona Benkenstein, Robert Beyer, Manfred Consten, Mareile Knees, Anne-Katrin Leich und Ute Rieger. Besonders herzlich danke ich meiner Familie und meinen Freunden, ... die mich am Anfang dazu ermuntert haben, diesen Weg zu gehen, ... die auch zwischendurch in turbulenten Zeiten für mich da waren und ... die mich in der Schlussphase nicht nur moralisch, sondern auch ganz praktisch unterstützt haben. Adrian Simpson danke ich für die hervorragende Betreuung in der Anfangsphase meiner Dissertation. Auch danach war er immer für meine Fragen und Probleme da. Durch unsere Diskussionen und seine zahlreichen Hinweise und Anregungen, v. a. bei Fragen zur Analyse der Daten, habe ich viel gelernt. - Danke für deine motivierende Art, deine konstruktive Kritik und deine Begeisterung auch für Ergebnisse, die nicht meinen Erwartungen entsprachen! 1. Einleitung Die folgende Arbeit leistet einen Beitrag zur forensischen Phonetik als einem Anwendungsgebiet der Phonetik, das sich aus einer Reihe von Subdisziplinen zusammensetzt, wie beispielsweise der Erstellung von Sprecherprofilen, der Sprecheridentifizierung, der Gegenüberstellung von Stimmen, der Sprachsignalverbesserung oder der Überprüfung der Authentizität einer Sprachaufnahme. Gemeinsam ist diesen Subdisziplinen, dass die forensisch-phonetische Analyse überall dort zum Einsatz kommt, wo lautsprachliche Äußerungen im Kontext einer Straftat stehen. Laut Broeders (2001) werden im deutschen Bundeskriminalamt ca. 100 Fälle pro Jahr bearbeitet, die in den Bereich Sprechererkennung fallen. Die forensisch-phonetische Analyse von Sprachmaterial wird nach Gfroerer (2003) durch eine Reihe möglicher Störeinflüsse erheblich erschwert. Sie können in Störungen technischer Art (z. B. Verzerrungen durch Telefonübertragung, Hintergrundgeräusche) und in Störungen menschlicher Art seitens des Sprechers (z. B. durch Stress, Intoxikation, Emotionen, Verstellung) unterteilt werden (vgl. dazu auch Künzel, 1987, S. 3). Die Verstellung des stimmlich-sprachlichen Verhaltens eines Sprechers 1 wird in der Regel unter dem Terminus „Stimmverstellung“ zusammengefasst und hat zumeist die Verbergung der Identität des Sprechers als Ziel. Die Verstellung kann sowohl während der Begehung der Straftat erfolgen als auch bei der Aufzeichnung von Vergleichsmaterial für die forensisch-phonetische Untersuchung. Nach Braun (2006), einer neueren Untersuchung zur Vorkommenshäufigkeit von Verstellungen in der forensischen Praxis, treten in knapp einem Viertel der von forensisch-phonetischen Experten begutachteten Fälle Verstellungen auf. Bei Kapitalverbrechen wie Entführungen oder Erpressungsfällen, bei denen die Täter von einer Aufzeichnung ihrer gesprochenen Botschaft ausgehen können, sind Verstellungen besonders häufig (vgl. Masthoff, 1996a; Künzel, 2000; Braun, 2006). Stimmverstellung kann zu einer schlechteren Wiedererkennungsleistung durch Hörer führen (vgl. Hollien et al., 1982; Orchard und Yarmey, 1995; Duckworth und Hirson, 1995; Wagner und Köster, 1999) und auch die Analyse des forensisch-phonetischen Gutachters wird erschwert. So muss beispielsweise bei einem Stimmenvergleich das verstellte Material aus der Tataufzeichnung mit unverstelltem Material aus der Vergleichsaufzeichnung verglichen werden. Das heißt, dass zunächst Merkmale, die von der Verstellung betroffen sind, von nicht betroffenen Merkmalen unterschieden werden müssen. Ziel ist es, die unverstellt gebliebenen Merkmale zu ermitteln und auszuwerten und die verstellten Merkmale möglichst auf unverstellten Zustand zurückzuführen (vgl. Masthoff, 1996b). Die Effektivität der Verstellung ist nach Duckworth und Hirson (1995) zu einem großen Teil von der Fähigkeit des Sprechers abhängig, 1 Im Folgenden schließen die männlichen Formen die weiblichen ein. 1 seine Stimme, Sprache und Sprechweise stärker zu verändern als es durch normalverteilte Variation erwartet werden kann. Auf der anderen Seite bringt diese Abweichung von den gewohnten Mustern auch ein hohes Fehlerpotenzial mit sich, da es sich gerade nicht um eine Routineprozedur handelt (vgl. Künzel, 2000). Für Rodman (1998) und Rodman und Powell (2000) besteht die Motivation zur Forschung im Bereich Stimmverstellungen darin, dass es oft notwendig sei, einen Verdächtigen anhand verstellten Sprachmaterials zu identifizieren. Daher seien Mittel notwendig, um festzustellen, ob eine Stimmverstellung vorliegt und welche Art der Verstellung vom Sprecher genutzt wurde. Diese Mittel könnten nach Rodman und Powell (2000) ggf. auch eine computergestützte automatische Sprecheridentifikation trotz Stimmverstellung ermöglichen. Aus diesem Grund sollte diesem Bereich der forensischen Phonetik besonderer Forschungsaufwand gewidmet werden. Bisher existiert nach Eriksson (2010) kein automatisches System, das Verstellungen zuverlässig identifizieren kann. Der Aufbau einer Datenbank mit unverstelltem und verstelltem Material sei aber ein wichtiger Schritt dahin. Die vorliegende Arbeit schließt sich dem Ziel an, dem Bereich Stimmverstellung besonderen Forschungsaufwand zu widmen. Sie baut auf Neuhauser (2005) auf, einer Studie zu phonetischen und nicht-phonetischen Variationen bei der Imitation fremdsprachiger Akzente zum Zweck der Stimmverstellung, und entwickelt diese weiter. Unter fremdsprachigem Akzent werden hier die Aussprachebesonderheiten eines Sprechers verstanden, der in einer Fremdsprache (z. B. Deutsch) spricht und auf diese Fremdsprache bestimmte lautsprachliche Merkmale aus seiner Muttersprache überträgt. Mit der Vortäuschung eines fremdsprachigen Akzents im forensischen Kontext, kann der Sprecher beabsichtigen, seine eigene Identität zu verbergen und die Ermittlungen in eine bestimmte Richtung lenken, z. B. Muttersprachler einer anderen Sprache als dem Deutschen zu sein. Ziel der vorliegenden Arbeit ist die Untersuchung phonetischer und linguistischer Aspekte bei der Imitation fremdsprachiger Akzente durch deutsche Muttersprachler. Dabei wird sowohl die produktive als auch die perzeptive Seite der Akzentimitation berücksichtigt. Als Basis für die Untersuchung wurde ein Korpus mit verstelltem und unverstelltem Sprachmaterial gesprochen von deutschen und nicht-deutschen Muttersprachlern erstellt. Die Form und Variation bestimmter phonetischer Merkmale im Deutschen gesprochen mit einem vorgetäuschten fremdsprachigen Akzent von deutschen Muttersprachlern und mit einem authentischen Akzent von nicht-deutschen Muttersprachlern soll systematisch untersucht werden. Außerdem sollen phonetische Marker herausgearbeitet werden, die zuverlässig auf die Authentizität eines fremdsprachigen Akzents schließen lassen bzw. die die Nicht-Authentizität eines vorgetäuschten Akzents aufdecken könnten. Über Perzeptionsexperimente soll der „Erfolg“ 2 der Akzentimitationen in Kategorien wie „empfundener Authentizität“ oder „Identifizierbarkeit des Akzents“ überprüft werden. Die vorliegende Arbeit ist eine empirische Untersuchung, die sich in folgende sechs Teile gliedert: Teil I Theoretische Grundlagen und Stand der Forschung, Teil II Methodik und Korpus, Teil III Phonetische und phonologische Grundlagen, Teil IV Produktion, Teil V Perzeption, Teil VI Schluss. In Teil I werden die theoretischen Grundlagen und der Stand der Forschung in den für diese Arbeit relevanten Gebieten dargestellt. Dazu gehört in Kapitel 2 zum einen die Definition des Terminus „Stimmverstellung“ mit einer anschließenden Darstellung der Klassifikationsmöglichkeiten für die unterschiedlichen Verstellungsarten. Zum anderen wird die Auftretenshäufigkeit sowie die Wirksamkeit der einzelnen Verstellungen in der forensischen Praxis diskutiert. In Kapitel 3 liegt der Schwerpunkt auf der Verstellung durch einen fremdsprachigen Akzent. Es erfolgt zunächst eine Klärung des Terminus „fremdsprachiger Akzent“ sowie ein Überblick zu seinen Einflussfaktoren, phonetischen Korrelaten und seiner Messbarkeit. Es schließt sich die Betrachtung des fremdsprachigen Akzents im forensischen Kontext an. Untersuchungen zum Einfluss fremder Sprachen, fremdsprachiger Akzente und fremder regionaler Dialekte auf die Identifizierung von Sprechern werden vorgestellt und die Forschung zur Imitation fremdsprachiger Akzente als Möglichkeit der Verbergung der Identität eines Sprechers wird diskutiert. Teil I schließt mit der Motivation und Zielsetzung für die vorliegende Arbeit ab. Für die empirischen Untersuchungen wurde ein umfangreiches Korpus mit 52 Sprechern erstellt. Teil II beschreibt detailliert das Korpus sowie die angewendete Methodik bei seiner Vorbereitung, Erstellung und Aufbereitung. Grundlage für die in dieser Studie besprochenen und analysierten fremdsprachigen Akzente im Deutschen ist eine Befragung deutscher Muttersprachler nach dem Akzent, den sie am besten imitieren könnten. Methodik und Ergebnisse dieser Befragung werden in Kapitel 4 vorgestellt. Das Korpus sowie seine Erstellung wird in Kapitel 5 beschrieben. Gleichzeitig wird hier die Beschränkung auf französischen Akzent bei der phonetischen Analyse begründet. In Kapitel 6 wird die Aufbereitung des Korpus v. a. durch Transliteration und Annotation des Sprachmaterials dargestellt sowie die geplante Veröffentlichung des Korpus vorgestellt. Teil III bietet die phonetischen und phonologischen Grundlagen für die spätere Analysearbeit. Es wird eine phonetisch-phonologische Beschreibung des Deutschen (Kapitel 7.1) und des Französischen (Kapitel 7.2) gegeben, die einander 3 kontrastiv gegenübergestellt werden. Abgeschlossen wird dieser Teil durch eine Aufstellung zu erwartender phonetischer Abweichungen französischer Muttersprachler im Deutschen. Die Teile IV und V umfassen den empirischen Teil der Arbeit zur Produktion und zur Perzeption von imitierten und authentischen fremdsprachigen Akzenten. Teil IV betrachtet die produktive Ebene der Imitation eines französischen Akzents. Hier werden Variationen, die deutsche Muttersprachler bei der Imitation eines französischen Akzents vornehmen, systematisch untersucht und mit ihren unverstellten deutschen Textproduktionen verglichen. Außerdem werden die verstellten und unverstellten Produktionen der deutschen Muttersprachler deutschen und französischen Produktionen französischer Muttersprachler gegenübergestellt. Über diese Vergleiche wird sowohl die Variationsfähigkeit deutscher Sprecher bei der Akzentimitation als auch französischer Sprecher bei der Aussprache in der Fremdsprache Deutsch überprüft. Kapitel 8 leitet diesen Teil der Arbeit ein und begründet die Auswahl der phonetischen Muster, die analysiert werden. Der Fokus der phonetischen Analyse liegt auf der Variation glottaler Aktivität. In Kapitel 9 wird die Variation von Stimmeinsatzzeit und Stimmbeteiligung bei Plosiven untersucht und Kapitel 10 analysiert die Variation von junktureller Glottalisierung und glottaler Friktion. Die Realisierung von Endsilben, als einem Beispiel für artikulatorische Variation bei der Imitation eines französischen Akzents, wird in Kapitel 11 betrachtet. In Teil V wird die Imitation fremdsprachiger Akzente von der perzeptiven Seite untersucht. Im Vordergrund steht die Frage, ob und wie gut deutsche Muttersprachler die Authentizität eines fremdsprachigen Akzents beurteilen und den gehörten Akzent identifizieren, d. h. benennen, können. Kapitel 12 beschreibt zwei Perzeptionsexperimente zur Authentizitätsbeurteilung und Identifizierung verschiedener authentischer und imitierter fremdsprachiger Akzente im Deutschen mit Schwerpunkt auf französischem und amerikanisch-englischem Akzent. In Kapitel 13 werden mögliche phonetische Korrelate der Akzentauthentizität diskutiert. Der Fokus liegt auf der Bedeutung der Realisierung von / h/ , von Vokaljunkturen sowie der Endsilbe / -@n/ für die wahrgenommene Authentizität eines französischen Akzents im Deutschen. Es wird u. a. getestet, welchen Einfluss die Manipulation der Endsilbe / -@n/ auf die Authentizitätsbeurteilung authentischer und imitierter französischer Akzente durch deutsche Hörer hat. Teil VI dient der Zusammenfassung der Arbeit mit besonderem Schwerpunkt auf den Ergebnissen der Teile Produktion und Perzeption. Die Analyseergebnisse werden in Hinblick auf die Zielsetzung der Arbeit sowie auf mögliche Folgeuntersuchungen kritisch diskutiert und es werden Schlussfolgerungen für den Fremdsprachenunterricht sowie für die forensische Praxis gezogen. Die vorliegende Arbeit leistet einen wichtigen Beitrag zum Bereich Stimmverstellung durch Verwendung eines fremdsprachigen Akzents, ist aber auch außerhalb 4 der forensischen Phonetik von Bedeutung. Sie trägt u. a. zum Forschungsbereich Fremdsprachenerwerb bei, insbesondere zu den lautsprachlichen Aspekten beim Erwerb von Deutsch als Fremdsprache durch französische Muttersprachler, aber auch von Französisch als Fremdsprache durch deutsche Muttersprachler. Darüberhinaus werden im Hinblick auf stereotypische Vorstellungen über fremdsprachige Akzente im Deutschen auch soziolinguistische Aspekte beleuchtet. Die Betrachtung der perzeptiven Seite imitierter und authentischer fremdsprachiger Akzente schafft Anknüpfungspunkte zur klinischen Linguistik, speziell zur Forschung zum Foreign Accent Syndrome, aber auch zur forensischen Linguistik mit der Disziplin Language Analysis for the Determination of Origin (LADO), bei der es um die Bestimmung der sprachlichen Herkunft von Sprechern geht. Die Beleuchtung der produktiven Seite von Akzentimitation zeigt die Möglichkeiten aber auch Beschränkungen von Sprechern bei der Variation phonetischer Details auf. Dies ist nicht nur für die forensische, sondern auch für die artikulatorische Phonetik von Relevanz. 5 Teil I. Theoretische Grundlagen und Stand der Forschung 2. „Stimmverstellung“ Diese Arbeit untersucht die Imitation fremdsprachiger Akzente als eine mögliche Art der Stimmverstellung. In diesem Kapitel wird zunächst der Terminus „Stimmverstellung“ definiert und es werden verschiedene Möglichkeiten vorgestellt, Verstellungsarten zu klassifizieren. Daran anschließend wird die Frequenz der einzelnen Verstellungsarten in der forensischen Praxis sowie in experimentellen Untersuchungen aufgezeigt und die vermutete oder nachgewiesene Effektivität der Verstellungsarten sowie die Identifikation als Verstellung diskutiert. 2.1. Definition und Klassifikation Rodman (1998) beschreibt Stimmverstellung als jegliche Veränderung, Verzerrung oder Abweichung von der normalen Stimme ungeachtet des Grundes. Der Begriff Stimmverstellung wird hier also sehr weit gefasst und es werden dabei auch unbeabsichtigte Veränderungen des Stimmklangs, z. B. aufgrund der Frequenzbeschränkung bei einer Telefonübertragung oder aufgrund von Heiserkeit während einer Erkrankung, einbezogen. Eine weitere sehr vage Definition stammt von Storey (1996, S. 204), die schreibt, dass Stimmverstellung der beabsichtigte Versuch ist, nicht wie man selbst zu klingen: „[...] disguised voice might conveniently be defined as a deliberate attempt not to sound like oneself.“ Mögliche Ziele der Verstellung seien, im Zusammenhang mit einer Straftat nicht erkannt zu werden und die Bestrafung somit zu vermeiden, aber auch den Drohcharakter in einer Botschaft zu erhöhen, oder ein Spiel zu spielen: „The speaker may wish to sound like someone else, or simply not to be recognised as anyone in particular. The intent may be to avoid detection and the penalties for an offence, or to increase the threat in a message, or simply to play a game.“ (Storey, 1996, S. 204). Neben den oben genannten recht vagen Beschreibungen findet sich bei Künzel (1987) eine genauere Definition des Terminus Stimmverstellung als [...] die in der Absicht der Verbergung der eigenen Identität herbeigeführte Veränderung von Merkmalen der Stimme, Sprache und / oder Sprechweise eines Individuums (Künzel, 1987, S. 103). Diese Definition verdeutlicht bereits, dass der Terminus Stimmverstellung als „pars pro toto, nämlich für das gesamte lautsprachliche Verhalten eines Sprechers anzusehen ist“ (Künzel, 1987, S. 103) und alle drei genannten Merkmale (Stimme, Sprache, Sprechweise) umfasst. Darüber hinaus ermöglicht sie eine Klassifizierung der Verstellungsarten nach Art der veränderten Merkmale in drei Gruppen, angelehnt an die aus der Medizin entlehnte Dreiteilung des lautsprachlichen Verhaltens (vgl. dazu Künzel, 1987, S.105-116): 9 1. Verstellung der Merkmale der Stimme (z. B.: Erhöhung / Vertiefung der natürlichen Stimmlage, Veränderung der Nasalität, Phonation durch die Taschenfalten, Veränderung des Stimmklangs, z. B. durch zusätzliche Resonanzkörper oder elektronische Verzerrung), 2. Verstellung der Merkmale der Sprechweise (z. B.: Veränderung des Intonationsverlaufs oder der Sprechgeschwindigkeit), 3. Verstellung der Merkmale der Sprache (z. B.: Einführen von Fremdkörpern in den Vokaltrakt, Änderung des Grades der dialektalen Färbung, Aufsetzen eines fremden Dialekts, Verwendung eines fremdsprachigen Akzents). Masthoff (1996a, S. 163) nimmt eine nur wenig von Künzels Klassifizierung abweichende Einteilung der Verstellungsarten vor, die auf vier Bereichen der Sprachproduktion beruhen: 1. respiration (Veränderung der Atmung), 2. phonation (Veränderung der Phonation, z. B. Erhöhung der Stimmlage), 3. articulation (Veränderung der Artikulation, z. B. durch Einführen von Gegenständen in den Mundraum), 4. manner of speaking (Veränderung der Sprechweise, z. B. des Sprechtempos oder anderer prosodischer Eigenschaften). Rodman (1998) und Rodman und Powell (2000) unterscheiden Stimmverstellungen anhand zweier unabhängiger Dimensionen: (i) vorsätzlich vs. nicht-vorsätzlich (deliberate vs. nondeliberate) und (ii) elektronisch vs. nicht-elektronisch (electronic vs. nonelectronic). Tabelle 2.1 zeigt die weite Klassifizierung der Stimmverstellungen nach Rodman (1998). Verstellung auf den Dimensionen electronic-deliberate kommt laut Rodman (1998) sehr selten vor und betrifft nur rund 1-10 % aller Stimmverstellungsvorkommen. Daneben wird diese Form hauptsächlich vom Rundfunk oder auch vor Gericht verwendet, um beispielsweise die Identität einer Person, Tabelle 2.1.: Weite Klassifizierung der Stimmverstellungen (modifiziert nach Rodman, 1998) Vorsätzlich Nicht-vorsätzlich Elektronisch z. B. elektronische Verschlüsselung z. B. Kanalverzerrung / -verformung Nicht-elektronisch z. B. im Falsett sprechen z. B. Heiserkeit, Rauschzustand 10 z. B. eines Zeugen, unkenntlich zu machen. Stimmverstellung auf den Dimensionen electronic-nondeliberate bezieht sich auf „Kanalverzerrungen“ oder sonstige nicht vorsätzliche Störungen, die durch den Übertragungs- oder Kommunikationskanal verursacht werden, z. B. durch Frequenzbeschränkungen des Sprachsignals bei der Telefonübertragung oder qualitativ schlechte Sprachaufnahmen. Die Dimensionen nonelectronic-nondeliberate beziehen sich auf nicht vorsätzliche und oft unbewusste Veränderungen der Stimme, z. B. eine gesundheitliche Beeinträchtigung, die zu Heiserkeit führt, oder stimmliche und sprachliche Veränderungen durch Drogen- und Alkoholgenuss oder psychische Störungen. Die vorsätzliche nicht-elektronische Verstellung der Stimme (nonelectronic-deliberate) ist die Verstellungskategorie, mit der sich diese Arbeit beschäftigt. Sie umfasst nach Rodman (1998) phonatorische, phonemische, prosodische und deformierende Veränderungen, die durch den Sprecher vorsätzlich herbeigeführt werden. Tabelle 2.2 zeigt eine detaillierte Klassifikation der Stimmverstellungsarten in dieser Kategorie nach Rodman (1998) jeweils mit Beispielen. Tabelle 2.2.: Detaillierte Klassifikation der vorsätzlichen nicht-elektronischen Stimmverstellungsarten (modifiziert nach Rodman, 1998) Verstellungsart Erklärung und Beispiele Phonatorisch Außergewöhnliche glottale Aktivität: Erhöhung oder Vertiefung der natürlichen Stimmlage, Knarrstimme, Flüstern, Behauchung, gehobener / gesenkter Larynx Phonemisch Gebrauch außergewöhnlicher Allophone: Verwendung eines Dialekts oder fremdsprachigen Akzents, Mimikry, Hypernasalität, Sprechstörungen, wie z. B. Simulation eines Sigmatismus Prosodisch Veränderungen in Intonation, Akzentplatzierung, Längung oder Kürzung von Segmenten, Sprechtempo Deformation Erzwungene physische Veränderung im Vokaltrakt: Nase zuhalten, zusammengepresster Kiefer, Hindernis zwischen den Zähnen (bite block), Lippen vorwölben, Wangen einziehen, Festhalten der Zunge, Fremdkörper in den Vokaltrakt einführen oder vor den Mund halten Diese Taxonomie soll nach Rodman (1998) nicht als genaue Aufteilung der Stimmverstellungsarten verstanden werden, da es Überschneidungen und Ungenauigkeiten gibt. So kann eine Senkung oder Hebung des Larynx auch unter „Deformation“ eingeordnet werden, wenn beispielsweise der Kehlkopf von außen mit den Fingern in seiner Position gehalten wird. Mimikry als weiteres Beispiel beinhaltet nicht nur die Imitation der Aussprache (allophonisch) einer 11 bestimmten Person, sondern auch glottale und prosodische Eigenschaften, und könnte demnach in Tabelle 2.2 auch unter „phonatorisch“ oder „prosodisch“ eingeordnet werden. Storey (1996, S. 206 f.) führt verschiedene Methoden der Stimmverstellung an, ordnet diese allerdings nicht bestimmten Oberkategorien unter. Zu den Stimmverstellungsarten zählen dabei folgende: changes to phonation type (Veränderung der Phonationsart, z. B. Flüstern), changes to voice quality (Veränderung der Stimmqualität, z. B. weicher oder schriller), changes to intonation (Veränderung der Intonation, z. B. melodischer), change of general articulation (Veränderung der allgemeinen Artikulation, z. B. erhöhte Nasalität), change of specific articulation (Veränderung der spezifischen Artikulation, z. B. Glottalisierung des / t/ ), change of dialect (Veränderung des Dialekts / Akzents, z. B. von australischem Englisch zu irischem Englisch), change of sociolect or register (Veränderung des Soziolekts oder der stilistischen Sprachebene, z. B. von Gesprächsebene zu gehobener phonostilistischer Ebene), change of native language overlay character (Veränderung des muttersprachlichen Akzents, der auf einer Fremdsprache liegt, z. B. Englisch mit einem eher deutschen als französischen Akzent), imitation (mimicry) of someone else’s voice (Imitation einer anderen Stimme, z. B. einer berühmten Person), taking on the vocal characteristics of altered physical or emotional states such as intoxication or extreme anger or distress (Annehmen von stimmlichen Charakteristika veränderter physischer oder emotionaler Zustände, z. B. Betrunkenheit), change in tone, pitch, rate or amplitude (Veränderung von Klang, Tonhöhe, Geschwindigkeit, Amplitude), speaker tries to sound older or younger, or different sex (Versuch, älter, jünger oder eines anderen Geschlechts zu klingen), interspersing speech with laughter or other vocalisations (Rede z. B. mit Gelächter vermengen), muffling (Dämpfen, z. B durch Kleidung über dem Telefonhörer), change in acoustic environment (Veränderung der akustischen Umgebung, z. B. durch ein Stück Rohr sprechen), electronic scrambling (elektronische Verzerrung). Nach Glitza und Masthoff (2002, S.110) handelt es sich bei den Klassifikationen von Künzel (1987) und Masthoff (1996a) um „genetisch symptomatische“ Einteilungen und bei Rodman (1998) und Rodman und Powell (2000) um eine Einteilung nach bewusster vs. unbewusster Verstellung. Außerdem lassen sich nach Glitza und Masthoff (2002, S. 110) die Stimmverstellungen weiterhin nach „Verwendung extrakorporaler mechanischer (z. B. bite block) oder elektronischer Hilfsmittel (z. B. Verzerrer)“ einteilen. 12 2.2. Frequenz verschiedener Verstellungen Arbeiten mit Aussagen zur Vorkommenshäufigkeit verschiedener Verstellungsarten im deutschen Kontext basieren entweder auf Daten aus der Sachverständigen-Praxis der Autoren oder aus Institutionen, wie beispielsweise dem Bundeskriminalamt (z. B. Künzel, 1987; Masthoff, 1996a; Wagner, 1998; Künzel, 2000), oder auf experimentellen Untersuchungen, bei denen die Probanden frei eine Verstellungsart oder aus einer Auswahl verschiedener Arten wählen können (z. B. Masthoff, 1996a; Künzel, 2000). Die Angaben dazu, wie häufig Stimmverstellungen in forensisch-phonetisch untersuchten Fällen auftreten, schwanken zwischen 2,5 % (einem von 40 Fällen) bei JP French Associates 1 in Großbritannien (Clark und Foulkes, 2007) und 52 % bei Fällen des Bundeskriminalamts (BKA) im Zeitraum zwischen 1989-1994. Bei Letzterem handelt es sich allerdings um Fälle, bei denen die Verdächtigen von der Sprachaufzeichnung wussten; mit 69 % treten nach diesen Angaben Verstellungen am häufigsten in Erpressungsfällen auf (vgl. Masthoff, 1996a, der die Daten aus Gfroerer, 1994 bezieht). Braun (2006) ist eine neuere Untersuchung zur Frequenz von Verstellungen im deutschen Sprachraum, die aktuelle Daten von vier in der forensischphonetischen Praxis tätigen Sachverständigen berücksichtigt und damit insgesamt 175 Fälle auswertet. Nach dieser Untersuchung traten in 22,9 % der untersuchten Fälle Verstellungen auf und es konnte außerdem ein Zusammenhang mit der Art des Deliktes festgestellt werden. So wird das stimmlich-sprachliche Verhalten während der Begehung der Straftat in der Regel nur dann verstellt, wenn der Sprecher eine Aufzeichnung seiner Äußerungen vermutet oder weiß, dass seine Stimme dem Hörer (z. B. dem Angerufenen) bekannt ist. In fast der Hälfte (46 %) der begutachteten Fälle von Belästigung und / oder Beleidigung und in etwas mehr als einem Viertel (27 %) der untersuchten Fälle von Erpressungen traten Verstellungen auf. Ähnliche Zahlen finden sich auch in Künzel (2000), der für die vom BKA forensisch-phonetisch untersuchten Fälle ein Verstellungsvorkommen von 15-25 % angibt und eine vergleichbare Einschätzung zur Delikt-Abhängigkeit trifft. Bei anderen Delikten, wie zum Beispiel Verstößen gegen das Betäubungsmittelgesetz, treten laut Braun (2006) Verstellungen generell nur selten (in 6 % der untersuchten Fälle) und außerdem nicht bei der Tatbegehung, sondern erst bei der Abgabe einer Vergleichsaufnahme auf. Braun (2006) erklärt dies damit, dass die zu untersuchenden sprachlichen Äußerungen in der Regel ohne Wissen der Sprecher (z. B. im Rahmen einer Telefonüberwachung) aufgezeichnet wurden und die Verdächtigen erst während der Vergleichsaufnahme eine Verstellung nutzten, um sich soweit wie möglich von der Tataufzeichnung zu entfernen. 1 JP French Associates ist ein unabhängiges Institut in Großbritannien mit Sitz in York, das auf forensisch-phonetische und forensisch-linguistische Untersuchungen spezialisiert ist. 13 Gemeinsam ist den unter Punkt 2.1 vorgestellten Klassifikationen die Gruppe Verstellung der Merkmale der Stimme bzw. Phonation, die eine der häufigsten Formen der Stimmverstellung ist (vgl. Künzel, 1987; Masthoff, 1996a, 2000; Braun, 2006). Laut Braun (2006) liegt in etwa zwei Drittel aller Fälle, bei denen Verstellung involviert ist, eine Verstellung stimmlicher Parameter vor. Gleichzeitig gehören die „Parameter der Stimmgebung [...] zu den wenigen, für die Hintergrundstatistiken vorliegen. Auf diese Statistiken können gegebene Meßwerte (sic! ) projiziert und bewertet werden“ (Masthoff und Köster, 1994, S. 270). Als Beispiel für Korpora, aus denen solche Statistiken gezogen werden können, sei das Korpus Pool 2010 des Bundeskriminalamts genannt (vgl. u. a. Jessen et al., 2005). Eine Erhöhung der Grundfrequenz (mit und ohne Registerwechsel) ist nach Masthoff (2000) und Braun (2006) innerhalb der Verstellung stimmlicher Parameter die häufigste Form. Andere Studien ergaben u. a. geschlechtsspezifische Tendenzen zur Erhöhung bzw. Verringerung der Grundfrequenz oder untersuchten die Effektivität dieser Verstellungsart, z. B. Masthoff (1996a), Wagner und Köster (1999), Künzel (2000), Masthoff (2000). So konnte Künzel (2000) zeigen, dass Männer öfter ihre Grundfrequenz verringern, während Frauen sie öfter erhöhten. Auch innerhalb der Gruppen gab es für Sprecher mit einer höheren Grundfrequenz Tendenzen, diese häufiger zu erhöhen, und für Sprecher mit einer tieferen Grundfrequenz, diese häufiger zu verringern. Auf der anderen Seite verlief der Grad der Veränderungen entgegengesetzt, d. h. Frauen waren in der Lage, ihre Grundfrequenz stärker zu senken, während bei Männern das Umgekehrte der Fall war. Künzel (2000) begründet dies mit dem natürlichen Spielraum, der bei Männern mehr Möglichkeiten zur Erhöhung und bei Frauen mehr Möglichkeiten zur Verringerung der Sprechstimmlage lässt. Zur Variation weiterer Merkmale der Stimme, z. B. Verwendung von Knarr- oder Flüsterstimme, sei u. a. auf Masthoff und Köster (1994), Duckworth und Hirson (1995), Orchard und Yarmey (1995) verwiesen. Während Verstellungen der Merkmale der Stimme aufgrund ihres relativ häufigen Auftretens in der forensischen Praxis in zahlreichen Studien untersucht und diskutiert wurden, trifft dies auf Verstellung der Merkmale der Sprechweise in diesem Maße nicht zu. Grund hierfür ist vermutlich, dass sie deutlich weniger häufig auftritt (vgl. Masthoff, 1996a; Braun, 2006). Nach Künzel (1987, S. 115) beschränkt sich die Verstellung der Merkmale der Sprechweise im Wesentlichen auf zwei Arten von Merkmalsänderungen: Entweder wird der Intonationsverlauf oder die Sprechgeschwindigkeit verändert. Sowohl Künzel (1987) als auch Braun (2006) geben an, dass eine künstliche Einschränkung des Tonhöhenverlaufs (d. h. Verstellung durch eine künstliche Monotonie) die häufigste Form sei. Reich et al. (1976) und Reich und Duke (1979) untersuchen die Wirkung von Verlangsamung der Sprechgeschwindigkeit auf die Sprechererkennung. Nach Künzel (1987) tritt diese häufiger auf als eine Erhöhung der Sprechgeschwindigkeit, da bei einem Erpressungsanruf beispielsweise wichtige Informationen verständlich übermittelt werden sollen. 14 Die Angaben zum Vorkommen elektronischer Hilfsmittel im Zusammenhang mit Stimmverstellung aus Künzel (1987) oder Masthoff (1996a), deren Häufigkeitsangaben sich zwischen 0-1 % bewegen, im Vergleich zu Rodman (1998), der von 1-10 % ausgeht, lassen bereits vermuten, dass die Anzahl der Fälle, in denen elektronische Hilfsmittel eingesetzt werden, steigt. Zwar betont auch Künzel (2000) noch, dass die Anzahl der Fälle von elektronischer Verstellung gering sei, bestätigt aber auch, dass das Problem zunehmen wird. Die steigende Anzahl solcher Fälle ist durch die schnelle technologische Entwicklung sowie durch die erhöhte Verfügbarkeit und immer einfachere Handhabbarkeit digitaler Sprachverarbeitungs- und -syntheseprogramme wenig überraschend. Das Ausmaß wird jedem bewusst, der Begriffe wie „voice disguise“ einmal in eine Internetsuchmaschine eingibt. Außerdem werden nicht nur „Stimmenverzerrer“ eingesetzt, sondern auch Zusammenschnitte aus bereits (öffentlich) existierendem Sprachmaterial zur Übermittlung einer Botschaft genutzt. In den letzten Jahren sind auch sogenannte Text-to-speech-Systeme (TTS- Systeme) weiterentwickelt und verbessert worden. Bei der Verwendung solcher Sprachsynthese-Systeme zur Stimmverstellung muss die Identität des Sprechers ohne dessen vokale Merkmale ermittelt werden - dies geht jedoch über die forensische Phonetik hinaus und gehört zum Aufgabengebiet der forensischen Linguistik (vgl. dazu Jessen et al., 2003, S. 113). 2 Zur Wirksamkeit elektronischer Verstellung (am Beispiel von F0-Manipulation) bei der Identifizierung von Sprechern vgl. Clark und Foulkes (2007). Eine Beeinflussung der Artikulation durch das Einführen von Fremdkörpern in den Vokaltrakt (sogenannter bite blocks, wie z. B. Stifte, Bonbons oder Steine) kommt nach Künzel (1987, S. 115) extrem selten vor und ist in ihrer Wirksamkeit auch sehr beschränkt, da niemals alle Laute durch diese Manipulation beeinflusst werden und außerdem die Stimm- und Sprecheigenschaften einer Person dadurch weitgehend unbeeinträchtigt bleiben. Figueiredo und Souza Britto (1996) hingegen berichten, dass diese Verstellungsart vor allem bei brasilianischen Entführungsfällen häufig vorkommt. Außerdem bewerten sie Verstellungen, die die supraglottale Aktivität betreffen, als schwerwiegender für die forensische Praxis als Verstellungen, die nur Merkmale der Stimme betreffen. Grund hierfür sei, dass die Konsequenzen aus der Beeinflussung der Artikulation aufgrund der komplexen Interaktion zwischen artikulatorischen Beschränkungen und der individuellen artikulatorischen Basis des Sprechers schlechter vorauszusagen sind. Bei der Verstellung der Merkmale der Stimme hingegen seien die dialektalen und segmentellen Merkmale des Sprechers kaum betroffen (vgl. Figueiredo und Souza Britto, 1996, S. 174). Zur Diskussion der akustischen Auswirkung von bite blocks sei u. a. auf Figueiredo und Souza Britto (1996) und Horga (2002) verwiesen. Die Untersuchung von Masthoff (1996a, S. 165) ergab, dass innerhalb der Gruppe „Artikulation“ von den Sprechern zu 2 Erschwerend kann hinzukommen, dass bei einem Input in einer Sprache A in ein TTS-System, das auf eine Sprache B ausgelegt ist, eine synthetisierte Sprache entsteht, die einen „fremdsprachigen Akzent“ tragen kann. Mehr dazu findet sich bei Jessen et al. (2003). 15 40 % eine Manipulation des Vokaltraktes (z. B. Lippen vorstülpen, Nase zuhalten, gehobener Larynx, Wangen einziehen) vorgenommen wurde und zu 20 % die Zunge demobilisiert wurde. Künzel (2000) konnte zeigen, dass das Zuhalten der Nase bei Frauen eine häufig gewählte Verstellungsart ist. Moosmüller (2006) diskutiert eine weitere Form der Veränderung artikulatorischer Merkmale, die auf Vermeidung oder Verweigerung von Artikulation zurückgeht und als „articulatory avoidance“ bezeichnet wird. Diese Form tritt nach Moosmüller (2006) v. a. bei Vergleichsaufnahmen auf und ist hauptsächlich durch geringe Kieferöffnungsbewegungen und eine Neutralisierung der Vokaltraktkonfiguration mit entsprechenden akustischen Auswirkungen gekennzeichnet. Stimmenimitation ist eine weitere Möglichkeit der Verschleierung der eigenen Identität, bei der „typischerweise das sprechsprachliche Verhalten bekannter Persönlichkeiten des öffentlichen Lebens zum Zwecke der Unterhaltung nachgeahmt [wird]“ (Masthoff, 1996b, S. 59). Sie kommt nach Künzel (2000) und Braun (2006) in der forensischen Praxis extrem selten vor, was auf die Komplexität der Aufgabe zurückzuführen ist. Voraussetzung für eine erfolgreiche Imitation sind nach Braun (2006) zunächst anatomisch-physiologische Ähnlichkeiten mit der zu imitierenden Person. Außerdem müssten Imitatoren die individuellen Eigenschaften der Zielperson (er)kennen und sie erfolgreich über einen längeren Zeitraum konsistent imitieren. Markham (1997, S. 48) verwendet zur Abgrenzung von imitierenden Prozessen beim Fremdsprachenerwerb den Terminus „impersonation“, der verallgemeinernd für alle Typen expressiver oder unterhaltender Imitation von Dialekten, Akzenten, Sprechstilen oder Personen steht. Außerdem findet sich zum Teil auch die Verwendung des Terminus „Mimikry“ (oder engl. mimicry), z. B. bei Rodman (1998). Als Auswahl weiterführender Studien zur Imitation seien Endres et al. (1971), Sullivan und Schlichting (2000), Sullivan und Kügler (2001), Zetterholm et al. (2003), Eriksson et al. (2010) genannt. Eine Verstellung der Merkmale der Sprache kommt nach den Untersuchungen von Braun (2006) in etwa 10 % der Fälle vor, davon sind Vortäuschung eines fremdsprachigen Akzents oder eines fremden regionalen Dialekts die häufigsten Formen. Ausgehend von BKA-Statistiken zwischen 1989 und 1997 ist nach Wagner (1998) die Imitation eines fremdsprachigen Akzents die am häufigsten vorkommende Verstellungsform generell. In der experimentellen Untersuchung von Masthoff (1996a) nutzte jedoch nur einer von 20 Sprechern die Imitation eines (russischen) Akzents zur Verstellung. Nach Künzel (1987) werden englischer und französischer Akzent und nach Wagner (1998) englischer, amerikanischer, italienischer und spanischer Akzent am häufigsten zur Imitation gewählt. Auch Versuche, den eigenen regionalen Dialekt zu reduzieren und standardnah zu sprechen oder auch ihn zu verstärken, sind denkbar, kommen jedoch laut Künzel (1987) seltener vor. Ebenso selten sei es, den eigenen muttersprachlichen Akzent in einer fremden Sprache zu verstärken oder ihn durch einen anderen fremdsprachigen Akzent (z. B. türkisch-akzentuiertes Deutsch 16 anstelle eines italienisch-akzentuierten Deutschs) zu „ersetzen“. Fälle, in denen Sprecher vorgeben, Muttersprachler einer anderen Sprache / Sprachvarietät zu sein und so aus einem anderen Sprachraum als ihrem eigentlichen Sprachraum zu stammen (z. B. aus Sierra Leone statt aus Nigeria oder Ghana), kommen vor allem im Kontext von Sprachanalysen bei Asylbewerbern vor. Es sind aber auch andere Fällen denkbar, in denen es dem Sprecher darum geht, die Analysen zu seiner (sprachlichen) Herkunft in eine bestimmte Richtung zu lenken. Es sei an dieser Stelle auf die einschlägige Literatur im Bereich LADO (Language Analysis for the Determination of Origin) verwiesen, z. B. Fraser (2009), Cambier-Langeveld (2010). Im Abschnitt 3.2 wird auf die Verstellung durch Imitation eines anderen regionalen Dialekts und speziell auf die Imitation fremdsprachiger Akzente detaillierter eingegangen. 2.3. Effektivität von Verstellungen und Identifikation als Stimmverstellung Verschiedene experimentelle Untersuchungen konnten zeigen, dass Veränderungen in den Merkmalen der Stimme, Sprechweise und Sprache die Identifikation von Sprechern durch Hörer zum Teil stark beeinflussen. Bereits in den 1930er Jahren ging McGehee (1937) u. a. der Frage nach, welchen Effekt eine Erhöhung der Grundfrequenz auf die Sprecheridentifikationsleistung von Hörern habe. Die Untersuchungen ergaben eine Reduzierung der korrekten Identifikationen von 80 % im unverstellten Modus auf 67 %, wenn der Originaltext mit erhöhter Stimmlage gesprochen wurde, die Vergleichstexte am folgenden Tag aber in natürlicher Stimmlage. Die Untersuchungen von Reich et al. (1976) und Reich und Duke (1979) mit Laien- und Experten-Hörern, die sowohl visuelle als auch auditiv-perzeptuelle Techniken zur Sprecheridentifizierung nutzten, ergaben ebenfalls eine deutliche Reduzierung der korrekten Sprecheridentifizierungen für das auf verschiedene Weise verstellte Material. Dabei spielte auch die Art der genutzten Verstellung eine Rolle. So hatten Hypernasalität und „freie Verstellung“ den größten Effekt auf die korrekte Identifizierung, wobei nicht hervorgeht, welche Verstellungen unter „free disguise“ von den Probanden vorgenommen wurden. Auch Hollien et al. (1982, S. 142- 144) konnten zeigen, dass die Identifikationsleistung von Hörern bei Sprechern, die ihre Stimmen verstellten (bei freier Wahl der Verstellungsart, außer Dialektimitation oder Verwendung von Flüsterstimme) signifikant gesenkt wird. Die Hörergruppe, die mit den Sprechern sehr gut bekannt war, wies bei der Stimmverstellungsbedingung eine Fehlerquote von 21 % auf. Verglichen mit den Fehlerquoten bei normaler Sprechweise (2,0 %) bzw. unter der Stressbedingung (2,5 %) stellt dies eine deutliche Erhöhung dar. Bei der Hörergruppe, die die Sprecher nicht kannte, verschlechterte sich die Identifikationsleistung 17 drastisch auf ca. 79 % Falsch-Identifikationen und bei der Hörergruppe, die weder die Sprecher kannte noch die Sprache (Englisch) sprach, lag der Anteil der Falsch-Identifikationen bei ca. 82 %. Eine Verringerung der korrekten Sprecheridentifizierung konnte außerdem in Orchard und Yarmey (1995) für die Verwendung von Flüsterstimme, in Duckworth und Hirson (1995) für die Verwendung von Knarrstimme mit leicht unterschiedlich guten Resultaten für Laien und Phonetiker, und in Wagner und Köster (1999) für die Verwendung von Falsett gezeigt werden. Die Ergebnisse von Wagner und Köster (1999) stechen durch eine sehr schlechte Identifikationsleistung bei Verwendung von Falsett als Tarnung hervor, zumal die Sprecher den Hörern sehr gut bekannt waren. Die Identifikationsrate verringerte sich von 97 % korrekter Identifikation im unverstellten Modus auf 4 % bei der Verstellung durch Falsett. Wagner und Köster (1999) schlussfolgern, dass die Wiedererkennungsleistung u. a. mit der Stärke der Abweichung von der gewohnten Grundfrequenz korreliert und bei stärkeren Abweichungen die Identifikationsleistung auch stärker sinkt. Storey (1996) untersucht die Verstellungsleistung eines Schauspielers, der sich mit 35 unterschiedlichen Verstellungsarten und diversen Kombinationen dieser auf verschiedene Art und Weise tarnte. Sie kommt zu dem Ergebnis, dass es selbst bei einem Schauspieler konstante Charakteristika im Ausdruck, der Intonation und in speziellen artikulatorischen Merkmalen gibt. Eine Veränderung der Stimmqualität sei zwar möglich, bewege sich dennoch in einem bestimmten Rahmen. Die Artikulation hingegen sei anfälliger für Variationen als Tonhöhe, Intonation, Sprechgeschwindigkeit, Soziolekt oder Muttersprachskompetenz, auch diese Variation bleibe jedoch begrenzt und sei meist nicht nachhaltig (vgl. Storey, 1996, S. 205, 215). Laut Künzel (1987) ist es über die Analyse der von Verstellungen oder beispielsweise schlechter Telefonübertragung nicht betroffenen Merkmalsbereiche meist möglich, ein Sprecherprofil zu erstellen, denn „[...] bei Veränderungen innerhalb eines der drei Merkmalsbereiche [(Stimme, Sprache, Sprechweise)] des sprachlichen Verhaltens [bleiben] Merkmale aus den anderen beiden völlig oder zumindest teilweise erhalten“ (Künzel, 1987, S. 120). Die forensisch-phonetische Gutachtenerstellung und Sprecheridentifizierung wird durch die Kombination verschiedener Verstellungsarten erschwert. Dies kommt jedoch laut Masthoff (1996a) nur in beschränktem Maße vor, da sich der Sprecher gleichzeitig sowohl auf die Stimmverstellung als auch auf das Überbringen der Botschaft konzentrieren muss, was schwer konsistent durchzuhalten ist: [S]peakers alter only a few (and not more than three) selected phonetic parameters when disguising their voice. [...] An explanation for this seemingly inconsistent behaviour is that a speaker, when performing a voice disguise [...], must simultaneously try to both obscure his identity and deliver a meaningful message. To do so, he 18 must suppress speaker-dependent information while maintaining linguistic integrity [and] it maybe difficult to simultaneously control these two classes of behaviour. (Masthoff, 1996a, S. 166) Auch in Masthoff (2000, S. 65) wird angeführt, dass Verstellungen maximal zwei der vier Beschreibungsebenen (Respiration, Phonation, Artikulation und Sprechweise) betreffen und dass die Verstellungsversuche nach auditiver Beurteilung wenig wirkungsvoll sind, da z. B. die Normalstimmlage mit einer Genauigkeit von 1-2 Halbtonschritten rekonstruiert werden kann. Außerdem nimmt nach Masthoff (2000) die Konsistenz der Verstellungsversuche in der Regel mit zunehmender Sprechdauer ab. Die geringe Konsistenz während der Verstellung ist auch für Künzel (2000) ein wichtiger Grund für ihre geringe Effektivität. Er führt an, dass der Grad einer Verstellung, mit dem Wiederholen der Anrufe beispielsweise, immer weiter abnimmt, bis schließlich sogar keine Stimmverstellung mehr vorliegen mag: A fact which may facilitate the forensic expert’s task considerably is that irrespective of the kind of disguise employed in a given case, there is often a tendency for a criminal to reduce the degree of his disguise as a function of the number of calls he makes. In some cases the disguise may disappear altogether. (Künzel, 2000, S. 151) Die effektivste Methode der Stimmverstellung ist sicher die, die ausreichend die individuellen Merkmale des persönlichen lautsprachlichen Verhaltens maskiert und gleichzeitig als Verstellung selbst nicht erkannt wird. Die Beurteilung, ob ein Sprecher eine der vielfältigen Verstellungsmethoden zur Tarnung seiner Identität genutzt hat, basiert in der forensischen Praxis weniger auf dem Wissen über das nicht-manipulierte verbale Verhalten desselben Sprechers, sondern eher auf den Erfahrungswerten des Sachverständigen (vgl. Wagner, 1998). In den wenigen Fällen, in denen die Frage nach dem Vorliegen einer Stimmverstellung nicht eindeutig zu beantworten ist, liegt der Grund dafür nach Wagner (1998) in sehr kurzem Sprachmaterial oder schlechter Aufnahmequalität. Reich (1981) untersuchte die Fähigkeit geschulter und ungeschulter Hörer, Stimmverstellungen nach eigener Wahl („free disguise“) aufzudecken. Es konnte in der Studie gezeigt werden, dass sowohl geschulte als auch ungeschulte Hörer exakt und zuverlässig ein Vorhandensein von Stimmverstellung in Sprachmaterial aufdecken können. Der durchschnittliche Anteil der korrekten Identifikation des Sprachmaterials als „verstellt“ war in beiden Hörergruppen hoch (ca. 90 %), wobei die Leistung der geschulten Hörer signifikant besser war. Die Fehlerrate einer falschen Einordnung unverstellten Sprachmaterials als „verstellt“ (false detection) war in beiden Hörergruppen signifikant höher als ein falscher Ausschluss (false elimination) verstellten Materials als „unverstellt“. Obwohl es nach diesen Ergebnissen für einen menschlichen Hörer relativ einfach zu sein scheint, Verstellungen aufzudecken, ist dies nach Eriksson (2010) für automatische Systeme bisher noch nicht oder nicht zuverlässig möglich. Eriksson (2010) legt dar, dass für diese Aufgabe zunächst eine ausreichend umfangreiche Da- 19 tenbank mit verstelltem und unverstelltem Sprachmaterial erforderlich wäre, um Modelle auf die Unterscheidung zu trainieren. Ein solches System existiere zum jetzigen Zeitpunkt aber noch nicht oder stecke noch in der Anfangsphase. Als Beispiel für eine Untersuchung zum Einfluss ausgewählter Verstellungsarten auf die automatische Sprechererkennung sei Zhang (2007) genannt, deren Ergebnisse eine Abhängigkeit der Erkennungsleistung sowohl von der Verstellungsart als auch vom Sprecher und seinen „Verstellungsfähigkeiten“ vermuten lassen. 20 3. Verstellung durch einen fremdsprachigen Akzent Bevor in diesem Kapitel auf den Aspekt Verstellung durch Verwendung eines fremdsprachigen Akzents eingegangen wird, soll zunächst der Terminus „fremdsprachiger Akzent“ erläutert werden. Es geht an dieser Stelle bewusst nicht um eine umfassende Beschreibung des Forschungsbereichs Fremdsprachenerwerb mit Schwerpunkt auf dem Erwerb der Aussprache, sondern es soll knapp umrissen werden, wodurch ein fremdsprachiger Akzent gekennzeichnet ist, welche Einflussfaktoren beim Grad des fremdsprachigen Akzents möglicherweise eine Rolle spielen und wie die Stärke eines fremdsprachigen Akzents gemessen und verglichen werden kann. Im zweiten Teil dieses Kapitels wird auf fremdsprachige Akzente im forensischen Kontext eingegangen. Dazu werden zunächst verschiedene Untersuchungen zum Einfluss einer Fremdsprache, eines fremdsprachigen Akzents oder regionalen Dialekts bei der Erkennung und Identifikation von Sprechern vorgestellt. Im Anschluss daran wird als Exkurs die Imitation regionaler Dialekte thematisiert und danach werden Forschungsaussagen und empirische Studien zur Imitation fremdsprachiger Akzente referiert. Abschließend wird in diesem Kapitel die Motivation für weitere Forschung auf diesem Gebiet und Ziele der vorliegenden Studie dargestellt. 3.1. Fremdsprachiger Akzent 3.1.1. Fremdsprachiger Akzent und seine möglichen Einflussfaktoren Wenn in dieser Arbeit von einem fremdsprachigen Akzent die Rede ist, so sind hier Aussprachebesonderheiten eines Sprechers gemeint, der nicht in seiner Muttersprache (L 1 ), sondern in einer Fremdsprache (L 2 - L n ) spricht. Es handelt sich hierbei um sogenannte Interferenzen, die auf lautlicher Ebene stattfinden und die Künzel (1977a) als die „weitgehend unbewußte Übernahme von Charakteristika des muttersprachlichen Lautsystems in das zu erlernende / erlernte fremdsprachliche Lautsystem“ (Künzel, 1977a, S. 1) definiert. Diese Übertragung von muttersprachlichen Gewohnheiten auf eine Zielsprache wird auch als Transfer bezeichnet, der positiv oder negativ ausfallen kann, je nachdem, ob eine lautliche Erscheinung in der Fremdsprache vergleichbar mit einer lautlichen Erscheinung in der Muttersprache ist. Ein negativer Transfer führt zu Interferenzen (vgl. z. B. Ternes, 1976). Trubetzkoy (1962) vergleicht das phonologische System einer Sprache mit einem Sieb, in dem zunächst nur die lautlichen Merkmale des Gesprochenen haften bleiben, die für die Individualität der Phoneme relevant sind, und auf späteren Stufen auch die appellrelevanten lautlichen Merkmale und die charakteristischen Züge des Sprechschalls. In einer Fremdsprache wird seiner Auffassung 21 nach das falsche (nämlich das muttersprachliche) „phonologische Sieb“ zur Analyse des Gesprochenen herangezogen und die Laute erhalten eine falsche phonologische Interpretation. Demnach begreift Trubetzkoy einen fremdsprachigen Akzent nicht als die Unfähigkeit eines Sprechers einen bestimmten Laut auszusprechen, sondern als eine Fehlbeurteilung dieses Lautes bedingt durch eine unterschiedliche phonologische Struktur in den beiden betroffenen Sprachen (vgl. Trubetzkoy, 1962, S. 47-50). Der Prozess des Interpretierens eines Lautes aus einer Fremdsprache in phonologischen Kategorien aus der Muttersprache wird auch als phonologisches Filtern (phonological filtering) bezeichnet. Flege und Hammond (1982) zeigen jedoch für spanisch-akzentuiertes Englisch am Beispiel von VOT und Längung von Silben in äußerungsfinaler Position, dass Sprecher sich rein phonetischer, d. h. nicht-distinktiver, Unterschiede zwischen ihrer Muttersprache und einer L2 bewusst sind und diese in Imitationsaufgaben auch produzieren können. Daraus schlussfolgern sie, dass phonologisches Filtern zwar zum Teil ursächlich für einen fremdsprachigen Akzent ist, jedoch eine muttersprachsnahe Aussprache in L2 vermutlich nicht zwangsläufig verhindern muss. Markham (1997) unterscheidet zwischen phonologischem und phonetischem Akzent, die oft miteinander einhergehen. Vereinfacht dargestellt, tritt der phonologische Akzent vor allem in frühen Lernstufen ein, wenn der Lerner mit einem neuen phonologischen System konfrontiert wird oder wenn Elemente des L2-Systems mit dem L1-System in Konflikt stehen. Erwirbt aber ein Sprecher das phonologische System von L2 und produziert dennoch phonetische Abweichungen vom Standard, so handelt es sich nach Markham um phonetischen Akzent. Für detailliertere Ausführungen sei auf Markham (1997) verwiesen. Der Grad eines fremdsprachigen Akzents variiert in Abhängigkeit von verschiedenen Faktoren. Piske et al. (2001) geben einen ausführlichen Überblick zur Forschungsliteratur und diskutieren folgende mögliche Einflussfaktoren auf den Grad eines fremdsprachigen Akzents: • Alter, in dem die Fremdsprache (L2) erlernt wird, • Maß der Erfahrung in L2 oder Dauer des Aufenthaltes in einer Gesellschaft, in der vorwiegend diese Sprache gesprochen wird, • Geschlecht der Sprecher, • erhaltene Ausbildung in L2, • Motivation, eine akzentfreie Aussprache in L2 zu erwerben, • Imitationsfähigkeit, musikalische Begabung oder Talent im Fremdsprachenerwerb, und • Maß des Gebrauchs von L1 und L2. Die wohl am besten untersuchten und zugleich bedeutsamsten Einflussfaktoren auf die Stärke eines fremdsprachigen Akzents sind nach Piske et al. (2001) 22 das Alter, in dem eine Fremdsprache erlernt wird (age of L2 learning) sowie die Dauer des Aufenthaltes (length of residence). Ersterem wird die sogenannte Critical-Period-Hypothese (Lenneberg, 1967) zugrundegelegt, die besagt, dass eine Fremdsprache aufgrund neuro-physiologischer Entwicklungen nur bis zum Ende dieser mutmaßlich kritischen oder auch sensiblen Phase muttersprachsnah erlernt werden kann. Die Angaben dazu, wann das Ende dieser Phase erreicht wird, schwanken. Andere Faktoren wie beispielsweise die Dauer des Aufenthaltes in einer Umgebung, in der L2 die dominierende Sprache ist, wirken ebenfalls auf den muttersprachlichen Akzent in L2 ein. Auch das Maß des Gebrauchs der Sprachen L1 und L2 sowie die Fähigkeit zur Imitation von Lauten spielen ein große Rolle. Untersuchungen zum Effekt des Sprechergeschlechts hingegen liefern widersprüchliche Ergebnisse, die vermuten lassen, dass es keinen oder keinen belegbaren Einfluss auf den Grad eines fremdsprachigen Akzents hat. Ebenso scheint der Effekt einer Ausbildung in L2 nur von geringem Einfluss zu sein, wenn in dieser nicht explizit Wert auf Training im segmentellen und suprasegmentellen Bereich gelegt wurde (vgl. Gut, 2009). Ein weiterer Parameter, der in der obenstehenden Liste noch nicht aufgeführt ist, ist der Einfluss von L1. Eine der Grundhypothesen von Fleges Speech Learning Model (Flege, 1995) ist, dass der Grad des Erfolgs beim Erlernen einer korrekten Aussprache von L2 von der wahrgenommenen phonetischen Ähnlichkeit der Laute in L1 und L2 abhängig ist. Demnach wäre eine Kategorienbildung für die L2-Laute wahrscheinlicher, die sich von dem nächsten L1-Laut am stärksten unterscheiden. Wenn für einen L2-Laut keine neue phonetische Kategorie gebildet wird, dann würden die phonetischen Eigenschaften des L2- Lautes mit denen des korrespondierenden L1-Lautes in eine Mischform zusammengefügt, die in einer nicht-muttersprachlichen Aussprache des L2-Lautes und damit in einem fremdsprachigen Akzent resultiert (vgl. Piske et al., 2001, S. 212). Zur Kritik an Fleges Modell vergleiche Markham (1997). Eine der größten Schwierigkeiten bei der Untersuchung, welche Parameter Einfluss auf den akzentfreien Erwerb einer Fremdsprache haben und wie stark der Einfluss der jeweiligen Parameter ist, liegt im Zusammenspiel der verschiedenen Variablen. Selbst komplexe statistische Analysen verhelfen meist nicht zu eindeutigen, schlüssigen Resultaten (vgl. Markham, 1997; Piske et al., 2001; Gut, 2009). 3.1.2. Beurteilung eines fremdsprachigen Akzents Es gibt unterschiedliche Methoden, um die Stärke oder den Grad eines fremdsprachigen Akzents einzustufen, zum Beispiel mittels einer Beurteilung der Sprecher durch Hörer auf einer Skala (vgl. z. B. Cunningham-Andersson und Engstrand, 1989; Flege et al., 1995; Piske et al., 2001) oder auch durch Klassifizierung der Sprecher in bestimmte vorgegebene Kategorien, die jeweils von einer Definition begleitet werden (vgl. Markham, 1997). Bei Ersterem werden in 23 der Regel zwei Extremkategorien gewählt, z. B. kein fremdsprachiger Akzent und starker fremdsprachiger Akzent, die den Anfang bzw. das Ende einer unterschiedlich langen Skala bilden, auf der die Hörer den gehörten fremdsprachigen Akzent beurteilen. Die Reichweite oder Aufteilung der Skala (z. B. vier, neun oder elf Intervalle), Anzahl und diverse Eigenschaften der Hörer (z. B. ob Muttersprachler, L2-Sprecher, Laien oder Experten) variiert zwischen den Studien und sollte in Abhängigkeit von Faktoren, wie Anzahl der zu beurteilenden Akzente, passend gewählt werden. Markham (1997) und Piske et al. (2001) beschreiben nicht nur detailliert die von ihnen verwendete Methode, sondern geben auch einen Überblick zur unterschiedlichen Methodik verschiedener Studien und diskutieren diese kritisch. Cunningham-Andersson und Engstrand (1989) zeigten, dass die von naiven Hörern anhand einer Skala eingeschätzte Stärke eines fremdsprachigen Akzents im Schwedischen signifikant mit der statistischen Auszählung phonetischer Normabweichungen zusammenfällt und dass mit zunehmender Anzahl an normabweichenden Merkmalen auch der Grad des Akzents als stärker wahrgenommen wurde. Nach Gfroerer (2003) kann der fremdsprachige Akzent eines Sprechers ähnlich wie bei der Bestimmung der Art und des Grades eines Dialekts durch die Anzahl der Abweichungen von und / oder Übereinstimmungen mit der Grammatik und dem Lautsystem einer Referenzsprache pro Texteinheit quantifiziert werden 1 . Auch Munro et al. (2003, S. 535) gehen von einer Quantifizierung des Akzents über die Anzahl der phonologischen Fehler (z. B. Einfügung, Tilgung, Substitution) aus, beziehen aber auch Sprechgeschwindigkeit, Stimmqualität und Stimmlage als Indikatoren für einen fremdsprachigen Akzent ein. 3.1.3. Phonetische Korrelate eines fremdsprachigen Akzents Obwohl Piske et al. (2001) nicht explizit die phonetischen Korrelate eines fremdsprachigen Akzents untersucht haben, berichten sie, dass die Hörer ihres Perzeptionsexperimentes die Beurteilung der Stärke eines fremdsprachigen Akzents aufgrund segmenteller und suprasegmenteller Abweichungen getroffen haben. Die Stärke eines fremdsprachigen Akzents hängt außerdem auch davon ab, wie flüssig die L2 produziert wird, was Sprechgeschwindigkeit, Längung von Segmenten, Pausenverhalten (Anzahl, Dauer und Position), Häsitationen, Wiederholungen und Abbrüche einschließt. Flege (1988) konnte in Perzeptionsexperimenten, bei denen Pausen in Stimuli gesprochen von L2-Sprechern entfernt wurden, jedoch nur minimale Veränderungen im Beurteilungsverhalten der Hörer feststellen. Es bleibt jedoch offen, ob das bedeutet, dass der Sprechfluss den wahrgenommenen Grad eines fremdsprachigen Akzents nicht (wesentlich) beeinflusst, oder ob der Sprechfluss nicht unabhängig von segmentellen und suprasegmentellen Mustern wahrgenommen wird, die einen fremd- 1 Zur Methode der Messung phonetischer Dialektalität vgl. auch Kehrein (2009). 24 sprachigen Akzent bestimmen. Nach Piske et al. (2001) konnte bisher noch nicht empirisch nachgewiesen werden, welchen relativen Stellenwert segmentelle Parameter, prosodische Parameter und Redefluss auf die wahrgenommene Stärke eines fremdsprachigen Akzents haben. Zu dieser Schwierigkeit trägt auch bei, dass segmentelle und prosodische Parameter oft eng miteinander verbunden sind. Auch Gut (2009) findet keinen signifikanten Zusammenhang zwischen der beurteilten Stärke von fremdsprachigen Akzenten und einzelnen untersuchten segmentellen und suprasegmentellen Mustern, in denen sich muttersprachliche Produktionen von nicht-muttersprachlichen Produktionen unterscheiden. In Martin (2003) wurde die Wirkung einer Manipulation des Sprachsignals auf einen fremdsprachigen Akzent untersucht. Der Akzent amerikanischenglischer Muttersprachler im Französischen konnte durch Modifikation des Sprachsignals „verbessert“ werden. Dazu wurde z. B. die globale Intonationskontur dem französischen Muster angepasst, indem die Kontur in von französischen Muttersprachlern gesprochenen Sätzen kopiert und auf die von den englischen Muttersprachlern gesprochenen Sätze gelegt wurde. Außerdem wurde die Vokaldauer reduziert und bei Diphthongen ein Vokalteil herausgeschnitten und somit monophthongiert. Eine weitere Modifikation bestand in der Reduktion der Aspiration initialer stimmloser Fortis-Plosive ebenfalls durch Herausschneiden eines Teils der Aspirationszeit. In einem anschließenden Perzeptionsexperiment verglichen französische Muttersprachler Sprachmaterial von französischen Muttersprachlern gesprochen mit dem von englischen Muttersprachlern gesprochenen Originalmaterial sowie das von englischen Muttersprachlern gesprochene Originalmaterial mit dem modifizierten Material. Dabei wurden generell die muttersprachlich französischen Äußerungen bevorzugt. Beim Vergleich Original vs. Modifikation wurde jeweils die Modifikation bevorzugt, wobei nur für die Modifikation der Intonationskontur und die Reduktion von Vokaldauer und bei den Diphthongen Signifikanz festgestellt wurde. Über diesen Test konnte gezeigt werden, dass eine Veränderung des Sprachmaterials auf segmenteller und auf suprasegmenteller Ebene den fremdsprachigen Akzent in einer Sprache erheblich verringern kann. Munro et al. (2003) untersuchen die Fähigkeit von Hörern (kanadisch-englische Muttersprachler), einen fremdsprachigen Akzent (Mandarin-chinesischer Akzent im Englischen) in rückwärts abgespielter Sprache zu entdecken, unter der Annahme, dass hier phonologische Fehler keine Rolle spielen. Da die Beurteilungen der Hörer meist korrekt waren, müssen in dem Sprachmaterial trotzdem bestimmte Merkmale eines nicht-muttersprachlichen Akzents vorhanden sein. Munro et al. (2003) schlussfolgern, dass es wohl Langzeit-Eigenschaften wie Stimmqualität sind, die es Hörern ermöglichen, einen fremdsprachigen Akzent sogar in rückwärts abgespielter Sprache zu erkennen. Einen starken Einfluss suprasegmenteller Merkmale darauf, dass Sprache als fremdsprachig akzentuiert wahrgenommen wird, sehen auch Boula de Mareüil und Vieru- Dimulescu (2006) in ihrer Studie zu spanisch-akzentuiertem Italienisch und 25 italienisch-akzentuiertem Spanisch. Weiterführende Studien zur Rolle von Prosodie im Fremdsprachenerwerb finden sich u. a. bei Munro (1995), Jilka (2000) oder Gut (2009). 3.2. Fremdsprachiger Akzent im forensischen Kontext 3.2.1. Fremdsprachen und fremdsprachige Akzente im forensischen Kontext Fremdsprachen, fremdsprachige Akzente und regionale Dialekte können, wie Hollien (2002) hervorhebt, unter bestimmten Bedingungen einen positiven Einfluss auf die Sprechererkennung haben, da über sie Aussagen zur Herkunft eines Sprechers getroffen werden können. Auf der anderen Seite können sie aber auch die Wiedererkennung und Identifizierung eines bereits gehörten Sprechers aus einer Gruppe von Sprechern, z. B. in einem sogenannten voice line-up (einer akustischen Wahlgegenüberstellung), erschweren. Eine der wenigen Studien, nach der ein fremdsprachiger Akzent (deutscher Akzent im amerikanischenglischen Kontext) keinen Einfluss auf die Wiedererkennung von Sprechern durch Hörer hatte, ist McGehee (1937), wobei auch hier von einer Verschlechterung der Erkennungsleistung nach längerer Zeit zwischen den Testphasen ausgegangen wird. Goldstein et al. (1981) kommen in ihren Untersuchungen zu dem Ergebnis, dass Sprecher, die einen fremdsprachigen Akzent aufweisen (taiwanesisch-akzentuiertes Englisch), bei einer sehr kurzen Phase zwischen dem Vorspielen der Zielstimme und dem Vorspielen der Teststimmen von amerikanisch-englischen Hörern genauso gut erkannt werden wie akzentfreie Stimmen (amerikanisches Englisch). Die Erkennungsleistung verringerte sich jedoch unter der Akzent-Bedingung nach einer Reduktion der Dauer des Sprachmaterials. In verschiedenen anderen Studien konnte gezeigt werden, dass die Exaktheit einer möglichen Wiedererkennung eines Sprechers in einer Gegenüberstellung von Stimmen sich deutlich verschlechtert, wenn der Sprecher in einer für den Hörer fremden Sprache oder mit einem fremdsprachigen Akzent spricht (z. B. Thompson, 1987; Goggin et al., 1991; Köster und Schiller, 1997; Huntley Bahr, 1999; Sullivan und Schlichting, 2000; Sullivan und Kügler, 2001). Thompson (1987) und Goggin et al. (1991) kritisieren die in McGehee (1937) und Goldstein et al. (1981) angewandten Methodiken, die die Ergebnisse zum Teil uninterpretierbar machten. Kritikpunkte sind u. a. eine Vermischung der Bedingungen und Stimmen, eine zu heterogene Gruppe der deutschen Sprecher verglichen mit der amerikanisch-englischen Sprechergruppe (beides bei McGehee, 1937) sowie zu kurze Zeitdauern zwischen den einzelnen Testphasen. In Thompson (1987) wurden monolingualen englischen Muttersprachlern Texte in Englisch, Spanisch oder Englisch mit starkem spanischem Akzent vorge- 26 spielt. Die sechs Sprecher der Studie sprachen sowohl Spanisch als auch Englisch fließend und imitierten einen spanischen Akzent. Die Hörer sollten eine Woche nach der Präsentation des ersten Stimulus versuchen, den zuvor gehörten Sprecher in einem voice line-up (6 Sprecher, inklusive der Zielperson) wiederzuerkennen. Die Stimuli in der Gegenüberstellung wurden im selben Modus (Englisch, Spanisch, spanisch-akzentuiertes Englisch) vorgespielt wie für die erste Präsentation. Die Untersuchung zeigte, dass die Hörer (monolingual englisch) schlechter abschnitten, wenn sie die Spanisch sprechenden Sprecher identifizieren sollten, als wenn dieselben Sprecher Englisch sprachen. Die Identifikationsleistung bei den spanisch-akzentuierten Stimuli lag zwischen den anderen beiden Bedingungen. In einem zweiten Experiment, bei dem die Zielperson nicht im voice line-up vertreten war, gab es zwischen den einzelnen Bedingungen keine wesentlichen Unterschiede, allerdings war die Rate falscher Zuordnungen unter allen drei Bedingungen relativ hoch. Thompson (1987) schlägt zwei mögliche Erklärungen für die schlechtere Identifikationsleistung bei Vorliegen einer fremden Sprache vor: Zum einen, dass Hörer in der Sprache, die sie sprechen, besser in der Lage seien, idiosynkratische Muster zu erkennen. Zum anderen wirft er die Möglichkeit auf, dass manche Sprachen aufgrund bestimmter Charakteristika Identifikationsaufgaben erleichtern. Goggin et al. (1991) geht mit Thompson (1987) in dem Punkt konform, dass wenn Sprecher in einem für den Hörer fremden Dialekt oder in einer fremden Sprache sprechen, die Phonologie so stark von dem Standardschema des Hörers abweichen kann, dass bestimmte Feinheiten (idiosynkratische Muster) verloren gehen können und die Identifikation des Sprechers aus einer Gruppe weiterer Sprecher erschwert wird. Goggin et al. (1991) wiederholten zum Teil Thompsons Experimente von 1987 mit unterschiedlichen Sprachkombinationen (Deutsch-Englisch anstatt Spanisch-Englisch) und bestätigten dessen Resultate. Die Untersuchungen ergaben, dass monolinguale Englisch sprechende Hörer Sprecher, die Englisch sprachen, besser identifizieren konnten als wenn dieselben Sprecher Deutsch sprachen. Das umgekehrte Ergebnis konnte mit deutschen Hörern erreicht werden, d. h. sie erkannten Deutsch sprechende Sprecher besser als wenn diese Englisch sprachen. Somit konnte Thompsons Erklärungsansatz widerlegt werden, dass die Identifikationsaufgabe für bestimmte Sprachen einfacher sei als für andere. Bei bilingualen Hörern (Spanisch-Englisch) spielte die Sprache (Englisch, Spanisch, spanisch-akzentuiertes Englisch), in der sie die Ziel- und Test-Stimuli hörten, keine Rolle für die korrekte Sprecheridentifikation. Außerdem waren monolinguale Englisch sprechende Hörer sicherer in ihrer Beurteilung für Englisch sprechende Sprecher als für Spanisch sprechende; die Akzent-Bedingung lag dazwischen. Bei den bilingualen Hörern war das Vertrauen in ihre Beurteilung in beiden Sprachbedingungen annähernd gleich groß, jedoch geringer für die Akzent-Bedingung. Dennoch besteht generell zwischen dem Vertrauen in die Beurteilungen und den korrekten Identifikationen nur ein sehr geringer positiver Zusammenhang. 27 Die Untersuchungen von Köster et al. (1995) sowie von Köster und Schiller (1997) mit deutschen und englischen bzw. spanischen und chinesischen Hörern mit und ohne Sprachkenntnissen des Deutschen zeigten, dass die Hörer, die gewisse Deutsch-Kenntnisse hatten, einen Deutsch sprechenden Sprecher besser identifizierten als Hörer ohne diese Sprachkenntnisse. Welchen konkreten Einfluss der Kompetenzgrad in der Fremdsprache Deutsch oder auch die typologische Verwandtschaft von Sprachen auf die Identifikationsleistung hat, blieb in diesen Untersuchungen jedoch noch unklar. Sullivan und Schlichting (2000) und Sullivan und Kügler (2001) untersuchten, ob der Kompetenzgrad einen Einfluss auf die Identifikationsleistungen hatten. Beide Untersuchungen ergaben, dass britisch-englische Muttersprachler, die keine Schwedisch-Kenntnisse aufwiesen, für Schwedisch sprechende Sprecher schlechtere Identifikationsleistungen zeigten als britisch-englische Hörer mit Schwedisch-Kenntnissen. Die Identifikationsleistung konnte mit zunehmendem Kompetenzgrad im Schwedischen während eines vierjährigen Sprachstudiums jedoch nicht signifikant verbessert werden. Obwohl es also mit dem Erlernen einer Fremdsprache für die Hörer zunächst einen Zugewinn in ihrer Fähigkeit bei der Sprecheridentifikation in dieser Sprache gibt, konnte nach dem Erreichen eines bestimmten Kompetenzgrades trotz weiterer Fortschritte im Fremdspracherwerb keine weitere Verbesserung der Identifikationsleistung erzielt werden. In Sjöström et al. (2006) wird anhand von vier Perzeptionsexperimenten die Wirkung von Dialektänderung (dialect switching) eines Sprechers, der in zwei Dialekten (Stockholmer und Schonischer Dialekt im Schwedischen) gleich kompetent ist, auf die Identifizierung dieses Sprechers untersucht. Die Studie zeigte, dass Dialekte sehr großen Einfluss auf die Identifizierung eines Sprechers haben. Sie wird erschwert, wenn Ziel- und Teststimuli in unterschiedlichen Dialekten gesprochen werden. Folglich könne nach Sjöström et al. (2006), wenn ein Sprecher bei Tat- und Vergleichsaufnahme unterschiedliche Dialekte verwendet, dies zu schwerwiegenden Folgen bei einer Gegenüberstellung von Stimmen führen. Denn es bestünde nicht nur die Gefahr, dass der Sprecher nicht identifiziert wird, sondern auch, dass eine andere Person, deren Dialekt näher an der Tataufnahme ist, fälschlicherweise für den Sprecher auf der Tataufnahme gehalten wird. Eine Erweiterung dieser Studie zeigte, dass die Identifikationsfähigkeit weder verstärkt wurde, wenn die Hörer selbst Sprecher eines der beiden Dialekte waren, noch wenn ihnen explizit gesagt wurde, dass der Sprecher den Dialekt ändern würde (vgl. Eriksson, 2007). Hollien (2002) nennt zusammenfassend mögliche Erklärungen für die reduzierte Wahrscheinlichkeit, einen Sprecher mit einem fremden regionalen Dialekt oder fremdsprachigen Akzent wiederzuerkennen (vgl. Hollien, 2002, S. 56): 1. Der Hörer wird durch den Dialekt oder Akzent abgelenkt und verwirrt, 2. sprecherspezifische idiosynkratische Merkmale werden gedämpft, 3. feinste Nuancen der Sprache werden maskiert oder gehen verloren, und 28 4. Kontraste zwischen den Segmenten werden reduziert. Libossek und Anthes (2003, S. 699) sehen dies auch als eine Erklärung für schlechte Leistungen bei voice line-ups in einer Fremdsprache. Sie gehen beispielsweise davon aus, dass, wenn der Hörer zur Charakterisierung eines Sprechers sein eigenes Vokalkonzept nutzt, er bei einem fremden Vokal nicht unterscheiden kann, ob es sich entweder um eine ungewöhnliche Realisierung eines bestimmten ihm bekannten Vokals oder um einen ihm fremden Vokal einer anderen Sprache handelt. Bei Ersterem wäre der Hörer mit einem sprecherspezifischen Merkmal konfrontiert. Bei Zweiterem kann es aufgrund unterschiedlicher Verteilung möglicher Variationen des Vokals in der betreffenden Sprache auch ein nicht-sprecherspezifisches Merkmal sein (vgl. Libossek und Anthes, 2003, S. 699). Die Wiedererkennungsleistung von Russisch-Sprecherinnen durch deutsche Hörer erhöhte sich in Libossek und Anthes (2003) tendenziell, wenn die präsentierten russischen Silben und Vokale deutschen Mustern entsprachen, und konnte mit zunehmender Länge der linguistischen Einheiten sogar signifikant erhöht werden (vgl. Libossek und Anthes, 2003, S. 701). Obwohl in den vorausgegangenen Ausführungen v. a. die Problematik fremdsprachiger Akzente in Bezug auf die Sprecheridentifizierung bei der Gegenüberstellung von Stimmen dargestellt wurde, wurde zu Beginn dieses Abschnittes auf Hollien (2002) verwiesen, der in fremdsprachigen Akzenten und regionalen Dialekten auch Chancen für die Sprecheridentifizierung sieht, da sie eine Eingrenzung der potenziellen Sprecher ermöglichen. Künzel (1987) betont, dass das Ablegen eines regionalen Dialekts und der Versuch, Standard(deutsch) zu sprechen, für einen nicht ausgebildeten Sprecher ein komplexes Unterfangen ist und in der Regel eine Einordnung in den regionalen Großraum, aus dem ein Sprecher kommt, dennoch möglich sei (vgl. Künzel, 1987, S. 113 f.). Bedenkt man die zunehmende Mobilität in der Gesellschaft, so wird sich beispielsweise die dialektale Einordnung eine Sprechers, der einen Teil seiner Kindheit und Jugend in Schleswig-Holstein und einen Teil im alemannischen Dialektgebiet Baden-Württembergs verbracht hat, schwierig gestalten. Ähnlich verhält es sich mit der Einordnung nicht-muttersprachlicher Akzente, beispielsweise eines in Bayern lebenden nigerianischen Sprechers, der neben seiner Erstsprache Haussa aber vielleicht noch andere Tschad-Sprachen und Englisch als Amtssprache erlernt hat. Trotz der durch diese Konstellationen zu erwartenden zum Teil widersprüchlichen Befundlagen, können vielleicht auch gerade aus diesen wertvolle Hinweise für die Erarbeitung eines Sprecherprofils gewonnen werden. Mindestens genauso schwierig wie das Ablegen der regionalen Färbung für einen Dialektsprecher und, wie unter Punkt 3.1 dargestellt, für viele Sprecher nahezu unmöglich ist es, den Akzent der Muttersprache beim Sprechen einer Fremdsprache abzulegen. Rogers (1998) berichtet von einem Fall, in dem er durch sein Sachverständigen-Gutachten einen Verdächtigen (Englisch sprechender kantonesischer Muttersprachler) entlasten konnte, da der fremdsprachige Akzent des Verdächtigen stärker war als der fremdsprachige Akzent in 29 der Tataufnahme. Er führt an, dass es nicht schwierig ist, seinen Akzent in einer fremden Sprache zu verstärken, sehr viel schwieriger sei es hingegen, einen schwächeren Akzent zu sprechen: Imitating a stronger accent in a foreign language than one normally has is not difficult; imitating less of an accent than one normally has is very difficult. (Rogers, 1998, S. 206) Rodman (2002) berichtet von einem ähnlich gelagerten Fall. Ein aus Haiti stammender Mann und Sprecher eines kreolischen Akzents wurde zu zwölf Jahren Haft verurteilt, weil das Gericht ihm anhand einer Sprachaufnahme eine Straftat nachgewiesen hatte. Doch der Sprecher aus der Tataufnahme sprach mit einem afroamerikanischen Akzent. Die Staatsanwaltschaft, und ihr folgend auch die Jury, unterstellte dem Angeklagten, seine Stimme verstellt zu haben, indem er seinen fremdsprachigen Akzent ablegte. Möglich wäre dies nach Angaben der Staatsanwaltschaft durch die Tätigkeit des Verdächtigen als Linguist in der Armee, wodurch er fähig sei, seine Stimme zu verstellen und den kreolischen Akzent abzulegen. Mit dieser Annahme unterlag die Staatsanwaltschaft nach Rodman (2002) jedoch einer fatalen Fehleinschätzung über die sprachlichen Möglichkeiten eines Menschen. Er argumentiert, dass es unmöglich sei für einen Sprecher, der eine Fremdsprache erst nach einem bestimmten Alter erlernt hat, seinen muttersprachstypischen Akzent abzulegen und Interferenzen zu vermeiden, die darauf hindeuten, dass der Sprecher kein Muttersprachler dieser Sprache ist: [W]hen a language is learned past the critical age of puberty, it is almost inevitably spoken with interference from the native language, that is, with a distinct non-native accent. (Rodman, 2002, S. 101) Eine Verstellung derart, dass ein fremdsprachiger Akzent willentlich abgelegt werden kann, um somit die wahre Herkunft zu verbergen, ist laut Rodman (2002) maximal möglich, wenn der Sprecher die Fremdsprache bereits im Kindesalter erlernt hat. Nur so könnten Interferenzen vermieden und die Sprache akzentfrei gesprochen werden. Zur Diskussion um mögliche Einflussfaktoren auf einen fremdsprachigen Akzent, wie die auch hier von Rodman angenommene Critical Period Hypothesis sowie für weitere Literatur zu diesem Bereich vgl. Punkt 3.1.1 dieser Arbeit. Wie unter Punkt 3.1.3 zu möglichen phonetischen Korrelaten eines fremdsprachigen Akzents bereits beschrieben, konnte in Martin (2003) durch Perzeptionsexperimente gezeigt werden, dass der Akzent amerikanisch-englischer Muttersprachler im Französischen durch eine Modifikation des Sprachsignals (Veränderung der globalen Intonationskontur, Reduktion der Vokaldauer, Monophthongierung von Diphthongen, Reduktion der Aspiration bei initialen Fortis- Plosiven) verbessert werden konnte. Es handelt sich dabei um eine Studie, die eher dem didaktischen als dem forensischen Bereich der Phonetik zuzuordnen ist, und diese Art der Stimmverstellung ist in der forensischen Praxis aufgrund 30 der Komplexität und des vorausgesetztem linguistischen Wissens eher nicht zu erwarten. Nicht alle notwendigen Modifikationen sind leicht umzusetzen. Martin (2003, S. 959) weist darauf hin, dass z. B. eine Monophthongierung durch Eliminierung eines Vokalsegments einfacher ist, als einen Diphthong zu synthetisieren. Dasselbe gilt für die Reduktion vs. Verlängerung der Aspiration. Prinzipiell ist eine instrumentelle Modifikation eines Sprachsignals nicht nur zur Vermeidung des muttersprachstypischen Akzents in einer Fremdsprache vorstellbar, sondern auch für die Vortäuschung eines fremdsprachigen Akzents. Dabei ist Letzteres sicher genauso schwer umzusetzen wie ersteres. 3.2.2. Imitierte regionale Dialekte In der Literatur werden Imitation fremder regionaler Dialekte und Imitation fremdsprachiger Akzente oft in einem Zusammenhang besprochen und diskutiert. Grund hierfür ist, dass beide nach Künzels (1987) Taxonomie Formen der Verstellung von Merkmalen der Sprache sind und in beiden Fällen versucht wird, die eigene Identität und Herkunft zu verbergen und gleichzeitig eine andere Herkunft vorzutäuschen. Viele Aussagen zu Identifikationsmöglichkeiten bei einer solchen Verstellung oder zur Komplexität der Imitationsaufgabe treffen sowohl auf die Imitation eines regionalen Dialekts als auch auf die Imitation fremdsprachiger Akzente zu. Oftmals werden die Termini Dialekt und Akzent auch nicht auseinander gehalten, sondern synonym verwendet oder es geht erst aus den Ausführungen hervor, welche Form gemeint ist. So findet sich beispielsweise bei Baldwin und French (1990, S. 66) der Ausdruck „counterfeit accent“, wobei hier keine eindeutige Unterscheidung zwischen Dialekt und Akzent getroffen wird. Ohne zu tief in die Debatte einsteigen zu wollen, die in der Soziolinguistik um die Verwendung der Termini Akzent und Dialekt geführt wird, sei sich im Folgenden an eine verschiedene Definitionen zusammenfassende Begriffsklärung von Britain (2004) angelehnt: Definitions of accent are quite consistent - involving ONLY the pronunciation of a language variety, regardless of who speaks it, whether standard or non-standard-speaking, native or non-native. [...] The term ‘dialect’, meanwhile, lacks definitional consensus perhaps more than any other in the field ([sociolinguistics]). The only agreement across the discipline, it appears, is in the meaning of ‘dialect’ vis à vis ‘accent’, where the former is commonly recognised as involving every level of language, including, but not restricted to the phonological. (Britain, 2004, S. 267 f.) In dieser Arbeit wird „Dialekt“ als regionalsprachliche Varietät verstanden, die alle linguistischen Ebenen umfasst, während sich „fremdsprachiger Akzent“ auf die Aussprachebesonderheiten eines Sprechers bezieht, der in einer Fremdsprache spricht. Die folgenden Ausführungen zur Imitation regionaler Dialekte 31 sind als Exkurs zu sehen, der in Hinblick auf die Verknüpfung der beiden Verstellungsformen nicht nur plausibel, sondern notwendig zu sein scheint. Künzel (1987, S. 114) spricht bei der Dialektimitation vom „Aufsetzen eines fremden Dialekts“ und stellt fest, dass die Komplexität des „Zieldialekts“ häufig unterschätzt wird und so die perfekte Nachahmung desselben kaum gelingt. Außerdem konzentriere sich die Verstellung vorwiegend auf den lautlichen Bereich. Besondere grammatische Formen, wie sie zum Beispiel im Bairischen zu finden sind, oder gebietstypische Phrasen, Formulierungen oder Ausdrücke (vgl. zum Beispiel Semmel - Brötchen - Wecken - Schrippen; Fleischer - Metzger - Schlachter) werden dabei meist nicht berücksichtigt (vgl. Künzel, 1987, S. 114). Ein ähnliche Einschätzung findet sich auch bei Purschke (2010), der davon ausgeht, „dass sich das Wissen der Sprecher über eine fremde Regionalsprache wesentlich in Form von Syntagmen und festgefügten Ausdrücken [(oft bekannt aus überregionalen Medien)] strukturiert“ (Purschke, 2010, S. 153) und aufgrund dieser Unvollständigkeit des Wissens die Dialektimitation fehleranfällig ist. Außerdem vermutet Purschke (2010) eine doppelte Schwierigkeit bei der Imitation eines fremden Dialekts, da zunächst die eigene regionalsprachliche Kompetenz mit der standardsprachlichen Kompetenz abgeglichen werden muss, um dann in einem zweiten Schritt Varianten aus dem Zieldialekt zu integrieren. So sind aufgrund der Komplexität einer sprachlichen Varietät nicht nur Fehler in der Imitation des Zieldialekts, sondern ebenfalls Interferenzen durch den eigenen regionalsprachlichen Hintergrund zu erwarten (vgl. Purschke, 2010, S. 154). Wagner (1998) beschreibt Dialektimitation als eine komplexe Verstellungsart, die häufig von Sprechern genutzt wird, die mit dem Dialekt vertraut sind, den sie imitieren, weil sie z. B. eine längere Zeit in der betreffenden Region gelebt haben. Tate (1979), Segerup (1999), Markham (1999) und Purschke (2010) sind Beispiele für Studien, in denen Dialektimitation empirisch untersucht wurde. Der Fokus dieser Untersuchungen liegt zum einen auf der Imitationsfähigkeit der Sprecher aber auch auf der Leistung von Hörern, die Authentizität der Verstellungen zu beurteilen oder den angestrebten Dialekt zu identifizieren. Der Hintergrund dieser Studien ist nicht immer ein forensisch-phonetischer, sondern zum Teil auch ein dialektologischer. Was als „erfolgreiche Imitation“ gilt, hängt auch von dem jeweiligen Hintergrund der betreffenden Studie ab. Tate (1979) untersucht die Möglichkeit von Hörern, eine Stimmverstellung durch Annehmen eines fremden Dialekts zu erkennen. Es gab in dieser Untersuchung vier Probandengruppen: 1.) acht Sprecher aus Nord-Zentral-Florida mit einem südlichen Dialekt („marked Southern accents“), 2.) acht untrainierte Sprecher der amerikanischen Standardvarietät („General American accent“), 3.) acht trainierte Schauspieler, ebenfalls Sprecher der amerikanischen Standardvarietät und 4.) zehn untrainierte Hörer aus Florida. Die trainierten und untrainierten Sprecher der amerikanischen Standardvarietät sollten im Experiment versuchen, den Dialekt aus Nord-Zentral-Florida zu imitieren, nachdem sie die 32 Möglichkeit hatten, sich Aufnahmen der Sprecher aus Florida anzuhören und im Falle der trainierten Sprechergruppe die Nachahmung zu trainieren. Außerdem wurde Sprachmaterial mit ihrem natürlichen Dialekt aufgenommen. Die Hörergruppe hatte die Aufgabe, in einem Perzeptionsexperiment anzugeben, ob es sich bei dem gehörten Sprachmaterial um „native Southern“, „imitation Southern“ oder „General American Speech“ handelt. Das Gesamtergebnis war, dass die Hörer sowohl fähig waren, die amerikanische Standardvarietät als auch den authentischen südlichen Dialekt korrekt zu identifizieren. Außerdem konnten die Hörer in zwei Drittel der Fälle die Imitationen auch als solche identifizieren. Dabei war die Verstellungsleistung der trainierten Schauspieler besser (in 37,5 % der Fälle als „native Southern“ identifiziert, verglichen mit 30,0 % falscher Identifikation als „native Southern“ bei den untrainierten Sprechern), jedoch nicht signifikant. Segerup (1999) ist eine Studie zur Imitation eines westschwedischen Dialekts (Region Göteburg) durch vier Sprecher eines südschwedischen Dialekts (Region Helsingburg). Zwar ist diese Untersuchung nicht unmittelbar dem forensisch-phonetischen Bereich zuzuordnen, dennoch soll kurz auf sie eingegangen werden, da Fragen aufgeworfen werden, die auch für die vorliegende Arbeit von Interesse sind: Wie ist die generelle Wahrnehmung des Zieldialektes? Welche Dialektmerkmale werden zur Imitation in Betracht gezogen? Bleiben Merkmale des eigenen Dialekts bei der Imitation erhalten und wenn ja, welche sind das? Welche Merkmale sind Voraussetzung für eine erfolgreiche Imitation? Unter „erfolgreicher Imitation“ versteht Segerup (1999), dass der Hörer zweifelsfrei den Zieldialekt identifiziert und dass die Imitation überzeugend natürlich oder muttersprachlich ist: „The description of an imitation as successful implies that the listener without doubt identifies the target dialect and further considers the imitation to be convincingly native-like.“ (Segerup, 1999, S. 1253). Für die Untersuchung wurden bestimmte phonetische Merkmale der unverstellten (Originaldialekt) und verstellten (Dialektimitation) Textproduktionen der Sprecher auditiv und akustisch analysiert und mit den Produktionen eines authentischen Sprechers aus Göteburg verglichen. Außerdem sollten die Imitatoren vor der Aufnahme Charakteristika des zu imitierenden westschwedischen Dialekts nennen. Sowohl in den Beschreibungen als auch in den Dialektimitationen der Sprecher gab es viele Übereinstimmungen, die auf eine gemeinsame Vorstellung über den Zieldialekt schließen lassen. Die in den Dialektbeschreibungen genannten Merkmale des Zieldialektes fanden in den Dialektimitationen Entsprechungen, auch wenn das Ziel nicht immer erreicht wurde. Die Dialektimitationen von immerhin zwei der vier Sprecher wurden als erfolgreich und vergleichbar mit den Produktionen des Referenzsprechers bewertet. Gleichzeitig war es jedoch in allen vier Imitationen schwierig, den Originaldialekt zu bestimmen. Die Merkmale, die für eine erfolgreiche Imitation des westschwedischen Dialekts am wichtigsten zu sein scheinen, sind nach Segerup (1999) die Realisierung des Hauptakzents, Vokalquantität und Vokalqualität, v. a. wenn der Vokal in einem den Hauptakzent tragenden Wort vorkommt. 33 Markham (1999) untersucht, wie überzeugend acht schwedische Muttersprachler verschiedene schwedische Dialekte imitieren können. Für diese Zwecke sollten acht Hörer (phonetisch trainierte Linguisten) die Dialektimitationen regional einordnen und die Authentizität beurteilen. Die Ergebnisse zeigen, dass selbst die dialektale Einordnung des Originaldialektes den trainierten Hörern zum Teil Probleme bereitete. Außerdem war die Varianz sowohl bei der Leistung der Sprecher als auch bei der Leistung der Hörer sehr hoch. Zudem konnte zum Teil auch ein Zusammenhang mit dem Zieldialekt festgestellt werden und Dialekte, die Merkmale von verschiedenen Dialekten aufwiesen, wurden in vielen Fällen eher als authentisch akzeptiert als reine Dialekte (pure accents). Allerdings führte ein übermäßiger Einsatz bestimmter typischer Merkmale oder Merkmalskombinationen wiederum häufig zu einer Reduktion der wahrgenommenen Authentizität. Markham (1999) zieht die Schlussfolgerung, dass manche Sprecher fähig sind, einen fremden Dialekt teilweise so zu imitieren, dass sie von Hörern als authentische Sprecher dieses Dialekts beurteilt werden. Andere Sprecher hingegen könnten nur ihren eigenen Dialekt durch einen fremden Dialekt tarnen, ohne dass dieser als authentisch empfunden wird: [T]here is a wide variation in the ability of even highly motivated and perhaps phonetically talented speakers convincingly and consistently to create natural-sounding accent readings for dialectal accents other than their own. Some subjects performed particularly well on certain accents, convincing listeners that they were native speakers, and successfully masking their own native dialect. Some other subjects were able to mask their native dialect, even though their imitations of other dialectal accents were not heard as natural by many listeners. (Markham, 1999, S. 298) In Purschke (2010), einer Studie zum Hessischen, geht es primär darum, das Wissen nicht-hessischer ungeschulter Hörer über hessische Sprachräume zu untersuchen. 15 deutsche Muttersprachler (Nicht-Hessen) wurden gebeten, einen Text vorzulesen und dabei hessischen Akzent und Dialekt zu imitieren. Außerdem wurden auch freie Gesprächssequenzen mit der Dialektimitation sowie eine standardsprachliche Version des Lesetextes aufgezeichnet. Als Referenzsprecher dienten drei Sprecher, die aus Hessen stammen, von denen jedoch nur zwei als „dialektkompetent“ bewertet wurden. Von den zwei dialektkompetenten Sprechern wurden standardnahe Produktionen und von der nicht-dialektkompetenten Sprecherin wurden möglichst dialektale Textproduktionen aufgezeichnet. In einem Perzeptionstest sollten eine nicht-hessische und eine hessische Hörergruppe die empfundene Entfernung vom Standard (= Dialektalität) einschätzen, die Herkunft der Sprecher (= Regionalität) einordnen sowie die Authentizität des Dialekts beurteilen. Trotz unterschiedlicher Arbeitsanweisung für die Sprecher (Dialektimitation vs. möglichst standardnah zu sprechen) wurde für beide Sprechergruppen ein vergleichbares objektives Dialektalitätsniveau errechnet. Die objektiven Dialektalitätswerte stimmen in 34 hohem Maße mit den subjektiven Dialektalitätswerten der Hörer überein, die alle Aufnahmen als deutlich von der Standardlautung abweichend einschätzten. Neben der hohen Übereinstimmung bzgl. des phonetischen Abstandes von der Standardlautung gibt es auch eine hohe Übereinstimmung in den regionalen Merkmalen, die von den Imitatoren eingesetzt wurden und sich auch in den authentischen Dialektproduktionen wiederfinden. Dabei handelt es sich vorwiegend um konsonantische Merkmale wie Nicht-Realisierung des konsonantischen / r/ und Vokalkürzung, Lenisierung von intervokalischen Frikativen und Fortis-Plosiven, Fortisierung von / b, d, g/ , Zusammenfall des vorderen Allophons von / x/ mit Allophonen von / S/ . Die Authentizität der Aufnahmen wird in den beiden Hörergruppen unterschiedlich eingeschätzt. Während die nicht-hessische Hörergruppe fast alle Produktionen (d. h. auch die Dialektimitationen) als „authentisch“ bewertet, schätzt die hessische Hörergruppe fast alle Imitationen als „neutral“ oder „nicht-authentisch“ ein. Die regionale Zuordnung der Sprecher durch die Hörer unterscheidet sich ebenfalls in den beiden Hörergruppen, so sind die Zuordnungsversuche der hessischen Hörergruppe differenzierter als die der nicht-hessischen Gruppe, die die Imitationen meist in „Frankfurt“ verorten. Purschke (2010) bietet zwei Erklärungen hierfür an: entweder eine pauschale Verortung der Sprecher seitens der nicht-hessischen Hörer oder eine erfolgreiche Aktivierung der kognitiven Dialekt-Prototypen seitens der Imitatoren. Purschke (2010) schlussfolgert, dass das Wissen der nichthessischen Hörer sowie der Imitatoren durch die standardnahe und medial präsente Variante des Hessischen um Frankfurt geprägt ist und dieses begrenzte Wissen zwar ausreiche, um die intendierte Regionalität zu erkennen, aber nicht, um authentischen und imitierten Dialekt voneinander zu unterscheiden. Die Untersuchungen von Tate (1979), Segerup (1999), Markham (1999) und Purschke (2010) zeigen, dass der Erfolg einer Dialektimitation nicht nur von der oft recht unterschiedlichen Leistung der Imitatoren, sondern auch von der Leistung der Hörer abhängig ist. Faktoren wie regionale Herkunft oder phonetische Ausbildung der Hörer scheinen zwar eine Rolle zu spielen, gleichzeitig aber keine Garantie für eine Identifikation der Imitationen als solche zu geben. 3.2.3. Imitierte fremdsprachige Akzente Wie im obigen Abschnitt beschrieben, haben verschiedene Studien gezeigt, dass ein fremdsprachiger Akzent für die erfolgreiche Identifikation eines Sprechers eine große Herausforderung darstellt. Die Problematik erhöht sich, wenn nicht ausgeschlossen werden kann, dass es sich bei dem vorliegenden fremdsprachigen Akzent um eine Stimmverstellung handelt und der Akzent zur Verbergung der eigenen Identität imitiert wurde. Ähnlich wie bei der Nachahmung eines fremden Dialekts wird durch den Sprecher versucht, die eigene Herkunft zu verbergen und gleichzeitig eine andere Herkunft vorzutäuschen. Künzel (1987, S. 114) spricht hier von der Vortäuschung eines „sogenannten ‚Gastarbeiter- 35 deutsch[s]‘ mit ganz bestimmten Veränderungen im Bereich des Lexikons, der Syntax und des Wortschatzes, z. B. Ersetzen flektierter Verbformen durch Infinitive [oder] Benutzung von ‚du‘ statt ‚Sie‘ als Anredeform“. Allerdings wird in verschiedenen Studien und Werken der einschlägigen Forschungsliteratur betont, dass es relativ leicht sei, eine Stimmverstellung durch einen fremdsprachigen Akzent aufzudecken. Ein Grund für die relativ leichte Aufdeckung einer Akzentimitation als solche kann das Beibehalten vieler phonetischer Merkmale der eigenen Muttersprache sein. So geht Künzel (1987) beispielsweise sogar davon aus, dass bei der Verstellung als Nicht-Muttersprachler die Aussprache sämtlicher Laute in der Regel unverändert bleibt, und sich die Verstellung nur auf den grammatischen oder lexikalischen Bereich beschränkt 2 . Dies würde zumeist eine zweifelsfreie Identifikation der aufgenommenen Sprache als Verstellung oder Vortäuschung des fremdsprachigen Akzents ermöglichen. Darüber hinaus könnten aus der Akzentimitation sogar Rückschlüsse gezogen werden, ob die Fremdsprache, deren Akzent imitiert werden soll, erlernt wurde, z. B. im deutschen Schulunterricht oder durch einen Auslandsaufenthalt, und auch wie gut diese Fremdsprache beherrscht wird (vgl. Künzel, 1987, S. 114 f.). Diese Analyse geht jedoch bereits über die Identifizierung des Sprachmaterials als Verstellungsversuch hinaus und liefert den Ermittelnden noch zusätzliche Informationen über den Sprecher. Ein weiterer häufig angeführter Grund für die Identifikation einer Akzentimitation ist die Komplexität eines fremdsprachigen Akzents, der die Akzentimitationen nicht gerecht würden. Folglich seien sie durch Fehler, Übertreibungen und Inkonsistenzen gekennzeichnet. Dern (2003) bezieht sich zwar auf geschriebene Sprache, ihre Auseinandersetzung damit, wie ein fehlerhafter Text als Verstellung als Nicht-Muttersprachler identifiziert werden kann, ist aber sicherlich auch auf gesprochene Sprache übertragbar: Eine Orientierung bezüglich der Frage nach der Authentizität von Fehlern, d. h. dem möglichen Vorliegen einer Verstellung, bieten bisher lediglich der feststellbare Grad der Systematik gegebener Abweichungen sowie das Verhältnis von Abweichungen und korrekter Sprachverwendung. Ist keinerlei Systematik im Auftreten von Fehlern erkennbar [...] oder stehen sich korrekte und inkorrekte Instanzen in einer Kategorie [(Phonetik, Morphologie etc.)] in auffälliger Weise gegenüber, so ist eine Verstellung zu vermuten. (Dern, 2003, S. 47) Schall (2008, S. 332), ebenfalls v. a. geschriebene Sprache berücksichtigend, geht davon aus, dass die „Autoren [...] oftmals die stereotypen Merkmale [verwenden], die einem linguistischen Laien zugänglich sind“. Sie nennt folgende ty- 2 Hier liegt das Gegenteil zur Imitation eines fremden regionalen Dialekts vor, bei der Variationen laut Künzel (1987) oft ausschließlich auf der phonetischen Ebene zu finden sind. 36 pische Abweichungen: „im Bereich der Syntax die Vermeidung von Hypotaxen, auf der Ebene der Morphosyntax die Verwendung nicht flektierter, nicht markierter Formen (Singular, Präsens, Infinitiv), Verwendung von ‚nix‘ als universellem Negator und ‚viel‘ als universeller Steigerungspartikel“ (Schall, 2008, S. 332, die sich dabei auf Fobbe, 2006, beruft). Die genannten Abweichungen decken sich mit den in Neuhauser (2005, 2008) empirisch nachgewiesenen. Außerdem weisen sowohl Dern (2003) als auch Schall (2008) darauf hin, dass eine Verstellung von sprachlich ungeschulten Sprechern kaum über einen längeren Zeitraum konsistent aufrechtzuerhalten ist und die Verstellung im Verlaufe des Textes zugunsten des muttersprachlichen Deutschs abnimmt. Eine ähnliche Einschätzung für gesprochene Sprache findet sich in Clark und Foulkes (2007). Auch Nolan (1990) zweifelt an, dass während einer Akzentimitation Konsistenz und Verständlichkeit aufrechtzuerhalten sind. In Rose (2002) wird ebenfalls die Komplexität des fremdsprachigen Akzents angeführt, die es einerseits extrem schwierig macht, einen Akzent authentisch zu imitieren, und damit andererseits eine Identifikation als Verstellung sowie der eigentlichen sprecherspezifischen (z.B. dialektalen) Merkmale ermöglicht: It means at the very least getting the phonemes, their sequences, and their realisations right. Since accents can also differ in intonation, this too must be got right. Given the systematic complexity of accents, and the way they can vary depending on context, it is relatively easy for a linguist who knows the phonological structure of a given language variety to detect a bogus accent when it is used for disguise. This means in turn that a forensic phonetician will be often able to identify those aspects of the accent-disguised speech that reflect the speaker ’s true accent. (Rose, 2002, S. 193) Für eine erfolgreiche Akzentimitation scheinen nach Baldwin und French (1990), Blum (1990) und Storey (1996) schauspielerische Fähigkeiten und / oder linguistische Kenntnisse nötig zu sein, da Amateure sonst, aber auch professionelle Imitatoren gelegentlich, grobe Fehler begehen oder die Verstellung nicht aufrecht erhalten können: The phonetician [...] has no remedy against the perfect accentimitator, in the same way as any perfect counterfeit will elude detection, but perfection in the phonetics area seems, fortunately, to be very rare. Even professional imitators have been known to make mistakes in extended samples, whilst the amateur [...] usually does let his accent slip. (Baldwin und French, 1990, S. 67) [D]ie praktische Umsetzung [(der Akzentimitation)] [bereitet] aber in der Regel Schwierigkeiten [...]: es kommt zu Übertreibungen und widersprüchlichen Befundkonstellationen, die ihren Ursprung darin haben, dass die meisten Verfasser nur über diffuse Vorstellungen 37 von Ausländerdeutsch sowie über begrenzte Fremdsprachenkenntnisse verfügen. (Blum, 1990, S. 292) [I]n my experience at least, people assuming non-native speaker voice diguises for criminal purposes are probably neither actors nor linguists and almost invariably make fairly obvious errors and misinterpretations and are easily detected. (Storey, 1996, S. 212) Was unter Blums (1990) Formulierung „diffuse Vorstellungen von Ausländerdeutsch“ zu verstehen ist, lässt sich an einem Beispiel zeigen, von dem Clark und Foulkes (2007) berichten: In einem Fall, der von JP French Associates in Großbritannien untersucht wurde, versuchte der Sprecher bei seinen Telefonanrufen einen nicht-muttersprachlichen Akzent im Englischen zu imitieren. Der angestrebte Akzent konnte von den Sachverständigen jedoch nicht einer spezifischen Sprache zugeordnet werden. Auf der anderen Seite zeigte der Verdächtige, ein englischer Muttersprachler, in der Vergleichsaufnahme bestimmte phonetische Merkmale, die auch in den Tataufnahmen auffielen und darauf hindeuteten, dass es sich bei beiden Aufnahmen um denselben Sprecher handelte. Wie Blum (1990, S. 292) betont, wird außerdem nicht immer ein authentischer Akzent angestrebt und der Sprecher legt „auch gar keinen Wert darauf, die Verstellung als solche zu verschleiern, da sie hauptsächlich dazu dienen soll, den eigenen Stil unkenntlich zu machen“. Ebenso Markham (1999), der bezogen auf Dialektimitationen (jedoch vermutlich auch auf Akzentimitation übertragbar) betont, dass ein spezifischer authentisch wirkender „Zieldialekt“ nicht zwingend notwendig sei, solange das Hauptziel der Stimmverstellung - die eigene Identität und den eigenen Dialekt zu verbergen - erreicht wird: The key components of voice disguise are the masking of one’s own identity, and - if the deception itself should be concealed - the creation of an impression of naturalness, so as not to cause suspicion. Doubts as to naturalness could cause a listener to become suspicious and more sensitive to discordant accent characteristics. [...] Achieving a specific pure target accent is not necessairly important in voice disguise, as long as the speaker ’s D1 [own native dialect] is still obscured. (Markham, 1999, S. 296) Nach Wagner (1998) können zwei Zielsetzungen bei der Imitation eines fremdsprachigen Akzents unterschieden werden. Eine Form sei die Produktion eines undifferenzierten fremdsprachigen Akzents ohne Zuordenbarkeit zu einer spezifischen Sprache. Diese Form sei v. a. durch grammatische Fehler und infinite Verbformen gekennzeichnet, weise aber häufig keine Veränderungen auf der phonetischen Ebene auf. Die andere Form sei die Imitation eines spezifischen Akzents, meist ein englischer, amerikanischer, italienischer oder spanischer Akzent. Hier würden nur die Merkmale zur Verstellung in Betracht gezogen, die von den Sprechern als typisch für den jeweiligen Akzent angesehen werden, z. B. retroflexes / r/ beim amerikanisch-englischen Akzent. Inkonsistenzen auf 38 grammatischer, lexikalischer und phonologischer Ebene würden aber auch bei dieser Verstellungsform die Effektivität begrenzen. Die bisher referierten Arbeiten beziehen sich hauptsächlich auf die Erkennung und / oder Identifikation von Sprechern, die ihre Identität durch die Imitation eines fremdsprachigen Akzents oder eines fremden regionalen Dialekts tarnen. Sie bewegen sich demnach vor allem auf der perzeptiven Ebene. Es scheint unter den Autoren Einigkeit darüber zu herrschen, dass Verstellungen durch Imitation eines fremdsprachigen Akzents relativ leicht aufzudecken sind, da die Sprecher zu viele phonetische Merkmale ihrer Muttersprache beibehalten und in ihren Akzentimitationen Übertreibungen, Fehler und Inkonsistenzen aufweisen, die ihren Ursprung in beschränkter linguistischer Kompetenz in der betreffenden Fremdsprache und diffusen Vorstellungen über den betreffenden Akzent haben. Diese Behauptungen implizieren zweierlei: 1. Hörer sind fähig, zwischen imitierten und authentischen fremdsprachigen Akzenten zu unterscheiden. 2. Nicht-Muttersprachler sind in der Produktion ihrer Interferenzerscheinungen (im Gegensatz zu den Akzentimitatoren) konsistent. Die meisten der oben aufgeführten Aussagen aus der Forschungsliteratur zum Thema Stimmverstellung durch einen fremdsprachigen Akzent sind allgemeiner Natur und beruhen auf Erfahrungen aus der forensischen Praxis der Autoren. Keine der genannten Studien zeigt empirisch, zum Beispiel über Perzeptionsexperimente, wie authentisch ein imitierter fremdsprachiger Akzent von linguistisch naiven oder erfahrenen Hörern wahrgenommen wird. Außerdem sind Studien zur produktiven Ebene von Akzentimitation rar. Die empirische Überprüfung der Frage Welche Variationen nehmen Sprecher bei der Imitation eines fremdsprachigen Akzents vor? findet kaum angemessene Beachtung. Das gilt auch für den Vergleich von imitierten fremdsprachigen Akzenten mit authentischen Akzentproduktionen, deren mutmaßliche Konsistenz bezüglich vorhandener phonetischer Interferenzerscheinungen noch zu überprüfen ist. Im folgenden Abschnitt werden die wenigen empirischen Studien zur produktiven Seite von Akzentimitation vorgestellt. 3.3. Empirische Studien zur Verstellung durch einen fremdsprachigen Akzent Obwohl sich Dern (2008) ausdrücklich auf geschriebene Sprache bezieht, soll diese Studie dennoch kurz beschrieben werden, da sie die Verstellung als Nicht- Muttersprachler des Deutschen empirisch untersucht. 57 Studierende (deutsche Muttersprachler) sollten je einen Erpresserbrief mit konkret vorgegebener Rahmenbedingung verfassen (Teilaufgabe 1). In einem zweiten Schritt (Teilaufgabe 39 2) wurden die Probanden aufgefordert, ihr Schreiben auf sprachlicher Ebene so zu verändern, dass ihre Identität getarnt wird, und in einem dritten Schritt (Teilaufgabe 3) in ihrem Schreiben einen „Ausländer“ zu imitieren. Die durchschnittliche Anzahl der für die Schreiben verwendeten Wörter nahm mit den Teilaufgaben ab, d. h. während bei Teilaufgabe 1 noch durchschnittlich 105 Wörter produziert wurden, waren es bei Teilaufgabe 3 (Imitation eines „Ausländers“) nur noch 60. 31 % der Probanden gaben an, bereits bei Teilaufgabe 2 (Verstellung auf sprachlicher Ebene) versucht zu haben, einen nicht-deutschen Muttersprachler zu imitieren. Bei Teilaufgabe 3 (Imitation eines „Ausländers“) versuchten nur drei Personen eine Verbindung zu einer konkreten Sprache herzustellen, während die anderen Probanden keine sprachspezifischen Veränderungen vornahmen. Um welche Sprachen es sich in den drei Fällen handelt, geht aus den Ausführungen nicht hervor. Aus einem Beispiel wird jedoch deutlich, dass zumindest in einem Fall Französisch als Muttersprache simuliert wurde. Die Auswertung der Schreiben zur Teilaufgabe der Imitation von „Ausländerdeutsch“ ergab, dass in 56 % der Schreiben Fehler auf grammatischer Ebene dominierten, ca. 21 % der Schreiben ausgewogene Manipulation auf unterschiedlichen Ebenen zeigten und in 10 % der Schreiben orthografische Fehler bei sonst relativ intakter Sprachverwendung vorherrschten. Veränderungen in der Wortwahl und Absenkung der Stilebene kamen ebenfalls vor, traten jedoch seltener auf. Cunningham-Andersson und Engstrand (1989) ist eine Studie, die die Produktion eines fremdsprachigen Akzents nicht aus forensisch-phonetischer Perspektive, sondern vom Aspekt der wahrgenommenen Stärke eines fremdsprachigen Akzents untersucht. Es wurden verschiedene schwedische Textversionen gesprochen von einem schwedischen Muttersprachler (Phonetiker und Zweitautor der Studie) aufgenommen, die bewusst ausgewählte phonetische Merkmale eines fremdsprachigen (v. a. finnischen oder britisch-englischen) Akzents aufwiesen. Diese Merkmale waren segmenteller und suprasegmenteller Art und kamen sowohl einzeln als auch in diversen Kombinationen in den jeweiligen Textproduktionen des Sprechers vor. 35 schwedische Muttersprachler sollten in einem Hörexperiment beurteilen, ob der jeweilige Stimulus von einem nichtschwedischen Muttersprachler oder einem schwedischen Dialektsprecher gesprochen wurde oder einfach „eigenartig klingt“. Im Falle eines fremdsprachigen Akzents sollten sie diesen außerdem benennen und seine Stärke schätzen. Es konnte gezeigt werden, dass bei den Hörern durch die Produktion normabweichender phonetischer Merkmale ein Eindruck eines fremdsprachigen Akzents oder regionalen Dialekts geweckt werden konnte. Außerdem besteht ein positiver Zusammenhang zwischen der Anzahl an veränderten Merkmalen und dem wahrgenommenen Grad des fremdsprachigen Akzents, wobei einige Merkmale eine stärkere Rolle spielen als andere. Obwohl gezielt Merkmale ausgewählt wurden, die als charakteristisch für finnischen und britischenglischen Akzent im Schwedischen eingestuft wurden, wurde nur der „finnische Akzent“ von der Mehrheit der Hörer erkannt. In einem weiteren Ex- 40 periment innerhalb dieser Untersuchung produzierte derselbe Sprecher erneut verschiedene schwedische Textversionen mit fünf ausgewählten Merkmalen eines finnischen Akzents: (1) Veränderung des Wortakzents: Akzent I wird durch Akzent II ersetzt, (2) Reduktion der Aspiration in initialen stimmlosen Plosiven, (3) velarisierte Realisierung von / l/ , (4) Verstärkung der Quantitätsunterschiede in VC-Silben und (5) Realisierung von / r/ als alveolarer Vibrant. In einem Hörexperiment sollte durch 39 schwedische Muttersprachler beurteilt werden, ob sie einen finnischen Sprecher hörten und wie stark der Grad des Akzents sei. Die Analyse ergab, dass in der Regel drei Merkmale benötigt werden, damit der Akzent von der Mehrheit der Sprecher als finnisch wahrgenommen wird. Kommen weitere Merkmale hinzu, so nahm die empfundene Stärke des fremdsprachigen Akzents zu und mehr Hörer glaubten, einen finnischen Akzent zu hören. Ein akustischer Vergleich der Akzentimitationen des schwedischen Muttersprachlers mit schwedischen Produktionen zweier finnischer Muttersprachler zeigte, dass die betreffenden Merkmale auch in den authentischen finnischen Akzenten auftraten. Außerdem zeigte der Sprecher in der Akzentimitation keine stärkere Variation innerhalb der betreffenden Merkmale als in seinen unverstellten Textproduktionen. Cunningham-Andersson und Engstrand (1989) gibt ein Beispiel für eine erfolgreiche Akzentimitation, denn der Sprecher produziert nicht nur Akzentmerkmale, die auch in authentischen finnischen Akzentproduktionen zu finden sind, sondern er ist in seinen Akzentproduktionen auch relativ konsistent. Für den forensischen Kontext muss jedoch davon ausgegangen werden, dass Sprecher in der Regel nicht über die phonetische Expertise des Sprechers der diskutierten Studie verfügen, der Trainingsaufwand vermutlich geringer sein wird, und dass Faktoren wie Stress hinzukommen. Dennoch wirft die Untersuchung ein Licht auf die phonetischen Variationsmöglichkeiten eines Sprechers bei der Akzentimitation und deren potenzielle Auswirkungen auf linguistisch untrainierte Hörer. Torstensson et al. (2004), als Teilstudie auch veröffentlicht in Torstensson (2010), untersucht, ob schwedische Muttersprachler kognitive Modelle von akzentuiertem Schwedisch haben. Der Fokus liegt auf dem Akzent britisch-englischer Muttersprachler im Schwedischen (L2). Die Probanden sind drei schwedische Muttersprachler mit guten Englischkenntnissen sowie ein englischer Muttersprachler, der bereits seit zehn Jahren in Schweden lebt und ein fortgeschrittener Sprecher des Schwedischen ist, und dennoch einen markanten britischenglischen Akzent aufweist. Die schwedischen Muttersprachler sollten einen schwedischen Text zunächst so vorlesen, als ob sie Briten wären, danach noch einmal ohne Stimmverstellung. Im Anschluss bekamen die Probanden eine Aufnahme desselben Textes von dem britischen Probanden gesprochen und sollten sich den Text innerhalb einer Woche so oft wie möglich anhören, um ihren imitierten Akzent zu verbessern. Eine Woche später wurde die zweite Sprachaufnahme mit den schwedischen Probanden durchgeführt. Die auditive und akustische Analyse (sowohl intraals auch interindividuell vergleichend) ergab, dass die Sprecher viele der typischen Merkmale des Akzents überneh- 41 men konnten, und dass es eine hohe Übereinstimmung zwischen dem gab, was von einem Schwedisch sprechenden Briten erwartet wird und den tatsächlich gefundenen Variationen der schwedischen Probanden bei der Stimmverstellung durch einen britisch-englischen Akzent. Die Vergleiche zwischen den Sprechern zeigten, dass es eine große Menge an Übereinstimmungen zwischen den Variationen der einzelnen Sprecher gab. Viele der markanten Merkmale des britischenglischen Akzents im Schwedischen wurden von allen drei Sprechern vorgenommen, z. B. abweichende Realisierungen von / a/ und / r/ in verschiedenen Kontexten oder Diphthongierungen. Nach Torstensson et al. (2004) ist es daher sehr wahrscheinlich, dass für die schwedischen Probanden ein gemeinsamer kognitiver Prototyp des Akzents besteht, der innerhalb der Gruppe eine hohe Ähnlichkeit aufweist. Außerdem konnte die Verstellung durch relativ kurzfristiges mehrmaliges Anhören eines authentischen britisch-englischen Akzents im Schwedischen sowohl auf prosodischer als auch auf segmenteller Ebene deutlich verbessert werden. Für die forensische Praxis ist der Punkt verbesserter Imitationsfähigkeit durch Anhören eines authentischen Akzents sicherlich von besonderer Relevanz. Interessant ist, dass die Probanden nicht nur Gemeinsamkeiten in den veränderten Merkmalen zeigten, sondern auch in der Abwesenheit eines Merkmals, das dennoch als typisch für britisch-englischen Akzent gilt: der stimmhaften Realisierung von / s/ . Torstensson et al. (2004) begründen dies damit, dass / z/ zwar Bestandteil des englischen, aber nicht des schwedischen Phonemsystems sei und die Realisierung eines stimmhaften alveolaren Frikativs von schwedischen Muttersprachlern daher entweder nicht wahrgenommen, ignoriert oder vergessen wird. Auch hier findet sich ein bedeutender Ansatzpunkt für die forensisch-phonetische Analyse. So weisen Torstensson et al. (2004) darauf hin, dass das Fehlen eines wichtigen oder markanten Merkmals einer Sprache bzw. eines Akzents in Kombination mit dem Vorhandensein anderer markanter Merkmale Hinweise darauf geben kann, dass der vorliegende Akzent imitiert und nicht authentisch ist. Der kognitive Eindruck eines authentischen Akzents wird nach Torstensson et al. (2004, S. 275 f.) nicht durch einen Prototypen geformt, sondern ist durch distinktive Merkmale definiert, wobei jedes wichtig und zusammen hinreichend ist. Neuhauser (2005) ist eine weitere der wenigen Studien zur produktiven Seite von Akzentimitation und konzentriert sich auf mögliche Variationen, die deutsche Sprecher bei der Stimmverstellung durch einen französischen und türkischen Akzent vornehmen. Teile der Studie wurden in Neuhauser (2008) erweitert und publiziert. Diese Untersuchungen bilden die Forschungsgrundlage für die vorliegende Arbeit und werden daher im Folgenden zusammenfassend dargestellt. 42 Vorstudie als Forschungsgrundlage Ziel der vorliegenden Arbeit ist die Fortführung und Weiterentwicklung der Arbeit aus Neuhauser (2005, 2008) zur Thematik Phonetische und linguistische Variation bei der Stimmverstellung unter Verwendung eines fremdsprachigen Akzents, mit der bereits wichtige Grundlagen für die anstehende Arbeit geleistet wurden. Als Untersuchungsgrundlage für die empirische Arbeit wurde in Neuhauser (2005) zunächst der Frage nachgegangen, welche fremdsprachigen Akzente oder Dialekte des Deutschen überhaupt zur Stimmverstellung in Betracht gezogen werden. Es ergaben sich aus einer Befragung von 45 Personen zwei präferierte fremdsprachige Akzente - türkischer und französischer Akzent - mit geschlechtsspezifischen Tendenzen der weiblichen Befragten zum französischen und der männlichen Befragten zum türkischen Akzent. Aufgrund dieses Ergebnisses wurden der französische und der türkische Akzent für die Untersuchungen ausgewählt. Zwölf Sprecher wurden bei Stimmverstellungsversuchen durch einen der beiden Akzente in jeweils zwei Sitzungen aufgenommen und ihre Verstellungsversuche auf verschiedene Aspekte hin untersucht. Der Untersuchungsschwerpunkt lag zum einen auf den vorgenommenen phonetischen und weiteren linguistischen (nicht-phonetischen) Abweichungen der Probanden bei der Stimmverstellung und zum anderen auf der Konsistenz, mit der die Sprecher diese Variationen durchführen konnten. Die auditiv- und akustisch-phonetische Analyse des Sprachmaterials zeigte, dass es den Sprechern für die Imitation eines fremdsprachigen Akzents gelang, vielfältige Variationen auf segmenteller und suprasegmenteller Ebene vorzunehmen. Die Variationen konzentrierten sich vorwiegend auf den artikulatorischen Bereich, auf dem auch der Schwerpunkt der Betrachtungen lag. Doch mehr als die Hälfte aller Sprecher nutzte auch Variationen im phonatorischen Bereich, z. B. Veränderung der Grundfrequenz, des Tonhöhenumfangs sowie der Tonhöhenvariabilität. Zu den artikulatorischen Variationen der Sprecher, die sich durch einen französischen Akzent tarnten, gehören u. a. der Versuch fast aller Sprecher / h/ nicht und das vordere Allophon von / x/ abweichend zu realisieren. Diese Versuche blieben inkonsistent. Weitere ebenfalls inkonsistente Versuche umfassen die Unterdrückung des festen Stimmeinsatzes vor Vokalen und Vokalqualitätsänderungen, z. B. Nasalierung oder Vorverlagerung. Besonders hervorzuheben ist, dass alle Sprecher der Studie die Aspiration nach stimmlosen Fortis-Plosiven reduzierten. Die Reduktion war bei manchen Sprechern zum Teil sogar so stark, dass keine Aspiration mehr vorlag. Damit passten sich die Sprecher dem in der Literatur beschriebenen Muster an, dass stimmlose Plosive im Französischen in der Regel unbehaucht sind. Die wichtigsten artikulatorischen Abweichungen der Sprecher, die sich durch einen türkischen Akzent tarnten, sind abweichende Realisierungen von / r/ und 43 / ts/ . Drei von vier Sprechern realisierten bei der Imitation eines türkischen Akzents / r/ als geschlagenen Apikal, teilweise sogar an Stellen, bei denen im Deutschen eine vokalische Realisierung zu erwarten wäre. Weniger Konsistenz gab es bei der Realisation von / ts/ : Statt einer Affrikate wurde am häufigsten ein stimmloser alveolarer Frikativ realisiert. Variationen im nicht-phonetischen Bereich wurden durch eine linguistische Analyse der von den Probanden selbst verfassten Texte ermittelt. Nur fünf von acht Sprechern, die sich durch einen französischen Akzent tarnten, variierten auf syntaktischer, morphologischer oder lexikalischer Ebene. Die wichtigsten Variationen in den Produktionen der Sprecher dieser Gruppe sind relativ systematische Vermeidung des Dativs in Präpositionalgruppen sowie eine Tendenz zur Genusveränderung männlicher Substantive hin zu Feminina. Außerdem ergaben die Analysen inkonsistente Veränderungen der Position der finiten Verbform, z. B. Verbzweitstellung im Nebensatz und in Fragen oder ein doppelt besetztes Vorfeld. Die Imitationen eines türkischen Akzents zeichneten sich auf der nicht-phonetischen Ebene durch Vermeidung von Artikeln, Genusveränderungen tendenziell zum Femininum, Auflösung von Determinativkomposita und Variationen in Imperativsätzen aus. Neuhauser (2005) gibt einen Überblick über die Vielfalt der phonetischen Variationen, die von deutschen Muttersprachlern bei der Imitation eines französischen oder türkischen Akzents vorgenommen werden. Die Annahme Künzels (1987), dass die Variationen vorrangig auf nicht-phonetischer Ebene stattfinden würden, konnte durch diese Pilotstudie widerlegt werden. Problematisch an den Ergebnissen von Neuhauser (2005) ist v. a. die zu geringe Probandenanzahl in der Gruppe der Sprecher, die türkischen Akzent imitieren (N = 4), aber auch für die französische Gruppe (N = 8) wäre eine größere Probandenanzahl wünschenswert gewesen. Obwohl bei der Erstellung der Datenbasis auf Vergleichbarkeit geachtet wurde, unterschied sich der Abstand zwischen den beiden Aufnahmesitzungen in der Sprechergruppe zum Teil erheblich (zwei Tage - acht Wochen). Dadurch können allgemeine Feststellungen zur Konsistenz in den Realisierungen über die beiden Sitzungen für die gesamte Sprechergruppe nur mit Vorsicht getroffen werden. Übereinstimmungen in den Produktionen innerhalb der Sprechergruppen zeugen von einer gemeinsamen Vorstellung über den jeweiligen Akzent. Darüber, welche der produzierten Variationen bewusster und unbewusster Art sind, kann jedoch nur spekuliert werden. Der „Erfolg“ der Imitationsversuche, z. B. ob sie von Hörern als authentisch empfunden werden und ob der angestrebte Akzent erkannt wird, bleibt noch zu testen. 44 3.4. Motivation und Ziele für die weitere Forschung Die Ausführungen in den vorangegangenen Abschnitten (v. a. Abschnitt 3.2 und 3.3) dieser Arbeit zeigten, dass obwohl bereits Künzel (1987, S. 114) feststellt, dass „[d]ie Aussprache [...] immer als der empfindlichste Indikator eines echten oder vorgetäuschten Akzents anzusehen [ist]“, es an empirischen Studien zur Problematik Akzentimitation mangelt. Studien zur perzeptiven Seite der Imitation von Dialekten oder Akzenten und allgemeine Aussagen derart, dass eine Verstellung durch Akzentimitation leicht aufzudecken sei, weil phonetische Merkmale der Muttersprache beibehalten werden und die Veränderung von Merkmalen inkonsistent und fehlerhaft sei, dominieren den Forschungsbereich. Allerdings konnten Studien wie Torstensson et al. (2004) und Neuhauser (2005, 2008) auch zeigen, dass von Sprechern bei der Imitation fremdsprachiger Akzente vielfältige Variation auf prosodischer und segmenteller Ebene vorgenommen werden. Außerdem scheint es bei den Sprechern eine Übereinstimmung in der Wahrnehmung bestimmter fremdsprachiger Akzente und deren charakteristischen Merkmale zu geben, da die verstellten Produktionen der Sprecher Gemeinsamkeiten aufweisen. Die Diskussion der Ergebnisse von Neuhauser (2005, 2008) zeigte aber auch, dass es noch viele wichtige Ergänzungen und Erweiterungen geben muss, damit genauere und repräsentative Aussagen über die Variationsfähigkeiten und -möglichkeiten von Sprechern bei der Imitation eines fremdsprachigen Akzents getroffen werden können. Hier schließt sich die Notwendigkeit der vorliegenden Arbeit an. Die drei wichtigsten Forschungsziele der vorliegenden Arbeit sind: 1. Vergrößerung der Probandenanzahl im Vergleich zu Neuhauser (2005), um zu valideren Ergebnissen zu gelangen, sowie die Aufnahme authentischer nicht-deutscher Muttersprachler. 2. Eine systematische Untersuchung der Form und Variation bestimmter phonetischer Merkmale im Deutschen gesprochen mit einem vorgetäuschten fremdsprachigen Akzent von deutschen Muttersprachlern und mit einem authentischen Akzent von nicht-deutschen Muttersprachlern. 3. Überprüfung der Authentizität der Verstellungsversuche durch Perzeptionsexperimente und Ermittlung der phonetischen Korrelate von als authentisch empfundenen Akzenten. Durch den Aufbau eines umfangreichen Korpus kann eine Datenbasis geschaffen werden, die eine komplexe Analyse unterschiedlicher Aspekte der Akzentimitation auf verschiedenen Ebenen ermöglicht und die Grundlage für statistische Auswertungen und repräsentative Ergebnisse schafft. Bei der Erstellung eines solchen Korpus sollten v. a. folgende Faktoren Berücksichtigung finden: 1. Muttersprache der Sprecher (deutsche und nicht-deutsche Muttersprachler), 45 2. verschiedene Textsorten (Spontan- und Lesesprache, vorbereitete und nicht vorbereitete Texte, vorgegebene und von Probanden selbst verfasste Texte), 3. verschiedene Aufnahmesitzungen. Wie bereits im vorigen Abschnitt beschrieben, konnte in Neuhauser (2005) ein guter Überblick über verschiedene segmentelle und suprasegmentelle Variationen bei der Imitation zweier fremdsprachiger Akzente durch deutsche Muttersprachler gegeben werden. Dieser Überblick war wichtig und hilfreich für die Einschätzung der Möglichkeiten, die Sprecher bei der Akzentimitation nutzen oder nutzen können. Auf der anderen Seite wäre eine Vertiefung der Analyse wünschenswert gewesen, auch wenn dadurch weniger Parameter untersucht werden können. Im Rahmen der vorliegenden Arbeit soll die auditive und akustische Analyse bestimmter phonetischer Variationen bei der Stimmverstellung durch einen fremdsprachigen Akzent im Vergleich zu Neuhauser (2005) erweitert und vertieft sowie auf eine größere Stichprobe angewandt werden. Eine Befragung der Probanden hinsichtlich bewusst gesteuerter Abweichungen kann helfen, bewusste Variationen von unbewussten besser trennen und die Umsetzbarkeit bewusster Variationen abschätzen zu können. Hauptziel der Analysearbeit ist die Ausarbeitung phonetischer Marker, die zuverlässig auf die Authentizität eines fremdsprachigen Akzents schließen lassen bzw. die die Nicht-Authentizität eines vorgetäuschten Akzents aufdecken. Die Analyse des Sprachmaterials Deutsch sprechender nicht-deutscher Muttersprachler und ein Abgleich mit den Analyseergebnissen der Akzentimitationen der deutschen Muttersprachler kann dabei Aufschluss über die Wirksamkeit bestimmter Verstellungsbemühungen geben. Außerdem muss die aus der Forschungsliteratur abgeleitete Annahme überprüft werden, dass Nicht-Muttersprachler des Deutschen konsistente Abweichungen auf phonetischer Ebene aufweisen. Stellt sich diese Annahme als falsch heraus, kann Inkonsistenz in den Variationen nicht länger als maßgeblicher Indikator für eine vorliegende Stimmverstellung angesehen werden. Über Perzeptionsexperimente kann nicht nur die Authentizität der Akzentimitationen und damit die Leistung der Sprecher überprüft werden, sondern auch die Fähigkeit der Hörer zwischen imitierten und authentischen fremdsprachigen Akzenten zu unterscheiden. Darüber hinaus ist auch von Interesse, was die phonetischen Korrelate eines als authentisch wahrgenommenen fremdsprachigen Akzents sind. Aufgaben zur Identifizierung (Benennung) der gehörten Akzente könnten diese Perzeptionsexperimente noch erweitern und ebenfalls Aufschluss darüber geben, ab wann eine Akzentimitation „erfolgreich“ ist. 46 Teil II. Methodik und Korpus 4. Korpusvorbereitung 4.1. Befragung zur Akzentimitation: Methode Der empirische Teil dieser Arbeit besteht zum Großteil aus Analysen der Produktionen deutscher Muttersprachler bei der Imitation eines fremdsprachigen Akzents. Für die Planung einer solchen Untersuchung stellt sich folgende Frage: Von welchen Akzenten glauben deutsche Muttersprachler, dass sie sie gut imitieren könnten? Ziel bei der Korpuserstellung war, ausreichend Sprecher für die Datenaufnahme zu gewinnen, die möglichst bereit sind, den gleichen fremdsprachigen Akzent zu imitieren. Darüber hinaus wäre es von Vorteil, wenn diese Sprecher auch der Meinung sind, dass sie den jeweiligen Akzent gut imitieren können. Da sich die in der Vorstudie verwendete Methodik bewährt hat, Akzentbefragung und Probandenakquise mithilfe eines Fragebogens miteinander zu verbinden, wurde für die vorliegende Untersuchung ein mit Neuhauser (2005) vergleichbarer Fragebogen entworfen. In diesem wurde erfragt, welche fremdsprachigen Akzente am besten imitiert werden könnten. Obwohl aus forensischer Perspektive von hohem Interesse ist, welche Akzente zur Stimmverstellung bei Straftaten verwendet werden, wurde der forensische Aspekt in der Fragebogenformulierung bewusst ausgeklammert. Grund dafür ist, dass explizit Akzente ermittelt werden sollten, die angeblich gut zu imitieren sind. Stereotype Vorstellungen über bestimmte Akzente sollten das Ergebnis der Befragung nicht beeinflussen. Nach Torstensson (2010) verbinden Hörer bestimmte soziale oder Persönlichkeitseigenschaften mit fremdsprachigen Akzenten. So konnte u. a. gezeigt werden, dass Sprecher mit arabisch-, türkisch- oder serbo-kroatisch-akzentuiertem Schwedisch in Kategorien wie Macht, Solidarität, Kompetenz und Status („power, solidarity, competence, status“) weniger gute Bewertungen erhielten als beispielsweise Sprecher mit amerikanischenglischem Akzent im Schwedischen. Den Teilnehmern der Umfrage wurde mitgeteilt, dass die Befragung Teil einer Untersuchung zur Fähigkeit deutscher Muttersprachler einen fremdsprachigen Akzent zu imitieren ist. Sie sollten aus einer Liste aus vorgegebenen Akzenten den Akzent wählen, den sie am besten imitieren könnten. Es wurden folgende zehn fremdsprachige Akzente in alphabetischer Reihenfolge vorgegeben: amerikanisches Englisch, britisches Englisch, Französisch, Italienisch, Russisch, Schweizerdeutsch, Slawisch (allgemein), Spanisch, Türkisch, Vietnamesisch. Außerdem bestand die Möglichkeit, einen zusätzlichen nicht vorgegebenen Akzent vorzuschlagen. Die Probanden konnten maximal zwei Wahlstimmen vergeben. Daneben wurde auch erfragt, woher die gewählten Akzente bekannt sind und welche Merkmale (z. B. bzgl. Aussprache, Stimmgebung, Wortschatz oder Grammatik) diese Akzente aufweisen. Zudem wurden 49 als Probandendaten neben dem Alter und Geschlecht der Befragten auch ihre regionale Herkunft, Fremdsprachenkenntnisse und entsprechende Auslandsaufenthalte, Studienfächer sowie die Bereitschaft zur Teilnahme am Experiment erfragt. An der Befragung nahmen 121 Personen (60 männlich und 61 weiblich) teil. Der Fragebogen befindet sich im Anhang unter Punkt A.1. Vorteil an einer vorgegebenen Auswahl an Akzenten ist, dass sich die Anzahl derer, die denselben Akzent wählen, erhöht und so größere Gruppen für die späteren Sprachaufnahmen entstehen, da ein Teil der Sprecher des Korpus bereits über diese Befragung gewonnen wurde. Um jedoch einen Listeneffekt durch die Reihenfolge der vorgegebenen Akzente auszuschließen und bisher nicht genannte Akzente nicht unberücksichtigt zu belassen, wurde ein zweiter Fragebogen für eine Kontrollgruppe entworfen, bei dem keine Akzente vorgegeben wurden und die Probanden freie Wahl hatten (vgl. Anhang Punkt A.2). Es wurde eine Kontrollgruppe von 70 Personen (27 männlich und 43 weiblich) durch diesen zweiten Fragebogen erfasst. Die Probanden beider Befragungen (N = 191, davon 87 männlich und 104 weiblich) waren hauptsächlich Studierende der Hochschulen in Jena, Saarbrücken und Marburg sowie Schüler eines Brandenburger Gymnasiums und eines Jenaer Beruflichen Gymnasiums. Das gemittelte Durchschnittsalter in der ersten Befragung war 22,7 Jahre (s = 3,5) und in der Kontrollgruppe 21,9 Jahre (s = 2,8). Das Gesamtdurchschnittsalter aller Befragten beträgt 22,5 Jahre (s = 3,3). 4.2. Befragung zur Akzentimitation: Ergebnisse Die Ergebnisse der Probandenbefragung bezüglich der Akzentwahl waren teilweise überraschend. Während in Neuhauser (2005) der französische und türkische Akzent mit Abstand am häufigsten gewählt wurden, lag in der ersten Befragung dieser Studie (121 Befragte mit je zwei Wahlstimmen) zwar wieder der französische Akzent mit knapp 33 % (72 von 221 abgegebenen Stimmen) an erster Stelle, knapp ein Viertel der Befragten nannte jedoch amerikanischenglischen Akzent als den am besten zu imitierenden, gefolgt vom britischenglischen und russischen Akzent, die mit jeweils 10 % der Stimmen gleichauf liegen. Da die Akzente in alphabetischer Reihenfolge vorgegeben wurden, die Akzente amerikanisches Englisch, britisches Englisch und Französisch also als erstes aufgeführt waren, und diese Akzente auch die meisten Stimmen erhielten, wurde zunächst ein Listeneffekt vermutet. Die Befragung der Kontrollgruppe (70 Befragte mit je zwei Wahlstimmen), bei der keine Akzente vorgegeben wurden, brachte jedoch ein ähnliches Ergebnis. Auch hier liegt der französische Akzent mit 48 von 120 abgegebenen Stimmen (40%) an erster Stelle. Fasst man hier die 50 Tabelle 4.1.: Verteilung der Stimmen auf fremdsprachige Akzente in der ersten Befragung (links) und in der Befragung der Kontrollgruppe (rechts) Befragung 1 Befragung 2 (Kontrollgruppe) Akzent Stimmen Akzent Stimmen Französisch 72 (32,6%) Französisch 48 (40,0%) Amerik. Englisch 55 (24,9%) Englisch (allg.) 22 (18,3%) Brit. Englisch 22 (10,0%) Amerik. Englisch 11 (9,2%) Russisch 22 (10,0%) Russisch 8 (6,7%) Türkisch 18 (8,1%) Italienisch 7 (5,8%) Schweizerdeutsch 11 (5,0%) Türkisch 5 (4,2%) Italienisch 9 (4,1%) Österreichisch 4 (3,3%) Spanisch 4 (1,8%) Spanisch 3 (2,5%) Slawisch (allg.) 4 (1,8%) Brit. Englisch 3 (2,5%) Sonstige 4 (1,8%) Sonstige 9 (7,5%) Stimmen aus der Kontrollgruppe zusammen, die auf „englischen Akzent (allgemein)“, „amerikanisch-englischen“ und „britisch-englischen“ Akzent fallen, so liegt englischer Akzent mit 36 Stimmen (30%) an zweiter Stelle der gewählten Akzente gefolgt vom russischen Akzent. Die Verteilung der Stimmen auf die Akzente in der ersten Befragung (121 Befragte mit je zwei Wahlstimmen) sowie in der Kontrollgruppe (70 Befragte mit je zwei Wahlstimmen) sind in Tabelle 4.1 dargestellt. Dabei wird auch jeweils der prozentuale Anteil angegeben. Zusammenfassend kann festgehalten werden, dass die befragten deutschen Muttersprachler glauben, einen französischen oder englischen Akzent am besten imitieren zu können. Abbildung 4.1 zeigt die Verteilung der Stimmen auf die unterschiedlichen Akzente als zusammengefasstes Ergebnis beider Probandenbefragungen. Die Ergebnisse unterstützen zum Teil die Ergebnisse aus der Befragung in Neuhauser (2005): Französischer Akzent ist in allen Befragungen nach einem fremdsprachigen Akzent, der (am besten) imitiert werden kann, der am häufigsten genannte. Die Unterschiede zu den Ergebnissen aus Neuhauser (2005) können nicht zweifelsfrei erklärt werden. Zwar wurde auch in Neuhauser (2005) versucht, den forensischen Hintergrund der Befragung nicht offenzulegen, es kann jedoch nicht ausgeschlossen werden, dass einigen der Befragten doch das Ziel der Untersuchung bekannt war oder es durch Formulierungen und zusätzliche Erklärungen während der Befragung erahnt werden konnte. Durch einen schriftlichen Fragebogen mit expliziter Nennung des angeblichen Ziels der Untersuchung sowie einer genauen Beschreibung der Aufgabenstellung, konnte diese Problematik nahezu ausgeschlossen werden. Außerdem wurde in der Vorstudie nur gefragt, welche Akzente „eventuell“ und nicht welche „am bes- 51 0 20 40 60 80 100 120 Slaw. Oesterr. Span. Schweizdt. Ital. Tuerk. Russ. Engl. Franz. Anzahl der Stimmen Akzente 120 (36,4%) 113 (34,2%) 30 (9,1%) 23 (7,0%) 16 (4,8%) 13 (3,9%) 7 (2,1%) 4 (1,2%) 4 (1,2%) Abbildung 4.1.: Gesamtverteilung der Stimmen auf die Akzente ten“ imitiert werden könnten. Dies kann dahingehend ausschlaggebend sein, dass eine sehr allgemeine stereotypische Vorstellung von einem Akzent zwar existiert, sich die Befragten jedoch nicht zutrauen würden, diesen Akzent tatsächlich zu produzieren. Diese Vermutung wird dadurch gestützt, dass sich aus der Gruppe, die türkischen oder russischen Akzent wählten, nur wenige Personen bereit erklärten, an dem Experiment teilzunehmen. Eine weitere Erklärung für die abweichenden Ergebnisse wäre, dass sich die Frequenz des Auftretens verschiedener Akzente in den Medien verändert hat und im Sommer 2004, als die Befragung der Vorstudie durchgeführt wurde, türkischer Akzent besonders häufig vorkam, während ca. zwei Jahre später dies nicht mehr der Fall war und englischer Akzent dominierte. Durch die Verteilung der Fragebögen an mehreren Universitäten und Schulen innerhalb Deutschlands konnte für die vorliegende Untersuchung eine Teilnehmeranzahl erreicht werden, die statistisch belastbare Ergebnisse ermöglicht, und ein potenzieller Peer-Group-Effekt ausgeschlossen werden. 52 5. Korpusbeschreibung 5.1. Sprecher Die Sprecher für die Untersuchung wurden durch die oben beschriebenen Befragungen, durch Aushänge an der Universität Jena und zum Teil auch aus der Sprechergruppe aus Neuhauser (2005) gewonnen. Insgesamt wurden 52 Sprecher aufgenommen, die sich in drei große Sprechergruppen und mehrere Untergruppen aufteilen lassen. 1. 35 deutsche Muttersprachler (22 weiblich, 14 männlich) 2. 16 nicht-deutsche Muttersprachler, davon: a) 14 nicht-deutsche Muttersprachler, die alle fließend Deutsch sprechen und keine Schwierigkeiten haben, den Text zu lesen. Dennoch ist bei allen Sprechern ein erkennbarer nicht-muttersprachlicher Akzent vorhanden. • Vier französische Muttersprachler (je zwei männlich und weiblich), • acht amerikanisch-englische Muttersprachler (je vier männlich und weiblich), • ein russischer Muttersprachler und eine tschechische Muttersprachlerin. b) Zwei Sprecher ohne oder mit sehr geringen Deutschkenntnissen, die die Texte vorlasen, aber bei denen kein oder ein sehr geringes Textverständnis vorhanden war. • Ein amerikanisch-englischer Muttersprachler (männlich), • ein italienischer Muttersprachler (männlich). 3. Ein bilingualer Sprecher (russisch-deutsch), der in beiden Sprachen keinen fremdsprachigen Akzent aufweist. Dies wurde einerseits durch die Selbstaussage des Probanden und andererseits durch eine eigene auditive Analyse (für das Deutsche) und die Einschätzung eines russischen Muttersprachlers (für das Russische) ermittelt. Von den 35 deutschen Muttersprachlern befanden sich zur Zeit der Aufnahmen sechs Personen im Hauptstudium des Magisternebenfaches Sprechwissenschaft / Phonetik an der Universität Jena oder hatten dieses gerade abgeschlossen, und weisen aufgrund ihres Studiums phonetische Kenntnisse auf, die sie für Akzentimitationen nutzen könnten. Die übrigen Sprecher sind keine Studierenden 53 AE-nm01 Akzent: AE - Amerikanisches Englisch F - Französisch R - Russisch T - Türkisch Angabe zur Muttersprache: leer - deutsch -n - Muttersprachler -biling - bilingual Geschlecht: f - weiblich m - männlich Probanden-Nr.: 01, 02, ..., 15 Abbildung 5.1.: Zusammensetzung der Probandenbezeichnung des Faches oder befanden sich zum Zeitpunkt der Aufnahme noch im Grundstudium und haben Grundlagenwissen oder keine Kenntnisse im Bereich Phonetik. Der Altersdurchschnitt liegt in dieser Gruppe bei 23,8 Jahren (s = 2,9). Der Altersdurchschnitt der nicht-deutschen Muttersprachler liegt bei 23 Jahren (s = 2,6). Ein ausgeglichenes Geschlechterverhältnis wurde in allen Gruppen angestrebt, konnte jedoch für die Gruppe der deutschen Muttersprachler nicht erreicht werden, da die Mehrheit der Sprecher aus dem Fach Germanistik oder anderen Neuphilologien stammt, in denen der Frauenanteil überwiegt. Die Probanden werden im Folgenden durch eine Buchstaben-Zahlen- Kombination bezeichnet. Am Anfang steht ein Kürzel für den gesprochenen bzw. imitierten Akzent (AE - amerikanisch-englisch, F - französisch, R - russisch, T - türkisch, ...), dem im Fall, dass es sich bei dem Sprecher um einen Muttersprachler des Akzents handelt, ein -nfolgt. Danach folgt eine Angabe zum Geschlecht des Sprechers (f für weiblich, m für männlich) sowie eine Probandennummer (01 bis 15). Abbildung 5.1 stellt die Zusammensetzung der Probandenbezeichnung dar. 5.2. Akzente Aufgrund der Ergebnisse aus der oben beschriebenen Befragung im Vorfeld der Korpuserstellung lag der Fokus auf Aufnahmen von Imitationen eines französischen oder eines amerikanisch-englischen Akzents. Es wurden Imitationen folgender fremdsprachiger Akzente durch deutsche Muttersprachler aufgenommen: • Französischer Akzent: 22 Sprecher (15 weiblich, 7 männlich) 54 • Amerikanisch-englischer Akzent: 11 Sprecher (5 weiblich, 6 männlich) • Russischer Akzent: 2 Sprecher (je 1 weiblich und männlich) • Türkischer Akzent: 1 Sprecherin Ein deutscher Muttersprachler imitierte sowohl französischen als auch amerikanisch-englischen Akzent. Dieser Sprecher ist demnach in beiden Gruppen vertreten (AEm01, Fm04), was zu einem Unterschied in der Anzahl der Sprecher in der Gesamtgruppe verglichen mit der aufaddierten Anzahl der Sprecher in den Einzelgruppen führt. 5.3. Texte Alle Probanden haben ca. eine Woche vor der ersten Aufnahme zwei Texte im Umfang von 237 und 217 Wörtern sowie eine Aufgabenstellung zum Verfassen eines eigenen Textes zugeschickt bekommen. Diese Aufgabenstellung beinhaltete eine Reihe von Wörtern oder Wortgruppen, die in dem selbst verfassten Text vorkommen sollten und bei einer Analyse als Vergleichsbasis dienen können. Aufgabe für die deutschen Muttersprachler war, die Texte so vorzubereiten, dass sie ihn mit dem von ihnen gewählten fremdsprachigen Akzent vorlesen konnten. Der selbst verfasste Text sollte außerdem nicht nur in der Aussprache, sondern auch in der Grammatik und / oder Lexik verändert sein. Es war den Probanden freigestellt, die Texte vor den Aufnahmen zu üben, da davon auszugehen ist, dass auch in der forensischen Praxis ein möglicher Täter seinen Text oder seine Nachricht proben würde, wenn er zur Tarnung der eigenen Identität eine Verstellung nutzen will. Zu den zwei vorgegebenen und dem selbst verfassten Text bekamen alle Probanden während der ersten Aufnahmesitzung einen ihnen unbekannten Text 1 im Umfang von 116 Wörtern. Diesen konnten sie sich vor der Aufnahme durchlesen bis sie sich bereit fühlten, den Text ohne Probleme laut vorzulesen. Die nicht-deutschen Muttersprachler erhielten zusätzlich einen kurzen Text in ihrer Muttersprache (mehr dazu unter Punkt 5.4.2). Die Texte sowie Aufgabenstellung zum Verfassen des eigenen Textes befinden sich im Anhang C. 1 Dieser neue Text entspricht dem vorgegebenen Text aus Neuhauser (2005). Die Probanden, die bereits an der Untersuchung teilgenommen hatten, kannten den Text zwar bereits aus den damaligen Aufnahmen, es ist jedoch nicht davon auszugehen, dass sie sich an diesen Text erinnern konnten, da die Aufnahmen bereits zwei Jahre zurücklagen. 55 5.4. Sprachaufnahmen Die Sprachaufnahmen erfolgten in einem schallgedämpften Raum über ein Sprachmikrofon (SHURE SM48 Dynamic LOZ 55-14.000 Hz) und wurden mit dem Programm CSL (Computerized Speech Lab) mit einer Abtastfrequenz von 16.000 Hz und 16 Bit Amplitudenauflösung unkomprimiert digitalisiert. Der Abstand zum Mikrofon betrug ungefähr 40 cm. Damit entsprechen die Aufnahmebedingungen denen aus Neuhauser (2005). Für jeden Probanden wurden insgesamt zwei Aufnahmesitzungen im Abstand von ungefähr zwei Wochen durchgeführt. Die Sprachaufnahmen dauerten jeweils ca. 15 Minuten. Nach der zweiten Aufnahmesitzung erhielten die Probanden eine kleine Aufwandsentschädigung, z. B. Süßigkeiten oder eine Flasche Wein. 5.4.1. Sprachaufnahmen für deutsche Muttersprachler Erste Aufnahme Die Probanden wurden unmittelbar vor der ersten Aufnahme über den forensischen Hintergrund der Untersuchung aufgeklärt. Im Anschluss daran wurde eine Befragung der Sprecher durchgeführt. Der Fragebogen (siehe Anhang B) bestand einerseits aus persönlichen Angaben (wie Alter, Geschlecht, Muttersprache, regionale Herkunft, Studienfächer, erlernte Fremdsprachen und längere Auslandsaufenthalte, Kontakt zu Nicht-Muttersprachlern des Deutschen, Angaben zu möglichen Stimm- Sprachund/ oder Sprechstörungen sowie Höreinschränkungen), und andererseits aus Fragen zum imitierten Akzent bzw. zur Imitation. Letzteres wurde erst nach der Aufnahme erfragt (Merkmale des Akzents, Selbsteinschätzung zur Authentizität des Akzents und zur Unterscheidungsfähigkeit zwischen echten und imitierten Akzenten). Im Anschluss an die Befragung wurden die Probanden gebeten, die Texte so vorzulesen, dass ein Hörer glauben soll, sie wären französische, amerikanischenglische, russische oder türkische Muttersprachler. Die Reihenfolge der Texte bei der ersten Aufnahme war: 1. Text 2 mit Akzent gesprochen, 2. Text 3 mit Akzent gesprochen, 3. selbst verfasster Text mit Akzent gesprochen, 4. Text 1 (unbekannter Text) mit Akzent gesprochen, 5. Text 1 ohne Akzent gesprochen, 6. Text 3 ohne Akzent gesprochen. 56 Nachdem ein Text vorgelesen wurde, wurde die Aufnahme jeweils gestoppt und die Datei abgespeichert. Die Texte 1 und 3 wurden zusätzlich auch ohne Akzent gesprochen aufgenommen, um eine unverstellte Vergleichsbasis für die Analyse zu haben. Die Probanden erhielten den Hinweis, so natürlich wie möglich und in ihrem alltäglichen Deutsch zu sprechen, d. h. nicht zu versuchen, zwingend Standarddeutsch oder „besonders schön“ zu sprechen. Der selbst verfasste Text und Text 1 wurden nach der Aufnahme einbehalten. Die Probanden wurden darauf hingewiesen, dass sie die Texte 2 und 3 in den zwei Wochen Abstand bis zur zweiten Aufnahmesitzung üben dürfen. Zweite Aufnahme Der Ablauf der zweiten Aufnahmesitzung entspricht ungefähr dem der ersten Sitzung. Zusätzlich wurde jedoch noch ein Stück Spontansprache aufgenommen, das ebenfalls mit Stimmverstellung durch den gewählten Akzent gesprochen wurde. Die Probanden sollten dafür ca. 90 Sekunden etwas über sich oder eine fiktive Person erzählen (Name, Herkunft, Studienfächer, etwas zu Jena als Studienort) und zusätzlich, falls noch nicht genügend Sprachmaterial vorhanden war, ohne Hilfestellung einen Weg beschreiben. Die Reihenfolge der vorzulesenden Texte bei der zweiten Aufnahme war: 1. Text 2 mit Akzent gesprochen, 2. Text 3 mit Akzent gesprochen, 3. selbst verfasster Text mit Akzent gesprochen, 4. Text 1 mit Akzent gesprochen, 5. Spontansprache mit Akzent gesprochen, 6. Text 1 ohne Akzent gesprochen. In beiden Aufnahmesitzungen wurden insgesamt zwölf Texte pro deutschen Muttersprachler aufgenommen, davon wurden neun Texte mit Stimmverstellung gesprochen. 5.4.2. Sprachaufnahmen für nicht-deutsche Muttersprachler Die Aufnahmebedingungen für Nicht-Muttersprachler des Deutschen entsprechen den oben geschilderten. Sie haben die gleichen Texte wie deutsche Muttersprachler gelesen, die sie ebenfalls ca. eine Woche vor der ersten Aufnahme zugeschickt bekamen. Die vorgegebenen Wörter und Wortgruppen bei der Aufgabenstellung zum Verfassen eines eigenen Textes entsprechen denen der deutschen Muttersprachler. Es wurde darum gebeten, den Text ohne Hilfe durch 57 deutsche Muttersprachler zu schreiben. Alle Probanden bestätigten, dass sie den Text ohne Hilfe geschrieben haben, oder haben ihn direkt im phonetischen Labor unmittelbar vor der Aufnahme geschrieben. Zusätzlich sollten die Nicht-Muttersprachler des Deutschen einen kurzen Text in ihrer Muttersprache vorlesen, den zuvor einer der jeweiligen Probanden vom Deutschen in die entsprechende Sprache übersetzt hat (Text 4). Die Aufgabenstellung für Nicht- Muttersprachler sowie der Text 4 sind im Anhang unter Punkt C zu finden. Die Reihenfolge der vorzulesenden Texte für Nicht-Muttersprachler des Deutschen war: Erste Aufnahme: 1. Text 2, 2. Text 3, 3. selbst verfasster Text, 4. Text 1, 5. Text 4. Zweite Aufnahme: 1. Text 2, 2. Text 3, 3. selbst verfasster Text, 4. Text 1, 5. Spontansprache. Es ergeben sich pro Sprecher für beide Aufnahmen insgesamt zehn Texte. Von den Sprechern Tsch-nf01 und I-nm01 wurden nur vier Texte (Text 1-4) und von Sprecher AE-nm03 wurden nur 2 Texte (Text 1 und 4) aufgenommen. Die Sprecher AE-nf01 bis AE-nf04 sowie AE-nm04 und AE-nm05 wurden erst etwa zwei Jahre nach der Erstellung des Korpus aufgenommen. Diese Aufnahmen erfolgten im Rahmen einer Magisterarbeit über den Erwerb der Fremdsprache Deutsch aus Sicht amerikanisch-englischer Lerner (Hellmann, 2008). Die verwendete Methodik wurde der Experimentleiterin vor den Aufnahmen detailliert beschrieben und sie bestätigt, dass die Aufnahmebedingungen den oben geschilderten entsprechen. 5.4.3. Übungsaufwand Es war den Probanden dieser Studie freigestellt ob, wie stark und mit welchen Mitteln sie sich auf das Experiment vorbereiten und die Imitationen im Vorfeld üben. Über intraindividuelle Vergleiche konnten Torstensson et al. (2004) zeigen, dass Sprecher ihre Akzentimitation durch Anhören einer Aufnahme eines authentischen britisch-englischen Muttersprachlers im Schwedischen „verbessern“ konnten. Aus diesem Grund kann der jeweilige Übungsaufwand der Sprecher von Interesse sein. Nach Abschluss beider Aufnahmen wurden die deutschen Muttersprachler befragt, ob sie sich auf die Aufnahmen vorbereitet und die Texte mit der Imitation 58 eines Akzents geübt haben. Für diese Befragung wurde ein Fragebogen verwendet, in dem die Probanden ihren Aufwand für die Vorbereitung an einer sechsstufigen Skala selbst einschätzen sollten. Folgende Antwortmöglichkeiten standen zur Verfügung: 1. Keine Vorbereitung. 2. Kurz durchgelesen. 3. Mehrmals durchgelesen. 4. Einmal laut vorgelesen. 5. Mehrmals laut vorgelesen. 6. Sehr gute Vorbereitung, z.B. durch ... Die Probanden sollten diese Einschätzung getrennt für beide Aufnahmesitzungen treffen und konnten die Punkte 3 und 5 durch eine Nennung der Anzahl der Wiederholungen ergänzen, sowie bei Punkt 6 weitere Ergänzungen hinzufügen. Denkbar wäre hier z. B. sich Tipps von einem nicht-deutschen Muttersprachler geben lassen oder Aufnahmen bzw. Filme mit nicht-deutschen Muttersprachler anhören bzw. ansehen. Der verwendete Fragebogen inklusive Erläuterungen und Ergänzungen befindet sich im Anhang B.2. Die Befragung zum Übungsaufwand wurde nur für die deutschen Muttersprachler, die französischen oder amerikanisch-englischen Akzent imitieren, ausgewertet. Die Mehrheit dieser Probanden (30 von 33) gaben an, sich auf die erste Aufnahmesitzung vorbereitet zu haben. Dabei waren „kurz durchgelesen“, „einmal laut vorgelesen“ und „mehrmals laut vorgelesen“ die am häufigsten angegebenen Kategorien. Die meisten Sprecher verringerten ihren Angaben nach den Übungsaufwand für die zweite Aufnahmesitzung - nur sechs von 33 Sprechern behielten den Vorbereitungsaufwand (d. h. mindestens „kurzes Durchlesen“) bei. Die Mehrheit der Sprecher (20 von 33) bereiteten sich auf die zweite Sitzung nicht vor. Keiner der Probanden gab an, sich besonders intensiv auf eine oder beide Aufnahmen vorbereitet zu haben. Nur vier Sprecher bereiteten sich auf beide Aufnahmesitzungen durch lautes oder mehrmaliges lautes Vorlesen vor: AEf02, Ff13, Ff02 und Ff10. 5.5. Korpusgruppe: Französischer Akzent In einem Großteil dieser Arbeit liegt der Fokus auf imitiertem und authentischem französischen Akzent. So wurde von den aufgenommenen Akzenten nur französischer Akzent bei der phonetischen Analyse der Akzentproduktionen berücksichtigt. Zum einen wurde er in der unter Kapitel 4 beschriebenen Befragung am häufigsten als der Akzent, der am besten zu imitieren sei, gewählt. Zum anderen erklärten sich aus der Gruppe der Befragten sowie aus den über andere Wege gewonnenen Teilnehmern die meisten Personen bereit, französischen Akzent zu imitieren. Der Hauptgrund für die Konzentration auf 59 französischen Akzent liegt also in der vergleichsweise höchsten Anzahl an aufgenommenen deutschen Muttersprachlern, die diesen Akzent imitieren. Zu Beginn der Untersuchung standen außerdem mehr französische als amerikanischenglische Muttersprachler zur Verfügung. Dies änderte sich erst zu einem späteren Zeitpunkt mit den Aufnahmen aus Hellmann (2008). Im Folgenden wird die Gruppe der deutschen Muttersprachler, die französischen Akzent imitieren, sowie die der französischen Muttersprachler genauer beschrieben. 5.5.1. Deutsche Muttersprachler Alter und regionale Herkunft Der Altersdurchschnitt der 22 deutschen Muttersprachler, die französischen Akzent imitieren, liegt bei 23,5 Jahren (s = 2,6). Keiner der Probanden gab an, eine ihm oder ihr bekannte Stimmstörung zu haben. Nur die Sprecher Ff08 und Fm03 berichten, dass sie um eine leichte Beeinträchtigung ihres Hörvermögens wissen, die aus ihrer Sicht im Alltag jedoch nicht bemerkbar ist. Die Mehrheit der Sprecher (13 von 22) stammt aus dem östlichen Thüringen oder aus Sachsen. Die anderen Sprecher verteilen sich auf die Regionen Westbis Mittelthüringen, Sachsen-Anhalt, Franken (Südthüringen und Bayern), Hessen, Berlin und die Pfalz. Fremdsprachen Alle 22 Sprecher haben Englisch als erste Fremdsprache erlernt und geben an, Englisch mindestens auf einem fortgeschrittenen Niveau oder fließend zu sprechen. 18 der 22 Sprecher geben Französisch als weitere (meist zweite) erlernte Fremdsprache an, in der sie über mindestens Basiskenntnisse verfügen. Zwei Sprecher geben an, Französisch auf einem fortgeschrittenen Niveau zu sprechen. Vier Sprecher haben einen längeren Auslandsaufenthalt in Frankreich oder einem französisch-sprachigen Land verbracht und geben an, Französisch fließend zu sprechen: Ff12 und Fm04 haben während ihres Studiums jeweils ca. ein halbes Jahr in Frankreich verbracht, Ff04 und Ff06 haben jeweils ein Jahr in Frankreich bzw. im französisch-sprachigen Kanada (Quebeck) gelebt. Fm04 ist der einzige Proband, der Romanistik mit Schwerpunkt Französisch studiert hat. Zum Zeitpunkt der Aufnahme hatte er sein Studium bereits beendet. Weitere genannte Fremdsprachen sind Spanisch (3 Personen), Russisch (2 Personen), Schwedisch, Griechisch und Tschechisch (je eine Person), in denen in der Regel nur Basiskenntnisse vorliegen. 60 Französischer Akzent im Deutschen Auf die Frage, woher ihnen französischer Akzent bekannt sei, gaben 19 Personen „Medien“ an, die damit die am häufigsten genannte Quelle sind. Sieben Personen gaben an französischen Akzent im Deutschen von „Freunden oder Bekannten“ zu kennen, wobei keiner der Befragten zum Zeitpunkt der Befragung regelmäßigen Kontakt zu französischen Muttersprachlern hatte. Im Anschluss an die erste Aufnahmesitzung wurden die Probanden befragt, welche Merkmale sie als charakteristisch für einen französischen Akzent halten. Die Probanden sollten ohne Vorgaben mögliche Eigenschaften des Akzents nennen. Diese wurden auf dem jeweiligen Fragebogen eines jeden Sprechers notiert. Die Angaben der Probanden wurden sorgsam und soweit es möglich war interpretiert und für diese Ausführungen in phonetisch-phonologischen Termini beschrieben. Zum Teil wurden aber bewusst die deskriptiven Formulierungen der Probanden beibehalten. Die von den Probanden am häufigsten genannten Merkmale eines französischen Akzents im Deutschen sind 2 : • keine oder schwächere Realisierung von / h/ oder Probleme bei der Realisierung (17) • vorderes Allophon von / x/ ( [ç] ) wird als [ S ] realisiert oder häufiges Auftreten von [ S ] (13) • klingt „weich“ oder „melodisch“ (8) • veränderter Wortakzent (8) • veränderte Realisierung von / r/ , z. B. frikativisch, gerollt oder aspiriert (5) • Verwendung von hohen vorderen gerundeten Vokalen ( [y: , Y] ) statt / u: , U/ (5) • mehr (oder „andere“) Nasalität (3) • „weichere“ oder mehr stimmhafte Konsonanten bzw. weniger Fortis- Konsonanten (3) • veränderte Realisierung von / @/ , z. B. als gerundet als [œ] (3) Auf nicht-phonetischer Ebene wurden „Probleme mit Satzbau“ (5 Nennungen) und „falsche Artikelwahl oder Fehler beim Genus“ (3 Nennungen) am häufigsten als charakteristische Merkmale eines französischen Akzents angegeben. Bei Letzterem meinten zwei von drei Befragten, dass meistens Femininum verwendet würde 3 . 2 In Klammern steht die Anzahl der Personen, die das jeweilige Merkmal genannt haben. 3 Eine Tendenz zur verstärkten Verwendung des Femininums wurde auch in Neuhauser (2005, 2008) für die französischen Akzentimitationen gefunden. Eine mögliche Erklärung für diese Präferenz ist, dass das Femininum aufgrund der Formgleichheit femininer Nomen und Pluralformen bei der Flexion von Pronomen und definiten Artikeln morphologisch unauffällig ist (vgl. Bittner, 2002). 61 Übungsaufwand Der von den deutschen Muttersprachlern aufgewendete Übungsaufwand zur Vorbereitung auf die Aufnahmen entspricht dem unter Punkt 5.4.3 geschilderten für die Gesamtgruppe der deutschen Muttersprachler, die französischen und amerikanisch-englischen Akzent imitieren. Das heißt, dass sich die Mehrheit der Sprecher durch kurzes Durchlesen der Texte oder durch mehrmaliges lautes Vorlesen der Texte auf die erste Aufnahme vorbereitet hat. Auf die zweite Aufnahme hat sich die Mehrheit der Sprecher jedoch nicht noch einmal vorbereitet oder die Texte nur kurz durchgelesen. Selbsteinschätzung zur Authentizität Die Probanden sollten im Anschluss an die erste Aufnahmesitzung einschätzen, ob ihre Imitation eines französischen Akzents „authentisch klingt“. Dazu wurde eine vierstufige Skala vorgegeben: (1) Ja, sicher. (2) Ja, wahrscheinlich. (3) Nein, wahrscheinlich nicht. (4) Nein, sicher nicht. Etwas mehr als die Hälfte der Sprecher (13 von 22) schätzte den eigenen produzierten französischen Akzent als wahrscheinlich nicht authentisch (Stufe 3) ein und neun Sprecher gehen davon aus, dass der produzierte Akzent wahrscheinlich authentisch klingt (Stufe 2). Keiner der Sprecher gab an, dass sein Akzent sicher authentisch klingt (Stufe 1), aber auch kein Sprecher war der Meinung, dass sein Akzent sicher nicht authentisch klingt (Stufe 4). Außerdem sollten die Probanden ebenfalls im Anschluss an die erste Aufnahmesitzung einschätzen, ob sie einen imitierten von einem authentischen französischen Akzent unterscheiden könnten. Dazu wurde wieder eine vierstufige Skala vorgegeben: (1) Ja, sicher. (2) Ja, wahrscheinlich. (3) Nein, wahrscheinlich nicht. (4) Nein, sicher nicht. Die deutliche Mehrheit der Sprecher (18 von 22) glaubt, diese Unterscheidung wahrscheinlich treffen zu können (Stufe 2) und zwei Sprecher sind sich sogar sicher (Stufe 1), einen imitierten von einem authentischen Akzent unterscheiden zu können. Nur zwei Sprecher glauben, diese Unterscheidung wahrscheinlich nicht (Stufe 3) treffen zu können, aber keiner der Sprecher denkt, dass er oder sie es sicher nicht unterscheiden könnte. Eine Übersicht über die Häufigkeitsverteilung in der Befragung zur Selbsteinschätzung gibt Abbildung 5.2. Links in der Abbildung sind die Ergebnisse zur Einschätzung der Authentizität des eigenen imitierten französischen Akzents dargestellt. Rechts sind die Ergebnisse zur persönlichen Einschätzung, ob imitierte und authentische französische Akzente voneinander unterschieden werden können, abgebildet. 62 Abbildung 5.2.: Selbsteinschätzung der deutschen Muttersprachler zur Authentizität ihrer produzierten französischen Akzente (links) und zur Fähigkeit, imitierte von authentischen französischen Akzenten zu unterscheiden (rechts) 5.5.2. Französische Muttersprachler Alter und regionale Herkunft Die vier französischen Muttersprachler haben einen Altersdurchschnitt von 21,5 Jahren (s = 2,1). Bekannte Stimmstörungen oder Beeinträchtigungen des Hörvermögens liegen laut der Angaben der Probanden nicht vor. Die Sprecher stammen aus unterschiedlichen Teilen Frankreichs: Die Sprecher F-nf01 und F-nm01 stammen aus dem Raum Nevers bzw. Paris in der Mitte Frankreichs, F-nm02 aus der Bretagne und F-nf02 aus der Nähe von Straßburg im Elsass. Abbildung 5.3 zeigt zur besseren Orientierung eine Karte Frankreichs mit den betreffenden Regionen, aus denen die Sprecher stammen. Fremdsprachen Die aufgenommenen französischen Muttersprachler geben alle Deutsch als erste erlernte Fremdsprache und Englisch als ihre zweite Fremdsprache an. F-nf01 und F-nm01 haben außerdem Basiskenntnisse in Spanisch und F-nf02 Basiskenntnisse in Russisch. Sprecherin F-nf02 stammt aus dem Elsass und gibt Französisch als ihre Muttersprache und den Elsässischen Dialekt als Zweitsprache an. Deutsch bezeichnet sie als Fremdsprache, die sie ab Klassenstufe 6 erlernt hat. 63 Abbildung 5.3.: Regionale Herkunft der französischen Muttersprachler (Karte modifiziert nach Wikimedia Commons) Die Sprecherinnen F-nf01 und F-nf02 lebten zum Zeitpunkt der Aufnahme seit ca. 1,5 Jahren in Jena und die Sprecher F-nm01 und F-nm02 seit etwa vier bzw. acht Monaten. Nur Sprecher F-nm01 verbrachte bereits davor schon einmal einen längeren Aufenthalt im deutschsprachigen Raum und lebte für ein Semester in Wien. F-nf02 und F-nm02 besuchten in Frankreich Schulen, in denen sie ein deutsch-französisches Abitur ablegten. Keiner der Sprecher studierte in Frankreich oder in Deutschland ein germanistisches oder linguistisches Fach. Alle Sprecher gaben an, während ihres Aufenthaltes in Jena weiterhin regelmäßigen Kontakt zu französischen Muttersprachlern zu pflegen. Die französischen Muttersprachler unterscheiden sich hinsichtlich ihres Kompetenzniveaus im Deutschen. Nach meiner Einschätzung bewegen sich die Sprecher F-nf01 und F-nm02 zum Zeitpunkt der Aufnahmen innerhalb der Niveaustufen B2 - C1 des gemeinsamen europäischen Referenzrahmens für Sprachen 4 . Sprecherin F-nf02 ist etwa in Stufe C2 und Sprecher F-nm01 etwa in Stufe B1 einzuordnen. Diese Einschätzung beruht auf einer auditiven Beurteilung der Aufnahmen des spontansprachlichen Materials sowie des selbstverfassten Textes, wurde jedoch nicht mit einem standardisierten Testverfahren überprüft oder durch ein anerkanntes Zertifikat nachgewiesen. 4 Der gemeinsame europäische Referenzrahmen für Sprachen „definiert [u. a. ] international vergleichbare Kompetenzniveaus [und] enthält objektive Kriterien für die Beschreibung von Sprachkompetenzen“ (vgl. Goethe-Institut, 2010). 64 Grad des fremdsprachigen Akzents im Deutschen Trotz zum Teil hoher Kompetenzen in den Bereichen Grammatik und Lexik, die vor allem bei den Sprechern F-nf02 und F-nm02 zu nahezu fehlerfreien deutschen Textproduktionen führen, sind auf phonetischer Ebene Normabweichungen feststellbar, die zum Eindruck eines fremdsprachigen Akzents beitragen. Zum besseren Vergleich der Sprecher untereinander sowie zur Einstufung des Grades des fremdsprachigen Akzents wurde ein Perzeptionsexperiment durchgeführt. Methodisch wurde sich dabei an den foreign accent ratings von Flege et al. (1995) bzw. Piske et al. (2001) orientiert, d. h. Hörer sollten anhand einer 9-stufigen Skala die wahrgenommene Stärke des fremdsprachigen Akzents beurteilen. Methode: Als Stimulus wurde der folgende aus Text 2 stammende Satz verwendet: Die verstärkten Sicherheitsvorkehrungen der Banken könnten Räuber abgeschreckt haben. Dieser Satz ist verhältnismäßig kurz und daher für Hörexperimente hinsichtlich der Experimentdauer gut geeignet. Gleichzeitig enthält dieser Satz bestimmte Muster, die durch Interferenzerscheinungen zu fehlerhaften Produktionen seitens nicht-deutscher Muttersprachler führen können (z. B. vorderes Allophon von / x/ , postvokalisches und initiales / r/ , / h/ , Vokaljunkturen, Endsilben / -@n/ , velarer Nasal [N] , stimmlose Fortis-Plosive). Der Stimulus-Satz wurde von zehn Sprechern gesprochen: Neben den vier französischen Muttersprachlern, um deren Stärke des Akzents es v. a. geht, wurde der Satz auch von vier deutschen Muttersprachlern (je zwei weiblich und männlich), einem russischen Muttersprachler (R-nm01) und einer tschechischen Muttersprachlerin (Tsch-nf01) gesprochen. Die Aufnahmen des Stimulus-Satzes für die nicht-deutschen Muttersprachler (vier französische, ein russischer und eine tschechische Muttersprachler/ in) stammen aus den Aufnahmen des Gesamtkorpus. Die Stimulus-Sätze der deutschen Muttersprachler stammen nicht aus dem Korpus, sondern wurden getrennt aufgenommen. Die Sprachaufnahmen erfolgten in einem schallgedämpften Raum über ein Kondensatormikrofon (AKG C1000S) und wurden über einen Mikrofon-Vorverstärker (Vivanco MA 222) mit Wavesurfer (Sjölander und Beskow, 2005) bei einer Abtastfrequenz von 16.000 Hz und 16 Bit Amplitudenauflösung unkomprimiert aufgenommen. Der Abstand zum Mikrofon betrug ungefähr 40 cm. Der Satz wurde nicht isoliert eingesprochen, sondern war in den gleichen Kontext wie in den Korpusaufnahmen eingebettet. Damit entsprechen die Aufnahmebedingungen den oben geschilderten für das Gesamtkorpus. Die Sprecher haben einen Altersdurchschnitt von 23 Jahren (Standardabweichung = 2,3). Die vier deutschen Muttersprachler stammen alle aus Thüringen (Jena, Nordhausen und Eisenach). Die französischen Muttersprachler wurden oben beschrieben. Die Sprecher R-nm01 und Tsch-nf01 haben Deutsch in der Schule gelernt und leben und studieren beide seit einigen Jahren in Jena. 65 Die Hörer des Perzeptionsexperiments waren zwölf deutsche Muttersprachler (sieben weiblich und fünf männlich) mit einem Altersdurchschnitt von 29,8 Jahren (s = 5,7). Die jüngste Hörerin ist 21 und der älteste Hörer ist 38 Jahre alt. Nur eine Hörerin berichtet von einer leichten Beeinträchtigung ihres Hörvermögens, die jedoch laut ihrer Aussage im Alltag nicht bemerkbar ist. Alle Hörer gaben an, mindestens über Grundkenntnisse in der Fremdsprache Englisch zu verfügen, die meisten Sprecher haben außerdem noch mindestens eine weitere Fremdsprache erlernt. Acht Hörer stammen aus Mittel- oder Ostthüringen, zwei Hörer aus Sachsen und jeweils ein Hörer aus Berlin und Hamburg und haben dort die meiste Zeit ihrer Kindheit und Jugend verbracht. Bis auf zwei Hörer haben alle Hörer Germanistik oder Germanistische Sprachwissenschaft studiert bzw. befinden sich kurz vor ihrem Studienabschluss und sollten daher über phonetische Grundkenntnisse oder zumindest ein erhöhtes Sprachbewusstsein verfügen. Keiner der Hörer verfügt über vertiefte Phonetikkenntnisse oder würde sich als phonetisch trainiert bezeichnen 5 . Die Hörer wurden im Vorfeld des Hörexperiments darüber informiert, dass sie eine Reihe deutscher und nicht-deutscher Muttersprachler hören würden und auf einem Fragebogen die wahrgenommene Stärke des fremdsprachigen Akzents anhand einer Skala von 1 - kein fremdsprachiger Akzent bis 9 - starker fremdsprachiger Akzent kennzeichnen sollen. Sie sollten die Stufe 1 dabei für die deutschen Muttersprachler reservieren und Stufe 9 für den oder die Sprecher mit dem stärksten Akzent. Es wurden keinerlei Hinweise zur Anzahl der deutschen und nicht-deutschen Sprecher oder zur Herkunft der Sprecher gegeben. Die zehn Stimulus-Sätze wurden in vier Durchgängen mit jeweils unterschiedlicher Randomisierung über Kopfhörer (Philips SBC HP830) bei einem für die Hörer komfortablen Lautstärkepegel abgespielt. Jeder Stimulus wurde durch einen 880 Hz-Ton (Dauer von 500 ms) eingeleitet, gefolgt von einer Sekunde Pause. Nach jedem Stimulus erfolgte eine Pause von 5 Sekunden für die Beurteilung durch die Hörer. Zwischen den einzelnen Blöcken gab es jeweils eine kurze Pause, deren Länge die Hörer selbst bestimmten. Für jeden Sprecher wurde das arithmetische Mittel aus den Beurteilungen für ihn gebildet. Der erste Durchgang diente als Testdurchgang für die Hörer zur Gewöhnung an die Sprecher und die Aufgabe. Er wurde aus daher nicht gewertet. Auf jeden Sprecher kommen 36 Hörerurteile (12 Hörer x 3 Urteile). Ergebnisse: Die französischen Muttersprachler unterscheiden sich hinsichtlich der von den Hörern wahrgenommenen Stärke ihres fremdsprachigen Akzents. Die männlichen Sprecher (F-nm01 und F-nm02) weisen nach den Er- 5 Flege (1984) zeigte, dass sowohl phonetisch trainierte als auch untrainierte Hörer anhand einer CV- Silbe, einen fremdsprachigen Akzent von muttersprachlichen Produktionen unterscheiden können. Cunningham-Andersson und Engstrand (1989) zeigten, dass von naiven Hörern zuverlässige Beurteilungen des Akzentgrades erwartet werden können. Auch nach Piske et al. (2001) gibt es keinen Hinweis dafür, dass für foreign accent ratings zwingend phonetisch trainierte Hörer gewählt werden sollten, da die Beurteilungsleistung phonetisch untrainierter Hörer in der Regel vergleichbar sei. 66 gebnissen dieses Hörexperiments einen stärkeren Akzent auf als die beiden Sprecherinnen (F-nf01 und F-nf02). Gleichzeitig wurde der Akzent der beiden männlichen französischen Muttersprachler auch in der Gesamtgruppe aller Stimulussprecher als am stärksten bewertet: F-nm01 erhält den durchschnittlichen Rang 8,8 (s = 0,38) und F-nm02 erhält den durchschnittlichen Rang 8,2 (s = 0,88). Der Akzent der beiden französischen Muttersprachlerinnen wurde von den Hörern im Durchschnitt als mittel stark bewertet: 4,5 (s = 1,52) für F-nf01 und 4,9 (s = 1,26) für F-nf02. Interessant ist, dass die aus dem Elsass stammende Sprecherin F-nf02 einen höheren Rang erhielt und ihr Akzent damit als etwas stärker beurteilt wurde als der von Sprecherin F-nf01. Die hohe Standardabweichung bei den französischen Muttersprachlerinnen im Gegensatz zu den männlichen französischen Muttersprachlern deutet daraufhin, dass bei stärkeren Akzenten unter den Hörern eine höhere Übereinstimmung in der Beurteilung vorhanden zu sein scheint als bei weniger starken fremdsprachigen Akzenten. Die deutschen Muttersprachler wurden in der deutlichen Mehrheit der Fälle korrekt als deutsche Muttersprachler identifiziert und erhielten einen durchschnittlichen Rang von 1,0 (Sprecher KT, RH, LS) bzw. 1,1 (Sprecherin KL). Der russische Muttersprachler R-nm01 erhält einen Durchschnittsrang von 4,2 (s = 1,72) und die tschechische Muttersprachlerin Tsch-nf01 erhält einen Durchschnittsrang von 7,5 (s = 1,25). Bei einer informellen Befragung im Anschluss an das Hörexperiment gaben die Hörer an, sich in ihrer Beurteilung vor allem an augenscheinlicher Lesekompetenz bzw. Sprechfluss und -tempo, der Sprechmelodie sowie einzelnen segmentellen Eigenschaften wie der Realisierung von Vokalen, bestimmten Konsonanten, z. B. / r/ und / N/ , und Endsilben orientiert zu haben. Die deutschen Muttersprachler wurden laut der Teilnehmer vor allem an dialektalen Merkmalen sowie dem Sprechtempo identifiziert. Französischer Akzent im Deutschen Nicht nur die deutschen, sondern auch die französischen Muttersprachler wurden befragt, welche Merkmale sie für charakteristisch für einen französischen Akzent im Deutschen halten. Die Antworten fielen sehr subjektiv aus und sind eher als Auflistung von Merkmalen zu verstehen, mit denen die Probanden nach eigener Auffassung selbst noch Schwierigkeiten haben. Drei der vier Sprecher gaben an, immer noch Probleme mit der Realisierung von / h/ zu haben bzw. sich noch stark darauf konzentrieren zu müssen. Probleme mit Wortakzent, Vokalen oder bei der Realisierung des vorderen Allophons von / x/ wurden von jeweils einem Sprecher genannt. Eine Sprecherin gab an, dass sie aufgrund der Länge der Wörter manchmal Schwierigkeiten bei der Atmung hätte. Nicht-phonetische Merkmale beziehen sich auf Fehler bei Deklination und Konjugation sowie der Bildung von Passivsätzen. 67 Zur Einschätzung der eigenen Fähigkeit, zwischen einem imitierten und einem authentischen französischen Akzent im Deutschen zu unterscheiden, wurde wie bei den deutschen Muttersprachlern eine vierstufige Skala vorgegeben: (1) Ja, sicher. (2) Ja, wahrscheinlich. (3) Nein, wahrscheinlich nicht. (4) Nein, sicher nicht. Zwei Sprecher waren sich sicher und zwei Sprecher meinten, dass sie wahrscheinlich zwischen einem imitierten und einem authentischen französischen Akzent im Deutschen unterscheiden könnten. 68 6. Korpusaufbereitung 6.1. Allgemeine Vorarbeiten und Transliteration Im Anschluss an die Korpuserstellung und im Vorfeld der phonetischen Analysen stand eine aufwändige Bearbeitung der Daten, die zunächst aus dem Sichten und Schneiden des Materials bestand. Hier wurden, sofern dies möglich war und durch diese Bearbeitung eventuell resultierende Beeinträchtigungen des Sprachmaterials auf segmenteller oder suprasegmenteller Ebene ausgeschlossen werden konnten, Störgeräusche (z. B. Türenschlagen, längeres Husten oder Lachen etc.) und grobe Versprecher mit folgender Wiederholung von Wortgruppen bis hin zu Sätzen entfernt. Im Nachhinein muss kritisch angemerkt werden, dass diese Art der Bearbeitung problematisch ist, da möglicherweise auch Fehler entfernt wurden, die für eine Analyse von Interesse hätten sein können. In einem zweiten Schritt wurden die von den Probanden selbstverfassten Texte transliteriert, d. h. in eine orthografische Form gebracht. Durch die Transliterationen wurden bereits Vorbereitungen für eine mögliche nicht-phonetische Analyse der selbst verfasst Texte getroffen, bei der Variationen in den Bereichen Syntax, Morphologie oder Lexik untersucht werden können. Außerdem wurde auch eine Basis für die Annotationen der selbstverfassten Texte geschaffen (vgl. Punkt 6.2). Bei der Transliteration wurden beide Aufnahmen der selbst verfassten Texte der deutschen Muttersprachler, die französischen oder amerikanisch-englischen Akzent imitieren, sowie der französischen und amerikanisch-englischen Muttersprachler berücksichtigt. In einem späteren Schritt wurde auch das spontansprachliche Material dieser Sprechergruppen transliteriert. Dabei wurden persönliche Angaben der Sprecher (Name, Geburtsdatum, Wohnort etc.) in den Transliterationen durch die Form „XXX“ ersetzt. Proben der transliterierten Texte (gesprochen von den Sprecherinnen Ff01, F-nf01, Ff15) sind im Anhang C.7 zu finden. Phonetische Abweichungen sollten bei der Transliteration unberücksichtigt bleiben, da eine binäre Entscheidung darüber, wann phonetisch abweichende Fälle einer ergänzenden phonetischen Transkription bedürfen und wann nicht, äußerst schwer oder sogar unmöglich ist und somit auch eine konsistente Vorgehensweise nahezu unmöglich sein würde. Die Alternative wäre, eine durchgehend enge Transkription zu wählen, um die Verhältnisse genau wiederzugeben. Dies würde jedoch zum einen den Lesefluss unnötig erschweren und zum anderen ist äußerst fraglich, ob der dafür benötigte Aufwand im richtigen Verhältnis zu seinem Nutzen stünde. Aus diesen Gründen wurde auf den Einbezug einer phonetischen Ebene an dieser Stelle verzichtet und phonetisch abweichende Formen wurden unter Berücksichtigung des Kontexts ausschließlich in ihrer orthografischen Form aufgenommen, z. B. [Pa˜lo] als Hallo! 69 oder [su: ] als zu. Wenn aus dem Material eines Sprechers hervorging, dass der Sprecher beispielsweise versucht, Umlaute zu vermeiden, so wurden Fälle wie [PU˜mSla: g@] als Umschläge oder [vUKd@n] als würden aufgenommen, insofern das auch mit dem Kontext vereinbar war. Ein Problem bei der Transliteration ist jedoch, dass nicht immer eine zweifelsfreie Abgrenzung zwischen phonetischer und nicht-phonetischer Abweichung vom deutschen Standard gezogen werden kann. So kann beispielsweise die Unterscheidung problematisch sein, ob bei einer Verbform, deren Endung / -@n/ als nasalierter Vokal realisiert wird (z. B. in Sie fahre(n) zur Bushaltestelle.), die Variation auf eine abweichende phonetische Realisierung zurückzuführen ist oder der Sprecher eine grammatische Veränderung intendiert hat. In vielen dieser Fällen konnte von einer phonetischen Abweichung ausgegangen werden, sodass die angenommene grammatisch korrekte Form in die Transliteration aufgenommen wurde. Konnte ein Wort nicht zweifelsfrei verstanden werden, so wurde das vermutete Wort in Klammern gesetzt. Abweichungen innerhalb der beiden Aufnahmen der selbst verfassten Texte wurden berücksichtigt und durch Kursiv-Setzung der geänderten Formen in der zweiten Aufnahme gekennzeichnet. 6.2. Annotation des Sprachmaterials Um den Zugang zu den Daten zu erleichtern sowie spätere Analyseschritte zu automatisieren, wurde ein Großteil des aufgenommenen Sprachmaterials zum französischen und amerikanisch-englischem Akzent auf Wortbasis annotiert (wortbasierte Etikettierung). Eine Annotation von Daten bringt vielfältige Vorteile mit sich. So werden die Daten mittels einer Annotation um zusätzliche Informationen erweitert. Durch das Setzen von Zeitmarken im Sprachsignal und das Versehen dieser Zeitmarken mit bestimmten Etiketten (auch Labels genannt) wird das Sprachsignal segmentiert und etikettiert. Dies ermöglicht einen besseren und schnelleren Zugriff auf bestimmte für die Analyse relevante Abschnitte des Sprachsignals. Die Annotation von Sprachsignalen eines Korpus ist besonders wichtig, da sie nicht nur die eigenen Arbeitsschritte erleichtert, sondern bei einer Veröffentlichung des Korpus dieses auch für andere Untersuchungen nutzbar macht. Zur Annotation des Sprachmaterials wurde die Software xassp (Advanced Speech Signal Processor; Version 1.3.15) verwendet. xassp ist eine Anwendung zur Anzeige, Analyse und Verarbeitung von Sprachsignalen, die v. a. zur segmentellen und prosodischen Etikettierung eingesetzt wird und am Institut für Phonetik und digitale Sprachverarbeitung (IPDS) der Universität Kiel entwickelt wurde. Für weitere Informationen zu xassp sei auf das User ’s Manual (IPDS, 1997b) verwiesen. Der große Vorteil einer Annotation mit xassp ist, dass die Etiketten nicht einzeln manuell eingetragen werden müssen, sondern 70 aus der entsprechenden vorliegenden Textdatei herausgezogen werden können und nur noch an die richtige Stelle im Signal gesetzt werden müssen. Dieses Verfahren erleichtert und beschleunigt den Prozess der Annotation. Da xassp jedoch nicht plattformunabhängig ist, sondern nur auf Unix-Systemen läuft, wurden die Annotationsdateien in einem späteren Schritt in das TextGrid-Format von Praat (Boersma und Weenink, 2009) konvertiert und einige weitere Dateien durch studentische Hilfskräfte von vornherein mit Praat annotiert. Für die Arbeit wurde eine wortbezogene Segmentierung eingesetzt. Dazu wurde jeweils der Beginn und das Ende eines Wortes mit einem Label versehen, das mit seiner Zeitmarke in einer Labeldatei abgespeichert wurde (Interval-Tier bei Praat). Der Beginn eines neuen Wortes markiert gleichzeitig das Ende des vorherigen Wortes. Das Satzende, Atem- und Störgeräusche sowie Pausen, Lachen, Husten etc. wurden mit P gekennzeichnet. Versprecher und Abbrüche von Wörtern wurden wie Wörter behandelt und bekamen ihr eigenes Etikett ggf. mit einem Gedankenstrich am Ende, z. B. statt „Haltestelle“ Bushal- und Haltestelle. Im spontansprachlichen Material wurden persönliche Angaben der Sprecher mit dem Label XXX versehen und in einem späteren Schritt mit Hilfe eines Skripts anonymisiert. Dazu wurde die entsprechende Stelle über einen 400 Hz Low-pass-Filter mit einer Übertragungsbandbreite von 100 Hz gefiltert, wodurch Tonhöhenverhältnisse und temporäre Aspekte beibehalten wurden. Die Annotationen wurden ausschließlich für Aufnahmen zum französischen und amerikanisch-englischen Akzent durchgeführt. Insgesamt wurden 504 Dateien (von 516 gesamt) annotiert: 396 Dateien deutscher Muttersprachler und 108 Dateien nicht-deutscher Muttersprachler. Das fremdsprachige Material, d. h. die Texte, die von den nicht-deutschen Muttersprachlern in ihrer Muttersprache gesprochen wurden, wurde nicht annotiert. Für die Gruppe der deutschen Muttersprachler wurden pro Sprecher Aufnahmen von zwölf Texten annotiert. Es handelt sich dabei um folgende Texte: 1. Aufnahme: • Texte 1 und 3 jeweils verstellt und unverstellt, • Text 2 und selbst verfasster Text jeweils verstellt. 2. Aufnahme: • Texte 1 verstellt und unverstellt, • Texte 2 und 3, selbst verfasster Text und Spontansprache jeweils verstellt. In der Gruppe der französischen und amerikanisch-englischen Muttersprachler wurden jeweils Aufnahmen von neun Texten pro Sprecher annotiert. Es handelt sich dabei jeweils um die Texte 1, 2 und 3 aus beiden Aufnahmesitzungen sowie 71 Abbildung 6.1.: Überblick über eine Etikettierung mit Praat um die selbst verfassten Texte (beide Aufnahmen) und das spontansprachliche Material. Abbildung 6.1 zeigt beispielhaft die Etikettierung mit Praat. In den drei untereinanderstehenden Fenstern sind das Sprachsignal, das Sonagramm und die Annotationsspur dargestellt. Obwohl es sich bei der vorgenommenen Annotation um eine wortbezogene Etikettierung und nicht um eine Etikettierung der einzelnen phonetischen oder phonologischen Segmente handelt, ist die Zeitdauer, die eine Annotation einer Aufnahme beansprucht, sehr hoch. Die Entscheidung, wo zwischen zwei Segmenten, die ineinander übergehen, eine Wortgrenze zu setzen ist, kann in vielen Fällen nicht zweifelsfrei getroffen werden und bleibt daher oft arbiträr. Problematische Fälle sind beispielsweise Vokaljunkturen oder Vokal-Nasal- / Nasal- Vokal-Übergänge, in denen die Vokale meist nasaliert werden. Es wurde versucht, in solchen Problemfällen konsistent vorzugehen und die Entscheidungen basierten sowohl auf einer auditiven Beurteilung als auch auf einer visuellen Überprüfung, z. B. unter Zuhilfenahme des Verlaufs von Formantstrukturen im Sonagramm oder des Schalldruckverlaufs im Oszillogramm. Bei Plosiv-Plosiv- Abfolgen, bei denen es zum Explosionsverlust kommt, wurde die Wortgrenze in der Verschlussphase gesetzt, wobei das zeitliche Verhältnis der Plosive zueinander vernachlässigt wurde. Bei Plosiv-Frikativ-Abfolgen war die Unterscheidung zwischen zum Plosiv gehörender Aspirationsphase und darauffolgender Friktion problematisch. Hier wurde versucht, sich an der Verteilung der Energiekonzentrationen zu orientieren. 72 6.3. Veröffentlichung des Korpus Die für diese Arbeit aufgestellte Datenbasis ist auch für andere Forschungsvorhaben sowohl innerhalb als auch außerhalb der forensischen Phonetik von Interesse. Beispiele dafür, dass einige Teile der aufgenommenen Daten bereits für Forschungsarbeiten aus unterschiedlichen Gebieten genutzt wurden, sind Hellmann (2008) und Witecy (2010), zwei Magisterbzw. Masterarbeiten an den Universitäten Jena und Marburg, oder Simpson und Neuhauser (2010). Hellmann (2008) gehört zum Bereich Deutsch als Fremdsprache und ist eine Arbeit zu phonetischen und phonologischen Transferenzen und Interferenzen der Lernersprache amerikanischer Deutschlerner. Witecy (2010) und Witecy et al. (2010) untersucht verschiedene Aspekte der Akzentbeurteilung beim sogenannten Foreign Accent Syndrome, einer seltenen neurogenen Sprechstörung, und ist dem klinisch-linguistischen Bereich zuzuordnen (vgl. dazu auch Abschnitt 12.3). Simpson und Neuhauser (2010) ist eine Studie aus dem Bereich der forensischen Phonetik und untersucht die Robustheit epiphänomenaler nichtpulmonaler Lautproduktion, verursacht durch Überlappung zweier artikulatorischer Gesten, in den unverstellten Produktionen deutscher Muttersprachler und in den Imitationen eines französischen Akzents durch dieselben Sprecher. Ein Teil des vorgestellten Korpus wird unter der Bezeichnung „FAIC - Foreign Accent Imitation Corpus“ der Fachöffentlichkeit zu Forschungszwecken zur Verfügung gestellt (vgl. Neuhauser, 2011a). Auf der Internetseite http: / / www.narr.de/ akzentimitation können Auszüge einzelner Beispieldateien und die dazugehörigen Annotationen direkt geladen werden. Auf Anfrage kann Zugriffsrecht auf das Gesamtkorpus gegeben werden. 73 Teil III. Phonetische und phonologische Grundlagen 7. Lautlicher Vergleich des Deutschen und Französischen In diesem Abschnitt der Arbeit werden die Lautsysteme des Deutschen und Französischen beschrieben. Dazu wird wie in verschiedenen Werken zur Phonetik und Phonologie einer bestimmten Sprache (wie z. B. Kohler, 1995 für das Deutsche) vorgegangen und die Ausführungen werden in eine Beschreibung des Vokalsowie eine Beschreibung des Konsonantensystems aufgeteilt. Konsonantensystem und Vokalsystem sind phonologische Termini. Sie beschreiben ein abstraktes linguistisches System, das auf Grund phonetischer Ähnlichkeiten und Unterschiede in Äußerungen einer Sprache aufgebaut wird. Die im System enthaltenen Elemente sind jedoch nicht als Laute, sondern als Knoten in diesem System - einem Netzwerk von Beziehungen - zu verstehen (vgl. Simpson, 1998, S. 40, der sich hier auf Trubetzkoy, 1962 bezieht). Phonetisch können Konsonanten und Vokale aus einer Perspektive mit artikulatorischem, auditivem oder akustischem Schwerpunkt beschrieben werden. In keiner dieser rein phonetischen Beschreibungen wird (im Gegensatz zu einer phonologischen Beschreibung) etwas über die sprachliche Funktion eines beschriebenen Lautes im System ausgesagt. Wenn wie im Folgenden die Lautsysteme verschiedener Sprachen einander gegenübergestellt werden, gibt es das Problem, die abstrakten linguistischen Systeme dieser Sprachen miteinander zu vergleichen, ohne dabei die phonologische Ebene mit der phonetischen Ebene zu vermischen. Simpson (1999) diskutiert dieses Problem der komparativen Phonetik und Phonologie ausführlich und kritisiert komparative Arbeiten (wie z. B. Maddieson, 1984) und phonologische Datenbasen (wie z. B. UPSID 1 oder das Stanford Phonology Archive), die genau diese Ebenen vermischen und phonologische Systeme phonetisch interpretieren. Dabei wird nach Simpson (1999) auf der einen Seite der abstrakte Charakter eines phonologischen Systems nicht korrekt dargestellt und auf der anderen Seite werden die komplexen phonetischen Muster, die in Sprachen Bedeutungsunterscheidungen zur Folge haben, zu stark vereinfacht. Die Folge ist, dass phonetisch interpretierte phonologische Systeme weder einen ernsthaften phonetischen noch einen ernsthaften phonologischen Vergleich zwischen Sprachen erlauben. Simpson (1999, S. 349 und 351 f.) fordert, dass die Beschreibung und der Vergleich linguistischer Lautsysteme stattdessen auf folgenden drei Ebenen erfolgen soll, die klar voneinander getrennt werden müssen: 1. Phonetische Ebene: Vergleich der sprachlichen Laute ohne jeglichen Bezug zu ihrer linguistischen Funktion. 2. Funktional-phonetische Ebene: Vergleich der sprachlichen Laute unter Berücksichtigung ihrer strukturellen Verteilung und lexikalischen und grammatischen Funktion. Dieser Vergleich umfasst alle Allophone eines Phonems mit Informationen zu dem Kontext, in dem sie auftreten, und 1 UCLA Phonological Segment Inventory Database 77 deckt Unterschiede und Gemeinsamkeiten dieser phonetischen Korrelate in den verschiedenen Kontexten auf. 3. Phonologische Ebene: Vergleich der relationalen Systeme auf Basis der Unterschiede und Gemeinsamkeiten in den funktional-phonetischen Mustern. Das bedeutet für den sprachübergreifenden Vergleich: ein sehr beschränkter Vergleich der Phonemsysteme (z. B. durch Auszählen der Elemente in diesen Systemen) meist in Kombination mit einer funktionalphonetischen Analyse, bei der die allophonischen Gruppen der Phoneme herausgearbeitet und miteinander verglichen werden. Die folgende Beschreibung der Lautsysteme des Deutschen und Französischen ist eine phonetische Beschreibung, hauptsächlich auf funktionalphonetischer Ebene, mit vorwiegend artikulatorisch-phonetischem Schwerpunkt, wobei nicht immer auf den Einbezug der anderen Perspektiven (auditiv- / impressionistisch- und akustisch-phonetisch) verzichtet werden konnte. Ausgangspunkt ist das phonologische System der jeweiligen Sprache als abstraktes System funktionaler Einheiten, dessen Phoneminventar zunächst knapp dargestellt wird (Beschreibung auf phonologischer Ebene) und anschließend (teils funktional-) phonetisch beschrieben wird. Die Probleme, die aus einer phonetischen Beschreibung eines phonologischen Systems resultieren, sind auch hier nicht ganz zu vermeiden. Dennoch wird versucht, die oben genannten Ebenen voneinander getrennt zu halten. Es soll keine in allen Bereichen ausführliche Beschreibung der beiden Lautsysteme erfolgen, da der Schwerpunkt dieser Arbeit nicht auf einem phonetisch-phonologischen Vergleich des Deutschen und Französischen liegt. Stattdessen wird auf die wichtigsten Realisierungen der Phoneme und die positionsabhängigen Lautrealisierungen hingewiesen. Die für die spätere Beschreibung und Analyse der Produktionen der Sprecher besonders relevanten Merkmale werden daher in Teil IV der Arbeit, in dem die Ergebnisse der phonetischen Analyse dargestellt werden, nochmals aufgegriffen und detaillierter betrachtet. Die Ausführungen zur allgemeinen artikulatorischen Charakteristik von Konsonanten und Vokalen sind im Abschnitt 7.1 zur Phonetik und Phonologie des Deutschen etwas ausführlicher und müssen daher später für das Französische nicht noch einmal wiederholt werden. Dem Abschnitt 7.2 zur Phonetik und Phonologie des Französischen folgt ein Abschnitt zu den zu erwartenden Abweichungen französischer Muttersprachler in der Fremdsprache Deutsch. 78 7.1. Phonetik und Phonologie des Deutschen 7.1.1. Phonetische Beschreibung des deutschen Konsonantensystems Das deutsche Konsonantensystem umfasst 19 Konsonantenphoneme: / p, b, t, d, k, g, m, n, N, f, v, s, z, S, x, h, r, l, j/ . / Z/ kommt nur in Fremdwörtern vor, und wurde daher hier nicht mitgezählt. Auch der phonologische Status von / N/ wird je nach phonologischer Theorie diskutiert, ebenso wie die Wertung des glottalen Verschlusslautes [P] , was dazu führt, dass die Angaben zum Konsonanteninventar je nach zugrundeliegender Betrachtungsweise schwanken. Auf eine schematische Darstellung der deutschen Konsonantenphoneme, wie man sie u. a. in Kohler (1995) findet, wird hier (trotz ihrer Vorteile durch eine kompakte visuelle Darstellung, die einen leichten Vergleich zu anderen Konsonantensystemen ermöglicht) verzichtet, da sie die phonologische und phonetische Ebene nicht mehr sauber voneinander trennt. Artikulatorisch sind Konsonanten dadurch gekennzeichnet, dass (im Gegensatz zu Vokalen) zu ihrer Produktion im Ansatzrohr ein Verschluss bzw. eine Enge gebildet wird. Durch unterschiedliche Konfiguration von Glottis, Velum, Zunge und Lippen werden unterschiedliche Konsonanten erzeugt. Die artikulatorischen Parameter, die die Konsonanten charakterisieren und voneinander unterscheiden, sind: 1. Stellung der Glottis (z. B. vibrierend (stimmhaft), offen (stimmlos)) 2. Artikulationsort (passiver Artikulator) und Artikulationsorgan (aktiver Artikulator) 3. Artikulationsart (Verschluss / Friktionsenge / friktionslose Enge) 4. oral / nasal (Velum gesenkt (nasal), Velum gehoben (oral)) Zunächst können Konsonanten nach dem an ihrer Bildung beteiligten Luftstrommechanismus und der Luftstromrichtung in pulmonale, d. h. mit aus der Lunge strömender Ausatemluft gebildete, und nicht-pulmonale Konsonanten (wie z. B. Clicks oder Implosive und Ejektive) unterschieden werden. Sowohl pulmonale als auch nicht-pulmonale Konsonanten sind durch ein Hindernis gekennzeichnet. Durch eine nähere Bestimmung der Stelle im Vokaltrakt (Artikulationsort oder passiver Artikulator), an der das Hindernis mit Hilfe der sich an diese Stellen hinbewegenden Artikulationsorgane (aktiven Artikulatoren) gebildet wird, lässt sich eine weitere Klassifikation der Konsonanten vornehmen. Im europäischen Sprachraum und damit auch im Deutschen finden sich fast ausschließlich pulmonale Konsonanten. Nicht-pulmonale Konsonanten haben in diesen Sprachen entweder eine paralinguistische Funktion, z. B. der bilabiale Click, der bezeichnenderweise auch Kuss-Click genannt wird, oder sind als Epiphänomene zum Beispiel aufgrund intraoraler Luftdruckänderungen zu bewerten (vgl. z. B. Simpson, 2007; Simpson und Grawunder, 2008). Aus diesem 79 Grund soll hier auch nicht näher auf nicht-pulmonale Konsonanten eingegangen werden. Innerhalb der pulmonalen Konsonanten lässt sich nach der Artikulationsart (Art des Hindernisses sowie Art und Weise der Hindernisüberwindung) wiederum folgende Unterscheidung treffen: Plosive, Nasalkonsonanten, Frikative, Approximanten sowie Vibranten. Plosive und Nasalkonsonanten sind orale Verschlusslaute, was bedeutet dass der Mundraum verschlossen ist, sodass die Luft auf diesem Wege nicht entweichen kann. Im Deutschen werden die oralen Verschlusslaute je nach artikulierendem Organ labial (Allophone der Phoneme / p, b, m/ ), apikal bis laminal (Allophone von / t, d, n/ ) oder dorsal (Allophone von / k, g, N/ ) gebildet. Dabei variieren besonders die dorsalen Verschlusslaute in ihrem Artikulationsort abhängig vom Vokal in der Umgebung von postpalatal bis postvelar; die apikalen Verschlusslaute werden alveolar oder dental gebildet (vgl. Kohler, 1995, S. 159, 161). Nasalkonsonanten unterscheiden sich von Plosiven durch das gesenkte Velum, das eine Entweichung der Luft durch die Nase erlaubt. Die Nasalkonsonanten des Deutschen sind Allophone der Phoneme / m, n, N/ , die in der Regel stimmhaft realisiert werden. Im Gegensatz zu Allophonen von / m/ und / n/ kann / N/ nicht wort- und morpheminitial und in der Regel nicht nach Langvokal oder Diphthong auftreten (außer in manchen regionalen Varianten, z. B. aus dem Berliner Sprachraum). Außerdem kann kein Konsonant in derselben Silbe vor [N] stehen. Diese Distribution kann dadurch erklärt werden, dass sich / N/ historisch auf eine Abfolge von Nasal + Plosiv zurückführen lässt, die im Deutschen eben diesen Distributionsbeschränkungen unterliegt. In vielen regionalen Varianten des Deutschen wird / N/ jedoch auch wortfinal nicht als [N] , sondern als [Nk] realisiert (z. B. lang [laNk] ). Vgl. dazu Ramers und Vater (1991, S. 105-109) und Kohler (1995, S. 162 f.). Bei Plosiven - im Deutschen Allophone der Phoneme / p, b, t, d, k, g/ - ist das Velum gehoben, die Luft kann nicht durch den Nasenraum entweichen und staut sich oral hinter der Verschlussstelle bis der Verschluss abrupt und explosionsartig gelöst wird. Diese Verschlusslösung kann abhängig von Plosiv und nachfolgendem Laut oral (z. B. in Beute ["b ˚Oø “ t@] ), lateral (bei [t, d] vor [l] , z. B. in Beutel ["b ˚Oø “ t l l"] ) oder nasal (Plosiv vor homorganem Nasalkonsonanten, z. B. in ausbeuten ["Pao“sb ˚Oø “ t n n" ] ) sein, wobei Letztere (laterale oder nasale Lösung) u. a. wie in den hier angeführten Beispielen durch Wegfall des Schwa entstehen können und dann der dem Plosiv folgende Lateral oder Nasal silbisch realisiert wird. Außerdem kann die Sprengung des Verschlusses v. a. in Plosivfolgen entfallen (Explosionsverlust). Die zeitliche Koordinierung der Stimmlippenschwingung mit Verschlussbildung bzw. -lösung, und damit nicht nur das Merkmal Stimmhaftigkeit per se sondern auch der Zeitpunkt der einsetzenden Stimmhaftigkeit, kann zur Unterscheidung von Plosiven herangezogen werden. Bei gleichzeitig zur Verschlussbildung einsetzender Stimmhaftigkeit ist der Verschlusslaut voll stimmhaft, wie z. B. im Deutschen nach einem vorangehenden stimmhaften Laut ( [b] als Allophon des Phonems / b/ ) oder in 80 französisch bas. Setzt die Stimmlippenschwingung etwas verzögert oder erst mit dem folgenden Vokal ein, dann liegt ein teilweise oder voll entstimmter Verschlusslaut vor, wie z. B. in deutsch Bar ( [b ˚] als Allophon des Phonems / b/ ). Gleiches gilt für die Realisierungen der Phoneme / d/ und / g/ . Bei stimmlosen Plosiven ist zu unterscheiden, ob die Stimmbeteiligung direkt mit bzw. unmittelbar nach der Verschlusslösung beginnt (nicht-aspirierter stimmloser Plosiv, wie z. B. in französisch pas [p] ) oder ob die Stimmhaftigkeit erst eine kurze Weile nach der Verschlusslösung einsetzt, wie das in der Regel im Deutschen der Fall ist (aspirierter stimmloser Plosiv, wie z. B. in deutsch Park [p h ] ). Vgl. dazu z. B. International Phonetic Association (1999, S. 8f.) oder Kohler (1995, S. 59). Setzt die Stimmhaftigkeit erst eine gewisse Weile nach der Verschlusslösung ein, liegt das daran, dass die orale Verschlusslösung zeitlich mit einer glottalen Öffnungsgeste zusammenfällt und die Stimmlippen während dieser Öffnungsbewegung noch nicht schwingen, sondern hier eine zeitlich begrenzte Turbulenz entsteht (vgl. Pompino-Marschall, 1995, S. 180; Kohler, 1995, S. 59). Dieser Vorgang wird als Aspiration bezeichnet und kann vereinfacht auch als behauchte Produktion eines Lautes beschrieben werden. Im Deutschen werden die Phoneme / p, t, k/ im Silbenanlaut (außer nach silbeninitialem [ S ] ) sowie im In- und Auslaut als stimmlose aspirierte Plosive realisiert. Mehr zur Stimmeinsatzzeit und Stimmbeteiligung bei Plosiven folgt weiter unten im Abschnitt sowie in Kapitel 9. Frikative entstehen durch die Bildung einer schmalen Enge (Friktionsenge) zwischen Artikulationsstelle und artikulierendem Organ, durch die die Luft entweichen muss. Die dabei entstehenden Turbulenzen verursachen als akustisches Produkt ein Rauschen, das Friktion genannt wird. Die Frikative des Deutschen sind Allophone der Phoneme / f, v, s, z, S, x, r, h/ . Außerdem können noch frikativische Realisierungen anderer Phoneme (z. B. [B, ô fi, G] als Allophone von / b, d, g/ ) hinzukommen. / f/ und / v/ werden labiodental realisiert, wobei / v/ sowohl als Frikativ [v] aber auch als Approximant [V] realisiert werden kann, bei dem jegliche Turbulenz fehlt. Für die Realisierung von / s, z/ wird im Deutschen eine Enge zwischen Zungenblatt bzw. -spitze und den Alveolen gebildet. Für / S/ (und / Z/ , das nur in Fremdwörtern, z. B. Garage, vorkommt und oft als fortis realisiert wird) ist je nach regionaler Herkunft des Sprechers eher die Zungenspitze oder das Zungenblatt das artikulierende Organ, das postalveolar eine Enge bildet. Zudem wird / S/ häufig velarisiert oder labialisiert (vgl. Kohler, 1995, S. 161). In der deutschen Standardaussprache erscheint im absoluten Anlaut von deutschen Wörtern [z] oder [z ˚] als Allophon von / z/ , intervokalisch kann sowohl [z] als auch [s] stehen, die auf / z/ oder / s/ zurückgehen können. In Fremdwörtern sowie in regionalen Varianten, z. B. des süddeutschen Sprachraums, kann [s] aber auch wortinitial stehen. Nach Fortis- Obstruenten sowie in der Silbenkoda wird [s] realisiert (vgl. dazu Kohler, 1995, S. 160 sowie die Ausführungen zur progressiven Stimmlosigkeitsassimilation und Auslautverhärtung weiter unten). Auf die Allophone des Phonems / x/ sei hier gesondert hingewiesen, da die dorsalen Frikative im Deutschen komplementär 81 verteilt sind und der Artikulationsort zwischen palatal und uvular variiert. So steht das vordere Allophon von / x/ (palatales [ç] ) morpheminitial sowie nach vorderen Vokalen (einschließlich der Diphthonge, die auf diese ausgehen) und Konsonanten ( / l, r, n/ ) im selben Morphem. Die hinteren Allophone von / x/ (postvelares / uvulares [X] bzw. velares [x] ) stehen nach hinteren Vokalen im selben Morphem: Uvularer Frikativ steht nach den offenen hinteren Vokalen / a(: ), O/ und velarer Frikativ nach hinteren geschlossenen und halboffenen Vokalen sowie nach Diphthongen, die auf diese ausgehen (vgl. Kohler, 1995, S. 160 f.). Die Realisierung von / r/ ist zum einen abhängig vom lautlichen Kontext, zum anderen aber auch dialektal und stilistisch bedingt. Das Spektrum der Realisierungen ist somit sowohl intraindividuell als auch interindividuell sehr hoch. Stimmhafter (aber auch entstimmter) uvularer Frikativ [K, K ˚] bzw. Approximant [Kfl] sind im Deutschen zum gegenwärtigen Zeitpunkt dialektal vorherrschend und nehmen an Verbreitung zu, auch als Bühnenaussprache ist der uvulare Frikativ mittlerweile zulässig. Darüber hinaus sind apikaler Vibrant [r] oder Schlaglaut [R] (z. B. im alemannischen und bayerisch-österreichischen Sprachraum) aber auch uvularer Vibrant [ö] oder stimmhafter velarer Frikativ [G] (sowie weitere Reduktionen dieser zur entsprechenden einschlägigen oder approximantischen Realisierung) vertreten. Diese konsonantischen Allophone sind fakultative Varianten des Phonems / r/ und stehen in freier Variation. Die verschiedenen uvularen (oder velaren) Realisierungen sind v. a. durch artikulatorisch-aerodynamische Abläufe und zeitliche Überlappung zu erklären (vgl. Simpson, 1998, S. 132-140). Daneben steht jedoch noch die komplementäre Verteilung der konsonantischen Realisierung mit einer vokalischen Realisierung des / r/ ( [5“] ). Bei dieser vokalischen Realisierung ist das phonetische Korrelat von / r/ eine halboffene zentrale Vokalqualität und auf die Position nach Langvokal in der Silbenkoda derselben Silbe beschränkt, während die konsonantische Realisierung von / r/ an dieser Position nicht stehen kann (vgl. z. B. Kohler, 1995, S. 165 f.; Simpson, 1998, Kapitel 4; Rues, 2001). 2 Der glottale Frikativ / h/ wird meist stimmlos als [h] , intervokalisch und häufig auch wortinitial aber auch stimmhaft ( [H] ) realisiert und ist stets von dem folgenden Vokal geprägt, da die Artikulationsorgane bereits ihre Position für diesen einnehmen (vgl. Kohler, 1995, S. 156). Bei Approximanten ist die gebildete Enge friktionslos, d. h. Artikulationsstelle und -organ sind weit genug voneinander entfernt, sodass keine Turbulenzen entstehen und damit keine Friktion wahrnehmbar ist. Der Approximant / j/ im deutschen Lautsystem wird palatal gebildet und meist stimmhaft (aber auch entstimmt) realisiert. Andere approximantische Laute sind Realisierungen anderer Phoneme. Bei Lateralapproximanten entweicht die Luft seitlich (lateral) und nicht in der Mittellinie des Vokaltrakts. Im Deutschen gibt es den Lateralapproximanten / l/ , der apikal (und dental oder alveolar) gebildet und in der Regel ebenfalls stimmhaft realisiert wird, wobei die Stimmhaftigkeit abhängig 2 Mehr zur vokalischen Realisierung des / r/ folgt auch im nächsten Unterkapitel zum deutschen Vokalsystem. 82 vom Lautkontext verspätet einsetzen kann. Je nach dialektaler Herkunft eines Sprechers kann / l/ zudem palatalisiert (süddeutscher Sprachraum) oder velarisiert (rheinischer Sprachraum) sein (vgl. Kohler, 1995, S. 164). Die phonologischen Merkmale fortis und lenis werden in der Lautklassifikation zur Unterscheidung von Lauten benötigt, die in den Klassifikationskategorien Artikulationsart und -ort sowie in der Stimmbeteiligung übereinstimmen, bei denen aber dennoch ein Unterschied wahrnehmbar ist wie z. B. in französisch pas [p] und deutsch Bar [b ˚] . Dabei ist bei Plosiven u. a. auch die Dauer des Verschlusses, die Schnelligkeit der artikulatorischen Bewegung hin zum Verschluss sowie die Stärke des intraoralen Drucks während der Verschlussphase von Bedeutung und verbunden damit auch die Stärke der Schallintensität während der Verschlusslösung und im Einsetzen des folgenden Vokals (vgl. Kohler, 1995, S. 59). Bei Frikativen ist v. a. die Stärke der Turbulenz (stark bei fortis, schwächer bei lenis) das unterscheidende Merkmal in dieser phonologischen Kategorie. Im Deutschen korreliert das Merkmal der Stimmbeteiligung mit den Eigenschaften fortis / lenis (bzw. gespannt / ungespannt), d. h. stimmlose Obstruenten (Plosive und Frikative) werden immer fortis gesprochen, stimmhafte Obstruenten in der Regel lenis. Eine Ausnahme stellt hier der Verlust der Stimmhaftigkeit bei den phonetischen Realisierungen der Phoneme / b, d, g, z, Z/ (und gelegentlich auch bei denen der Lenis-Frikative / v, r/ sowie des Approximanten / j/ ) nach einem stimmlosen Fortis-Obstruenten oder nach einer Pause dar - trotz Verlust der Stimmhaftigkeit bleiben sie der Kategorie lenis zugehörig. Dieser Prozess wird als progressive Stimmlosigkeitsassimilation bezeichnet und ist darauf zurückzuführen, dass ein erhöhter Ausatemdruck bei stimmlosen Fortis-Obstruenten einen Druckausgleich zwischen der Luft unter- und oberhalb der Glottis erfordert, was den Beginn der Stimmlippenschwingung erschweren kann, besonders bei stimmhaften Lenis-Obstruenten (vgl. Rues et al., 2007, S. 35). Während im deutschen Anlaut sowohl Fortisals auch Lenis-Obstruenten stehen können, stehen im Wort- und Silbenauslaut nur Fortis-Obstruenten (Auslautverhärtung). Denn Lenis-Obstruenten werden in der Silbenkoda (außer wenn [l, K, n] im Wortstamm vor einem Suffix folgen) stimmlos realisiert und weisen weitere Korrelate des Merkmals fortis auf. Das bedeutet beispielsweise, dass Plosive auslautend stimmlos, mit hoher Artikulationsstärke und aspiriert produziert werden (vgl. Pompino-Marschall, 1995, S. 181; Rues et al., 2007, S. 34 f.). Der Glottalverschluss oder glottal stop [P] ist ein glottaler Verschlusslaut, d. h. die Stimmlippen sind fest verschlossen und werden durch die sich darunter anstauende Luft explosionsartig gesprengt. Im Deutschen soll normativ jeder silbeninitiale Vokal mit einem vorangehenden festen Stimmeinsatz (d. h. mit Glottalverschluss) gesprochen werden (vgl. Rues et al., 2007, S. 36), tatsächlich gibt es aber, u. a. abhängig von Faktoren wie Sprechstil, Wortart, Position in einer Äußerung oder Satzakzent, verschiedene Realisierungen, wie z. B. Glottalverschluss verbunden mit Glottalisierung oder auch Glottalisierung ohne Glottalverschluss (vgl. Rodgers, 2000, S. 289 ff.), auf die in Kapitel 10 näher 83 eingegangen wird. Ramers und Vater (1991) betrachten den Glottalverschluss nicht als eigenständiges Segment des deutschen Phonemsystems, da er durch fakultative phonologische Epentheseregeln abgeleitet werden könne, die einer Optimierung der Silbenstruktur von V C zu unmarkiertem C V C dienen, und in keinem Kontext immer anzutreffen sei. Auf der anderen Seite wird betont, dass, obwohl dieser feste Stimmeinsatz (oder harter Vokaleinsatz) fakultativ ist, er doch charakteristisch für das Deutsche im Vergleich zu Sprachen mit weichem Vokaleinsatz (wie Englisch oder romanische Sprachen) sei und „primär dafür verantwortlich [ist], da[ss] Ausländer die deutsche Sprache als abgehackt, nicht flüssig wahrnehmen. Andererseits hat ein Deutscher beim Erlernen einer Fremdsprache, die nur den weichen Einsatz kennt, oft Schwierigkeiten, den ‘glottal stop’ zu unterdrücken.“ (Ramers und Vater, 1991, S. 115). 7.1.2. Phonetische Beschreibung des deutschen Vokalsystems Vokale können artikulatorisch als (in der Regel) stimmhafte dorsale Öffnungslaute ohne Kontakt des Zungenrückens mit dem mittleren Teil des Gaumens definiert werden. Der Luftstrom kann im Gegensatz zu Konsonanten das Ansatzrohr ungehindert, d. h. ohne eine Enge oder einen Verschluss überwinden zu müssen, passieren. Das durch die vibrierende Glottis erzeugte Signal wird durch die sich bewegenden Artikulatoren modifiziert und gibt den Vokalen ihre charakteristische Qualität. Vokale lassen sich durch folgende artikulatorische Parameter charakterisieren und damit voneinander abgrenzen: 1. Hebungsrichtung des Zungenrückens (vorn / zentral / hinten) 2. Hebungsgrad des Zungenrückens und damit Abstand des Zungenrückens vom Gaumen (hoch / halbhoch / obermittelhoch / mittel / untermittelhoch / halbtief / tief) 3. Lippenstellung oder Labialität (gerundet/ schwach gerun det / ungerun det) 4. Quantität (kurz / lang) 5. Öffnungsgrad des Kiefers und Gespanntheit der Zunge und Lippen (relativ geschlossen und gespannt / relativ offen und ungespannt) Aus phonologischer Sicht können Vokale über Merkmale definiert werden, die zum einen den Gegensatz zum Konsonanten sicherstellen ([konsonantisch]) und zum anderen die Funktion des Vokals als Silbenträger verdeutlichen ([+ silbisch] bzw. [+ sonorantisch]) (vgl. Ladefoged und Maddieson, 1996, S. 281 f., Ramers und Vater, 1991, S. 116). Vokale bilden, da sie die größte Sonorität (Schallfülle) aufweisen, den Nukleus einer Silbe und sind so in der Regel Silbenträger. Wird ein Vokal elidiert, so kann ein anderer Sonorant (Nasal oder Liquid) silbisch werden und somit die Funktion des Silbenträgers übernehmen, so zum Beispiel im Deutschen bei Elision des Schwa in hatten oder wissen. 84 Abbildung 7.1.: Schematische Darstellung der wichtigsten monophthongischen und diphthongischen Vokalallophone der deutschen Vokalphoneme Das deutsche Vokalsystem umfasst 16 Monophthonge sowie drei Diphthonge (vgl. Ramers und Vater, 1991; Kohler, 1995): / i: , I, e: , E, E: , y: , Y, ø: , œ, @, a: , a, u: , U, o: , O/ und / aI, aU, OY/ . Die Angaben zum Phoneminventar des Deutschen schwanken. So gibt z. B. Pompino-Marschall (1995), der wie andere / @/ nicht als eigenständiges Phonem wertet, nur 15 Vokalphoneme an. Eine Diskussion dazu soll hier nicht gegeben werden, es sei stattdessen auf die entsprechende Literatur, z. B. Ramers und Vater (1991, S. 115-129), verwiesen. Auch die phonologische Wertung der drei Diphthonge ist umstritten (vgl. dazu Ramers und Vater, 1991, S. 128 ff.). Sie sind hier, Kohler (1995) folgend, monophonematisch gewertet, wobei ihr zweiter Teil den Phonemen / I/ , / U/ und / Y/ zugeordnet wird. Abbildung 7.1 zeigt eine vereinfachte schematische Darstellung der wichtigsten phonetischen Realisierungen der Monophthonge (links) und der Diphthonge (rechts) des deutschen Vokalsystems im sogenannten „Vokalviereck“, das den Vokalraum schematisch repräsentiert. Vokalraum ist hier abstrakt gemeint und bezeichnet den Raum, der durch die auf Jones (1917) zurückgehenden Kardinalvokale aufgespannt wird und in dem die Vokale aller Sprachen liegen. Ausgangspunkt für das Kardinalvokalsystem sind die Vokale [i] und [A] , die mit der höchsten und vordersten Zungenlage ( [i] - close front vowel) bzw. mit der tiefsten und hintersten Zungenlage ( [A] - open back vowel) gebildet werden. Man kann sie als artikulatorische Extremvokale bezeichnen, die als feste Referenzwerte für die Abbildung und den Vergleich von Vokalsystemen verschiedener Sprachen dienen. Vgl. dazu z. B. International Phonetic Association (1999, S. 10-13), Ladefoged und Maddieson (1996, S. 282-285). Im Vergleich zu anderen Sprachen hat das Deutsche mit seinen 16 Monophthongen und drei Diphthongen ein relativ großes Vokalsystem, da die Systeme der meisten Sprachen der Welt nur fünf bis sieben distinktive Vokalphoneme umfassen (vgl. Maddieson, 1984, S. 126). Je größer das Vokalsystem, umso mehr werden die Vokale durch zusätzliche modifizierende artikulatorische 85 Parameter voneinander unterschieden, z.B. durch Nasalierung, Pharyngalisierung, Lippenrundung, stärkere Differenzierung der Hebungsgrade oder Längenunterscheidung (vgl. Pompino-Marschall, 1995, S. 214 f.). Deutsch ist eine der Sprachen mit den meisten distinktiven Vokaleigenschaften (vgl. Maddieson, 1984, S. 126 f.). Die deutschen Monophthonge (außer / a: , a, E: , @/ ) bilden „Paare, in denen unter gleichen Kontextbedingungen üblicherweise ein längerer und geschlossenerer Vokal einem kürzeren und offeneren Vokal gegenübersteht“ (Kohler, 1995, S. 170): / i: I/ , / y: Y/ , / u: U/ , / e: E/ , / ø: œ/ , / o: O/ . Dabei werden die Kurzvokale in der Regel auch zentraler als die langen Entsprechungen realisiert (vgl. Ramers und Vater, 1991, S. 121; Simpson, 1998, S. 59). Im Standarddeutschen besteht zwischen den Allophonen der Phoneme / a: / und / a/ vorwiegend ein quantitativer Unterschied (vgl. Kohler, 1995, S. 170; Simpson, 1998, S. 59), wobei dialektal jedoch auch qualitative Unterschiede in den Realisierungen bestehen können. In der Mehrheit der Sprachen findet sich ein Zusammenhang zwischen den phonetischen Dimensionen Hebungsrichtung „hinten“ (backness) und Lippenrundung (vgl. Ladefoged und Maddieson, 1996, S. 292) - so auch im Deutschen. Allerdings befinden sich hier unter den neun Vorderzungenvokalen neben den fünf ungerundeten auch vier gerundete (d. h. labialisierte) Vorderzungenvokale ( [y: , Y, ø: ] sowie schwächer gerundetes [œ] als Allophone der Phoneme / y: , Y, ø: , œ/ ). Diese Vokale kommen aufgrund ihrer phonologischen Komplexität in den Sprachen der Welt relativ selten vor. Auch innerhalb des Deutschen (sowie in den anderen Sprachen, in denen sie vorkommen) treten sie relativ selten auf, wie Simpson (1998) anhand von Häufigkeitsverteilungen von Vokalen in Daten aus dem Kiel Corpus of Read Speech (IPDS, 1994) und dem Kiel Corpus of Spontaneous Speech (IPDS, 1997a) zeigt, und die er mit anderen Statistiken (z. B. Meier, 1967) vergleicht. Die Phoneme / e: / und / E: / werden häufig ähnlich realisiert, wobei je nach regionaler Herkunft des Sprechers die Realisierung des Phonems / E: / eher durch eine geschlossenere Vokalqualität gekennzeichnet ist (v. a. norddeutscher Sprachraum) bzw. die Realisierung des Phonems / e: / durch eine eher offenere Vokalqualität (z. B. ostmitteldeutscher Sprachraum). Unter den Zentralvokalen nehmen das Phonem / @/ und der halboffene Zentralvokal [5] eine Sonderposition ein. / @/ , auch als Schwa bezeichnet, wird im Deutschen nicht immer als mittlerer zentraler Vokal, sondern häufig auch etwas geschlossener realisiert, wie akustische Messungen, z.B. in Barry (1995) oder auch Simpson (1998), zeigen. / @/ kommt im Deutschen nur in unbetonten Silben vor, während die anderen Vokale sowohl in betonter als auch in unbetonter Position vorkommen können, z. B. totem / "o: / - / @/ , Totem / "o: / - / E/ , Potenz / o/ - / "E/ (vgl. Kohler, 1995, S. 169). [5] , das in Abbildung 7.1 als halboffener Zentralvokal dargestellt ist, in seiner Qualität jedoch dialektal aber auch abhängig von der Position in der Äußerung sowie von der unmittelbaren Lautumgebung sehr stark schwanken kann, hat keinen Phonemstatus. Es ist stattdessen entweder als vokalisches Allophon des Phonems / r/ oder als Allophon der Phonemkombination / @r/ zu werten (vgl. Trubetzkoy, 1962). Im Suffix -er innerhalb einer unbetonten Silbe kommt [5] als Allophon der 86 Phonemkombination / @r/ vor (z. B. in weiter / "vaIt@r/ ). In diesen Fällen liegt die Realisierung zwar innerhalb einer großen Variationsbreite, ist jedoch stets monophthongisch (vgl. Simpson, 1998, S. 125). Daneben steht das vokalische Allophon des / r/ -Phonems, das nach Langvokal in der Silbenkoda derselben Silbe als unsilbischer halboffener ungerundeter zentraler Vokal ( [5“] ) realisiert wird, wobei ein Diphthong mit einer vorderen und geschlossenen Anfangsposition und einer zentralen ungerundeten Endposition entsteht, z. B. in Meer / me: r/ . Auch nach Kurzvokalen, die in ihrer Vokalqualität etwas zentralisierter und offener sind, kann eine vokalische Realisierung von / r/ stehen, wobei sowohl monophthongische (zentralisierte) Realisierung als auch diphthongische Realisierungen mit geringerer Qualitätsänderung möglich sind. Nach offenen Vokalen (Allophone von / a(: )/ und / O/ ) stehen jedoch häufig gar keine Diphthonge mehr, sondern es werden nur noch Monophthonge mit geringer Zentralisierung oder Entrundung beobachtet (vgl. Kohler, 1995, S. 166; Simpson, 1998, S. 128-132). Während die Vokalqualität der Monophthonge weitgehend gleichbleibend ist, sind Diphthonge durch eine deutliche Qualitätsänderung gekennzeichnet. Sie bilden eine einsilbige Einheit aus zwei Vokalen und sind im Standarddeutschen steigend, d. h. die artikulatorische Bewegung geht von einer hohen Kieferöffnung mit flachem Zungenrücken zu einer geschlosseneren Kieferöffnung mit gehobenem Zungenrücken (vgl. Pompino-Marschall, 1995, S. 219, sowie die schematische Darstellung in Abbildung 7.1). Untersuchungen zur Häufigkeitsverteilungen der drei Diphthonge / aI, aU, OY/ im Deutschen (spontansprachlich sowie gelesen) in Simpson (1998) ergaben, dass / aI/ am häufigsten und / OY/ am seltensten vorkommt, was teilweise durch die phonologische Komplexität von / OY/ aufgrund seines zweiten Bestandteils, aber auch durch die Abwesenheit des Phonems in Funktionswörtern zu erklären ist. Die Allophone der Phoneme / aI, aU, OY/ können als [ae “, ao “, Oø “ ] symbolisiert werden, wobei die Symbolisierung problematisch ist und in der Fachliteratur unterschiedlich verwendet wird. Simpson (1998) geht kurz auf diese Problematik ein und argumentiert, dass eigentlich nur zwei (angestrebte) Vokalqualitäten symbolisiert werden, aber die zeitliche Beziehung zwischen diesen außer Acht gelassen wird. Wenn man davon ausgeht, dass die erste Vokalqualität erreicht und über einen gewissen Zeitraum gehalten wird, besteht die Möglichkeit, dass die zweite Vokalqualität bei festgelegter Artikulationsgeschwindigkeit (i) entweder bei ausreichender Zeit ebenfalls erreicht wird oder (ii) bei nicht ausreichender Zeit nicht erreicht wird und im Bereich zwischen Anfangs- und Endqualität liegt. Außerdem kann die Artikulationsgeschwindigkeit, die benötigt wird, um die zweite Vokalqualität zu erreichen, je nach zur Verfügung stehender Zeit entweder beschleunigt oder verlangsamt werden (vgl. Simpson, 1998, S. 44). Aus diesen Ausführungen ergeben sich auch die Probleme, die in einer detaillierten phonetischen Beschreibung von Diphthongen liegen. Es soll an dieser Stelle noch erwähnt werden, dass aus phonetischer Sicht zu den Realisierungen der im deutschen Lautsystem repräsentierten Diphthongen auch die oben erwähn- 87 ten r-Diphthonge (als Realisierung von / r/ ) sowie in verschiedenen deutschen Aussprachevarianten außerdem diphthongische Realisierungen von Vokalphonemen, die in der deutschen Standardaussprache monophthongisch realisiert werden müssten, hinzukommen. Auf der anderen Seite stehen auch monophthongische Realisierungen von / aI, aU, OY/ , die nicht nur dialektal bedingt sind, sondern, z. B. in Funktionswörtern, auch auf die erwähnte kurze Artikulationszeit zurückgeführt werden können. 7.2. Phonetik und Phonologie des Französischen Wenn im Folgenden das Lautsystem „des Französischen“ und seine Realisierungen beschrieben werden, so bezieht sich diese Beschreibung auf die Lautung dessen, was man als Standardfranzösisch bezeichnen mag und der Aussprachenorm entspricht oder entsprechen soll, die in der Pariser Mittel- und Oberschicht in einer gehobenen Konversation zu finden ist. Dieses Französisch soll in Bezug auf Region, soziale Klasse und Stil neutral sein und damit einer Norm am nächsten kommen. Zur weiteren Diskussion dazu sei auf Klein (1982, S. 13-20), Meisenburg und Selig (1998, S. 14 f.) oder Léon (2005) verwiesen. 7.2.1. Phonetische Beschreibung des französischen Konsonantensystems Das französische Lautsystem umfasst ca. 17 Konsonantenphoneme (vgl. z. B. Klein, 1982; Hammarström, 1998; Fougeron und Smith, 1999): / p, b, t, d, k, g, f, v, s, z, S, Z, l, ö, m, n, ñ/ . / N/ kommt nur im Suffix -ing einiger englischer Lehnwörter vor und ist daher in seinem Phonemstatus umstritten, sodass die Anzahl der Konsonantenphoneme in den verschieden Werken schwankt (vgl. Hammarström, 1998, S. 51; Meisenburg und Selig, 1998, S. 78; Schmidt, 2003, S. 8). Ebenfalls umstritten ist die phonologische Einordnung der Approximanten [4, j, w] , wie beispielsweise in huit (acht), fille (Mädchen, Tochter) und loi (Gesetz), die je nach phonologischem Ansatz entweder als eigenständige Halbkonsonanten / 4, j, w/ (z. B. Meisenburg und Selig, 1998; Schmidt, 2003), aber auch als kombinatorische Varianten der Vokalphoneme / i, u, y/ (z. B. Hammarström, 1998) bewertet werden. In Rothe (1978) und Röder (1996) wird nur / j/ als Konsonantenphonem gewertet, / wa, w˜e, 4i/ jedoch als diphthongische Phoneme (Rothe, 1978) bzw. [4] und [w] „als kombinatorische Varianten der Vokalphoneme / y/ bzw. / u/ , die [...] als nicht silbentragende Halbkonsonanten mit Gleitlautfunktion realisiert werden“ (Röder, 1996, S. 73). In anderen Werken wird die phonologische Bedeutung der Halbkonsonanten als gering und daher vernachlässigbar bewertet (vgl. Klein, 1982, S. 102; Léon, 2005, S. 70). In dieser Arbeit werden [4, j, w] unter den Konsonanten abgehandelt. Die Plosive im Französischen sind Allophone der Phoneme / p, t, k, b, d, g/ . Damit verfügt das Französische ähnlich dem Deutschen über Plosive, die bi- 88 labial (Allophone der Phoneme / p, b/ ), apiko-dental (Allophone von / t, d/ ) oder dorso-velar (Allophone von / k, g/ ) gebildet werden und jeweils stimmlos und stimmhaft auftreten können. Die apikalen Plosive werden nach Rothe (1978), Fougeron und Smith (1999), Léon (2005) dental und damit im Vergleich zum Deutschen etwas frontiert gebildet, es findet sich aber auch die Angabe alveolar (Meisenburg und Selig, 1998) bzw. alveodental (Röder, 1996) für die Bildungsstelle. Die dorsalen Plosive variieren wie im Deutschen in ihrem Artikulationsort abhängig vom folgenden Vokal und werden beispielsweise vor einem hohen Vokal palatalisiert (vgl. Röder, 1996, S. 56; Corneau, 1999, S. 62- 64; Léon, 2005, S. 70). Bei den stimmhaften Lenis-Plosiven im Französischen beginnt die Stimmhaftigkeit bereits mit der Verschlussbildung, d. h. sie sind im Gegensatz zu den deutschen stimmhaften Plosiven voll stimmhaft. Während im Deutschen / p, t, k/ als aspirierte stimmlose Fortis-Plosive realisiert werden, werden sie im Französischen in der Regel nicht aspiriert, d. h. die Stimmlippen beginnen unmittelbar nach der Verschlusslösung zu schwingen (vgl. dazu Klein, 1982, S. 126; Röder, 1996, S. 57; Hammarström, 1998, S. 52-54; Meisenburg und Selig, 1998, S. 51-53). Gehen sie hohen Vokalen voraus, so kann eine kurze Aspirationsphase und / oder Friktion folgen (vgl. Fougeron und Smith, 1999, S. 80). Im Deutschen können stimmhafte Lenis-Plosive und Lenis-Frikative nur im Anlaut nicht jedoch im Silbenauslaut stehen (Auslautverhärtung), im Französischen jedoch können stimmhafte Lenis-Plosive auch im Auslaut vorkommen. Allerdings können sich stimmhafte Plosive im Merkmal der Stimmbeteiligung an die ihnen folgenden stimmlosen Konsonanten angleichen (regressive Assimilation) und somit ebenfalls stimmlos (und fortis) realisiert werden; umgekehrt werden stimmlose Plosive stimmhaft realisiert, wenn ihnen ein stimmhafter Konsonant folgt (vgl. dazu Röder, 1996, S. 55-57; Hammarström, 1998, S. 53). Diese Assimilation, die sowohl Plosive als auch Frikative betrifft, muss Léon (2005) zufolge bezüglich des Merkmals der Stimmbeteiligung nicht immer total sein, sondern kann auch nur eine Verringerung oder Erhöhung der artikulatorischen Stärke bedeuten (vgl. Léon, 2005, S. 71). Detailliertere Ausführungen und eine Diskussion der Forschungsliteratur zu den Themen Stimmeinsatzzeit und Stimmbeteiligung bei Plosiven folgt in Kapitel 9. Die Nasalkonsonanten im Französischen sind Allophone der Phoneme / m, n, ñ/ (und / N/ in englischen Lehnwörtern). Sie werden bilabial für / m/ , apikodental für / n/ , mediodorsal-palatal für / ñ/ (sowie dorso-velar für / N/ ) und in der Regel stimmhaft gebildet (vgl. Léon, 2005, S. 66-68). Wie im Deutschen so können auch im Französischen nur der labiale und der apikale Nasal in allen Silbenpositionen (initial, medial, final) vorkommen. [ñ] hingegen ist (bis auf wenige Einzelfälle, in denen es anlautend auftritt) auf den In- und Auslaut beschränkt, [N] kommt nur auslautend in der Silbe -ing in englischen Lehnwörtern oder als Ergebnis einer Assimilation vor (vgl. Meisenburg und Selig, 1998, S. 56; Röder, 1996, S. 77). Folgen Nasalkonsonanten auf einen stimmlosen Konsonanten, so können sie aufgrund einer progressiven Assimilation entstimmt realisiert werden (vgl. Röder, 1996, S. 74-76). 89 Die französischen Frikative sind Realisierungen der Phoneme / f, v, s, z, S, Z/ , die sowohl stimmhaft als auch stimmlos vorkommen. Ein Phonem / x/ wie im Deutschen mit komplementär verteilter palataler und velarer / uvularer Realisierung existiert im Französischen nicht. Die geräuschverursachende Enge der französischen Frikative wird ähnlich dem Deutschen bei / f, v/ labiodental gebildet und bei / s, z/ alveolar mit dem Zungenblatt (prädorsal / laminal), regional aber auch mit der Zungenspitze (apikal). Bei / S, Z/ wird die Enge präpalatal / postalveolar ebenfalls mit Zungenspitze oder -blatt (apikal / laminal) gebildet, im Gegensatz zum Deutschen sind die Lippen im Französischen dabei jedoch stärker gerundet (vgl. Röder, 1996, S. 59-64; Léon, 2005, S. 69). Sowohl die stimmhaften als auch die stimmlosen Realisierungen können anlautend, inlautend und auslautend stehen. Ihre Verteilung unterliegt also keiner Beschränkung wie der Auslautverhärtung im Deutschen oder der Regel, dass im absoluten Anlaut deutscher Wörter nur / z/ stehen kann (vgl. Meisenburg und Selig, 1998, S. 54). Wie die Plosive so gleichen sich auch die Frikative im Französischen bezüglich des Merkmals der Stimmbeteiligung an den folgenden Konsonanten an. Die häufigste Realisierung von / ö/ ist sowohl im Deutschen als auch im Französischen ein uvularer (oder velarer) Frikativ, der in der Regel stimmhaft ist, aber v. a. in stimmloser Umgebung und im Auslaut vor elidiertem [@] auch teilweise oder ganz entstimmt auftreten kann. Daneben kommen auch uvularer (v. a. in den Pariser Vorstädten) und alveolarer Vibrant als von der Norm abweichende dialektale Varianten des / ö/ vor, wobei v. a. die letztere als veraltet und provinziell gilt. Schon Trubetzkoy (1962, S. 42) beschreibt das „Zungen-r als lokale Abweichung oder als archaisierende Affektation z. B. [...] französischer Schauspieler“. Eine vokalische Realisierung des / ö/ wie im Deutschen (auslautend nach Langvokal) gibt es im Französischen nicht (vgl. Röder, 1996, S. 65 f.; Hammarström, 1998, S. 71-73, 95 f.; Meisenburg und Selig, 1998, S. 54, 57 f.; Léon, 2005, S. 69). / l/ wird als apiko-alveolarer (oder apiko-postdentaler) Lateralapproximant realisiert, der ebenso wie die Realisierungen von / ö/ durch Assimilation und positionsabhängig entstimmt auftreten kann (vgl. Röder, 1996, S. 78 f.). Im Deutschen existiert ein Phonem / h/ , das meist als stimmloser glottaler Frikativ realisiert wird. Außerdem wird im Deutschen vor silbeninitialen Vokalen in der Regel ein vorangehender Glottalverschluss bzw. Glottalisierung produziert. Im Gegensatz dazu werden im Französischen vokalisch anlautende Silben nicht mit Glottalverschluss realisiert. Stattdessen wird im mot phonétique 3 der vor dem anlautenden Vokal stehende auslautende Konsonant zum anlautenden Konsonanten des folgenden vokalisch beginnenden Wortes (enchaînement consonantique, z. B. avec une amie [a-vE-ky-na-mi] ). Bei Vokal-Vokal-Abfolge, die 3 Im Französischen wird eine aus mehreren Wörtern bestehende Sinneinheit als phonetische Einheit gesprochen (mot phonétique) und besteht in der Regel aus einem Satzglied. Die letzte Silbe dieser Einheit trägt den Akzent, die anderen bleiben meist unbetont (vgl. Röder, 1996, S. 26 f., 36). 90 ohne Pause und Glottalverschluss erfolgt, spricht man von enchaînement vocalique. Der Vokaleinsatz ist im Französischen bei normaler Stimmgebung weich, ein Glottalverschluss kommt nur bei besonders ausdrucksstarker Aussprache vor (vgl. Léon, 2005, S. 56; Röder, 1996, S. 81). Im Französischen existiert außerdem kein Phonem / h/ . Allerdings finden sich in der Orthografie Wörter mit h, das, wenn es sich bei diesen Wörtern ursprünglich um Entlehnungen aus meist germanischen Sprachen handelt, als h aspiré und sonst als h muet bezeichnet wird. In der Regel werden beide nicht realisiert. Klein (1982) spricht davon, dass beide „stumm“ sind und setzt phonologisch für das h aspiré ein Phonem Null (/ ∅ / ) an, da es ein „verstummter Konsonant [ist], der aber latent als Konsonant im Sprachbewusstsein vorhanden ist [und im Gegensatz zum h muet] die Elision und die liaison 4 [verhindert]“ (Klein, 1982, S. 27). Rothe (1978) kritisiert diese phonologische Wertung und wendet ein, dass im Fall des h aspiré gar kein Laut vorliegt und ihm demnach keine distinktiven Merkmale einem anderen Laut gegenüber zugewiesen werden können; er sieht dagegen ein lexikalisches Problem (vgl. Rothe, 1978, S. 91-103). Auf diese Diskussion soll an dieser Stelle nicht weiter eingegangen werden. Interessant ist jedoch, dass Léon (2005, S. 55 f.) schreibt, dass der glottale Frikativ im Französischen doch existiert und zwar meist von älteren Sprechern einiger französischer Dialekte produziert wird, und sonst v. a. in emphatischen Ausdrücken vorkommt. Weitere Ausführungen zur silbeninitialen Glottalisierung und glottalen Friktion im Französischen erfolgen in Kapitel 10. Die Diskussion um den phonologischen Status der Approximanten [4, j, w] wurde zu Beginn dieses Abschnittes bereits angerissen und soll an dieser Stelle auch nicht näher vertieft werden. Die friktionslose Enge wird bei [j] und bei [4] palatal mit dem Zungenrücken gebildet, wobei bei [4] noch eine zweite bilabiale Enge durch vorgestülpte gerundete Lippen gebildet wird, sodass dieser Laut als bilabio-palatal beschrieben werden kann. Bei [w] werden ebenfalls zwei friktionslose Engen gebildet (bilabio-velar): bilabial mit gerundeten Lippen und postdorso-velar (vgl. Jones, 1969, S. 208; Röder, 1996, S. 67-71). Alle drei Approximanten können nur in unmittelbarer Nähe zu einem Vokal auftreten, wobei nur [j] vor oder nach einem Vokal stehen kann, während [4] und [w] nur direkt vor einem Vokal möglich sind (vgl. Meisenburg und Selig, 1998, S. 58). In der Regel werden [4, j, w] stimmhaft realisiert, wobei sie aber nach einem stimmlosen Konsonanten durch progressive Assimilation auch entstimmt werden können (vgl. Röder, 1996, S. 67-73). Abschließend soll noch hinzugefügt werden, dass im Französischen die Artikulationsorgane nach der Bildung eines Konsonanten, der vor einer Pause steht, sofort wieder ihre neutrale Ausgangsposition einnehmen. Dieser Vorgang wird als la détente (engl. final consonant release) bezeichnet und kommt im Deutschen 4 Liaison ist eine Sonderform der oben beschriebenen enchaînement. Man spricht von Liaison, wenn ein Endkonsonant vor einem vokalisch anlautendem Wort innerhalb des mot phonétique realisiert wird, der im isolierten Wort, vor einer Pause und vor einem konsonantisch anlautendem Wort nicht gesprochen würde, z. B. les amis [lezami] (vgl. Röder, 1996, S. 36 f.). 91 nicht vor, da hier die Artikulationsorgane in einem solchen Fall noch eine kurze Weile in ihrer Position verharren. In emotionsgeprägten Ausdrücken können auch Vokale von der détente betroffen sein (vgl. Röder, 1996, S. 47). 7.2.2. Phonetische Beschreibung des französischen Vokalsystems Das französische Vokalsystem besteht aus ca. 16 Vokalphonemen, die sich in 12 Oralvokale und 4 Nasalvokale aufteilen: / i, e, E, a, y ø, œ, @, A, u, o, O/ und / ˜E, ˜ œ, ˜ A, ˜ o/ (vgl. z. B. Rothe, 1978; Röder, 1996; Meisenburg und Selig, 1998), wobei Uneinigkeit in der phonemischen Transkription des letztgenannten Nasalvokals herrscht ( / ˜ o/ vs. / ˜O/ ). Die Angaben zum Inventar des französischen Vokalsystems schwanken. Hammarström (1998) beispielsweise geht, indem er / E: / hinzurechnet, von 17 Vokalphonemen aus, davon 13 Oral- und 4 Nasalvokale. Außerdem ist die Wertung von / @/ umstritten, das beispielsweise von Rothe (1978) als eigenständiges Phonem, von Röder (1996) jedoch als Allophon von / ø/ oder / œ/ gewertet wird. Diphthonge gehören nicht zum französischen Phonemsystem. Es existieren jedoch Verbindungen zwischen den Approximanten [4] und [w] mit Vokalen, die wie oben bereits angeführt bei Rothe (1978, S. 60 f.) als diphthongische Phoneme ( / wa, w˜e, 4i/ ) gewertet werden, wobei diese Wertung umstritten ist. Im Gegensatz zum Deutschen ist die Vokalquantität im Französischen heute nicht mehr distinktiv. Die Quantität der Vokale ist auch einer der Gründe für die unterschiedliche Anzahl der Vokalphoneme in der Literatur. Je nachdem, ob / E: / und / ø: / als Phoneme betrachtet werden oder nicht, schwankt die Phonemanzahl. Röder (1996) beispielsweise schreibt den Minimalpaaren für / E/ vs. / E: / (mettre vs. maître, belle vs. bêlle) als Kennzeichen einer sehr gepflegten Aussprache meist älterer Personen für die heutige Standardaussprache keine Bedeutung mehr zu und wertet die langen Vokale daher als kombinatorische Varianten der kurzen Vokale (vgl. Röder, 1996, S. 86). Die Vokaldauer als phonetisches Korrelat phonologischer Quantität ist bei französischen Vokalen abhängig vom Kontext und v. a. von der Betonung. So werden Vokale v. a. in betonten Silben gelängt (vgl. Röder, 1996, S. 85-87; Meisenburg und Selig, 1998, S. 66 f., 86 f.). Die Oppositionen von / ø/ und / œ/ , / e/ und / E/ sowie / o/ und / O/ sind umstritten (vgl. Röder, 1996) und können in gewissen Stellungen jeweils zugunsten eines einzelnen Phonems (Archiphonem) aufgehoben werden, wobei die Realisierungen ( [ø, œ, e, E, o, O] ) dann als kombinatorische Varianten gewertet werden können, die v. a. an die Silbenstruktur gebunden sind (vgl. Trubetzkoy, 1962, S. 69 f., der sich jedoch nur auf / e/ und / E/ bezieht). Eine allgemeine und vereinfachte Verteilungsregel ist, dass in offenen Silben meist die geschlossenen Vokale realisiert werden (ces [se] , ceux [sø] , seau [so] ) und in geschlossenen Silben meist die offenen Vokale (sel [sEl] , seul [sœl] sol [sOl] ). Mehr dazu und zu 92 den Ausnahmen von dieser Regel in Léon (2005, S. 85 f.); detailliertere Ausführungen in Meisenburg und Selig (1998, S. 83-85) und Röder (1996, S. 89-98). Außerdem werden [E] und teilweise auch [œ] in unbetonter offener Silbe an geschlossene Vorderzungenvokale der Folgesilbe angeglichen und als [e] bzw. [ø] realisiert. Hier liegt eine Vokalharmonie vor, die auch umgekehrt ablaufen kann, d. h. [e] wird in offener Silbe mit folgendem offenen Vokal zu [E] (vgl. Röder, 1996, S. 90 f.; Léon, 2005, S. 85). Auch die Opposition zwischen / a/ und / A/ ist nach Röder (1996) dabei, aufgehoben zu werden und wird nur noch von älteren Sprechern aufrecht erhalten, sonst jedoch zugunsten eines tiefen Zentralvokals [¨ a] oder des vorderen [a] neutralisiert. Hinzukommt, dass nach Léon (2005, S. 87) das hintere tiefe [A] mit nur 2,4 % des Gesamtvorkommens von a im Französischen nur sehr selten vorkommt. Nach Meisenburg und Selig (1998) werden die französischen Vokale generell mit einer größeren Spannung artikuliert als die deutschen Vokale und erscheinen damit auditiv klar und präzise. Diese artikulatorische Spannung wird im Französischen jeweils während des gesamten Vokals aufrecht gehalten, sodass die Vokalqualität konstant bleibt (vgl. Meisenburg und Selig, 1998, S. 61). Die französischen Vokale können durch die unter Punkt 7.1.2 genannten artikulatorischen Eigenschaften wie Hebungsrichtung und -grad des Zungenrückens, Lippenstellung und Öffnungsgrad des Kiefers beschrieben werden: Die Hinterzungenvokale werden mit Lippenrundung gebildet, die Vorderzungenvokale sind sowohl gerundet als auch nicht gerundet. Es gibt einen tiefen Zentralvokal ( [¨ a] ). Fougeron und Smith (1999) geben außerdem [@] als Zentralvokal an, dieser ist jedoch z. B. bei Röder (1996) als Vorderzungenvokal eingeordnet und kommt fast ausschließlich in unbetonten Silben vor. Daneben können die französischen Vokale jedoch auch durch die Stellung des Velums charakterisiert und voneinander unterschieden werden. Während bei Oralvokalen das Velum gehoben ist und der Luftstrom fast ausschließlich durch den Mund entweicht, ist bei Nasalvokalen das Velum gesenkt und die Luft kann durch Mund und Nase entweichen (vgl. z. B. Röder, 1996, S. 82 f., 99). Kennzeichnend für den auditiven Eindruck von Oral- und Nasalvokalen ist dabei die stärkere Beteiligung des jeweiligen Resonanzraumes. Während bei Oralvokalen der Mund vorwiegend als Resonanzraum betrachtet werden kann, bestimmt bei Nasalvokalen die Beteiligung des Nasenraumes den Klang des Vokals. Die Vokale des Deutschen werden als Oralvokale bezeichnet, obwohl aus phonetischer Sicht auch deutsche Vokale ein gewisses Maß an Nasalität aufweisen können. Dies trifft vor allem, aber nicht ausschließlich, dann zu, wenn sie im Kontext mit einem Nasal stehen, wie z. B. Benkenstein (2007) über akustische Untersuchungen gezeigt hat. Jedoch ist im Deutschen im Gegensatz zum Französischen die Nasalität phonologisch nicht relevant. Für das Französische werden in der Regel vier distinktive Nasalvokalphoneme angesetzt ( / ˜E, ˜ œ, ˜ A, ˜o / ˜O/ ), die (bis auf [˜ A] ) etwas offener und weiter hinten (vgl. Röder, 1996, S. 99) sowie in allen Positionen länger (vgl. Delattre und Monnot, 1981) als ihre oralen Entsprechungen realisiert werden. Allerdings wird die Opposition zwischen / ˜ œ/ und / ˜E/ 93 tief halbtief untermittelhoch mittel obermittelhoch halbhoch hoch hinten zentral vorn @ • u • o • ˜o • O • ˜a • A • ¨a • a • ˜ œ • œ • ˜E • E • ø • e • y • i • Abbildung 7.2.: Schematische Darstellung der wichtigsten Vokalallophone der französischen Vokalphoneme (modifiziert nach Röder, 1996, S. 84) häufig zugunsten eines vorderen ungerundeten Nasalvokals aufgehoben und [˜E] realisiert (vgl. Fougeron und Smith, 1999, S. 79). Abbildung 7.2 zeigt eine vereinfachte schematische Darstellung der wichtigsten phonetischen Realisierungen der Vokalphoneme des französischen Vokalsystems. Je nachdem ob / ˜ o/ (z. B. bei Klein, 1982) oder / ˜O/ (z. B. bei Röder, 1996) angesetzt wird, liegt auch die Position des Nasalvokals im Vokaltrapez entweder näher an o oder an O . Obwohl sich die Abbildung an Röder (1996) anlehnt, wurde / ˜ o/ als Phonem angenommen und das entsprechende Allophon gewählt, da die Lippenrundung eher dem [o] entspricht (Röder, 1996, S. 99). Neben den bereits genannten Merkmalen fallen im Vergleich zu den Vokalallophonen des Deutschen auch folgende Unterschiede auf: Die französischen Vokalallophone [i] und [u] sind jeweils geschlossener als die deutschen langen Vokalallophone [i: ] und [u: ] und weit geschlossener und gespannter als die deutschen kurzen Vokalallophone [I] und [U] , das französische [y] wird mit einem ähnlichen Öffnungsgrad wie das deutsche [y: ] gebildet. Die französischen Allophone [e] und [E] unterscheiden sich vor allem durch im Vergleich zum Deutschen gespreiztere Lippen bei [e] und höheren Öffnungsgrad bei [E] von den deutschen Allophonen [e: ] und bzw. [E] (vgl. Röder, 1996, 88 f.). 7.2.3. Zu erwartende Abweichungen in Deutsch als L2 Dieser Abschnitt der Arbeit baut auf den bisherigen Betrachtungen zu den Lautsystemen des Deutschen und Französischen auf und soll auf Grund der Unterschiede in ihnen einige typische zu erwartende phonetische Abweichungen französischer Muttersprachler in der Fremdsprache Deutsch aufzeigen. Die für diese Studie besonders relevanten Merkmale werden in Teil IV der Arbeit noch einmal aufgegriffen und diskutiert. 94 Bei einem Vergleich des Inventars der Konsonantenphoneme des Deutschen und des Französischen fallen folgende Unterschiede auf: Die Phoneme / x/ und / h/ (sowie / N/ ) sind Bestandteile des deutschen Konsonantenphoneminventars, kommen aber im Französischen nicht oder nur in Fremdwörtern vor. Dagegen sind / ñ/ und / Z/ Bestandteile des französischen Konsonanteninventars und kommen nicht im Deutschen vor (bzw. / Z/ nur in Fremdwörtern). Aufgrund dieser Unterschiede im Lautsystem können von französischen Muttersprachlern in der Fremdsprache Deutsch abweichende Realisierungen der Phoneme / x/ und / h/ erwartet werden. So wird nach Schmidts (2003) Auflistung häufiger phonetischer Abweichungen französischer Lerner im Deutschen das vordere Allophon des Phonems / x/ nicht als palataler Frikativ [ç] , sondern häufig postalveolar als [ S ] oder auch als velarer Plosiv [k] , das hintere Allophon von / x/ ebenfalls häufig als [k] und nicht als uvularer oder velarer Frikativ realisiert (vgl. Schmidt, 2003, S. 12). / h/ wird nach Schmidt (2003) häufig gar nicht realisiert. Eine weitere mögliche Fehlerquelle Deutsch sprechender französischer Muttersprachler liegt im Vokaleinsatz, der im Deutschen in der Regel mit Glottalverschluss und / oder Glottalisierung gebildet wird, im Französischen jedoch nicht (z. B. in der enchaînement consonantique) bzw. weich (in vokaler Junktur oder enchaînement vocalique) realisiert wird (vgl. Schmidt, 2003, S. 11; Röder, 1996, S. 36). Ferner führt Schmidt (2003, S. 12) an, dass auch Probleme bei der Realisierung des velaren Nasals zu erwarten sind und führt sie neben abweichender Koordination von Velumhebung und -senkung auf positionsbedingte Unterschiede zurück, da im Französischen / n/ vor / k/ nicht assimiliert und somit häufig [nk] anstelle von [Nk] gesprochen würde. Da die Realisierung der Phoneme, die sowohl im Lautsystem des Deutschen als auch in dem des Französischen vorkommen, in den beiden Sprachen nicht identisch ist und auch sprachspezifische positionsabhängige Lautrealisierungen zu Unterschieden führen werden, kommen weitere Variationen französischer Muttersprachler hinzu. Ein bedeutendes Problem stellt die Differenzierung und korrekte Produktion der Kategorien fortis und lenis dar, die an Merkmale wie Stimmbeteiligung und Stimmeinsatzzeit aber auch an Lautdauer gebunden sind. Während im Deutschen Aspiration von Plosiven ein phonetisches Korrelat des phonologischen Merkmals fortis ist, trifft das auf das Französische nicht zu. Verschiedenen deskriptiven Studien zu Folge werden Fortis-Plosive im Französischen in der Regel nicht aspiriert bzw. es folgt ihnen nur eine sehr kurze Aspirationsphase (vgl. z. B. Klein, 1982, S. 126; Röder, 1996, S. 57; Hammarström, 1998, S. 52-54; Meisenburg und Selig, 1998, S. 51-53; Fougeron und Smith, 1999, S. 80). Das soll nach Schmidt (2003, S. 7 f., 12) dazu führen, dass im Deutschen / p, t, k/ ebenfalls nicht oder nur sehr gering behaucht werden. Da die Stimmbeteiligung stimmhafter Plosive im Französischen bereits in der Verschlussphase beginnt, ist davon auszugehen, dass im Deutschen die stimmhaften Plosive ebenfalls vollstimmhaft gebildet werden. Außerdem kann als mögliche Abweichung vom Standarddeutschen auch fehlende Auslautverhärtung stimmhafter Lenes im Silbenauslaut auftreten, was sowohl auf Plosive als auch 95 auf Frikative zutrifft. Umgekehrt kann es beispielsweise im Silbenanlaut dazu kommen, dass französische Muttersprachler lenis durch fortis ersetzen und im Falle von / z/ anstelle eines stimmhaften (oder auch entstimmten) lenis [z, z ˚] im absoluten Anlaut ein stimmloses fortis [s] realisieren (vgl. dazu Schmidt, 2003, S. 12). Weitere Probleme bereitet nach Schmidt (2003) auch die vokalische Realisierung von / r/ bzw. / @r/ , die häufig durch eine frikativische Realisierung ersetzt wird. Klein (1982) gibt deutschen Lernern folgende Ausspracheanweisung für das Französische: In englischen und deutschen Wörtern wird -er + Konsonant im Wortinnern in folgenden Fällen [Er] gesprochen [mit [r] ist hier velares oder uvulares r gemeint]: hinterland, [...], Austerlitz, Metternich. [...] Deutsche Wörter auf -er und -el werden [E: r] bzw. [El] gesprochen: [H]amster, [K]aiser, Adenauer (hier auch wie im Deutschen), Blücher, Dürer [...], Schiller, Weber, Werther u. a. ; [N]ickel [-El] , Diesel [...], Haendel u. a. Gelegentlich: Schopenhauer [@r] . (Klein, 1982, S. 69) Hier wird explizit darauf hingewiesen, wie deutsche Wörter mit / -@r/ oder / -@l/ im Französischen realisiert werden sollen: / -@r/ als in der Regel vorderer ungerundeter untermittelhoher Vokal [E] plus frikativischem r und / -@l/ ebenfalls mit [E] statt wie im Deutschen üblich [@] , das im Deutschen zumeist elidiert und der folgende Lateral silbisch würde. Als letzten Punkt in seiner Auflistung häufiger phonetischer Abweichungen französischer Muttersprachler führt Schmidt (2003, S. 12) an, dass Konsonantenhäufungen im Deutschen zu Problemen führen können (z. B. Konsonanten-Cluster wie in Herbststrauß oder Fläschchen), was zum einen damit zusammenhängt, dass diese komplexen Silbenstrukturen im Französischen seltener, und wenn dann v. a. in Entlehnungen, vorkommen (zur Phonostilistik des Französischen vgl. z. B. Rothe, 1978, S. 78- 91). Außerdem treten in solchen Verbindungen auch Konsonanten auf, die nicht zu den Realisierungen französischer Phoneme zählen. Da im Französischen Vokallänge kein distinktives Merkmal ist, sind für französische Muttersprachler trotz vorhandener Dauerunterschiede in französischen Vokalallophonen aufgrund von Betonung und Lautumgebung v. a. in diesem Bereich Schwierigkeiten in der Realisierung deutscher Vokale zu erwarten. Nach Schmidt (2003) liegt die Hauptschwierigkeit darin, lange Vokale nicht zu kurz und lange geschlossene Vokale in geschlossenen Silben nicht zu kurz und offen zu realisieren. Kurze ungespannte Vokale hingegen werden häufig zu gespannt realisiert und [@] wird fälschlicherweise gerundet, was auf eine gerundete Realisierung des Vokalallophons [@] im Französischen zurückzuführen ist. Da im Französischen die Kombination aus / a+n/ bzw. / o+n/ vor Konsonanten nicht vorkommt, wird ein französischer Muttersprachler vermutlich auch im Deutschen diese Vokale häufig nasaliert realisieren (vgl. Schmidt, 2003, S. 11). Auf suprasegmenteller Ebene besteht bei französischen Muttersprachlern häufig eine Unsicherheit im Setzten des Hauptakzents, was darauf zurückzufüh- 96 ren ist, dass der Akzent im Französischen immer auf der letzten Silbe des mot phonétique liegt. Diese Unsicherheit resultiert in der Tendenz, unbetonte Vokale oder Diphthonge der letzten Silbe zu betonen, was im Deutschen unüblich ist, und findet sich auch in der Betonung von Fremdwörtern wieder. In neutraler Rede jedoch ist der Unterschied zwischen den betonten und den unbetonten Silben im Französischen eher gering und die Betonung wird durch Verlängerung der Vokaldauer, Änderung des Tonhöhenverlaufs und Verstärkung der artikulatorischen Spannung gekennzeichnet. Wird der französische silbenzählende Rhythmus auf das Deutsche mit seinem akzentzählenden Rhythmus übertragen, so werden alle Silben zu gleichmäßig akzentuiert und die im Deutschen erforderlichen Reduktionen in den unbetonten Silben nicht realisiert (vgl. Schmidt, 2003, S. 11; Röder, 1996, S. 26-32). Die Imitationsversuche deutscher Muttersprachler können u. a. Aufschluss darüber geben, welche der oben genannten phonetischen Abweichungen von der deutschen Standardlautung als besonders charakteristisch für einen französischen Akzent im Deutschen wahrgenommen werden. Außerdem werden über die Analyse des Sprachmaterials der französischen Muttersprachler einige der hier aufgeführten Interferenzerscheinungen französischer Deutschlerner genauer untersucht und die allgemeinen Deskriptionen der Forschungsliteratur empirisch überprüft. Damit leistet die vorliegende Arbeit auch einen Beitrag zum Bereich Deutsch als Fremdsprache. 97 Teil IV. Produktion 8. Eingrenzung der phonetischen Analyse Die Textproduktionen der deutschen Muttersprachler, die einen französischen Akzent imitieren, weisen eine Vielzahl verschiedener suprasegmenteller und segmenteller Variationen von den unverstellten Textproduktionen auf und stimmen weitestgehend mit den in Neuhauser (2005) vorgefundenen Variationen überein. Die segmentelle Ebene ist dabei stärker von Abweichungen betroffen als die suprasegmentelle Ebene. Besonders häufig traten folgende Variationen auf: • abweichende Realisierung des vorderen Allophons von / x/ , meist als alveolo-palataler oder postalveolarer Frikativ, • Vermeidung glottaler Friktion für / h/ , • Reduktion der Aspiration in stimmlosen Fortis-Plosiven, • abweichende Realisierung von / r/ , z. B. postvokalische Friktion statt vokalischer Realisierung, • nicht reduzierte Realisierung von Endsilben wie / -@n/ , häufig verbunden mit Änderung der Vokalqualität von / @/ , • abweichende Realisierung von / ts/ meist durch Elision des Plosivs, • Änderung der Vokalqualität, z. B. Nasalierung von Vokalen vor Nasal oder Realisierung eines vorderen gerundeten Vokals für / u, U/ , • Verlagerung des Wortakzents. Ein Hauptziel der vorliegenden Arbeit ist die systematische Untersuchung der Form und Variation bestimmter phonetischer Merkmale im Deutschen, gesprochen mit einem imitierten französischen Akzent von deutschen Muttersprachlern und mit einem authentischen Akzent von französischen Muttersprachlern. Die Analyse umfasst bewusst nicht alle auftretenden phonetischen Abweichungen vom deutschen Standard, sondern soll sich auf einige bestimmte Merkmale beschränken und damit eine vertiefte und systematische Untersuchung dieser Merkmale ermöglichen. In diesem Teil IV der Arbeit werden die Ergebnisse der Analyse dargestellt. Es handelt sich hierbei um eine Kombination aus auditiver und akustischer (instrumental-phonetischer) Analyse, die sich in der forensischen Phonetik durchgesetzt hat 1 , und auch in der vorliegenden Arbeit angewendet wurde. Die für die einzelnen Untersuchungen verwendete Methodik wird in den entsprechenden Kapiteln jeweils detailliert beschrieben. Der Fokus der Analyse liegt auf der Variation glottaler Aktivität bei der Imitation eines französischen Akzents. Eine Abweichung von der gewohnten glottalen Aktivität ist mutmaßlich sehr schwierig, da es sich dabei um die Variation eines 1 Zur Diskussion darüber, welche Analyseart vorzuziehen ist, vgl. z. B. Rose (2002, S. 34-36). 101 phonetischen Details handelt. Für eine erfolgreiche Akzentimitation muss den Sprechern dieses phonetische Detail nicht nur bewusst sein, sondern sie müssen diesen komplexen artikulatorischen Prozess auch authentisch realisieren. Die Analyse umfasst folgende zwei Bereiche: 1. Stimmeinsatzzeit und Stimmbeteiligung bei Plosiven und 2. Junkturelle Glottalisierung und glottale Friktion. Die Unterscheidung zwischen Fortis- und Lenis-Plosiven wird durch verschiedene artikulatorische und akustische Muster realisiert. Seit den 1960er Jahren werden v. a. die Messung der Stimmeinsatzzeit (Voice Onset Time; VOT) zur Kategorisierung von Plosiven herangezogen (vgl. Lisker und Abramson, 1964) und sprachspezifische Muster bei einer solchen Kategorienbildung untersucht (z. B. Keating et al., 1981). VOT kann auch im forensischen Kontext ein wertvoller Parameter zur Sprecheridentifizierung sein (vgl. Künzel, 1987; Braun, 1996; Gurski, 2006). Deutsch und Französisch unterscheiden über das Konzept der VOT jeweils zwei Kategorien, die vereinfacht wie folgt beschrieben werden können: stimmlose aspirierte Fortis-Plosive und stimmlose nichtaspirierte Lenis-Plosive im Deutschen vs. stimmlose nicht-aspirierte Fortis- Plosive und stimmhafte nicht-aspirierte Lenis-Plosive im Französischen. Bei Nicht-Muttersprachlern des Deutschen oder Französischen, die die jeweils andere Sprache als L1 sprechen, können bei der Realisierung von Plosiven in L2 Interferenzen erwartet werden. Neuhauser (2005, 2008) gab erste bedeutende Hinweise darauf, dass deutsche Muttersprachler eine Variation der VOT in Fortis-Plosiven bei der Imitation eines französischen Akzents nutzen und damit auf glottaler Ebene variieren. In Kapitel 9 werden Plosiv-Realisierungen, produziert von deutschen Sprechern im Deutschen mit und ohne imitierten französischen Akzent und produziert von französischen Sprechern im Deutschen und im Französischen, in Hinblick auf die Merkmale Stimmeinsatzzeit und Stimmbeteiligung analysiert und miteinander verglichen. Dies soll weiteren Aufschluss über die Variationsmöglichkeiten auf glottaler Ebene geben. Glottale Aktivität im Silbenanlaut im Französischen unterscheidet sich noch in zwei weiteren wesentlichen Aspekten vom Deutschen, auf denen der Fokus in Kapitel 10 liegt. Zum einen wird im Französischen nur in bestimmten Kontexten ein glottalisierter Vokaleinsatz (z. B. bei Emphase) produziert. Zum anderen enthält das französische Phonemsystem kein Phonem / h/ . Es ist zu erwarten, dass beide Merkmale als Interferenzerscheinungen auf die Fremdsprache Deutsch übertragen werden (vgl. Schmidt, 2003). Neuhauser (2005, 2008) zeigte, dass die Nichtrealisierung des glottalen Frikativs im Silbenanlaut wohl eines der bekanntesten Merkmalen eines stereotypischen französischen Akzents im Deutschen ist, da der Versuch, glottale Friktion zu unterdrücken, zu den häufigsten Variationen deutscher Muttersprachler bei der Akzentimitation gehörte. Auch bei der Probandenbefragung im Rahmen der Korpuserstellung für die vorliegende Studie war die Nicht-Realisierung von / h/ das am häufigsten genannte Merkmal eines französischen Akzents. Es bleibt zu überprüfen, 102 inwieweit deutsche Muttersprachler bei der Akzentimitation beide Merkmale - Nicht-Realisierung des / h/ bei gleichzeitiger nicht-glottalisierter Realisierung eines Vokaleinsatzes - erfolgreich umsetzen können und inwieweit französische Muttersprachler in ihrem Deutsch diese angeblich typischen Aussprachemerkmale aufweisen. An die Ausführungen zu den genannten Variationen auf glottaler Ebene schließt sich in Kapitel 11 die Darstellung der Analyseergebnisse zur Realisierung von Endsilben als einem Beispiel für artikulatorische Variation an. In der deutschen Standardaussprache werden die Endsilben / -@n, -@m, -@l/ meist nicht voll realisiert, sondern u. a. abhängig vom vorangehenden Laut reduziert (vgl. Meinhold und Stock, 1980; Rues, 1993). In diesem Prozess wird mit dem Wegfall des / @/ als Silbenträger der Nasal silbisch und ggf. in seiner Artikulationsstelle (Artikulationsort und -organ) an den vorangehenden Laut assimiliert. Außerdem kann es auch zur nasalen oder lateralen Sprengung von Plosiven oder deren Elision kommen. Diese komplexen artikulatorischen Prozesse können den Deutschlerner vor große Herausforderungen stellen. Überprüft werden soll, ob deutsche Muttersprachler bei der Imitation eines französischen Akzents eine reduzierte Form oder eine volle Realisierung (Vokal-Konsonant-Sequenz) der Endsilben zeigen und wie sich die Deutsch sprechenden französischen Muttersprachler in diesem Aspekt verhalten. 103 9. Stimmeinsatzzeit und Stimmbeteiligung bei Plosiven Die Unterscheidung zwischen den Phonemen / b, d, g/ und / p, t, k/ wird durch verschiedene artikulatorische und akustische Muster realisiert, wie z. B. Dauer des Verschlusses, Stärke des intraoralen Luftdrucks und Stärke der Verschlusssprengung, Stimmeinsatzzeit oder Dauer des dem Plosiv vorausgehenden Vokals, und sie ist sprachspezifisch in ihrer Ausprägung. Doch auch innerhalb einer Sprache wird die Unterscheidung zwischen den phonologischen Kategorien fortis und lenis durch entsprechende phonetische Muster getroffen, die z. B. abhängig vom lautlichen Kontext, der Silbenposition und der Sprechgeschwindigkeit sind (vgl. u. a. Kohler, 1984). Eine Kategorisierung von Plosiven über die Voice Onset Time (VOT, Stimmeinsatzzeit oder Stimmtoneinsatz) wird spätestens seit Mitte der 1960er Jahre in verschiedenen Studien immer wieder aufgegriffen und die Arbeit von Lisker und Abramson (1964) als „Ursprung“ der Idee zitiert, dass die zeitliche Relation zwischen Plosivlösung und Beginn der Stimmhaftigkeit die wichtigste phonetische Ausprägung der phonologischen Kategorien fortis und lenis sei. Allerdings zeigt Braun (1983) auf, dass bereits Adjarian (1899) in einem Aufsatz über Plosive im Altarmenischen auf die Relation von Verschlusslösung und Beginn der Stimmlippenvibration hinweist. Damit ist das Konzept der VOT, jedoch noch nicht unter diesem Namen, zeitlich bereits im späten 19. Jahrhundert anzusiedeln. Als Referenzpunkt für die Berechnung der VOT dient die Lösung des oralen Verschlusses. Setzt die Vibration der Stimmlippen vor diesem Zeitpunkt ein und eilt damit der Verschlusslösung voraus, wird von voicing lead gesprochen und der VOT-Wert ist negativ. Die Plosive werden in diesem Fall als stimmhaft bezeichnet. Setzt die Stimmhaftigkeit erst nach der Verschlusslösung ein, eilt ihr nach, so spricht man von voicing lag und der VOT-Wert ist positiv. Je nach Größe der positiven VOT-Werte können diese außerdem in short lag (20- 35 ms) und long lag ( ≥ 35 ms) unterschieden werden. Dabei werden Plosive, die in die erste Gruppe fallen, traditionell als stimmlos unaspiriert (voiceless unaspirated) und Plosive, die in die zweite Gruppe fallen, als stimmlos aspiriert (voiceless aspirated) beschrieben (vgl. Keating, 1984, S. 295). Vorteil von VOT als Messdimension ist, dass Stimmbeteiligung, Aspiration und Artikulationsstärke nicht mehr getrennt behandelt, sondern als Konsequenz einer einzigen Variable zusammengefasst werden (vgl. Lisker und Abramson, 1964, S. 422). Damit ist es möglich, phonemische Kategorien innerhalb der Gruppe von Plosiven zu unterscheiden. Die Anzahl dieser Plosivkategorien variiert von Sprache zu Sprache und auch die Grenzen zwischen den einzelnen Kategorien sind sprachspezifisch (vgl. Keating et al., 1981). Deutsch, Englisch und Französisch kontrastieren zwischen zwei Kategorien. Es sind aber bis zu drei Plosivkategorien möglich, die allein über VOT kontrastiert werden können, so z. B. im Thai (vgl. Lisker und Abramson, 1964; Keating, 1984). 105 Sprachübergreifend ist die Dauer der VOT von verschiedenen Faktoren abhängig (vgl. z. B. Lisker und Abramson, 1964; Klatt, 1975; Ohala und Riordan, 1979; Ohala, 1983; Keating, 1984; Braun, 1988, 1996; Theodore et al., 2007; Abdelli- Beruh, 2009): So spielt z. B. der Artikulationsort des Plosivs eine Rolle. Die längsten VOTs wurden bei velaren Plosiven und kürzere dagegen bei bilabialen und alveolaren Plosiven gemessen, was über einen verkürzten transglottalen Druckausgleich mit zunehmender Entfernung von der Glottis und zunehmender Beweglichkeit des artikulierenden Organs erklärt wird. Auch der dem Plosiv folgende Vokal soll eine, wenngleich nicht so starke, Auswirkung auf die VOT haben, allerdings fallen die Untersuchungsergebnisse inkonsistent bezüglich dieses Einflussfaktors aus. Schließlich sei noch die Sprechgeschwindigkeit (verringerte VOT bei erhöhter Sprechgeschwindigkeit), die Position im Wort sowie die Position des Wortakzents zu nennen. So spielt die VOT intervokalisch eine untergeordnete Rolle und ist äußerungs- oder wortinitial v. a. in betonten Silben am höchsten. Aus artikulatorischer und aerodynamischer Perspektive lässt sich die Aspiration von stimmlosen Plosiven nach Stevens (1998) wie folgt kurz skizzieren. Für die Bildung eines Plosivs ist zunächst ein vollständiger Verschluss des Mund- und Nasenraumes erforderlich. Während der Phase der oralen Verschlussbildung ist der intraorale Luftdruck gleich 0, steigt jedoch mit dem Verschluss und gleicht sich dem subglottalen Druck an, da weiterhin Luft durch die geöffnete Glottis fließt. Durch aktive Erhöhung der Spannung der Vokaltraktwände wird eine Ausdehnung des Vokaltrakts verhindert und der intraorale Luftdruck steigt weiter. Zudem wirkt eine gleichzeitige Spannung der Stimmlippen. Bei stimmlosen unaspirierten Plosiven bewirkt der steigende Luftdruck oberhalb der Glottis eine abduzierende Kraft auf die Stimmlippen, die eine passive Öffnungsgeste derselben zur Folge hat. Dagegen sind aspirierte stimmlose Plosive durch eine aktive Öffnungsgeste charakterisiert, die ihr Maximum zeitnah zur Lösung des oralen Verschlusses erreicht (vgl. Jessen, 1998, S. 227-230). Diese weite Öffnung der Glottis (erreicht durch eine durch den musculus cricoarytenoideus posterior gesteuerte Drehbewegung der Aryknorpel) bewirkt, dass die Erhöhung des intraoralen Luftdrucks bei aspirierten Plosiven schneller erfolgt als bei unaspirierten. Der hohe intraorale Luftdruck und die weit geöffnete Glottis haben zur Folge, dass der transglottale Druck sinkt und keine Stimmlippenschwingung mehr möglich ist. Mit der Lösung des Verschlusses sinkt der intraorale Luftdruck, der sich hinter dem Verschluss gebildet hat, und der transglottale Luftstrom steigt rapide an. Durch diesen starken Luftstrom, der auch das sich nun öffnende Hindernis passiert, entstehen Turbulenzen an dem Hindernis und es kommt zu einem (oralen oder supraglottalen) Friktionsrauschen. Je nach Ausmaß der Kontaktfläche für die Verschlussbildung dauert die Lösung unterschiedlich lang und so ist bei Velaren die Friktionsphase etwas länger als bei Labialen (vgl. Stevens, 1998, S. 451-460). Vor allem bei velaren Plosiven, für die eine relativ lange Kontaktfläche während des Verschlusses charakteristisch ist, kann es außerdem zu einem aerodynamischen Prozess kommen, der 106 dem Bernoulli-Effekt an den Stimmlippen gleicht. Der Druck hinter dem oralen Verschluss verursacht ein Auseinandergehen der Wände der Artikulationsorgane. Wenn eine Öffnung erreicht ist, fließt die Luft durch diese hindurch und der Luftdruck innerhalb des Hindernisses fällt. Daraufhin gehen die Wände der Artikulationsorgane in ihre Ausgangslage zurück und der Luftstrom wird wieder abgeschnitten. Dieser Prozess wiederholt sich mehrere Male und führt in der Konsequenz zu Mehrfachlösungen des velaren Verschlusses und einer längeren Öffnungsphase insgesamt (vgl. Stevens, 1998, S. 121). Nach der oben beschriebenen Friktionsphase durch Turbulenzen am oralen Hindernis folgt eine Phase, in der nicht mehr das Rauschen am Hindernis, sondern das durch den starken transglottalen Luftstrom verursachte Rauschen dominant ist. Diese glottale Friktion wird auch als Aspiration bezeichnet. Nachdem der transglottale Luftstrom seinen Höhepunkt erreicht hat und wieder abnimmt, setzt auch die Stimmlippenvibration wieder ein. Bis die Modalstimme erreicht ist, findet man häufig noch behauchte Stimme (vgl. Stevens, 1998, S. 451-460). Fortis-Lenis im Deutschen Im Standarddeutschen werden nach Kohler (1995) die Plosive / p, t, k, b, d, g/ wie folgt realisiert: Die Fortis-Plosive / p, t, k/ werden in initialer Position sowie wortfinal aspiriert realisiert. Dabei ist die Aspiration in betonten Silben stärker, nach betonten Silben jedoch schwächer. Außerdem sind Plosive vor dem akzentuierten Vokal stärker aspiriert als Plosive nach dem akzentuierten Vokal. Die Aspiration fällt geringer aus oder kann ganz fehlen, wenn dem Plosiv ein / S/ oder / s/ vorausgeht (spät, huste) oder wenn ein anderer Plosiv unmittelbar folgt. Außerdem werden nasalgelöste Fortis-Plosive unaspiriert realisiert. Fortis-Plosive mit folgendem / l/ oder / r/ sind nach Kohler (1995) nicht im engeren Sinne aspiriert, d. h. die VOT verlängert sich und als Folge dessen werden / l/ und / r/ initial stimmlos. Die Lenis-Plosive / b, d, g/ werden nur intervokalisch voll stimmhaft (voicing lead) realisiert, in initialer Position setzt die Stimmhaftigkeit erst mit oder kurz vor der Verschlusslösung (short lag) ein. Nasal oder lateral gelöste Lenis-Plosive können ebenfalls entstimmt sein. Im Extremfall sind sowohl die Plosive der Kategorie fortis als auch lenis durch völliges Fehlen von Stimmhaftigkeit in der Verschlussphase sowie durch fehlende Aspiration im nasal oder lateral gelösten Plosiv und durch Entstimmung des nachfolgenden silbischen Nasals oder Laterals gekennzeichnet. In diesem Fall müssen die Kategorien fortis und lenis über andere phonetische Kategorien wie der Dauer des vorangehenden Vokals differenziert werden (vgl. Kohler, 1995, S. 157-159). Braun (1996) zufolge, einer Untersuchung zur regionalen Verteilung von VOT im Deutschen, fehlen für die Standardaussprache des Deutschen noch systematische Untersuchungen mit repräsentativen Stichprobengrößen. Jessen (1998) gibt eine gute Übersicht der Forschungsliteratur zur Thematik der Stimmbe- 107 teiligung und Aspiration bei Obstruenten im Standarddeutschen und bezieht dabei sowohl präskriptive Hinweise der Aussprachewörterbücher (u. a. Duden und das Große Wörterbuch der deutschen Aussprache) als auch transkriptionsbasierte Untersuchungen und verschiedene akustisch phonetische Studien inklusive eigener Analysen ein. Es sei an dieser Stelle zur weiteren vertieften Diskussion der Literatur daher auf Jessen (1998) verwiesen. Seine empirischen Untersuchungen mit sechs Sprechern aus dem norddeutschen (standardnahen) Raum ergaben, dass die Opposition zwischen Fortis- und Lenis-Plosiven (hier synonym verwendet zu den Termini tense und lax) bei allen Sprechern und in den drei untersuchten Kontexten intervocalic, utterance-initial und post-voiceless signifikant über das Merkmal Aspirationsdauer 1 realisiert wird, die Beteiligung oder Abwesenheit von Stimmhaftigkeit als Korrelat dieser Opposition im Deutschen jedoch nicht ausreicht. Diese Ergebnisse decken sich damit größtenteils mit den von ihm beschriebenen Ergebnissen zur Aspiration in der Literatur, bestätigen jedoch nicht, dass intervokalisches / p, t, k/ unaspiriert sei. Die Ergebnisse zeigen außerdem, dass zumindest im Kontext „Plosiv vor silbischem Sonorant“ der Parameter Aspirationsdauer nicht zur Oppositionsunterscheidung ausreicht und andere Parameter wie Verschlussdauer oder Dauer des vorangehenden Vokals einbezogen werden müssen. In einem Vergleich der VOT-Messungen verschiedener Studien konnten in Braun (1996) für alle untersuchten dialektalen Großräume 2 des Deutschen sowie für die Standardaussprache signifikante Unterschiede zwischen der VOT der Fortis- und der Lenis-Plosive festgestellt werden. Innerhalb der Gruppe der Lenis-Plosive wurden hinsichtlich der VOT nur geringe Unterschiede zwischen dem Nord- und dem Westmitteldeutschen gefunden, wobei das Oberdeutsche etwas höhere Werte bei den alveolaren und velaren Lenes aufwies. Die Lenis-Plosive werden nach den Vergleichen von Braun (1996) nur im Norddeutschen sporadisch auch stimmhaft, d. h. mit negativer VOT, realisiert, im Oberdeutschen (und Mitteldeutschen, zu dem jedoch widersprüchliche Beobachtungen vorliegen) dagegen stimmlos. Für die Gruppe der Fortis-Plosive lässt sich zusammenfassend festhalten, dass sich die höheren VOT-Werte des Westmitteldeutschen signifikant von den niedrigeren Werten des Ostoberdeutschen unterscheiden. Ein ähnlicher aber statistisch nicht überprüfbarer Trend lässt sich für das Westnorddeutsche beobachten, dessen ermittelte VOT-Werte höher als die des Ostnorddeutschen liegen (vgl. Braun, 1996, S. 23-29). Die Angaben zum (West-) Mitteldeutschen beziehen sich auf die Daten aus dem Hessischen aus Braun (1988); Daten zur Überprüfung des Ostmitteldeutschen standen Braun (1996) nicht zur Verfügung. Für die meisten mitteldeutschen Dialekte ist eine Neutralisierung der Fortis-Lenis-Opposition charakteristisch. Simmler (1983) und Spangenberg (1993), beides deskriptive dialektologische 1 Die Definition des Terminus Aspirationsdauer (bzw. stop aspiration) und die Messmethodik bei Jessen (1998) sowie die Ergebnisse der Studie werden weiter unten in diesem Kapitel ausführlicher diskutiert und mit der Methodik und den Ergebnissen der vorliegenden Arbeit verglichen. 2 Ausnahme bildet hier das Schweizerdeutsche, da hier VOT kein distinktiver Parameter zu sein scheint und andere Korrelate zur Unterscheidung herangezogen werden. 108 Arbeiten, beschreiben aus synchroner und diachroner Sicht am Beispiel verschiedener mitteldeutscher Dialekte die sogenannte Binnen(hoch)deutsche Konsonantenschwächung - ein Lenisierungsprozess, der nahezu im gesamten mitteldeutschen sowie nord- und mittelbairischen Sprachraum stattfindet und der u. a. mit Veränderungen der Stimmhaftigkeit und Verringerung der Luftdruckstärke sowie der Aspiration verbunden ist. John (2004), eine Untersuchung zur Fortis-Lenis-Opposition im Sächsischen, in der der Schwerpunkt aber explizit nicht auf der VOT, sondern auf anderen phonetischen Korrelaten liegt, konnte für alveolare Plosive (leiden/ leiten-Paare) in den untersuchten sächsischen Dialekten eine Neutralisierung der Fortis-Lenis-Opposition zu Gunsten der Lenis- Kategorie feststellen. Zusammen mit den Beschreibungen von Simmler (1983) und Spangenberg (1993) lässt das für das Ostmitteldeutsche niedrigere VOT- Werte für die (ursprünglich) Fortis-Plosive vermuten 3 . Fortis-Lenis im Französischen Wie im Deutschen werden auch im Französischen nur zwei VOT-Kategorien kontrastiert (vgl. Keating, 1984, S. 296). Wie bereits in Kapitel 7.2 dargestellt, werden in phonetischen Beschreibungen der französischen Standardaussprache stimmlose Fortis-Plosive als gespannt und meist nicht oder nur sehr gering aspiriert charakterisiert, d. h. die Stimmlippenschwingung setzt direkt nach der Plosivlösung ein (short lag). Allerdings ist in einigen regionalen Varianten des Französischen, in emphatischen Ausdrücken sowie vor hohen Vokalen auch eine der Plosivlösung folgende Aspiration oder Friktion möglich (vgl. Caramazza und Yeni-Komshian, 1974; Fougeron und Smith, 1999; Abdelli-Beruh, 2004; Léon, 2005, 2009). So schreibt Léon (2009) beispielsweise: En français standard, les occlusives ne sont pas aspirées. Mais elles peuvent l’être dialectalement, dans les parlers ruraux de Normandie, de Picardie, de Saintonge ou du Poitou qui les ont transmises au français canadien de la région de la Beauce et des Provinces maritimes. Elles sont en réalité soufflées. (Léon, 2009, S. 102 f.) Die Lenis-Plosive werden im Französischen in der Regel in allen Positionen (also auch auslautend) voll stimmhaft realisiert und weisen damit negative VOT-Werte auf. Allerdings ist durch regressive Assimilationsprozesse eine Angleichung im Merkmal der Stimmbeteiligung an einen folgenden stimmlosen Konsonanten möglich, was eine teilweise bis totale Entstimmung und / oder Erhöhung der artikulatorischen Stärke zur Folge haben kann. Umgekehrt können durch die regressive Assimilation auch / p, t, k/ stimmhaft realisiert werden 3 Es soll an dieser Stelle noch einmal darauf hingewiesen sein, dass Braun (1988) für den untersuchten hessischen Dialekt signifikante Unterschiede in der VOT initialer prävokalischer Plosive fand. Diese zu den Beschreibungen von Simmler (1983) und Spangenberg (1993) teils widersprüchlichen Ergebnisse zeigen, dass sich die binnen(hoch)deutsche Konsonantenschwächung im Hessischen vorwiegend über die Stimmbeteiligung und weniger über die Aspirationsdauer manifestiert. 109 (vgl. z. B. Röder, 1996; Abdelli-Beruh, 2004; Léon, 2005). Temple (1999) zeigte jedoch auch, dass es im Französischen (ebenso wie in anderen Sprachen) geschlechtsspezifische Tendenzen zur Entstimmung gibt, und dass Sprecherinnen phonologisch stimmhafte Plosive öfter entstimmen als männliche Sprecher. Außerdem konnte z. B. für die Region um Bordeaux eine erhöhte Tendenz zur Entstimmung v. a. im Auslaut gezeigt werden. Abdelli-Beruh (2004) untersuchte bei neun französischen Muttersprachlern die phonetischen Korrelate der Fortis-Lenis-Opposition im In- und Auslaut einsilbiger Wörter (teils Nonsens-Silben), die in Trägersätzen mit verschiedenem lautlichen Kontext eingebettet sind. Die für diesen Teil der Arbeit relevanten Ergebnisse lassen sich wie folgt zusammenfassen: Französische silbeninitiale / b, d, g/ wurden mit einer signifikant niedrigeren VOT (short lag) produziert als / p, t, k/ und zwar sowohl im Kontext zwischen Vokalen als auch zwischen stimmlosen Frikativen. Außerdem war die Verschlussdauer der / b, d, g/ , deren Verschlussphase einen Stimmhaftigkeitsanteil von über 75 % aufwies, signifikant kürzer als die Verschlussdauer von / p, t, k/ . Die Position innerhalb der Silbe hatte zwar einen Effekt auf die Dauer des Plosivverschlusses und die Länge des vorhergehenden Vokals, nicht jedoch auf die VOT oder die Dauer der Verschlusslösung (vgl. Abdelli-Beruh, 2004, S. 215 f.). Abdelli-Beruh (2009) zeigt, dass sich die Dauer der VOT auch im Französischen umso mehr erhöht, je weiter hinten sich die Verschlussstelle des Plosivs befindet ( / p/ ≤ / t/ ≤ / k/ ). Diese Ergebnisse entsprechen einerseits den Beobachtungen für das Deutsche (initiale Position) von Braun (1988), unterscheiden sich jedoch teilweise von den von Jessen (1998) ermittelten Werten in intervokalischer Position ( / p/ ≤ / k/ ≤ / t/ ). Zur Diskussion dazu sei auf Abdelli-Beruh (2009) verwiesen. Während im Deutschen Aspiration ein wichtiges phonetisches Korrelat der Fortis-Lenis-Opposition darstellt, wird diese Unterscheidung im Französischen vorwiegend über andere Faktoren realisiert. Perzeptionsexperimente, wie z. B. van Dommelen (1983), zeigten, dass Verschlussdauer, Dauer und Intensität der Stimmhaftigkeit während der Verschlussbildung, Intensität der Verschlusslösung sowie Dauer und Qualität des dem Plosiv vorausgehenden Vokals für französische Muttersprachler eine erhebliche Rolle in der Diskriminierung zwischen französisch / p, t, k/ und / b, d, g/ spielen. Die vorangegangenen Ausführungen haben gezeigt, dass die Stimmeinsatzzeit eines der Merkmale im Fortis-Lenis-Kontrast bei Plosiven ist, bei dem sich die Realisierung der Phoneme / b, d, g/ und / p, t, k/ im Französischen von der im Deutschen unterscheidet. Stark vereinfacht könnte wie in Tabelle 9.1 eine Verteilung der VOT für die Sprachen Deutsch und Französisch gegenübergestellt werden. Zusammenfassend lässt sich festhalten, dass / p, t, k/ im Deutschen als stimmlose orale (teils stark) aspirierte Plosive realisiert werden, wobei sich, z. B. in bestimmten lautlichen Kontexten, die Aspiration verringern kann. / b, d, g/ 110 Tabelle 9.1.: Vereinfachter Vergleich der VOT-Systeme Deutsch-Französisch Sprache / p, t, k/ / b, d, g/ Deutsch positive VOT 0-positive VOT Französisch 0-positive VOT negative VOT sind im Deutschen entstimmte (oder in intervokalischem Kontext auch stimmhafte) Plosive, die nicht oder nur wenig aspiriert sind. Französische / p, t, k/ hingegen werden als stimmlose orale Plosive mit keiner oder geringer Aspiration realisiert, und / b, d, g/ als meist stimmhafte Plosive mit keiner Aspiration (oder gering aspiriert, wenn Entstimmung vorliegt) gebildet. Während sich die Fortis-Plosive vor allem durch starke Aspiration im Deutschen und wesentlich geringere Aspiration im Französischen unterscheiden, werden die Lenis-Plosive v. a. durch die Stimmbeteiligung, die im Französischen stärker ist als im Deutschen, differenziert (vgl. Künzel, 1977a). Ausgehend von den Sprachgewohnheiten in seiner Muttersprache (L 1 ) könnte von einem französischen Muttersprachler im Deutschen (L 2 ) erwartet werden, dass er korrespondierend zu den französischen Fortis-Plosiven auch / p, t, k/ im Deutschen mit weniger Aspiration und damit einer verkürzten VOT produziert und ggf. die Lenis-Plosive mit einer erhöhten Stimmbeteiligung realisiert. Diese möglichen Interferenzerscheinungen werden auch von Schmidt (2003) beschrieben. Auf der anderen Seite zeigt Künzel (1977a,b), dass eine typische Interferenzerscheinung deutscher Muttersprachler im Französischen die Aspiration der Fortis-Plosive ist. In einer Untersuchung zur automatischen Erkennung fremdsprachiger Akzente im Französischen zeigten Vieru-Dimulescu et al. (2007) außerdem, dass deutsche und englische Muttersprachler französisches / b, d, g/ entstimmt realisiert haben. Van Dommelen (1983) beschreibt, dass in seinem Perzeptionsexperiment mit französischen Stimuli und französischen Muttersprachlern als Hörer, die Stimuli zu Irritationen bei den Hörern geführt haben, in denen der Verschluss zwar fast vollständig stimmhaft war, jedoch mit starker Aspiration gelöst wurde. Einige der Hörer glaubten, gleichzeitig ‚d‘ und ‚t‘ zu hören und andere einen fremdsprachigen (deutschen) Akzent zu hören. In den meisten Fällen favorisierten sie den Lenis-Plosiv, was nach van Dommelen (1983) für das starke Gewicht der Stimmhaftigkeit als diskriminierendes Merkmal im Französischen spricht (vgl. van Dommelen, 1983, S. 40, 60 f.). 111 Fortis-Lenis im forensischen Kontext Es liegt nahe, dass ein sensibles phonetisches Detail wie VOT auch als Parameter im Bereich der forensischen Phonetik eingesetzt werden kann. So weist z. B. Künzel (1987) darauf hin, dass die Aspirationsdauer selbst unter harten forensischen Randbedingungen ein wertvoller Parameter sei, da die Abweichungen in der Realisierung nicht nur dialektal bedingt sind, sondern auch innerhalb einer Sprechergruppe mit homogenem dialektalem Hintergrund schwankt und die Realisierung damit stark sprecherspezifisch sei (vgl. Künzel, 1987, S. 46-51, 87). Auch Braun (1996) wirft auf, dass die forensische Erfahrung zeigt, dass es selbst bei geschulten (standardnahen) Sprechern möglich sei, die regionale Herkunft mithilfe der VOT einzugrenzen. Sie fordert jedoch weiterführende Untersuchungen auf diesem Gebiet. In Gurski (2006) wird der Wert der VOT bezogen auf die Identifikation von bilingualen Sprechern (Englisch-Französisch / Französisch-Englisch) im forensisch-phonetischen Kontext diskutiert. Eine Untersuchung mit acht bilingualen Sprechern ergab, dass diese hinsichtlich der VOT ein Hybrid-System nutzen, das weder den typischen Mustern des Französischen noch des Englischen entspricht. Die Sprecher variierten außerdem ihre VOT nicht signifikant, wenn sie zwischen diesen beiden Sprachen wechselten. Außerdem wird es von der Mehrheit der Sprecher in gleicher Weise genutzt, unabhängig davon, ob Englisch oder Französisch die Erstbzw. die Zweitsprache ist. Merkmal dieses Hybrid-Systems der bilingualen Sprecher aus Gurski (2006) ist, dass stimmlose Plosive eine positive VOT aufweisen (vergleichbar zum Englischen) und dass stimmhafte Plosive vergleichbar zum Französischen eine negative VOT aufweisen. Damit liegt eine Verteilung vor, die nach Keating (1984) in Sprachen wie dem Englischen oder Französischen normalerweise nicht vorkommt, da sie nur zwei VOT-Kategorien kontrastieren und es auszureichen scheint, entweder fortis durch Aspiration oder lenis durch aktive Stimmhaftigkeit zu signalisieren. Tabelle 9.2 zeigt einen Vergleich der Voice-Onset-Systeme von Französisch, Englisch und dem Hybrid-System aus Gurski (2006). Vergleiche mit jeweils vier monolingualen Sprechern des Englischen und Französischen ergaben signifikante Unterschiede im Französischen gesprochen von monolingualen und bilingualen Sprechern, aber keine signifikanten Unterschiede im Englischen gesprochen von monolingualen Sprechern und bilingualen Sprechern mit Englisch als Erstsprache (aber signifikante Unterschiede, wenn Französisch die Erstsprache war). Die bilingualen Sprecher erreichten also in den meisten Fällen keine muttersprachsnahe VOT (mit der Ausnahme Englisch gesprochen von englisch-französischen Bilingualen), was die Komplexität in der Produktion kleiner phonetischer Details zeigt und daher auch für eine Identifikation von bilingualen Sprechern genutzt werden könnte. Dennoch bleibt die Frage nach der Ursache dieser Signifikanzunterschiede offen. Problematisch für diese Untersuchung war auch die starke intraindividuelle Variabilität, die größer war als die interindividuelle Variabilität und letztlich eine Identifizierung der Spre- 112 Tabelle 9.2.: Vergleich der VOT-Systeme Englisch-Französisch-Bilingual (modifiziert nach Gurski, 2006) Sprache / p, t, k/ / b, d, g/ Englisch positive VOT VOT = 0 Französisch VOT = 0 negative VOT Bilingual Fr / En, En / Fr, positive VOT negative VOT cher als mono- oder bilingual erschwert (C. Gurski; persönliche Mitteilung, Juni 2009). Die Frage nach dem Wert der VOT für die forensische Phonetik konnte in Gurski (2006) noch nicht eindeutig beantwortet werden und gibt gerade damit Anlass zu verstärkter Forschungstätigkeit in diesem Bereich. Nicht mit einem forensischen Hintergrund, sondern aus der Perspektive des Fremdsprachenerwerbs untersuchen Flege und Hammond (1982) die Möglichkeit der Variation von VOT bei der Imitation eines spanischen Akzents im Englischen. Die amerikanisch-englischen Muttersprachler (N = 20), die einen spanischen Akzent imitierten, wiesen bei initialem / t/ durchschnittlich 30 ms kürzere VOT-Dauern auf als Sprecher einer Kontrollgruppe mit unakzentuiertem Englisch. Sie zeigten jedoch keinen Kategorienwechsel zu / d/ , d. h. die VOT- Werte lagen noch unter den Werten, die für das englische / d/ angesetzt werden. Da die Studie mit einer Kontrollgruppe arbeitet, zeigt sie leider nicht, wie stark die einzelnen Sprecher oder die Sprechergruppe die VOT bei der Akzentimitation reduzieren. Außerdem ist die Analyse auf initiales / t/ beschränkt. Neuhauser (2005, 2008) konnte mit einer Sprechergruppe von acht deutschen Muttersprachlern zeigen, dass die Sprecher bei der Imitation eines französischen Akzents die VOT bei initialen Fortis-Plosiven ( / p, k/ ) teilweise erheblich reduzierten. Einige dieser Sprecher waren in ihren Produktionen dabei konsistent und wiesen zum Teil außerdem Merkmale auf, die mit den phonetischen Korrelaten der Kategorie lenis zusammenzubringen sind, z. B. kürzere Verschlussdauer und schwächere Verschlusssprengung. Die Ergebnisse von Flege und Hammond (1982) sowie aus Neuhauser (2005, 2008) können dahingehend gedeutet werden, dass sich die Sprecher einer möglichen Interferenzerscheinung in Form einer reduzierten VOT im Englischen bzw. Deutschen gesprochen von spanischen bzw. französischen Muttersprachlern bewusst waren. Sie zeigen außerdem, dass sich die Sprecher in diesem Merkmal in ihrer Verstellung dem angestrebten Akzent anpassen können. Allerdings beziehen weder Flege und Hammond (1982) noch Neuhauser (2005, 2008) authentische Produktionen spanischer Muttersprachler im Englischen bzw. französischer Muttersprachler im Deutschen in ihre Untersuchung ein. Diese könnten jedoch einen Hinweis darauf geben, wie erfolgreich die Akzentimitation in Hinblick auf das Merkmal VOT ist. 113 9.1. Variation der Stimmeinsatzzeit in Fortis-Plosiven Innerhalb der vorliegenden Arbeit ist die Untersuchung zur Variation der VOT während der Stimmverstellung durch einen französischen Akzent zu erweitern und die oben genannten Ergebnisse der Vorstudien (Neuhauser, 2005, 2008) sind anhand einer größeren Stichprobe zu überprüfen und statistisch auszuwerten. Ziel dieser Untersuchung ist es, den Wert des Parameters VOT im forensischen Kontext mit dem Hintergrund der Akzentimitation herauszuarbeiten. Dabei wird aufbauend auf den theoretischen Vorüberlegungen zur sprachspezifischen Ausprägung der VOT als phonetisches Korrelat des Merkmals fortis sowie schlussfolgernd aus den Ergebnissen der Vorstudien die Behauptung aufgestellt, dass deutsche Muttersprachler in der Lage sind, die VOT stimmloser Fortis-Plosive während der Stimmverstellung systematisch zu variieren. Die zu überprüfende gerichtete Hypothese H 1 lautet wie folgt: H 1 : Deutsche Muttersprachler reduzieren die VOT stimmloser Fortis-Plosive bei der Verstellung durch einen französischen Akzent. Erweiternd zu dieser Hypothese stellen sich außerdem folgende Fragen: 1. Sind die verstellten Versionen der deutschen Muttersprachler hinsichtlich des Merkmals der VOT mit den deutschen Produktionen der französischen Muttersprachler vergleichbar? Oder anders formuliert: Wie gut wird der in der Verstellung angestrebte französische Akzent erreicht? 2. Wie stark verändern die französischen Muttersprachler ihre VOT, wenn sie Deutsch sprechen im Vergleich zu ihren französischen Produktionen? Der Schwerpunkt der Untersuchung soll der Überprüfung der oben aufgestellten Hypothese dienen und liegt in der Analyse der VOT initialer Fortis- Plosive in den durch französischen Akzent verstellten Textproduktionen deutscher Muttersprachler verglichen mit ihren jeweiligen unverstellten Textproduktionen. Außerdem werden die Daten aus den verstellten Textproduktionen der deutschen Muttersprachler den Daten der französischen Muttersprachler in ihren deutschen Textproduktionen gegenübergestellt. Zuletzt soll ein Vergleich der VOT initialer Fortis-Plosive französischer Muttersprachler in ihren deutschen Produktionen mit ihren französischen Produktionen zeigen, wie stark die Variation der VOT auf dieser Seite ist. 9.1.1. Methode Dass die VOT-Dauer als Messmethodik zur Beschreibung von Plosiven nicht unumstritten ist und je nach Untersuchungsschwerpunkt variiert werden muss, zeigt u. a. die Diskussion in Künzel (1977a), Braun (1988) und Jessen (1998). So greift Künzel (1977a) z. B. Kritik aus der Literatur auf, wonach VOT zum einen in einigen Sprachen nur in initialer Silbenposition sinnvoll eingesetzt werden 114 kann, nicht jedoch intervokalisch oder gar final. Außerdem müsse unterschieden werden, ob die VOT im engeren Sinne, d. h. nach der Definition von Lisker und Abramson (1964) als die Zeitdauer zwischen der Verschlusslösung und dem Einsetzen der Stimmlippenvibration, ermittelt werden soll, oder ob nicht eher die Dauer der Aspiration im Vordergrund des Forschungsinteresses steht - zwei Größen, die nicht als deckungsgleich anzusehen sind, da „im Signal der Übergang von Aperiodiziät zu Periodizität oft nicht völlig abrupt verläuft, sondern eine Übergangsphase von ein bis fünf deutlich periodischen, aber dennoch verrauschten Schwingungen zu beobachten ist“ wie es Braun (1988, S. 115) formuliert und sich in ihrer Methodik Künzel (1977a) anschließt. Dieser arbeitet mit der Größe der Aspirationsdauer, die wie folgt definiert wird: [...] Aspirationsdauer als die Zeitspanne von der Lösung einer Okklusion durch Wiedereinsetzen der Öffnungsbewegung der artikulierenden Organe bis zum Erreichen eines lichten Ansatzrohrquerschnittes, bei dem im oralen Luftstrom keine oder nur geringfügigstetige Geräuschanteile auftreten. Aspiration wird demnach als Gesamtheit der von einer Okklusivlösung herrührenden Turbulenzen aufgefaßt. (Künzel, 1977a, S. 43). Als Messpunkte für die Aspirationsdauer verwendet Künzel (1977a) (i) die Explosion des oralen Verschlusses, die sich im Oszillogramm durch „abruptes Einsetzen von unperiodischen (stochastischen) Signalanteilen“ (Künzel, 1977a, S. 42) zeigt, und (ii) einen Punkt, an dem die Geräuschanteile ein stetiges Minimum erreicht haben. Der Schwerpunkt liegt also auf dem Ende der Aspiration und nicht wie bei Lisker und Abramson (1964) auf dem Beginn des periodischen Signals. Braun (1988) schließt sich in ihrer Messmethodik Künzel (1977a) an. Ebenso Jessen (1998) mit der Einschränkung, dass er die Aspirationsdauer im Sonagramm (jedoch auch unter Einbezug des Oszillogramms) misst und dabei den Beginn von F2 als rechten Messpunkt verwendet und damit das Ende (oder zumindest eine erhebliche Reduktion) der Aspiration in Zusammenhang bringt; der linke Messpunkt wurde im Sonagramm an dem plötzlichen Vorhandensein von Energie im hohen Frequenzbereich festgemacht. Da im Vordergrund dieser Arbeit ein Vergleich der Plosiv-Produktionen von Sprechern in unverstelltem und durch Akzentimitation verstelltem Modus steht, und nicht eine generelle Betrachtung deutscher Plosive mit repräsentativen Angaben zur VOT-Dauer oder Aspirationsdauer im Standarddeutschen beispielsweise, scheint es hinreichend, sich für eine Messmethodik zu entscheiden und diese konsistent zu verwenden. Die akustische Analyse der Fortis- Plosive in dieser Arbeit bestand aus einer Messung der VOT im Oszillogramm. Als erster (linksseitiger) oder Anfangsmesspunkt für die Lösung des Plosivs wurde der erste deutliche Amplitudenausschlag gewählt. Als zweiter (rechtsseitiger) oder auch Endmesspunkt für die einsetzende Stimmhaftigkeit wurde die erste periodischen Schwingung gemessen am Nulldurchgang gewählt. Das heißt, dass in einigen Fällen die gemessene Dauer der VOT kürzer ist, als wenn 115 V VOT PL ESt Time (s) 0.0265 0.1867 26 ms Abbildung 9.1.: Segmentierung zur Messung der VOT beispielhaft an einem Ausschnitt von kommen der Sprecherin Ff02 (verstellte Version, Text 1, 1. Aufnahme; V = Verschluss, PL = Plosivlösung, ESt = Einsatz der Stimmhaftigkeit) an dieser Stelle die oben erläuterte Methodik von Künzel (1977a) und Braun (1988) oder Jessen (1998) gewählt und die Aspirationsdauer gemessen worden wäre. Die Fälle, bei denen nach dem Stimmeinsatz noch starke Aspiration vorlag, wurden notiert und werden an anderer Stelle später diskutiert. Abbildung 9.1 zeigt beispielhaft die hier verwendete Segmentierung für die Messung der VOT an einem Ausschnitt des Wortes kommen gesprochen in verstellter Version von Sprecherin Ff02. Bei der Analyse waren folgende Problemfälle zu beachten. In einigen Fällen war die Plosivlösung sehr schwer erkennbar. Das betraf v. a. den Sprecher Fm04 sowohl in seinen unverstellten als auch in seinen verstellten Versionen (jeweils bei velaren Plosiven) und die Sprecherin Ff08 bei bilabialen Plosiven in ihren unverstellten Versionen. In solchen Fällen wurde als Messpunkt der relativ stärkste Amplitudenanstieg gewählt. Wenn dies nicht möglich war oder kein Verschluss gebildet wurde und die Lösung demnach entfiel, wurde das entsprechende Token ausgeschlossen. Bisweilen konnten, wie auch bei Künzel (1977a) und Braun (1988) beschrieben, zwei oder mehr aufeinanderfolgende Plosivlösungen beobachtet werden. Durch auditive Einschätzung und visuelle Inspektionen des Sonagramms konnte die Möglichkeit nicht-pulmonaler Clicks durch Überlappung zweier artikulatorischer Gesten, z. B. das Lösen der Zungenspitze von den Alveolen bei gleichzeitigem velarem Verschluss, in der Regel ausgeschlossen werden (vgl. Simpson, 2007). Die beobachteten doppelten oder mehrfachen Ver- 116 schlusslösungen können vermutlich auf in Stevens (1998, S. 121) beschriebene aerodynamische Prozesse zurückgeführt werden, die mit dem Bernoulli-Effekt vergleichbar sind. Sie sind im Oszillogramm an zwei (oder mehr) relativ nah beieinander liegenden Amplitudenanstiegen erkennbar; der Messpunkt wurde am ersten (linken) Amplitudenanstieg gesetzt. In der Phrase wenig Kunden kam es vereinzelt zur Realisierung eines velaren Plosivs anstelle des palatalen Frikativs und damit in Einzelfällen zu einem Zusammenfall der beiden Plosive, wobei der erste Plosiv nicht gelöst wurde. Hier wurde die vorhandene Plosivlösung dem zweiten Plosiv ( / k/ in / kUnd@n/ ) zugeordnet und mit in die Berechnungen einbezogen (betrifft jeweils die erste Aufnahme von Text 3 in unverstellter Version gesprochen von Ff11, Ff15, Fm06). Als Datenbasis für die Untersuchung der Produktionen der deutschen Muttersprachler diente die erste Aufnahme der gelesenen Texte 1 und 3 (vgl. Anhang C), da diese sowohl in verstellter als auch in unverstellter Version vorlagen und damit eine gute Vergleichsbasis zwischen diesen Versionen gegeben war. Es wurde die VOT für wort- und silbeninitiale 4 Fortis-Plosive mit nachfolgendem akzentuiertem Vokal gemessen, d. h. es handelt sich um betonte Silben. Ausnahme hiervon stellt das Wort Poli " zei dar, in dem der Plosiv in einer unbetonten Silbe steht. Aufgrund der Datenbasis mit einem geringen Vorkommen bilabialer Fortis-Plosive wurde dieses Token trotz der Abweichung mit in die Messungen aufgenommen. Insgesamt wurden pro deutschen Muttersprachler der Gruppe, die einen französischen Akzent imitierte (N=22), jeweils 25 Fortis- Plosive in der unverstellten und verstellten Version untersucht. Einige Tokens (N=7) wurden jedoch aufgrund oben aufgeführter Problemfälle ausgeschlossen oder konnten aufgrund von Abweichungen im Text nicht untersucht werden. Die Gesamtheit der in die Analyse einbezogenen Fortis-Plosive in der Gruppe der deutschen Muttersprachler umfasst 1093 Plosive. Es ergeben sich bei einer Clusterung nach Artikulationsort des Plosivs und dem nachfolgenden Vokal folgende in Tabelle 9.3 dargestellte Gruppen: / pa-/ , / pO-/ , / t/ + Vokal, / k/ + hinterer Vokal ( / kO-/ , / kU-/ ), / k/ + zentraler Vokal bzw. Diphthong ( / ka-/ , / kaI-/ ). Die Datenbasis für die Analyse der Produktionen der französischen Muttersprachler besteht ebenfalls aus der ersten Aufnahme der deutschen Texte 1 und 3 mit den in Tabelle 9.3 dargestellten analysierten Plosiv-Vokal-Kontexten, sowie aus dem französischen Text (Text 4; vgl. Anhang C), dessen Aufschlüsselung des Plosiv-Vokal-Kontexts in Tabelle 9.4 dargestellt ist. Die Fortis-Plosive des französischen Textes stehen in silbeninitialer Position, allerdings kommen bis auf coute alle in unbetonten Silben vor, da der französische Wortakzent in der Regel auf der letzten Silbe des Wortes liegt. In der Gruppe der vier französischen Muttersprachler wurden insgesamt 120 Plosive untersucht und in die Analyse einbezogen. 4 Die Plosive in den untersuchten Tokens waren bis auf / k/ in „gekommen“ alle wortinitial. 117 Tabelle 9.3.: Gruppierung der gemessenen VOT nach Artikulationsort und Vokalkontext (Text 1 und 3) / pa-/ / pO-/ / t/ + V / k/ + HV / k/ + ZV Wort (N) packen (2) Polizei (3) Täter (2) kommen (3) Kasse (2) Taten (1) kommt (2) keine (3) Tür (1) gekommen (2) kein (1) kurz (1) kann (1) Kunden (1) N 2 3 4 9 7 N gesamt = 25 Tabelle 9.4.: Gruppierung der gemessenen VOT nach Artikulationsort und Vokalkontext (Text 4, Französisch) / pa-/ / tu-/ / k/ + HV Wort (N) passez (1) toujours (1) commissariat (1) tout droit (1) coute (1) N 1 2 2 N gesamt = 5 Zur statistischen Datenanalyse und grafischen Darstellung der Ergebnisse wurde die freie Statistiksoftware und Programmiersprache R (R Development Core Team, 2009) verwendet. 9.1.2. Ergebnisse Vergleich der unverstellten und verstellten Produktionen deutscher Muttersprachler Abbildung 9.2 zeigt für die deutschen Muttersprachler einen zusammenfassenden Vergleich ihrer gemittelten VOT-Werte aller gemessenen und ausgewerteten Tokens jeweils in unverstellter (links) und verstellter (rechts) Version (Text 1 und 3; 1. Aufnahme). Für jeden Sprecher (N=22) ist der gemittelte Wert seiner in den jeweiligen Modi (verstellt / unverstellt) produzierten VOT-Werte (im Idealfall 25 Werte pro Sprecher und Modus) in die Berechnungen eingeflossen. In der Boxplotgrafik sind jeweils der Median durch den horizontalen Balken in der Box, das untere und obere Quartil durch die obere und untere Begrenzung der Box, sowie der Minimum- und Maximumwert durch die sogenannten whisker abgebildet, sofern diese nicht um mehr als das 1,5-fache des Interquartilabstands vom Median abweichen. Datenpunkte, die außerhalb dieses Bereichs liegen, gelten als ausreißerverdächtig und werden als einzelne Datenpunkte dargestellt. 118 Abbildung 9.2.: Vergleich der gemittelten VOT-Werte aller Tokens in unverstellter und verstellter Version gesprochen von deutschen Muttersprachlern Bereits der Vergleich der VOT-Messungen der Produktionen der deutschen Muttersprachler in Abbildung 9.2 zeigt, dass die Mehrheit der deutschen Muttersprachler bei der Imitation eines französischen Akzents die VOT in initialen Fortis-Plosiven reduziert. Tabelle 9.5 zeigt die gemittelten und gerundeten VOT-Werte der einzelnen deutschen Muttersprachler in unverstellter und verstellter Version. Eine deskriptiv-statistische Kurzauswertung dieser in Tabelle 9.5 dargestellten VOT-Mittelwerte wird in Tabelle 9.6 gegeben. Eine detailliertere Übersicht der gemittelten VOT pro deutschen Muttersprachler in verstellter und unverstellter Aufnahme aufgeteilt nach dem jeweiligen Plosiv-Vokal- Kontext findet sich in Tabelle E.1 im Anhang E. Ein Vergleich der hier ermittelten VOT-Werte der deutschen Muttersprachler in ihrer unverstellten Version mit den Aspirationsdauer-Mittelwerten initialer Fortis- und Lenis-Plosive aus den Studien von Künzel (1977a), Braun (1988) und Jessen (1998) zeigt trotz der voneinander abweichenden Messmethodik recht einheitliche Ergebnisse. Aus der guten Vergleichbarkeit der ermittelten Werte vor allem aus der vorliegenden Studie mit Künzel (1977a) und Braun (1988) lässt sich schließen, dass die hier vorliegenden Daten als repräsentativ für das 119 Tabelle 9.5.: Gemittelte VOT-Werte der deutschen Muttersprachler (N=22) in unverstellter und verstellter Version der Texte 1 und 3 (1. Aufnahme); in ms gerundet auf eine Dezimalstelle Sprecher unverstellt verstellt Sprecher unverstellt verstellt Ff01 62,8 41,0 Ff12 57,3 29,2 Ff02 70,5 51,5 Ff13 39,1 25,9 Ff03 60,6 21,5 Ff14 47,0 32,9 Ff04 48,8 38,1 Ff15 52,2 33,5 Ff05 66,0 34,1 Fm01 57,8 37,3 Ff06 66,5 42,9 Fm02 49,0 39,8 Ff07 45,6 30,3 Fm03 43,1 21,3 Ff08 46,4 27,3 Fm04 49,9 34,2 Ff09 71,9 76,4 Fm05 47,7 30,5 Ff10 61,6 29,7 Fm06 51,0 34,9 Ff11 56,7 51,2 Fm07 43,4 41,4 Tabelle 9.6.: Vergleich der VOT-Mittelwerte (in ms) deutscher Muttersprachler in unverstellter und verstellter Version (Min. = Minimum, Max. = Maximum, Mw = arithmetisches Mittel, Q 1/ 3 = 1. bzw. 3. Quartil) Min. Q 1 Median Mw Q 3 Max. unverstellt 39 47 52 54 61 72 verstellt 21 30 34 37 41 76 Deutsche betrachtet werden können. Die leicht geringeren Werte aus der vorliegenden Studie gegenüber den Werten der anderen Studien (die größten Unterschiede ergeben sich zu den in Jessen, 1998 ermittelten Werten) können vermutlich auf methodische Unterschiede wie der Verwendung von VOT anstelle der Aspirationsdauer zurückgeführt werden (vgl. dazu die Diskussion oben). Es ist aber auch eine leicht reduzierte VOT aufgrund des ostmitteldeutschen Sprachhintergrundes der meisten Sprecher dieser Studie nicht auszuschließen, da, wie oben diskutiert, in diesem Sprachraum häufig eine Neutralisierung der Fortis-Lenis-Opposition vorzufinden ist. Tabelle 9.7 stellt die Ergebnisse der genannten Studien einander gegenüber. Zur Überprüfung, ob die hier vorliegenden Daten einer Normalverteilung entsprechen, wurde der Shapiro-Wilk-Test durchgeführt. Dieses Testverfahren geht von der Nullhypothese aus, dass eine Normalverteilung der Daten vorliegt. Wird ein signifikantes Ergebnis erzielt (p < 0,05), kann davon ausgegangen werden, dass die Daten nicht normalverteilt sind (vgl. Gries, 2008, S. 155 f.). Die Ergebnisse des Shapiro-Wilk-Test sind in Tabelle 9.8 zu finden und lassen kurz gefasst darauf schließen, dass die Daten der deutschen Muttersprachler in der unverstellten Version normalverteilt sind, die Daten in der verstellten Version jedoch nicht. Allerdings, und das ist das Entscheidende für die Wahl eines Test- 120 Tabelle 9.7.: Vergleich der Aspirationsdauer (AD) initialer Fortis- und Lenis- Plosive deutscher Sprecher aus Künzel (1977), Braun (1988) und Jessen (1998) mit den VOT-Werten initialer Fortis-Plosive aus der vorliegenden Studie (SN). Angegeben sind die Anzahl (N) der Versuchspersonen (Vpn) und der Tokens sowie arithmetisches Mittel (Mw) und Standardabweichung (s) der AD / VOT in ms Autor (Jahr) Künzel (1977) Braun (1988) Jessen (1998) SN N Vpn 26 7 6 22 N Tokens 108 18 24 25 Mw (s) Fortes 60 (11) 64 (15) 74 (23) 54 (9) Mw (s) Lenes 27 (11) 16 (4) 21 (10) - - Tabelle 9.8.: Ergebnisse des Shapiro-Wilk-Tests auf Normalverteilung der VOT- Werte der deutschen Muttersprachler jeweils in verstellter und unverstellter Version mit dem Wahrscheinlichkeitswert p (wenn p < 0,05, dann liegt keine Normalverteilung der Daten vor; = n.nv.) und der Prüfgröße W Unverstellt Verstellt Gesamt p > 0,05 (W= 0,9526) p < 0,01 (W= 0,8509); n.nv. / pa-/ p > 0,05 (W= 0,9179) p < 0,001 (W= 0,7786); n.nv. / pO-/ p > 0,05 (W= 0,9776) p > 0,05 (W= 0,9557) / t/ + V p > 0,05 (W= 0,9169) p < 0,01 (W= 0,8461); n.nv. / k/ + HV p > 0,05 (W= 0,9696) p > 0,05 (W= 0,9628) / k/ + ZV / Diphth. p > 0,05 (W= 0,9245) p < 0,01 (W= 0,8745); n.nv. Mittelwertsdifferenz (verstellt unverstellt) p > 0,05 (W=0,9822) verfahrens, liegt für die Mittelwertsdifferenzen (Differenz der VOT-Mittelwerte aus der verstellten und der unverstellten Version) eine Normalverteilung vor. Zum Vergleich der VOT-Daten in den verstellten und unverstellten Produktionen wurde zunächst ein einseitiger gepaarter t-Test durchgeführt, der der Überprüfung dient, wie hoch die Wahrscheinlichkeit p ist, dass die Messwerte derselben Stichprobe entspringen. Es handelt sich hierbei um ein parametrisches Testverfahren, das eine Normalverteilung der Daten oder eine große Stichprobe annimmt. Ein einseitiger Test kann durchgeführt werden, da wie oben beschrieben von einer gerichteten Alternativhypothese ausgegangen werden kann: Verringerung der VOT bei der Verstellung. Der einseitige gepaarte t-Test bestätigt, dass sich die durchschnittliche VOT-Dauer der deutschen Muttersprachler in der verstellten Version signifikant zur unverstellten Version verringert (p < 0,001, t = 8,3161, df = 21). Obwohl die Stichprobe groß genug für einen gepaarten t-Test ist und auch die Mittelwertsdifferenzen normalverteilt sind, wurde als Kontrolle zusätzlich ein gepaarter Wilcoxon-Test (nicht parametrisches Testverfahren) durchgeführt. Das Ergebnis des gepaarten Wilcoxon-Tests ist eben- 121 Tabelle 9.9.: Ergebnisse der Signifikanztests auf Verringerung der VOT bei der Imitation eines französischen Akzents unter Angabe des Wahrscheinlichkeitswertes p und der Prüfgrößen t bzw. V Gepaarter t-Test (df = 21) Gepaarter Wilcoxon Gesamt p < 0,001 (t = 8,3161) p < 0,001 (V = 251) / pa-/ p < 0,001 (t = 5,3356) p < 0,001 (V = 239) / pO-/ p < 0,001 (t = 6,9653) p < 0,001 (V = 246) / t/ + V p < 0,001 (t = 9,5287) p < 0,001 (V = 253) / k/ + HV p < 0,001 (t = 5,1415) p < 0,001 (V = 233) / k/ + ZV / Diphth. p < 0,001 (t = 5,7617) p < 0,001 (V = 245) falls höchst signifikant (p < 0,001). Tabelle 9.9 zeigt unter Berücksichtigung des lautlichen Kontextes die Ergebnisse der statistischen Signifikanztests (gepaarter t-Test und gepaarter Wilcoxon) und gibt den Wahrscheinlichkeitswert p sowie die jeweiligen Prüfgrößen an. Nachdem die Ergebnisse beider Testverfahren signifikant ausgefallen sind und auch unter Einbezug des Artikulationsortes der Plosive und dem Vokalkontext die Wahrscheinlichkeit p in beiden Testverfahren unter 0,001 liegt und damit als statistisch höchst signifikant bezeichnet werden kann, kann die oben aufgestellte Hypothese H 1 - Deutsche Muttersprachler reduzieren die VOT stimmloser Fortis-Plosive bei der Verstellung durch einen französischen Akzent - angenommen werden. Die über alle Sprecher gemittelte Reduktion der VOT während der Akzentimitation beträgt ca. 18 ms. Eine nähere Betrachtung der Produktionen der Einzelsprecher zeigt eine relativ hohe interindividuelle Variabilität. So weist beispielsweise Sprecherin Ff03 mit einer mittleren Reduktion von 39 ms die größte und Sprecher Fm07 mit einer mittleren Reduktion von 2 ms die geringste bzw. keine Verringerung der VOT in der verstellten Produktion auf. Sprecherin Ff09 ist die einzige Sprecherin, die ihre VOT während der Imitation eines französischen Akzents erhöht (mittlere Erhöhung um ca. 4 ms). Die Sprecherinnen mit der stärksten Reduktion (Ff03) sowie mit der Erhöhung (Ff09) der VOT sind dabei jedoch als Ausreißer zu werten. Die erste Sprecherin sticht neben der starken Verringerung der VOT außerdem durch die Konsistenz in derselben hervor und letztere hat sowohl in der verstellten als auch in der unverstellten Version den höchsten VOT-Mittelwert der Gruppe. Abbildung 9.3 zeigt einen Vergleich zwischen den Einzelsprechern der Gruppe der deutschen Muttersprachler. Dargestellt sind pro Sprecher die Reduktion der VOT als Mittelwertsdifferenz aus verstellter und unverstellter Version mit dem jeweiligen Standardfehler 5 . Aus Gründen einer übersichtlicheren Darstellung 5 Der Standardfehler wird als die Standardabweichung der Mittelwerte gleich großer Zufallsstichproben aus einer Population oder Grundgesamtheit definiert. Er errechnet sich aus der Standardabweichung des Mittelwertes gebrochen durch die Wurzel aus der Größe der Stichprobe. Je 122 Abbildung 9.3.: Interindividuelle Variabilität der VOT dargestellt als Mittelwertsdifferenz zwischen verstellter und unverstellter Produktion wurde die Probandenbezeichnung ausnahmsweise von Ff01, Fm02 etc. auf f01, m02 verkürzt. Die in der Abbildung verwendeten Daten sind in Tabelle E.2 im Anhang E zu finden. Aus dieser Abbildung wird erneut deutlich, dass die Mehrheit der deutschen Muttersprachler dieser Studie die VOT initialer Fortis-Plosive während der Imitation eines französischen Akzents reduziert. 18 von 22 Sprechern verringern die VOT um mehr als 10 ms und 50 % der Mittelwertsdifferenzen befinden sich in einer Reduktion von 13 bis 22 ms. Die Gruppe der Frauen reduziert die VOT im Mittel um 19 ms und die Gruppe der Männer im Mittel um 15 ms. Ein gepaarter t-Test in den nach Geschlecht getrennten Gruppen der deutschen Muttersprachler zeigt jedoch, dass sowohl die Frauen als auch die Männer die VOT in Fortis-Plosiven signifikant reduzieren (weiblich: p < 0,001 (t = 6,7036, df = 14), männlich: p < 0,001 (t = 5,6253, df = 6)) 6 . größer der Standardfehler ist, desto geringer ist die Wahrscheinlichkeit, dass ein bestimmter Stichprobenmittelwert den Populationsmittelwert gut schätzt (vgl. Gries, 2008, S. 125 f.). 6 Die Mittelwertsdifferenzen sind nach dem Shapiro-Wilk-Test in beiden Gruppen normalverteilt (weibl.: p > 0,05, W = 0,9828; männl.: p > 0,05, W = 0,8961), sodass der t-Test als parametrisches Verfahren verwendet wurde. 123 Verschiedene Studien haben gezeigt, dass Frauen signifikant längere VOT- Dauern haben als Männer und dass dieser Unterschied bereits bei Kindern zu finden ist. Simpson (2009) gibt einen Forschungsüberblick dazu und referiert darin u. a. Swartz (1992), Ryalls et al. (1997), Koenig (2000), Whiteside und Marshall (2001), Whiteside et al. (2004) und Robb et al. (2005). Die in dieser Studie vorgefunden Ergebnisse decken sich weitgehend mit den Erkenntnissen der genannten Studien. Sowohl in der unverstellten als auch in der verstellten Version zeigten Frauen im Mittel höhere VOT-Werte in Fortis-Plosiven als Männer. Während dieser Unterschied zwischen Frauen und Männern in der unverstellten Version bei einem angesetzten Signifikanzniveau von 5 % als signifikant zu bewerten ist (p < 0,05; t = 2,5123; df = 19,767), ist er es in der verstellten Version jedoch nicht (p > 0,05; t = 0,8023; df = 19,863). Wie bereits beschrieben reduzieren sowohl die Frauen als auch die Männer ihre VOT während der Akzentimitation signifikant. Die Frauen weisen zwar während der Akzentimitation eine mittlere VOT-Reduktion auf, die mit 19 ms höher als die der Männer ist (15 ms), ein t-Test ergibt aber keine signifikant höhere Reduktion durch die Frauen (p > 0,05; t = -1.1714; df = 17.993). Dies kann vermutlich auf eine höhere Varianz in den verstellten Versionen zurückgeführt werden, so ist der Variationskoeffizient in den verstellten Versionen der Frauen und Männer nahezu doppelt so hoch, wie in den unverstellten Versionen. Voice Onset Time ist ein phonetisches Korrelat, über das die phonologische Fortis-Lenis-Opposition realisiert wird. Aber auch die Stärke der Plosivlösung ist ein Korrelat dieser Opposition. Aus perzeptorischer Perspektive kann die Stärke der Plosivlösung hinsichtlich der Aspirationsdauer zu einem auditiven Eindruck führen, der sich von der akustischen Messung unterscheidet. So wurde während der Datenanalyse beobachtet, dass ein Plosiv mit kurzer VOT aber stärkerer Lösung oder höherer Intensität perzeptiv stärker als aspiriert und damit eher als fortis wahrgenommen wurde. Auf der anderen Seite zeigt beispielsweise Sprecher Fm04 in seiner Akzentimitation teilweise recht schwache Lösungen v. a. bei velaren Plosiven wie in Kunden oder gekommen in Text 3. Diese schwachen Plosivlösungen können darauf hindeuten, dass nicht nur die VOT reduziert wird, sondern außerdem ein Kategorienwechsel von fortis zu lenis angestrebt wird. Es muss aber auch erwähnt werden, dass die Plosivlösungen dieses Sprechers auch in seinen unverstellten Versionen vereinzelt schwach sind. Vier deutsche Muttersprachler zeigten in der Akzentimitation außerdem stimmhafte Realisierungen phonologischer Fortis-Plosive, d. h. die Plosive wiesen negative VOT-Werte auf, die sich zwischen -49 und -86 ms bewegen. Außerdem befindet sich bei drei dieser Sprecher zwischen der Plosivlösung und der einsetzenden Stimmhaftigkeit im Vokal noch eine Strecke stimmhafter aber auch stimmloser Aspiration 7 . 7 Die zu erwartende und auch in anderen Studien beobachtete aspirierte Stimmhaftigkeit, die auf positive VOT folgt, konnte ebenso bei mehreren Sprechern festgestellt werden und findet sich u. a. bei den Sprechern Ff14 und Fm07 in ihren unverstellten Produktionen oder bei Sprecherin Ff01 in der Akzentimitation. 124 VOT Asp V-N-V-N VOT Asp V-N-V-N ESt PL ESt PL Time (s) 0 0.7554 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 Fm03 <kommen> Ff10 <kommen> -86ms -51ms Abbildung 9.4.: Stimmhafte Realisierung des / k/ in kommen in der verstellten Version der Sprecher Ff10 und Fm03 (Text 1, 1. Aufnahme; ESt = Einsatz der Stimmhaftigkeit, PL = Plosivlösung, Asp. = Aspiration, V-N-V-N = Vokal-Nasal-Abfolge) Abbildung 9.4 zeigt anhand der Sprecher Ff10 und Fm03 beispielhaft einen Kategorienwechsel von fortis zu lenis während der Imitation eines französischen Akzents, der über eine negative VOT des velaren Plosivs im Wort kommen (Kommen Sie am Dienstag Nachmittag um zwei Uhr zur Bushaltestelle an der Deutschen Bank.) realisiert wird. Nach der Plosivlösung folgt bei Sprecherin Ff10 ca. 28 ms stimmhafte Aspiration und bei Sprecher Fm03 ca. 19 ms Aspiration, die zunächst stimmlos beginnt und ab der Hälfte in behauchte Stimmhaftigkeit übergeht, bevor der Vokal stimmhaft ohne wesentliche Behauchung realisiert wird. Der dynamische Bereich des Sonagramms umfasst 45,0 dB (Präemphase = 6,0 dB / Oktave) 8 . Die hier beschrieben Fälle sind aber als Einzelfälle zu betrachten. Wie Abbildung 9.2 und Tabelle 9.6 weiter oben in diesem Abschnitt gezeigt haben, liegen bei der Akzentimitation 50 % der VOT-Mittelwerte zwischen 30 und 41 ms. Daher lässt sich trotz einer signifikanten Reduktion der VOT initialer Fortis- Plosive keine allgemeine Tendenz zur Realisierung einer Lenis-Kategorie über dieses Korrelat feststellen. Offen bleibt bis hierhin die Frage, ob die reduzierten 8 In den folgenden Abbildungen liegt die Präemphase ebenfalls bei jeweils 6,0 dB pro Oktave. Diese Angabe wird daher im Folgenden nicht mehr gesondert aufgeführt. Da der dynamische Bereich zur besseren Darstellung der Sonagramme jeweils angepasst wurde, wird er im Folgenden trotz eventueller negativer Auswirkungen auf den Lesefluss jeweils aufgeführt. 125 Tabelle 9.10.: Vergleich der gemittelten VOT der deutschen Muttersprachler in verstellter und unverstellter Version mit denen der französischen Muttersprachler im Deutschen in ms (Min. = Minimum, Max. = Maximum, Mw = arithmetisches Mittel, Q 1/ 3 = 1. bzw. 3. Quartil) Min. Q 1 Median Mw Q 3 Max. Dt - unverstellt 39 47 52 54 61 72 Fr - deutsch 36 39 42 45 48 59 Dt - verstellt 21 30 34 37 41 76 VOT-Werte der deutschen Sprecher in ihren Akzentimitationen mit den VOT- Werten französischer Muttersprachler im Deutschen vergleichbar sind. Vergleich der Akzentimitationen mit den deutschen Produktionen französischer Muttersprachler Die Ergebnisse des Vergleichs der deutschen Produktionen französischer Muttersprachler mit den Akzentimitationen deutscher Muttersprachler überraschen insofern, als man hätte vermuten können, dass die deutschen Muttersprachler in ihren Verstellungen zwar die VOT reduzieren, jedoch nicht an die zu erwartenden niedrigen VOT-Werte der französischen Muttersprachler in ihren deutschen Produktionen herankommen. Abbildung 9.5 und Tabelle 9.10 stellen die Werte der deutschen Muttersprachler in verstellter und unverstellter Version den Werten der französischen Muttersprachler im Deutschen gegenüber und zeigen, dass die deutschen Produktionen der französischen Muttersprachler hinsichtlich der VOT in Fortis-Plosiven ziemlich genau zwischen den verstellten und den unverstellten Produktionen der deutschen Muttersprachler liegen. Das heißt, dass die VOT-Werte der deutschen Muttersprachler in ihren Akzentimitationen niedriger sind als die VOT-Werte der untersuchten französischen Muttersprachler im Deutschen. Es lassen sich zwei mögliche Erklärungen für diese Ergebnisse finden: (i) entweder sind die in dieser Studie untersuchten französischen Muttersprachler so kompetent in der Fremdsprache Deutsch, dass ihre VOT-Werte nahezu dem deutschen System entsprechen oder (ii) die deutschen Muttersprachler reduzieren die VOT so stark, dass sie gewissermaßen „über das Ziel hinausschießen“ und zu Übertreibungen neigen. Die erste mögliche Erklärung - hohe Kompetenz der französischen Muttersprachler in der Fremdsprache Deutsch - kann aus zweierlei Gründen ausgeschlossen werden. Zum einen erreichen die französischen Muttersprachler in ihren deutschen Produktionen nicht die VOT-Werte der deutschen Muttersprachler in deren unverstellten Versionen, wie in Abbildung 9.5 und Tabelle 9.10 ersichtlich ist. Das heißt, dass die VOT-Werte für die Gruppe der französischen Muttersprachler im Deutschen immer noch unter den Werten der deutschen Muttersprachler in den unverstellten deutschen Produktionen lie- 126 Abbildung 9.5.: Vergleich der gemittelten VOT-Werte aus den verstellten und unverstellten Produktionen der deutschen Muttersprachler mit den deutschen Produktionen der französischen Muttersprachler gen. Ausschließlich die aus dem Elsass stammende Sprecherin F-nf02 erreicht in ihren deutschen Produktionen einen mittleren VOT-Wert, der mit den Werten der deutschen Muttersprachler vergleichbar ist (vgl. dazu auch Tabelle E.3 im Anhang E). Ob dieser Unterschied in den VOT-Werten zwischen den Gruppen signifikant ist, lässt sich aufgrund der unterschiedlichen Anzahl von den in die Berechnung einfließenden Werten nur schlecht statistisch berechnen, weswegen darauf verzichtet wird. Zum anderen würde sich eine hohe Kompetenz der französischen Muttersprachler im Deutschen aber auch dadurch zeigen, dass sich ihre VOT-Werte im Deutschen im Vergleich zum Französischen verändern, genauer gesagt erhöhen. Ein Vergleich der Produktionen der französischen Muttersprachler zeigt jedoch, dass sich die gemittelten VOT-Werte in ihren deutschen Produktionen nicht wesentlich von den gemittelten VOT- Werten ihrer französischen Produktionen unterscheiden. Da die Stichprobe für die Gruppe der französischen Muttersprachler unter der Bedingung „französischer Text“ zu klein ist - in die Mittelung fließen fünf Werte pro Sprecher (N = 4) ein - kann keine Normalverteilung der Daten angenommen werden 9 . 9 Die gemittelten VOT-Werte der französischen Muttersprachler in ihren deutschen Produktionen 127 Tabelle 9.11.: Vergleich der gemittelten VOT der französischen Muttersprachler in ihren deutschen und französischen Produktionen in ms (Min. = Minimum, Max. = Maximum, Mw = arithmetisches Mittel, Q 1/ 3 = 1. bzw. 3. Quartil) Min. Q 1 Median Mw Q 3 Max. französisch 38 41 43 43 46 47 deutsch 36 39 42 45 48 59 Aus diesem Grund wird hier auf ein statistisches Testverfahren verzichtet und die Beschreibung bleibt rein deskriptiv. Ein zusammenfassender Vergleich der gemittelten VOT-Werte der französischen Muttersprachler in beiden Sprachen ist in Abbildung 9.6 und Tabelle 9.11 dargestellt. Auffällig ist, dass bis auf eine größere Streuung im oberen VOT-Bereich beim Lesen der deutschen Texte die Verteilung der VOT-Werte in den beiden Sprachen für die gesamte Gruppe der französischen Muttersprachler betrachtet nicht stark voneinander abweicht, d. h. Median, arithmetisches Mittel sowie die Minimumwerte unterscheiden sich nur unwesentlich voneinander und damit findet im Mittel, d. h. auf die Gesamtgruppe der französischen Muttersprachler bezogen, keine Verlängerung der VOT in den deutschen Produktionen statt. Für drei Einzelsprecher der Gruppe der französischen Muttersprachler bestätigt sich dieses Bild, d. h. es liegt keine Verlängerung der VOT in ihren deutschen Produktionen vor. Wie bereits oben erwähnt erreicht ausschließlich die aus dem Elsass stammende Sprecherin F-nf02 in ihren deutschen Produktionen einen mittleren VOT-Wert, der mit den Werten der deutschen Muttersprachler vergleichbar ist, und verlängert ihre VOT in initialen Fortis-Plosiven im Durchschnitt um ca. 18 ms (vgl. Tabelle E.3 im Anhang E). Da aus den oben genannten Gründen eine hohe L2-Kompetenz der französischen Muttersprachler im Deutschen als Erklärung für ihre relativ hohen VOT- Werte im Vergleich zu den Werten der Akzentimitationen ausgeschlossen wurde, kann seitens der deutschen Sprecher von einer übertriebenen Reduktion der VOT in initialen Fortis-Plosiven während der Akzentimitation ausgegangen werden. Die Tatsache, dass einige deutsche Muttersprachler nicht nur die VOT reduzieren, sondern außerdem in Richtung einer Lenis-Kategorie gehen, indem sie stimmhafte Plosive oder schwache Verschlusslösungen produzieren, unterstützt diese Vermutung. Tabelle 9.12 zeigt für initiale Fortis-Plosive einen Vergleich der gemittelten VOT- Werte aus der vorliegenden Studie mit denen aus Abdelli-Beruh (2004) 10 sowie mit den Aspirationsdauer-Mittelwerten aus Künzel (1977a). Dargestellt sind weichen gemäß eines Shapiro-Wilk-Tests nicht von der Normalverteilung ab (p > 0,05, W = 0,8997). 10 In Tab. 9.12 sind aus Abdelli-Beruh (2004) nur die VOT-Werte silbeninitialer Plosive im intervokalischen Kontext dargestellt; für interkonsonantischen Kontext vgl. Abdelli-Beruh (2004). 128 Abbildung 9.6.: Gemittelte VOT-Werte der deutschen und französischen Produktionen der französischen Muttersprachler zum einen die Werte der französischen Muttersprachler im Französischen und zum anderen die Werte der deutschen Muttersprachler in der Fremdsprache Französisch 11 (Künzel, 1977a) bzw. bei der Imitation eines französischen Akzents (vorliegende Studie). Dieser in Tabelle 9.12 dargestellte Vergleich zeigt zum einen für die französischen Muttersprachler im Französischen eine gute Übereinstimmung zwischen ermittelten Aspirationsdauer-Werten aus Abdelli-Beruh (2004) und denen aus Künzel (1977a). Zum anderen zeigt der Vergleich jedoch relativ stark nach oben abweichende VOT-Mittelwerte aus der vorliegenden Studie. Sie liegen im Mittel 20-25 ms über den Werten aus Künzel (1977a) und Abdelli-Beruh (2004). Eine zufriedenstellende Erklärung für diese relativ hohen VOT-Werte dieser Studie konnte bisher nicht gefunden werden. Sprecherin F-nf02 stammt aus dem Elsass, daher wurde zunächst vermutet, dass diese Sprecherin aufgrund der zu erwartenden vermehrten Interferenzen aus dem Deutschen den 11 Künzel (1977a) untersucht die Interferenzen deutscher Muttersprachler in der Fremdsprache Französisch unter drei verschiedenen Sprechbedingungen: (i) erstes Lesen, (ii) Nachsprechen, (iii) zweites Lesen. Nachsprechen meint die Wiederholung eines Testsatzes, der zuvor von einer französischen Muttersprachlerin produziert wurde. Die in Tabelle 9.12 abgebildeten Daten beziehen sich auf die Sprechbedingung (i) erstes Lesen sowie auf die Produktion der französischen Muttersprachlerin. 129 Tabelle 9.12.: Vergleich der Aspirationsdauer (AD) aus Künzel (1977) mit den VOT-Werten der vorliegenden Studie (SN) sowie aus Abdelli- Beruh (2004) für französische initiale Fortis-Plosive gesprochen von französischen und deutschen Muttersprachlern bzw. bei der Akzentimitation. Angegeben sind jeweils die Anzahl (N) der Versuchspersonen (Vpn) und der Tokens, sowie das arithmetische Mittel (Mw) und die Standardabweichung (s) der AD / VOT in ms Frz. Mspr. (frz.) Dt. Mspr. (frz. / imitierter Akz.) N Vpn N Tokens Mw (s) N Vpn N Tokens Mw (s) Künzel (1977) 1 90 28 (13) 26 99 43 (17) SN 4 5 43 (4) 22 25 37 (12) Abdelli-Beruh (2004) 9 322 23 (5) - - - Mittelwert verfälscht. Allerdings liegt weder ihr individueller VOT-Mittelwert noch ihr VOT-Maximumwert über den Werten der anderen Sprecher dieser Gruppe - auffällig scheint nur die hohe Standardabweichung für die Werte dieser Sprecherin. (Vgl. dazu im Anhang E die in Tabelle E.3 dargestellten VOT-Einzelwerte der französischen Muttersprachler in ihren französischen Produktionen.) Ein weiterer Erklärungsansatz für die recht hohen VOT-Werte der französischen Muttersprachler in der vorliegenden Studie könnte die Beeinflussung der Fortis-Plosiv-Realisierung durch den starken Kontakt der Sprecher zur Fremdsprache Deutsch sein. So haben beispielsweise Flege und Eefting (1987), Sancier und Fowler (1997) und Nielsen (2006) gezeigt, dass Sprecher beeinflusst durch den Kontakt zu einer Fremdsprache (z.B. während eines längeren Auslandsaufenthaltes) die VOT-Dauern in ihrer Muttersprache variieren, d. h. den in der Fremdsprache üblichen VOT-Dauern annähern. Allerdings ist im Rahmen dieser Arbeit eine Überprüfung des Ansatzes nicht möglich, da weder Sprachaufnahmen der Sprecher vor ihrem Deutschlandaufenthalt noch nach diesem vorliegen. An dieser Stelle muss mangels anderer Erklärungen von einer Unausgewogenheit der zur Verfügung stehenden Datenbasis ausgegangen werden. Wenn anstatt der in dieser Studie ermittelten VOT-Werte die Aspirationsdauerbzw. VOT-Werte aus Künzel (1977a) bzw. Abdelli-Beruh (2004) als französische Standardwerte angesetzt würden, müsste seitens der französischen Muttersprachler von einer Verlängerung der VOT initialer Fortis-Plosive im Deutschen gegenüber dem Französischen ausgegangen werden. Es soll an dieser Stelle jedoch auch angemerkt werden, dass sowohl in Künzel (1977a) als auch in Abdelli-Beruh (2004) ausschließlich oder zum Teil Nonsens-Wörter getestet wurden, die in Trägersätzen eingebettet wurden. Zum anderen waren die Versuchswörter in beiden Studien einsilbig (CVC-Kontext), d. h. wortakzenttragend. Eine direkte Vergleichbarkeit mit dem hier vorliegenden Material ist demnach nicht gegeben. 130 Interessant ist, dass die Aspirationsdauer-Werte der deutschen Sprecher in der Fremdsprache Französisch aus Künzel (1977a) vergleichbar mit den VOT- Werten der Akzentimitationen aus der vorliegenden Studie sind (vgl. dazu wieder Tabelle 9.12). Diese Ergebnisse bekräftigen zum einen die Vermutung, dass sich deutsche Muttersprachler einer im Vergleich zum Deutschen geringeren Aspirationsdauer im Französischen bewusst sind und auch der damit verbundenen Interferenzerscheinung einer zu geringen Aspirationsdauer französischer Muttersprachler im Deutschen. Zum anderen zeigen die Ergebnisse aus Künzel (1977a), dass die meisten deutschen Muttersprachler ihre Aspirationsdauer im Französischen im Vergleich zu ihren deutschen Produktionen signifikant reduzieren, jedoch scheinbar nur ca. die Hälfte der Sprecher in der Lage ist, die noch niedrigeren muttersprachsnahen Werte im Französischen zu erzielen (vgl. dazu Künzel, 1977a, S. 141). Die deutschen Muttersprachler dieser Studie reduzieren bei der Imitation eines französischen Akzents im Deutschen ihre VOT so stark, dass sie einerseits, wie oben gezeigt, geringere Werte erreichen als französische Muttersprachler im Deutschen und andererseits VOT- Werte aufweisen, die den Aspirationsdauer-Werten deutscher Muttersprachler in der Fremdsprache Französisch vergleichbar sind. Dies deutet darauf hin, dass als Ziel in der Akzentimitation eher französische Werte angestrebt (jedoch nicht oder nur bedingt erreicht) werden und weniger ein französischer Akzent im Deutschen, der zwar noch phonetische Interferenzerscheinungen aus der Muttersprache Französisch aufweisen kann, aber ebenso bereits erfolgreich erworbene deutsche Phonemrealisierungen zeigt. 9.1.3. Zusammenfassung Es wurde bisher gezeigt, dass deutsche Muttersprachler in der Lage sind, ein sensibles phonetisches Detail wie die VOT initialer Fortis-Plosive während der Imitation eines französischen Akzents bewusst zu variieren und signifikant zu reduzieren. Künzel (1977a) konnte im Bereich des Fremdsprachenerwerbs zeigen, dass deutsche Sprecher (i) in der Fremdsprache Französisch die Aspirationsdauer initialer Fortis-Plosive ebenfalls signifikant reduzieren, jedoch (ii) nur ein Teil der deutschen Muttersprachler Aspirationsdauer-Werte erreichte, die innerhalb des Toleranzbereichs französischer Standardwerte liegen und somit mit diesen vergleichbar sind, und dass sich (iii) die Leistung der deutschen Muttersprachler während und nach der Imitation (hier Nachsprechen) einer französischen Muttersprachlerin nicht signifikant verbessert. Dies deutet bereits darauf hin, dass der Variation der Aspirationsdauer bestimmte Grenzen gesetzt sind und die Interferenzen aus dem Deutschen einen recht hohen Einfluss haben können. Die Beobachtungen dieser Studie gehen mit den Ergebnissen aus Künzel (1977a) in folgendem Punkt konform: Deutsche Muttersprachler reduzieren ihre VOT in Fortis-Plosiven signifikant. Diese Reduktion der VOT ist jedoch zum Teil so erheblich, dass die VOT-Werte eines authentischen französischen Akzents im Deutschen im Gruppenmittel übertroffen werden. Das deu- 131 tet darauf hin, dass eine Feinabstimmung in diesem Parameter nicht erreicht wird. Außerdem zeigen einige Sprecher einen Kategorienwechsel von Fortiszu Lenis-Plosiven, indem sie Stimmbeteiligung und schwache Verschlusslösungen einsetzen. 9.2. Variation der Stimmbeteiligung bei Lenis-Plosiven Die vorangegangenen Ausführungen haben anhand initialer Fortis-Plosive gezeigt, dass sich deutsche Muttersprachler bestimmter Interferenzerscheinungen französischer Muttersprachler im Deutschen bewusst sind und darüberhinaus auch in der Lage sind, sensible phonetische Details wie die VOT bei der Imitation eines französischen Akzents zu variieren. Eine Untersuchung von Lenis-Plosiven in diesem Zusammenhang steht bis hierhin jedoch noch aus. In einer persönlichen Mitteilung im August 2009 äußerte Michael Jessen die Vermutung, dass deutschen Muttersprachlern die An- oder Abwesenheit von Aspiration in Fortis-Plosiven bewusster ist, als die An- oder Abwesenheit von Stimmhaftigkeit in Lenis-Plosiven und daher bei einer Stimmverstellung Letzteres vermutlich schlechter zu variieren sei. Er begründet dies durch folgende Überlegung, die ihren Ursprung in der Plosivtypologie nimmt: Sprachen, die zwei Serien von Plosiven unterscheiden, kontrastieren (mit Ausnahme des Schwedischen, vgl. Ringen und Helgason, 2008) entweder im Merkmal Stimmbeteiligung [ ± voice], z. B. Russisch, oder im Merkmal Aspiration [ ± tense] (oder auch [ ± aspirated / spread glottis]), z. B. Isländisch, wobei beide Oppositionen durch unterschiedliche phonetische Korrelate realisiert werden, denen unterschiedlich starke Bedeutungen in dieser Realisierung zukommen. Die Stellung einer Einzelsprache, wie zum Beispiel des Deutschen oder des Französischen, innerhalb dieser Typologie wird immer wieder kontrovers diskutiert. Im Deutschen kann das Merkmal [ ± voice], wie weiter oben bereits erörtert, nicht als geeignetes Merkmal für die Kontrastierung der Plosive angesehen werden, und so spricht sich auch Jessen in seinen Arbeiten (z. B. Jessen, 1998; Jessen und Ringen, 2002) für einen Kontrast im Merkmal [ ± tense] aus und bezeichnet Aspiration als das wichtigste phonetische Korrelat (basic correlate) dieses Kontrastes (vgl. Jessen, 1998, S. 14 f.). Jessen (1998) begründet dies u. a. damit, dass aus phonetischer Perspektive eine Unterscheidung durch Aspiration kontextuell stabiler sei als eine Unterscheidung durch Stimmhaftigkeit. So werden z. B. Lenis-Plosive im Deutschen meist stimmlos realisiert und sind selbst im intervokalischen Kontext oft zumindest teilentstimmt, wohingegen Fortis-Plosive bis auf die Stellung vor einem silbischen Sonoranten meist mehr oder weniger stark aspiriert sind. Auch aus perzeptorischer Sicht scheint Aspiration zur Unterscheidung der Plosiv-Serien eine größere Rolle zu spielen als Stimmhaftigkeit (vgl. Kohler, 1979). Steinberg (2008), eine Untersuchung zu geflüsterten Plosiven, in denen das Vorhandensein von Stimmhaftigkeit per se ausgeschlossen ist, zeigt ebenfalls, dass die Opposition signifikant über Aspiration reali- 132 siert wird. Schlussfolgernd können, so Jessen in seiner persönlichen Mitteilung 2009, im Deutschen Aspiration als phonologisch „aktiv“ und Stimmhaftigkeit in Plosiven als phonologisch „passiv“ aufgefasst und kontextuelle Stabilität und perzeptuelle Relevanz als phonetische Kriterien dafür betrachtet werden. Ein weiteres mögliches Kriterium sei, dass aktive Merkmale der bewussten Kontrolle zugänglicher sind als passive. Untersuchungen im Bereich der Stimmverstellungen können die Möglichkeit bieten, eine solche bewusste Kontrolle zu testen. Auch die Stellung des Französischen in dieser Plosiv-Typologie ist nicht unkontrovers. Allerdings sprechen einige Gründe für Stimmhaftigkeit als diskriminierendes Merkmal, so z. B. regressive Assimilation im Merkmal der Stimmbeteiligung (vgl. z. B. Abdelli-Beruh, 2004), perzeptuelle Relevanz wie sie u. a. van Dommelen (1983) zeigt oder die in deskriptiven Studien beschriebene Nicht-Aspiration der Fortis-Plosive. Zu Beginn dieses Kapitels wurde bezüglich der Unterscheidung deutscher und französischer Plosive auf Künzel (1977a) verwiesen, der als unterscheidendes Kriterium die Aspiration für Fortis-Plosive und die An- oder Abwesenheit von Stimmbeteiligung für Lenis-Plosive annimmt. Da französische Lenis- Plosive wie oben beschrieben sich von den deutschen dadurch unterscheiden, dass sie in der Regel voll stimmhaft, d. h. mit vor der Verschlusslösung einsetzender Stimmhaftigkeit, realisiert werden, kann eine stimmhafte Realisierung deutscher Lenis-Plosive seitens französischer Muttersprachler als Interferenzerscheinung angenommen werden. Wenn nun, wie von Jessen angenommen, Stimmhaftigkeit im Deutschen ein passives phonologisches Merkmal ist, das aus diesem Grunde der bewussten Kontrolle weniger zugänglich ist als die Aspiration als aktives phonologisches Merkmal, dann kann davon ausgegangen werden, dass die deutschen Muttersprachler bei der (stimmhaften) Realisierung von Lenis-Plosiven weniger variationsfähig sind als sie es bezüglich der Reduktion der Aspiration waren. Flege und Eefting (1988) und Vieru-Dimulescu et al. (2007) zeigen, dass englische bzw. deutsche Muttersprachler Lenis-Plosive im Spanischen bzw. Französischen häufig entstimmt realisieren. Auch diese Ergebnisse können als Hinweis auf eine geringe Variationsfähigkeit deutscher Muttersprachler im Merkmal Stimmbeteiligung gedeutet werden. Aus diesen Ausführungen ergibt sich die folgende Untersuchungsfrage: Sind deutsche Muttersprachler in Lage, die Realisierung von Lenis-Plosiven bei der Imitation eines französischen Akzents zu variieren, indem sie Stimmbeteiligung einsetzen? 9.2.1. Methode Um zu testen, wie variationsfähig deutsche Muttersprachler hinsichtlich des Merkmals Stimmbeteiligung sind, soll ein Kontext gewählt werden, in dem die Lenis-Plosive im Deutschen mit hoher Sicherheit stimmlos realisiert werden. 133 Ein intervokalischer Kontext wird somit ausgeschlossen. Zwar werden auch hier die Lenis-Plosive selten aktiv voll stimmhaft realisiert, dennoch kann eine Teilstimmhaftigkeit vorliegen oder sich die Stimmhaftigkeit auch passiv vom vorhergehenden Vokal ausbreiten. In äußerungsinitialer Position geht dem Plosiv jedoch eine stimmlose Phase voraus und es kann häufig von einer stimmlosen Realisierung des Lenis-Plosivs ausgegangen werden. Ebenso in der Position nach einem stimmlosen Obstruenten - durch eine progressive Stimmlosigkeitsassimilation wird der Lenis-Plosiv ebenfalls stimmlos, und damit mit positiver VOT, realisiert. 12 Im Französischen hingegen, wo von stimmhaft realisierten Plosiven und damit von einer der Verschlusslösung vorauseilenden Stimmhaftigkeit ausgegangen werden kann, würde in der Position nach einem stimmlosen Obstruenten die Stimmhaftigkeit des Plosivs aufgrund einer regressiven Assimilation auf den davorstehenden Obstruenten übertragen werden (vgl. Abdelli-Beruh, 2004). Für 22 deutsche Muttersprachler wurde die VOT in jeweils 27 initialen Lenis- Plosiven aus jeweils den verstellten und unverstellten Produktionen gemessen. Darunter kommen 14 Lenis-Plosive in satzinitialer Position vor und folgen damit auf eine Pause, neun Plosive stehen in wort- und vier in silbeninitialer Position und folgen jeweils auf einen stimmlosen Obstruenten. Als Textbasis wurde wieder auf die Texte 1 und 3 zugegriffen, da hier auch die unverstellten Versionen zum Vergleich vorliegen. Für die alveolaren Plosive war die zur Verfügung stehende Datenbasis am günstigen, da hier 14 Lenis-Plosive in die Messungen einbezogen werden konnten. Die Gruppe der labialen Plosive ist, wie bei den Fortis-Plosiven auch, am schwächsten vertreten und es konnten nur drei Tokens verwendet werden. Obwohl eigentlich aus Gründen der Einheitlichkeit auf den zu untersuchenden Lenis-Plosiv ein Vokal folgen sollte, wurde „bleiben“ jedoch nicht ausgeschlossen, um die schon geringe Datenbasis für bilabiale Lenis-Plosive nicht noch weiter zu verringern. Einige Tokens (N=17, davon 14 in der unverstellten Version) konnten aufgrund von Abweichungen im Text nicht untersucht werden oder mussten von der Analyse ausgeschlossen werden, da die Verschlusslösung zu schwach oder mit Friktion überlagert und somit nicht erkennbar war, oder weil der dem Plosiv folgende Vokal stimmlos realisiert oder elidiert wurde. Die Gesamtheit der in die Analyse einbezogenen Lenis-Plosive in der Gruppe der deutschen Muttersprachler umfasst 1171 Lenis-Plosive. Außerdem wurde für die vier zur Verfügung stehenden französischen Muttersprachler ebenfalls die VOT von 27 initialen Lenis-Plosiven von den deutschen Produktionen der Texte 1 und 3 (gleiche Tokens wie bei den deutschen Muttersprachlern) gemessen. Die Plosive aus zwei Tokens mussten ausgeschlossen werden, da der Sprecher (F-nm02) keine Pause zwischen den Sätzen machte und so der stimmlose Kontext vor dem Lenis-Plosiv nicht mehr gegeben war. 12 Vgl. dazu auch Braun (1988) oder Jessen (1998), die einen zusammenfassenden Überblick über die relevante Forschungsliteratur geben. 134 Tabelle 9.13.: Datenbasis zur Messung der VOT bei Lenis-Plosiven gruppiert nach Artikulationsstelle des Plosivs. ~ bedeutet, dass sich der Plosiv in satzinitialer Position befindet, d. h. dass davor eine Pause steht. / b/ / d/ / g/ Wort (N) zwölf Banken ~ Dann das Geld (4) ~ Bei ~ Dort (2) Falschgeld ~ Bleiben ~ Der (2) sind gehen ~ Das (4) nichts garantieren aufgepasst dass insgesamt (2) ~ Die (3) aufgepasst Weltkrieg dabei N 3 14 10 N gesamt = 27 Die Gesamtheit der in die Analyse einbezogenen Lenis-Plosive in der Gruppe der französischen Muttersprachler umfasst 106 Lenis-Plosive. Tabelle 9.13 stellt die Datenbasis für die VOT-Analyse der Lenis-Plosive sowohl für die Produktionen der deutschen Muttersprachler (verstellt und unverstellt) als auch für die deutschen Produktionen der französischen Muttersprachler dar. Wie bei den Fortis-Plosiven wurde auch bei den Lenis-Plosiven der erste starke Amplitudenausschlag der Verschlusslösung als erster Messpunkt für die VOT- Messung bestimmt. Der zweite Messpunkt wurde am Nulldurchgang der ersten periodischen Schwingung gesetzt. Allerdings erwies sich die Bestimmung der Messpunkte in einigen Fällen als besonders schwierig. Problematisch war es, wenn die Plosivlösung sehr schwach war oder die Plosivlösung und die darauffolgend einsetzende Stimmhaftigkeit besonders eng beieinander lagen (ca. 0-10 ms VOT). Da die Plosivlösung selbst einige Millisekunden dauert und zudem oft mit Friktion einhergeht, war der Einsatz der Stimmbandschwingung von dieser oft überlagert, sodass eine präzise Bestimmung des zweiten Messpunktes in diesen Fällen kaum möglich war. Das betrifft z. B. den dorsalen Plosiv in den verstellten Produktionen von das Geld (Text 1 und 3) der Sprecherinnen Ff03 und Ff14. Auf der anderen Seite kamen in den verstellten Versionen auch Fälle von durchgehender Stimmhaftigkeit vor, so z. B. bei Fm03 in das Geld (Text 1 und 3). Hier wird nicht nur der dorsale Plosiv stimmhaft realisiert, sondern auch der vorhergehende Frikativ, der im Standarddeutschen aufgrund seiner Kodastellung stimmlos realisiert werden müsste. In diesen Fällen liegt also eine regressive Assimilation der Stimmhaftigkeit vor, wie sie in Sprachen wie Französisch oder Russisch zu finden ist. Problematisch in diesen Fällen ist ebenfalls die Bestimmung des Einsatzes der Stimmhaftigkeit, da innerhalb des stimmhaften Frikativs nicht klar ist, ab wann die Stimmhaftigkeit möglicherweise noch vom vorhergehenden Vokal ausgeht und sich progressiv überträgt 135 und ab wann sie vom folgenden stimmhaft realisierten Plosiv ausgeht und sich regressiv überträgt. Außerdem sind auch in einigen anderen Fällen weitere Formen von Stimmhaftigkeit, die der Verschlusslösung vorauseilt, oder Pränasalierung des Plosivs zu finden, die weiter unten diskutiert werden. Aus diesen Ausführungen wird bereits deutlich, dass sich aus den gemessenen VOT-Einzelwerten der verstellten Versionen nicht einfach das arithmetische Mittel bilden lässt, das sich später mit dem VOT-Mittelwert der unverstellten Produktionen vergleichen lässt. Aus diesem Grund werden die Ergebnisse der Analyse der Lenis-Plosive aus den Produktionen der deutschen Muttersprachler in drei Teile untergliedert: (i) allgemeine Ergebnisse und Tendenzen, (ii) Realisierung von / b, d, g/ ohne Beteiligung von Stimmhaftigkeit, was die Analyseergebnisse mit positiven VOT-Werten beinhaltet, und (iii) Realisierung von / b, d, g/ unter Beteiligung von Stimmhaftigkeit, was verschiedene Formen der (teil)stimmhaften sowie der pränasalierten Realisierungen der Lenis- Plosive beinhaltet. An die Analyseergebnisse der Produktionen der deutschen Muttersprachler schließt sich die Darstellung der Analyseergebnisse der deutschen und französischen Produktionen der französischen Muttersprachler und ein Vergleich dieser mit den Produktionen der deutschen Muttersprachler an. 9.2.2. Ergebnisse Allgemeine Ergebnisse und Tendenzen In den unverstellten Textversionen produzierten die deutschen Muttersprachler mit großer Mehrheit stimmlose Realisierungen der Lenis-Plosive. Das heißt, dass sich die gemessenen VOT-Werte fast ausschließlich im positiven Bereich bewegten. Nur drei von insgesamt 580 Lenis-Plosiven wurden mit einer der Plosivlösung vorauseilenden Stimmhaftigkeit realisiert. Auffällig ist, dass die Verschlusslösungen in einigen Fällen so schwach waren bzw. kein vollständiger Verschluss gebildet wurde, sodass eine Bestimmung von VOT-Werten dadurch nicht möglich war. Auch in ihren verstellten Versionen produzierten die deutschen Muttersprachler mehrheitlich stimmlose Realisierungen der Lenis-Plosive / b, d, g/ . So haben 16 von 22 deutschen Muttersprachlern in mehr als 75 % der Fälle (über 20 von 27 Tokens) / b, d, g/ ohne Beteiligung von Stimmhaftigkeit und mit positiver VOT realisiert. Etwas mehr als die Hälfte dieser Sprecher (9) wies in allen untersuchten Tokens positive VOT-Werte auf. Dennoch konnten bei 13 deutschen Muttersprachlern auch Realisierungen der Lenis-Plosive beobachtet werden, in denen Stimmbeteiligung vorhanden war. Dazu zählen z. B. durchgehende Stimmhaftigkeit beginnend in der Verschlussphase und andauernd bis zum Folgevokal, Stimmhaftigkeit gefolgt von einer Phase von Stille um die Verschlusslösung herum und Aspiration nach der Verschlusslösung sowie pränasalierte Plosive. Die Anzahl der Tokens, deren initialer Lenis-Plosiv unter 136 Beteiligung von Stimmhaftigkeit produziert wurde, rangiert zwischen ein bis maximal 16 (von insgesamt 27) Tokens pro Sprecher. Tabelle 9.14 gibt für die Lenis-Plosive in den verstellten und den unverstellten Textproduktionen einen zusammenfassenden Überblick über Anzahl der stimmlosen Realisierungen sowie der Realisierungen unter Stimmbeteiligung. Die Kategorie „Realisierung mit Stimmbeteiligung“ könnte theoretisch noch in die einzelnen Formen wie durchgehende Stimmhaftigkeit, Stimmhaftigkeit in der Verschlussphase mit folgender Stimmlosigkeit kurz vor der Verschlusslösung, Pränasalierung etc. untergliedert werden. Da die Grenzen jedoch in der Regel fließend sind, in vielen Fällen die artikulatorisch-aerodynamischen Gründe für die Realisierung der einen oder anderen Form aus dem akustischen Signal allein nicht erschlossen werden können und außerdem auch die Relevanz einer solch feinen Untergliederung für diese Untersuchung fraglich erscheint, wurde darauf verzichtet. Neben den absoluten Zahlen sind auch die jeweiligen prozentualen Anteile der verschiedenen Realisierungen angegeben. Realisierung von / b, d, g/ ohne Beteiligung von Stimmhaftigkeit Wie bereits oben angeführt und in Tabelle 9.14 ersichtlich, haben die deutschen Muttersprachler die Lenis-Plosive in ihren unverstellten Versionen fast ausschließlich stimmlos realisiert. Nur drei Tokens (von 580; nicht verfügbare Werte bereits abgezogen), gesprochen von je einem Sprecher, zeigen stimmhafte Realisierungen des untersuchten Lenis-Plosivs. Das über alle Sprecher gebildete arithmetische Mittel der VOT beträgt 18,9 ms (s = 3,3), wobei hier nur die positiven Werte, d. h. die stimmlos realisierten Lenis-Plosive, berücksichtigt wurden 13 . Die Varianz um diesen Mittelwert ist bei einem Variationskoeffizienten (C v ) von 0,17 ist als gering zu bezeichnen. Zwar wurden auch in den Akzentimitationen die Mehrheit der untersuchten Lenis-Plosive stimmlos realisiert, dennoch zeigt sich das Bild nicht so einheitlich wie in den unverstellten Versionen. Wie in Tabelle 9.14 dargestellt, haben neun von 22 deutschen Muttersprachlern während der Imitation eines französischen Akzents alle untersuchten Lenis-Plosive stimmlos und mit positiver VOT realisiert. Immerhin 16 von 22 Sprechern (fast dreiviertel der Sprecher) haben wiederum die Lenis-Plosive in mehr als 20 von 27 Tokens stimmlos realisiert. Das über alle Sprecher gebildete arithmetische Mittel der VOT in diesen stimmlos realisierten Lenis-Plosiven beträgt 17,9 ms (s = 3,3), wobei die Varianz von diesem Mittelwert mit einem Variationskoeffizienten C v = 0,18 gering ist. Obwohl sich die arithmetischen Mittelwerte der VOT-Dauern der stimmlos realisierten Lenis-Plosive in der unverstellten und der verstellten Version bei einer über alle Sprecher gemittelten Mittelwertsdifferenz von weniger als 1 ms 13 Eine Berücksichtigung der stimmhaft realisierten Werte wirkt sich auf diesen Mittelwert kaum aus: Das über alle Sprecher gebildete arithmetische Mittel reduziert sich lediglich auf 18,5 ms (s = 3,1). 137 Tabelle 9.14.: Anzahl der Realisierungen der Lenis-Plosive mit und ohne Stimmbeteiligung in der verstellten (verst.) und unverstellten (unverst.) Version pro Sprecher. (MW = arithmetisches Mittel der positiven VOT-Werte in ms, NA = nicht verfügbare Werte) N ohne Stimmbeteiligung (MW) N mit Stimmbeteiligung NA verst. unverst. verst. unverst. verst. unverst. Ff01 27 (19,6) 25 (18,8) 0 0 0 2 Ff02 26 (14,0) 27 (17,1) 1 0 0 0 Ff03 20 (13,1) 27 (13,9) 7 0 0 0 Ff04 27 (21,5) 27 (21,4) 0 0 0 0 Ff05 19 (12,2) 27 (14,5) 8 0 0 0 Ff06 25 (15,3) 27 (15,0) 2 0 0 0 Ff07 19 (14,9) 27 (13,7) 7 0 1 0 Ff08 27 (17,6) 27 (18,9) 0 0 0 0 Ff09 27 (16,8) 26 (18,8) 0 0 0 1 Ff10 11 (20,2) 26 (19,1) 16 1 0 0 Ff11 17 (21,9) 25 (19,5) 10 1 0 1 Ff12 27 (21,5) 24 (24,0) 0 0 0 3 Ff13 27 (17,1) 26 (16,3) 0 0 0 1 Ff14 26 (15,5) 25 (17,4) 1 0 0 2 Ff15 26 (16,4) 27 (18,9) 1 0 0 0 Fm01 25 (16,2) 25 (15,6) 0 0 2 2 Fm02 27 (25,3) 26 (26,3) 0 0 0 1 Fm03 14 (19,9) 25 (23,9) 13 1 0 1 Fm04 23 (19,7) 27 (20,6) 4 0 0 0 Fm05 26 (18,3) 27 (21,1) 1 0 0 0 Fm06 26 (21,9) 27 (20,2) 1 0 0 0 Fm07 27 (15,7) 27 (19,8) 0 0 0 0 Gesamt (= 594) 519 (17,9) (88 %) 577 (18,9) (99,5 %) 72 (12 %) 3 (0,5 %) 3 14 kaum voneinander unterscheiden, zeigt ein einseitiger gepaarter t-Test 14 , dass die VOT-Dauer in der verstellten Version signifikant geringer ist als in der unverstellt gesprochenen Version (p < 0,05; t = 2,2897; df = 21), was auf eine geringe Varianz um den Mittelwert in beiden Textversionen zurückgeführt werden kann. Während bei den Fortis-Plosiven die deutschen Muttersprachlerinnen in der unverstellten Version eine signifikant längere VOT als die Männer zeigten, ist es bei den Lenis-Plosiven genau umgekehrt. Hier ergibt ein t-Test, dass die männlichen Sprecher in der unverstellten Version bei einem Signifikanzlevel von 5 % signifikant höhere VOT-Werte haben als die weiblichen (p < 0,05; t = 14 Nach dem Shapiro-Wilk-Test kann davon ausgegangen werden, dass die Mittelwertsdifferenzen normal verteilt sind (p > 0,5, W = 0,9619). 138 Tabelle 9.15.: VOT-Mittelwerte (in ms) der Fortis- und Lenis-Plosive in verstellter und unverstellter Version unter Berücksichtigung des Sprechergeschlechts / p, t, k/ / b, d, g/ verstellt unverstellt verstellt unverstellt weiblich 37,6 56,9 17,2 17,8 männlich 34,2 48,8 19,6 21,5 gesamt 36,6 54,3 17,9 18,9 Tabelle 9.16.: Zusammenfassung der Ergebnisse der statistischen Testverfahren hinsichtlich der VOT-Unterschiede in verstelltem (verst.) und unverstelltem (unverst.) Modus und zwischen den Sprechergeschlechtern / p, t, k/ / b, d, g/ verstellt - unverstellt verst. < unverst. verst. < unverst. - ♀ verst. < unverst. - ♂ *** *** *** verst. < unverst. verst. < unverst. - ♀ verst. < unverst. - ♂ * n.s. n.s. weiblich - männlich ♀ > ♂ - unverst. ♀ > ♂ - verst. * n.s. ♀ < ♂ - unverst. ♀ < ♂ - verst. * n.s. 2,2128; df = 10,216). In der verstellten Version ist dieser Unterschied jedoch nicht signifikant (p > 0,05; t = 1,6025; df = 11,224). Obwohl die Gesamtgruppe der deutschen Muttersprachler in der verstellten Version die VOT signifikant reduziert, ist die Reduktion innerhalb der Einzelgruppen der männlichen und weiblichen deutschen Muttersprachler jedoch nicht signifikant (weiblich: p > 0,05; t = 1,4661; df = 14; männlich: p > 0,05; t = 1,776; df = 6). Tabelle 9.15 stellt für die deutschen Muttersprachler die gemessenen VOT- Mittelwerte für Fortis- und Lenis-Plosive in verstellter und unverstellter Version unter Berücksichtigung des Sprechergeschlechts gegenüber. In Tabelle 9.16 werden zusammenfassend die Ergebnisse der statistischen Testverfahren hinsichtlich der VOT-Unterschiede in verstelltem und unverstelltem Modus und hinsichtlich des Sprechergeschlechts dargestellt. Die Ergebnisse der Studie zeigen, dass Frauen in ihren unverstellten Textproduktionen bei Fortis-Plosiven signifikant höhere VOT-Mittelwerte und bei Lenis-Plosiven signifikant niedrigere VOT-Mittelwerte als Männer haben. Das deutet darauf hin, dass Frauen die Fortis-Lenis-Opposition mittels VOT als Korrelat stärker kontrastieren als Männer. Hier sind Untersuchungen von Whiteside et al. (2004) und Wadnerkar et al. (2006) zum Zusammenhang zwischen VOT und hormonellen Veränderungen während des weiblichen Zyklus von Interesse, die zeigen, dass Frauen in einer Zyklusphase mit hohem Östrogen- und Progesteron-Level signifikant höhere VOT-Werte für Fortis-Plosive und signifikant niedrigere VOT-Werte für Lenis-Plosive aufweisen als in einer Zy- 139 klusphase mit niedrigem Östrogen- und Progesteron-Level. Das bedeutet, dass Sprecherinnen in einer Phase, in der sie hormonell am „weiblichsten“ sind, einen verstärkten Unterschied zwischen Fortis- und Lenis-Plosiven treffen, den sie über VOT realisieren und mit der auch eine Erhöhung der Deutlichkeit der Sprache einhergeht. Dieser geschlechtsspezifische Effekt eines größeren Fortis- Lenis-Kontrastes realisiert über die VOT lässt sich jedoch nur für die unverstellte Textversion statistisch nachweisen. In der verstellten Textversion erreicht dieser Effekt vermutlich aufgrund einer höheren Varianz keine Signifikanz. Um für diese Studie genauere Aussagen zu den Geschlechtsunterschieden zu treffen, wäre ein ausgewogeneres Geschlechterverhältnis notwendig. Realisierung von / b, d, g/ unter Beteiligung von Stimmhaftigkeit Bevor die Ergebnisse dargestellt werden, soll eine kurze einleitende Erklärung zu den artikulatorischen Abläufen bei stimmhaften Plosiven gegeben werden. Um bei stimmhaften Plosiven die Stimmlippenschwingung zumindest während eines Teils der Verschlussphase aufrechtzuerhalten, muss ein Abfallen des transglottalen Luftdrucks verhindert werden. Dies kann durch eine aktive Volumenvergrößerung des Vokaltrakts erreicht werden, indem z. B. der Larynx abgesenkt, der pharyngale Raum vergrößert und das Velum gehoben wird. Außerdem wirkt eine passive Ausdehnung des Vokaltraktes durch die Nachgiebigkeit (compliance) des Gewebes im Vokaltrakt, z. B. der Wangen oder der Zunge (vgl. Ohala und Riordan, 1979). Durch die Volumenvergrößerung des Vokaltraktes baut sich der intraorale Druck langsamer und stetig auf. Damit wird dem Abfallen des transglottalen Luftstroms entgegen gewirkt. Zwar wird er durch eine leichte passive Öffnung der Glottis etwas reduziert, kann aber im besten Fall weiter fließen. Außerdem können die Stimmlippen, die durch ein Absinken des Larynx mit verbundener Kippbewegung des Ringknorpels verdickt und entspannt sind, auch bei einer Reduktion des transglottalen Drucks weiterschwingen. Die Frequenz und die Amplitude dieser Schwingung während der Verschlussphase ist jedoch geringer als im Vokal davor oder nach der Verschlusslösung. Stevens (1998), der sich dabei auf Daten von Ewan und Krones (1974) bezieht, kommt in seiner Berechnung bei einer Absenkung des Larynx um 4-6 mm zu einer Verkürzung der Stimmlippen um 2-3 % und zu einer Abnahme ihrer Spannung zwischen 9 und 15 %. Wenn sich dieser verringerte Spannungsgrad auf den benachbarten Vokal überträgt, dann führt das zu einer Verringerung der Grundfrequenz um 5-7 % in den ersten 50-100 ms des Vokals. Das entspricht einer Senkung der F0 bei Männern um ca. 7 Hz und bei Frauen um ca. das Doppelte. 15 Allerdings kann der transglottale Druck während der 15 Die gemessene Verringerung der Grundfrequenz in einem Vokal nach einem stimmhaften Plosiv im Vergleich zu einem Vokal nach einem stimmlosen Plosiv ist jedoch etwas größer und bewegt sich zwischen 10-15 % - Stevens (1998) referiert hier Ohde (1984) und Kingston und Diehl (1994). Diese scheinbare Differenz kommt dadurch zustande, dass bei stimmlosen Plosiven die aktive Spannung der Stimmlippen zu einer Erhöhung der F0 im Folgevokal führt (vgl. Stevens, 1998, S. 140 Verschlussphase auch so stark abfallen, dass kurz vor der Verschlusslösung keine Stimmlippenschwingung mehr vorhanden ist. Weil der intraorale Luftdruck bei stimmhaften Plosiven etwas geringer als bei stimmlosen Plosiven ist, fällt auch der Burst an der Verschlusslösung in seiner Amplitude etwas schwächer aus als bei stimmlosen Plosiven (vgl. Stevens, 1998, S. 465-474). Wie zu erwarten, wurde in den unverstellten Textproduktionen der deutschen Muttersprachler die Mehrheit der Lenis-Plosive ohne Beteiligung von Stimmhaftigkeit realisiert. Nur drei von 22 Sprechern haben je ein Token mit einem stimmhaften initialen Lenis-Plosiv gebildet. Es handelt sich in allen drei Fällen um satzinitiale Lenis-Plosive. Die Dauer der der Verschlusslösung vorauseilenden Stimmhaftigkeit beträgt in diesen Fällen ca. 26 ms (dort, Text 3, Sprecherin Ff11), 32 ms (bleiben, Text 3, Sprecherin Ff10) und 78 ms (bleiben, Text 3, Sprecher Fm03). Bei dem Wort bleiben sind die Produktionen beider Sprecher (Ff10, Fm03) durchgehend stimmhaft, d. h. die Stimmhaftigkeit setzt vor der Verschlusslösung ein und dauert bis zum Lateral an. Dabei ist die Lösung des Plosivs so schwach, dass im Oszillogramm kein eindeutiger Amplitudenausschlag erkennbar ist und daher der im Sonagramm sichtbare vertikale Balken als Messpunkt genutzt wurde. Bei dem Wort dort (Ff11) beträgt die Zeit zwischen dem Einsatz der Stimmhaftigkeit und der nachfolgenden Verschlusslösung ca. 26 ms, der Lösung folgen ca. 10 ms Friktion und Stimmhaftigkeit, die in ihrer Amplitude etwas schwach und im Schwingungsverhalten unregelmäßig ist. Während der Imitation eines französischen Akzents zeigten immerhin 13 von 22 deutschen Muttersprachlern auch Lenis-Plosiv-Realisierungen unter Beteiligung von Stimmhaftigkeit. Für die apikalen Plosive lässt sich dabei im Vergleich zu den dorsalen Plosiven eine deutlich größere Anzahl an Realisierungen unter Beteiligung von Stimmhaftigkeit feststellen. Vergleicht man nicht die absoluten Zahlen, sondern die prozentualen Anteile der mit Stimmbeteiligung gebildeten Lenis-Plosive, so lässt sich erkennen, dass bei einer größeren Datenbasis für die bilabialen Plosive auch hier die Anzahl der mit Stimmbeteiligung realisierten Lenis-Plosive im Vergleich zu den dorsalen überwiegen würde. Tabelle 9.17 stellt die Verteilung der mit Stimmbeteiligung realisierten Lenis-Plosive nach Artikulationsort dar. Es ist davon auszugehen, dass ein weiter vorn im Mund gebildeter Verschluss das Aufrechterhalten der für die Stimmlippenschwingung notwendigen Druckverhältnisse besser ermöglicht als es für die hintere Verschlussbildung der Fall ist, u. a. weil das Vokaltraktvolumen bei dorsalen Plosiven nicht so stark ausgedehnt werden kann (vgl. Ohala und Riordan, 1979; Stevens, 1998, S. 368). Allerdings darf dabei nicht außer Acht gelassen werden, dass die deutliche Mehrheit der Tokens mit alveolarem Lenis-Plosiv satzinitial steht, während die Mehrheit der dorsalen Lenis-Plosive auf einen stimmlosen Obstruenten folgt. 466 f., 470 f.). Mehr zum kontextuellen F0 z. B. bei Kohler (1982); Ohde (1984); Kingston und Diehl (1994). 141 Tabelle 9.17.: Verteilung der mit Stimmbeteiligung realisierten Lenis-Plosive nach Artikulationsort (N Tokens = Anzahl der Tokens gesprochen von allen Sprechern abzüglich der nicht verfügbaren Werte; N Stimmbeteil. = absolute Anzahl der mit Stimmbeteiligung realisierten Lenis-Plosive sowie Prozentsatz vom Grundwert) / b/ / d/ / g/ N Tokens 65 306 220 N Stimmbeteil. 8 (12 %) 53 (17 %) 11 (5 %) Der Effekt eines mehr als dreifach höheren Anteils an mit Stimmbeteiligung realisierten Lenis-Plosiven bei den Alveolaren im Vergleich zu den Dorsalen lässt sich vermutlich nicht allein durch den Artikulationsort erklären, sondern ist auch kontextabhängig. In der überwiegenden Mehrheit der untersuchten Fälle handelt es sich bei den Realisierungen von Lenis-Plosiven mit Stimmbeteiligung um eine in der Verschlussphase beginnende Stimmhaftigkeit, die bis zum Folgevokal andauert. Diese Form kann somit als durchgehend bezeichnet werden. Vor allem die Sprecher Ff10, Fm03 und Ff03 wiesen in ihren verstellten Produktionen durchgehend stimmhaft realisierte Lenis-Plosive auf, deren stimmhafte Verschlussphase sich beginnend ab ca. 30 ms auf bis zum Teil über 100 ms erstreckt. Die Frequenz und Amplitude der periodischen Schwingung vor der Verschlusslösung waren jedoch in einigen dieser Fälle zum Teil erheblich reduziert, sodass die Abgrenzung zu einer möglichen Kategorie „stimmhafte Verschlussphase mit folgender Stimmlosigkeit kurz vor der Verschlusslösung“ nicht immer zweifelsfrei möglich wäre. Im Folgenden werden weitere Auffälligkeiten bei der Realisierung von Lenis- Plosiven bei der Akzentimitation beispielhaft beschrieben. Der dorsale Plosiv in gehen aus der Phrase Wenn Sie am Stadion angekommen sind, gehen Sie zur Kasse 2 und werfen das Geld dort in den Mülleimer (Text 1) wurde bei der Akzentimitation von sieben von 22 Sprechern mit Stimmbeteiligung realisiert. Zum einen zeigen zwei deutsche Muttersprachler voll stimmhafte Realisierungen, d. h. die VOT war negativ: Bei Sprecher Fm03 wurde eine VOT von -40 ms gemessen. Bei Sprecherin Ff06 beginnt die Stimmhaftigkeit noch während der Aspirationsphase des / t/ in sind und dauert ca. 114 ms an. Außerdem folgt bei beiden Sprechern nach der dorsalen Verschlusslösung noch eine kurze Strecke (ca. 15-25 ms) aspirierte Stimmhaftigkeit, bevor der Vokal unaspiriert in Modalstimme produziert wird. Zum anderen weisen fünf weitere Sprecherinnen (Ff02, Ff05, Ff07, Ff10, Ff15) in ihren Produktionen vor der dorsalen Verschlusslösung andere Formen von Stimmhaftigkeit auf. Zunächst wird der apikale Plosiv im Auslaut von sind regulär gelöst, danach folgt eine Pause, die durch den Einsatz von Stimmhaftigkeit, erkennbar an einem plötzlichen, starken Ausschlag im Signal, unterbrochen wird. Bei drei der fünf Spreche- 142 rinnen (Ff05, Ff07, Ff10) folgt auf diesen auffälligen Stimmeinsatz erst eine ca. 20-50 ms andauernde Phase von Stille, bevor dann eine Phase von Stimmhaftigkeit mit einer Dauer von bis zu 80 ms folgt. An dieses Stück Stimmhaftigkeit schließt sich (außer bei einer Sprecherin, Ff07) erneut ein Stück Stille an, das zwischen 20-65 ms dauert und auf das die Lösung des dorsalen Verschlusses folgt. Zwischen dieser Verschlusslösung und dem Einsetzen der Stimmhaftigkeit für den folgenden Vokal / e: / findet sich bei vier Sprecherinnen (Ausnahme ist hier wieder Ff07) eine VOT von 17-32 ms. Bei Sprecherin Ff07 hingegen liegt durchgehende Stimmhaftigkeit von ca. 80 ms vor, die bereits vor der Plosivlösung ebenfalls erkennbar an einem starken Ausschlag im Signal einsetzt und bis zum Vokal andauert. Abbildung 9.7 zeigt für die Sprecherinnen Ff02, Ff05, Ff07, Ff10, Ff15 jeweils das Sonagramm und Oszillogramm des Ausschnitts gehen mit der beschriebenen vor der dorso-velaren Verschlusslösung einsetzenden Stimmhaftigkeit. Der dynamische Bereich des Sonagramms umfasst 45,0 dB. Die verwendeten Dateiausschnitte wurden mit Wavesurfer normalisiert (100 %). Den Sprecherinnen scheint bewusst zu sein, dass sie für die Imitation eines französischen Akzents irgendeine andere als im Deutschen übliche Realisierung des Lenis-Plosivs benötigen und verbinden dies scheinbar sogar mit Stimmhaftigkeit. Allerdings ist die stimmhafte Realisierung des dorso-velaren Plosivs in der Umsetzung eher schwierig. Der artikulatorische Ablauf der oben beschriebenen Produktionen kann folgendermaßen beschrieben werden. Die Glottis ist während der Aspirationsphase des / t/ in sind geöffnet und Luft strömt aus; bei Ff07 folgt zwischen sind und gehen noch eine Atmungspause, sodass hier von einer Respirationsstellung der Glottis ausgegangen werden kann. Es folgt die Bildung eines dorso-velaren Verschlusses für das / g/ und eine zeitlich eng damit verbundene Bildung eines glottalen Verschlusses mit resultierendem Anstieg des subglottalen Drucks. Zwischen der Bildung und der Lösung des velaren Verschlusses wird der Glottalverschluss gelöst - im Sonagramm am vertikalen Ausschlag erkennbar. Nach kurzer Zeit, wenn sich die Druckverhältnisse ausgeglichen haben, setzt die Stimmlippenschwingung und damit die Stimmhaftigkeit ein. Allerdings kann der für die Schwingung nötige transglottale Druck bei einem dorso-velaren Verschluss nicht lange aufrecht erhalten werden und die Stimmhaftigkeit setzt daher bereits nach einigen Millisekunden wieder aus. Der dorso-velare Verschluss wird gesprengt und nach kurzer Zeit ist das nötige Druckverhältnis wiederhergestellt und die Stimmlippen können für den Vokal wieder schwingen. Somit liegt in diesen Fällen zwar häufig eine (zum Teil) stimmhafte Verschlussphase vor, aber dennoch könnten positive VOT-Werte gemessen werden. Da in dem Stück Stimmhaftigkeit vor der velaren Verschlusslösung keine oberen Frequenzen erkennbar waren, die auf die Zuschaltung des Nasenraumes als zusätzlichen Resonanzraum hindeuten, und auch auditiv ein „dumpfer“ Klang festgestellt wurde, kann Pränasalierung hier ausgeschlossen werden. An dieser Stelle soll angemerkt werden, 143 Time (s) 0 2.2 0 5000 Frequency (Hz) 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 2.2 Ff02 Ff05 Ff07 Ff10 Ff15 0 1000 2000 3000 4000 5000 Abbildung 9.7.: Vor Verschlusslösung einsetzende Stimmhaftigkeit in der verstellten Version von gehen (Text 1, 1. Aufnahme) 144 dass sich die Produktion von Ff15 insofern von den oben beschriebenen Produktionen der anderen Sprecherinnen unterscheidet, dass die Stimmhaftigkeit vermutlich weich, d. h. ohne abrupte Öffnung eines glottalen Verschlusses, aber mit einem graduellen Einschwingen der Stimmlippen, einsetzt. Der im Sonagramm sichtbare schwarze Balken, der hier aufgrund des in der Abbildung 9.7 gewählten Frequenzbereiches (0-5000 Hz) den anderen gleicht, erstreckt sich jedoch in Wirklichkeit über den gesamten Frequenzbereich und auch auditiv ist ein Unterschied zu erkennen. Es handelt sich also vermutlich nicht um die Sprengung eines glottalen Verschlusses, sondern eventuell um eine Art Click. Bei einer Reihe von Tokens, z. B. bei dort, der, das (v. a. bei den Sprechern Ff05, Ff07, Ff10, Ff11 und Fm03) finden sich weitere Formen, in denen die Verschlussphase zum Teil stimmhaft realisiert wird. Die Dauer der stimmhaften Phase kann dabei stark schwanken. Die Stimmhaftigkeit setzt jedoch jeweils kurz vor der oralen Verschlusslösung aus und setzt erst nach einiger Zeit ( ≈ 10-20 ms) mit dem Vokal wieder ein. Eine andere in dieser Untersuchung auftretende Möglichkeit der Realisierung von Lenis-Plosiven unter Beteiligung von Stimmhaftigkeit ist eine Pränasalierung des Plosivs. Sprecherin Ff11 weist bei sieben Lenis-Plosiven in ihren verstellten Produktionen Formen von Pränasalierung und in drei weiteren Fällen andere Formen von Stimmhaftigkeit vor der Verschlusslösung auf. Beides erstreckt sich ausschließlich auf die apikalen Plosive. Als pränasaliert können z. B. die apikalen Plosive in dort, dann, der, das, die bezeichnet werden, wobei die nasale und die nicht-nasale Phase jeweils eine homorgane Verbindung bilden. Auditiv unterscheidet sich diese recht hell klingende Phase der Stimmhaftigkeit bei Ff11 deutlich von den stimmhaften Verschlussphasen anderer Sprecher, die durch einen oralen und gleichzeitig nasalen Verschluss gedämpfter klingen. Abbildung 9.8 zeigt anhand von fünf Beispielen die pränasalierte Realisierung von / d/ der Sprecherin Ff11. Der Frequenzbereich des in dieser Abbildung dargestellten Sonagramms umfasst 0-8000 Hz, der dynamische Bereich umfasst 45,0 dB. Akustisch sind diese Produktionen von Ff11 durch eine Phase deutlicher Stimmhaftigkeit mit einem direkt darüber liegenden verstärkten Frequenzbereich um ca. 450-700 Hz charakterisiert, was auf Nasalität hindeutet. Darüber sind die Frequenzen gedämpft und erst der Frequenzbereich zwischen 2500- 3000 Hz wird wieder verstärkt. Die Dauer dieser stimmhaften Phase bewegt sich zwischen ca. 11-70 ms. Im Oszillogramm wird die vergleichsweise hohe Intensität in der Verschlussphase des Plosivs deutlich, die bei nicht-pränasalierten Plosiven geringer ausfallen würde. Außerdem fällt hier auch die sinusähnliche Form des Schalldruckverlaufs auf. In immerhin fünf von sieben Fällen ist die Stimmhaftigkeit durchgehend bis zum Folgevokal vorhanden, nimmt aber zur Verschlusslösung hin in den meisten Fällen deutlich ab. Sprecherin Ff11 sticht besonders heraus, da sie die einzige Sprecherin mit deutlich pränasalierten Plosiv-Realisierungen ist. Zwar lässt sich auch bei Sprecherin Ff05 in einer verstellten Version von die eine deutlich nasale Phase beobach- 145 Time (s) 0 1.44 0 8000 Frequency (Hz) 0 2000 4000 6000 8000 0 0.3 0.6 0.9 1.2 die die der dann dort Abbildung 9.8.: Pränasalierte Realisierung von / d/ in den verstellten Versionen der Sprecherin Ff11 (1. Aufnahme, Text 1 und 3) 146 ten, allerdings wurde hier der Plosiv vollständig durch einen Nasal ersetzt und steht außerdem in Zusammenhang mit einem Schluckvorgang. Pränasalierte Plosive sind zwar auch in Produktionen anderer Sprecher möglicherweise vorhanden, jedoch weder auditiv noch akustisch so eindeutig und auch nicht so eindrucksvoll darstellbar wie bei Sprecherin Ff11. Da eine eindeutige Zuordnung zu der einen oder anderen Kategorie sowieso nicht immer zweifelsfrei möglich ist, soll es an dieser Stelle bei der Beschreibung von Ff11 bleiben. Pränasalierung von Lenis-Plosiven ist für diesen Teil der Untersuchung besonders interessant, weil es eine relativ einfache Art zeigt, Lenis-Plosive unter Beteiligung von Stimmhaftigkeit zu produzieren (vgl. Ohala, 1983; Jacewicz et al., 2009). Der Plosiv wird in einen stimmhaften Kontext eingebunden, ähnlich als würde er intervokalisch stehen, und eine stimmhafte Verschlussphase wird ermöglicht. Dadurch, dass in der nasalen Phase das Velum gesenkt und damit der velopharyngale Weg für den Luftfluss freigegeben ist und die Luft durch die Nase entweichen kann, staut sich hinter der oralen Verschlussbildung (hier apiko-alveolar) keine Luft an. Damit bleibt der durchschnittliche supraglottale Luftdruck auf atmosphärischem Druckniveau und es wirken keine abduzierende Kräfte auf die Stimmlippen, die somit nicht stark in ihrem Schwingungsverhalten beeinflusst werden (vgl. Stevens, 1998, 487-489). Dass sich in den Produktionen bei Sprecherin Ff11 die Stimmhaftigkeit zur Verschlusslösung reduziert bzw. ganz aussetzt, liegt daran, dass im letzten Teil der oralen Verschlussphase das Velum doch noch angehoben wird und so der für die Plosivproduktion notwendige nasale Verschluss gebildet werden kann. Durch den oralen und nasalen Verschluss baut sich jetzt doch ein intraoraler Luftdruck auf, der auf die Stimmlippen eine abduzierende Kraft ausübt und die Schwingung der Stimmlippen erschwert oder verhindert. Der Verschluss des Velums wird vermutlich nicht in allen Fällen vollständig erreicht, aber die Enge reicht aus, um Druck aufzubauen und den oralen Verschluss später zu sprengen und gleichzeitig wird die Stimmlippenschwingung aufrechterhalten. Außerdem konnten im Rahmen der Analyse der Lenis-Plosive in den verstellten Produktionen auch stimmhafte und nicht auslautverhärtete Realisierungen des vor dem Plosiv stehenden Obstruenten festgestellt werden, wie z. B. in den Phrasen das Geld (bei Fm03) oder Weltkrieg dabei (bei Ff06, Ff13, Fm04). Wie oben bereits geschildert wird in der von Fm03 produzierten Phrase das Geld nicht nur der dorsale Plosiv stimmhaft realisiert, sondern auch der davor stehende Frikativ, der im Standarddeutschen aufgrund seiner Kodastellung stimmlos realisiert werden müsste. Problematisch ist hier die Bestimmung des Stimmeinsatzes, da innerhalb des stimmhaften Frikativs nicht klar ist, ab wann die Stimmhaftigkeit möglicherweise noch vom vorhergehenden Vokal ausgeht und sich progressiv überträgt und ab wann sie vom folgenden stimmhaft realisierten Plosiv ausgeht und sich regressiv überträgt. Im Fall des von Ff13 gesprochenen Weltkrieg dabei ist die Verschlussphase des dorsalen Lenis-Plosivs in -krieg nicht stimmhaft, allerdings folgt der oralen Lösung noch eine Phase von Glottalisierung 147 mit zentraler Vokalqualität, bevor der apikale Plosiv stimmlos mit positiver VOT realisiert wird. Auch bei Ff06 ist die Verschlussphase des dorsalen Plosivs stimmlos, der dorsalen Lösung folgt jedoch ein Stück Stimmhaftigkeit von knapp 80 ms mit anschließender Stille von ca. 50 ms Dauer, bevor der apikale Verschluss gelöst wird und nach weiteren 15 ms der Vokal einsetzt. Es ist an dieser Stelle nicht eindeutig bestimmbar, ob der finale dorsale Plosiv oder der initiale apikale Plosiv stimmhaft realisiert werden sollte. Sprecher Fm04 realisiert bei -krieg statt des finalen dorsalen Plosivs einen stimmhaften Approximanten und ermöglicht so eine stimmhafte Realisierung des darauffolgenden apikalen Plosivs. Ein interessanter Punkt ist auch, dass die einzigen drei Sprecher (Ff10, Ff11 und Fm03), die in ihren unverstellten Textproduktionen jeweils eine stimmhafte Realisierung eines Lenis-Plosivs zeigten, gleichzeitig auch die Sprecher sind, die in der Akzentimitation die größte Anzahl an Lenis-Plosiv-Realisierungen unter Beteiligung von Stimmhaftigkeit aufweisen. Vergleich der Produktionen der deutschen Muttersprachler mit den Produktionen französischer Muttersprachler Die deutschen Produktionen der französischen Muttersprachler weisen vorwiegend stimmlos realisierte Lenis-Plosive auf. Insgesamt wurden 95 von 106 Lenis-Plosiven stimmlos realisiert, was einem prozentualen Anteil von 90 % entspricht. Für diese stimmlos realisierten Lenis-Plosive ergibt sich ein über alle Sprecher gemittelter VOT-Wert von 22,7 ms, dessen Varianz mit einem Varianzkoeffizienten Cv = 0,06 sehr gering ist. Die beiden französischen Muttersprachlerinnen, deren Kompetenz im Deutschen auch als höher als die der männlichen Sprecher zu bewerten ist, realisierten alle untersuchten Lenis-Plosive ohne Stimmbeteiligung. Sprecher F-nm01 ist der Sprecher aus dieser Gruppe mit der höchsten Anzahl von Realisierungen unter Beteiligung von Stimmhaftigkeit. In acht von 27 Fällen war bei diesem Sprecher Stimmbeteiligung bei der Produktion der Lenis-Plosive vorhanden: Aber nur in zwei dieser Fälle produziert er durchgehende Stimmhaftigkeit. In den anderen Fällen konnten unterschiedlich lange stimmhafte Phasen während des Verschlusses beobachtet werden, wobei die Stimmhaftigkeit um die Verschlusslösung herum in ihrer Amplitude sehr schwach wurde und aussetzte und erst 10-30 ms nach der Verschlusslösung mit dem folgenden Vokal wieder einsetzte. Bei Sprecher F-nm02 mussten zwei Tokens (dann, bleiben) ausgeschlossen werden, da er ohne Pause zwischen den Sätzen direkt vom davorstehenden Vokal in die Plosive überging. Folglich realisierte er die Plosive mit durchgehender Stimmhaftigkeit. Da jedoch als Kontext- Voraussetzung für diese Untersuchung vorausgehende Stimmlosigkeit gesetzt wurde, wurden diese beiden Tokens ausgeschlossen. Allerdings wies Sprecher F-nm02 noch drei weitere Fälle auf, in denen Stimmbeteiligung vorlag: einmal durchgehende Stimmhaftigkeit (zwölf Banken), einmal aspirierte sehr niedrig 148 Tabelle 9.18.: Gegenüberstellung der Lenis-Plosiv-Realisierungen der deutschen Produktionen französischer Muttersprachler den verstellten und unverstellten Produktionen der deutschen Muttersprachler. Dargestellt sind die Anzahl (N) der Sprecher (Vpn), der Tokens gesprochen von allen Sprechern abzüglich der nicht verfügbaren Werte sowie der stimmlosen bzw. mit Stimmbeteiligung (Stimmbeteil.) realisierten Plosive. MW VOTstl = arithmetisches Mittel der VOT-Werte der stimmlos realisierten Lenis-Plosive und die Standardabweichung (s) Fr - deutsch Dt - verstellt Dt - unverstellt N Vpn 4 22 22 N Tokens 106 580 591 N stimmlos MW VOTstl (s) 95 (90 %) 22,7 (1,3) 519 (88 %) 17,9 (3,3) 577 (99,5 %) 18,9 (3,3) N Stimmbeteil. 11 (10 %) 72 (12 %) 3 (0,5 %) frequente Stimmhaftigkeit (das) und ein nicht ganz eindeutiger Fall von sehr schwacher Stimmhaftigkeit vor der Verschlusslösung (die). Tabelle 9.18 stellt die Lenis-Plosiv-Realisierungen aus den deutschen Produktionen der französischen Muttersprachler den verstellten und unverstellten Produktionen deutscher Muttersprachler gegenüber. Es lässt sich feststellen, dass die deutschen Produktionen der französischen Muttersprachler bzgl. des Anteils der stimmlosen und der mit Stimmbeteiligung realisierten Lenis-Plosive mit den Akzentimitationen der deutschen Muttersprachler recht gut übereinstimmen. Die deutschen Muttersprachler realisieren prozentual gesehen nur unwesentlich mehr Lenis-Plosive mit Stimmbeteiligung. Auch hinsichtlich der VOT-Dauern der stimmlos realisierten Lenis-Plosive unterscheiden sich die Produktionen der französischen Muttersprachler kaum von den verstellten und unverstellten Produktionen der deutschen Muttersprachler. Überraschend ist dennoch, dass die stimmlosen Lenis-Plosive der französischen Muttersprachler im Mittel die längste VOT aufweisen. Sowohl die verstellten Versionen der deutschen Muttersprachler als auch die deutschen Produktionen der französischen Muttersprachler zeigten Lenis-Plosiv-Realisierungen mit durchgehender Stimmhaftigkeit oder Stimmhaftigkeit während der Verschlussphase, die jedoch um die Lösung herum aussetzt und erst kurz nach der Lösung wieder einsetzt. Pränasalierung wie in den verstellten Produktionen der Sprecherin Ff11 (vgl. Abbildung 9.8) oder ein scheinbar bewusstes Einsetzen von Stimmhaftigkeit mit vorausgehendem Glottalverschluss wie für mehrere deutsche Sprecher in der Phrase sind gehen (verstellte Version) beschrieben (vgl. Abbildung 9.7) wiesen die deutschen Produktionen der französischen Muttersprachler nicht auf. 149 In dem kurzen auf Französisch vorgelesenen Text 4 war die Kontextbedingung eines dem Lenis-Plosiv vorausgehenden stimmlosen Obstruenten oder einer Pause nicht gegeben. Der Text weist vier Tokens mit initialen Lenis-Plosiven auf. In drei Tokens steht der Lenis-Plosiv jedoch in intervokalischer Position und in einem Token steht er zwischen Vokal und / r/ . Eine Vergleichbarkeit der französischen Produktionen mit den deutschen Produktionen der französischen Muttersprachler ist also bereits aus diesem Grund nicht gegeben. Außerdem wird eine Bestimmung der Dauer der Stimmhaftigkeit, die der Verschlusslösung vorauseilt, durch einen dem Plosiv vorausgehenden Vokal erschwert oder ist überhaupt nicht möglich. Die Stimmhaftigkeit in der Verschlussphase eines stimmhaft realisierten Plosivs unterscheidet sich vom vorausgehenden Vokal durch das Fehlen einer Formantstruktur sowie durch eine geringere Frequenz und Amplitude (vgl. Stevens, 1998, S. 471). Dennoch kann oft keine zweifelsfreie Entscheidung darüber getroffen werden, ob die vorhandene Stimmhaftigkeit durch das Ausschwingen der Stimmlippen nach dem vorausgehenden Vokal erklärt werden kann oder auf aktive Stimmhaftigkeit in der Verschlussphase des Plosivs zurückzuführen ist. Außerdem lässt sich aufgrund der zum Teil (für vollstimmhafte Plosive auch charakteristischen) sehr schwachen Verschlusslösungen der zweite Messpunkt nicht immer eindeutig bestimmen. Es kann jedoch festgehalten werden, dass abgesehen von einer Ausnahme alle Lenis-Plosive mit Stimmbeteiligung realisiert wurden und dass in der Mehrheit der Fälle (10 von 16) sogar eine vom vorausgehenden Vokal bis zum Folgevokal durchgehend vorhandene Stimmhaftigkeit vorlag. In den anderen fünf Fällen war während der Verschlussphase Stimmbeteiligung vorhanden, die jedoch wie besprochen zum Teil auch noch auf den vorausgehenden Vokal zurückgeführt werden kann und die vor der Verschlusslösung aussetzt (bis zu 25 ms Stimmlosigkeit) und erst ca. 10-40 ms nach der Verschlusslösung wieder einsetzt. Nur ein Token (Bank gesprochen von F-nf02) wurde ohne Beteiligung von Stimmhaftigkeit und mit einer VOT von 11 ms realisiert. Tabelle 9.19 stellt überblickshaft für jeden französischen Muttersprachler dar, welche der Tokens aus den französischen Produktionen mit durchgängig vorhandener Stimmhaftigkeit, mit nicht-durchgängiger Stimmbeteiligung und ohne Stimmbeteiligung realisiert wurde. 9.2.3. Zusammenfassung Zusammenfassend lässt sich festhalten, dass die initialen Lenis-Plosive in den unverstellten Textproduktionen der deutschen Muttersprachler fast ausschließlich (mehr als 99 %) stimmlos realisiert wurden. Diese Ergebnisse stimmen mit den Ergebnissen anderer Studien, z. B. Braun (1988) oder Jessen (1998), überein, in denen deutsche Muttersprachler initiale oder auf einen stimmlosen Obstruenten folgende Lenis-Plosive ausschließlich oder überwiegend stimmlos realisierten. Auch in der Imitation eines französischen Akzents produzierten die 150 Tabelle 9.19.: Realisierung der Lenis-Plosive in der französischen Textproduktion (Text 4) französischer Muttersprachler (durchg. sth. = durchgängig vorhandene Stimmhaftigkeit, Stimmbeteil. = nicht-durchgängige Stimmbeteiligung) F-nf01 F-nf02 F-nm01 F-nm02 droit durchg. sth. Stimmbeteil. durchg. sth. Stimmbeteil. devant durchg. sth. durchg. sth. durchg. sth. durchg. sth. Deutsche Stimmbeteil. Stimmbeteil. durchg. sth. durchg. sth. Bank Stimmbeteil. stimmlos durchg. sth. durchg. sth. deutschen Muttersprachler der vorliegenden Studie mit großer Mehrheit (88 %) stimmlose Lenis-Plosive. Obwohl sich das über alle Sprecher gebildete arithmetische Mittel der VOT-Dauern in den ohne Stimmbeteiligung realisierten Lenis-Plosiven der unverstellten verglichen mit der verstellten Textproduktion um nur 1 ms unterscheidet, so ist doch eine signifikante Reduktion der VOT in der verstellten Version zu verzeichnen. In den Akzentimitationen konnten bei 13 von 22 Sprechern auch Lenis-Plosiv-Realisierungen unter Beteiligung von Stimmhaftigkeit festgestellt werden, das entspricht einem prozentualen Anteil von 12 %. Allerdings zeigten nur drei dieser Sprecher in zehn und mehr Fällen Realisierungen mit Stimmbeteiligung. Die Gruppe der meist in satzinitialer Position stehenden alveolaren Lenis-Plosive ist dabei die Gruppe mit dem höchsten prozentualen Anteil an Realisierungen mit Stimmbeteiligung. Eindeutige Fälle von pränasalierten Plosiven konnten nur für die verstellten Versionen der Sprecherin Ff11 festgestellt werden. Die Produktion von mit Stimmbeteiligung realisierten Lenis-Plosiven in den Akzentimitationen der anderen Sprecher waren v. a. durch durchgehende Stimmhaftigkeit sowie durch vor der Verschlusslösung aussetzende Stimmhaftigkeit gekennzeichnet. Ein Vergleich mit den deutschen Produktionen der französischen Muttersprachler zeigt, dass auch diese Sprecher mit 90 % die Mehrheit der Lenis-Plosive im Deutschen stimmlos realisiert. Die mit Stimmbeteiligung realisierten Lenis-Plosive der französischen Muttersprachler im Deutschen unterscheiden sich in diesem Merkmal scheinbar nicht von den verstellten Produktionen der deutschen Sprecher. Pränasalierte Formen kommen hier nicht vor. 9.3. Zusammenfassung und Diskussion Die Ergebnisse zur Variation der Stimmeinsatzzeit und Stimmbeteiligung bei Plosiven zeigen, dass deutsche Muttersprachler für die Imitation eines französischen Akzents nicht nur in der Realisation von Fortis-Plosiven variieren, indem sie die VOT signifikant reduzieren, sondern dass auch in der Realisierung von Lenis-Plosiven Variabilität besteht. Einleitend wurde in diesem Kapitel diskutiert, dass im Deutschen Stimmbeteiligung in der Unterscheidung der 151 Plosivreihen kaum eine Rolle spielt. Nach Jessens Auffassung (persönliche Mitteilung; August 2009) spricht außerdem einiges dafür, dass Stimmbeteiligung in Plosiven im Gegenteil zur Aspiration, die kontextuell stabiler und bei der perzeptuellen Unterscheidung von höherer Relevanz sei, nur als „phonologisch passiv“ gelten kann und damit vermutlich der bewussten Kontrolle weniger zugänglich ist. Daran schließt sich die Annahme an, dass es sich hierbei um ein Merkmal handelt, das gegenüber Stimmverstellungen relativ robust sei: „Robustheit“ in der Form, dass deutsche Muttersprachler nicht oder nur schlecht in der Lage sind, in einem Kontext, der im Deutschen eine stimmlose Realisierung von Lenis-Plosiven erwarten lässt, Stimmhaftigkeit zu produzieren. Zwar wird auch in den verstellten Versionen der deutschen Muttersprachler die deutliche Mehrheit der Lenis-Plosive stimmlos realisiert, bei immerhin 12 % der Lenis-Plosive wird jedoch auch Stimmbeteiligung eingesetzt. Dies mag zwar im ersten Moment gering erscheinen, auf der anderen Seite ist jedoch anzumerken, dass auch die französischen Muttersprachler nur 10 % der Lenis-Plosive im Deutschen mit Stimmbeteiligung realisiert haben. Obwohl also festgehalten werden kann, dass entgegen anfänglicher Annahmen deutsche Muttersprachler in der Lage sind, Stimmbeteiligung in der Realisierung von Lenis-Plosiven einzusetzen und damit von ihren gewohnten unverstellten Produktionen zu variieren, so ist die Variationsfähigkeit der VOT in Fortis-Plosiven scheinbar doch stärker ausgeprägt. Ein unmittelbarer Vergleich der Variationsleistung der Sprecher in Fortis- und Lenis-Plosiven ist nicht möglich. Dennoch kann festgestellt werden, dass bei den Fortis-Plosiven 18 von 22 Sprechern die VOT um durchschnittlich mehr als 10 ms reduzieren, während bei den Lenis-Plosiven nur sechs von 22 Sprechern in sieben oder mehr Fällen (von 27) Stimmbeteiligung einsetzen. Interessant ist die stärkere Kontrastierung der Fortis-Lenis-Opposition mittels VOT bei Frauen im Vergleich zu Männern. Die Ergebnisse dieser Untersuchung zeigen dass Frauen bei Fortis-Plosiven signifikant höhere VOT-Mittelwerte und bei Lenis-Plosiven signifikant niedrigere VOT-Mittelwerte als Männer haben und bestätigen damit vorangegangene Studien (z. B. Ryalls et al., 1997; Koenig, 2000; Robb et al., 2005). Allerdings trifft das hier nur auf die unverstellten Textproduktionen zu. In den verstellten Versionen ist vermutlich aufgrund einer höheren Varianz dieser Effekt nicht signifikant. Da die deutschen Muttersprachler die VOT in initialen Fortis-Plosiven so stark reduzierten, dass sie im Gruppenmittel kürzere Dauern aufwiesen als die authentischen französischen Muttersprachler in ihren deutschen Produktionen, scheint hier die Feinabstimmung hinsichtlich der Stärke der VOT-Reduktion der entscheidende Parameter zu sein, anhand dessen eine Akzentimitation durch einen deutschen Muttersprachler aufgedeckt werden kann. Auch ein möglicher Kategorienwechsel von fortis hin zu lenis kann einer dieser Parameter sein. Bei den Lenis-Plosiven dagegen könnten eventuell Realisierungen wie Pränasalierung oder gezielter Einsatz von prevoicing verbunden mit Glottalver- 152 schluss und aussetzender Stimmhaftigkeit vor der Verschlusslösung (wie für die Phrase sind gehen beschrieben) als Kriterium für das Vorliegen eines nichtauthentischen Akzents genutzt werden. Diese Ergebnisse zeigen, dass Variation glottaler Aktivität - Aspiration und Stimmbeteiligung - für eine Akzentimitation eingesetzt wird, jedoch die Komplexität ihrer Steuerung nicht zu unterschätzen ist. Folgende Arbeitsschritte sollten in der weiteren Forschung noch erfolgen: Vertiefung der intraindividuellen Analyse: In den Produktionen der deutschen sowie der französischen Muttersprachler in den verschiedenen Modi fällt eine relativ hohe intraindividuelle Variabilität in der VOT der jeweiligen Sprecher auf, die zum Teil auf die Artikulationsstelle des Plosivs zurückgeführt werden kann. Es ergibt sich also auch in dieser Studie die bereits von Gurski (persönliche Mitteilung; Juni 2009) geschilderte Problematik. Eine vertiefte Varianzanalyse sowie eine Untersuchung zu den bestimmenden Parametern im Kontext Akzentimitation steht noch aus. Erweist sich die Varianz innerhalb eines Sprechers generell als hoch, wäre das für die forensische Praxis als sehr kritisch anzusehen, da in der forensischen Fallarbeit eine hohe interindividuelle aber eine geringe intraindividuelle Variabilität zur Eingrenzung eines Sprechers gefordert ist. Überprüfung der Konsistenz in der VOT-Reduktion während der Akzentimitation über eine Analyse der Produktionen aus der zweiten Aufnahmesitzung: Die Ergebnisse der Vorstudie (Neuhauser, 2005, 2008) lassen darauf schließen, dass es für die meisten Sprecher keine wesentliche Veränderung in der VOT initialer Fortis-Plosive aus den verstellten Produktionen der ersten Aufnahme verglichen mit den verstellten Produktionen der zweiten Aufnahme gibt. Daher wurde in diesem Teil der Arbeit zunächst darauf verzichtet, eine zumindest stichprobenhafte Überprüfung wäre jedoch erstrebenswert. Überprüfung des Einflusses der Silbenposition auf die Variation der VOT: Künzel sieht als möglichen Grund für die geringe Differenz in den VOT-Mittelwerten der französischen Muttersprachler in ihren französischen und in ihren deutschen Produktionen die Position der Plosive in der Silbe und vermutet größere Unterschiede in finaler als in initialer Silbenposition, da Fortis-Plosive im Französischen in dieser Stellung nicht aspiriert werden dürfen (persönliche Mitteilung; August 2009). Auf der anderen Seite zeigte Abdelli-Beruh (2004, S. 216 f.), dass sich die Silbenposition nicht signifikant auf die VOT auswirkt. Dennoch könnte eine Untersuchung der VOT finaler Fortis-Plosive von Interesse sein und das Gesamtbild erweitern. Vergrößerung der Datenbasis der französischen Muttersprachler: Um repräsentative Ergebnisse zu den französischen und deutschen Produktionen französischer Muttersprachler zu erlangen, muss die Datenbasis in diesem Bereich erweitert werden. Das bezieht sich sowohl auf die Anzahl der Sprecher als auch auf die zur Verfügung stehende Textbasis. 153 Schaffung eines ausgeglichenen Geschlechterverhältnises: Um eine verlässlichere Aussage zu den Variationsunterschieden zwischen Frauen und Männern zu treffen, wäre eine Ergänzung der Gruppe der männlichen deutschen Muttersprachler und damit ein ausgeglichenes Geschlechterverhältnis erstrebenswert. Die Ergebnisse der Untersuchungen zur Variation der Stimmeinsatzzeit bei Fortis-Plosiven und der Variation der Stimmbeteiligung bei Lenis-Plosiven wurden in Neuhauser (2011b) veröffentlicht. 154 10. Glottalisierung und glottale Friktion Die im vorangegangenen Kapitel beschriebene Analyse der Parameter Stimmeinsatzzeit und Stimmbeteiligung bei Plosiven hat gezeigt, dass deutsche Muttersprachler eine Variation glottaler Aktivität für die Akzentimitation einsetzen. Die feine Steuerung dieser glottalen Aktivität ist jedoch sehr komplex, woraus sich Möglichkeiten für die Unterscheidung zwischen authentischen und imitierten französischen Akzenten ergeben. Deutsch und Französisch unterscheiden sich in ihren glottalen Strategien außerdem in zwei weiteren wesentlichen Aspekten: 1. In der Realisierung vokalisch anlautender Silben und 2. im Vorhandensein eines Phonems / h/ . Im Deutschen soll normativ jeder silbeninitiale Vokal mit einem vorangehenden festen Stimmeinsatz, d. h. mit Glottalverschluss ( [P] ), gesprochen werden (vgl. Krech, 1968; Duden, 2005; Rues et al., 2007; Krech et al., 2009). Dass die tatsächliche Realisierung silbeninitialer Vokale von dieser Präskription abweicht, zeigen deskriptive Studien wie Kohler (1994), Rodgers (2000) oder Pompino-Marshall und ˙ Zygis (2010) an gelesenem und spontansprachlichem Material. Kohler (1994) und Rodgers (2000) untersuchen das Vorkommen vier weitgefasster Realisierungsmöglichkeiten des kanonischen Glottalverschlusses: Glottalverschluss, Glottalverschluss verbunden mit Glottalisierung, Glottalisierung ohne Glottalverschluss und Abwesenheit eines Glottalverschlusses oder einer Glottalisierung. Sie zeigen, dass in gelesenem und spontan gesprochenem Deutsch Glottalisierung sowohl verbunden mit als auch ohne Glottalverschluss generell am häufigsten vorkommt. Dabei ist die Realisierung vokalisch anlautender Silben jedoch u. a. abhängig von Faktoren wie Pausen, lautlichem Kontext, Sprechstil (gelesen vs. spontansprachlich), Wortart (Funktionsvs. Inhaltswörter), Position in einer Äußerung (phraseninitial vs. -medial) oder Satzakzent (akzentuiert vs. nicht akzentuiert). Kohler (1994) und Rodgers (2000) unterstützen damit auch Studien zu anderen Sprachen wie zum Beispiel dem amerikanischen Englisch (Dilley et al., 1996; Redi und Shattuck-Hufnagel, 2001). Unter bestimmten Voraussetzungen, z. B. wenn die Kohäsion zwischen zwei Wörtern besonders stark ist, kann auch im Deutschen die Vokaljunktur unmarkiert sein und keine Veränderung in der Modalstimme auftreten. Zum Beispiel bei einem unakzentuierten Personalpronomen, das enklitisch an ein Auxiliarverb angefügt wird, wie in hat er (Kohler, 1994, 2000; Krech et al., 2009). Trubetzkoy (1962) kategorisiert den „festen Vokaleinsatz“ ( [P] ) im Deutschen nicht als eigenständiges Phonem, sondern bezeichnet ihn als aphonematisches Grenzsignal, das eine „selbstverständliche Art der Aussprache der Vokale im Morphemanlaut“ (Trubetzkoy, 1962, S. 244 f.) und bei Fremdwörtern auch im Inlaut ist. Ein weiterer glottaler Laut, der jedoch eine Repräsentation im deutschen Phonemsystem hat, ist der glottale Frikativ. / h/ , meist als stimmloser aber in wort- 155 initialer oder intervokalischer Position auch als stimmhafter glottaler Frikativ realisiert, kann nicht final stehen und keine Verbindung mit einem Konsonanten innerhalb eines Morphems eingehen (Kohler, 1995, S. 101, 156). Damit handelt es sich bei dem glottalen Frikativ wie auch bei dem Glottalverschluss [P] und seinen abweichenden Realisierungsformen um eine sich auf den Silbenanlaut beschränkende glottale Aktivität im Deutschen. Französisch unterscheidet sich hinsichtlich seiner glottalen Strategien im Silbenanlaut vom Deutschen. Zum einen werden im Französischen vokalisch anlautende Silben nicht mit Glottalverschluss oder einer Glottalisierung realisiert. Stattdessen wird im mot phonétique ein prävokalisch stehender auslautender Konsonant zum anlautenden Konsonanten des folgenden vokalisch beginnenden Wortes (enchaînement consonantique). Auch Vokaljunkturen (enchaînement vocalique) erfolgen in der Regel ohne Pause und Glottalverschluss. Ein glottalisierter Vokaleinsatz wird im Französischen nur bei besonders ausdrucksstarker Aussprache (z. B. bei Emphase) produziert (vgl. Röder, 1996, S. 81; Kohler, 2000, S. 91; Léon, 2005, S. 56). Zum anderen existiert im Französischen kein Phonem / h/ . Das in der Orthografie mancher Wörter vorhandene h wird entweder als h aspiré bezeichnet, wenn es sich um Entlehnung aus meist germanischen Sprachen handelt, oder als h muet. In der Regel werden beide Formen phonetisch nicht realisiert. Allerdings schränkt Léon (2005, 2009) ein, dass der glottale Frikativ im Französischen in emphatischen Ausdrücken oder bei älteren Sprechern einiger französischer Dialekte vorkommen kann: Ce phone existe encore dans plusieurs variétés de français dialectaux, en particulier de l’Ouest. [...] Hors d’un contexte dialectal, c’est maintenant un effet d’archaïsme ou d’emphase comique quand on l’emploie au théâtre (Léon, 2009, S. 82 f.) Es ist von französischen Muttersprachlern zu erwarten, dass beide Merkmale - keine Glottalisierung in vokalisch anlautenden Silben und Vokaljunkturen sowie fehlende glottale Friktion - als Interferenzerscheinungen auf die Fremdsprache Deutsch übertragen werden. Die Nichtrealisierung des glottalen Frikativs im Silbenanlaut ist dabei sicherlich eines der bekanntesten Merkmale eines französischen Akzents im Deutschen. Die Analysen aus der Vorstudie (Neuhauser, 2005, 2008) ergaben, dass der Versuch, initial stehendes / h/ zu vermeiden, zu den häufigsten Variationen deutscher Muttersprachler bei der Imitation eines französischen Akzents gehört. In den meisten Fällen wurde von den Sprechern statt eines initialen glottalen Frikativs eine glottalisierte Form des Vokaleinsatzes realisiert, nur selten ein nicht glottalisierter. Nur einer von acht Sprechern war während der Imitation eines französischen Akzents in der Lage, über zwei Aufnahmesitzungen hinweg konsistent / h/ zu vermeiden und durch Glottalisierung zu ersetzen. Auf der anderen Seite variierte jedoch nur eine Sprecherin überhaupt nicht in diesem Punkt und zeigte weiterhin glottale Friktion (vgl. Neuhauser, 2008, S. 141-143). Bezüglich der Realisierung eines auf einen Vokal oder Nasal folgenden Vokaleinsatzes haben die Voruntersu- 156 chungen gezeigt, dass in der unverstellten Variante Glottalisierung die häufigste Realisierungsform war. Ein weicher Einsatz wurde nur halb so oft realisiert und ein fester Stimmeinsatz um fast 75 % seltener. Bei der Imitation eines französischen Akzents zeigten die Sprecher ebenfalls eine Tendenz, keinen festen Vokaleinsatz, sondern einen weichen Einsatz oder Glottalisierung zu realisieren, die zahlenmäßig ungefähr gleich verteilt sind. Wobei sich die Anzahl der Fälle mit glottalisierter Realisierung oder festem Vokaleinsatz in der verstellten Version nicht signifikant reduziert hat (vgl. Neuhauser, 2008, S. 143-146). Die Ergebnisse dieser Voruntersuchung lassen vermuten, dass eine gleichzeitige Konzentration auf das Vermeiden glottaler Friktion und auf die Produktion eines weichen Stimmeinsatzes für die Sprecher eine große Schwierigkeit darstellt. Es ist zu überprüfen, inwieweit die deutschen Muttersprachler beide Merkmale bei der Akzentimitation erfolgreich umsetzen können und inwieweit französische Muttersprachler in ihrem Deutsch diese angeblich typischen Aussprachemerkmale aufweisen. Die in diesem Kapitel vorgestellte Untersuchung wurde in Neuhauser (2011c) veröffentlicht. 10.1. Glottalisierung 10.1.1. Methode Um zu überprüfen, inwiefern deutsche Muttersprachler in der Lage sind, vokalisch anlautende Silben ohne den für das Deutsche charakteristischen festen Vokaleinsatz (Glottalverschluss) oder durch Glottalisierung zu realisieren, soll möglichst ein Kontext gewählt werden, in dem im Deutschen mit hoher Wahrscheinlichkeit von einer Glottalisierung ausgegangen werden kann. Glottalisierung ist nach Kohler (1994) und Rodgers (2000) besonders wahrscheinlich für satzakzenttragende phraseninitiale (nach Pausen stehende) Inhaltswörter in gelesener Sprache, wobei der auf den kanonischen Glottalverschluss folgende Vokal betont sein sollte. Dahingegen kann vor einem unbetonten Vokal häufig von einer sehr starken Abschwächung eines glottalen Reflexes bis hin zu seinem kompletten Fehlen ausgegangen werden. Das heißt, statt eines Glottalverschlusses oder einer Glottalisierung wird ein weicher Vokaleinsatz oder im Vokal-Vokal-Kontext ein gleitender Vokalübergang realisiert, der in Amplitude oder im F0-Verlauf nur noch Spuren einer nicht-modalen Stimmgebung aufweist oder ganz nivelliert ist (Kohler, 1994, 2000; Rodgers, 2000). Obwohl im Deutschen, wie auch in anderen germanischen Sprachen, z. B. dem Amerikanischen Englisch, Glottalisierung oder andere Formen eines glottalen Reflexes v. a. phraseninitial, d. h. auf Pausen folgend, mit hoher Wahrscheinlichkeit vorkommen (Pierrehumbert und Talkin, 1992; Kohler, 1994; Dilley et al., 1996; Kohler, 2000; Rodgers, 2000; Pompino-Marshall und ˙ Zygis, 2010), erweist 157 Time (s) 0 0.5383 0 5000 Frequency (Hz) 0 0.1 0.2 0.3 0.4 0.5 Ff11 Ff15 Abbildung 10.1.: Vergleich des phraseninitialen Vokaleinsatzes der Sprecherinnen Ff11 und Ff15 in der unverstellten Version des Wortes ohne sich dieser Kontext für die Untersuchungen innerhalb dieser Arbeit als eher ungünstig. Zum einen ist eine zuverlässige Feststellung von Glottalisierung phraseninitial schwierig. Zum anderen soll es hier um den Vergleich französischer Muttersprachler im Deutschen und deutscher Muttersprachler bei der Imitation eines französischen Akzents gehen. Da im Französischen Glottalisierung in einer phraseninitialen Position zwar nicht wahrscheinlich, aber zumindest möglich ist (Kohler, 2000, S. 92), so scheint dieser Kontext für einen Vergleich ungeeignet. Abbildung 10.1 zeigt einen Vergleich des phraseninitialen Vokaleinsatzes der Sprecherinnen Ff11 und Ff15 in der unverstellten Version des Wortes ohne (Ohne Polizei., Text 1). Der dynamische Bereich des Sonagramms umfasst 45,0 dB. Bei Sprecherin Ff15 (rechts) ist der glottalisierte Vokaleinsatz im Oszillogramm gut an den unregelmäßigen Schwingungen, der verlängerten Periodendauer sowie der niedrigeren Amplitude erkennbar und wird auch im Sonagramm deutlich. Bei Sprecherin Ff11 (links) hingegen erweist sich die Beurteilung des Vokaleinsatzes als schwieriger, da in diesem Fall keine Glottalisierung vorliegt. Es wird ein glottaler Verschluss realisiert, dem sich regelmäßige Stimmlippenschwingung anschließt. Abbildung 10.2 zeigt beispielhaft an Produktionen französischer Muttersprachler, dass auch im Französischen die Beurteilung eines phraseninitialen Vokaleinsatzes problematisch sein kann. Dargestellt ist das Wort après (Après pas- 158 Time (s) 0 0.74 0 5000 Frequency (Hz) 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 F-nf02 F-nm02 Abbildung 10.2.: Phraseninitialer Vokaleinsatz der Sprecher F-nf02 und F-nm02 in après sez devant la Deutsche Bank [...]., Text 4) jeweils gesprochen von F-nf02 und Fnm02. Der dynamische Bereich des Sonagramms umfasst 45,0 dB. Aufgrund der im Oszillogramm erkennbaren Unregelmäßigkeit im Schwingungsverlauf, lässt sich schlussfolgern, dass beide Sprecher in diesem Beispiel einen schwach glottalisierten Vokaleinsatz aufweisen. Bei Sprecherin F-nf02 (links) setzt der Vokal zunächst weich ein, vor der Mitte des Vokals wird die Schwingung jedoch vorübergehend unregelmäßig wie man sowohl im Oszillogramm als auch im Sonagramm erkennen kann. Außerdem ist der Vokal auch auditiv mit Knarrstimme markiert. Bei Sprecher F-nm02 (rechts) ist das Signal, das dem Vokal vorausgeht, durch Stille gekennzeichnet, was auf einen glottalen Verschluss hindeutet. Oszillogramm und Sonagramm zeigen, dass der erste glottale Puls relativ stark ist. Demnach liegt hier vermutlich eine Sprengung eines Glottalverschlusses vor. Diese beiden Beispiele zeigen, dass auch im Französischen in phraseninitialer Position glottalisierte Vokaleinsätze möglich sind. Die Beurteilung, ob Glottalisierung vorliegt, ist in einem stimmhaften Kontext am zuverlässigsten, und damit auch am ehesten für die forensische Praxis geeignet. Das heißt in einem Kontext, in dem ein betonter Vokal auf einen anderen Vokal oder Nasal folgt: denn in einer stimmhaften Phase kann eine Veränderung der glottalen Aktivität am besten aufgedeckt werden. Ein glottalisierter Vokaleinsatz kommt wie Pierrehumbert und Talkin (1992) und Pierrehumbert (1995) zeigen nicht nur wortinitial zu Beginn einer Äußerung vor, sondern auch, wenn dem initialen Vokal ein Wort mit finalem Vokal vorausgeht. In einem sol- 159 chen Vokal-Vokal-Kontext ohne dazwischen liegende Pause tritt Glottalisierung signifikant häufiger auf, wenn der zweite Vokal akzentuiert ist. Daneben konnten auch Umeda (1978) und Dilley et al. (1996) anhand des Amerikanischen Englisch zeigen, dass ein glottalisierter Vokaleinsatz in phraseninterner Position bei vorausgehendem Vokal, Liquid oder Nasal am häufigsten vorkommt. Aus diesen Überlegungen heraus wurde für die Analyse zum Vorhandensein eines glottalen Reflexes im Deutschen folgender Kontext gewählt: ein betonter initialer Vokal, der auf einen Vokal (N = 10), Nasal (N = 2) oder Lateralapproximanten (N = 1) folgt. Die zu analysierenden 13 Tokens stammen aus zwei Texten. In elf von 13 Fällen steht dieser Vokal in wortinitialer Position und in zwei Fällen steht er in silbeninitialer Position. In mindestens fünf von 13 Fällen kann davon ausgegangen werden, dass die Mehrheit der Sprecher außerdem den Satzakzent auf diesen Vokal legt. Als weiterer möglicher Einflussfaktor auf die Realisierung des Vokaleinsatzes wurde neben den oben genannten auch die Vokalqualität diskutiert, d. h. Hebungsgrad oder die Hebungsrichtung des Zungenrückens zur Produktion des betreffenden Vokals bzw. der Vokale im Vokal-Vokal-Kontext. Krech (1968) findet für das Deutsche einen hochsignifikanten Zusammenhang zwischen Vokalqualität und Vokaleinsatz: Die Anzahl der mit physiologischem Glottisschlag eingesetzten Fälle ist umgekehrt proportional zu der Höhe des Zungenrückens. Weniger gespannte Vokale, die einen größeren Kieferöffnungswinkel haben, zeigen danach den festen Einsatz häufiger. (Krech, 1968, S. 65) Außerdem führt sie fort, dass „unabhängig von Akzentuierung und vorangehender Pausengestaltung [...] der physiologische Glottisschlag besonders häufig beim Einsatzvokal A und besonders selten bei den Einsatzvokalen I, U und Ü [erscheint]“ (Krech, 1968, S. 117). Problematisch an diesen Ergebnissen ist die angewendete Methodik mit der Auswahl der Sprecher und Textsorten in gehobener stilistischer Ebene: professionelle Sprecher der allgemeinen deutschen Hochlautung, die Nachrichten, Programmansagen, Dichtung etc. sprechen. Außerdem liegt der Fokus bei Krech (1968) auf dem sogenannten „physiologischen Glottisschlag“. Damit wird beispielsweise Glottalisierung als „nicht-physiologische“ Form von der Bewertung ausgeschlossen. In Umeda (1978), einer Studie zum amerikanischen Englisch, wird berichtet, dass hintere Vokale eine höhere Chance auf Glottalisierung haben als vordere Vokale; diese Aussage hat jedoch eher beobachtenden Charakter. Eine ähnliche Aussage mit selbem Inhalt findet sich auch bei Krech (1968), die die Hebungsrichtung der Zunge als sekundäres Merkmal innerhalb der Vokalgruppen mit hoher, mittlerer und flacher Zungenstellung sieht. Außerdem verweist Umeda (1978) auf eine Untersuchung von Allen (1970), nach der die Differenz der Zungenhöhe zwischen den beiden benachbarten Vokalen einen Einfluss auf die Wahrscheinlich- 160 keit von glottalisierter Junktur haben soll - je kleiner die Differenz, umso wahrscheinlicher sei Glottalisierung. Er kann dies an seinen eigenen Daten jedoch nicht bestätigen. Pompino-Marshall und ˙ Zygis (2010) bestätigen die Ergebnisse von Krech (1968) hinsichtlich eines Zusammenhangs zwischen Hebungsgrad des Zungenrückens und der Frequenz von glottaler Markierung im Deutschen: Tiefe Vokale werden häufiger durch Glottalisierung oder Glottalverschluss markiert als nicht tiefe Vokale. Eine Erklärung für diesen Zusammenhang wird aber nicht gegeben. Der Forschungsstand zu diesem möglichen Einflussfaktor scheint noch recht gering zu sein. Da die hier vorliegende Untersuchung diese Forschungslücke nicht ausfüllen soll, sondern eine andere Zielsetzung hat, wurde die Vokalqualität als möglicher Einflussfaktor bei der Auswahl des zu untersuchenden Sprachmaterials nicht berücksichtigt. Der Vollständigkeit halber sei jedoch angeführt, dass die Mehrheit (8 von 13) der initialen Vokale zentrale, tiefe Vokale ( / a/ ) bzw. Diphthonge mit dieser Anfangsqualität ( / aI/ ) sind. Im Folgenden wird das untersuchte Sprachmaterial aufgelistet. Die untersuchte Vokaljunktur ist durch eine Unterstreichung der entsprechenden Stelle im Satz bzw. in der Phrase markiert. Das Material stammt aus den ersten Aufnahmen der Texte 1 und 3 (Text wird jeweils in Klammern angegeben): 1. Ich sag es nur einmal. (1) 2. Ich will eine Million Euro. (1) 3. ... fahren bis zur Haltestelle „Am Stadion“. (1) 4. Wenn Sie am Stadion angekommen sind, ... (1) 5. ... zu langen Haftstrafen verurteilt worden. (3) 6. Der [...] jüngste Angeklagte muss ... (3) 7. Zu zehn Jahren wurde ein Dreiundsiebzigjähriger verurteilt. (3) 8. ... insgesamt eine halbe Million Euro. (3) 9. Zwei Männer der Opa-Bande ... (3) 10. Die anderen zwei Männer sind ... (3) 11. Dort haben sie die Angestellten gezwungen, ... (3) 12. Das Geld mussten die Angestellten ... (3) Insgesamt sind in die Analyse der Produktionen der deutschen Muttersprachler 568 Vokaleinsätze eingeflossen: 22 Sprecher haben je 13 Phrasen in den zwei Modi „unverstellt“ und „verstellt“ gesprochen. In der unverstellten Version wurde ein Fall ausgeschlossen, da der Sprecher eine Atmungspause in der zu beobachtenden Vokaljunktur einlegte (Fm01, Haltestelle „Am...“). In der verstellten Version wurden drei Fälle ausgeschlossen: zwei ebenfalls wegen einer 161 langen Pause von über 500 ms an der zu untersuchenden Junktur (Fm05, Haltestelle „Am...“ und Ff11, der Opa-Bande) und ein Fall wegen eines Abbruchs mit anschließender Korrektur (Fm07, der Opa-Bande). Für die Analyse der Vokaleinsätze in den deutschen Produktionen der vier französischen Muttersprachler wurden ebenfalls die oben gelisteten Phrasen untersucht. Insgesamt sind in diese Analyse 51 Vokaleinsätze eingeflossen: 13 Phrasen gesprochen von vier Sprechern, abzüglich eines Falls, der aufgrund einer langen Atmungspause innerhalb der Junktur und einer zusätzlichen Abweichung vom Text ausgeschlossen werden musste (F-nm01, jüngste Angeklagte). Für die Analyse der französischen Produktionen (Text 4) der französischen Muttersprachler wurde ebenfalls ein stimmhafter Kontext gewählt. Phraseninitiale Vokale wurden aus den oben erläuterten Gründen ausgeschlossen. Ebenso ausgeschlossen wurde die Phrase six euros (L’entrée coute six euros.), da schon allein aufgrund ihrer Position innerhalb des Satzes und des Textes (letzte Phrase im Text) terminale Knarrstimme zu erwarten ist (Lehiste, 1979; Dilley et al., 1996; Kohler, 2000; Redi und Shattuck-Hufnagel, 2001). Auch die Phrase soir il wurde nicht berücksichtigt, da nicht ausgeschlossen werden kann, dass durch die konsonantische Realisierung des / r/ Unregelmäßigkeiten entstehen, die die Analyse beeinträchtigen. Es ergeben sich daher für die französischen Produktionen der französischen Muttersprachler die vier folgenden zu untersuchenden Junkturen (durch Unterstreichung hervorgehoben) in einem Vokal-Vokalbzw. Nasal-Vokal-Kontext: 1. Ce soir il y a un joli film au cinéma. 2. Le cinéma se situe au centre-ville. 3. Le cinéma est à l’intersection suivante. Aus akustischer Perspektive kann Glottalisierung als ein Teil im Sprachsignal bezeichnet werden, der vor allem durch Unregelmäßigkeiten im Schwingungsverlauf gekennzeichnet ist und durch weitere phonetische Korrelate begleitet werden kann. Dabei variieren sowohl die Vorkommensfrequenz als auch die akustischen Charakteristika interindividuell sehr stark. Folgende Merkmale im Sprachsignal weisen auf Glottalisierung hin (Dilley et al., 1996; Redi und Shattuck-Hufnagel, 2001): • Unregelmäßigkeiten im Signalverlauf im Oszillogramm, die sich z. B. manifestieren durch - unregelmäßige Schwingungen, - einen einzelnen glottalen Puls mit anschließenden unregelmäßigen Schwingungen, - verlängerte Periodendauer, - Reduktion in der Amplitude. 162 • Abfall in der F0-Kontur Das Vorhandensein eines glottalen Reflexes in der Junktur wurde zum einen durch eine auditive Einschätzung und zum anderen durch eine eingehende visuelle Analyse des Sprachsignals bestimmt. Der Fokus der akustischen Analyse liegt auf einer visuellen Überprüfung des Oszillogramms. Ein Einbruch im Schalldruckverlauf oder Unregelmäßigkeiten in den Schwingungen können auf eine Störung der modalen glottalen Aktivität hindeuten. Eine zusätzliche Inspektion des Intensitätsverlaufs kann helfen, eine Reduktion in der Amplitude aufzudecken. Allerdings kann der Grund für Veränderungen im Schalldruckverlauf auch in Änderungen im Resonanzverhalten liegen, die durch artikulatorische Abläufe verursacht werden und die komplexe akustische Änderungen nach sich ziehen. Zum Beispiel können durch artikulatorische Bewegung Obertöne in der Nähe der unteren Formanten geschwächt werden. Eine Überprüfung des Tonhöhenverlaufs zeigt, ob in der Vokaljunktur ein Abfall in der F0-Kontur vorliegt, der auf einen glottalen Reflex hindeutet. Im Sonagramm weisen schwarze vertikale Balken, die meist größere Abstände zwischeneinander haben, auf eine verlängerte Periodendauer und damit auf Glottalisierung hin. Diese akustischen Charakteristika können einzeln aber auch in Kombination miteinander auftreten und führen zu dem auditiven Eindruck einer Glottalisierung. Dieser perzeptive Eindruck einer glottalen Geste oder eines glottalen Reflexes kann auf die Wahrnehmung einer Störung oder Unterbrechung der modalen Stimmgebung zurückgeführt werden und wird häufig auch mit Kategorien wie Knarren, Rauigkeit, oder Behauchung beschrieben (vgl. Redi und Shattuck-Hufnagel, 2001). 10.1.2. Ergebnisse Ergebnisse: Vokaleinsatzrealisierungen in den unverstellten Produktionen der deutschen Muttersprachler Wie zu erwarten wurden die untersuchten Vokaleinsätze in den unverstellten Produktionen der deutschen Muttersprachler in deutlicher Mehrheit mit einem glottalen Reflex realisiert. Glottalisierung, auch verbunden mit einem glottalen Verschluss, war dabei die am häufigsten beobachtete Form. Eine quantitative Auswertung der verschiedenen vorgefundenen Formen soll an dieser Stelle nicht erfolgen. Denn es geht hier insbesondere darum, generell zu zeigen, dass in den unverstellten Versionen der deutschen Muttersprachler bei initialen Vokalen im untersuchten Kontext ein glottaler Reflex zu erwarten ist. In nur acht von 285 Fällen konnte akustisch kein glottaler Reflex festgestellt werden - das entspricht einem Prozentsatz von 2,8 %. Die Beurteilung war bei den männlichen Sprechern schwieriger, da hier geknarrte Stimmgebung häufiger vorkommt. 163 Dilley et al. (1996) und Redi und Shattuck-Hufnagel (2001) stellen die starke interindividuelle Variation in Frequenz und akustischer Ausprägung als besonderes Merkmal von Glottalisierung heraus. Während die Frequenz von Glottalisierung in der untersuchten Sprechergruppe der deutschen Muttersprachler bei dem gewählten Kontext kaum schwankt, kann die starke Streuung in ihrer akustischen Ausprägung jedoch bestätigt werden. Die Abbildungen 10.3 und 10.4 zeigen für die Variationsbreite beispielhaft verschiedene Glottalisierungsformen in der Vokaljunktur in der unverstellten Version von nur ein(mal) (Ich sage es nur einmal! , Text 1) gesprochen von den Sprecherinnen Ff04, Ff07, Ff05, Ff01. Der dynamische Bereich der Sonagramme in Abbildung 10.3 umfasst 45,0 dB. Sprecherin Ff04 markiert die Vokaljunktur mit Knarrstimme. Die Glottalisierung ist im Oszillogramm an den unregelmäßigen Schwingungen mit verlängerter Periodendauer erkennbar, ein Glottalverschluss liegt nicht vor. Die anderen drei Sprecherinnen realisieren einen glottalen Verschluss von meist weniger als 50 ms Dauer, der mit Glottalisierung einhergeht, die jedoch zu einem unterschiedlichen Zeitpunkt erfolgt. Bei den Sprecherinnen Ff07 und Ff05 konzentriert sich die deutlich erkennbare Glottalisierung auf das Ende von nur und geht damit dem Glottalverschluss voraus. Nach dem Glottalverschluss beginnt die Stimmhaftigkeit des Diphthongs in eine zwar mit unregelmäßigen Schwingungen, allerdings liegt keine Knarrstimme vor. Sprecherin Ff01 weist ebenfalls einen Glottalverschluss in der Vokaljunktur auf. Dieser wird durch Glottalisierung eingeleitet und es schließt sich deutliche Glottalisierung an, die auch auditiv an einer ausgeprägten Knarrstimme erkennbar ist. Dass die Realisierung der Vokaleinsätze nicht nur zwischen den Sprechern, sondern auch innerhalb eines Sprechers variiert, wird beispielhaft an Abbildung 10.5 gezeigt. Abgebildet ist jeweils ein Ausschnitt aus der Phrase die Angestellten (bis zum Ende des ersten Nasals) zweimal gesprochen von Sprecherin Ff12. Beide Ausschnitte stammen aus der ersten Aufnahme der unverstellten Version des Textes 3. Dargestellt sind (von oben nach unten) das Oszillogramm, der Intensitätsverlauf (in dB), der Tonhöhenverlauf (in Hz) und das Sonagramm (dynamischer Bereich: 45,0 dB). Teil (a), im linken Abschnitt der Abbildung, zeigt, dass die Sprecherin in der Vokaljunktur einen Glottalverschluss realisiert, wobei dieser nicht vollständig erreicht zu werden scheint. Dieser knapp 60 ms dauernden Verschlussphase geht außerdem Glottalisierung voraus, nach dem Verschluss setzt die Stimmhaftigkeit mit einer sehr kurzen Phase unregelmäßiger Schwingung wieder ein. Teil (b), im rechten Bereich der Abbildung, zeigt eine zweite Version der Phrase die Angestellten gesprochen von derselben Sprecherin, innerhalb desselben Textes und damit ebenfalls in unverstelltem Deutsch. In diesem Fall markiert die Sprecherin die Vokaljunktur nicht. Der Periodenverlauf ist nahezu regelmäßig, der Tonhöhenverlauf fällt in der Junktur nicht ab, sondern zeigt einen gleichmäßigen Verlauf um 200 Hz. Im Intensitätsverlauf ist ebenfalls keine wesentliche Änderung feststellbar. Die im 164 Time (s) 0 0.7837 0 5000 Frequency (Hz) 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 Ff04 Ff07 Time (s) 0 0.8492 0 5000 Frequency (Hz) 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 Ff01 Ff05 Abbildung 10.3.: Verschiedene Formen junktureller Glottalisierung in nur einmal (Ausschnitt) gesprochen von Ff04, Ff07, Ff05, Ff01 (unverstellte Version) 165 Time (s) 0 0.05 0.1 0.15 0.2 0.25 0.3 Ff04 Ff07 Ff05 Ff01 Abbildung 10.4.: Oszillogramme verschiedener Formen junktureller Glottalisierung in nur einmal (Ausschnitt) gesprochen von Ff04, Ff07, Ff05, Ff01 (unverstellte Version) Oszillogramm sichtbare Veränderung der Form des Schalldruckverlaufs lässt sich vermutlich auf den artikulatorischen Ablauf in der Bewegung von einem hohen vorderen Vokal zu einem zentralen tiefen Vokal zurückführen, die akustisch zu komplexen Änderungen in der Formantstruktur führt und auch von Ladefoged und Maddieson (1996, S. 76 f.) beschrieben wird. Die Pfeile in Abbildung 10.5 markieren den Abschnitt der Glottalisierung und den Abschnitt, in dem akustisch kein glottaler Reflex feststellbar ist. Auf der anderen Seite scheinen sich für manche Sprecher auch Präferenzen in der Realisierung des Vokaleinsatzes herauszukristallisieren. So weisen beispielsweise die Sprecherinnen Ff05 und Ff07 gegenüber den anderen deutschen Muttersprachlern deutlich häufiger längere glottale Verschlussphasen (35-70 ms) mit vorausgehender oder darauffolgender Glottalisierung auf. 166 20 40 60 100 200 300 400 Time (s) 0 0.5914 0 5000 Frequency (Hz) 0 0.1 0.2 0.3 0.4 0.5 dB Hz (b) (a) Abbildung 10.5.: Vergleich der unterschiedlichen Realisierung der Vokaljunktur in die Angestellten (Ausschnitt) gesprochen von Ff12 in unverstellter Version Ergebnisse: Vokaleinsatzrealisierungen in den französischen Produktionen der französischen Muttersprachler Von den 16 zu analysierenden Vokaljunkturen (vier Junkturen à vier Sprecher) musste ein Fall ausgeschlossen werden. Sprecherin F-nf02 bricht nach der Phrase Le cinéma est ab und setzt mit est neu ein. Der begonnene Übergang ist durch eine raue Stimmqualität gekennzeichnet. Das neu eingesetzte est beginnt mit einem glottalisierten Vokal und ist auch auditiv durch Knarrstimme gekennzeichnet. Obwohl hier folglich alles auf eine glottalisierte Junktur hindeutet, wurde dieser Fall dennoch ausgeschlossen, da Glottalisierung nicht nur ein Grenzsignal ist, sondern auch ein Merkmal von Abbrüchen (Kohler, 2000; Rodgers, 2000). An dieser Stelle soll noch angemerkt werden, dass in der Auswertung auch die Phrase est à (Le cinéma est à ...) nicht berücksichtigt wurde; zum einen aufgrund des eben genannten Abbruchs der Sprecherin F-nf02 an dieser Stelle, zum anderen aber auch weil alle Sprecher außer F-nm01 in est den Plosiv / t/ realisieren und somit kein Vokal-Vokal-Kontext gegeben ist. Alle der verbleibenden 15 Junkturen wurden ohne einen glottalen Reflex realisiert, der die normale glottale Vibration unterbricht. Das heißt es liegt ein 167 weicher nicht glottalisierter Übergang vor. In der Phrase film au erweist sich die Beurteilung des Vokaleinsatzes trotz des stimmhaften Kontexts zum Teil als problematisch. Die auditive Beurteilung ergibt, dass auch in dieser Junktur alle Sprecher einen weichen Übergang ohne Grenzmarkierung realisieren und auch die akustische Überprüfung bestätigt dieses Ergebnis. Zwar zeigt sich bei drei Sprechern im Oszillogramm zwischen dem Nasal und dem Vokal eine Änderung im Schalldruckverlauf, vermutlich kann diese jedoch auf die komplexen akustischen Vorgänge zurückgeführt werden, die Folge der artikulatorischen Bewegung von einem hohen vorderen Vokal mit anschließendem palatalem Approximanten über einen Nasal hin zu einem hinteren gerundeten Vokal sind. So zeigt sich bei den beiden Sprecherinnen im Oszillogramm ein Einbruch im Schalldruckverlauf. Bei Sprecher F-nm02 hingegen steigt die Amplitude für den Vokal, was jedoch auch nicht ungewöhnlich ist, da ein Nasal häufig akustisch schwächer ist als ein Vokal. In deskriptiven Studien wird davon ausgegangen, dass im Französischen Vokaleinsätze weich realisiert werden, d. h. weder Glottalverschluss noch Glottalisierung vorhanden ist und die modale glottale Vibration unterbricht. Für die hier untersuchten Junkturen im stimmhaften Kontext kann diese Aussage bestätigt werden, sie wurden alle mit einem fließenden Übergang unter Verwendung von Modalstimme realisiert. Anders verhält es sich in einem nicht-stimmhaften Kontext. Wie oben am Beispiel phraseninitialer Vokale gezeigt, realisieren die französischen Muttersprachler dieser Studie glottalisierte Vokaleinsätze. Ein weiteres Beispiel für einen glottalisierten Vokaleinsatz wird durch Abbildung 10.6 verdeutlicht. Dargestellt ist ein glottalisierter Vokaleinsatz in der Phrase Bank et (Après passez devant la Deutsche Bank et le commissariat.) gesprochen von Sprecher F-nm02. Nach der Lösung des dorsalen Plosivs (bei 0,27 s) folgt eine lange Aspirationsphase, die ca. 100 ms andauert, bis zunächst ein schwacher und gleich danach der erste stärkere glottale Puls (bei 0,38 ms) einsetzt und nach über 30 ms (ab 0,41 s) weitere glottale Pulse folgen (durch Pfeil gekennzeichnet). Auch die anderen drei Sprecher weisen an dieser Stelle einen deutlich glottalisierten Vokaleinsatz auf. Ursächlich für die Diskontinuität an dieser Stelle kann der deutsche Eigenname Deutsche Bank sein, der die Sprecher zu einer deutschen Aussprache der beiden Wörter veranlassen mag und auch einen glottalisierten Vokaleinsatz in et begünstigt. Ergebnisse: Vokaleinsatzrealisierungen in den verstellten Produktionen der deutschen Muttersprachler Vergleichbar zu den Vokaleinsätzen in ihren unverstellten Produktionen realisieren die deutschen Muttersprachler auch in den Akzentimitationen in einer deutlichen Mehrheit glottalisierte Vokaleinsätze. In nur zehn von 283 Fällen, das entspricht einem Prozentsatz von 3,5 %, konnte eine Unterbrechung der Modalstimme durch einen glottalen Reflex ausgeschlossen werden. Damit liegt 168 Time (s) 0 0.4792 0 5000 Frequency (Hz) 0 0.1 0.2 0.3 0.4 Abbildung 10.6.: Glottalisierter Vokaleinsatz in Bank et gesprochen von F-nm02 in der Akzentimitation eine Steigerung der Anzahl der nicht glottalisierten Vokaleinsätze um weniger als einen Prozentpunkt vor, die nicht signifikant ist (p > 0,05; gepaarter Wilcoxon-Test). Tabelle 10.1 gibt für die deutschen Muttersprachler einen Gesamtüberblick über die Anzahl der mit bzw. ohne Glottalisierung realisierten Vokaleinsätze in der unverstellten und verstellten Produktion. Abbildung 10.7 und 10.8 zeigen zum Vergleich jeweils eine Gegenüberstellung eines mit Glottalisierung realisierten Vokaleinsatzes in der unverstellten Variante und eines ohne Glottalisierung realisierten Vokaleinsatzes in der verstellten Variante. Abbildung 10.7 stellt einem glottalisierten Vokaleinsatz in der unverstellten Version einen nicht glottalisierten Vokaleinsatz in der verstellten Version von die anderen gesprochen von Ff07 gegenüber. Abgebildet ist nur ein Ausschnitt bis unmittelbar vor der Lösung des / d/ in anderen (Text 3, 1. Aufnahme; dynamischer Bereich: 43,0 dB). Abbildung 10.8 zeigt eine weitere Gegenüberstellung für die Phrase nur einmal gesprochen von Fm04 (1. Aufnahme von Text 3; dynamischer Bereich: 41,0 dB). Die Pfeile zeigen den Abschnitt der Glottalisierung an bzw. in der verstellten Version den Abschnitt ohne einen akustisch feststellbaren glottalen Reflex. Bei der Betrachtung der Verteilung der Realisierung der Vokaleinsätze kann der Eindruck entstehen, dass eine Tendenz besteht, dass die männlichen Sprecher 169 Time (s) 0 0.6661 0 5000 Frequency (Hz) 0 0.1 0.2 0.3 0.4 0.5 0.6 unverstellt verstellt Abbildung 10.7.: Gegenüberstellung von glottalisiertem Vokaleinsatz in unverstellter Version und nicht glottalisiertem Vokaleinsatz in verstellter Version der Phrase die anderen (Ausschnitt) gesprochen von Ff07 Time (s) 0 1.096 0 5000 Frequency (Hz) 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 unverstellt verstellt Abbildung 10.8.: Gegenüberstellung von glottalisiertem Vokaleinsatz in unverstellter Version und nicht glottalisiertem Vokaleinsatz in verstellter Version der Phrase nur einmal gesprochen von Fm04 170 Tabelle 10.1.: Anzahl (N) der mit und ohne Glottalisierung (Glott.) realisierten Vokaleinsätze pro Sprecher in der unverstellten und in der verstellten Version (NA = nicht verfügbare Werte) unverstellt verstellt N Glott. N ohne Glott. NA N Glott. N ohne Glott. NA Ff01 13 0 0 13 0 0 Ff02 13 0 0 13 0 0 Ff03 12 1 0 12 1 0 Ff04 13 0 0 13 0 0 Ff05 13 0 0 13 0 0 Ff06 13 0 0 13 0 0 Ff07 13 0 0 12 1 0 Ff08 13 0 0 13 0 0 Ff09 13 0 0 13 0 0 Ff10 13 0 0 13 0 0 Ff11 13 0 0 11 1 1 Ff12 12 1 0 13 0 0 Ff13 13 0 0 13 0 0 Ff14 13 0 0 13 0 0 Ff15 13 0 0 13 0 0 Fm01 12 0 1 12 1 0 Fm02 13 0 0 13 0 0 Fm03 11 2 0 10 3 0 Fm04 11 3 0 10 3 0 Fm05 12 1 0 12 0 1 Fm06 13 0 0 13 0 0 Fm07 13 0 0 12 0 1 Gesamt 277 (97,2 %) 8 (2,8 %) 1 273 (96,5 %) 10 (3,5 %) 3 häufiger nicht glottalisierte Vokaleinsätze als die Sprecherinnen aufweisen: sieben der zehn Fälle kommen in der Gruppe der männlichen Sprecher vor. Auf die Sprecher Fm03 und Fm04 fallen davon jeweils drei Fälle. Auf der anderen Seite sind auch in der unverstellten Version dies die beiden einzigen männlichen Sprecher, die zwei bzw. drei nicht glottalisierte Vokaleinsätze realisieren und damit fünf der insgesamt acht Fälle ausmachen. Es handelt sich hier also nicht zwangsläufig um eine geschlechtsspezifische Tendenz, sondern kann auch eine sprecherspezifische Ausprägung sein. Hier soll noch angemerkt sein, dass es sich jeweils nicht um die gleichen Wörter handelt, deren Vokaleinsatz in der unverstellten und verstellten Variante nicht glottalisiert wurde. Zur Frage, welchen Einfluss das Sprechergeschlecht auf die Frequenz von Glottalisierung hat, sind in der Literatur widersprüchliche Antworten zu finden (vgl. z. B. die Diskussion bei Redi und Shattuck-Hufnagel, 2001). Sprecherin Ff07, die in der 171 unverstellten Version eine der beiden Sprecherinnen mit den häufigsten glottalen Verschlüssen war, realisiert auch in der verstellten Textversion mehr glottale Verschlüsse als die anderen deutschen Muttersprachler. Dies ist ebenfalls ein Hinweis auf die Existenz von sprecherspezifischen Präferenzen in der Realisierung von Glottalisierung. Das Wort mit den meisten nicht glottalisierten Vokalübergängen (N = 4) ist verurteilt. Im Präfix verwird sowohl von einigen deutschen Muttersprachlern in der Akzentimitation als auch von einigen französischen Muttersprachlern ein konsonantisches, meist frikativisches, / r/ realisiert. Die durch die Engebildung verursachten Turbulenzen, die zum Teil auch mit dem Aussetzen der Stimmlippenschwingung einhergehen, können die auditive und akustische Beurteilung zum Vorhandensein von Glottalisierung erschweren. Bei den Sprecherinnen, die alle die Vokaljunktur glottalisierten, war die Identifikation der Glottalisierung dennoch in den meisten Fällen unproblematisch. Bei den männlichen Sprechern, bei denen in vier Fällen eine Vokaljunktur ohne Glottalisierung realisiert wurde, war die Beurteilung dieser Fälle etwas schwieriger, zumal häufig ein recht kurzer Vokal realisiert wurde. Als Beispiel sei Fm03 genannt, der beide Formen von verurteilt ohne Glottalisierung realisiert, aber ein konsonantisches / r/ aufweist. Dieses wird vermutlich mit einer Resyllabifizierung verknüpft. Das heißt, dass die Lautkette in eine neue Silbenstruktur umgruppiert wird, sodass in der veränderten Struktur das / r/ aus verzum Onset der folgenden Silbe wird (von / fEr-Ur-taIlt/ zu / fE-rUr-taIlt/ ) bzw. ambisyllabisch wird. Eine solche Umgruppierung der Silbenstruktur ist vor allem beim Fehlen von Glottalisierung nicht ungewöhnlich (vgl. Krech et al., 2009, S. 53 f.) und kommt in nicht-muttersprachlichen deutschen Äußerungen häufiger vor als in muttersprachlichen deutschen Äußerungen (vgl. Gut, 2009, S. 133 f.). Abbildung 10.9 zeigt beispielhaft den Ausschnitt verurteilt gesprochen in der verstellten Version von Sprecher Fm03 (2. Form in Text 3; dynamischer Bereich: 43,0 dB); der Pfeil markiert den diskutierten Abschnitt. Es gibt noch weitere Fällen, bei denen in der Imitation eines französischen Akzents anstelle eines vokalischen / r/ häufig eine konsonantische Realisierung auftritt: in nur einmal und der Opa-Bande. In den meisten dieser Fälle wird der auf das / r/ folgende Vokaleinsatz glottalisiert. Ergebnisse: Vokaleinsatzrealisierungen in den deutschen Produktionen der französischen Muttersprachler In den deutschen Produktionen der französischen Muttersprachler ist der Anteil der nicht glottalisierten Vokaleinsätze etwas höher als in den Akzentimitationen der deutschen Muttersprachler. Von 51 analysierten Junkturen wurden fünf ohne einen glottalen Reflex realisiert, was einem Prozentsatz von fast 10 % entspricht. Die meisten nicht glottalisierten Vokaleinsätze realisierte Sprecher F-nm01 mit drei Fällen. Sprecher F-nm02 hingegen realisierte alle untersuchten 172 Time (s) 0 0.6801 0 5000 Frequency (Hz) 0 0.1 0.2 0.3 0.4 0.5 0.6 Abbildung 10.9.: Nicht glottalisierte, mit konsonantischem / r/ realisierte Form von verurteilt gesprochen von Fm03 in verstellter Version Tokens mit einem glottalen Reflex. Die beiden verbleibenden Fälle nicht glottalisierter Vokaleinsätze fallen auf die beiden französischen Muttersprachlerinnen. Die Werte sind in Tabelle 10.2 dargestellt. Die französischen Muttersprachler zeigen im Merkmal der Glottalisierung von Vokaleinsätzen im Deutschen keine konsistente Realisierung. Dies kann besonders gut an dem Beispiel verurteilt gesprochen von den Sprecherinnen Fnf01 und F-nf02 verdeutlicht werden. Beide Sprecherinnen haben innerhalb einer Aufnahme desselben Textes (Text 3) den Vokalübergang jeweils einmal glottalisiert und einmal nicht glottalisiert realisiert. Anhand der Abbildungen Tabelle 10.2.: Anzahl (N) der mit und ohne Glottalisierung (Glott.) realisierten Vokaleinsätze pro französischen Muttersprachler in der deutschen Produktion (NA = nicht verfügbare Werte) N Glott. N ohne Glott. NA F-nf01 12 1 0 F-nf02 12 1 0 F-nm01 9 3 1 F-nm02 13 0 0 Gesamt (= 52) 46 (88,5 %) 5 (9,6 %) 1 173 Time (s) 0 1.03 0 5000 Frequency (Hz) 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 (a) (b) Abbildung 10.10.: Gegenüberstellung von nicht glottalisiertem (a) und glottalisiertem (b) Vokaleinsatz in verurteilt (Ausschnitt) gesprochen von F-nf01 10.10 und 10.11 wird diese Inkonsistenz in der Realisierung des Vokalübergangs dargestellt. Abgebildet ist jeweils nur der Ausschnitt bis ca. zur Mitte des Diphthong-Lateral-Abschnitts in -teilt. Die Pfeile markieren jeweils die Abschnitte mit und ohne glottalen Reflex. Abbildung 10.10 zeigt die Produktionen der Sprecherin F-nf01, die die erste Form (a) von verurteilt ohne glottalen Reflex realisiert und die zweite Form (b) davon wenige Sätze später im selben Text jedoch mit glottalem Reflex (dynamischer Bereich: 43,0 dB). Abbildung 10.11 zeigt die Produktionen der Sprecherin F-nf02, die die erste Form (a) von verurteilt mit glottalem Reflex realisiert und die zweite Form (b) ohne glottalen Reflex (dynamischer Bereich: 41,0 dB). Auffällig ist außerdem, dass auch die französischen Muttersprachler zum Teil konsonantische Realisierungen des / r/ in den Phrasen nur einmal, verurteilt und der Opa-Bande aufweisen. Diese konsonantischen Realisierungen von / r/ an Positionen, bei denen im Deutschen ein vokalisches / r/ ( [5“] ) realisiert werden müsste, kommt auch in den Akzentimitationen einiger deutscher Muttersprachler vor. Das zeigt, dass es sich hier nicht nur um ein bekanntes Muster französischer Muttersprachler im Deutschen handelt, sondern auch, dass die deutschen Muttersprachler sich dieses Musters bewusst sind und versuchen, es in ihren Akzentimitationen umzusetzen. 174 Time (s) 0 1.088 0 5000 Frequency (Hz) 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 (a) (b) Abbildung 10.11.: Gegenüberstellung von glottalisiertem (a) und nicht glottalisiertem (b) Vokaleinsatz in verurteilt (Ausschnitt) gesprochen von F-nf02 Ein besonderer Fall ist die Phrase Stadion angekommen gesprochen von F-nm02. Der Vokaleinsatz wurde in der Analyse als glottalisiert gewertet. Eine rein perzeptuelle Einschätzung reicht nicht aus, um die Realisierung des Vokaleinsatzes zu beurteilen. Ein glottaler Verschluss oder niedrigfrequente unregelmäßige glottale Schwingung liegen nicht vor. Allerdings scheint sich die Stimmqualität in der Junktur leicht zu verändern und im Oszillogramm zeigt sich außerdem ein Einbruch im Schalldruckverlauf. Die Realisierung der letzten Silbe des Wortes Stadion entspricht aufgrund einer stark abweichenden Vokalqualität nicht dem auditiven Erwartungsbild. Der Nasal in Stadion wird zudem vermutlich palatal statt alveolar gebildet. 10.1.3. Zusammenfassung Deutsch und Französisch unterscheiden sich in der Realisierung von Vokaleinsätzen zum Beispiel in Vokaljunkturen. Um im Hinblick auf dieses Merkmal die Variationsfähigkeit deutscher Muttersprachler bei der Imitation eines französischen Akzents und französischer Muttersprachler im Deutschen zu untersuchen, wurde ein Kontext gewählt, in dem im Deutschen mit sehr hoher Wahrscheinlichkeit Glottalisierung auftritt und diese möglichst zuverlässig identifiziert werden kann: initiale akzentuierte Vokale, denen ein Vokal, Nasal oder Lateral vorausgeht. 175 Die deutschen Muttersprachler dieser Studie realisieren im untersuchten Kontext in ihren deutschen unverstellten Produktionen wie zu erwarten fast ausschließlich glottalisierte Vokaleinsätze. In ihren Akzentimitationen erhöht sich die Zahl der nicht glottalisierten Vokaleinsätze jedoch nur geringfügig. Die Frequenz der Glottalisierung variiert über die Sprechergruppe kaum und unterscheidet sich damit von den Ergebnissen anderer Studien, die jedoch zum Amerikanischen Englisch durchgeführt wurden (Umeda, 1978; Dilley et al., 1996; Redi und Shattuck-Hufnagel, 2001). Eine breitere Streuung ist allerdings für die akustische Ausprägung der Glottalisierung zu finden, wobei Glottalisierung gegenüber dem Glottalverschluss überwiegt. Doch nicht nur innerhalb der Sprechergruppe sind unterschiedliche Formen eines glottalen Reflexes im Vokaleinsatz zu finden. Es konnte bereits für die unverstellten Produktionen gezeigt werden, dass auch innerhalb eines Sprechers verschiedene Formen - sowohl glottalisiert und nicht glottalisiert als auch verschiedene Realisierungen der Glottalisierung - vorkommen. Dies zeigt, dass eine konsistente Realisierung in diesem Merkmal bereits in den unverstellten Produktionen der Sprecher unwahrscheinlich ist. Allerdings scheint es in dem Merkmal der Glottalisierung für manche Sprecher eine stärkere sprecherspezifische Ausprägung zu geben als für andere Sprecher. Diese Beobachtung stimmt mit Erkenntnissen von Redi und Shattuck-Hufnagel (2001) überein, dass von verschiedenen Sprechern verschiedene Glottalisierungsformen mit unterschiedlich starker Frequenz genutzt werden, wobei manche Sprecher eine stärkere Präferenz für bestimmte Formen zeigen als andere. Die französischen Muttersprachler realisieren in den untersuchten französischen Produktionen (im stimmhaften Kontext) ausschließlich nicht glottalisierte Vokaleinsätze. Damit werden deskriptive Aussagen zum Französischen bestätigt. Allerdings konnte am Beispiel Bank et gezeigt werden, dass es sich in einem anderen Kontext durchaus anders verhalten kann und Glottalisierung hier sehr wahrscheinlich ist. In ihren deutschen Produktionen realisierten die französischen Muttersprachler mit großer Mehrheit glottalisierte Vokaleinsätze. Allerdings liegt der Anteil der nicht glottalisierten Vokaleinsätze höher als in den Akzentimitationen der deutschen Muttersprachler. Die französischen Muttersprachler sind in ihren Vokaleinsatzrealisierungen im Deutschen nicht konsistent. Innerhalb eines Textes kommen beim selben Wort glottalisierte und nicht glottalisierte Vokaljunkturen vor. Dies zeigt, dass zumindest in der Realisierung von Vokaleinsätzen Konsistenz kein hinreichendes Kriterium für die Authentizitätsbeurteilung eines fremdsprachigen Akzents ist. Simpson und Meinhold (2007) konnten durch ihre Studie zu artikulatorischen Kompensationsstrategien einer Sprecherin mit angeborener Aglossie zeigen, dass diese Sprecherin verschiedene Formen von Glottalisierung aufweist, denen unterschiedliche Funktionen zukommen. Zum einen wird Glottalisierung als Kompensationsstrategie für dorsale Plosive genutzt und zum anderen werden durch Glottalisierung auch Junkturen markiert. Dabei unterscheiden sich die 176 glottalen Korrelate der Junktur von der glottalen Strategie zur Kompensation der dorsalen Plosive. So finden sich zum Beispiel in den Fällen, in denen dorsale Plosive ersetzt werden, relativ lange glottale Verschlussphasen, denen Knarrstimme vorausgehen aber nicht folgen kann. Knarrstimme kann hier auch nicht alternativ zum Glottalverschluss eingesetzt werden. Damit liegt für die glottale Kompensationsstrategie eine hohe Beschränkung vor, während in der Vokaljunktur dieselben Variationsmöglichkeiten wie für gesunde Sprecher bestehen und von der Sprecherin genutzt werden. Nach Simpson und Meinhold (2007) können diese Ergebnisse darauf hindeuten, dass die Variationsmöglichkeiten in Glottalisierung gut kontrollierbar sind. Für die vorliegende Studie lässt sich festhalten, dass die Variation innerhalb des Merkmals Glottalisierung insgesamt sehr hoch ist. Auf Seite der deutschen Muttersprachler scheint jedoch die Fähigkeit zur bewussten und systematischen Variation in diesem Merkmal zum Zweck der Imitation eines französischen Akzents kaum ausgeprägt zu sein. Die französischen Muttersprachler hingegen variieren in diesem Merkmal für die Produktion des Deutschen. Dies zeigt, dass eine systematische Variation möglich ist, und lässt vermuten, dass dafür jedoch ein Bewusstsein für bestimmte phonetische Charakteristika der eigenen Sprache und der Fremdsprache notwendig ist. 10.2. Glottale Friktion Eine der bekanntesten Interferenzerscheinungen französischer Muttersprachler im Deutschen ist die mutmaßliche Nichtrealisierung des glottalen Frikativs im Silbenanlaut. Wie die Analysen aus der Vorstudie (Neuhauser, 2005, 2008) ergaben, gehört der Versuch, initial stehendes / h/ zu vermeiden, zu den häufigsten Variationen deutscher Muttersprachler bei der Imitation eines französischen Akzents. Dieses Ergebnis soll in der vorliegenden Studie durch die Analyse einer größeren Sprechergruppe überprüft werden. Im vorangegangenen Abschnitt zur Realisierung von Vokaljunkturen konnte gezeigt werden, dass in einem Kontext, in dem im Deutschen eine durch Glottalisierung markierte Junktur die häufigste Realisierungsform ist, auch in den Imitationen eines französischen Akzents diese Junktur durch Glottalisierung gekennzeichnet ist. Nicht glottalisierte Junkturen wurden im untersuchten Kontext sowohl in den unverstellten als auch in den verstellten Produktionen der deutschen Muttersprachler kaum realisiert. Diese Ergebnisse stützen die Vermutung, dass beim Versuch deutscher Muttersprachler, glottale Friktion im Silbenanlaut zu unterdrücken, in den Fällen einer erreichten Abwesenheit vermutlich ein glottalisierter Vokaleinsatz realisiert wird. Gestärkt wird diese Vermutung durch die Vorstudie (Neuhauser, 2005, 2008), in der bereits mit einer kleinen Sprechergruppe gezeigt wurde, dass deutsche Muttersprachler in den 177 meisten Fällen statt eines initialen glottalen Frikativs eine glottalisierte Form des Vokaleinsatzes realisieren. Zur Überprüfung der glottalen Strategien deutscher und französischer Muttersprachler im deutschen Silbenanlaut mit / h/ stellen sich folgende Analyseaufgaben: Zunächst muss überprüft werden, ob französische Muttersprachler im Deutschen den glottalen Frikativ tatsächlich nicht realisieren. Sollte glottale Friktion in den Produktionen der französischen Muttersprachler auftreten, dann ist zu untersuchen, ob und wie sich die Realisierung des / h/ von der Realisierung der unverstellten und verstellten Produktion deutscher Muttersprachler unterscheidet. In den Fällen, in denen die Produktionen der französischen Muttersprachler keine glottale Friktion im Silbenanlaut aufweisen, ist aufzudecken, welche Realisierung des Vokaleinsatzes an diesen Stellen realisiert wird. Die naheliegende Vermutung ist, dass von den französischen Muttersprachlern ein nicht glottalisierter Vokaleinsatz realisiert wird. Diese Vermutung ist zu überprüfen und es bleibt zu untersuchen, ob sich diese Vokaleinsatz- Realisierungen von den Realisierungen der deutschen Muttersprachler in ihren verstellten Produktionen unterscheiden. 10.2.1. Methode Um einen guten Vergleich zwischen den glottalen Strategien zu ermöglichen, die im deutschen Silbenanlaut eingesetzt werden, soll ein Kontext gewählt werden, in dem sowohl glottale Friktion als auch Glottalisierung möglichst zuverlässig festgestellt werden kann. Daher bietet sich der gleiche Kontext wie im vorigen Abschnitt zur Analyse der Vokaleinsätze in Junkturen an: in stimmhafter Umgebung stehendes / h/ . Durch diese Beschränkung wird phraseninitial stehendes / h/ ausgeschlossen. Folgende elf Tokens mit einem initialen glottalen Frikativ, der auf einen Vokal (N=6) oder Nasalkonsonanten (N=5) folgt und einem Vokal vorausgeht, wurden auf die Realisierung des glottalen Frikativs untersucht. Die relevante Stelle ist jeweils durch eine Unterstreichung in der Phrase markiert. Das Material stammt aus den ersten Aufnahmen der Texte 1 und 3 (Text wird jeweils in Klammern angegeben): 1. In jeden Umschlag zweihunderttausend Euro. (1) 2. ... und fahren bis zur Haltestelle „Am Stadion“ (1) 3. ... zu langen Haftstrafen verurteilt worden. (3) 4. ... für zwölf Jahre hinter Gitter. (3) 5. ... und kommt für neun Jahre in Haft. (3) 6. ... überfiel zwischen Neunzehnhundertsechsundachtzig und ... (3) 178 7. ... insgesamt eine halbe Million Euro. (3) 8. Bei ihren Überfällen hatten sie immer ... (3) 9. Alle haben Masken und moderne Hosen getragen. (3) 10. Ein Mann hat an der Tür gewartet und ... (3) Insgesamt sind in die Analyse der Produktionen der deutschen Muttersprachler 484 Silben mit initialem glottalen Frikativ eingeflossen: je 11 Phrasen gesprochen von 22 Sprechern in den zwei Modi „unverstellt“ und „verstellt“. In der unverstellten Version mussten davon 23 Tokens und in der verstellten Version 18 Tokens ausgeschlossen werden. Grund für diesen Ausschluss waren vorwiegend Abweichungen im Text. Beispielsweise wurde statt zur Haltestelle in einigen Fällen Bushaltestelle gelesen, wodurch der intervokalische Kontext nicht mehr vorliegt. In anderen Fällen fehlen Wortteile, Wörter oder der ganze Satz (z. B. zweitausend anstelle von zweihunderttausend oder Neunzehnsechsundachtzig anstelle von Neunzehnhundertsechsundachtzig). Vor allem in den unverstellten Varianten wurde zum Teil so stark reduziert (betrifft v. a. Neunzehnhundertsechsundachtzig), dass eine Analyse zum eventuellen Vorhandensein glottaler Friktion nicht möglich war. Außerdem wurden auch die Fälle ausgeschlossen, in denen eine dem initialen glottalen Frikativ vorausgehende Atmung, Versprecher und Abbrüche den stimmhaften Kontext unterbrochen haben. Für die Analyse der deutschen Produktionen der vier französischen Muttersprachler wurden ebenfalls die oben gelisteten Phrasen untersucht. Von 44 Silben mit initialem glottalem Frikativ (elf Phrasen gesprochen von vier Sprechern) mussten sieben Tokens ebenfalls aufgrund von vorausgehender Atmung, Versprechern oder Abweichungen vom Text ausgeschlossen werden. 1 Die glottale Friktion bei / h/ wird durch eine Engebildung an der Glottis erreicht, wodurch hier Turbulenzen entstehen, die das Friktionsrauschen verursachen. Die Quelle des Rauschens liegt im laryngalen Raum und befindet sich vorwiegend an der Oberfläche der Epiglottis, aber auch an den Taschenfalten (vgl. Stevens, 1998, S. 430-432). / h/ ist stark durch koartikulatorische Prozesse gekennzeichnet. Die Zunge nimmt bereits während der glottalen Engebildung die Position für den folgenden Vokal ein, d. h. die glottale Turbulenz wird durch die jeweilige Einstellung im Ansatzrohr entsprechend gefiltert (vgl. Kohler, 1995, S. 156). Dieser koartikulatorische Prozess ist auditiv durch ein verändertes Friktionsgeräusch erkennbar. Akustisch ist er durch die Formantstruktur des folgenden Vokals nachweisbar, die bereits während des glottalen Frikativs im Sonagramm sichtbar ist, wenngleich verrauscht. Doch nicht nur die Qualität des folgenden Vokals überträgt sich auf / h/ , sondern auch die Stimmbeteiligung. In stimmloser Umgebung wird / h/ meist stimmlos realisiert. In 1 Sprecherin F-nf01 liest Neunhundertsechsundachtzig statt Neunzehnhundertsechsundachtzig. Da der Kontext Nasal- / h/ -Vokal jedoch weiterhin gegeben ist, wurde dieses Token nicht ausgeschlossen. 179 stimmhafter Umgebung, zum Beispiel intervokalisch, wird der glottale Frikativ jedoch meist stimmhaft realisiert, d. h. es liegt behauchte Stimmhaftigkeit vor. Das Spektrum ist mit Stimmbalken und Formantstruktur vokalähnlich, aber verrauscht. Bei der stimmhaften Realisierung überlappen sich zwei artikulatorische Gesten: zum einen die periodische Öffnungs- und Schließungsgeste der Glottis zur Stimmbildung und zum anderen eine glottale Öffnungsgeste, die zu einem erhöhten Luftverbrauch führt. Das Aufrechterhalten der Stimmlippenschwingung erklärt Stevens (1998, S. 424 f.) dadurch, dass sich bei der glottalen Öffnungsgeste zwar der hintere Teil der Glottis mehr als der vordere Teil spreizt, aber die nahezu unveränderte Vibrationsbewegung des vorderen Teils der Glottis mechanisch mit dem hinteren Teil verbunden ist. Dies führt dazu, dass die Stimmlippen auch im hinteren Teil der Glottis weiterhin schwingen, allerdings berühren sie sich bei entsprechend gespreizter Stellung nicht mehr, wodurch es auch zu keinem transglottalen Druckabfall kommt und der Schalldruckverlauf keine Diskontinuitäten aufweist, sondern sinusförmig verläuft. Wenn jedoch die Abduktion der Stimmlippen ausreichend stark ist, sodass die Stimmlippen in einem Großteil ihrer Gesamtlänge gespreizt sind, so setzt auch die Vibration der Stimmlippen aus. Da für diese Untersuchung ein stimmhafter Kontext gewählt wurde, ist davon auszugehen, dass die deutschen Muttersprachler in ihren normalen unverstellten Produktionen einen stimmhaften glottalen Frikativ produzieren. Folgende Realisierungsformen sind in den verstellten Produktionen der deutschen Muttersprachler bzw. in den deutschen Produktionen der französischen Muttersprachler denkbar und werden daher als Kategorien zur Analyse herangezogen: 1. Realisierung eines stimmhaften glottalen Frikativs, 2. Realisierung eines stimmlosen glottalen Frikativs, 3. keine glottale Friktion und Realisierung einer glottalisierten Junktur, 4. keine glottale Friktion und Realisierung eines weichen Vokaleinsatzes (nicht glottalisierte Junktur), 5. andere Formen, die sich keiner der obigen Kategorien zuordnen lassen. Um zwischen der stimmhaften und stimmlosen Realisierung eines glottalen Frikativs zu unterscheiden, wurde sich zunächst an dem von Koenig et al. (2008) aufgestellten Kriterium orientiert, nach dem Stimmlosigkeit dann vorliegt, wenn die stimmlose Phase länger ist als die Dauer zweier glottaler Schwingungsperioden: To allow a binary distinction between voiced and devoiced tokens, a two-pulse-period criterion was defined, based on the speaker ’s average f0 measures before and after / h/ . Productions with a voicing break greater than the duration of two pitch periods were considered to be devoiced. (Koenig et al., 2008, S. 711) 180 Dieses Kriterium schien für diese Untersuchung einen zu strengen Maßstab anzulegen und verschiedene Problemfälle nicht zu erfassen. Schließlich wurde es für die Analyse in der vorliegenden Studie dahingehend variiert, dass auch wenn im Sonagramm kein Stimmbalken mehr zu erkennen war, aber im Oszillogramm noch Periodizität vorhanden war, der glottale Frikativ als stimmhaft gewertet wurde. Auch wenn die stimmhaften Phasen vor und nach der stimmlosen Phase in ihrer gemeinsamen Dauer deutlich die Dauer der stimmlosen Phase überschritten, so wurde die glottale Friktion als stimmhaft gewertet, selbst wenn die stimmlose Phase länger als zwei Schwingungsperioden dauerte und keine Periodizität mehr feststellbar war. Auf der anderen Seite wurde die glottale Friktion als stimmlos bewertet, wenn die stimmlose Phase in ihrer Dauer deutlich überwog. Die folgende Analyse ist nur zum Teil quantitativ. Zum einen scheint die Zuordnung zu den oben aufgestellten Kategorien sinnvoll und notwenig, um einen Eindruck über die (relative) Anzahl der verschiedenen möglichen Realisierungsformen zu gewinnen und auszudrücken. Zum anderen zeigt bereits die obige Diskussion zur Unterscheidung zwischen stimmloser und stimmhafter glottaler Friktion, dass eine Zuordnung zu der einen oder anderen Kategorie nicht immer zweifelsfrei möglich ist. Auch die Aufnahme einer Kategorie „Andere Formen“ ist kritisch zu betrachten, da sie ihre Ursache in der Nicht- Zuordenbarkeit einer bestimmten vorliegenden Realisierungsform zu einer der anderen Kategorien hat. Außerdem werden v. a. die Ausführungen zu den Realisierungen der französischen Muttersprachler zeigen, dass bestimmte Formen aus der quantitativen Analyse ausgeschlossen werden mussten, z. B. weil aufgrund von Abbrüchen und Atmung kein stimmhafter Kontext mehr vorliegt, jedoch gerade diese Formen von besonderem Interesse sind. Eine detaillierte quantitative sowie statistische Auswertung scheint aus diesen Gründen wenig sinnvoll. Der Schwerpunkt der Analyse liegt daher auf einer qualitativen Beschreibung der Produktionen der deutschen und französischen Muttersprachler in ihren verschiedenen Textversionen. Diese qualitativ-deskriptive Analyse wird kombiniert mit einer einfachen quantitativen Darstellung und Kategorisierung der vorgefundenen Realisierungsformen. 10.2.2. Ergebnisse Ergebnisse: Realisierung von / h/ in den unverstellten Produktionen der deutschen Muttersprachler Wie zu erwarten realisieren die deutschen Muttersprachler in ihren unverstellten Produktionen fast ausschließlich glottale Friktion für / h/ . Von 219 analysierten Silben wurden 216 mit einem akustisch erkennbaren glottalen Reflex realisiert, der mehrheitlich (207 von 216) als stimmhafte glottale Friktion bewertet wurde. Die verbleibenden drei Formen sind einmal ein nicht glottalisierter 181 Vokalübergang ohne glottale Friktion und zwei Realisierungsformen, die aus einer Kombination von glottaler Friktion und Glottalisierung bestehen. Die Konsistenz in den Realisierungen der deutschen Muttersprachler in ihren unverstellten Textproduktionen ist insgesamt hoch. Herausstechend ist jedoch die hohe Anzahl an für die Analyse nicht verfügbaren Werten bei den Tokens Neunzehnhundertsechsundachtzig und zweihunderttausend. Insgesamt konnten 18 Realisierungen dieser beiden Tokens nicht analysiert werden. Gründe hierfür wurden im Abschnitt zur Methodik bereits angeführt. Eine weitere Diskussion dazu erfolgt in der Zusammenfassung zum Ende dieses Abschnittes unter Punkt 10.2.3. Da das Ziel dieser Arbeit nicht eine Beschreibung möglicher Realisierungsformen von / h/ oder glottaler Friktion im Deutschen ist, wird auf detaillierte Ausführungen zur auditiven Charakteristik und akustischen Ausprägung der unverstellten Realisierungen deutscher Muttersprachler verzichtet. Dafür werden im Folgenden einige auffällige Einzelfälle dargestellt, die von den sonst üblichen Realisierungen abweichen oder in denen die Beurteilung der Realisierung besonders schwierig ist. In einigen Fällen ist die Entscheidung, ob ein Vokalübergang mit leicht behauchter Stimmqualität als „nicht glottalisierte Junktur ohne glottale Friktion“ oder als (schwache) „stimmhafte glottale Friktion“ gewertet wird, äußerst schwierig und kann sicherlich nicht immer zweifelsfrei getroffen werden. Besonders bei / h/ mit folgendem gerundeten Vokal, z. B. in Hosen oder -hundert-, scheint die glottale Friktion häufig so schwach ausgeprägt zu sein, dass das charakteristische Rauschen im Sonagramm kaum erkennbar ist. Grund hierfür ist, dass durch die Lippenrundung die oberen Frequenzen abgeschwächt werden, wodurch das Rauschen im oberen Spektrum ebenfalls schwächer wird. In diesen Fällen wurde sich neben einer auditiven Beurteilung auch am Oszillogramm orientiert, in dem bei vorliegender glottaler Friktion meist ein Abfall in der Amplitude zu erkennen ist. Wenn im Sonagramm noch schwache Formantstrukturen erkennbar sind, so weist deren nicht klar definierte, sondern ausgefranste oder verwaschene Struktur ebenfalls auf glottale Friktion hin. Natürlich beschränkt sich die Problematik der zum Teil schwierigen Abgrenzung zwischen „nicht glottalisierter Junktur ohne glottale Friktion“ und (eventuell nur schwacher) „stimmhafter glottaler Friktion“ nicht auf / h/ vor gerundetem Vokal. Anhand des folgenden Beispiels (Jahre hinter) wird dies verdeutlicht und die getroffene Beurteilung begründet. Abbildung 10.12 zeigt die Phrase Jahre hinter gesprochen von Sprecher Fm03 in unverstellter Version. Im Oszillogramm ist im Vokalübergang ein gradueller Abfall in der Amplitude erkennbar (in der Abbildung durch einen Pfeil gekennzeichnet), bevor für den Nasal wieder ein Anstieg erfolgt. Ein Abfall in der Amplitude kann sowohl ein akustischer Hinweis auf Glottalisierung als auch auf glottale Friktion sein. Da die Dauer der einzelnen Schwingungsperioden bei 182 Time (s) 0 0.42 0 5000 Frequency (Hz) 0 0.1 0.2 0.3 0.4 Abbildung 10.12.: Jahre hinter in unverstellter Version gesprochen von Fm03 diesem Einbruch im Schalldruckverlauf nicht zunimmt, kann hier davon ausgegangen werden, dass es sich um eine Folge der akustischen Vorgänge beim Vokalübergang handelt und der Amplitudenabfall in diesem Fall kein Hinweis auf Glottalisierung ist. Dies bestätigt auch der auditive Eindruck. Die Formantstruktur im Vokalübergang wird zunehmend „verwaschen“, sodass von behauchter Stimmqualität ausgegangen werden kann. Dennoch scheint die Behauchung keine so prominente Rolle zu spielen, dass diese Realisierung als stimmhafte glottale Friktion bewertet werden sollte. Der auditive Eindruck ist hier das ausschlaggebende Maß für die Beurteilung, dass in diesem Fall die Vokaljunktur als „nicht glottalisiert und ohne glottale Friktion“ bewertet wurde. Abbildung 10.13 vergleicht für denselben Sprecher (Fm03) die unverstellte (links) mit der verstellten (rechts) Produktion von Jahre hinter. Abgebildet ist jeweils der Ausschnitt beginnend ab der Mitte des / r/ in Jahre bis kurz vor der Lösung des alveolaren Verschlusses von / t/ in hinter. In beiden Fällen ist die Junktur ohne Glottalisierung realisiert. Allerdings scheint die verstellte Version generell behauchter und v. a. der Nasal von glottaler Friktion überlagert zu sein. Aufgrund dieser generell vorliegenden behauchten Stimmqualität wurde auch in der verstellten Version die Entscheidung für die Kategorie „nicht glottalisierte Junktur ohne glottale Friktion“ getroffen. Der dynamische Bereich der Sonagramme beider Abbildungen (10.12 und 10.13) liegt bei 42,0 dB. 183 Time (s) 0 0.4499 0 5000 Frequency (Hz) 0 0.1 0.2 0.3 0.4 unverstellt verstellt Abbildung 10.13.: Ausschnitt aus Jahre hinter in unverstellter und verstellter Version gesprochen von Fm03 Die folgenden zwei Beispiele demonstrieren, dass glottale Friktion im Deutschen auch gemeinsam mit Glottalisierung auftreten kann und damit eine eindeutige Zuordnung zu einer der im Methodenteil genannten Kategorien erschwert wird. Abbildung 10.14 zeigt einen Ausschnit aus der Phrase moderne Hosen gesprochen von Sprecherin Ff09 in unverstellter Version. Der dargestellte Ausschnitt beginnt mit dem apikalen Nasal in moderne und endet etwa in der Mitte des / z/ in Hosen. Der dynamische Bereich des Sonagramms liegt bei 42,0 dB. Der Übergang vom finalen Vokal in moderne zu Hosen ist zunächst durch behauchte Stimmhaftigkeit ( [o¨] ) gekennzeichnet. Diese Behauchung, im Sonagramm am sich über das gesamte Frequenzspektrum erstreckende Rauschen und den ausgefransten Formanten erkennbar, ist am Anfang recht stark ausgeprägt und verringert sich dann allmählich. Nach ca. 100 ms tritt Glottalisierung ein - eine ca. 60 ms andauernde Phase, die akustisch durch verlängerte (ca. verdoppelte) Periodendauer und auditiv durch Knarrstimme gekennzeichnet ist, und anschließend in Modalstimme übergeht. Die Realisierung des / h/ in diesem Beispiel wurde als stimmhafte glottale Friktion gewertet: Vor allem weil stark behauchte Stimmhaftigkeit dominiert und Glottalisierung erst in der zweiten Hälfte des Vokals hinzukommt. Außerdem scheint Knarrstimme charakteristisch für diese Sprecherin zu sein, da sie in all ihren Textproduktionen verhältnismäßig häufig eine verknarrte Stimmqualität aufweist, sodass das Hinzutreten der Glottalisierung auch hierdurch erklärt werden kann. 184 n @ o o o o z Time (s) 0 0.3549 0 5000 Frequency (Hz) 0 0.1 0.2 0.3 Abbildung 10.14.: Behauchte Stimmhaftigkeit mit anschließender Glottalisierung in moderne Hosen (Ausschnitt) gesprochen von Ff09 (unverstellte Version) Ein weiteres Beispiel für gemeinsames Auftreten von Glottalisierung und glottaler Friktion ist in der Phrase Mann hat gesprochen von Sprecherin Ff10 (unverstellte Version) zu finden. Abbildung 10.15 zeigt einen Ausschnitt beginnend ab der Mitte des apikalen Nasals in Mann bis zum Beginn des Verschlusses von / t/ in hat (dynamischer Bereich des Sonagramms = 42,0 dB). Oszillogramm und Sonagramm zeigen deutlich, dass das Ende des apikalen Nasals glottalisiert realisiert wird, bis es schließlich zu einer glottalen Verschlussphase von fast 50 ms Dauer kommt. An diesen Glottalverschluss schließt sich ein zunächst glottalisierter Vokal an, der in seinem Verlauf zunehmend behauchter wird. Das bedeutet, dass in der ersten Phase des Vokals die Stimmlippenschwingung nach der glottalen Verschlussphase zunächst unregelmäßig beginnt und zeitlich mit einer glottalen Öffnungsgeste zusammenfällt. In der zweiten Hälfte des Vokals geht die Stimmqualität schließlich in Modalstimme über. Da sowohl glottalisierte Stimmgebung, stimmhafte glottale Friktion als auch Modalstimme vorliegen, war die Zuordnung dieses Beispiels zu einer bestimmten Kategorie problematisch. Außerdem kann weder ausgeschlossen noch begründet angenommen werden, dass ein Zögern Grund für die Glottalisierung ist. Daher wurde dieses Beispiel der Kategorie „andere Form“ zugeordnet. 185 nn P a a a t Time (s) 0 0.3207 0 5000 Frequency (Hz) 0 0.1 0.2 0.3 Abbildung 10.15.: Glottalisierung und anschließende stimmhafte glottale Friktion in Mann hat (Ausschnitt) gesprochen von Ff10 (unverstellte Version) Es sei noch ein letztes Beispiel für glottalisierte Behauchung in der unverstellten Textproduktion deutscher Muttersprachler genannt, um aufzuzeigen, dass auch die Position des glottalen Frikativs im Satz eine Rolle spielt. Sprecher Fm07 realisiert / h/ in der Phrase in Haft als glottalisierte Behauchung. Als Grund für die Glottalisierung kann angenommen werden, dass es sich hierbei um finale Knarrstimme handelt. Denn diese Phrase steht nicht nur final im Satz Das älteste Mitglied der Bande ist 74 und kommt für neun Jahre in Haft., sondern ist auch Ende des betreffenden Textabschnittes. Abbildung 10.16 stellt das geschilderte Beispiel dar (dynamischer Bereich des Sonagramms = 43,0 dB). Ergebnisse: Realisierung von / h/ in den verstellten Produktionen der deutschen Muttersprachler Die Analyse der Realisierung von / h/ in den Akzentimitationen ergab, dass die Mehrheit der deutschen Muttersprachler versucht, keine glottale Friktion zu realisieren. An ihre Stelle tritt in den meisten Fällen eine glottalisierte Vokaljunktur. Nicht glottalisierte Junkturen kommen dagegen selten vor. Insgesamt macht die Anzahl der glottalisierten Vokalübergänge mit 157 von 224 analysierten Tokens ca. 70 % der Realisierungen aus. Dahingegen wird eine glottale 186 I n a a f t Time (s) 0 0.437 0 5000 Frequency (Hz) 0 0.1 0.2 0.3 0.4 Abbildung 10.16.: Glottalisierte Behauchung in finaler Position in in Haft gesprochen von Fm07 (unverstellte Version) Friktion in nur knapp 23 % der Fälle und ein weicher Vokalübergang (nicht glottalisierte Junktur) in nur 4,5 % der Fälle realisiert. Tabelle 10.3 zeigt eine Übersicht über die verschiedenen Realisierungen des / h/ 2 pro Sprecher. Geht man bei der Betrachtung der in Tabelle 10.3 dargestellten Daten mehr ins Detail, so wird ersichtlich, dass sich die verschiedenen Realisierungsformen zum Teil recht unterschiedlich auf die Sprecher verteilen. Nur drei von 22 Sprechern (Ff09, Ff11, Ff14) realisieren auch in der verstellten Produktion die Mehrheit der untersuchten Tokens (8-11 von 11) mit einem glottalen Frikativ. Die verbleibenden 19 Sprecher realisieren stattdessen vorwiegend eine glottalisierte Vokaljunktur. Davon konnten fünf Sprecher in allen untersuchten Fällen glottale Friktion unterdrücken. Dies zeigt, dass manche Sprecher eine starke Präferenz in einer der Realisierungen aufweisen. Abbildung 10.17 zeigt anhand der Oszillogramme verschiedener Sprecher unterschiedliche Realisierungsformen des / h/ in der Phrase alle haben (verstellte Version). Dargestellt ist für die Sprecherinnen Ff02, Ff04, Ff10 und Ff09 jeweils ein Ausschnitt aus dieser Phrase beginnend mit der Mitte des auslautenden / @/ 2 An dieser Stelle muss angemerkt werden, dass die Formulierung „Realisierung des / h/ “ an den Stellen, an denen nachweislich keine glottale Friktion, sondern z. B. eine glottalisierte Vokaljunktur realisiert wird, ungeeignet ist. Denn obwohl es sich bei dem Phonem / h/ um eine abstrakte Einheit handelt, so repräsentiert sie doch eine Gruppe von phonetisch ähnlichen Lauten, deren Gemeinsamkeit glottale Friktion ist, die wiederum gerade in den Akzentimitationen produzierten glottalisierten Vokaljunkturen nicht vorliegt. Trotz dieses Widerspruchs wird im Folgenden mangels einer geeigneteren Formulierung an dieser festgehalten. 187 Tabelle 10.3.: Anzahl (N) der verschiedenen Realisierungen für / h/ pro Sprecher (glottalisierte J. = glottalisierte Junktur; nicht glott. J. = nicht glottalisierte Junktur; NA = nicht verfügbare Werte) N Glottale Friktion N glottalisierte J. N nicht glott. J. Andere Form NA Ff01 1 9 1 0 0 Ff02 2 7 0 2 0 Ff03 1 7 3 0 0 Ff04 1 9 0 0 1 Ff05 2 6 0 0 3 Ff06 2 8 1 0 0 Ff07 3 5 0 2 1 Ff08 1 10 0 0 0 Ff09 11 0 0 0 0 Ff10 0 10 1 0 0 Ff11 10 1 0 0 0 Ff12 1 8 0 0 2 Ff13 0 11 0 0 0 Ff14 8 2 0 0 1 Ff15 0 10 0 0 1 Fm01 1 7 0 0 3 Fm02 1 7 0 1 2 Fm03 1 7 1 0 2 Fm04 0 8 2 0 1 Fm05 3 7 0 0 1 Fm06 0 10 1 0 0 Fm07 2 8 0 1 0 Gesamt (= 242) 51 (22,8 %) 157 (70,1 %) 10 (4,5 %) 6 (2,7 %) 18 in alle bis zur Mitte des / a: / in haben. Die oberen drei Oszillogramme der Sprecherinnen Ff02, Ff04 und Ff10 lassen deutlich eine glottalisierte Vokaljunktur erkennen. Dabei liegt bei Ff10 eine glottale Verschlussphase vor, die ca. 100 ms andauert. Im Gegensatz dazu realisiert Sprecherin Ff09 in ihrer verstellten Textversion für / h/ einen stimmhaften glottalen Frikativ. Im Oszillogramm ist die Periodizität der Schwingungen noch deutlich erkennbar. Die in Tabelle 10.3 unter der Kategorie „Glottale Friktion“ dargestellten Daten umfassen sowohl stimmhafte als auch stimmlose Realisierungsformen. Wie im Methodenteil erläutert und an der Analyse der unverstellten Produktionen dargestellt, kann aufgrund des stimmhaften Kontexts davon ausgegangen werden, dass die Mehrheit der Fälle, in denen eine glottale Friktion realisiert wird, stimmhaft sein wird. Diese Annahme konnte durch die Analyse der verstellten Produktionen bestätigt werden: 44 der 51 Fälle glottaler Friktion wurden als stimmhafte glottale Friktion bewertet. Im Vergleich zu den unverstellten Pro- 188 0 0.1668 0 0.05 0.1 0.15 0 0.1866 0 0.05 0.1 0.15 0 0.2685 0 0.05 0.1 0.15 0.2 0.25 0 0.1662 0 0.05 0.1 0.15 Time (s) Ff02 Ff04 Ff10 Ff09 Abbildung 10.17.: Oszillogramme verschiedener Realisierungsformen des / h/ in alle haben (Ausschnitt) gesprochen von Ff02, Ff04, Ff10 und Ff09 (verstellte Version) duktionen der deutschen Muttersprachler, bei denen nur 4 % der Fälle glottaler Friktion als stimmlos bewertet wurden, hat sich damit die Anzahl der Fälle stimmloser glottaler Friktion in den Akzentimitationen auf 14 % erhöht. Die Unterscheidung, ob stimmhafte oder stimmlose glottale Friktion vorliegt, erweist sich in einigen Fällen als besonders schwierig. Auch das von Koenig et al. (2008) aufgestellte Kriterium, in dem die Dauer von zwei Schwingungsperioden zur Differenzierung herangezogen wird, erleichtert die Differenzierung in einigen Fällen nicht. Wie im Abschnitt zur Methode beschrieben, wurde zur Entscheidungsfindung eine visuelle Beurteilung hinzugezogen, ob im Oszillogramm noch Periodizität vorhanden ist und welche Phase (stimmlose oder stimmhafte glottale Friktion) in ihrer Dauer eindeutig überwiegt. Tabelle 10.4 stellt die Verteilung der stimmhaften und stimmlosen glottalen Friktion auf die deutschen Muttersprachler dar. 189 Tabelle 10.4.: Verteilung der stimmhaften (sth.) und stimmlosen (stl.) Realisierungen glottaler Friktion in den verstellten Produktionen deutscher Muttersprachler (ges. = gesamt) sth. stl. ges. sth. stl. ges. Ff01 1 0 1 Ff12 1 0 1 Ff02 2 0 2 Ff13 0 0 0 Ff03 1 0 1 Ff14 8 0 8 Ff04 1 0 1 Ff15 0 0 0 Ff05 1 1 2 Fm01 1 0 1 Ff06 2 0 2 Fm02 0 1 1 Ff07 3 0 3 Fm03 1 0 1 Ff08 1 0 1 Fm04 0 0 0 Ff09 9 2 11 Fm05 3 0 3 Ff10 0 0 0 Fm06 0 0 0 Ff11 7 3 10 Fm07 2 0 2 Gesamt = 51 (davon 44 stimmhaft und 7 stimmlos) Tabelle 10.5.: Anzahl (N) der verschiedenen Realisierungen für / h/ nach Tokens sortiert (glottalisierte J. = glottalisierte Junktur; nicht glott. J. = nicht glottalisierte Junktur; NA = nicht verfügbare Werte) N Glottale Friktion N glottalisierte J. N nicht glott. J. Andere Form NA zweihunderttausend 7 6 4 0 5 zur Haltestelle 3 16 0 1 2 langen Haft... 3 17 0 2 0 Jahre hinter 2 16 2 1 1 in Haft 3 17 1 1 0 neunzehnhundert... 7 9 2 0 4 eine halbe 6 15 1 0 0 Überfällen hatten 6 13 0 0 3 alle haben 3 17 0 1 1 moderne Hosen 3 18 0 0 1 Mann hat 8 13 0 0 1 Gesamt (= 242) 51 (22,8 %) 157 (70,1 %) 10 (4,5 %) 6 (2,7 %) 18 190 Eine Betrachtung der Realisierungsformen nach Tokens sortiert, wie in Tabelle 10.5 dargestellt, zeigt vor allem für zwei Tokens eine interessante Tendenz: Die höchste Anzahl an nicht verfügbaren Werten (NA) liegt für die Tokens zweihunderttausend und Neunzehnhundertsechsundachtzig vor. Das kann größtenteils auf die oben erwähnten Abweichungen vom Text (z. B. zweitausend und Neunzehnsechsundachtzig) zurückgeführt werden. Diese hohe Anzahl an Abweichungen, die eine Analyse der Realisierungsformen des / h/ verhindert, legt einen Ausschluss dieser Tokens aus der Analyse nahe. Auf der anderen Seite jedoch wurde in diesen Tokens im Vergleich zu anderen Tokens seltener eine glottalisierte Junktur und relativ häufig eine glottale Friktion realisiert. Die Anzahl der nicht glottalisierten Junkturen (weiche Vokalübergänge) scheint zumindest in zweihunderttausend ebenfalls leicht erhöht zu sein. Allerdings kann nur die geringe Anzahl an glottalisierten Junkturen durch den hohen Anteil der nicht verfügbaren Werte erklärt werden. Eine weitere mögliche Erklärung für diese vom allgemeinen Trend abweichende Realisierungsverteilung liegt in der Position des lexikalischen Akzents. Nur in den Fällen von zweihunderttausend und Neunzehnhundertsechsundachtzig liegt der lexikalische Akzent nicht auf der Silbe, in deren Onset / h/ steht. Außerdem sind dies auch die einzigen Tokens, in denen der glottale Frikativ nicht wortinitial steht. Es kann weiterhin nicht ausgeschlossen werden, dass auch die Wortart eine Rolle spielt, da beide Male ein Zahlwort vorliegt. Das vergleichsmäßig häufige Vorkommen einer nicht glottalisierten Junktur in zweihunderttausend ist vermutlich durch die unakzentuierte Silbe zu erklären, in der der glottale Frikativ steht. In Vokaljunkturen in unakzentuierten Silben sowie in Zahlwörtern (vermutlich ebenfalls aufgrund der „Nicht-Akzentuierung“) ist häufig weder ein glottaler Verschluss noch Glottalisierung zu finden (vgl. Kohler, 1994). Das bedeutet, dass auch in den Fällen, in denen der glottale Frikativ in der Verstellung erfolgreich unterdrückt wurde, durch fehlende Akzentuierung der Silbe ein weicher Vokalübergang erleichtert oder ermöglicht werden kann. Die hohe Anzahl der nicht verfügbaren Werte für diese Wörter sowie die Abweichungen in der Position des glottalen Frikativs und des lexikalischen Akzents können gute Gründe dafür sein, diese Tokens aus der Analyse und den weiteren Betrachtungen auszuschließen. Auch scheint die Schwierigkeit, behauchte Stimmhaftigkeit von stimmhafter glottaler Friktion zu unterscheiden, in diesen Fällen besonders hoch zu sein. Dennoch wurde hier auf den Ausschluss verzichtet, da anhand dieser Beispiele verdeutlicht werden konnte, dass Faktoren wie die Position des lexikalischen Akzents das Analyseergebnis beeinflussen können. Die folgenden Ausführungen beschreiben einzelne auffällige oder abweichende Realisierungsformen in den verstellten Versionen der deutschen Muttersprachler. Abbildung 10.18 zeigt einen Ausschnitt aus der Phrase langen Haftstrafen gesprochen von Sprecherin Ff02 in verstellter Version (dynamischer Bereich des Sonagramms = 44,0 dB). Abgebildet ist ein Ausschnitt von ca. der Mitte des dor- 191 salen Nasals [N] bis zu Beginn des Verschlusses von [t] . Im Sonagramm gut zu erkennen ist eine Phase stimmhafter glottaler Friktion bzw. ein behauchter nasalierter Vokal zentraler Vokalqualität ( [˜@ ¨] ), der sich direkt an den alveolaren Nasal in langen anschließt. Danach folgt eine glottale Verschlussphase von ca. 90 ms und ein glottalisierter Vokaleinsatz zu Beginn von Haft-, wobei ein schwach gerundeter hinterer untermittelhoher Vokal realisiert wird. Diese Form der Realisierung könnte als Fehler oder Inkonsistenz interpretiert werden. Die Sprecherin öffnet nach der Realisierung des Nasals den oralen Verschluss und gleichzeitig hebt sich das Velum. Die Stimmlippen, die noch schwingen, fallen mit einer glottalen Öffnungsgeste zusammen, sodass es zu stimmhafter glottaler Friktion kommt. An dieser Stelle würde sich in unverstelltem Deutsch der Vokal anschließen, d. h. die Stimmlippen würden sich wieder schließen oder einander annähern und weiter schwingen. In der verstellten Produktion jedoch scheint die Sprecherin bemerkt zu haben, dass sie die glottale Friktion für die Akzentimitation unterdrücken wollte, und bricht die glottale Friktion durch einen glottalen Verschluss ab. Nach ca. 90 ms setzt sie mit einem glottalisierten Vokaleinsatz fort. Eine alternative Erklärung für diese Realisierung ist, dass die Sprecherin versucht, die stereotypische Vorstellung zu realisieren, dass „im Französischen Wörter auf einen Vokal enden“. Das würde bedeuten, sie fügt dafür an den Nasal einen Vokal an und realisiert anschließend einen glottalisierten Vokaleinsatz anstelle des initialen glottalen Frikativs in Haftstrafen. Ein ähnliches Beispiel findet sich in alle haben gesprochen von Sprecher Fm07 in verstellter Version. Der auslautende Vokal in alle wird in seinem Verlauf zunehmend behaucht realisiert, was auf eine glottale Öffnungsgeste hinweist, bis zuletzt keine Stimmhaftigkeit mehr vorliegt. Es folgt eine glottale Verschlussphase von knapp 150 ms, nach der der Vokal [a: ] glottalisiert einsetzt. Abbildung 10.19 zeigt die Phrase alle haben gesprochen von Fm07 (dynamischer Bereich des Sonagramms = 43,0 dB). Neben diesen Formen, bei denen glottale Friktion einem glottalisierten Vokaleinsatz vorausgeht, kommt außerdem, wie auch für die unverstellten Versionen beschrieben, behauchte Glottalisierung vor. Abbildung 10.20 zeigt ein solches Beispiel (dynamischer Bereich des Sonagramms = 43,0 dB). Dargestellt ist ein Ausschnitt aus der Phrase Jahre hinter gesprochen von Sprecherin Ff07 in der verstellten Version. Der dargestellte Abschnitt beginnt ab ca. der Mitte des uvularen Frikativs in Jahre und geht bis zum Nasal in hinter. Die Vokaljunktur wird glottalisiert realisiert: nach dem Schwa erfolgt ein glottaler Verschluss, der jedoch nicht ganz vollständig realisiert wird und es schließt sich ein glottalisierter Vokaleinsatz an. Nach ca. vier unregelmäßigen glottalen Schwingungen tritt glottale Friktion hinzu. 192 N @ n @ ˜ P O f Time (s) 0 0.5059 0 5000 Frequency (Hz) 0 0.15 0.3 0.45 Abbildung 10.18.: Ausschnitt aus langen Haftstrafen gesprochen von Ff02 (verstellte Version) a l @@ h P a : b 9 n Time (s) 0 1.005 0 5000 Frequency (Hz) 0 0.15 0.3 0.45 0.6 0.75 0.9 Abbildung 10.19.: alle haben gesprochen von Fm07 (verstellte Version) 193 K @ P I I n Time (s) 0 0.3323 0 5000 Frequency (Hz) 0 0.1 0.2 0.3 Abbildung 10.20.: Behauchte Glottalisierung in Jahre hinter (Ausschnitt) gesprochen von Ff07 (verstellte Version) Es sei zusammenfassend wiederholt, dass die Mehrheit der deutschen Muttersprachler in den Akzentimitationen glottale Friktion vermeidet. An ihre Stelle tritt in den meisten Fällen (ca. 70 %) eine glottalisierte Vokaljunktur. Glottale Friktion hingegen wird in weniger als einem Viertel der Fälle realisiert und ist dann vorwiegend stimmhaft. Nicht glottalisierte Junkturen kommen, wie vermutet, ausgesprochen selten vor. Ergebnisse: Realisierung von / h/ in den deutschen Produktionen der französischen Muttersprachler Die für diese Studie aufgenommenen französischen Muttersprachler realisieren in ihren deutschen Produktionen in 35 von 44 Fällen glottale Friktion für / h/ . Bei Sprecher F-nm01 mussten fünf von elf Tokens von der Analyse ausgeschlossen werden, was bei dieser kleinen Sprechergruppe recht stark ins Gewicht fällt (insgesamt wurden sieben Tokens ausgeschlossen). Dennoch kann festgehalten werden, dass glottale Friktion bei allen Sprechern die häufigste Realisierungsform für / h/ ist. Von keinem der Sprecher wurde eine nicht-glottalisierte Vokaljunktur anstelle eines glottalen Frikativs realisiert. Eine glottalisierte Vokaljunktur kam nur in zwei von 44 Fällen vor. Tabelle 10.6 fasst die Anzahl der 194 Tabelle 10.6.: Anzahl (N) der verschiedenen Realisierungen für / h/ pro französischen Muttersprachler (glottalisierte / nicht glott. J. = glottalisierte / nicht glottalisierte Junktur; NA = nicht verfügbare Werte) N Glottale Friktion N glottalisierte J. N nicht glott. J. NA F-nf01 8 1 0 2 F-nf02 11 0 0 0 F-nm01 6 0 0 5 F-nm02 10 1 0 0 Gesamt (= 44) 35 2 0 7 verschiedenen Realisierungsformen des / h/ in den deutschen Produktionen der französischen Muttersprachler pro Sprecher zusammen. Ein Beispiel dafür, wie unterschiedlich die Realisierungen des / h/ in derselben Phrase sein können, findet sich in zur Haltestelle. Abbildung 10.21 zeigt an einem Ausschnitt drei unterschiedliche Realisierungen der französischen Muttersprachler. Der dargestellte Ausschnitt beginnt mit der Lösung des Plosivs in der Affrikate / ts/ und dauert bis zum apikalen Verschluss des / t/ in Halte- (dynamischer Bereich des Sonagramms = 44,0 dB); die Pfeile markieren jeweils den Abschnitt des glottalen Reflexes bei der Realisierung von / h/ . Links in der Abbildung ist die glottalisierte Vokaljunktur produziert von Sprecherin Fnf01 dargestellt, die insofern eine für diese Sprechergruppe untypische Realisierungsform darstellt, da im analysierten Material insgesamt nur zwei Fälle einer glottalisierten Junktur vorkommen. Die beiden anderen Ausschnitte zeigen Formen glottaler Friktion. Sprecherin F-nf02 (Mitte) realisiert stimmhafte glottale Friktion. Im Sonagramm ist ein durchgehender Stimmbalken erkennbar und der Schwingungsverlauf im Oszillogramm ist periodisch. Die ausgefransten Formantstrukturen im Sonagramm weisen auf die glottale Friktion hin und auch auditiv kann die starke Behauchung festgestellt werden. Sprecher Fnm02 (rechts) produziert ebenfalls glottale Friktion, allerdings dominiert hier eine Phase glottaler Friktion ohne Stimmbeteiligung. Zunächst fällt die Realisierung des Vokals in zur mit einer glottalen Öffnungsgeste zusammen. Es kann nicht eindeutig ausgeschlossen werden, dass zur Realisierung des postvokalischen / r/ außerdem noch leichte postvelare oder uvulare Friktion hinzukommt. Sowohl auditiv als auch über die visuelle Überprüfung des Sonagramms ist verrauschte Stimmhaftigkeit feststellbar. Die Stimmhaftigkeit lässt im Verlauf dieser Friktion soweit nach, bis es zu einer ca. 40 ms dauernden Phase stimmloser glottaler Friktion kommt. Danach setzt die Stimmlippenschwingung wieder ein und der folgende Vokal beginnt behaucht stimmhaft, bis die Behauchung allmählich wieder nachlässt. Insgesamt ist die Phase der glottalen Friktion bei diesem Sprecher mit knapp 130 ms und zusätzlich vorausgehender und nachfolgender behauchter Stimmhaftigkeit in den Vokalen vergleichsweise lang. 195 Time (s) 0 1.089 0 5000 Frequency (Hz) 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 F-nf01 F-nf02 F-nm02 Abbildung 10.21.: Unterschiedliche Realisierungsformen des / h/ in zur Haltestelle (Ausschnitt) gesprochen von französischen Muttersprachlern Obwohl die Nicht-Realisierung des initialen glottalen Frikativs im Deutschen aufgrund des französischen Phonemsystems eine mögliche Interferenzerscheinung französischer Muttersprachler ist, zeigen die hier untersuchten französischen Muttersprachler diese Abweichung vom akzentfreien Deutschen kaum. Dies lässt darauf schließen, dass der glottale Frikativ recht gut erworben wurde. Allerdings unterscheidet sich die produzierte glottale Friktion der französischen Muttersprachler im Deutschen zum Teil von den Realisierungen der deutschen Muttersprachler in ihren unverstellten Textproduktionen. Während die deutschen Muttersprachler vorwiegend stimmhafte glottale Friktion realisieren, so ist das Verhältnis von stimmhafter und stimmloser glottaler Friktion in den deutschen Produktionen der französischen Muttersprachler ausgewogener. Dabei scheinen manche der Sprecher spezifische Präferenzen zu haben: während Sprecher F-nm01 fast ausschließlich stimmlose glottale Friktion realisiert, ist bei Sprecher F-nm02 genau das Umgekehrte der Fall und er produziert fast ausschließlich stimmhafte glottale Friktion. Die beiden Sprecherinnen scheinen etwas inkonsistenter in ihren Realisierungen zu sein, obwohl auch hier Tendenzen erkennbar sind: F-nf01 zeigt mehr stimmhafte und F-nf02 mehr stimmlose Realisierungen. Wie oben bereits besprochen, ist die eindeutige Zuordnung zu den Kategorien „stimmhaft“ oder „stimmlos“ meist kompli- 196 ziert, da häufig auch Mischformen vorliegen. Bei Sprecher F-nm01 findet man beispielsweise vor der stimmlosen glottalen Friktion jeweils eine Phase deutlich behauchter Stimmhaftigkeit, wohingegen bei Sprecherin F-nf02 diese Phase sehr kurz ist. Abbildung 10.22 demonstriert die unterschiedlich langen Phasen behauchter Stimmhaftigkeit, die stimmloser glottaler Friktion vorausgehen können, und zeigt für die Sprecher F-nm01 (oben) und F-nf02 (unten) je einen Ausschnitt aus in Haft ((a) links oben), Mann hat ((b) rechts oben), Überfällen hatten ((c) links unten) und langen Haftstrafen ((d) rechts unten). Die Ausschnitte beginnen jeweils etwa in der Mitte des Nasals und dauern bis zur Mitte des / a/ an. Der dynamische Bereich der Sonagramme ist 42,0 dB. Bei den Produktionen von F-nm01 (oben) folgt nach dem Nasal eine Phase deutlich behauchter Stimmhaftigkeit, die sowohl durch periodischen Schwingungsverlauf im Oszillogramm als auch durch einen Stimmbalken im Sonagramm sichtbar ist, wobei die Formantstrukturen jedoch durch das Rauschen fast nicht mehr erkennbar sind. Nach 50- 60 ms behauchter Stimmhaftigkeit endet diese und stimmlose glottale Friktion liegt vor. Bei Sprecherin F-nf02 (unten) ist die Phase, in der sich Stimmhaftigkeit und glottale Öffnungsgeste überschneiden, deutlich geringer und dauert nur ca. 3-5 Schwingungsperioden an. Die Pfeile kennzeichnen jeweils die Phasen glottaler Friktion ohne Stimmhaftigkeit und geben deren gerundete Dauer an. Der höhere Anteil an stimmloser glottaler Friktion in den deutschen Produktionen der französischen Muttersprachler im Vergleich zu den unverstellten Produktionen deutscher Muttersprachler deutet darauf hin, dass glottale Friktion als Merkmal zwar erworben wurde, jedoch die praktische Umsetzung nicht in allen Fällen erfolgreich ist: Ein übliches koartikulatorisches Muster des Deutschen (stimmhafte Behauchung bei stimmhaftem Kontext), dem die Überlappung einer glottalen Öffnungsgeste mit glottaler Schwingung zugrunde liegt, wird nicht produziert. Die Ursache dafür, dass dieses übliche koartikulatorische Muster nicht umgesetzt wird, kann in der isolierten Übung glottaler Friktion und unzureichenden Realisierungsanweisungen im Ausspracheunterricht liegen. Koenig et al. (2008) zeigen, dass der Sprecher ihrer Studie in der Lage ist, die Stimmbeteiligung während glottaler Friktion gezielt zu variieren (d. h. in diesem Fall zu entstimmen), und dazu systematisch verschiedenartige Veränderungen vornimmt, wie z. B. stärkere Abduktion der Stimmlippen, Verringerung des subglottalen Drucks, stärkere Längsspannung der Stimmlippen. Allerdings schränken sie ein, dass zum einen ein Zusammenhang mit phonetischer Expertise und intensivem Stimmtraining des Sprechers bestehen kann. Zum anderen würden Vergleiche mit anderen Sprechern darauf hindeuten, dass Sprecher sich in den individuellen Strategien zur (Nicht-)Aufrechterhaltung von Stimmhaftigkeit stark unterscheiden und dass bei einigen die Anzahl an Strategien stark eingeschränkt ist. Für ihre vorgenommene Sprecherauswahl argumentieren Koenig et al. (2008), dass ein phonetisch naiver englischer Muttersprachler, 197 Time (s) 0 0.4573 0 5000 Frequency (Hz) 0 0.1 0.2 0.3 0.4 (a) (b) Time (s) 0 0.4365 0 5000 Frequency (Hz) 0 0.1 0.2 0.3 0.4 (c) (d) F-nm01 F-nf02 30 ms 80 ms 100 ms 100 ms Abbildung 10.22.: Stimmlose glottale Friktion mit unterschiedlich langen Phasen vorausgehender behauchter Stimmhaftigkeit in den Produktionen (Ausschnitte) von in Haft (a) und Mann hat (b) gesprochen von F-nm01 und Überfällen hatten (c) und langen Haftstrafen (d) gesprochen von F-nf02 198 Tabelle 10.7.: Verteilung der stimmhaften (sth.) und stimmlosen (stl.) Realisierung glottaler Friktion in den deutschen Produktionen französischer Muttersprachler (ges. = gesamt) sth. stl. ges. F-nf01 6 2 8 F-nf02 4 7 11 F-nm01 1 5 6 F-nm02 9 1 10 Gesamt 20 15 35 nicht in der Lage sei, Stimmhaftigkeit in / h/ gezielt zu variieren, da die Stimmbeteiligung im Englischen hier nicht distinktiv ist. Unter diesem Gesichtspunkt scheint die fehlende Stimmbeteiligung in den deutschen Produktionen der französischen Muttersprachler dieser Studie ebenfalls nicht zu überraschen, zumal das französische Phonemsystem kein / h/ aufweist. Tabelle 10.7 zeigt die Verteilung der stimmhaften und stimmlosen glottalen Friktion pro französischem Muttersprachler. Um aufzuzeigen, welche Besonderheiten bei der Realisierung des / h/ in den deutschen Produktionen französischer Muttersprachler auftreten können, werden im Folgenden einige auffällige Realisierungsformen näher beschrieben und diskutiert. Die Produktionen von Sprecher F-nm01 sind besonders interessant. Von elf Tokens wurden sechs mit glottaler Friktion realisiert, fünf davon ohne Stimmbeteiligung. Fünf Tokens des Sprechers mussten von der Analyse ausgeschlossen werden. Die Lesekompetenz dieses Sprechers ist im Deutschen relativ schlecht, sodass ein Grund für den Ausschluss Versprecher bzw. Abbrüche waren. Außerdem mussten zwei Tokens (Jahre hinter, Überfällen hatten) wegen vorausgehender Atmung ausgeschlossen werden. Dies ist dahingehend interessant, dass sich vermuten lässt, dass der Sprecher vor der Realisierung des glottalen Frikativs noch einmal „Luft holen“ wollte und damit gewissermaßen Anlauf für das Folgende nimmt. Eine Abweichung vom Text im Token Neunzehnhundertsechsundachtzig (realisiert als Neunzehnsechsundachtzig) führte ebenfalls zu einem Ausschluss des Tokens. Allerdings zeigen die ausgeschlossenen Tokens des Sprechers F-nm01 interessante Muster, die vermuten lassen, dass hinter ihnen eine Unsicherheit in der Produktion eines in einen stimmhaften Kontext eingebetteten glottalen Frikativs steht. Als Beispiel dafür wurde bereits die dem / h/ vorausgehende Atmung genannt und weitere Auffälligkeiten werden im Folgenden dokumentiert. Im Fall der Phrase Jahre hinter fällt nicht nur die dem / h/ vorausgehende Atmung, sondern auch die Qualität des produzierten stimmlosen Frikativs auf. 199 Anstelle einer glottalen Friktion realisiert der Sprecher zusätzlich noch eine palatale Friktion. Das Dorsum ist bereits in der Position für den folgenden vorderen hohen Vokal, der in seiner Qualität geschlossener als das für das Standarddeutsche angenommene [I] ist. Die Ausatmungsluft wird mit relativ großem Druck abgegeben, was an den gebildeten Engen - glottal und palatal - zu Turbulenzen und Friktionsrauschen führt. Nicht nur auditiv ist die palatale Friktion durch eine hellere Färbung des Rauschens erkennbar. Auch akustisch unterscheidet sich diese Realisation von den anderen Realisationen des / h/ dieses Sprechers. Das Friktionsrauschen beginnt erst über 2000 Hz, dabei ist F3 stark angeregt und liegt bei etwa 3000 Hz. Der untere Frequenzbereich ist frei. Bei glottaler Friktion hingegen wird auch der untere Frequenzbereich ausgenutzt. In zweihunderttausend findet sich bei demselben Sprecher (F-nm01) ein ähnliches Beispiel für eine Friktion, die nicht nur glottal erzeugt wird, sondern bei der an einer oralen Enge zusätzliche Turbulenzen entstehen. Die Artikulationsstelle scheint sich dabei während der Friktion zu ändern. Zunächst wird die Friktionsenge prävelar gebildet, am Ende des Frikativs scheint jedoch eine labiale Enge zu dominieren, was auf die frühzeitig einsetzende Vorstülpung und starke Rundung der Lippen für den Vokal [Ufi] zurückgeführt werden kann. Auditiv ist die bilabiale Friktion deutlich wahrnehmbar. Der Übergang von einer hellen ungerundeten Qualität im Diphthong hin zu einer gerundeten dorsovelaren Qualität ist akustisch durch einen stark angeregten zweiten Formanten im Frikativ geprägt. Auch in diesem Beispiel liegt keine Stimmbeteiligung vor. Abbildung 10.23 stellt die beschriebene supraglottale Friktion des Sprechers Fnm01 an zwei Ausschnitten dar. Im Abschnitt (a) ist ein Ausschnitt aus Jahre hinter dargestellt. Der Ausschnitt beginnt erst kurz vor der Friktion, da vorher eine Einatmung erfolgt, und dauert bis zum Ende des Nasals. Abschnitt (b) zeigt einen Ausschnitt aus zweihunderttausend, der ab ca. der Mitte des Diphthongs beginnt und bis zum Ende des ersten Nasals dauert. Die Sonagramme sind mit einem dynamischen Bereich von 40.0 dB dargestellt. Die Bandbreite des Sonagramms wurde etwas reduziert, indem die Länge des Analysefensters auf 7,5 ms festgelegt wurde. In Ausschnitt (a) (hinter) weist die starke Ausprägung von F3 bei 3000 Hz auf palatale Friktion hin, während in Ausschnitt (b) (-hundert-) die starke Ausprägung von F2 auf dorso-velare Friktion hindeutet. Der Sprecher scheint durch eine zusätzliche orale Engebildung noch mehr Turbulenzen zu erzeugen, die zu einem Reibegeräusch führen. Damit erreicht er, dass er für / h/ eine deutlich wahrnehmbare Friktion realisiert. Beide Erscheinungen decken sich mit den in Stevens (1998) beschriebenen Mustern, die Folge einer supraglottalen Engebildung während der Produktion von / h/ sind, und besonders häufig dann auftreten, wenn im folgenden Kontext hohe Vokale oder tiefe hintere Vokale stehen. Sobald eine Enge oberhalb der Glottis gebildet wird, erhöht sich das supraglottale Friktionsrauschen und gleichzeitig nimmt das glottal erzeugte Friktionsrauschen durch eine Reduktion des transglottalen 200 Time (s) 0 0.5368 0 5000 Frequency (Hz) 0 0.1 0.2 0.3 0.4 0.5 (a) (b) Abbildung 10.23.: Supraglottale Friktion bei Sprecher F-nm01 in den Phrasen Jahre hinter (a) und zweihunderttausend (b) Luftstroms ab. Das hinzugetretene supraglottale Friktionsrauschen kann dabei das Spektrum des Frikativs in den Frequenzbereichen dominieren, die mit den Resonanzen der oralen Engebildung korrespondieren (vgl. Stevens, 1998, S. 441-446). In der oben besprochenen Abbildung 10.21, die drei Ausschnitte aus zur Haltestelle gesprochen von französischen Muttersprachlern zeigt, fehlt die Produktion von F-nm01. Grund dafür ist, dass die Produktion von F-nm01 aufgrund eines Abbruches nach dem Lateralapproximanten in Haltestelle von der Analyse ausgeschlossen wurde. Dennoch sei dieser Fall hier kurz beschrieben und in Abbildung 10.24 dargestellt, da er eine von den üblichen Formen abweichende Realisierung zeigt. Der Sprecher realisiert zunächst eine stimmhafte glottale Friktion, bricht dann aber beim Lateralapproximanten ab. Direkt danach setzt er mit Haltestelle erneut ein, wobei er dieses Mal eine stimmlose glottale Friktion realisiert, die ca. 140 ms andauert. Es kann spekuliert werden, dass der Sprecher eine Unsicherheit in der Realisierung der glottalen Friktion zeigt: möglicherweise zweifelt er an der Angemessenheit seiner Realisierung, bricht aus diesem Grund ab und setzt erneut mit einer glottalen Friktion - dieses Mal ohne Stimmbeteiligung - ein. Das in Abbildung 10.24 dargestellte Sonagramm umfasst einem dynamischen Bereich von 44,0 dB. 201 0 5000 Frequency (Hz) ts u u a a l h a l Abbruch und Neueinsatz Time (s) 0 0.6606 0 0.1 0.2 0.3 0.4 0.5 0.6 Abbildung 10.24.: Realisierung des / h/ in zur Haltestelle (Ausschnitt) gesprochen von F-nm01 Obwohl eine glottalisierte Vokaljunktur anstelle glottaler Friktion in den Produktionen der französischen Muttersprachler mit zwei Fällen nur ausgesprochen selten vorkam, soll mit Abbildung 10.25 ein Beispiel für das mögliche Vorkommen von Glottalisierung gezeigt werden. Die Abbildung zeigt zum Vergleich je ein Beispiel für eine glottalisierte Vokaljunktur anstelle glottaler Friktion sowie für glottale Friktion in Kombination mit Glottalisierung. In der Phrase langen Haftstrafen realisiert Sprecher F-nm01 (links) zwar einen stimmlosen glottalen Frikativ, aber vor und nach diesem glottalisiert er die Vokale. Da hier noch glottale Friktion vorhanden ist, wurde diese Realisierung nicht als glottalisierte Junktur, sondern als stimmlose glottale Friktion gewertet. Sprecher F-nm02 (rechts) zeigt an dieser Stelle keine glottale Friktion, sondern nur eine glottalisierte Vokaljunktur. Diese Realisierung ist vergleichbar mit den glottalisierten Realisierungen, die in den verstellten Produktionen der deutschen Muttersprachler zu finden sind. Die abgebildeten Sonagramme sind mit einem dynamischen Bereich von 44,0 dB dargestellt. Anhand eines Beispiels der Sprecherin F-nf01 kann gezeigt werden, dass trotz ihrer hohen L2-Kompetenz Fehler auftreten, die darauf hindeuten, dass sie eine Nicht-Muttersprachlerin des Deutschen ist. Wie oben gezeigt, realisiert die Sprecherin in Vokaljunkturen in zwölf von 13 Fällen eine glottalisierte Junktur und produziert außerdem in acht von elf Fällen mit initialem / h/ glottale 202 Time (s) 0 0.6363 0 5000 Frequency (Hz) 0 0.1 0.2 0.3 0.4 0.5 0.6 F-nm01 F-nm02 Abbildung 10.25.: langen Haftstrafen (Ausschnitt) gesprochen von F-nm01 und F-nm02 Friktion. Dies zeugt davon, dass die Sprecherin sich der Unterschiede glottaler Aktivität im Silbenanlaut im Deutschen gegenüber dem Französischen bewusst ist und die für das Deutsche übliche Realisierung recht gut umsetzen kann. Allerdings scheint ihr diese Umsetzung in der Phrase erwartete erhöhte (Text 2) nicht zu gelingen und sie vermischt die Formen glottaler Aktivität im Deutschen. Abbildung 10.26 stellt dieses Beispiel dar (dynamischer Bereich des Sonagramms = 43,0 dB). Der obere Teil der Abbildung zeigt die Phrase erwartete erhöhte (Gleichzeitig ist die mit der Einführung des Euro erwartete erhöhte Kriminalität ausgeblieben.) beginnend ab ca. der Mitte der glottalisierten Junktur zwischen Euro und erwartete bis zu Beginn des dorsalen Verschlusses von Kriminalität. Der untere Teil der Abbildung zeigt einen Ausschnitt aus der oberen Abbildung (markierter Bereich), der kurz vor der Verschlusslösung des zweiten apikalen Plosivs in erwartete beginnt und mit dem dorsalen Verschluss von Kriminalität endet. Während die erste Vokaljunktur (Euro erwartete) noch glottalisiert und damit den deutschen Mustern konform realisiert wird, weicht die Realisierung der zweiten Vokaljunktur (erwartete erhöhte) von diesen ab: Statt einer glottalisierten Junktur mit folgender glottaler Friktion (z. B. [-t@ PE5“Hø: t@] oder [-t@ 5˜Hø: t@] ) realisiert die Sprecherin in der Junktur stimmhafte glottale Friktion bzw. behauchte Stimmhaftigkeit, der sich eine kurze Phase stimmloser postvelarer-uvularer Friktion anschließt. Eine glottale Friktion folgt nicht, sondern es schließt sich ein vorderer obermittelhoher gerundeter Vokal an ( [-t@@ ¨E ¨5¨“ K ˚ø: t@] ). 203 Frequency (Hz) 0 5000 v v a t t ø: t Time (s) 0 1.077 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Time (s) 0 0.5807 0 5000 Frequency (Hz) 0 0.1 0.2 0.3 0.4 0.5 Abbildung 10.26.: erwartete erhöhte gesprochen von F-nf01 204 Anhand verschiedener Beispiele konnte gezeigt werden, dass sich die Realisierungen französischer Muttersprachler - trotz des anscheinend erfolgreichen Erwerbs glottaler Friktion für / h/ im Deutschen - von den muttersprachlichen deutschen Realisierungen im Detail unterscheiden. Merkmale glottaler Friktion realisiert von französischen Muttersprachlern können z. B. eine Reduktion oder der Verlust von Stimmbeteiligung während der Friktionsphase oder eine zusätzliche orale Engebildung zur Erzeugung supraglottaler Friktion sein. 10.2.3. Zusammenfassung Wie bereits im Abschnitt zur Methode angeführt, konnten vor allem in den unverstellten Textproduktionen der deutschen Muttersprachler einige Tokens bei der Analyse nicht berücksichtigt werden, u. a. aufgrund von Abweichungen im Text, aber auch weil die Sprecher zum Teil so stark reduzierten, dass eine Analyse zum möglichen Vorhandensein glottaler Friktion ausgeschlossen war. Am häufigsten betroffen von einer solch starken Reduzierung und damit vom Ausschluss aus der Analyse waren die Tokens Neunzehnhundertsechsundachtzig und zweihunderttausend. Oft ist die Abgrenzung zwischen einem vorliegenden nicht glottalisierten Vokaleinsatz ohne glottale Friktion auf der einen Seite und starker Reduktion, die zu einem Ausschluss des entsprechenden Tokens führt, oder behauchter Stimmhaftigkeit auf der anderen Seite nur sehr schwer zu treffen. Mögliche Realisierungsformen sind auch stark reduzierte Versionen, die jedoch insgesamt mit Behauchung überlagert sind und ebenfalls eine Bewertung erschweren. Eine ähnliche Problematik ergab sich auch für die verstellten Textversionen der deutschen Muttersprachler. Auch hier waren Neunzehnhundertsechsundachtzig und zweihunderttausend die Tokens, die am häufigsten von der Analyse ausgeschlossen wurden. Außerdem wurden, wie bereits im Abschnitt zu Analyseergebnissen der verstellten Textproduktionen diskutiert, in diesen Tokens von den Sprechern vergleichsweise selten eine glottalisierte Junktur und relativ häufig eine glottale Friktion realisiert. Mögliche Gründe dafür sind die Position des lexikalischen Akzents, der in diesen beiden Fällen nicht auf der Silbe mit initialem / h/ liegt, sowie die nicht wortinitiale Position des glottalen Frikativs. Vor allem die hohe Anzahl an für die Analyse nicht verfügbaren Werten sowie die genannten Schwierigkeiten in der Beurteilung der Realisierungen legen nahe, Tokens wie Neunzehnhundertsechsundachtzig und zweihunderttausend von den Betrachtungen auszuschließen. Auf der anderen Seite konnte durch den Nicht-Ausschluss gezeigt werden, dass Faktoren wie die Position des lexikalischen Akzents das Analyseergebnis beeinflussen können. Außerdem zeigt ein Vergleich mit den deutschen Produktionen französischer Muttersprachler, dass diese weniger häufig solche Reduktionen vornehmen oder die vorgenommenen Reduktionen nicht so stark in ihrem Ausmaß sind, da hier nur zwei Fälle aufgrund von Textabweichungen, jedoch kein Fall aufgrund einer zu starken Reduktion von der Analyse ausgeschlossen werden mussten. 205 Zusammenfassend lässt sich festhalten, dass die deutschen Muttersprachler in ihren unverstellten Textproduktionen für / h/ wie zu erwarten fast ausschließlich stimmhafte glottale Friktion realisieren. In den Imitationen eines französischen Akzents vermeidet die Mehrheit der deutschen Muttersprachler glottale Friktion und fünf der Sprecher waren in der Lage, glottale Friktion konsistent zu vermeiden. Nur in weniger als einem Viertel der Fälle realisieren die Sprecher auch in der Akzentimitation weiterhin glottale Friktion. Die Vermutung, dass in den Fällen einer erreichten Abwesenheit glottaler Friktion stattdessen ein glottalisierter Vokaleinsatz realisiert wird, konnte durch die Analysen bestätigt werden: In 70 % der Fälle treten anstelle glottaler Friktion glottalisierte Vokaljunkturen auf. Nicht glottalisierte Junkturen kommen hingegen nur in Ausnahmefällen vor. Dem gegenüber stehen die Realisierungen der französischen Muttersprachler in ihren deutschen Produktionen. Die Anzahl der glottalisierten Vokaljunkturen fällt ausgesprochen gering aus. Weiche Vokalübergänge (Junkturen ohne glottale Friktion oder Glottalisierung) kommen im untersuchten Material überhaupt nicht vor. Stattdessen realisieren die französischen Muttersprachler mit einer deutlichen Mehrheit glottale Friktion, was zu dem Schluss führt, dass es sich hierbei um ein Muster handelt, das gut erworben wird. Allerdings unterscheiden sich ihre Realisierungen v. a. durch einen deutlich höheren Anteil an stimmloser glottaler Friktion von den unverstellten Realisierungen deutscher Muttersprachler. Ursache hierfür kann ein isoliertes Einüben glottaler Friktion unter Nicht-Beachtung koartikulatorischer Prozesse sein. Interessant ist dabei, dass selbst die aus dem Elsass stammende Sprecherin F-nf02 trotz ihrer hohen Kompetenz im Deutschen mehr Fälle stimmloser glottaler Friktion (N=7) aufweist als Fälle stimmhafter glottaler Friktion (N=4) und in diesem Merkmal deutlich inkonsistent ist. Diese Ergebnisse führen zu folgenden Schlussfolgerungen: Deutsche Muttersprachler sind sich mehrheitlich bewusst, dass das Nicht-Vorhandensein glottaler Friktion eine mögliche Interferenzerscheinung französischer Muttersprachler im Deutschen ist. Außerdem ist die Mehrheit der deutschen Muttersprachler auch in der Lage, glottale Friktion zu unterdrücken - einige von ihnen erreichen eine konsistente Vermeidung glottaler Friktion. Eine glottalisierte Vokaljunktur, die in den meisten Fällen an die Stelle glottaler Friktion tritt, scheint jedoch weniger reale französische Akzente als vielmehr eine stereotypische Vorstellung dieser widerzuspiegeln. Schließlich realisieren die analysierten französischen Muttersprachler bis auf wenige Ausnahmen fast ausschließlich glottale Friktion, die sich v. a. im Merkmal Stimmbeteiligung während der Friktionsphase, aber zum Teil auch durch zusätzliche orale Engebildung zur Erzeugung supraglottaler Friktion von den unverstellten Produktionen der deutschen Muttersprachler unterscheidet. Dies spricht für einen nur bedingt erfolgreichen Erwerb des Merkmals glottaler Friktion in der Fremdsprache Deutsch. Obwohl sich in den Akzentimitationen der deutschen Muttersprachler der relative An- 206 teil an stimmloser glottaler Friktion im Vergleich zu ihren unverstellten Textproduktionen erhöht hat, so liegt er immer noch deutlich unter dem Anteil stimmloser glottaler Friktion in den deutschen Produktionen der französischen Muttersprachler. Die Ergebnisse sprechen dafür, dass ein hoher Anteil an stimmloser glottaler Friktion ein Indikator für einen vorliegenden authentischen französischen Akzent sein kann, während ein hoher Anteil an glottalisierten Vokaljunkturen für / h/ auf einen imitierten französischen Akzent hindeutet. Diese Ergebnisse zeugen davon, dass Variation auf glottaler Ebene möglich ist. Sie ist jedoch komplex und daher ist die authentische Umsetzung bei der Imitation eines fremdsprachigen Akzents ebenso schwierig wie die muttersprachsnahe Umsetzung beim Fremdsprachenerwerb. 10.3. Zusammenfassung und Diskussion Deutsch und Französisch unterscheiden sich in ihren glottalen Strategien im Silbenanlaut. So werden im Deutschen vokalisch anlautende Silben mit einer Form von Glottalisierung realisiert. Außerdem existiert im deutschen Phonemsystem ein Phonem / h/ , das intervokalisch als meist stimmhafte glottale Friktion realisiert wird, die sich in ihrer Qualität den umgebenden Lauten angleicht. Im Französischen hingegen werden vokalisch anlautende Silben oder Vokalübergänge in der Regel nicht durch einen glottalen Reflex markiert und es existiert kein Phonem / h/ . Glottalisierung in Vokaljunkturen und glottale Friktion können im Französischen jedoch in emphatischen Ausdrücken ebenfalls auftreten (vgl. Léon, 2005). Erwartbare Interferenzerscheinungen im Deutschen sind fehlende glottale Friktion und Glottalisierung im Silbenanlaut. Während die mutmaßliche Nicht-Realisierung glottaler Friktion zu den bekanntesten Charakteristika eines französischen Akzents im Deutschen gehört, ist die möglicherweise abweichende Realisierung des vokalischen Anlauts vermutlich weniger bekannt. Ziel der Untersuchung war, zu ermitteln, ob deutsche Muttersprachler bei der Imitation eines französischen Akzents von ihrer üblichen glottalen Strategie im Silbenanlaut abweichen und welche Variationen sie gegebenenfalls dabei vornehmen. Außerdem wurden die deutschen (und französischen) Produktionen der französischen Muttersprachler auf diese Merkmale hin untersucht und somit eine Basis für einen Vergleich zu den unverstellten und verstellten Produktionen der deutschen Muttersprachler geschaffen. Um einen guten Vergleich zwischen den glottalen Strategien zu ermöglichen, die im deutschen Silbenanlaut eingesetzt werden, wurde ein Kontext gewählt, in dem sowohl glottale Friktion als auch Glottalisierung zuverlässig festgestellt werden kann: (1) betonter initialer Vokal, der auf einen Vokal, Nasal oder Lateral folgt sowie (2) in stimmhafter Umgebung stehendes / h/ . 207 Die deutschen Muttersprachler dieser Studie realisieren in ihren unverstellten Produktionen wie zu erwarten fast ausschließlich glottalisierte Vokaleinsätze. In ihren Akzentimitationen erhöht sich die Zahl der nicht-glottalisierten Vokaleinsätze nicht signifikant. Sowohl innerhalb der unverstellten Produktionen der Sprechergruppe als auch innerhalb der unverstellten Produktion eines einzelnen Sprechers variiert die akustische Ausprägung der Glottalisierung stark. Dies zeigt, dass auch in den unverstellten Produktionen der deutschen Sprecher keine Konsistenz in der glottalen Strategie im vokalischen Silbenanlaut erwartet werden kann. Es muss aber einschränkend hinzugefügt werden, dass es für manche Sprecher stärkere Präferenzen zu einer bestimmten Realisierungsform gibt als für andere. Die französischen Muttersprachler weichen in ihrer glottalen Strategie im vokalischen Silbenanlaut von ihren französischen Produktionen ab und realisieren in den deutschen Produktionen mehrheitlich glottalisierte Vokaljunkturen. Das zeigt, dass sie das Muster einer glottalisierten Vokaljunktur bereits erfolgreich erworben haben. Allerdings liegt der Anteil an nichtglottalisierten Junkturen in ihrer Gruppe höher als in den Akzentimitationen der deutschen Muttersprachler. Da auch die französischen Muttersprachler in den Realisierungen der Vokaljunkturen nicht konsistent sind, kann Konsistenz in diesem Merkmal nicht als hinreichendes Kriterium für die Authentizitätsbeurteilung eines französischen Akzents gelten. Im Fall der Realisierung von / h/ fällt auf, dass die Mehrheit der deutschen Muttersprachler in der Akzentimitation versucht, glottale Friktion zu unterdrücken. An ihrer Stelle realisieren sie vorwiegend glottalisierte Vokaljunkturen. Das zeigt das bei den deutschen Muttersprachlern vorhandene Bewusstsein für eine mögliche Interferenzerscheinung französischer Muttersprachler im Deutschen und gleichzeitig ihre Fähigkeit, ihre übliche glottale Strategie zu variieren. Interessanterweise ist Glottalisierung als eine Realisierung von / h/ jedoch nicht die glottale Strategie, die die untersuchten französischen Muttersprachler einsetzen. Sie weisen in ihren deutschen Produktionen fast ausschließlich glottale Friktion auf. Durch die Dokumentation von Einzelfällen konnte gezeigt werden, dass der oberflächlich betrachtete erfolgreiche Erwerb glottaler Friktion seitens französischer Muttersprachler sich im Detail jedoch von glottaler Friktion im Deutschen produziert von deutschen Muttersprachlern unterscheidet. So realisieren die französischen Muttersprachler deutlich häufiger stimmlose glottale Friktion als die deutschen Muttersprachler. Damit weichen sie nicht nur vom deutschen Muster stimmhafter glottaler Friktion bei stimmhaftem Kontext ab, sondern sind auch innerhalb der Realisierung glottaler Friktion inkonsistent. Zum Teil treten weitere Aufälligkeiten hinzu, die darauf hindeuten, dass die angemessene Realisierung glottaler Friktion noch Schwierigkeiten bereitet. Als Beispiel sei hier eine zusätzliche orale Engebildung und damit Erzeugung eines supraglottalen Friktionsrauschen genannt, das die glottale Friktion akustisch dominiert und auditiv zu einem verstärkten Eindruck von vorhandener Friktion führt. Es ist anzunehmen, dass sich die glottale Friktion außerdem auch in ihrer Länge und Intensität von muttersprachlichen deutschen Realisie- 208 rungen unterscheidet. Allerdings ist sowohl die Messbarkeit dieser Parameter als auch die Vergleichbarkeit der gewonnenen Daten problematisch. So müssten beispielsweise für die Messung der Friktionsdauer einheitliche Kriterien gesetzt werden, ab wann behauchte Stimmhaftigkeit als glottale Friktion anzusehen ist. Nicht zuletzt reduzieren die untersuchten französischen Muttersprachler weniger stark Formen wie zweihunderttausend oder Neunzehnhundertals deutsche Muttersprachler. Für die weiterreichende Forschung ist eine Überprüfung der Konsistenz in der Realisierung vokalisch anlautender Silben und / h/ während der Akzentimitation über eine Analyse der Produktionen aus der zweiten Aufnahmesitzung wünschenswert, sowie die Vergrößerung der Datenbasis der französischen Muttersprachler erforderlich, um validere Ergebnisse zu den deutschen Produktionen französischer Muttersprachler zu erlangen. Dennoch konnte bereits über die durchgeführte Untersuchung gezeigt werden, dass in der Analyse der Realisierung von / h/ mehr Potenzial zur erfolgreichen Unterscheidung zwischen einem vorgetäuschten und einem authentischen französischen Akzent im Deutschen steckt als in der Analyse der Realisierung von Vokaljunkturen. Allerdings erfordert diese Analyse den Einbezug phonetischer Details wie Stimmbeteiligung und eine Prüfung der spektralen Charakteristik von Friktion. 209 11. Artikulatorische Variation am Beispiel der Endsilbenrealisierung Im Folgenden wird die artikulatorische Variation bei der Akzentimitation am Beispiel der Endsilbenrealisierung dargestellt. Sowohl in gelesener als auch in spontansprachlicher Standardaussprache des Deutschen werden die Endsilben / -@n, -@m/ und / -@l/ in der Regel nicht voll realisiert, sondern u. a. abhängig vom vorangehenden Laut reduziert. Eine ausführliche Beschreibung der verschiedenen Reduktionsformen findet sich z. B. bei Meinhold und Stock (1980) oder Rues (1993). Die Hauptmerkmale der Endsilbenreduktion lassen sich wie folgt zusammenfassen: Bei der Reduktion wird Schwa ( [@] ) elidiert, wobei das folgende / n, m/ bzw. / l/ die vokalische Funktion des Silbenträgers übernimmt und so als silbischer Nasal bzw. als silbische Lateralität realisiert wird. Bei vorangehendem Plosiv 1 übernimmt der silbische Nasal den Artikulationsort des vorangehenden Konsonanten (progressive partielle Kontaktassimilation der Artikulationsstelle und des Artikulationsorgans) und der Plosiv wird vor dem homorganen Nasalkonsonanten nasal gesprengt (regressive partielle Kontaktassimilation der Nasalität), z. B. haben / ha: b@n/ realisiert als [ha: b n m" ] . Zudem kann der Lenis-Plosiv zugunsten des homorganen Nasals entfallen (vgl. Rues, 1993; Kohler, 1995), z. B. [ha(: )m(: )] . Folgt die Endsilbe / -@n/ auf / r/ , so wird das / r/ in der Regel vokalisiert, z. B. hören / hø: r@n/ realisiert als [hø: 5 “n] . Die apikalen Plosive / t/ und / d/ werden vor / l/ in der Endsilbe / -@l/ lateral gesprengt, z. B. Beutel / bOYt@l/ realisiert als [b ˚Oø “ t l l"] . Diese komplexen koartikulatorischen Prozesse stellen für nicht-deutsche Muttersprachler zum Teil eine große Herausforderung dar und so kann ein typisches Aussprachemerkmal von Deutschlernern eine volle Endsilbenrealisierung sein, d.h. eine nicht-reduzierte Realisierung einer Vokal-Konsonanten-Sequenz. Ladefoged (1982) führt dieses auch als typisches Merkmal eines fremdsprachigen Akzents im Englischen an: It [(nasal plosion)] is normally used in pronouncing words such as ‘sadden, sudden, leaden’ ["sædn" , "s2dn" , "lEdn" ] . It is considered a mark of a foreign accent to add a vowel ["sæd@n, "s2d@n, "lEd@n] .(Ladefoged, 1982, S. 51) Es ist fraglich, ob Reduktions- und Assimilationsprozesse wie die Endsilbenrealisierung im Fremdsprachenunterricht vermittelt werden und welchen Stellenwert diese Thematik einnimmt. Außerdem zeigt die Alltagserfahrung, dass das Sprechen mit nicht-deutschen Muttersprachlern häufig durch eine besonders langsame Sprechweise und hyperkorrekte Artikulation, u. a. durch voll realisierte Endsilben, seitens der deutschen Muttersprachler gekennzeichnet ist. 1 Auch nach Frikativen kann der Nasal an die Artikulationsstelle des vorangehenden Frikativs assimiliert werden, z. B. bilabialer oder labiodentaler Nasal ( [m, M] ) anstelle des apikalen Nasals nach / f/ oder / pf/ oder auch velarer Nasal ( [N] ) nach einem hinteren Allophon von / x/ ( [x, X] ). 211 Daraus stützen sich die Annahmen, dass nicht-deutsche Muttersprachler die Endsilben meist voll realisieren und dass deutsche-Muttersprachler eine volle Endsilbenrealisierung als typisches nicht-muttersprachliches Aussprachemerkmal wahrnehmen. Es ist zu untersuchen, ob deutsche Muttersprachler in ihren Verstellungen dieses mutmaßlich typische Merkmal der nicht-reduzierten Endsilbenrealisierung systematisch umsetzen und wie konsistent sie ggf. in dieser Umsetzung sind. Außerdem soll der Frage nachgegangen werden, ob die französischen Muttersprachler dieser Studie vorwiegend volle Endsilben realisieren oder ob sie diesen Aspekt der deutschen Aussprache bereits beherrschen und die Endsilben reduzieren. Zunächst sollen einige statistische Angaben über die Verteilung der Endsilbenrealisierung herangezogen werden. In Meinhold (1962) wurde die Realisation von / -@n, -@m/ und / -@l/ in ca. 13 000 Silben untersucht. Die untersuchten Daten stammen aus Nachrichtenlesungen und Programmansagen im Rundfunk, belletristischen Lesungen, Rezitationen, Hörspielen und Bühnenaufführungen und wurden von 130 Sprechern verschiedener regionaler Herkunft, darunter auch Schauspieler und Rezitatoren, gesprochen. Hauptergebnis dieser Untersuchung war, dass der Vokal in / -@n/ in den meisten Fällen nach Frikativen und nach Plosiven nicht realisiert wurde, wobei die Plosive wie oben beschrieben nasal gelöst und die Nasale an den Artikulationsort des Plosivs assimiliert wurden. Bei den Frikativen wird die Endsilbe am häufigsten nach (post)alveolaren Lauten ( / s, z, S, ts/ ) reduziert (ca. 99 % bei / -s@n/ ) und am seltensten nach dem vorderen Allophon von / x/ (58 %). Bei den Plosiven tritt die Reduktion der Endsilbe am häufigsten nach / b/ und / t/ , am seltensten jedoch nach / k/ auf. Bei der Endsilbe / -@l/ überwiegen im Gegensatz zu / -@m/ ebenfalls die reduzierten Formen, wobei die apikalen Plosive / t/ und / d/ lateral gesprengt werden (vgl. Meinhold, 1962, S. 4-6). Rues (1993) untersucht ein Korpus von 10 Sprechern mit 766 Endsilben / -@n/ auf Gesprächsebene. Insgesamt wurden hier 96 % der Endsilben reduziert und nur 4 % voll realisiert. Für die Folge Frikativ + Endsilbe / -@n/ findet sich wie bei Meinhold (1962) (außer nach palatalem Approximanten und Frikativ [j, ç] ) in allen Fällen eine Reduktion der Endsilbe. Auch nach Plosiven wird in 98 % der Fälle die Endsilbe reduziert. Eine zusätzliche Elision der Plosive findet nach Fortis-Plosiven kaum (20 %), nach Lenis-Plosiven jedoch häufig (70 %) statt. Nach Nasalkonsonanten, Vokalen und Liquiden dominieren in dieser Untersuchung ebenfalls die reduzierten Formen der Endsilbe / -@n/ . Sowohl Meinhold (1962) als auch Rues (1993) weisen darauf hin, dass das Vorkommen der Endsilbe / -@m/ äußerst beschränkt ist und daher keine repräsentativen Ergebnisse liefert. Den Unterschied zwischen einer ausschließlich vollen Realisierung der Endsilbe / -@m/ in Meinholds Stichprobe zur stets reduzierten Form in ihrer Untersuchung führt Rues (1993) auf die unterschiedlichen phonostilistischen Ebenen (hohe Formstufe bei Meinhold, 1962 vs. Gesprächs- 212 stufe bei Rues, 1993) zurück (vgl. Rues, 1993, S. 106-109). Auch Meinhold und Stock (1980) weisen auf eine unterschiedliche Verteilung der verschiedenen Endsilben-Realisierungsformen hin - volle Realisierung bei der gehobenen Formstufe der Standardaussprache, wozu Rezitationen und feierliche Vorträge zählen, und reduzierte Realisierung im Bereich der Gesprächsstufe (vgl. Meinhold und Stock, 1980, S. 194). Ob dieser Unterschied (insbesondere die volle Realisierung) in der Realität tatsächlich in diesem Ausmaß vorliegt, soll an dieser Stelle nicht diskutiert werden. Es ist jedoch zu beobachten, dass selbst in Nachrichtensendungen bei ARD und ZDF, deren Sprachstufe als „gehobene phonostilistische Ebene“ der deutschen Standardaussprache einzustufen ist, von den Sprechern meist reduzierte Endsilben realisiert werden. Volle Realisierungen der Endsilben kommen dagegen außer in regionalen Varianten wie beispielsweise den rheinischen Dialekten (zur Umgangssprache in Köln vgl. z. B. Froitzheim, 1984) in der Regel nur bei sehr langsamer und hyperkorrekter Sprechweise vor, z. B. in nachdrücklichen Anweisungen, beim Vorlesen von Sicherheitsbestimmungen oder beim Sprechen mit Nicht-Muttersprachlern. Zuletzt sei an dieser Stelle noch auf Kohler (1995) hingewiesen, der eine Statistik mit der Verteilung der verschiedenen Reduktionsformen im Datenkorpus PHONDAT des IPDS Kiel anführt und ebenfalls zeigt, dass die unterschiedliche Häufigkeit der Endsilbenreduktionen vom artikulatorischen Kontext (Bildungsstelle des vorangehenden Plosivs) abhängt und die Reduktion bei / b@n/ und / g@n/ im Vergleich zu / d@n/ am stärksten ausgeprägt ist. Für die drei nichtinitialen Silben ( / -b@n, -g@n, -d@n/ ) konnte deutlich gezeigt werden, dass eine Reduktion zu Plosiv mit folgendem homorganen Nasal weitaus häufiger vorkommt als andere Formen, z. B. eine Abfolge von Plosiv und apikalem Nasal oder nur ein homorganer Nasal. Außerdem wird gezeigt, dass die Tilgung des Vokals in / -@n/ -Silben nach Plosiven in 96% der Fälle, nach Frikativen in 82% und nach / l/ in 76% der Fälle auftritt. Nach Vokalen wird aber nur in 53% der Fälle reduziert und nach Nasalen oder / r/ in 63% (vgl. Kohler, 1995, S. 227-229). 11.1. Methode Bei der Analyse der Realisierung der Endsilben sollen schwerpunktmäßig folgende Fragen untersucht werden: 1. Unterscheiden sich die unverstellten und die verstellten Produktionen der deutschen Muttersprachler hinsichtlich der Realisierung der Endsilben? Gibt es Tendenzen zu einer vollen oder reduzierten Realisierung? 2. Wie verhalten sich die französischen Muttersprachler in ihren deutschen Produktionen hinsichtlich der Endsilbenrealisierung? 213 3. Sind die Akzentimitationen hinsichtlich der Endsilbenrealisierung mit den deutschen Produktionen der französischen Muttersprachler vergleichbar? 4. Sind die Akzentimitationen hinsichtlich der Endsilbenrealisierung über zwei Aufnahmen hinweg konsistent? In den Texten 1-3 dieser Studie kommen insgesamt 109 Silben / -@n, -@m/ oder / -@l/ in medialer oder finaler Position vor. Dabei sind auch Silbenfolgen wie / -@n@n/ in vergangenen oder / -@nd/ wie in -tausend oder -abend enthalten. Tabelle 11.1 zeigt die absolute Anzahl der vorkommenden Endsilben. Am häufigsten kommen in den Texten 1-3 Endsilben nach Plosiven vor. Es muss hinzugefügt werden, dass die Verteilung in den einzelnen Konsonant-Endsilben-Gruppen sehr stark streut, da z. B. / -@n/ nach bilabialem Fortis-Plosiv / p/ überhaupt nicht vertreten ist, nach / t/ oder / b/ jedoch sehr häufig. Aus der Verteilung der Endsilben in den Texten 1-3 und den oben angeführten statistischen Angaben von Kohler (1995), Rues (1993) und Meinhold (1962) wurden für diese Studie die Endsilben von 17 Wörtern (46 Endsilben insgesamt) ausgewählt. Tabelle 11.2 listet die relevanten Wörter auf und zeigt die Einordnung in den lautlichen Kontext sowie das Vorkommen in den untersuchten Texten. In einem auditiven Verfahren, unterstützt durch akustische und visuelle Überprüfung, wurde die Realisierung der oben aufgeführten 46 Endsilben für 22 deutsche Muttersprachler bei der Imitation eines französischen Akzents sowie für vier französische Muttersprachler im Deutschen analysiert. Dabei wurde nur vermerkt, ob die Realisierung voll oder reduziert war und nicht, welche Vokalqualität / @/ in einer vollen Realisierung aufweist. Als Vergleichsbasis wurden außerdem die Endsilben der unverstellten Textversionen aus der ersten Aufnahmesitzung analysiert. Da nur die Texte 1 und 3 in unverstellter Version aufgenommen wurden, standen für diese Untersuchung 31 Endsilben pro Sprecher zur Verfügung. Es ist ausreichend, die Endsilbenrealisierungen von nur elf von 22 deutschen Muttersprachlern (gerade Probanden-Identifikationsnummer bei weiblichen und ungerade bei männlichen Sprechern: Ff02, Ff04, ..., Ff14, Fm01, Fm03, ..., Fm07) in der unverstellten Tabelle 11.1.: Anzahl (N) der Endsilben in den Texten 1-3 (sortiert nach vorangehendem Laut) Endsilbe N Endsilbe N Plosiv+ / @n/ 49 Vokal+ / @n/ 2 Frikativ+ / @n/ 14 / -@l/ 2 Nasal+ / @n/ 18 / -@m/ 1 Liquid+ / @n/ 23 214 Tabelle 11.2.: Auflistung der auf Realisierung der Endsilben zu analysierenden Wörter und Anzahl (N) ihres Vorkommens in den Texten 1-3 (Gesamtanzahl = 46) Wort N Wort N / -t@n/ hatten Taten Angestellten 3 2 2 Frikativ + / @n/ -tausend zwischen 3 2 / -k@n/ Banken packen 4 2 Nasal + / @n/ kommen Millionen 7 2 / -b@n/ haben 5 / -d@n/ werden jeden 2 1 Liquid + / @n/ fällen Pistolen Jahren 3 2 3 / -g@n/ wegen getragen 2 1 Variante zu untersuchen, da für allgemeine Aussagen auf die oben aufgeführten Statistiken zurückgegriffen werden kann. Außerdem wurden für die verbleibenden elf deutschen Muttersprachler (Ff01, Ff03, ..., Ff15, Fm02, ..., Fm06) sowie für die vier französischen Muttersprachler die Endsilbenrealisierungen in den Textproduktionen aus der zweiten Aufnahmesitzung 2 analysiert. Zum einen kann über diese Analyse die Konsistenz in der Realisierung über einen größeren Zeitraum (zwei Wochen) überprüft werden zum anderen übernimmt sie gewissermaßen eine Kontrollfunktion für die erste Analyse. Insgesamt wurden 2227 Endsilben auf ihre Realisierung analysiert. Nicht in allen Fällen war es möglich, eine Entscheidung über die Realisierung der Endsilbe zu treffen. Manche Sprecher verwendeten Singularformen und damit waren keine Endsilben vorhanden (v. a. Bank statt Banken oder Million statt Millionen) oder sie ließen beispielsweise das betreffende Wort aus. Diese Fälle wurden von der Analyse ausgeschlossen. Außerdem kam es vor, dass Sprecher zwar den finalen Nasal der Endung elidierten, jedoch noch einen Vokal realisierten, z. B. in kommen. War dieser Vokal nasaliert, so wurde diese Silbe als eine voll realisierte Endsilbe gewertet, bei nicht-nasalierter Realisierung des Vokals wurden diese Fälle ebenfalls von der Analyse ausgeschlossen. Außerdem war die Bewertung der Endsilbenrealisierung in weiteren Fällen wie beispielsweise nach Frikativen (z. B. in -tausend) problematisch. Vor allem in diesen Fällen wurde die auditive Analyse zusätzlich durch einen genauen visuellen Abgleich der Sonagramme unterstützt. So wurde, wenn nach dem Frikativ noch genü- 2 Das betrifft die zweite Aufnahme der Texte 1-3 (in verstellter Version für die deutschen Muttersprachler). 215 gend formantähnliche Struktur mit einem sichtbaren Übergang von Vokal zu Nasal vorhanden war, auf eine volle Realisierung der Endsilbe geschlossen. Ebenso nach Liquid / l/ , z. B. in Pistolen. In anderen Fällen wie beispielsweise nach Plosiven konnte in auditiv schlecht unterscheidbaren Fällen bei Vorhandensein von Aspiration auf eine orale Lösung des Plosivs und damit auf eine nicht reduzierte Endsilbe geschlossen werden. Die im Ergebnisteil folgenden Angaben zur Anzahl der Endsilbenreduktion sind prozentuale Angaben und nicht absolute, damit ein besserer Vergleich zwischen den Produktionen der einzelnen Sprecher und Sprechergruppen möglich ist. Die Notwendigkeit dieses Vergleichs soll auch die zum Teil nicht unproblematische Angabe in Prozent bei absoluten Zahlen unter einhundert rechtfertigen. 11.2. Ergebnisse 11.2.1. Vergleich der verstellten und unverstellten Produktionen deutscher Muttersprachler Die elf deutschen Muttersprachler der Stichprobe, deren unverstellte Versionen der Texte 1 und 3 analysiert wurden, reduzieren in diesen unverstellten deutschen Textversionen mehrheitlich die Endsilbe / -@n/ . Die Anzahl der reduzierten Endsilben liegt hier bei einem Durchschnitt von 89,6 % (s = 12,7). Dabei ist Sprecherin Ff10 mit nur 55 % Reduktion in den untersuchten Endsilben sicherlich als Ausreißer zu bewerten, da die anderen zehn Sprecher mit ihren Reduktionen bei 87-100 % liegen und ohne diesen Ausreißer einen Mittelwert von 93,1 % (s = 5,7) aufweisen. Dieser Wert ist vergleichbar mit den Ergebnissen aus Meinhold (1962), Rues (1993) und Kohler (1995), was darauf schließen lässt, dass die hier vorliegenden Daten als repräsentativ für das Deutsche betrachtet werden können. In der verstellten Version ist die Anzahl der reduzierten Endsilben in dieser Gruppe von elf Sprechern mit durchschnittlich nur 10,7 % (s = 12,5) Reduktion der analysierten Endsilben signifikant geringer als in der unverstellten Version (p < 0,01; gepaarter Wilcoxon-Test) 3 . Obwohl die Streuung um den Mittelwert mit einer Standardabweichung von 12,5 und einer Spannweite R von 45 relativ hoch ist, bedeutet das, dass die deutliche Mehrheit der Sprecher für die Imitation eines französischen Akzents die Endsilben vorwiegend voll realisiert und [@] nicht elidiert wird. Dieser Unterschied zwischen den verstellten und den unverstellten Versionen zeigt, dass deutsche Muttersprachler über eine gemeinsame Vorstellung darüber verfügen, dass Deutsch mit französischem Akzent von akzentfreiem Deutsch bezüglich der Endsilbenrealisierung abweicht, und dass französische Muttersprachler dazu tendieren, die Endsilben voll - und nicht 3 Es wurden nur die Texte 1 und 3 bewertet. 216 0 20 40 60 80 100 Fm07 Fm05 Fm03 Fm01 Ff14 Ff12 Ff10 Ff08 Ff06 Ff04 Ff02 Anzahl der Endsilbenreduktionen in % Sprecher 90 0 100 0 87 6 97 10 55 13 90 45 87 10 87 7 93 7 100 17 100 3 unverstellt verstellt (franz. Akzent) Abbildung 11.1.: Prozentualer Anteil reduzierter Endsilben in den unverstellten und verstellten Produktionen der deutschen Muttersprachler wie im Standarddeutschen üblich vorwiegend reduziert - zu realisieren. Abbildung 11.1 zeigt für die Gruppe der elf deutschen Muttersprachler (Ff02, Ff04, ..., Ff14 und Fm01, Fm03, ..., Fm07) einen Vergleich der prozentualen Anzahl der reduzierten Endsilben zwischen der verstellten und unverstellten Produktion der Texte 1 und 3 aus der ersten Aufnahmesitzung. Die Gesamtgruppe der deutschen Muttersprachler (N = 22) reduziert bei der Imitation eines französischen Akzents durchschnittlich 11,4 % (s = 13,8) aller untersuchten Endsilben in den Texten 1-3. Damit unterscheidet sich die Anzahl der reduzierten Endsilben in der verstellten Textversion im Vergleich zur Untergruppe von elf Sprechern nicht wesentlich 4 . Ein Vergleich dazu, welche Tokens besonders selten von der Endsilbenreduktion betroffen sind, gestaltet sich aufgrund der unterschiedlichen Anzahl an Sprechern in den verschiedenen Gruppen und an berücksichtigten Texten sowie unterschiedlich häufigem Vorkommen der einzelnen Wörter schwierig. Unter Berücksichtigung der Wörter, die mindestens drei Mal in den Texten vorkom- 4 Auf ein statistisches Prüfverfahren wurde an dieser Stelle verzichtet, da sowohl die Anzahl der Sprecher pro Gruppe als auch die Anzahl der untersuchten Silben voneinander abweichen: elf Sprecher in der Untergruppe, für die die Texte 1 und 3 (je 31 Silben) analysiert wurden, vs. 22 Sprecher in der Gesamtgruppe, für die die Texte 1, 2 und 3 (je 46 Silben) analysiert wurden. 217 men, seien daher nur zwei Tendenzen genannt: Besonders häufig traten sowohl in den verstellten als auch in den unverstellten Versionen reduzierte Endsilben bei -tausend auf. In den Akzentimitationen wurde knapp die Hälfte der Endsilben in diesem Token reduziert, in der unverstellten Version wurden hier alle Endsilben reduziert. Dies deckt sich mit den Ergebnissen von Meinhold (1962) und Rues (1993), nach denen Endsilbenreduktion nach Frikativen besonders häufig auftritt. Besonders wenig Fälle von Endsilbenreduktionen sind in der verstellten Version von Banken, haben sowie von Jahren zu finden - die Anzahl an voll realisierten Endsilben liegt hier jeweils bei ca. 95-98 %. Da die Anzahl der Reduktionen in Banken und haben in unverstelltem Deutsch für die vorliegende Stichprobe sehr hoch ist und auch nach den Statistiken von Meinhold (1962), Rues (1993) und Kohler (1995) sehr hoch sein sollte ( / -@n/ nach Plosiv), kann hier von einer besonders starken Abweichung von gewöhnlichen Artikulationsmustern für die Akzentimitation ausgegangen werden. Abbildung 11.2 zeigt anhand der Produktionen von Sprecherin Ff04 einen Vergleich der reduzierten Endsilben in der unverstellten Version und der vollen Endsilbenrealisierung bei der Imitation eines französischen Akzents. Abgebildet sind die Oszillogramme und Sonagramme (dynamischer Bereich: 42,0 dB) der Wörter haben und Banken (Text 3, 1. Aufnahme). Im oberen Teil der Grafik ist jeweils die unverstellte Version mit reduzierter Endsilbe und im unteren Teil der Grafik die verstellte Version mit voll realisierter Endsilbe dargestellt. Die Pfeile markieren dabei jeweils die Endsilben beginnend mit der Lösung des vorausgehenden Verschlusses. Die volle Realisierung der Endsilben ist besonders gut an der deutlichen Abgrenzung der Formantstruktur zwischen dem Vokal und dem folgenden Nasal erkennbar. Bei Banken fällt auf, dass die Sprecherin in der verstellten Form den dorsalen Plosiv aspiriert und die darauffolgende Endsilbe voll realisiert. In der unverstellten Version hingegen wird kein dorsaler Plosiv realisiert, sondern die Stimmhaftigkeit durch einen glottalen Verschluss unterbrochen und es folgt auf diese Verschlussphase ein silbischer dorsaler Nasal. 11.2.2. Vergleich der Akzentimitationen mit den deutschen Produktionen französischer Muttersprachler Ein Vergleich der Akzentproduktionen der deutschen Muttersprachler mit den deutschen Produktionen der authentischen französischen Muttersprachler kann Aufschluss darüber geben, inwiefern sich die Vorstellungen der deutschen Sprecher bezüglich einer vollen Endsilbenrealisierung bestätigen lassen und ob ihre Produktionen mit den Produktionen der französischen Muttersprachler übereinstimmen. Abbildung 11.3 zeigt die prozentuale Anzahl der reduzierten Endsilben in der ersten Aufnahme der Texte 1-3 für die vier französischen Muttersprachler im Deutschen und für die Gesamtgruppe der 22 deutschen Muttersprachler bei der Imitation eines französischen Akzents. Es fällt zunächst auf, dass drei der vier 218 Time (s) 0 0.7838 0 5000 Frequency (Hz) 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 Time (s) 0 0.9844 0 5000 Frequency (Hz) 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 haben (unverst.) Banken (unverst.) Banken (verst.) haben (verst.) Abbildung 11.2.: Reduzierte und volle Realisierung der Endsilben in haben und Banken gesprochen von Ff04 in unverstellter (oben) und verstellter Version (unten) 219 0 20 40 60 80 100 Fm07 Fm06 Fm05 Fm04 Fm03 Fm02 Fm01 Ff15 Ff14 Ff13 Ff12 Ff11 Ff10 Ff09 Ff08 Ff07 Ff06 Ff05 Ff04 Ff03 Ff02 Ff01 F-nm02 F-nm01 F-nf02 F-nf01 Anzahl der Endsilbenreduktionen in % Sprecher 77 98 27 58 2 0 0 0 5 7 13 7 54 11 20 46 0 9 4 4 11 5 11 16 16 9 franz. Mspr. dt. Mspr. Abbildung 11.3.: Prozentualer Anteil reduzierter Endsilben in den deutschen Produktionen französischer Muttersprachler und bei der Akzentimitation durch deutsche Muttersprachler (1. Aufnahme) französischen Muttersprachler über die Hälfte aller untersuchten Endsilben reduziert realisieren. Eine Sprecherin (F-nf02) reduziert sogar fast alle untersuchten Endsilben. Dahingegen reduziert von den 22 deutschen Muttersprachlern, die einen französischen Akzent imitieren, lediglich eine Sprecherin (Ff09) mit 54 % knapp mehr als die Hälfte und eine weitere Sprecherin (Ff12) mit 46 % geringfügig weniger als die Hälfte aller untersuchten Endsilben. Die verbleibenden 20 Sprecher realisieren in den untersuchten Fällen dagegen mehrheitlich (und einige von ihnen sogar ausschließlich) volle Endsilben während der Akzentimitation. Es ergibt sich für die Gruppe der deutschen Muttersprachler bei der Akzentimitation ein gemittelter Wert der reduzierten Endsilben von 11,4 % (s = 13,8; Spannweite R = 54). Für die französischen Muttersprachler ergibt sich ein gemittelter Wert von 65 % Endsilbenreduktion bei einer relativ großen Streuung (s = 30,1; Spannweite R = 71). Diese große Varianz ist sicherlich einerseits der geringen Probandenzahl, vermutlich aber auch den unterschiedlichen Niveaustufen der Sprecher in der Fremdsprache Deutsch zuzuschreiben. So unterscheiden sich die Produktionen der beiden französischen Muttersprachlerinnen (F-nf01, F-nf02), deren L2-Kompetenz im Deutschen höher ist und die einen weniger starken Akzent aufweisen (vgl. foreign accent ratings unter Punkt 5.5.2), durch eine höhere Anzahl an reduzierten Endsilben von den Produktionen der Sprecher F-nm01 und F-nm02. 220 Tabelle 11.3.: Vergleich der gemittelten Anzahl an reduzierten Endsilben in den verstellten und unverstellten Produktionen der deutschen Muttersprachler und in den deutschen Produktionen der französischen Muttersprachler (Mw in % = arithmetisches Mittel in Prozent; s = Standardabweichung) Texte Mw in % (s) Dt - unverstellt (N = 11) 1, 3 89,6 (12,7) Dt - verstellt (N = 22) 1 - 3 11,4 (13,8) Fr - deutsch (N = 4) 1 - 3 65,0 (30,1) Die relative Anzahl an reduzierten Endsilben ist in den Akzentimitationen der deutschen Muttersprachler deutlich geringer als in den deutschen Produktionen der französischen Muttersprachler. Vergleicht man jedoch die Werte der französischen Muttersprachler mit den Werten der deutschen Muttersprachler in ihren unverstellten Versionen, so lässt sich feststellen, dass bezogen auf die Anzahl an reduzierten Endsilben diese Werte näher beieinander liegen. Das trifft insbesondere für die beiden französischen Muttersprachlerinnen (F-nf01, F-nf02) zu. Zwar kommen in den deutschen Produktionen der französischen Muttersprachler weniger (im Mittel ca. 25 Prozentpunkte) reduzierte Endsilben vor als in den unverstellten Produktionen der deutschen Sprecher, aber nicht so wenige wie in den Akzentimitationen. Das heißt, dass sich hinsichtlich der Anzahl an Endsilbenreduktionen die authentischen Akzentproduktionen den unverstellten deutschen Produktionen mehr ähneln als den Akzentimitationen. Dies deutet darauf hin, dass es hier zu einer Übertreibung seitens der deutschen Muttersprachler während der Akzentimitationen kommt. Tabelle 11.3 gibt für die deutschen und französischen Muttersprachler jeweils das arithmetische Mittel an reduzierten Endsilben in Prozent und die Standardabweichung an. Abbildung 11.4 stellt die prozentuale Anzahl der reduzierten Endsilben in den deutschen Produktionen der französischen Muttersprachler der prozentualen Anzahl der reduzierten Endsilben in den unverstellten Produktionen der deutschen Muttersprachler gegenüber. 11.2.3. Konsistenz in der Realisierung Um zu überprüfen, wie konsistent deutsche Muttersprachler in der Endsilbenrealisierung während der Akzentimitation sind, wurden für eine Stichprobe von elf deutschen Muttersprachlern (ungerade Probandennummer bei weiblichen und gerade bei männlichen Sprechern: Ff01, Ff03, ..., Ff15 und Fm02, ..., Fm06) die Realisierungen der Endsilben aus der ersten Aufnahmesitzung mit den Realisierungen aus der zwei Wochen später stattgefundenen zweiten Aufnahmesitzung verglichen. Außerdem wurden für die vier französischen Muttersprachler ebenfalls die Realisierungen der Endsilben aus beiden Aufnahme- 221 0 20 40 60 80 100 Fm07 Fm05 Fm03 Fm01 Ff14 Ff12 Ff10 Ff08 Ff06 Ff04 Ff02 F-nm02 F-nm01 F-nf02 F-nf01 Anzahl der Endsilbenreduktionen in % Sprecher 77 100 26 65 90 100 87 97 55 90 87 87 93 100 100 franz. Mspr. dt. Mspr. Abbildung 11.4.: Prozentualer Anteil reduzierter Endsilben in den deutschen Produktionen französischer Muttersprachler und in den unverstellten Produktionen deutscher Muttersprachler (1. Aufnahme der Texte 1 und 3) sitzungen miteinander verglichen, um auch hier die Konsistenz in den Produktionen zu überprüfen. Abbildung 11.5 zeigt einen Vergleich der Werte aus beiden Aufnahmesitzungen für die französischen Muttersprachler im Deutschen und für die Untergruppe der elf deutschen Muttersprachler während der Stimmverstellung. Für beide Gruppen, französische und deutsche Muttersprachler, kann festgestellt werden, dass sich im Mittel die prozentuale Anzahl der Endsilbenreduktionen in der zweiten Aufnahme im Vergleich zur ersten Aufnahme nicht wesentlich ändert. In der Untergruppe der elf deutschen Muttersprachler steigt in den verstellten Textversionen die Anzahl der reduzierten Endsilben um weniger als zwei Prozentpunkte von durchschnittlich 12,4 % (s = 15,3) auf 14,1 % (s = 16,3). In der Gruppe der französischen Muttersprachler sinkt die Anzahl der reduzierten Endsilben um nur drei Prozentpunkte von durchschnittlich 65 % (s = 30,1) auf 62 % (s = 38,4). Diese Änderung ist in keiner der beiden Gruppen signifikant (p > 0,05; gepaarter Wilcoxon-Test). Betrachtet man nur diese Mittelwerte, entsteht der Eindruck, dass sich die Konsistenz in den Realisierungen sowohl für die akzentimitierenden Sprecher als auch für die authentische nicht-muttersprachliche Gruppe über einen Abstand 222 0 20 40 60 80 100 Fm06 Fm04 Fm02 Ff15 Ff13 Ff11 Ff9 Ff07 Ff05 Ff03 Ff01 F-nm02 F-nm01 F-nf02 F-nf01 Anzahl der Endsilbenreduktionen in % Sprecher 77 91 98 98 27 20 58 39 2 8 0 9 5 9 13 10 54 57 20 20 0 0 4 0 11 25 11 2 16 15 franz. Mspr. dt. Mspr. Aufnahme 1 Aufnahme 2 Abbildung 11.5.: Vergleich des prozentualen Anteils an reduzierten Endsilben zwischen der 1. und der 2. Aufnahme (Texte 1-3) für französische und deutsche Muttersprachler (verstellt) von zwei Wochen nicht oder nur sehr geringfügig ändert. Im Einzelnen betrachtet und in Abbildung 11.5 gut ersichtlich, sind jedoch in beiden Gruppen Sprecher vertreten, deren Realisierungen sich in der ersten und zweiten Aufnahme unterscheiden. Diese Abweichungen kommen für beide Sprechergruppen in beiden Richtungen vor, d. h. sowohl Erhöhung als auch Verringerung der prozentualen Anzahl der reduzierten Endsilben, und bewegen sich zwischen -19 und +14 Prozentpunkten. Ob die Sprecher einer Gruppe eine höhere Konsistenz aufweisen als die Sprecher der anderen Gruppe lässt sich aufgrund der unterschiedlichen Sprecheranzahl schlecht bestimmen. Wichtig erscheint jedoch v. a. zweierlei: Zum einen, dass im Mittel betrachtet die Konsistenz in beiden Sprechergruppen sehr hoch ist, im Einzelfall hingegen allerdings stark schwanken kann. Zum anderen sind auch die authentischen französischen Muttersprachler nicht konsistent in ihren Realisierungen. Konsistenz in der Realisierung von Endsilben ist demzufolge kein geeignetes Kriterium zur Unterscheidung von authentischen und imitierten französischen Akzenten im Deutschen. 223 11.3. Zusammenfassung Zusammenfassend sei festgehalten, dass sich in Bezug auf das Detail der Endsilbenrealisierung die Sprechergruppen der deutschen und französischen Muttersprachler von einander abgrenzen lassen. Es scheint unter den deutschen Muttersprachlern eine gemeinsame Vorstellung darüber zu existieren, dass mit französischem Akzent gesprochenes Deutsch u. a. durch eine volle und nicht wie im Standarddeutschen übliche reduzierte Endsilbenrealisierung gekennzeichnet ist. Diese gemeinsame Vorstellung äußert sich durch eine Produktion vorwiegend voll realisierter Endsilben bei der Imitation eines französischen Akzents durch deutsche Muttersprachler. Die französischen Muttersprachler dieser Studie hingegen produzieren trotz unterschiedlicher Niveaustufen in der Fremdsprache Deutsch alle eine höhere Anzahl an reduzierten Endsilben als die deutschen Sprecher in ihren Akzentimitationen im Mittel betrachtet. Sie liegen damit in ihrem Mittel näher an den unverstellt gelesenen Produktionen der deutschen Muttersprachler als an deren Verstellungen. Dies lässt zum einen auf eine Übertreibung der deutschen Sprecher bei den Akzentimitationen schließen. Es kann zum anderen aber auch als Hinweis darauf gedeutet werden, dass die französischen Muttersprachler der Studie eine gute Kompetenz in Deutsch als L2 aufweisen und dass das Muster der Endsilbenreduktion bereits relativ erfolgreich erworben wurde. Bestätigt wird dies durch die Unterschiede innerhalb der Gruppe der französischen Muttersprachler. So weisen die Sprecher mit der höchsten Kompetenz in Deutsch als L2 und dem schwächsten fremdsprachigen Akzent im Deutschen eine höhere Anzahl an reduzierten Endsilben auf und liegen damit noch näher an den unverstellten deutschen Produktionen als die Sprecher mit einer geringeren L2-Kompetenz und einem stärkeren Akzent. Die gemittelte Konsistenz der Realisierungen über zwei Aufnahmesitzungen im Abstand von zwei Wochen hinweg ist in beiden Sprechergruppen sehr hoch, schwankt jedoch im Einzelfall. Die französischen Muttersprachler sind dabei nicht konsistenter in ihren Realisierungen als die deutschen Muttersprachler in ihren Akzentimitationen. Daraus kann geschlussfolgert werden, dass das Kriterium der Konsistenz zumindest in Hinblick auf die Endsilbenrealisierung zur Unterscheidung zwischen authentischen und imitierten französischen Akzenten im Deutschen ungeeignet ist. 224 Teil V. Perzeption 12. Perzeptionsexperiment I Selbst phonetisch untrainierte Hörer sind in der Lage, einen fremdsprachigen Akzent an Indikatoren wie der Anzahl phonologischer Fehler (z. B. Insertion, Tilgung, Substitution), der Sprechgeschwindigkeit und Stimmqualität zu erkennen. Markham (1997) geht davon aus, dass jedes Mitglied einer Sprachgemeinschaft Sprecher identifizieren kann, die aufgrund ihrer phonetischen Merkmale nicht zu dieser Sprachgemeinschaft gehören, sondern beispielsweise Sprecher eines anderen regionalen Dialekts oder eines fremdsprachigen Akzents sind. Abgesehen von der Identifizierung normabweichender phonetischer Merkmale sind diese Beurteilungen eines Hörers jedoch niemals objektiv. Denn sie beruhen jeweils auf seinen subjektiven Überzeugungen von und dem Wissen über die eigene Gruppe und werden von Erfahrungen und Wissen über andere Gruppen beeinflusst (vgl. Markham, 1997, S. 85). Munro et al. (2003) beschreibt ein Perzeptionsexperiment, bei dem Hörer beurteilen sollen, ob sich in rückwärtsabgespielten Sprachbeispielen (kanadisches Englisch mit und ohne mandarin-chinesischen Akzent) ein fremdsprachiger Akzent befindet. Es wurde angenommen, dass Faktoren wie phonologische Fehler, Intonationskonturen oder rhythmische Muster bei rückwärtsabgespielter Sprache keine Rolle in der Erkennung eines fremdsprachigen Akzents spielen. Dennoch waren die Hörer der Studie in der Lage, die Stimuli mit fremdsprachigem Akzent zu identifizieren. Der Faktor Sprechgeschwindigkeit konnte in einer Kontrollgruppe durch Angleichung der Stimuli-Dauern ausgeglichen werden. Auch nach dieser Angleichung konnten die Probanden die akzentfreien Stimuli von den Stimuli mit fremdsprachigem Akzent unterscheiden. Die Ergebnisse deuten daraufhin, dass möglicherweise Langzeit-Eigenschaften wie die Stimmqualität des Sprechers bei der Erkennung eines fremdsprachigen Akzents genutzt werden: Our results indicate that despite the very limited list of potential cues to non-nativeness that exist in backwards speech, listeners seem able to find enough information in such speech to detect a foreign accent. Although we cannot yet pinpoint the exact cues that our listeners used, it is quite possible that they attended to longterm properties of the speech such as voice quality. (Munro et al., 2003, S. 537) In Kapitel 3 wurde diskutiert, dass aus den Aussagen der Forschungsliteratur zur mutmaßlich relativ leichten Identifizierung eines vorgetäuschten fremdsprachigen Akzents zwar geschlossen werden kann, dass Hörer fähig sind, zwischen authentischen und imitierten Akzenten zu unterscheiden, entsprechende empirische Überprüfungen dieser Implikation fehlen jedoch. Über Perzeptionsexperimente kann nicht nur die Fähigkeit der Hörer überprüft werden, zwischen imitierten und authentischen fremdsprachigen Akzenten zu unterscheiden, sondern es kann gleichzeitig auch die Authentizität der Akzentimitationen und damit die Leistung der Sprecher untersucht werden. 227 Ziel des Perzeptionsexperiments der vorliegenden Untersuchung ist, zu überprüfen, ob und wie gut deutsche Muttersprachler nicht-authentische (imitierte) von authentischen fremdsprachigen Akzenten unterscheiden können und ob sie in der Lage sind, den gesprochenen imitierten oder authentischen Akzent zu identifizieren, d. h. zu erkennen und einer geografischen oder nationalen Sprachgemeinschaft zuzuordnen. Die wahrgenommene Authentizität und die Identifizierbarkeit der imitierten fremdsprachigen Akzente kann als Erfolgskontrolle der Imitationen betrachtet werden und bietet darüber hinaus die Möglichkeit, eventuelle Korrelationen zwischen wahrgenommener Authentizität und den von den Sprechern vorgenommenen Variationen bei der Akzentimitation aufzudecken. Der Schwerpunkt des Perzeptionsexperiments liegt auf französischem und amerikanisch-englischem Akzent. Das sind die beiden Akzente, die in der Vorbefragung (vgl. Kapitel 4) besonders häufig als leicht zu imitieren benannt wurden und die die größten Akzentgruppen im aufgenommenen Korpus ausmachen. Als Kontrastfiguren (sogenannte Foils) werden aber auch andere fremdsprachige Akzente einbezogen. Das im Folgenden beschriebene Perzeptionsexperiment wurde in Neuhauser und Simpson (2007a) veröffentlicht. 12.1. Methode 12.1.1. Hypothesen Die Untersuchungsfrage ist, ob Hörer in der Lage sind, einerseits einzuschätzen, ob der gehörte Akzent authentisch oder imitiert (nicht authentisch) ist, und andererseits, ob sie den gehörten Akzent (bzw. die zugrundeliegende Muttersprache) bestimmen können. Bei Tate (1979) erkannten die Hörer in zwei Dritteln der Fälle die Imitation eines „Southern American Accent“ (vgl. dazu die Ausführungen unter Punkt 3.2.2). Markham (1999) beschreibt hingegen eine große Variation in der Verstellungsleistung der Sprecher, die sich darin äußert, dass nur manche Sprecher einen fremden schwedischen Dialekt so imitieren konnten, dass sie von Hörern als authentische Dialektsprecher beurteilt wurden. Viele Sprecher konnten aber nur ihre eigene regionalsprachliche Varietät durch einen fremden Dialekt tarnen, ohne dass der fremde Dialekt als „echt“ angesehen wurde (vgl. Markham, 1999, S. 298). In beiden Studien handelt es sich um die Beurteilung der Authentizität eines Dialekts der eigenen Muttersprache. Ob diese Ergebnisse auf die Imitation fremdsprachiger Akzente und die Authentizitätsbeurteilungen dieser Akzente übertragen werden können, soll hier durch ein Perzeptionsexperiment überprüft werden. In verschiedenen Studien und Erfahrungsberichten aus der 228 forensischen Praxis wird angenommen, dass die Imitation fremdsprachiger Akzente leicht aufgedeckt werden kann (vgl. Künzel, 1987; Blum, 1990; Storey, 1996; sowie die Diskussion im Abschnitt 3.2.3). Ob die Muttersprache von L2-Sprechern durch Hörer identifiziert werden kann, hängt v. a. von der Bekanntheit des Akzents ab. Im Hörexperiment von Cunningham-Andersson und Engstrand (1989) erkannte die Mehrheit der Hörer zwar einen finnischen, jedoch nicht einen britisch-englischen Akzent im Schwedischen. Cunningham-Andersson und Engstrand (1989) sehen einen Zusammenhang mit dem höheren Bekanntheitsgrad des finnischen Akzents unter schwedischen Muttersprachlern und referieren auf Cunningham-Andersson und Engstrand (1988), wo der Zusammenhang zwischen Bekanntheitsgrad (und geografischer Nähe) und der Identifizierbarkeit des Akzents nachgewiesen wurde. Torstensson (2010) untersucht in einem Teilexperiment die Fähigkeit schwedischer Muttersprachler, einen fremdsprachigen Akzent zu identifizieren. 42 schwedische Muttersprachler sollten für Stimuli mit akzentuiertem Schwedisch (neun verschiedene Akzente) die Muttersprache der Stimulus- Sprecher und das Land, aus dem die Sprecher stammen, nennen. Die Ergebnisse von Torstensson (2010) zeigen, dass die Mehrheit der Hörer korrekt den amerikanisch-englischen, den finnischen und den deutschen Akzent identifizierte. Dies sind auch die fremdsprachigen Akzente, die in den Medien und im Umfeld der Hörer am häufigsten anzutreffen sind. Die Zuordnung der anderen Akzente (spanisch, polnisch, serbo-kroatisch, ungarisch, türkisch and arabisch) fiel deutlich schlechter aus. Wie im Methodenteil beschrieben wurden die Sprecher dieser Studie nach der Authentizität ihrer imitierten Akzente befragt und auch danach, ob sie einen imitierten von einem authentischen Akzent unterscheiden könnten. Die Zuversicht in die Authentizität ihrer imitierten Akzente ist nach dieser Befragung nicht sehr groß: 19 von 33 Sprechern glaubten, dass ihr imitierter französischer oder amerikanisch-englischer Akzent wahrscheinlich nicht oder sicher nicht authentisch klingt, aber 14 glaubten auch, dass er wahrscheinlich authentisch sei. Sicherer waren sich die Sprecher, dass sie die Authentizität eines französischen oder amerikanisch-englischen Akzents beurteilen könnten: 27 von 33 Personen glaubten, dies wahrscheinlich oder sicher zu können; nur sechs glaubten, diese Unterscheidung wahrscheinlich nicht treffen zu können. Aus der genannten Befragung in dieser Studie, den bisherigen Ausführungen der Forschungsliteratur zur begrenzten Fähigkeit von Sprechern, fremdsprachige Akzente zu imitieren (vgl. Kapitel 3.2.3), und den Untersuchungen von Cunningham-Andersson und Engstrand (1988, 1989) und Torstensson (2010) lassen sich folgende Hypothesen ableiten, die durch das Perzeptionsexperiment untersucht werden: 1. Deutsche Muttersprachler können einen authentischen von einem nichtauthentischen Akzent unterscheiden. 229 2. Deutsche Muttersprachler können einen amerikanisch-englischen Akzent und einen französischen Akzent gut identifizieren, da diese Akzente im (medialen) Alltag der Hörer relativ stark vertreten sind. 3. Die Identifikation wird vermutlich bei Akzentimitationen erleichtert, da die Sprecher mit stereotypen Mustern arbeiten, d. h. imitierte Akzente werden von den Hörern besonders gut identifiziert. 12.1.2. Stimuli Als Stimulus für das Perzeptionsexperiment wurde folgender Satz verwendet: Die verstärkten Sicherheitsvorkehrungen der Banken könnten Räuber abgeschreckt haben. Dieser Satz stammt aus dem vorgegebenen Text 2 (vgl. Anhang C) und wurde aus dem Gesamtkorpus aller aufgenommenen Probanden für 34 Sprecher ausgewählt. Es wäre auch ein anderer Satz als Stimulus möglich und brauchbar gewesen. Der gewählte Satz hat jedoch den Vorteil, dass er bestimmte Muster enthält, die bei nicht-deutschen Muttersprachlern eine fehlerhafte Produktion durch Interferenzerscheinungen erwarten lassen und die bei der Imitation eines fremdsprachigen Akzents beachtet werden müssten. Dazu gehören u. a. die Realisierung • des vorderen Allophons des Phonems / x/ , • von postvokalischem und initialem / r/ , • von / h/ , • von Vokaljunkturen, • der Endsilben / -@n/ , • des dorsalen Nasals / N/ , • von stimmlosen Fortis-Plosiven. Obwohl der Satz relativ komplexe phonetische Muster enthält, ist er dennoch recht kurz und eignet sich daher auch aus praktischen Gründen, wie der zeitlichen Länge des Experiments. Da sich Hörer innerhalb kürzester Zeit ein Bild vom Sprecher machen und auch in der Lage sind, ein Urteil darüber zu fällen, ob ein Sprecher mit fremdsprachigem Akzent spricht (vgl. Flege, 1984; Cunningham-Andersson und Engstrand, 1989), scheint der Satz auch unter dem Aspekt der Dauer hinreichend zu sein. Es wurden 35 Stimuli getestet, die sich aus Akzentimitationen und authentischen fremdsprachigen Akzenten zusammensetzen: 230 1. 26 Akzentimitationen produziert von: • 16 deutschen Muttersprachlern (neun weiblich, sieben männlich), die französischen Akzent imitieren, • acht deutschen Muttersprachlern (fünf männlich, drei weiblich), die amerikanisch-englischen Akzent imitieren, • einem deutschen Muttersprachler und einem bilingualen Sprecher (Russisch-Deutsch), die jeweils russischen Akzent imitieren. 2. Neun authentische Akzente produziert von: • vier französischen Muttersprachlern (je zwei männlich und weiblich), • zwei amerikanisch-englischen Muttersprachlern (beide männlich), • jeweils einem italienischen Muttersprachler, einem russischen Muttersprachler und einer tschechischen Muttersprachlerin Da ein deutscher Muttersprachler, sowohl französischen (Fm04) als auch amerikanisch-englischen (AEm01) Akzent imitiert hat und beide Imitationen in die Stimuli aufgenommen wurden, ergeben sich 35 Stimuli gesprochen von 34 Sprechern. Der Fokus der Untersuchung liegt auf französischem und amerikanisch-englischem Akzent. Aus diesem Grund werden im Folgenden die anderen Akzente (russisch, tschechisch, italienisch) als sogenannte Foils- Gruppe zusammengefasst. Eine Liste der Sprecher befindet sich in Tabelle E.4 im Anhang E. Zur Beschreibung der Sprecher sei auf die Korpusbeschreibung in Kapitel 5 verwiesen. Die meisten Sprecher waren den Hörern unbekannt. Die Sprecherin Ff07 ist den Hörern bekannt und befand sich selbst auch in der Hörergruppe, daher wurde der von ihr gesprochene Stimulus mit Praat (Formant shift ratio = 0.9, neue mittlere Grundfrequenz (Median) = 180 Hz) 1 modifiziert. 12.1.3. Hörer Als Probanden dienten Studierende des Fachs Sprechwissenschaft und Phonetik der Friedrich-Schiller-Universität Jena im Hauptstudium, die über ein Hauptseminar gewonnen wurden. Es handelt sich also um Hörer mit einer phonetischen Grundausbildung. Die Hörer waren 22 deutsche Muttersprachler (18 weiblich, vier männlich) im Alter zwischen 20 und 26 Jahren (Ø 22,7 Jahre). Alle gaben Englisch und die meisten zusätzlich Französisch als erlernte Fremdsprachen an, wobei die Kompetenz in den Sprachen zwischen den Hörern stark variierte. Keiner der Hörer gab an, dass bekannte Einschränkungen des Hörvermögens vorlagen. 1 „Formant shift ratio“ bestimmt die Formantfrequenzen des modifizierten Sprachsignals. Ursprüngliche Stimmtonhöhe (Median) war 203 Hz. 231 12.1.4. Durchführung Die 35 Stimuli wurden in sechs Blöcken mit fünf unterschiedlichen Randomisierungen vorgespielt (= 210 Stimuli). Jeder Stimulus wurde durch einen 880 Hz-Ton von einer Sekunde Länge eingeleitet, gefolgt von einer Sekunde Pause. Nach jedem Stimulus in den ersten fünf Blöcken erfolgte eine Pause von 5 Sekunden. Diese Pause war im sechsten Block 10 Sekunden lang. Zwischen den einzelnen Blöcken gab es eine kurze Pause, die ca. 30 Sekunden dauerte, zwischen dem fünften und dem sechsten Block war die Pause etwas länger. Die Stimuli wurden in einem schallbehandelten Raum über Lautsprecher bei einem angemessenen Lautstärkepegel vorgespielt. Das Perzeptionsexperiment bestand aus zwei Teilexperimenten. Im ersten Teilexperiment wurden die ersten fünf Stimuli-Blöcke vorgespielt. Die Aufgabe für die Probanden war, zu beurteilen, ob der gehörte Akzent authentisch ist, d. h. von einem nicht-deutschen Muttersprachler gesprochen wird, oder nicht-authentisch ist, also von einem deutschen Muttersprachler mit imitiertem fremdsprachigen Akzent gesprochen wird. Diese binäre Beurteilung (authentisch vs. nicht-authentisch) wurde durch die Probanden während der fünf Sekunden dauernden Pause nach jedem Stimulus auf einem Fragebogen (Anhang D) durch Ankreuzen notiert. Im zweiten Teilexperiment wurden die 35 Stimuli erneut abgespielt (sechster Stimuli-Block), wobei die Reihenfolge des letzten Durchlaufs aus dem ersten Teilexperiment (fünfter Stimuli-Block) beibehalten wurde. Die Probanden sollten hier einschätzen, welcher Akzent gesprochen wird, und zusätzlich beurteilen, ob dieser Akzent authentisch oder nicht-authentisch ist. Außerdem hatten sie die Möglichkeit, zu kennzeichnen, wenn sie glaubten, einen Sprecher erkannt zu haben. Diese Beurteilungen wurden durch die Probanden während der zehn Sekunden dauernden Pause nach jedem Stimulus auf einem Fragebogen durch Ankreuzen bzw. Nennung des Akzents notiert. Die Authentizitätsbeurteilungen aus diesem Durchlauf wurden mit den Ergebnissen aus Block 1-5 zusammengefasst und werden im Folgenden unter Teilexperiment 1 dargestellt. Für die Authentizitätsbeurteilung des gehörten Akzents ergaben sich in beiden Teilexperimenten zusammen pro Sprecher 132 Urteile (22 Hörer x 6 Experimentdurchläufe). Für die Identifikation des Akzents ergeben sich pro Sprecher 22 Urteile (ein Urteil pro Hörer). 232 12.2. Ergebnisse 12.2.1. Teilexperiment 1 - Authentizitätsbeurteilung Das erste Teilexperiment dient der Überprüfung von Hypothese 1, nach der deutsche Muttersprachler einen authentischen von einem nicht-authentischen Akzent unterscheiden können. Die Aufgabenstellung für die Hörer war, zu beurteilen, ob der gehörte Akzent authentisch oder nicht authentisch ist. Pro Sprecher ergeben sich 132 Urteile (22 Hörer x 6 Experimentdurchläufe) zur Authentizität des gehörten Akzents. Es ist insgesamt eine sehr hohe Variation in der Authentizitätsbeurteilung der Akzente durch die Hörer feststellbar. Das gilt sowohl für die Gruppe der deutschen Muttersprachler, die fremdsprachige Akzente imitieren, als auch für die Gruppe der nicht-deutschen Muttersprachler, mit ihren authentischen Akzentproduktionen im Deutschen. Abbildung 12.1 zeigt die Verteilung der falschen Authentizitätsurteile (Wertung als „authentisch“) für die Sprecher, die einen französischen Akzent imitieren, über alle sechs Experimentdurchgänge. Die imitierten französischen Akzente aller 16 deutschen Muttersprachler wurden in mindestens einem Viertel aller Hörerurteile hinsichtlich ihrer Authentizität falsch beurteilt. Fehlbeurteilung bedeutet hier, dass die Hörer angeben, der gehörte Akzent sei authentisch, obwohl es sich tatsächlich um Akzentimitationen handelt. Es wurde also kein Sprecher in dieser Gruppe von allen Hörern in allen Experimentdurchläufen korrekt als deutscher Muttersprachler identifiziert, der seine Stimme durch Akzentnachahmung verstellt. Auch der umgekehrte Fall, dass der imitierte Akzent eines deutschen Muttersprachlers von allen Hörern in allen Experimentdurchläufen fälschlicherweise als authentisch beurteilt worden wäre, kam nicht vor. Die höchste Fehlerquote lag bei Fm04, dessen Akzent vorwiegend als authentisch beurteilt wurde - knapp 76 % aller Authentizitätsurteile waren falsch. Außer bei diesem Sprecher waren auch noch bei vier weiteren Sprechern (Ff04, Ff07, Fm03, Fm05) mehr als die Hälfte aller Urteile falsch - diese Sprecher scheinen demnach relativ erfolgreich in der Verstellung gewesen zu sein. Interessant ist, dass die beiden Sprecher mit den am authentischsten wahrgenommenen Akzenten (Fm04, Ff04) eine längere Zeit in Frankreich verbracht haben und angeben, fließend Französisch zu sprechen. Die von Ff05 und Fm07 gesprochenen Stimuli wurden mit nur je 26,5 % bzw. 29,5 % Fehlbeurteilung am korrektesten eingeschätzt - ihre Akzente wurden in der Gruppe „imitierter französischer Akzent“ am seltensten als authentisch eingestuft. Aus der Gruppe der acht deutschen Muttersprachler, die einen amerikanischenglischen Akzent imitierten, wurden AEf01 mit 51,5 % und AEm03 mit 60,6 % Fehlurteilen als relativ authentisch eingestuft. Die restlichen sechs Sprecher lagen in der Fehlbeurteilung unter 50 %. Am häufigsten korrekt wurden AEm04 233 30 40 50 60 70 80 90 100 Fm07 Fm06 Fm05 Fm04 Fm03 Fm02 Fm01 Ff13 Ff11 Ff10 Ff08 Ff07 Ff05 Ff04 Ff02 Ff01 Anzahl des Urteils "authentisch" (falsche Beurteilung) Sprecher 54 40,9% 45 34,1% 94 71,2% 35 26,5% 84 63,6% 61 46,2% 44 33,3% 51 38,6% 62 47% 49 37,1% 51 38,6% 75 56,8% 100 75,8% 67 50,8% 50 37,9% 39 29,5% Abbildung 12.1.: Anzahl falscher Authentizitätsbeurteilungen in der Gruppe deutscher Muttersprachler, die französischen Akzent imitieren und AEm06 mit nur je 7,6 % bzw. 9,8 % Fehlbeurteilung eingestuft. Diese zwei Sprecher produzierten also die am wenigsten authentisch klingenden Akzente. Abbildung 12.2 zeigt die Verteilung der falschen Authentizitätsurteile (Wertung als „authentisch“) für die Sprecher, die einen amerikanisch-englischen Akzent imitierten, über alle sechs Experimentdurchgänge. Interessant sind die Ergebnisse für die Gruppe der nicht-deutschen Muttersprachler mit ihren authentischen Akzentproduktionen. Diese Gruppe setzt sich aus zwei amerikanisch-englischen und vier französischen Muttersprachlern sowie je einem Muttersprachler des Italienischen, Russischen und Tschechischen zusammen. Der bilinguale Stimulus-Sprecher (russisch-deutsch) wurde in diese Gruppe nicht einbezogen. Abbildung 12.3 zeigt, dass die Akzente bei sechs der neun Sprecher dieser Gruppe vorwiegend korrekt als authentisch beurteilt wurden. Drei der neun Sprecher wurden jedoch in einer großen Mehrheit der Urteile fälschlicherweise als nicht-authentisch eingeschätzt: F-nf01 (90,2 %), F-nf02 (81,8 %) und R-nm01 (80,3 %). Die beiden französischen Muttersprachlerinnen wurden damit häufiger als nicht-authentisch gewertet als jede getestete Imitation eines französischen Akzents. Während sich die Fehlbeurteilungen für diese drei Sprecher (F-nf01, F-nf02, R-nm01) zwischen 80 % und 90 % bewegen, befinden sich die übrigen sechs Sprecher in einer Spanne von 4,5 % bis knapp 35 % Fehlbeurteilung und wurden damit mehrheitlich korrekt 234 10 20 30 40 50 60 70 80 90 AEm06 AEm04 AEm03 AEm02 AEm01 AEf04 AEf02 AEf01 Anzahl des Urteils "authentisch" (falsche Beurteilung) Sprecher 68 51,5% 19 14,4% 40 30,3% 17 12,9% 51 38,6% 80 60,6% 10 7,6% 13 9,8% Abbildung 12.2.: Anzahl falscher Authentizitätsbeurteilung in der Gruppe deutscher Muttersprachler, die amerikanisch-englischen Akzent imitieren als Sprecher eines authentischen fremdsprachigen Akzents beurteilt. Nur vier der deutschen Muttersprachler erreichten ähnlich hohe Authentizitätsbeurteilungen. Interessanterweise wurden besonders oft diejenigen nicht-deutschen Sprecher falsch beurteilt, deren muttersprachlicher Akzent im Deutschen am geringsten ausgeprägt ist: F-nf01, F-nf02, R-nm01 erhielten in den im Methodenteil dieser Arbeit beschriebenen foreign accent ratings eine Bewertung zwischen 4,2-4,9 auf einer Skala von 0-9 (vgl. Punkt 5.5.2). Zwei dieser Sprecher (F-nf01 und R-nm01) weisen zudem Merkmale eines ostmitteldeutschen Dialekts auf, z. B. Verdunklung des / a/ in Banken und haben oder des vokalischen / r/ ( [5] ) am Ende von Räuber. Das Vorhandensein dieser charakteristischen Merkmale für eine bestimmte regionale Färbung im Deutschen kann die Hörer des Experiments dazu bewegt haben, die Akzente als nicht-authentisch einzustufen. Durch informelle Gespräche mit den Hörern konnte außerdem der Faktor „Inkonsistenz“ als möglicher Indikator für eine Beurteilung der Akzente als „nicht-authentisch“ ausgemacht werden. So berichtete ein Hörer, dass er, sobald er glaubte inkonsistente Realisierungen in den Akzenten entdeckt zu haben, diese Akzente als „nicht-authentisch“ bewertete, da er davon ausginge, dass authentische Nicht-Muttersprachler des Deutschen in ihren Abweichungen vom deutschen Standard konsistent seien. 235 0 20 40 60 80 100 120 Tsch-nf01 R-nm01 I-nm01 F-nm02 F-nm01 F-nf02 F-nf01 AE-nm02 AE-nm01 Anzahl des Urteils "nicht-authentisch" (falsche Beurteilung) Sprecher 29 22% 6 4,5% 119 90,2% 108 81,8% 21 15,9% 46 34,8% 15 11,4% 106 80,3% 20 15,2% Abbildung 12.3.: Verteilung der falschen Authentizitätsurteile für die Gruppe der nicht-deutschen Muttersprachler (nach Muttersprache geordnet) 12.2.2. Teilexperiment 2 - Identifikation Das zweite Teilexperiment dient der Überprüfung von Hypothese 2, nach der deutsche Muttersprachler französische und amerikanisch-englische Akzente gut identifizieren können, und Hypothese 3, nach der imitierte Akzente besonders gut identifiziert werden. Die Aufgabenstellung für die Hörer war, den gehörten Akzent zu identifizieren. Zusätzlich wurde in diesem experimentellen Durchlauf (sechster Stimuli-Block) auch eine Authentizitätsbeurteilung der Akzente durchgeführt, deren Ergebnisse in die Auswertung des bereits beschriebenen ersten Teilexperiments eingeflossen sind. Auf jeden Sprecher entfallen 22 Identifikationsurteile (pro Hörer ein Urteil). Abbildung 12.4 fasst die Anzahl der korrekten Akzentidentifikationen für jeden Sprecher aus der Gruppe „französischer Akzent“ (links) und „amerikanischenglischer Akzent“ (rechts) in einem Diagramm zusammen. Es sind sowohl die Urteile für die Akzentimitationen (Ff..., Fm..., AEf..., AEm...) als auch für die authentischen Akzente (F-n..., AE-n...) dargestellt. Aus der Gruppe der Sprecher, die ihre Stimmen durch einen französischen Akzent verstellten, wurde der angestrebte Akzent der Sprecher in den meisten Fällen (90 %) korrekt als „französisch“ eingeschätzt. Die Beurteilung der Sprecherinnen fiel insgesamt besser aus als die der männlichen Sprecher. Bei 236 0 5 10 15 20 AE-nm02 AE-nm01 AEm06 AEm04 AEm03 AEm02 AEm01 AEf04 AEf02 AEf01 F-nm02 F-nm01 F-nf02 F-nf01 Fm07 Fm06 Fm05 Fm04 Fm03 Fm02 Fm01 Ff13 Ff11 Ff10 Ff08 Ff07 Ff05 Ff04 Ff02 Ff01 Anzahl korrekter Akzentidentifikation Sprecher 20 22 21 20 20 21 20 21 22 21 13 20 21 21 16 19 19 10 14 14 19 22 22 22 22 20 22 21 19 0 Ff Fm F-n AEf AEm AE-n Abbildung 12.4.: Anzahl korrekter Akzentidentifikationen in den Gruppen „französischer Akzent“ und „amerikanisch-englischer Akzent“ allen neun Sprecherinnen lag die Anzahl der korrekten Antworten jeweils zwischen 20 und 22. Das heißt, dass der angestrebte Akzent zweier Sprecherinnen (Ff02 und Ff13) von allen Hörern als „französischer Akzent“ erkannt wurde, bei drei Sprecherinnen von 21 Hörern und bei den übrigen vier Sprecherinnen von immerhin 20 Hörern. Bei den männlichen Sprechern, die einen französischen Akzent imitierten, scheint sich die korrekte Zuordnung etwas schwieriger zu gestalten: Fünf von sieben Sprechern wurden von 19 bis 21 Hörern korrekt beurteilt. Bei zwei Sprechern lag die Anzahl der korrekten Antworten jedoch bei nur 13 bzw. 16. Große Unterschiede in der korrekten Beurteilung des gesprochenen Akzents gab es in der Gruppe der vier französischen Muttersprachler. Während der Akzent der Sprecherin F-nf01 von 19 von 22 Hörern korrekt als französischer Akzent identifiziert wurde, waren es bei Sprecherin F-nf02 nur 10 korrekte Antworten. Die anderen Hörer gaben an, den Akzent der Sprecherinnen nicht zu erkennen. Der Akzent beider männlicher französischer Muttersprachler wurde von jeweils nur 14 Hörern korrekt erkannt. Jeweils fünf bzw. sechs Hörer konnten den Akzent nicht einschätzen. Weitere angegebene Akzente waren unter anderem Tschechisch, Türkisch und Russisch. In Tabelle 12.1 ist die Anzahl der korrekten und falschen (bzw. nicht angegebenen) Akzentzuordnungen für die Gruppe „französischer Akzent“ (imitiert und authentisch) dargestellt. 237 Tabelle 12.1.: Anzahl der korrekt und falsch / nicht zugeordneten Akzente in der Gruppe „französischer Akzent“ Deutsch ( ♀ ) Ff01 Ff02 Ff04 Ff05 Ff07 Ff08 Ff10 Ff11 Ff13 korrekt 20 22 21 20 20 21 20 21 22 falsch/ nicht 2 0 1 2 2 1 2 1 0 Deutsch ( ♂ ) Fm01 Fm02 Fm03 Fm04 Fm05 Fm06 Fm07 korrekt 21 13 20 21 21 16 19 falsch/ nicht 1 9 2 1 1 6 3 Französisch F-nf01 F-nf02 F-nm01 F-nm02 korrekt 19 10 14 14 falsch/ nicht 3 12 8 8 Die Anzahl der korrekten Akzentidentifikationen war in der Gruppe der Sprecher, die einen amerikanisch-englischen Akzent imitierten, mit fast 97 % korrekter Zuordnung ebenfalls sehr hoch. Bei fünf von acht Sprechern (zwei weiblich, drei männlich) erkannten alle Hörer einen englischen Akzent, mindestens die Hälfte von ihnen spezifizierte ihre Aussage sogar durch die Angabe „amerikanisch-englischer Akzent“. Bei drei der acht Sprecher lag die Anzahl der korrekten Akzentzuordnungen zwischen 19 und 21. Die Akzentzuordnungen für die zwei amerikanisch-englischen Muttersprachler fielen sehr unterschiedlich aus. Der Akzent von Sprecher AE-nm01 wurde von 19 Sprechern als englischer (davon elfmal als amerikanisch-englischer) Akzent beurteilt. Dahingegen erkannte keiner der Hörer den Akzent des Sprechers AEnm02 als englischen oder amerikanisch-englischen Akzent. Die meisten Hörer glaubten stattdessen, einen russischen Akzent zu erkennen (neun Hörer) oder gaben an, den Akzent nicht zu erkennen (fünf Hörer). In Tabelle 12.2 ist die Anzahl der korrekten und falschen (bzw. nicht angegebenen) Akzentzuordnungen für die Gruppe „amerikanisch-englischer Akzent“ (imitierter und authentischer Akzent) dargestellt. Die Auswertung der Akzentzuordnungen in der Foils-Gruppe ergab, dass die Akzente der authentischen Muttersprachler (italienischer, russischer, tschechischer Akzent) schlechter zugeordnet wurden als der imitierte russische Akzent produziert von einem deutschen und einem bilingualen Sprecher. Tatsächlich konnten zwölf Hörer dem russischen Muttersprachler (R-nm01) keinen Akzent zuordnen, fünf glaubten einen französischen Akzent zu erkennen und fünf waren der Meinung, dass es ein deutscher Muttersprachler ist, der keinen Akzent spricht oder imitiert. Ähnlich verhielt es sich bei dem italienischen Muttersprachler (I-nm01): Der italienische Akzent wurde von keinem der Hörer erkannt, die meisten (acht von 22) vermuteten einen russischen Akzent oder konnten keine Angabe machen (fünf Hörer). Der Akzent der tschechischen Muttersprachlerin (Tsch-nf01) wurde dreimal korrekt erkannt, die meisten Hörer glaubten jedoch einen russischen Akzent (sechs Hörer) zu erkennen oder 238 Tabelle 12.2.: Anzahl der korrekt und falsch / nicht zugeordneten Akzente für die Gruppe „amerikanisch-englischer Akzent“ Deutsch ( ♀ ) AEf01 AEf02 AEf04 korrekt 19 22 22 falsch 3 0 0 Deutsch ( ♂ ) AEm01 AEm02 AEm03 AEm04 AEm06 korrekt 22 22 20 22 21 falsch 0 0 2 0 1 Englisch (AE) AE-nm01 AE-nm02 korrekt 19 0 falsch 3 22 Tabelle 12.3.: Anzahl der korrekt und falsch / nicht zugeordneten Akzente in der Foils-Gruppe Sprecher N korrekte Zuordnung N falsche/ keine Zuordnung I-nm01 0 22 Tsch-nf01 3 (aber insges. 16 x slawisch) 19 (bei „slawisch“ 6) R-nm01 0 22 R-biling-m01 19 (aber insges. 20 x slawisch) 3 (bei „slawisch“ 2) Rm01 19 (aber insges. 22 x slawisch) 3 (bei „slawisch“ 0) konnten keine Angabe (fünf Hörer) machen. Weitere Akzente, die bei dieser Sprecherin angegeben wurden, waren Polnisch, Slowakisch und Holländisch. Fasst man alle slawischen oder direkt als „slawisch“ angegebenen Akzente für Tsch-nf01 unter „slawisch“ zusammen, wurde 16 Mal das Urteil „slawisch“ abgegeben. Der imitierte russische Akzent der Sprecher Rm01 und R-biling-m01 wurde von je 19 Hörern korrekt als russischer Akzent erkannt. Fasst man auch hier alle angegebenen slawischen Akzente unter „slawisch“ zusammen, erhöht sich die Anzahl der korrekten Zuordnung auf 20 (R-biling-m01) bzw. 22 (Rm01). Die Verteilung der korrekten und falschen (bzw. nicht angegebenen) Akzentzuordnungen in der Foils-Gruppe ist in Tabelle 12.3 dargestellt. Bei drei Sprechern der insgesamt neun nicht-deutschen Muttersprachler wurde der Akzent von keinem der Hörer korrekt identifiziert: AE-nm02, I-nm01, Rnm01. Zwei dieser Sprecher (AE-nm02, I-nm01) erhielten die höchsten Authentizitätsraten, der andere Sprecher (R-nm01) erhielt jedoch eine extrem geringe Authentizitätsbewertung. Dies zeigt, dass eine Nicht-Identifizierbarkeit des Akzents allein kein hinreichendes Merkmal für die Authentizität eines fremdsprachigen Akzents ist. 239 12.2.3. Zusammenführung der Ergebnisse beider Teilexperimente Abbildung 12.5 fasst die Daten aus beiden Teilexperimenten zusammen. Pro Sprecher wird die Anzahl der korrekten Akzentidentifikationen als Funktion der wahrgenommenen Authentizität des Akzents dargestellt. Es wird zwischen deutschen Muttersprachlern (26 Sprecher), deren Akzent nicht authentisch ist, und nicht-deutschen Muttersprachlern (9 Sprecher) mit authentischem Akzent unterschieden. Der bilinguale Sprecher ist der Gruppe der deutschen Muttersprachler zugeordnet, da er Deutsch üblicherweise akzentfrei spricht, und den russischen Akzent für dieses Experiment nur imitiert hat. Für die Gruppe „amerikanisch-englischer Akzent“ wurden alle angegebenen Varietäten des Englischen (Englisch, amerikanisches Englisch, australisches Englisch) zusammengefasst. Ebenso wurde bei der Sprecherin Tsch-nf01 und bei den Sprechern R-nm01, Rm01 und R-biling-m01 verfahren - hier wurden alle slawischen Akzente zusammengefasst. Wie man anhand der Abbildung 12.5 gut erkennen kann, waren die deutschen Stimulus-Sprecher bei der Akzentimitation so erfolgreich, dass der angestrebte Akzent in den meisten Fällen von fast allen Hörern korrekt benannt wurde. Aus perzeptorischer Perspektive betrachtet bedeutet das auch, dass die Hörer des Perzeptionsexperiments insgesamt sehr erfolgreich in der Zuordnung der Akzente waren. Es fällt auf, dass die Akzentzuordnung bei den nicht-deutschen Muttersprachlern, d. h. bei Sprechern eines authentischen Akzents, für die Hörer weitaus schwieriger war. Immerhin konnten die authentischen Akzente bei drei von neun nicht-deutschen Muttersprachlern von keinem der Hörer und bei weiteren vier Sprechern nur von maximal 16 Hörern korrekt identifiziert werden. Nur die Akzente von zwei der nicht-deutschen Muttersprachler wurden ähnlich korrekt eingeschätzt wie die imitierten Akzente der meisten deutschen Muttersprachler. Im Gegensatz dazu wurde nur ein deutscher Muttersprachler mit „nur“ 13 korrekten Akzentidentifikationen mit Abstand am schlechtesten in der Gruppe der deutschen Muttersprachler beurteilt. Diese Ergebnisse bestätigen die unter Punkt 12.1.1 aufgestellte Hypothese 3, wonach die Hörer imitierte Akzente gut zuordnen können. Die imitierten französischen Akzente wurden zu 90 % korrekt als „französisch“ und die imitierten amerikanisch-englischen Akzente wurden zu 97 % korrekt als „englisch“ identifiziert. Dabei scheint es bei einer Gruppengröße von 22 Hörern einen Schwellenwert von 19 korrekten Identifikationen zu geben, ab dem die Akzentimitation so erfolgreich ist, dass der Akzent erkannt wird. Dass lässt sich vermutlich auf eine für Hörer und Sprecher gemeinsame Vorstellung über stereotype phonetische Muster zurückführen, die als charakteristisch für bestimmte fremdsprachige Akzente gelten. Außerdem scheinen die deutschen Sprecher diese stereotypen Muster bei der Akzentimitation relativ erfolgreich anzunehmen. Torstensson et al. (2004) zeigen, dass es bei der Imitation eines fremdsprachigen Akzents eine große Menge an Übereinstimmungen zwischen den Variatio- 240 0 5 10 15 20 25 0 20 40 60 80 100 120 140 Anzahl der korrekten Akzentidentifikation Anzahl des Urteils "authentisch" max max Nicht-Muttersprachler deutsche Muttersprachler Abbildung 12.5.: Zusammenhang zwischen Authentizitätsbeurteilung und korrekter Akzenteinschätzung nen der Sprecher gibt. Sie gehen daher davon aus, dass die Probanden einen kognitiven Prototypen des Akzents haben, der innerhalb der Sprechergruppe eine hohe Ähnlichkeit aufweist. Im Vergleich dazu scheinen, so lassen es die Ergebnisse dieser Studie vermuten, nicht-deutsche Muttersprachler in ihren authentischen Akzenten viel weniger dieser stereotypen Muster aufzuweisen als erwartet wird. Denn die Hörer der Studie sind schlechter in der Lage, authentische Akzente zu bestimmen. Aufgrund der zum Teil deutlich schlechteren Zuordnung der authentischen Akzente kann Hypothese 2 - Hörer können französische und amerikanisch-englische Akzent aufgrund ihrer Bekanntheit gut identifizieren - nicht bestätigt werden. Trotz erfolgreicher Imitation bis zu dem Grad, dass der Akzenttyp erkannt wird, gelang es den Sprechern unterschiedlich gut, den Akzent so zu imitieren, dass er als authentisch angenommen wird. Die Variationsbreite in der Authentizitätsbeurteilung ist sehr groß. Die Spanne des Urteils „authentisch“ für die von den deutschen Muttersprachlern produzierten Akzente reicht von 10 bis 110 (von möglichen 132). Es ergibt sich ein Mittelwert von 55,04 (41,6 %) als authentisch bewerteten Akzentimitationen bei einer Standardabweichung von 25,8. Interessant ist, dass sich bei einer Sortierung der deutschen Muttersprachler nach der Anzahl des Urteils „authentisch“ akzentspezifische Tendenzen herausbilden: Die vier Akzente, die am seltensten als authentisch eingestuft 241 wurden, sind Imitationen eines amerikanisch-englischen Akzents und die drei Akzente, die am häufigsten als authentisch eingeschätzt wurden, sind Imitationen eines französischen Akzents. Diese Ergebnisse zur Authentizitätsbeurteilung imitierter Akzente decken sich auch mit den Ergebnissen aus Markham (1999) zur Dialektimitation: die Fähigkeit, einen authentisch wirkenden Dialekt / Akzent zu imitieren, variiert zwischen verschiedenen Sprechern sehr stark. Überraschend ist jedoch, dass für die Authentizitätsbeurteilung der authentischen Akzente der nicht-deutschen Muttersprachler dieser Studie die Streuung um den Mittelwert von 79,2 ebenfalls sehr hoch ist (s = 46,1; Spannweite R = 114). Wie bereits oben beschrieben, wurde dabei der Akzent von zwei Dritteln der Sprecher (sechs von neun) mehrheitlich korrekt als authentisch beurteilt und nur bei einem Drittel der Sprecher fälschlicherweise mehrheitlich als nicht-authentisch eingestuft. Zwischen diesen beiden Untergruppen liegt eine Spannweite von 62. Die unter Punkt 12.1.1 aufgestellte Hypothese 1, nach der deutsche Muttersprachler in der Lage sind, einen authentischen von einem nicht-authentischen Akzent zu unterscheiden, kann folglich nicht bestätigt werden, da die Varianz sowohl in der Sprechergruppe der deutschen Muttersprachler als auch in der Sprechergruppe der nicht-deutschen Muttersprachler zu groß ist. Die schlechte Leistung der Hörer bei der Authentizitätsbeurteilung kann einerseits mit der unterschiedlichen Fähigkeit oder Leistung der deutschen Muttersprachler bei der Akzentimitation zusammenhängen. Andererseits spielt vermutlich bei den nicht-deutschen Muttersprachlern aber auch das unterschiedliche Kompetenzniveau in der Fremdsprache Deutsch eine Rolle, da nicht-deutsche Sprecher mit geringerem fremdsprachigen Akzent mehrheitlich als nicht-authentisch bewertet wurden. 12.3. Zusammenfassung Das vorgestellte Hörexperiment hat die Imitation fremdsprachiger Akzente von perzeptiver Seite untersucht. Hypothese 1 - deutsche Muttersprachler können einen authentischen von einem nicht-authentischen Akzent unterscheiden - konnte nicht bestätigt werden. Es zeigt sich, dass sowohl die authentische Imitation eines fremdsprachigen Akzents als auch die Authentizitätsbeurteilung eines gehörten fremdsprachigen Akzents sehr komplexe Aufgaben für Sprecher und Hörer sind. Hypothese 2 - deutsche Muttersprachler können französische und amerikanisch-englische Akzente gut identifizieren, da sie ihnen aus dem (medialen) Alltag bekannt sind - konnte nicht bestätigt werden. Zwar wurden diese beiden Akzente in 85-86 % der Fälle korrekt identifiziert, allerdings ist die Variation zwischen der Identifikation authentischer und imitierter Akzente 242 recht hoch. Außerdem müsste zum besseren Vergleich mit anderen Akzenten eine größere Datenbasis an Stimuli für die anderen Akzente vorliegen. Hypothese 3 - die Akzentidentifikation wird bei einem imitierten Akzent erleichtert - konnte bestätigt werden. Sowohl die imitierten französischen Akzente als auch die imitierten amerikanisch-englischen Akzente wurden häufiger korrekt als „französisch“ bzw. „englisch“ identifiziert als die entsprechenden authentischen Akzente. Die erfolgreiche Identifikation imitierter Akzente kann durch eine gemeinsame Vorstellung über die stereotypen Muster dieser Akzente auf der Seite der Sprecher und Hörer erklärt werden. Die weniger erfolgreiche Identifizierung der authentischen Akzente lässt darauf schließen, dass authentische nicht-deutsche Muttersprachler weniger dieser stereotypen Muster in ihrem Deutsch aufweisen als von den Hörern erwartet wird. Die in diesem Kapitel beschriebene Untersuchung wurde in Neuhauser und Simpson (2007a) veröffentlicht. Witecy (2010) (zum Teil publiziert in Witecy et al., 2010) greift diese Untersuchung auf und bettet sie in eine klinischlinguistische Untersuchung zum Foreign Accent Syndrome 2 (im Folgenden „FAS“) ein. Witecy (2010) untersucht die Beurteilung des Akzents einer FAS- Patientin durch verschiedene Hörergruppen. 36 deutschsprachigen sprachtherapeutischen Studierenden und 13 Sprechern mit verschiedenen Muttersprachen außer Deutsch wurden Stimuli mit authentischen und imitierten fremdsprachigen Akzenten sowie mit Produktionen der FAS-Patientin vorgespielt. Bei den Stimuli mit imitierten und authentischen fremdsprachigen Akzenten handelt es sich um die in der vorliegenden Arbeit verwendeten Stimuli, d. h. der oben beschriebene Stimulus-Satz gesprochen von denselben Sprechern. Von der FAS-Patientin wurde ebenfalls der Satz Die verstärkten Sicherheitsvorkehrungen der Banken könnten Räuber abgeschreckt haben. als Stimulus-Satz verwendet. Die Hörer hatten die Aufgabe, die Identität des Akzents einzuschätzen und die Sicherheit in dieser Beurteilung anzugeben sowie die Authentizität und die Stärke der Akzente auf einer zehnstufigen Skala zu bewerten. Vor einem zweiten Experiment-Durchgang erhielt ein Teil der Hörer außerdem Informationen über Merkmale eines französischen oder eines russischen Akzents im Deutschen. Dadurch sollte der Einfluss expliziten phonetischen Wissens auf die Beurteilung der Akzente untersucht werden. Die Untersuchung ist aus verschiedenen Gründen für die vorliegende Arbeit von Interesse. Zum einen werden die Ergebnisse zur Beurteilung der Akzentauthentizität und -identität anhand einer anderen Hörergruppe überprüft. Zum anderen wird auch der Einfluss untersucht, den die Muttersprache der Hörer oder das explizite phonetische Wissen der Hörer auf ihre Akzentbeurteilung haben. Die Ergebnisse von Witecy (2010) unterstützen die Ergebnisse der vorliegenden Arbeit: 2 Mit Foreign Accent Syndrome wird eine relativ seltene motorische Sprechstörung bezeichnet, die neurogene und / oder psychogene Ursachen haben kann (vgl. Verhoeven und Marïen, 2010). Hörer nehmen die Sprache von FAS-Patienten häufig als fremdsprachig-akzentuiert oder dialektal abweichend von deren früheren Aussprache wahr, da sie durch segmentelle und prosodische Variation gekennzeichnet ist (z. B. Dankoviˇ cová et al., 2001; Kanjee et al., 2010). 243 1. Hörer sind besser in der Lage, die Identität eines Akzents zu erkennen als seine Authentizität korrekt zu beurteilen. 2. Die Identität der imitierten Akzente wird signifikant häufiger korrekt beurteilt als die Identität der authentischen Akzente. 3. Die imitierten französischen Akzente werden häufiger als authentisch bewertet als die imitierten amerikanisch-englischen Akzente. Außerdem konnte Witecy (2010) einen mittleren positiven Zusammenhang zwischen der beurteilten Akzentstärke und der Akzentidentifikation feststellen. So wurden als stärker bewertete Akzente häufiger korrekt und mit größerer Sicherheit identifiziert als schwächere Akzente. Die Vermittlung von phonetischem Wissen über französischen Akzent im Deutschen hatte einen positiven Einfluss auf die Identifikation der französischen Akzente, jedoch nicht auf deren Authentizitätsbeurteilung. Die Untersuchung des Einflusses der Muttersprache der Hörer auf die Akzentbeurteilung erweist sich aufgrund der heterogenen Hörergruppe (13 Hörer mit 11 verschiedenen Muttersprachen) als sehr problematisch und statistisch nicht auswertbar. Interessant ist allerdings, dass die französische Muttersprachlerin der Untersuchung in der Beurteilung „französischer“ Akzente schlechter abschneidet als die Gruppe der 36 deutschen Muttersprachler. Dies deutet darauf hin, dass die Fähigkeit, einen fremdsprachigen Akzent hinsichtlich seiner Identität und Authentizität zu beurteilen, zwischen Hörern stark variiert. Allerdings müsste die nicht-deutsche Hörergruppe vergrößert werden und homogener aufgebaut sein, um valide Erkenntnisse darüber zugewinnen, ob sich die Leistungen deutscher und nicht-deutscher Muttersprachler bei der Beurteilung eines fremdsprachigen Akzents unterscheiden. Inwiefern Korrelationen zwischen den Ergebnissen des Perzeptionsexperiments der vorliegenden Arbeit und den Ergebnissen der auditiven und akustischen Analyse der Produktionen der Sprecher bei der Stimmverstellung bestehen, wird noch zu überprüfen sein. Torstensson et al. (2004) weisen beispielsweise darauf hin, dass das Fehlen eines wichtigen oder markanten Merkmals einer Sprache bzw. eines Akzents in Kombination mit dem Vorhandensein anderer markanter Merkmale Hinweise darauf geben kann, dass der vorliegende Akzent imitiert und nicht authentisch ist. Eine erste Einschätzung der Stimuli scheint das zu bestätigen: Das Vorhandensein typisch deutscher phonetischphonologischer Muster, die entweder von nicht-deutschen Muttersprachlern erfolgreich angenommen wurden oder von deutschen Muttersprachlern nicht verborgen werden konnten, scheint die Authentizität der Akzente in beiden Fällen - sowohl beim imitierten als auch beim authentischen Akzent - in Frage zu stellen. Das kann die niedrige Authentizitätsrate bei den nicht-deutschen Muttersprachlern mit geringem fremdsprachigen Akzent und regionaler Färbung, aber auch die niedrigen Authentizitätswerte bei deutschen Muttersprachlern erklären, die z. B. trotz Verstellung Endsilben reduziert haben und silbische Nasale statt Vokal-Nasal-Sequenzen realisieren. 244 13. Phonetische Korrelate der Akzent-Authentizität Dieses Kapitel dient der Untersuchung, welche phonetisch-phonologischen Muster einen Einfluss auf die Authentizitätsbeurteilung imitierter oder authentischer fremdsprachiger Akzente haben. Dazu werden sowohl die Ergebnisse der auditiven und akustischen Analyse der Akzentproduktionen (vgl. Teil IV) als auch die Ergebnisse des Perzeptionsexperiments I einbezogen. Um mögliche Korrelate der Akzent-Authentizität zu ermitteln, bietet es sich zunächst an, die Stimuli miteinander zu vergleichen, die am häufigsten als authentisch und am häufigsten als unauthentisch gewertet wurden. Aus der Gesamtgruppe der 35 Stimuli aus Perzeptionsexperiment I wurden daher vier Gruppen mit je drei Sprechern ausgewählt: 1. die am authentischsten klingenden deutschen Muttersprachler, d. h. drei Imitationen eines französischen Akzents: Fm04, Ff04, Ff07, 2. die am wenigsten authentisch klingenden deutschen Muttersprachler, d. h. drei Imitationen eines amerikanisch-englischen Akzents: AEm04, AEm06, AEm01, 3. die am authentischsten klingenden nicht-deutschen Muttersprachler, d. h. ein französischer, ein amerikanisch-englischer und eine tschechische Muttersprachler/ in: F-nm01, AE-nm01, Tsch-nf01, 4. die am wenigsten authentisch klingenden nicht-deutschen Muttersprachler, d. h. zwei französische und ein russischer Muttersprachler/ in: F-nf01, F-nf02, R-nm01. Bei einem auditiven Vergleich der Produktionen dieser Sprecher im Stimulus- Satz fielen v. a. folgende Muster als potenzielle phonetische Korrelate der Akzent-Authentizität auf: Realisierung der Endsilbe / -@n/ , Realisierung des / h/ , Glottalisierung in Vokaljunkturen sowie die Realisierung von postvokalischem und initialem / r/ . In den folgenden Abschnitten wird der Wert dieser Muster als phonetische Korrelate für die Akzentauthentizität diskutiert. Im Zentrum der Betrachtungen stehen dabei die vier obengenannten Gruppen der Stimulus-Sprecher und ihre Realisierung von Vokaljunkturen und von / h/ sowie die Realisierung der Endsilbe / -@n/ , da hier ein Bezug zum Produktionsteil der Arbeit (Teil IV) hergestellt werden kann. Die Realisierung der Endsilbe / -@n/ wird besondere Beachtung finden und durch ein weiteres Perzeptionsexperiment gesondert untersucht. Zu den Ergebnissen zur Realisierung von / r/ sei auf Neuhauser und Simpson (2007b) verwiesen, wo ein Teil der hier vorgestellten Ergebnisse publiziert wurde. 245 13.1. Realisierung des / h/ und Glottalisierung in Vokaljunkturen Die Analyse zur Realisierung von Glottalisierung und glottaler Friktion in Kapitel 10 hat gezeigt, dass deutsche Muttersprachler bei der Imitation eines französischen Akzents zwar kaum systematische Variationen bei der Realisierung von Vokaljunkturen vornehmen, allerdings mehrheitlich glottale Friktion unterdrücken und sie durch junkturelle Glottalisierung ersetzen. Die französischen Muttersprachler auf der anderen Seite weichen von ihren gewohnten glottalen Strategien im Silbenanlaut ab und realisieren in ihren deutschen Produktionen sowohl glottalisierte Vokaljunkturen als auch glottale Friktion. Aufgrund starker Variation in der akustischen Ausprägung von junktureller Glottalisierung in den Produktionen der deutschen und französischen Muttersprachler wurde geschlussfolgert, dass dieses Muster für die Unterscheidung zwischen imitierten und authentischen französischen Akzenten im Deutschen wenig geeignet ist. Dahingegen ist die Analyse der Realisierung von / h/ vielversprechender, da sich in diesem Muster nicht nur die imitierten von den authentischen französischen Akzenten unterscheiden, sondern bei einer detaillierten Betrachtung auch die deutschen Produktionen der französischen Muttersprachler von den unverstellten Produktionen deutscher Muttersprachler abweichen. Die glottalen Strategien im Silbenanlaut scheinen auch die Authentizitätsbeurteilung der französischen Akzente durch die Hörer im Perzeptionsexperiment zu beeinflussen. Die Stimulus-Sätze der Sprecher mit den am authentischsten und am unauthentischsten bewerteten Akzenten (vgl. die oben beschriebenen vier Gruppen) wurden auf die Realisierung von / h/ (in Sicherheitsvorkehrungen und haben) sowie auf die Realisierung der Vokaljunktur (in Räuber abgeschreckt) untersucht 1 . Die beiden französischen Muttersprachlerinnen F-nf01 und F-nf02 gehören zur Gruppe der am wenigsten authentisch klingenden nicht-deutschen Muttersprachler (Gruppe 4). Sie wurden nicht nur von der Mehrheit der Hörer fälschlicherweise als nicht-authentisch beurteilt, sondern erhielten von allen getesteten echten und imitierten französischen Akzenten am häufigsten das Urteil „nicht-authentisch“: F-nf01 in 90% der Fälle und Sprecherin F-nf02 in knapp 82% der Fälle. Damit wurden sie als „unauthentischer“ wahrgenommen als die tatsächlich imitierten französischen Akzente. Beiden Sprecherinnen ist gemeinsam, dass sie sowohl in Sicherheitsvorkehrungen als auch zu Beginn von haben glottale Friktion realisieren. Die drei deutschen Muttersprachler, deren Akzentimitationen am häufigsten als authentisch gewertet wurden, sind Fm04, Ff04 und Ff07 (Gruppe 1). Die beurteilte Authentizität dieser Imitationen eines französischen Akzents lag bei 76% für Sprecher Fm04, 71% für Ff04 und 64% für Ff07. In ihren Produktionen 1 Im Folgenden werden ausschließlich die Ergebnisse zu den französischen Akzenten berücksichtigt, nicht jedoch die der amerikanisch-englischen Akzentimitationen oder des authentischen russischen oder tschechischen Akzents. 246 des Stimulus-Satzes haben sie / h/ zumeist nicht durch glottale Friktion realisiert, sondern durch junkturelle Glottalisierung ersetzt und damit in ihren Imitationen ein stereotypes Muster französischer Muttersprachler angenommen. Sprecherin Ff07 realisiert das / r/ in Sicherheitskonsonantisch und schließt den Diphthong direkt, d. h. ohne vorausgehende glottale Friktion oder Glottalisierung, an. Aufgrund einer generell behauchten Stimmqualität der Sprecherin erweist sich die Beurteilung dieses Falles als schwierig, es entsteht aber der auditive Eindruck einer Resyllabifizierung. Zu Beginn von haben realisiert diese Sprecherin glottale Friktion. Dies ist der einzige Fall von glottaler Friktion in dieser Gruppe. Die Vokaljunktur in Räuber abgeschreckt wurde von allen Stimulus-Sprechern der Gruppen 1-4, d. h. der am authentischsten und am nicht-authentischsten klingenden authentischen und imitierten Akzente, mit junktureller Glottalisierung realisiert. Sprecherin Ff07 realisiert das finale / r/ in Räuber zwar konsonantisch, es folgt jedoch ein deutlich glottalisierter Vokal, sodass die Junktur als glottalisiert gewertet wurde. Die Beurteilung der Realisierung von F-nm01 ist problematisch, da der Sprecher zögert und eine lange Pause zwischen Räuber und abgeschreckt realisiert, die vermutlich mit einem glottalen Verschluss einhergeht. Wie in Kapitel 10 diskutiert, ist die Beurteilung des Vokaleinsatzes nach einer Pause oft nicht zweifelsfrei möglich. Die lange Pause mit mutmaßlicher glottaler Verschlussbildung sowie die unregelmäßig einsetzende Stimmlippenschwingung rechtfertigen hier aber die Wertung als glottalisierte Vokaljunktur. Die Ergebnisse deuten darauf hin, dass die Realisierung von glottaler Friktion für / h/ durch französische Muttersprachler zu einer Bewertung des Akzents als nicht-authentisch führt, während das Vermeiden glottaler Friktion bei imitierten französischen Akzenten zum Erfolg der Verstellung führt. Dies unterstützt die Vermutung, dass das Nicht-Vorhandensein von glottaler Friktion zu den stereotypen Merkmalen eines französischen Akzents im Deutschen gehört. Allerdings wurde auch der authentische Akzent von Sprecher F-nm01 mehrheitlich (83%) als authentisch gewertet (Gruppe 3), obwohl er wie die als nichtauthentisch gewerteten französischen Muttersprachlerinnen (F-nf01, F-nf02) in Sicherheitsvorkehrungen und haben glottale Friktion realisiert. Mit großer Wahrscheinlichkeit besteht hier aber ein starker Zusammenhang zwischen der beurteilten Akzentauthentizität und dem deutlich verzögerten Sprechfluss des Sprechers im beurteilten Stimulus-Satz. Zusammenfassend lässt sich festhalten, dass deutsche Muttersprachler das Nicht-Vorhandensein glottaler Friktion für / h/ als typisches Merkmal eines französischen Akzents im Deutschen ansehen. Zum einen unterdrücken deutsche Muttersprachler bei der Imitation eines französischen Akzents meist glottale Friktion. Zum anderen hat ein Vergleich der durch Hörer als authentisch bewerteten imitierten französischen Akzente mit als nicht-authentisch bewerteten echten französischen Akzenten gezeigt, dass das Fehlen von glottaler Friktion zum Eindruck eines authentischen französischen Akzents beiträgt. Das Vor- 247 handensein glottaler Friktion scheint zum gegenteiligen Eindruck beizutragen. Die Realisierung von Vokaljunkturen scheint sowohl bei der Akzentimitation als auch bei der Authentizitätsbeurteilung eine untergeordnete Rolle zu spielen. Es kommt weder zu einer systematischen Variation bei der Akzentimitation, noch scheint ein glottalisierter Vokalübergang in imitierten und authentischen französischen Akzenten die Authentizitätsbewertung der Akzente zu beeinflussen. Dies lässt vermuten, dass es sich bei der Realisierung von Vokaljunkturen um ein Muster handelt, das deutschen Muttersprachlern weniger bewusst ist als das Muster der Realisierung von / h/ . 13.2. Realisierung der Endsilbe / -@n/ Wie in Kapitel 11 beschrieben, wird in der deutschen Standardaussprache sowohl in gelesener als auch in spontansprachlicher Sprache die Endsilbe / -@n/ in der Regel nicht voll realisiert, sondern reduziert. Insgesamt 2227 Endsilben aus verschiedenen Texten und Aufnahmen wurden in Hinblick auf eine volle oder reduzierte Realisierung analysiert. Die Ergebnisse lassen darauf schließen, dass unter den deutschen Muttersprachlern eine gemeinsame Vorstellung darüber zu existieren scheint, dass das mit französischem Akzent gesprochene Deutsch u. a. durch eine volle, und nicht wie üblich im Standarddeutschen reduzierte, Endsilbenrealisierung gekennzeichnet ist. Diese gemeinsame Vorstellung äußert sich durch eine Produktion vorwiegend voll realisierter Endsilben bei der Verstellung durch einen französischen Akzent. Ein Vergleich der Stimulus-Produktionen in den vier oben genannten Gruppen zeigt, dass die Realisierung der Endsilbe / -@n/ für deutsche Hörer ausschlaggebend für die Einschätzung eines fremdsprachigen Akzents als authentisch oder nicht-authentisch sein kann. So werden die Sprecher, deren Produktionen eine Reduktion der Endsilbe / -@n/ durch Elision des Schwa und Realisierung eines silbischen Nasals aufweisen, z. B. [ha: bm" ] oder [ha: m: ] anstelle von [ha: b@n] (haben) oder [fE5“StE5 “kt n n" ] anstelle von [fE5“StE5 “kt@n] (verstärkten), häufig als nicht-authentisch beurteilt. Im Gegensatz dazu führte eine volle Realisierung der Endsilbe / -@n/ jedoch häufig zu einer Beurteilung als authentisch. In den am häufigsten als authentisch bewerteten authentischen und imitierten Akzenten (Gruppe 1 und Gruppe 3) wurden 25 von 30 Endsilben voll realisiert. Drei der Sprecher aus diesen Gruppen waren konsistent in ihrer vollen Realisierung. In den am häufigsten als nicht-authentisch bewerteten authentischen und imitierten Akzenten (Gruppe 2 und Gruppe 4) hingegen wurden 22 von 30 Endsilben reduziert. Ebenfalls drei der Sprecher aus diesen Gruppen waren in der Reduktion von Endsilben im Stimulus-Satz konsistent. Zur weiteren Überprüfung der Relevanz der Endsilbenrealisierung auf die Authentizitätsbeurteilung von französischen Akzenten im Deutschen werden folgende zwei Fragen getestet: 248 1. Ist die Realisierung der Endsilbe / -@n/ ausschlaggebend für die Authentizitätsbeurteilung von französischen Akzenten? 2. Kann eine Manipulation der Endsilben im Stimulus-Satz, z. B. durch Elision von Schwa und Einfügen eines silbischen Nasals anstelle einer vollen Endsilbenrealisierung, Hörer in ihrer Authentizitätsbeurteilung beeinflussen? Der im Perzeptionsexperiment I verwendete Stimulus-Satz Die verstärkten Sicherheitsvorkehrungen der Banken könnten Räuber abgeschreckt haben. enthält fünfmal die Endsilbe / -@n/ . Er wurde für zwölf von insgesamt 16 Stimulus- Sprechern mit französischem Akzent analysiert. Diese zwölf Sprecher gehören zu den folgenden vier Gruppen, die sich aus den Ergebnissen aus Perzeptionsexperiment I ergeben: 1. die vier als am authentischsten bewerteten deutschen Muttersprachler, die französischen Akzent imitieren (Fm04, Ff04, Ff07, Fm03), 2. die vier als am unauthentischsten bewerteten deutschen Muttersprachler, die französischen Akzent imitieren (Ff05, Fm07, Ff10, Ff02), 3. die zwei als am authentischsten bewerteten französischen Muttersprachler (F-nm01, F-nm02), 4. die zwei als am unauthentischsten bewerteten französischen Muttersprachler (F-nf01, F-nf02). Abbildung 13.1 zeigt für die ausgewählten zwölf Sprecher des französischen Akzents den Zusammenhang zwischen der Authentizitätsbeurteilung im Perzeptionsexperiment I und ihrer Realisierung der Endsilben im Stimulus-Satz. Auf der einen Seite reduzierten nur drei der sechs als authentisch bewerteten Sprecher die Endsilbe / -@n/ im Stimulus-Satz. All diese Reduktionen betrafen jedoch nur einen von fünf möglichen Fällen - jeweils das Wort haben. Auf der anderen Seite reduzierten fünf der sechs als nicht-authentisch bewerteten Sprecher die finale Endsilbe mindestens einmal und maximal fünfmal. Interessanterweise werden die zwei am häufigsten als nicht-authentisch gewerteten Akzente von den beiden französischen Muttersprachlerinnen produziert. Sie realisierten im Stimulus-Satz zweibzw. fünfmal reduzierte Endsilben und das nicht nur nach bilabialem Plosiv in haben, sondern auch in anderen Fällen. Diese Ergebnisse deuten daraufhin, dass nicht nur die volle bzw. reduzierte Realisierung der Endsilbe / -@n/ einen Einfluss auf die Authentizitätsbeurteilung französischer Akzente im Deutschen hat, sondern, dass der der Endsilbe vorausgehende Konsonant für diese Einschätzung ebenfalls von Wert ist. Wenn eine volle bzw. reduzierte Realisierung von Endsilben im Deutschen für die Einschätzung der Authentizität eines französischen Akzents von Bedeutung ist, so liegt die Vermutung nahe, dass eine diesbezügliche Manipulation der Endsilben die Authentizitätsbeurteilung beeinflussen kann. Vorstellbar wäre, dass, wenn die voll realisierten Endsilben eines Sprechers, dessen Akzent im 249 0 20 40 60 80 100 0 1 2 3 4 5 Urteil "authentisch" (in %) Anzahl an Reduzierungen von Endsilben 50 % franz. Muttersprachler dt. Muttersprachler Abbildung 13.1.: Zusammenhang zwischen Authentizitätsbeurteilung und Realisierung der Endsilben Perzeptionsexperiment I als authentisch beurteilt wurde, durch silbische Nasale ersetzt werden, der Akzent dieses Sprechers in einem anschließenden Perzeptionsexperiment nicht länger als authentisch eingestuft wird. Um diese Vermutung zu überprüfen, wurden die Produktionen von elf von zwölf Stimulus- Sprechern hinsichtlich ihrer Endsilbenrealisierung manipuliert. Anschließend wurde in einem Perzeptionsexperiment die von Hörern wahrgenommene Authentizität dieser französischen Akzente getestet. Im Folgenden wird die Bezeichnung Perzeptionsexperiment II verwendet. Diese Untersuchung wurde in Neuhauser und Simpson (2008) publiziert. 13.2.1. Methode - Perzeptionsexperiment II Obwohl in Perzeptionsexperiment II alle in Perzeptionsexperiment I getesteten Stimuli durch Hörer beurteilt wurden, wurde nur ein Teil der Stimuli mit französischem Akzent manipuliert. Im Folgenden wird zunächst die Methodik der Manipulation der Endsilben beschrieben. Es schließt sich die Darstellung des experimentellen Aufbaus von Perzeptionsexperiment II an. 250 Manipulation der Endsilben Die französischen Akzentproduktionen der sechs in Perzeptionsexperiment I als authentisch beurteilten Stimulus-Sprecher wurden mit Hilfe von Praat (Boersma und Weenink, 2008) manipuliert. Dazu wurden alle vollen Endsilbenrealisierungen durch reduzierte Formen ersetzt. Diese reduzierten Formen stammten teilweise aus anderen Aufnahmen dieser Sprecher, z. B. aus ihren unverstellten Textversionen. In anderen Fällen wurde Schwa elidiert und eine nasale Plosivlösung durch Bandpass-Filterung (0-1000 Hz) des Plosivs simuliert, z. B. in Banken. Eine weitere Möglichkeit war, die Dauer des dorsalen Nasals in Sicherheitsvorkehrungen zu verlängern, um einen silbischen dorsalen Nasal am Ende des Wortes zu erzeugen. Bei zwei Sprechern wurden jedoch die originalen Singularformen (könnte statt könnten von F-nm02 und Bank statt Banken von Ff07) beibehalten, damit ein möglicher durch die Manipulation hervorgerufener Effekt ausgeschlossen werden konnte. Die Produktionen von fünf der sechs als unauthentisch beurteilten Stimulus- Sprecher wurden manipuliert, indem die in den Originalaufnahmen reduzierten Realisierungen durch volle Realisierungen aus anderen Textversionen ersetzt wurden. Bei der französischen Muttersprachlerin F-nf02 wurden zwei reduzierte Formen beibehalten, weil eine Manipulation den Stimulus zu sehr verzerrt hätte. Der Stimulus einer deutschen Sprecherin (Ff02) wurde nicht manipuliert, da sie alle Endsilben voll realisiert hat und trotzdem als unauthentisch bewertet wurde, d. h. hier müssen andere Faktoren eine Rolle für die Authentizitätsbeurteilung gespielt haben. Da eine Verstärkung der Nicht-Authentizität dieses Akzents nicht beabsichtigt war, wurde hier auf eine Manipulation verzichtet. Durchführung Im Anschluss an die Manipulation der Endsilben wurde ein Perzeptionsexperiment durchgeführt, um zu überprüfen, ob sich die beurteilte Authentizität der französischen Akzente verändert. Der Aufbau dieses Perzeptionsexperiments entspricht nahezu dem Aufbau von Perzeptionsexperiment I (vgl. dazu Punkt 12.1) und soll daher an dieser Stelle nur noch einmal knapp zusammengefasst werden. Als Stimulus diente der Satz Die verstärkten Sicherheitsvorkehrungen der Banken könnten Räuber abgeschreckt haben.. Die Stimulus-Reihe bestand aus denselben 35 Stimuli des ersten Perzeptionsexperiments, gesprochen von 34 Sprechern (25 deutsche Muttersprachler, die einen fremdsprachigen Akzent imitieren, und 9 nicht-deutsche Muttersprachler, die Deutsch sprechen). Die 35 Stimuli wurden in fünf Blöcken mit fünf unterschiedlichen Randomisierungen vorgespielt. Das ergibt insgesamt 175 Stimuli für Perzeptionsexperiment II. Die Randomisierung aller fünf Blöcke entsprach der Randomisierung aus Perzeptionsexperiment I. 251 Die ersten zwei Blöcke waren identisch mit den ersten beiden Blöcken des ersten Perzeptionsexperiments. In den Blöcken 3-5 jedoch wurden die Stimuli von elf Sprechern 2 durch ihre Manipulationen ersetzt. Jeder Stimulus wurde durch einen 880 Hz-Ton von einer Sekunde Länge eingeleitet, gefolgt von einer Sekunde Pause. Nach jedem Stimulus erfolgte eine Pause von 5 Sekunden. Zwischen den einzelnen Blöcken gab es eine kurze Pause, die ca. 30 Sekunden dauerte. Die Hörergruppe ist vergleichbar mit der Hörergruppe aus Perzeptionsexperiment I. Als Probanden dienten Studierende des Fachs Sprechwissenschaft und Phonetik der Friedrich-Schiller-Universität Jena im Hauptstudium, die ebenfalls über ein Hauptseminar gewonnen wurden. Es handelt sich also um Hörer mit einer phonetischen Grundausbildung. Die Hörer waren 27 deutsche Muttersprachler (22 weiblich, 5 männlich) im Alter zwischen 21 und 29 Jahren (Ø 23,4 Jahre). Keiner der Hörer berichtete von Höreinschränkungen. Den Hörern war bekannt, dass die präsentierten Stimuli sowohl von deutschen Muttersprachlern als auch von nicht-deutschen Muttersprachlern gesprochen wurden. Die Probanden sollten beurteilen, ob der gehörte fremdsprachige Akzent authentisch oder nicht-authentisch ist. Diese binäre Beurteilung (authentisch vs. nicht-authentisch) wurde durch die Probanden in einem Fragebogen (erster Teil des Fragebogens aus Perzeptionsexperiment I, vgl. dazu Anhang D) notiert. Dieser Experimentaufbau hat zum einen den Vorteil, dass eine Vergleichbarkeit zum ersten Perzeptionsexperiment besteht und dass dieses Folge-Experiment somit eine gewisse Kontrollfunktion erfüllt. Zum anderen ist es möglich, innerhalb einer Hörergruppe und eines Experimentdurchgangs die manipulierten Stimuli mit den unmanipulierten Stimuli zu vergleichen. Daraus ergeben sich sowohl für die Analyse als auch für die Ergebnisse zwei Schritte: 1. Vergleich der Authentizitätsbeurteilungen für die unmanipulierten Stimuli zwischen Perzeptionsexperiment I und II (= Gesamtgruppe der 35 Stimuli). 2. Vergleich der Authentizitätsbeurteilungen zwischen den unmanipulierten Stimuli und den manipulierten Stimuli des Perzeptionsexperiments II (= Untergruppe der elf Stimuli mit französischem Akzent). 13.2.2. Ergebnisse - Perzeptionsexperiment II Die Ergebnisse des Perzeptionsexperiments überraschen in verschiedener Hinsicht. Zum einen finden sich trotz gleichen experimentellen Designs und vergleichbarer Probandeneigenschaften (wie Anzahl der Probanden, Alter und Ge- 2 Wie oben beschrieben wurde der Stimulus-Satz der Sprecherin Ff02 nicht manipuliert, da eine Verstärkung der wahrgenommenen Nicht-Authentizität durch eine Manipulation nicht intendiert war. 252 schlechterverhältnis) Unterschiede in den Authentizitätsbeurteilungen der unmanipulierten Stimuli aus beiden Experimenten. Die Auswertung der Daten aus der Gesamtgruppe der Stimuli ergab, dass sich im Vergleich zum Perzeptionsexperiment I die durchschnittlichen Authentizitätsbeurteilungen für 14 von 35 Stimuli um mehr als 10 Prozentpunkte verändert haben. Diese Ergebnisse spiegeln sich auch in den Ergebnissen der Auswertung für die Untergruppe der elf Stimuli mit französischem Akzent wider. In dieser Gruppe unterscheiden sich die Authentizitätsbeurteilungen der unmanipulierten Stimuli aus beiden Experimenten wie folgt und in Abbildung 13.2 dargestellt: Für sieben von elf Stimuli steigt die Bewertung des Akzents als authentisch (maximal um 26 Prozentpunkte), für 3 von elf Stimuli sinkt die Bewertung des Akzents als authentisch (maximal um 34 Prozentpunkte) und für einen Stimulus gibt es keine Veränderung in der Authentizitätsbeurteilung. 0 20 40 60 80 100 F-nf01 F-nf02 Ff05 Fm07 Ff10 Fm03 Ff07 F-nm02 Ff04 Fm04 F-nm01 Urteil "authentisch" (in %) Sprecher Experiment I Experiment II Abbildung 13.2.: Vergleich der Authentizitätsbeurteilungen für die unmanipulierten Stimuli zwischen Perzeptionsexperiment I und II Im Gegensatz dazu ergab der Vergleich der Authentizitätsbeurteilungen der unmanipulierten mit den manipulierten Stimuli aus dieser Experimentreihe keine signifikanten Unterschiede: Für zwei Sprecher steigt die wahrgenommene Authentizität im manipulierten Stimulus um acht Prozentpunkte und für zwei Sprecher sinkt sie im manipulierten Stimulus um sechs Prozentpunkte. Alle anderen Sprecher liegen dazwischen. Abbildung 13.3 stellt den Vergleich 253 0 20 40 60 80 100 Ff05 Fm07 F-nf01 Ff04 Ff10 F-nf02 Fm03 Fm04 Ff07 F-nm02 F-nm01 Urteil "authentisch" (in %) Sprecher original Exp. II manipuliert Exp. II Abbildung 13.3.: Vergleich der Authentizitätsbeurteilungen für die unmanipulierten und die manipulierten Stimuli aus Perzeptionsexperiment II der Authentizitätsbewertungen für die Untergruppe der elf Stimuli in manipulierter und unmanipulierter Form dar. Für Perzeptionsexperiment II lässt sich zusammenfassen, dass ein größerer Unterschied in der Authentizitätsbeurteilung der unmanipulierten Stimuli zwischen den beiden durchgeführten Experimenten mit zwei Hörergruppen besteht als zwischen den originalen und den manipulierten Stimuli. 13.2.3. Diskussion - Perzeptionsexperiment II Experiment II ist Bestandteil einer Reihe von Perzeptionsexperimenten, die für diese Studie durchgeführt wurden. Ziel der Perzeptionsexperimente war, Merkmale herauszuarbeiten, deren Variation den Erfolg oder Misserfolg einer Akzentimitation beeinflusst. Das wichtigste Ergebnis dieser Experimentreihe ist, dass Authentizitätsurteile von Hörern mit begrenztem phonetischen Training unzuverlässig sind. Dies zeigt zum einen die hohe Variation der Authentizitätsbeurteilung im ersten Perzeptionsexperiment sowohl für authentische als auch für imitierte fremdsprachige Akzente und zum anderen auch die Variation zwischen den Ergebnissen der Perzeptionsexperimente I und II. Die Varia- 254 tion innerhalb der Beurteilung derselben unmanipulierten Stimuli ist zwischen diesen beiden Experimenten größer als erwartet. Obwohl die Vorüberlegungen vermuten lassen, dass die Realisierung der Endsilbe / -@n/ relevant für die wahrgenommene Authentizität der fremdsprachigen Akzente ist, scheint dieses feine phonetische Detail alleine nicht so ausschlaggebend zu sein, dass eine Manipulation der Endsilben auch zu anderen Authentizitätsbeurteilungen führen würde. Diese Ergebnisse unterstützen die Feststellung aus Markham (1997), dass die Wahrnehmung von Akzent sehr subjektiv und individuell ist und von verschiedenen Faktoren wie dem Konzept der Hörer über den eigenen Dialekt oder die eigene Muttersprache abhängt. Außerdem erhöht vermutlich auch die Erfahrung der Hörer mit bestimmten Sprachvarietäten ihre Fähigkeit, Akzente zu beurteilen (vgl. Flege, 1984). Nicht zuletzt mag auch der Akzent selbst eine Rolle spielen. So scheinen stigmatisierte fremdsprachige Akzente anders beurteilt zu werden als „angesehene“ oder „privilegierte“ Akzente (vgl. Torstensson, 2010). Für beides wäre eine Untersuchung mit unterschiedlichen Hörergruppen - deutsche und nicht-deutsche Muttersprachler oder Hörer mit unterschiedlichen Erfahrungen mit nicht-muttersprachlichen Akzenten - von Interesse. Ein potenzieller Kritikpunkt am experimentellen Aufbau von Perzeptionsexperiment II ist, dass die Hörer sich möglicherweise an ihre Urteile für die unmanipulierten Stimuli aus den ersten zwei Blöcken erinnern konnten und dann aus ihrer Erinnerung heraus die Authentizität für die manipulierten Stimuli in den Blöcken 3-5 bestimmt haben. Aufgrund der hohen Anzahl der Stimuli und der Randomisierungen, kann davon ausgegangen werden, dass in diesen Fällen bestimmte prägnante Merkmale eine Erinnerung an einen bestimmten Stimulus begünstigten. Auf der anderen Seite handelt es sich bei einem fremdsprachigen Akzent selbstverständlich nicht um voneinander unabhängige Merkmale, sondern wir haben es hier mit einer komplexen Kombination verschiedener relevanter Merkmale zu tun. Die Schlussfolgerung, die sich aus dem Perzeptionsexperiment mit manipulierten Daten ziehen lässt, ist, dass eine auf phonetischer Ebene relativ beträchtliche Veränderung einen sehr geringen Effekt auf die Hörerurteile hatte. 13.3. Zusammenfassung Mit Perzeptionsexperiment I konnte gezeigt werden, dass die deutschen Hörer insgesamt sehr erfolgreich in der Zuordnung (Benennung) der imitierten Akzente waren bzw. dass die deutschen Stimulus-Sprecher bei der Akzentimitation so erfolgreich waren, dass der angestrebte Akzent in den meisten Fällen korrekt benannt wurde. Bei der Benennung authentischer Akzente waren die Hörer zum Teil weniger erfolgreich - es handelt sich hier für die Hörer um eine relativ komplexe Aufgabe. Die Beurteilung der Authentizität eines fremd- 255 sprachigen Akzents scheint eine noch weitaus schwierigere Aufgabe zu sein, schließlich war die Variationsbreite in der Authentizitätsbeurteilung sowohl für die gesprochenen Akzente der deutschen als auch der nicht-deutschen Muttersprachler sehr groß. Ein Vergleich der Produktionen der Stimulus-Sprecher, deren Akzente am häufigsten als authentisch beurteilt wurden, mit den Produktionen derjenigen Stimulus-Sprecher, deren Akzente am häufigsten als nicht-authentisch beurteilt wurden, lässt vermuten, dass untrainierte Hörer in ihren Authentizitätsbeurteilungen stark von der Anwesenheit stereotyper Muster beeinflusst werden. Erreicht ein Nicht-Muttersprachler ein Niveau in seiner L2-Kompetenz, bei dem die stereotypen Muster seines fremdsprachigen Akzents nicht mehr vorhanden sind, wird dieser Sprecher schnell als deutscher Muttersprachler mit imitiertem fremdsprachigen Akzent beurteilt. Ebenso werden deutsche Muttersprachler, die in ihrer Verstellung noch zu viele typisch deutsche phonetischphonologische Muster aufweisen, als nicht-authentisch beurteilt. Eine korrekte Realisierung des / h/ durch französische Muttersprachler und das Annehmen einer regionalen Färbung (z. B. durch Veränderung der Vokalqualitäten) scheint beispielsweise zu einer Bewertung des Akzents als nicht-authentisch beizutragen. Analyseergebnisse zur Realisierung des initialen / r/ bei authentischen und nicht-authentischen amerikanisch-englischen Akzenten, die hier nicht dargestellt, aber in Neuhauser und Simpson (2007b) publiziert sind, zeigen aber auch, dass die konsistente Verwendung stereotyper Muster keine Garantie für eine Beurteilung des Akzents als authentisch ist. Zudem bestätigen die Ergebnisse aus Perzeptionsexperiment II, dass ein Faktor allein nicht ausschlaggebend für die wahrgenommene Authentizität eines Akzents sein kann, da eine Manipulation der Endsilben / -@n/ die beurteilte Authentizität französischer Akzente nicht ändern konnte. Obwohl sich deutsche Muttersprachler relativ sicher sind, imitierte und authentische fremdsprachige Akzente voneinander unterscheiden zu können, muss für die forensische Praxis geschlussfolgert werden, dass (Zeugen-)Aussagen phonetischer Laien hinsichtlich der Authentizität und sprachlichen Herkunft eines fremdsprachigen Akzents mit äußerster Vorsicht behandelt werden sollten. Stattdessen müssen Einschätzungen zur Authentizität und Identität fremdsprachiger Akzente auf einer analytischen Beurteilung basieren, die stark auf phonetischen Details beruht. 256 Teil VI. Schluss 14. Zusammenfassung und Diskussion Ziel der vorliegenden Arbeit war die empirische Untersuchung phonetischer und linguistischer Aspekte der Akzentimitation im forensischen Kontext. Forensischer Kontext meint in diesem Fall die Imitation eines fremdsprachigen Akzents als eine mögliche Verstellungsart, die im Zusammenhang mit einer Straftat stehen kann. Fremdsprachiger Akzent wird hier verstanden als Aussprachebesonderheiten eines Sprechers in einer Fremdsprache. Ziel einer Verstellung durch die Imitation eines fremdsprachigen Akzents ist die Verbergung der eigenen Identität bei gleichzeitigem Vortäuschen einer anderen Herkunft. In Teil I der Arbeit wurden die notwendigen theoretischen Grundlagen zu diesem Thema gelegt. Der Terminus Stimmverstellung wurde definiert und es wurden verschiedene Möglichkeiten vorgestellt, Verstellungsarten zu klassifizieren. Außerdem erfolgte eine Auswertung der Forschungsliteratur in Hinblick auf die Auftretensfrequenz der verschiedenen Verstellungsarten und ihre Effektivität. Vor einer näheren Betrachtung der Verstellung durch die Imitation fremdsprachiger Akzente, stand eine Begriffsklärung des Terminus fremdsprachiger Akzent sowie eine zusammenfassende Darstellung zu seinen Einflussfaktoren, phonetischen Korrelaten und Beurteilungsmöglichkeiten. Im forensischen Kontext können fremdsprachige Akzente helfen, die Herkunft eines Sprechers näher einzugrenzen. Auf der anderen Seite haben verschiedene Studien auch gezeigt, dass die Wiederkennung von Sprechern durch Hörer erschwert wird, wenn der Sprecher in einer für die Hörer fremden Sprache oder mit einem fremdsprachigen Akzent spricht (z. B. Thompson, 1987; Goggin et al., 1991; Köster und Schiller, 1997; Sullivan und Schlichting, 2000; Sullivan und Kügler, 2001). Mögliche Erklärungen für die schlechten Wiedererkennungsleistungen sind nach Hollien (2002), u. a. dass die Hörer durch den Dialekt oder Akzent abgelenkt werden und dass sprecherspezifische idiosynkratische Merkmale gedämpft werden. Bei der Imitation eines fremden regionalen Dialekts oder eines fremdsprachigen Akzents muss ebenso mit einer Verschlechterung der Wiedererkennung von Sprechern gerechnet werden. Beides sind Formen der Verstellung von Merkmalen der Sprache (Künzel, 1987), die nach Braun (2006) in ca. 10 % der von forensisch-phonetischen Experten begutachteten Fälle vorkommt. In der Literatur herrscht weitgehend Übereinstimmung darin, dass die Imitation fremdsprachiger Akzente zu Verstellungszwecken in ihrer Wirksamkeit beschränkt ist, da die Sprecher zu viele phonetische Merkmale ihrer Muttersprache beibehalten (z. B. Künzel, 1987; Rose, 2002). Desweiteren würden sie aufgrund mangelnder linguistischer Kompetenz der Komplexität eines fremdsprachigen Akzents in ihren Imitationen nicht gerecht, was zu Fehlern, Übertreibungen und v. a. Inkonsistenzen führt (z. B. Blum, 1990; Storey, 1996; Wagner, 1998). Diese Annahmen implizieren, (i) dass Hörer zwischen imitierten und authentischen fremdsprachigen Akzenten unterscheiden können und (ii) dass authentische Nicht-Muttersprachler in ihren Akzentproduktionen kon- 259 sistenter sind als Akzentimitatoren. Bis auf wenige Ausnahmen zur Imitation fremdsprachiger Akzente im Schwedischen (Cunningham-Andersson und Engstrand, 1989; Torstensson et al., 2004) und einer Vorstudie zum Deutschen (Neuhauser, 2005, 2008) mangelt es jedoch an empirischen Untersuchungen zur phonetischen und linguistischen Variationsfähigkeit von Sprechern bei der Akzentimitation. Auch Untersuchungen zur Wahrnehmung imitierter und authentischer fremdsprachiger Akzente durch Hörer fehlen bisher. Die drei wichtigsten Forschungsziele der vorliegenden Arbeit waren: 1. Vergrößerung der Probandenanzahl im Vergleich zu Neuhauser (2005), um zu valideren Ergebnissen zu gelangen, sowie die Aufnahme authentischer nicht-deutscher Muttersprachler. 2. Eine systematische Untersuchung der Form und Variation bestimmter phonetischer Merkmale im Deutschen gesprochen mit einem vorgetäuschten fremdsprachigen Akzent von deutschen Muttersprachlern und mit einem authentischen Akzent von nicht-deutschen Muttersprachlern. 3. Überprüfung der Authentizität der Verstellungsversuche durch Perzeptionsexperimente und Ermittlung der phonetischen Korrelate von als authentisch empfundenen Akzenten. Die Vergrößerung der Probandenanzahl und die Aufnahme authentischer nicht-deutscher Muttersprachler (Ziel 1) wurde durch die Erstellung eines umfangreichen Korpus erreicht. Ausgangspunkt für die Korpuserstellung war eine Befragung von insgesamt 191 Personen nach dem fremdsprachigen Akzent im Deutschen, den sie am besten imitieren könnten. Französischer und amerikanisch-englischer Akzent wurden von den Befragten am häufigsten genannt. Für das Korpus wurden verschiedene Textproduktionen von insgesamt 52 Sprechern aufgenommen. 35 dieser Sprecher sind deutsche Muttersprachler, die für diese Untersuchung mehrheitlich einen französischen oder amerikanisch-englischen Akzent imitiert haben. Außerdem wurden deutsche Produktionen von 16 nicht-deutschen Muttersprachlern, vorwiegend amerikanisch-englische und französische Muttersprachler, aufgenommen, die einen fremdsprachigen Akzent im Deutschen aufweisen. In Teil II der Arbeit wurde das Korpus sowie seine Vorbereitung, Erstellung und Aufbereitung detailliert beschrieben. Außerdem wurde der Großteil der Aufnahmen wortbezogen annotiert und weitere Daten anonymisiert. Diese Aufbereitung ermöglicht die Nutzung des Korpus auch innerhalb anderer Forschungsvorhaben. Der Schwerpunkt der Arbeit liegt auf imitiertem und authentischem französischem Akzent im Deutschen. Das ist darin begründet, dass für die Imitation eines französischen Akzents die größte Anzahl an deutschen Muttersprachlern zur Verfügung stand und dass dieser Akzent besonders häufig als „gut imitierbar“ genannt wurde. In Teil III der Arbeit wurden das deutsche und das französische Lautsystem miteinander verglichen und damit die phonetisch- 260 phonologischen Grundlagen für die nachfolgende Analyse der authentischen und imitierten Akzentproduktionen geschaffen. In Teil IV der Arbeit wurde die produktive Seite der Imitation eines französischen Akzents durch deutsche Muttersprachler betrachtet. Durch eine systematische Analyse bestimmter phonetischer Merkmale wurden die Variationen deutscher Muttersprachler bei der Imitation eines französischen Akzents untersucht und die Ergebnisse mit deutschen Produktionen französischer Muttersprachler verglichen (Ziel 2). Es wurde sich bewusst auf folgende Merkmale beschränkt, um eine vertiefte und systematische Untersuchung dieser zu ermöglichen: 1. Stimmeinsatzzeit und Stimmbeteiligung in Plosiven, 2. Glottalisierung und glottale Friktion, 3. Endsilbenrealisierung. Der Schwerpunkt der Analysen lag auf der Variation glottaler Aktivität während der Imitation eines französischen Akzents. Zum einen unterscheiden sich Deutsch und Französisch hinsichtlich ihrer glottalen Strategien bei der Realisierung von Plosiven sowie im Silbenanlaut. Zum anderen ist glottale Aktivität ein phonetisches Detail, bei dem es fraglich erscheint, ob es den Sprechern bewusst ist. Die Variation in diesem Detail erfordert jedoch nicht nur das Bewusstsein darüber, sondern auch die Realisierung eines artikulatorisch komplexen Prozesses. In Kapitel 9 wurde die Variation von Stimmeinsatzzeit und Stimmbeteiligung bei Plosiven als phonetische Korrelate der Fortis-Lenis- Opposition untersucht und in Kapitel 10 die Variation in den Merkmalen der junkturellen Glottalisierung und glottalen Friktion. An die Analysen zur Variation glottaler Aktivität hat sich in Kapitel 11 die Untersuchung zur Realisierung von Endsilben angeschlossen. Die wichtigsten Analyseergebnisse zur Produktion imitierter und authentischer französischer Akzente sind: 1. Die Mehrheit der deutschen Muttersprachler reduziert bei der Akzentimitation signifikant die VOT initialer Fortis-Plosive. Das zeigt, dass sie sich der reduzierten VOT als einer möglichen Interferenzerscheinung französischer Muttersprachler im Deutschen bewusst sind und außerdem auch in der Lage sind, in diesem Parameter zu variieren. 2. Die Reduktion der VOT bei der Akzentimitation führt zu geringeren VOT-Werten als in den authentischen französischen Akzenten. Die französischen Muttersprachler erreichen in ihren deutschen Produktionen weder VOT-Werte, die dem deutschen System entsprechen, noch weichen sie von ihren VOT-Werten im Französischen merklich ab. Eine hohe L2-Kompetenz der französischen Muttersprachler im Deutschen kann daher als Erklärung für ihre relativ hohen VOT-Werte im Vergleich zu den Akzentimitationen ausgeschlossen werden. Aus diesem Grund ist 261 anzunehmen, dass die deutschen Muttersprachler bei der Akzentimitation die VOT-Werte übertrieben stark reduzieren. Einzelfälle eines Kategorienwechsels von fortis zu lenis durch die Realisierung stimmhafter Plosive und schwacher Verschlusslösungen stützen diese Annahme. 3. Auch in der Realisierung von Lenis-Plosiven besteht Variabilität. Deutsche Muttersprachler realisieren bei der Imitation eines französischen Akzents vorwiegend stimmlose Lenis-Plosive, deren VOT-Werte signifikant geringer sind als in den unverstellten Versionen. Daneben sind aber auch Realisierungen unter Beteiligung von Stimmhaftigkeit vertreten, z. B. teil- oder vollstimmhafte Lenis-Plosive sowie pränasalierte stimmhafte Lenis- Plosive. Die deutschen Produktionen der französischen Muttersprachler sind ebenfalls durch ein Überwiegen an stimmlosen Lenis-Plosiven gekennzeichnet. 4. Die deutschen Sprecherinnen zeigen in ihren unverstellten Textproduktionen bei Fortis-Plosiven signifikant höhere VOT-Mittelwerte und bei Lenis-Plosiven signifikant niedrigere VOT-Mittelwerte als die männlichen deutschen Sprecher. Damit kontrastieren sie die Fortis-Lenis-Opposition mittels VOT stärker als Männer. In den verstellten Textversionen erreicht dieser geschlechtsspezifische Effekt keine Signifikanz. Dies ist vermutlich auf eine größere Varianz zurückzuführen. 5. Deutsche Muttersprachler zeigen bei der Akzentimitation kaum eine spezifische Variation in Vokaljunkturen. Sie realisieren sowohl in den unverstellten als auch in den verstellten Textversionen mehrheitlich glottalisierte Junkturen. Das deutet darauf hin, dass die Fähigkeit zur bewussten Variation in diesem Merkmal kaum ausgeprägt ist. Im Gegensatz dazu ist die Vermeidung glottaler Friktion für / h/ und das Ersetzen durch Glottalisierung ein verbreitetes Muster in imitierten französischen Akzenten. 6. Die Kompetenz französischer Muttersprachler in Deutsch als L2 wird häufig unterschätzt. Sie realisieren in ihren deutschen Produktionen mehrheitlich sowohl junkturelle Glottalisierung als auch glottale Friktion. Das weist darauf hin, dass diese Muster relativ gut erworben wurden. Allerdings unterscheiden sich ihre Produktionen im Detail von muttersprachlichen deutschen Produktionen v. a. durch einen höheren Anteil an stimmloser glottaler Friktion sowie durch zusätzliche orale Engebildung, die zu einer supraglottalen Friktion führt. Die französischen Muttersprachler sind weder in der Realisierung von Vokaljunkturen (glottalisiert vs. nicht glottalisiert) noch in der Realisierung glottaler Friktion (stimmhaft vs. stimmlos) konsistent. 7. Imitierte und authentische französische Akzente unterscheiden sich auch hinsichtlich der Endsilbenrealisierung voneinander. Während die Akzentimitationen durch vorwiegend voll realisierte Endsilben gekennzeichnet sind, produzieren die französischen Muttersprachler im Mittel mehr re- 262 duzierte Endsilben und liegen damit näher an den unverstellten deutschen Produktionen. Dies trifft insbesondere für die Sprecher mit der höheren L2-Kompetenz zu. Auch dieses Ergebnis lässt auf eine Übertreibung der Variationen bei der Akzentimitation schließen. In Teil V der Arbeit wurde die Imitation fremdsprachiger Akzente aus perzeptiver Sicht betrachtet, um u. a. die Authentizität der Verstellungsversuche zu überprüfen und phonetische Korrelate der als authentisch wahrgenommenen Akzente zu ermitteln (Ziel 3). Die Perzeptionsexperimente sowie die Analysen zu möglichen Korrelaten der Akzentauthentizität ergaben: 1. Deutsche Muttersprachler können die Authentizität fremdsprachiger Akzente schlecht einschätzen. Sowohl für die Gruppe der imitierten als auch für die Gruppe der authentischen Akzente ist die Varianz in den Authentizitätsbeurteilungen sehr hoch. Das kann durch die unterschiedliche Kompetenz bei der Akzentimitation seitens der deutschen Muttersprachler und durch die unterschiedliche L2-Kompetenz im Deutschen seitens der nicht-deutschen Muttersprachler erklärt werden. 2. Imitierte französische und amerikanisch-englische Akzente wurden häufiger korrekt als „französisch“ oder „englisch“ identifiziert als die entsprechenden authentischen Akzente. Die erfolgreiche Identifizierung imitierter Akzente kann durch eine gemeinsame Vorstellung über stereotype Muster dieser Akzente seitens der deutschen Sprecher und Hörer erklärt werden. Die weniger erfolgreiche Identifizierung der authentischen Akzente lässt darauf schließen, dass authentische nicht-deutsche Muttersprachler weniger dieser stereotypen Muster aufweisen als die Hörer erwarten. 3. Ein Vergleich der am häufigsten als authentisch beurteilten Akzentstimuli mit den am häufigsten als nicht-authentisch beurteilten Akzentstimuli ergab, dass untrainierte Hörer in ihren Authentizitätsbeurteilungen stark von der Anwesenheit stereotyper Muster beeinflusst werden. Erreicht ein Nicht-Muttersprachler eine L2-Kompetenz, bei der die stereotypen Muster seines fremdsprachigen Akzents nicht mehr zu erkennen sind, und nimmt vielleicht außerdem typisch deutsche phonetisch-phonologische Muster oder eine regionale Färbung im Deutschen an, so wird sein Akzent sehr wahrscheinlich als imitiert beurteilt. Ebenso werden die imitierten Akzente der deutschen Muttersprachler, die noch zu viele lautliche Muster aus dem Deutschen beibehalten, eher als nicht-authentisch beurteilt. 4. Für französische Akzente sind u. a. die Realisierung von / h/ oder von Endsilben / -@n/ ausschlaggebende Merkmale bei der Authentizitätsbeurteilung. Werden die Endsilben reduziert und glottale Friktion realisiert, so werden die Akzente häufig als nicht-authentisch beurteilt. Ein Ersetzen der glottalen Friktion durch Glottalisierung und eine volle Endsil- 263 benrealisierung scheint aber zum Eindruck eines authentischen Akzents beizutragen. Allerdings zeigte die Manipulation der Endsilbe / -@n/ in den Stimuli auch, dass ein Faktor allein nicht ausschlaggebend für die wahrgenommene Authentizität eines Akzents sein kann, da sich die beurteilte Authentizität der französischen Akzente durch die Manipulation nicht änderte. Kritik und Vorschläge für die zukünftige Forschung Für zukünftige Projekte ist es wünschenswert, die Anzahl der französischen Muttersprachler zu erhöhen und bei der Auswahl der Sprecher auch unterschiedliche Kompetenzstufen in Deutsch als L2 systematischer zu berücksichtigen. Aufgrund der Befragung nach „leicht zu imitierenden“ Akzenten und der resultierenden hohen Anzahl an Probanden, die französischen Akzent imitieren, lag der Schwerpunkt der Arbeit auf diesem Akzent. Speziell für den forensischen Kontext ist auch eine Analyse von Imitationen fremdsprachiger Akzente von Interesse, die in der forensischen Praxis eine größere Rolle spielen. Im Zusammenhang damit könnte die Probandenauswahl auf deutsche Muttersprachler ausgeweitet werden, die langfristig regelmäßigen Kontakt zu entsprechenden nicht-deutschen Muttersprachlern haben. Dadurch kann überprüft werden, ob eine starke Vertrautheit mit dem angestrebten Akzent kompensieren kann, dass die entsprechende Fremdsprache nicht erlernt wurde, und ob diese Probanden eine höhere und konsistentere Variationsfähigkeit besitzen als Sprecher ohne diesen Hintergrund. Die Perzeptionsexperimente sollten auch auf nicht-deutsche Hörergruppen ausgeweitet werden, da zu vermuten ist, dass sie den Akzent ihrer Muttersprache besser erkennen und die Authentizität besser beurteilen können als deutsche Muttersprachler, da sie mit typischen Aussprachemustern vertrauter sind. Im Zusammenhang mit den Authentizitätsbeurteilungen durch Hörer wurden auch mögliche phonetische Korrelate der Akzentauthentizität diskutiert. Die suprasegmentelle Ebene wurde dabei vernachlässigt. Sowohl in den Akzentimitationen als auch in den authentischen französischen Akzenten treten Abweichungen von der deutschen Prosodie auf. Indikatoren für die Authentizitätsbeurteilung eines Akzents sind sicher auch prosodische Merkmale wie Intonationsverläufe, Sprechfluss oder Sprechgeschwindigkeit. Der Einbezug der suprasegmentellen Ebene in die Analyse der Akzentproduktionen ist ein wichtiger Schritt für die weitere Forschung. In der vorliegenden Studie wurde nur gelesenes Material ausgewertet. Eine Auswertung der analysierten Parameter auf spontansprachlicher Ebene steht noch aus. Zwar führt Künzel (2000) an, dass spontansprachliches Material im forensischen Kontext am häufigsten vorkommt, bestätigt aber zugleich, dass auch vorbereitete Botschaften, die vorgelesen werden, regelmäßig auftreten. Obwohl für Folgeprojekte eine Bearbeitung des spontansprachlichen Materials 264 unbedingt im Vordergrund stehen sollte, ist das für diese Studie verwendete gelesene Sprachmaterial ebenso von forensisch-linguistischem Wert. Durch das aufgenommene spontansprachliche Material sowie durch die Aufnahmen der von den Probanden selbst verfassten Texte bietet das Korpus neben einer phonetischen Untersuchung der imitierten und authentischen fremdsprachigen Akzente außerdem die Möglichkeit einer Untersuchung auf morphologischgrammatikalischer und lexikalischer Ebene. Es ist anzunehmen, dass die Akzentimitatoren nicht nur auf der lautsprachlichen Ebene mit stereotypen Vorstellungen von einem (französischen) Akzent spielen, sondern auch auf anderen sprachlichen Ebenen. Vermutlich unterscheiden sich die selbst verfassten Texte, auf die sich die Probanden vorbereiten konnten, von der unangekündigten Spontansprache auch hinsichtlich der Anzahl, Art und Konsistenz von Variationen - das kann sowohl die authentischen Akzentproduktionen der nichtdeutschen Muttersprachler als auch die Akzentimitationen betreffen. Schlussfolgerungen für den Fremdsprachenunterricht Die Resultate dieser Arbeit lassen darauf schließen, dass deutsche Muttersprachler phonetische Muster wie die Realisierung nicht-aspirierter Fortis- Plosive und nicht-reduzierter Endsilben sowie die Nicht-Realisierung von / h/ als stereotypisch für französischen Akzent im Deutschen ansehen. Da diese Merkmale deutlich zum Akzenteindruck beitragen, sollte ihnen auch besondere Beachtung im Aussprachetraining gewidmet werden. Die französischen Muttersprachler dieser Studie zeigten in vielen Fällen weniger starke Interferenzen aus dem Französischen als erwartet und haben bestimmte phonetischphonologische Muster des Deutschen bereits gut erworben. So realisieren sie entgegen stereotyper Vorstellungen in ihren deutschen Produktionen mehrheitlich aspirierte Fortis-Plosive und stimmlose Lenis-Plosive, glottale Friktion für / h/ und glottalisierte Vokaljunkturen sowie reduzierte Endsilben. Das gilt insbesondere für die beiden Sprecherinnen, deren fremdsprachiger Akzent von deutschen Hörern als gering bewertet wurde. Trotz dieses scheinbar erfolgreichen Erwerbs unterscheiden sich ihre Produktionen im Detail von muttersprachlichen deutschen Produktionen. So erreichen sie weder die muttersprachlichen Werte in der VOT bei Fortis-Plosiven noch in der Endsilbenreduktion. In der Realisierung glottaler Friktion zeigen sie häufiger stimmlose glottale Friktion und vereinzelt auch supraglottale Friktion. Beides kann das Resultat eines isolierten Aussprachetrainings sein, bei dem die notwendigen koartikulatorischen Prozesse unberücksichtigt geblieben sind. Nach Koenig et al. (2008) ist die systematische Variation der Stimmbeteiligung bei / h/ für untrainierte Sprecher sehr problematisch. Hier kann ein gezieltes Training dazu beitragen, den fremdsprachigen Akzent im Deutschen zu reduzieren. 265 Schlussfolgerungen für die forensisch-phonetische Praxis Deutsche Muttersprachler nehmen für die Akzentimitation verschiedene Variationen auf lautlicher Ebene vor. Sie sind in der Lage, in phonetischen Details wie glottaler Aktivität zu variieren. So setzen sie für die Imitation eines französischen Akzents sowohl eine Reduktion der Stimmeinsatzzeit bei der Realisierung von Fortis-Plosiven als auch Stimmbeteiligung bei der Realisierung von Lenis-Plosiven ein. Obwohl die Tendenz besteht, dass die Sprecher im Merkmal der VOT stärker variieren als im Merkmal der Stimmbeteiligung, kann nicht bestätigt werden, dass eine Variation der Stimmbeteiligung der bewussten Kontrolle nicht zugänglich wäre und damit gegenüber Stimmverstellung robust sei. Die Feinabstimmung in den Merkmalen Stimmeinsatzzeit und Stimmbeteiligung bei Plosiven ist äußerst komplex. Bei Fortis-Plosiven können Übertreibungen bei der Reduktion der VOT oder ein Kategorienwechsel von fortis zu lenis auf eine Akzentimitation deuten. Vermutlich werden zum Teil eher französische Werte angestrebt als ein französischer Akzent im Deutschen, der zwar durch Interferenzerscheinungen gekennzeichnet ist, aber auch bereits erfolgreich erworbene Merkmale trägt. So weisen die Akzentimitatoren beispielsweise ähnliche VOT-Werte auf wie deutsche Französisch-Lerner im Französischen (vgl. Künzel, 1977a), aber niedrigere als die französischen Muttersprachler im Deutschen. Bei Lenis-Plosiven scheinen der Einsatz von Pränasalierung oder prevoicing verbunden mit Glottalverschluss und aussetzender Stimmhaftigkeit die kritischen Faktoren zu sein. Bei der Realisierung von / h/ und der Endsilbe / -@n/ sind die Akzentimitationen durch ein Vermeiden von glottaler Friktion und Ersetzen durch junkturelle Glottalisierung bzw. durch eine volle Endsilbenrealisierung gekennzeichnet. Da die französischen Muttersprachler der Studie diese Muster kaum bzw. seltener zeigen, scheint hier ebenfalls Potenzial für die Unterscheidung zwischen imitierten und authentischen französischen Akzenten zu liegen. In der forensischen Praxis ist eine starke interindividuelle Streuung in der Ausprägung von Merkmalen notwendig, um Sprecher voneinander abgrenzen zu können. Für die Realisierung der Stimmeinsatzzeit in Fortis-Plosiven, der Stimmbeteiligung in Lenis-Plosiven, der Endsilbe / -@n/ und die Realisierung von / h/ gibt es für die deutsche Sprechergruppe klare Tendenzen bei der Akzentimitation. In allen Merkmalen gibt es aber auch einzelne Sprecher, die nicht mit der Gruppe konform gehen. Die interindividuelle Streuung in der Ausprägung der genannten Merkmale ist u. a. deshalb relativ hoch. Problematisch für den forensischen Kontext ist eine hohe intraindividuelle Variabilität, wie sie z. B. für die akustische Ausprägung der Glottalisierung in Vokaljunkturen aber auch für VOT-Werte gefunden wurde. Bei der Realisierung von Vokaljunkturen zeigen manche Sprecher sowohl in verstellter als auch in unverstellter Version stärkere sprecherspezifische Tendenzen als andere Sprecher. Trotz einer überwiegenden Realisierung glottalisierter Junkturen, gibt es sowohl bei den deutschen als auch bei den französischen Muttersprachlern eine hohe inter- und 266 intraindividuelle Variation in der akustischen Ausprägung dieser, sodass vermutet werden kann, dass dieser Parameter für die forensische Analyse ungeeignet ist. Die intraindividuellen Schwankungen in den VOT-Werten von Fortis- Plosiven betreffen v. a. deutsche Muttersprachler in der Akzentimitation, aber auch französische Muttersprachler im Deutschen und Französischen, und können durch die unterschiedlichen Artikulationsstellen der Fortis-Plosive erklärt werden. Geringe Variation auf phonetischer Ebene, Übertreibungen und mangelnde Konsistenz bei der Akzentimitation sind die Hauptgründe für die angenommene geringe Effektivität von Akzentimitationen als Verstellung (vgl. z. B. Künzel, 1987; Blum, 1990; Storey, 1996; Wagner, 1998). In dieser Arbeit konnte gezeigt werden, dass deutsche Sprecher bei der Akzentimitation vielfältige Variationen auf phonetischer Ebene vornehmen, dabei aber zum Teil übertreiben. Konsistenz sollte nach den Ergebnissen dieser Arbeit kein hinreichendes Kriterium für eine Unterscheidung zwischen imitierten und authentischen französischen Akzenten sein. Zum einen weil die französischen Muttersprachler in ihren deutschen Produktionen nicht konsistenter und zum Teil sogar inkonsistenter sind als die deutschen Muttersprachler in ihren Akzentimitationen (z. B. in der Realisierung von / h/ ). Zum anderen zeigt das Beispiel der Endsilbenrealisierung, dass die mittlere Konsistenz der Realisierungen über zwei Aufnahmen im Abstand von zwei Wochen in beiden Sprechergruppen sehr hoch sein kann, im Einzelfall jedoch bei den deutschen Muttersprachlern sowie bei den französischen Muttersprachlern schwankt. Die Analyse der Akzentproduktionen sollte zur weiteren Überprüfung dieser Problematik unbedingt auf die zweite Aufnahmesitzung ausgeweitet werden. Aus den Ergebnissen der Perzeptionsexperimente kann für die forensische Praxis geschlussfolgert werden, dass die Aussagen phonetischer Laien bezüglich der Authentizität und sprachlichen Herkunft eines fremdsprachigen Akzents mit äußerster Vorsicht betrachtet werden müssen. Stattdessen müssen Einschätzungen zur Authentizität und Identität eines fremdsprachigen Akzents auf Basis einer analytischen Beurteilung getroffen werden, die stark auf phonetischen Details beruht. Denn obwohl von den Sprechern bei der Akzentimitation vielfältige Variationen auch feinster Details vorgenommen werden, ist die Feinabstimmung in der Realisierung extrem komplex. Sowohl die authentische Akzentimitation als auch die muttersprachsnahe Aussprache in L2 sind äußerst anspruchsvolle Aufgaben. Gerade bei der forensisch-phonetischen Fallarbeit dürfen aus den hier diskutierten Möglichkeiten und Beschränkungen in der Variationsfähigkeit von Sprechern nur mit besonderer Vorsicht Rückschlüsse auf die Fähigkeiten von Einzelsprechern gezogen werden. 267 Literaturverzeichnis Abdelli-Beruh, N. B. (2004). The Stop Voicing Contrast in French Sentences: Contextual Sensitivity of Vowel Duration, Closure Duration, Voice Onset Time, Stop Release and Closure Voicing. Phonetica 61, 201-219. Abdelli-Beruh, N. B. (2009). Influence of place of articulation on some acoustic correlates of the stop voicing contrast in Parisian French. Journal of Phonetics 37, 66-78. Adjarian, H. (1899). Les explosives de l’ancient arménien étudiées dans les dialectes modernes. Parole, 119-127. Allen, J. (1970). The Glottal Stop as a Junctural Correlate in English. Journal of the Acoustical Society of America 47, 57. Baldwin, J. und P. French (1990). Forensic Phonetics. London, New York: Pinter Publishers. Barry, W. J. (1995). Schwa vs. schwa + / r/ in German. Phonetica 52, 228-235. Benkenstein, R. (2007). Vergleich objektiver Verfahren zur Untersuchung der Nasalität im Deutschen. Hallesche Schriften zur Sprechwissenschaft und Phonetik (19). Frankfurt a.M. etc.: Peter Lang. Europäischer Verlag der Wissenschaften. Bittner, D. (2002). Semantisches in der pronominalen Flexion des Deutschen. Zeitschrift für Sprachwissenschaft 21, 196-233. Blum, A. (1990). Anregungen zu mehr Interdisziplinarität bei forensischen linguistischen Untersuchungen. In H. Kniffka (Hrsg.), Texte zu Theorie und Praxis forensischer Linguistik, Linguistische Arbeiten (249), 289-319. Tübingen: Niemeyer. Boersma, P. und D. Weenink (2009). Praat: doing phonetics by computer (Computerprogramm, Version 5.1.20). http: / / www.praat.org/ . Boersma, P. und D. Weenink (2008). Praat: doing phonetics by computer (Computerprogramm, Version 5.0.24). http: / / www.praat.org/ . Boula de Mareüil, P. und B. Vieru-Dimulescu (2006). The Contribution of Prosody to the Perception of Foreign Accent. Phonetica 63(4), 247-267. Braun, A. (1983). VOT im 19. Jahrhundert oder „Die Wiederkehr des Gleichen“. Phonetica 40, 323-327. Braun, A. (1988). Zum Merkmal „Fortis/ Lenis“. Phonologische Betrachtungen und instrumentalphonetische Untersuchungen an einem mittelhessischen Dialekt. Zeitschrift für Dialektologie und Linguistik (Beiheft 55). Stuttgart: Franz Steiner Verlag. 269 Braun, A. (1996). Zur regionalen Distribution von VOT im Deutschen. In A. Braun (Hrsg.), Untersuchungen zu Stimme und Sprache. Papers on Speech and Voice., 19-32. Stuttgart: Franz Steiner Verlag. Braun, A. (2006). Stimmverstellung und Stimmenimitation in der forensischen Sprechererkennung. In T. Kopfermann (Hrsg.), Das Phänomen Stimme: Imitation und Identität. 5. Internationale Stuttgarter Stimmtage 2004. Hellmut K. Geißner zum 80.Geburtstag, 177-182. St. Ingbert: Röhrig. Britain, D. (2004). Dialect and accent. In U. Ammon, N. Dittmar, K. Mattheier, und P. Trudgill (Hrsg.), Sociolinguistics: International Handbook of the Science of Language and Society, 267-273. Berlin: Mouton De Gruyter. Broeders, A. P. A. (2001). Forensic Speech and Audio Analysis - Forensic Linguistics 1998 to 2001. A review. In 13th INTERPOL Forensic Science Symposium, Lyon, France. https: / / www.interpol.int/ Public/ Forensic/ IFSS/ meeting13/ Reviews/ ForensicLinguistics.pdf (27.03.2006). Cambier-Langeveld, T. (2010). The role of linguists and native speakers in language analysis for the determination of speaker origin. The International Journal of Speech, Language and the Law 17(1), 67-93. Caramazza, A. und G. H. Yeni-Komshian (1974). Voice onset time in two French dialects. Journal of Phonetics 2, 293-245. Clark, J. und P. Foulkes (2007). Identification of voices in electronically disguised speech. The International Journal of Speech, Language and the Law 14(2), 195-221. Corneau, C. (1999). An EPG study of palatalisation in French. In Proc. of the 14th ICPhS, San Francisco, 61-64. Cunningham-Andersson, U. und O. Engstrand (1988). Attitudes to immigrant Swedish - a literature review and preparatory experiments. Perilus 8, 103- 152. Cunningham-Andersson, U. und O. Engstrand (1989). Perceived strength and identity of foreign accent in Swedish. Phonetica 46, 138-154. Dankoviˇ cová, J., J. M. Gurd, J. C. Marshall, M. K. C. MacMahon, J. Stuart-Smith, J. S. Coleman, und A. Slater (2001). Aspects of non-native pronunciation in a case of altered accent following a stroke (foreign accent syndrome). Clinical Linguistics & Phonetics 15 (3), 195-218. Delattre, P. und M. Monnot (1981). The Role of Duration in the Identification of French Nasal Vowels. In B. Malmberg (Hrsg.), Pierre Delattre: Studies in Comparative Phonetics. English, German, Spanish and French., 17-38. Heidelberg: Julius Groos Verlag. Dern, C. (2003). Sprachwissenschaft und Kriminalistik: Zur Praxis der Autorenerkennung. Zeitschrift für germanistische Linguistik 31, 44-73. 270 Dern, C. (2008). „Wenn zahle nix dann geht dir schlecht“. Ein Experiment zu sprachlichen Verstellungsstrategien in Erpresserbriefen. Zeitschrift für germanistische Linguistik 36(2), 240-265. Dilley, L., S. Shattuck-Hufnagel, und M. Ostendorf (1996). Glottalization of word-initial vowels as a function of prosodic structure. Journal of Phonetics 24, 423-444. Duckworth, M. und A. Hirson (1995). Forensic implications of vocal creak as voice disguise. In A. Braun und J.-P. Köster (Hrsg.), Studies in forensic phonetics, 67-76. Trier: WVT Wissenschaftlicher Verlag Trier. Duden (2005). Das Aussprachewörterbuch (6. überarb. und akt. Aufl.). Duden Band 6. Mannheim etc.: Dudenverlag. Endres, W., W. Bambach, und G. Flösser (1971). Voice Spectrograms as a Function of Age, Voice Disguise, and Voice Imitation. The Journal of the Acoustical Society of America 49(6(2)), 1842-1848. Eriksson, A. (2010). The disguised voice: Imitating accents or speech styles and impersonating individuals. In C. Llamas und D. Watt (Hrsg.), Language and Identities, 86-96. Edinburgh: Edinburgh University Press. Eriksson, E. (2007). That voice sounds familiar. Factors in speaker recognition. Umeå: Umeå University. Eriksson, E., K. Sullivan, E. Zetterholm, P. Czigler, J. Green, Å. Skagerstrand, und J. van Doorn (2010). Detection of imitated voices: who are reliable earwitnesses? The International Journal of Speech, Language and the Law 17(1), 25- 44. Ewan, W. G. und R. Krones (1974). Measuring larynx movement using the thyroumbrometer. Journal of Phonetics 2, 327-335. Figueiredo, R. M. d. und H. d. Souza Britto (1996). A report on the acoustic effects of one type of disguise. Forensic Linguistics: The International Journal of Speech, Language and the Law 3(1), 168-175. Flege, J. E. (1984). The detection of French accent by American listeners. Journal of the Acoustical Society of America 76(3), 692-707. Flege, J. E. (1988). Factors affecting degree of perceived foreign accent in English sentences. Journal of the Acoustical Society of America 84(1), 70-79. Flege, J. E. (1995). Second language speech learning: theory, findings, and problems. In W. Strange (Hrsg.), Speech perception and linguistic experience: theoretical and methodological issues, 229-273. Timonium, MD: York Press. Flege, J. E. und W. Eefting (1987). The production and perception of English stops by Spanish speakers of English. Journal of Phonetics 15, 67-83. 271 Flege, J. E. und W. Eefting (1988). Imitation of a VOT continuum by native speakers of English and Spanish: Evidence for phonetic category formation. Journal of the Acoustical Society of America 83, 729-740. Flege, J. E. und R. M. Hammond (1982). Mimicry of non-distinctive phonetic differences between language varieties. Studies in Second Language Acquisition 5 (1), 1-17. Flege, J. E., M. J. Munro, und I. R. A. MacKay (1995). Factors affecting strength of perceived foreign accent in a second language. Journal of the Acoustical Society of America 97(5), 3125-3134. Fobbe, E. (2006). Foreigner Talk als Strategie. Überlegungen zu Fehlergenese in Erpresserschreiben. In A. Busch und S. Wichter (Hrsg.), Wissenstransfer - Erfolgskontrolle und Rückmeldungen aus der Praxis, 149-165. Frankfurt a.M.: Lang. Fougeron, C. und C. L. Smith (1999). French. In International Phonetic Association (Hrsg.), Handbook of the International Phonetic Association. A Guide to the Use of the International Phonetic Alphabet., 78-81. Cambridge University Press. Fraser, H. (2009). The role of ‘educated native speakers’ in providing language analysis for the determination of the origin of asylum seekers. The International Journal of Speech, Language and the Law 16(1), 113-138. Froitzheim, C. (1984). Artikulationsnormen der Umgangssprache in Köln. Continuum. Schriftenreihe zur Linguistik (2). Tübingen: Gunter Narr Verlag. Gfroerer, S. (1994). Häufigkeit und Art forensischer Stimmverstellungen. Bundeskriminalamt (Manuskript). Gfroerer, S. (2003). Auditory-Instrumental Forensic Speaker Recognition. In Proc. of the Eurospeech 2003: 8th European Conference On Speech Communication and Technology, Genf. http: / / iesk.et.uni-magdeburg.de/ ko/ konferenzen/ eurospeech/ papers/ 03/ ES031147.pdf (05.01.2007). Glitza, F. und H. R. Masthoff (2002). Auswirkungen der Positionierung des Telefonhörers zum Zwecke der Stimmverstellung und ihr Einfluss auf die auditive Sprechererkennung. Zeitschrift für Dialektologie und Linguistik. Beihefte. (Phonetics and its applications: Festschrift for Jens-Peter Köster on the occassion of his 60th birthday) 121, 110-117. Goethe-Institut (2010). Profile Deutsch. http: / / www.goethe.de/ lhr/ prj/ prd/ upd/ rus/ deindex.htm. (Zitiert am 09.08.2010). Goggin, J. P., C. P. Thompson, G. Strube, und L. R. Simental (1991). The role of language familiarity in voice identification. Memory & Cognition 19(5), 448- 458. Goldstein, A. G., P. Knight, K. Bailis, und J. Conover (1981). Recognition memory for accented and unaccented voices. Bulletin of the Psychonomic Society 17(5), 217-220. 272 Gries, S. T. (2008). Statistik für Sprachwissenschaftler. Studienbücher zur Linguistik (13). Göttingen: Vandenhoeck und Ruprecht. Gurski, C. (2006). Voice Onset Time as a parameter for identification of bilinguals. In Proc. 15th Annual Conference of the IAFPA 2006, Department of Linguistics, Göteborg University, Schweden, Göteborg. Gut, U. (2009). Non-native speech. A corpus-based analysis of phonological and phonetic properties of L2 English and German. English corpus linguistics (9). Frankfurt am Main etc.: Peter Lang. Hammarström, G. (1998). Französische Phonetik: Eine Einführung (3., vollst. überarb. und erw. Aufl.). Tübingen: Narr. Hellmann, J. (2008). Phonetische und phonologische Transferenzen und Interferenzen der Lernersprache amerikanischer Deutschlerner. Magisterarbeit (unveröff.), Friedrich-Schiller-Universität Jena, Jena. Hollien, H. (2002). Forensic voice identification. San Diego etc.: Academic Press. Hollien, H., W. Majewski, und E. T. Doherty (1982). Perceptual identification of voices under normal, stress and disguise speaking conditions. Journal of Phonetics 10, 139-148. Horga, D. (2002). The influence of bite-blocks on continuous speech production. Zeitschrift für Dialektologie und Linguistik. Beihefte. (Phonetics and its applications: Festschrift for Jens-Peter Köster on the occasion of his 60th birthday) 121, 143-152. Huntley Bahr, R. (1999). The dynamics of codeswitching in voice identification. In Proc. of the 14th ICPhS, San Francisco, 583-586. International Phonetic Association (Hrsg.) (1999). Handbook of the International Phonetic Association. A Guide to the Use of the International Phonetic Alphabet. Cambridge University Press. IPDS (1994). The Kiel Corpus of Read Speech. Kiel: IPDS. Vol. 1, CD-Rom 1. IPDS (1995-1997a). The Kiel Corpus of Spontaneous Speech. Kiel: IPDS. Vol. 1-3, CD-Rom 2-4. IPDS (1997b). xassp User’s Manual (Advanced Speech Signal Processor under the X Window System). Kiel: IPDS. Für Version 1.2.15. Jacewicz, E., R. A. Fox, und S. Lyle (2009). Variation in stop consonant voicing in two regional varieties of American English. Journal of the International Phonetic Association 39 (3), 313-334. Jessen, M. (1998). Phonetics and Phonology of tense and lax obstruents in German. Amsterdam, Philadelphia: Benjamins. Jessen, M., S. Gfroerer, und O. Köster (2003). Forensic study of a case involving SMS text-to-speech conversion. Forensic Linguistics: The International Journal of Speech, Language and the Law 10(1), 113-137. 273 Jessen, M., O. Köster, und S. Gfroerer (2005). Influence of vocal effort on average and variability of fundamental frequency. The International Journal of Speech, Language and the Law 12(2), 174-213. Jessen, M. und C. Ringen (2002). Laryngeal features in German. Phonology 19, 189-218. Jilka, M. (2000). The contribution of intonation to the perception of foreign accent. In Arbeitspapiere des Instituts für Maschinelle Sprachverarbeitung, Volume 6.3. Stuttgart: Universität Stuttgart. John, T. (2004). Eine akustische Analyse der Lenis/ Fortis-Opposition in Varietäten des Sächsischen. Magisterarbeit (unveröff.), Christian-Albrechts- Universität, Kiel. Jones, D. (1917). English Pronouncing Dictionary. London: Dent. Jones, D. (1969). An outline of English phonetics (9. Aufl.). Cambridge: W. Heffer and sons LTD. Kanjee, R., S. Watter, A. Sévigny, und K. R. Humphreys (2010). A case of foreign accent syndrome: Acoustic analyses and an empirical test of accent perception. Journal of Neurolinguistics 23, 580-598. Keating, P. A. (1984). Phonetic and phonological representation of stop consonant voicing. Language 60 (2), 286-319. Keating, P. A., M. J. Miko´ s, und W. F. Ganong (1981). A cross-language study of voice onset time in the perception of initial stop voicing. Journal of the Acoustical Society of America 70 (5), 1261-1271. Kehrein, R. (2009). Die Dialektalität von Vorleseaussprache im diatopischen Vergleich - Hörerurteil und phonetische Messung. Zeitschrift für Dialektologie und Linguistik 76 (1), 14-54. Kingston, J. und R. L. Diehl (1994). Phonetic knowledge. Language 70 (3), 419- 454. Klatt, D. H. (1975). Voice onset time, frication, and aspiration in word-initial consonant clusters. Journal of Speech and Hearing Research 18, 686-705. Klein, H.-W. (1982). Phonetik und Phonologie des heutigen Französisch (6. Aufl.). München: Max Hueber Verlag. Koenig, L. L. (2000). Laryngeal factors in voiceless consonant production in men, women, and 5-year-olds. Journal of Speech, Language and Hearing Research 43(5), 1211-1228. Koenig, L. L., J. C. Lucero, und W. E. Mencl (2008). Laryngeal and aerodynamic adjustments for voicing versus devoicing of / h/ : A within-speaker study. Journal of Voice 22(6), 709-720. 274 Kohler, K. J. (1979). Dimensions in the perception of fortis and lenis plosives. Phonetica 36, 332-343. Kohler, K. J. (1982). F0 in the production of lenis and fortis plosives. Phonetica 39, 199-218. Kohler, K. J. (1984). Phonetic explanation in phonology: The feature fortis/ lenis. Phonetica 41, 150-174. Kohler, K. J. (1994). Glottal stops and glottalization in German. Data and theory of connected speech processes. Phonetica 51, 38-51. Kohler, K. J. (1995). Einführung in die Phonetik des Deutschen. Grundlagen der Germanistik (20). Berlin: Erich Schmidt Verlag. Kohler, K. J. (2000). Linguistic and paralinguistic functions of non-modal voice in connected speech. In Proc. of the 5th Seminar on Speech Production: Models and Data, Kloster Seon, Germany, 89-92. Köster, O. und N. O. Schiller (1997). Different influences of the native language of a listener on speaker recognition. Forensic Linguistics: The International Journal of Speech, Language and the Law 4(1), 18-28. Köster, O., N. O. Schiller, und H. J. Künzel (1995). The influence of native language background on speaker recognition. In Proc. of the 13th ICPhS, Stockholm, 306-309. Krech, E.-M. (1968). Sprechwissenschaftlich-phonetische Untersuchungen zum Gebrauch des Glottisschlageinsatzes in der allgemeinen deutschen Hochlautung. Bibliotheca Phonetica (4). Basel, New York: Karger. Krech, E.-M., E. Stock, U. Hirschfeld, und L. C. Anders (Hrsg.) (2009). Deutsches Aussprachewörterbuch. Berlin, New York: Walter de Gruyter. Künzel, H. J. (1977a). Signalphonetische Untersuchung deutsch-französischer Interferenzen im Bereich der Okklusive. Forum linguisticum (10). Frankfurt a.M. etc: Lang. Künzel, H. J. (1977b). Zum Problem der Norm und Variabilität bei der Quantifizierung lautlicher Interferenz: eine empirische Untersuchung mit deutschen Französischlernenden. Linguistische Berichte 50, 45-50. Künzel, H. J. (1987). Sprechererkennung. Grundzüge forensischer Sprachverarbeitung. Heidelberg: Kriminalistik Verlag. Künzel, H. J. (2000). Effects of voice disguise on speaking fundamental frequency. Forensic Linguistics: The International Journal of Speech, Language and the Law 7(2), 149-179. Ladefoged, P. (1982). A Course in Phonetics (2. Aufl.). New York etc.: Harcourt Brace Jovanovich Publishers. 275 Ladefoged, P. und I. Maddieson (1996). The Sounds of the World’s Laguages. Oxford, Cambridge (Massachusetts): Blackwell Publishers. Lehiste, I. (1979). Perception of sentence and paragraph boundaries. In B. Lindblom und S. Öhman (Hrsg.), Frontiers of Speech Communication Research. Festschrift for Gunnar Fant, 191-201. London etc.: Academic Press. Lenneberg, E. H. (1967). Biological foundations of language. New York: Wiley. Léon, P. R. (2005). Phonétisme et prononciations du français. Paris: Armand Colin. Léon, P. R. (2009). Phonétisme et prononciations du français. Paris: Armand Colin. Libossek, M. und J. Anthes (2003). The influence of different linguistic units and unfamiliar phonemes on speaker discrimination in a foreign language. In Proc. of the 15th ICPhS, Barcelona, 699-702. Lisker, L. und A. Abramson (1964). A cross-language study of voicing in initial stops: acoustical measurements. Word 20, 384-422. Maddieson, I. (1984). Patterns of sounds. Cambridge: Cambridge University Press. Markham, D. (1997). Phonetic imitation, accent, and the learner. Travaux de l’institute de linguistique de Lund (33). Lund: Lund University Press. Markham, D. (1999). Listeners and disguised voices: the imitation and perception of dialectal accent. Forensic Linguistics: The International Journal of Speech, Language and the Law 6(2), 289-299. Martin, C. C. (2003). Manipulation of foreign-accented speech: improving English-accented French. In Proc. of the 15th ICPhS, Barcelona, 957-960. Masthoff, H. (1996a). A report on a voice disguise experiment. Forensic Linguistics: The International Journal of Speech, Language and the Law 3(1), 160-167. Masthoff, H. (1996b). Stimmverstellung durch Simulation von Stress erste Ergebnisse und Bedeutung für die forensische Sprecheridentifizierung. In Anwendungen der Akustik in der Wehrtechnik: Tagung am 17., 18. und 19. September 1996, Hamburg, 59-67. Deutsche Gesellschaft für Wehrtechnik / Sektion Meppen-Emden: Nixdorf. Masthoff, H. (2000). Die Auswirkungen von Stimmverstellungen auf ausgewählte phonetische Merkmale. In Bodo Nolte (Hrsg.), Anwendungen der Akustik in der Wehrtechnik: Tagung am 26., 27. und 28. September 2000, Hamburg, 58-66. Deutsche Gesellschaft für Wehrtechnik, Arbeitskreis Anwendungen der Akustik in der Wehrtechnik: Selbstverlag. Masthoff, H. und J.-P. Köster (1994). Identifikation von Sprechern bei Flüsterstimme. In Kurt Nixdorff (Hrsg.), Anwendungen der Akustik in der Wehrtechnik: Tagung am 13, 14. und 15. September 1994, Hamburg, 270-277. Deutsche Gesellschaft für Wehrtechnik / Sektion Meppen-Emden: Nixdorf. 276 McGehee, F. (1937). The reliability of the identification of the human voice. Journal of General Psychology 17, 249-271. Meier, H. (1967). Deutsche Sprachstatistik (2. Aufl.). Hildesheim: Georg Olms. Meinhold, G. (1962). Die Realisation der Silben (- @ n), (- @ m), (- @ l) in der deutschen hochgelauteten Sprache. Zeitschrift für Phonetik, Sprachwissenschaft und Kommunikationsforschung 15, 1-19. Meinhold, G. und E. Stock (1980). Phonologie der deutschen Gegenwartssprache. Leipzig: Bibliographisches Institut Leipzig. Meisenburg, T. und M. Selig (1998). Phonetik und Phonologie des Französischen. Uni Wissen Französisch. Stuttgart etc.: Klett. Moosmüller, S. (2006). Articulatory avoidance. In Proc. 15th Annual Conference of the IAFPA 2006, Department of Linguistics, Göteborg University, Schweden, Göteborg. Munro, M. J. (1995). Nonsegmental factors in foreign accent: ratings of filtered speech. Studies in Second Language Acquisition 17, 17-33. Munro, M. J., T. M. Derwing, und C. S. Burgess (2003). The detection of foreign accent in backwards speech. In Proc. of the 15th ICPhS, Barcelona, 535-538. Neuhauser, S. (2005). Phonetische und linguistische Variation bei der Stimmverstellung unter Verwendung eines fremdsprachigen Akzents. Magisterarbeit, Friedrich-Schiller-Universität Jena, Jena. http: / / www.db-thueringen. de/ servlets/ DocumentServlet? id=11301. Neuhauser, S. (2008). Voice disguise using a foreign accent - phonetic and linguistic variation. The International Journal of Speech, Language and the Law 15.2, 131-159. Neuhauser, S. (2011a). FAIC - Foreign Accent Imitation Corpus. In Proc. 20th Annual Conference of the IAFPA 2011, University of Vienna, Vienna, 45-46. Neuhauser, S. (2011b). Foreign accent imitation and variation of VOT and voicing in plosives. In Proc. of the 17th ICPhS, Hong Kong, 1462-1465. Neuhauser, S. (2011c). Variation of glottal activity in French accent imitation produced by native Germans. The International Journal of Speech, Language and the Law 18.2, 207-231. Neuhauser, S. und A. P. Simpson (2007a). Imitated or authentic? Listeners’ judgements of foreign accents. In Proc. of the 16th ICPhS, Saarbrücken, 1805- 1808. Neuhauser, S. und A. P. Simpson (2007b). Phonetic correlates of accent authenticity in voice disguise. In Proc. 16th Annual Conference of the IAFPA 2007, The College of St Mark & St John, Plymouth, UK, Plymouth, 26. 277 Neuhauser, S. und A. P. Simpson (2008). Realisation of German final syllable / - @ n/ as a cue to accent authenticity for French accents in German. In Proc. 17th Annual Conference of the IAFPA 2008, Laussane, CH, Lausanne, 2-3. Nielsen, K. Y. (2006). Specificity and generalizability of spontaneous phonetic imitation. In Proc. of the 9th International Conference on Spoken Language Processing (Interspeech), Pittsburgh, US, Paper 1326. Nolan, F. (1990). The limitations of auditory speaker identification. In H. Kniffka (Hrsg.), Texte zu Theorien und Praxis forensischer Linguistik, 457-749. Niemeyer. Ohala, J. J. (1983). The origin of sound patterns in vocal tract constraints. In P. F. MacNeilage (Hrsg.), The production of speech, 189-216. Springer-Verlag. Ohala, J. J. und C. J. Riordan (1979). Passive vocal tract enlargement during voiced stops. In J. J. Wolf und D. H. Klatt (Hrsg.), Speech Communication Papers, 89-92. Acoustical Society of America. Ohde, R. N. (1984). Fundamental frequency as an acoustic correlate of stop consonant voicing. Journal of the Acoustical Society of America 75(1), 224-230. Orchard, T. L. und A. D. Yarmey (1995). The effects of whispers, voice-sample duration, and voice distinctiveness on criminal speaker identification. Applied Cognitive Psychology 9, 249-260. Pierrehumbert, J. (1995). Prosodic effects on glottal allophones. In O. Fujimura und M. Hirano (Hrsg.), Vocal Fold Physiology 8: voice quality control, 39-60. San Diego, US: Singular Publishing Group. Pierrehumbert, J. und D. Talkin (1992). Lenition of / h/ and glottal stop. Papers in Laboratoy Phonology II, 90-117. Piske, T., I. R. A. MacKay, und J. E. Flege (2001). Factors affecting degree of foreign accent in an L2: a review. Journal of Phonetics 29, 191-215. Pompino-Marschall, B. (1995). Einführung in die Phonetik. Berlin, New York: Walter de Gruyter Studienbuch. Pompino-Marshall, B. und M. ˙ Zygis (2010). Glottal marking of vowel-initial words in German. In M. Weirich und S. Jannedy (Hrsg.), Papers from the Linguistics Laboratory, ZAS Papers in Linguistics 52, 1-17. Berlin: ZAS. Purschke, C. (2010). Imitation und Hörerurteil - Kognitive Dialekt-Prototypen am Beispiel des Hessischen. In C. Anders, M. Hundt, und A. Lasch (Hrsg.), Perceptual Dialectology. Neue Wege der Dialektologie, 151-178. Berlin, New York: Walter de Gruyter. R Development Core Team (2009). R: A language and environment for statistical computing. Vienna, Austria: R Foundation for Statistical Computing. ISBN 3-900051-07-0. 278 Ramers, K.-H. und H. Vater (1991). Einführung in die Phonologie. Kölner linguistische Arbeiten - Germanistik (16). Hürth-Efferen: Gabel. Redi, L. und S. Shattuck-Hufnagel (2001). Variation in the realization of glottalization in normal speakers. Journal of Phonetics 29, 407-429. Reich, A. R. (1981). Detecting the presence of vocal disguise in the male voice. The Journal of the Acoustical Society of America 69(5), 1458-1461. Reich, A. R. und J. E. Duke (1979). Effects of selected vocal disguises upon speaker identification by listening. The Journal of the Acoustical Society of America 66(4), 1023-1027. Reich, A. R., K. L. Moll, und J. F. Curtis (1976). Effects of selected vocal disguises upon spectrographic speaker identification. The Journal of the Acoustical Society of America 60(4), 919-925. Ringen, C. und P. Helgason (2008). Voicing and aspiration in Swedish stops. Journal of Phonetics 36(4), 607-628. Robb, M., H. Gilbert, und J. Lerman (2005). Influence of gender and environmental setting on voice onset time. Folia Phoniatrica et Logopaedica 57, 125-133. Röder, P. (1996). Französische Phonetik und Phonologie: ein Grundkurs. Erlangen Studien (105). Erlangen, Jena: Palm und Enke. Rodgers, J. (2000). The phonatory correlates of juncture in German. In Proc. of the 5th Seminar on Speech Production: Models and Data. CREST Workshop on Models of Speech Production: Motor Planning and Articulatory Modelling, Kloster Seon, Germany, 289-292. Rodman, R. D. (1998). Speaker recognition of disguised voices: A program for research. In H. M. Demirekler, A. Saranli (Hrsg.), Proc. of the Consortium on Speech Technology Conference on Speaker Recognition by Man and Machine: Directions for Forensic Applications, Ankara, 9-22. COST250 Publishing Arm. Rodman, R. D. (2002). Linguistics and the law: how knowledge of, or ignorance of, elementary linguistics may affect the dispensing of justice. Forensic Linguistics: The International Journal of Speech, Language and the Law 9(1), 94-103. Rodman, R. D. und M. S. Powell (2000). Computer recognition of speakers who disguise their voice. In Proc. of the International Conference on Signal Processing Applications & Technology, Dallas, USA. Rogers, H. (1998). Foreign accent in voice discrimination: a case study. Forensic Linguistics: The International Journal of Speech, Language and the Law 5(2), 203- 208. Rose, P. (2002). Forensic Speaker Identification. Forensic Science Series. London, New York: Taylor&Francis. 279 Rothe, W. (1978). Phonologie des Französischen. Einführung in die Synchronie und Diachronie des französischen Phonemsystems (2. von Richard Baum bearbeitete Aufl.). Grundlagen der Romanistik (1). Berlin: Erich Schmidt Verlag. Rues, B. (1993). Lautung im Gespräch. Ergebnisse einer empirischen Untersuchung. Forum Phoneticum (53). Frankfurt am Main: Wiss. Buchhandlung Hector. Rues, B. (2001). Noch einmal R. In M. Bräunlich, B. Neuber, und B. Rues (Hrsg.), Gesprochene Sprache - transdisziplinär. Festschrift zum 65. Geburtstag von Gottfried Meinhold, Hallesche Schriften zur Sprechwissenschaft und Phonetik (5), 127-134. Frankfurt a.M. etc.: Peter Lang. Europäischer Verlag der Wissenschaften. Rues, B., B. Redecker, E. Koch, U. Wallraff, und A. P. Simpson (2007). Phonetische Transkription des Deutschen. Ein Arbeitsbuch. Tübingen: Gunter Narr Verlag. Ryalls, J., A. Zipprer, und P. Baldauff (1997). A preliminary investigation of the effects of gender and race on voice onset time. Journal of Speech, Language and Hearing Research 40(3), 642-645. Sancier, M. L. und C. A. Fowler (1997). Gestural drift in a bilingual speaker of Brazilian Portuguese and English. Journal of Phonetics 25, 421-436. Schall, S. (2008). Anonyme inkriminierte Schreiben - Das Verbergen der Identität eines Autors. In S. Pappert, M. Schröter, und U. Fix (Hrsg.), Verschlüsseln, Verbergen, Verdecken in öffentlicher und institutioneller Kommunikation, Philologische Studien und Quellen (211), 315-343. Berlin: Erich Schmidt. Schmidt, L. (2003). Französisch. In U. Hirschfeld, H. P. Kelz, und U. Müller (Hrsg.), Phonetik international: von Afrikaans bis Zulu; kontrastive Studien für Deutsch als Fremdsprache. Waldsteinberg: Popp. Segerup, M. (1999). Imitation of dialects: From South Swedish to West Swedish. In Proc. of the 14th ICPhS, San Francisco, 1253-1256. Simmler, F. (1983). Konsonantenschwächung in den deutschen Dialekten. In W. Besch, U. Knoop, W. Putschke, und H. Wiegand (Hrsg.), Dialektologie. Ein Handbuch zur deutschen und allgemeinen Dialektforschung, 1121-1129. Berlin: Walter de Gruyter. Simpson, A. P. (1998). Phonetische Datenbanken des Deutschen in der empirischen Sprachforschung und der phonologischen Theoriebildung. In K. J. Kohler (Hrsg.), Arbeitsberichte des Instituts für Phonetik und digitale Sprachverarbeitung Universität Kiel (AIPUK, Nr. 33). Kiel: Universität Kiel. Simpson, A. P. (1999). Fundamental problems in comparative phonetics and phonology: Does UPSID help to solve them? In Proc. of the 14th ICPhS, San Francisco, 349-352. Simpson, A. P. (2007). Acoustic and auditory correlates of non-pulmonic sound production in German. Journal of the International Phonetic Association 37(2), 173-182. 280 Simpson, A. P. (2009). Phonetic differences between male and female speech. Language and Linguistics Compass 3(2), 621-640. Simpson, A. P. und S. Grawunder (2008). Intraoral pressure variation in nasalplosive and plosive-plosive sequences in German. In R. Sock, S. Fuchs, und Y. Laprie (Hrsg.), Proc. of the 8th International Seminar on Speech Production (ISSP), Strasbourg, 125-128. Simpson, A. P. und G. Meinhold (2007). Compensatory articulations in a case of congenital aglossia. Clinical Linguistics and Phonetics 21(7), 543-556. Simpson, A. P. und S. Neuhauser (2010). The persistency of epiphenomenal sound production in foreign accent disguise. In Proc. 16th Annual Conference of the IAFPA 2010, University of Trier, Trier, 31. Sjölander, K. und J. Beskow (2005). Wavesurfer (Computerprogramm, Version 1.8.5). http: / / www.speech.kth.se/ wavesurfer/ . Sjöström, M., E. J. Eriksson, E. Zetterholm, und K. P. Sullivan (2006). A switch of dialect as disguise. Lund University, Centre for Languages & Literature, Dept. of Linguistics & Phonetics. Working Papers 52, 113-116. Spangenberg, K. (1993). Laut- und Formeninventar thüringischer Dialekte. Berlin: Akademie Verlag. Steinberg, J. (2008). Geflüsterte Plosive. Hallesche Schriften zur Sprechwissenschaft und Phonetik (27). Frankfurt a.M. etc.: Peter Lang. Internationaler Verlag der Wissenschaften. Stevens, K. N. (1998). Acoustic Phonetics. Current Studies in Linguistics (30). Cambridge, MA and London, UK: MIT Press. Storey, K. C. J. (1996). Constants in auditory and acoustic voice analysis in forensic speaker identification in cases of diguised voice. In H. Kniffka und S. Blackwell (Hrsg.), Recent developments in forensic linguistics, 203-216. Frankfurt am Main [etc.]: Lang. Sullivan, K. P. H. und F. Kügler (2001). Was the knowledge of the second language or the age difference the determining factor? Forensic Linguistics: The International Journal of Speech, Language and the Law. 8(2), 1-8. Sullivan, K. P. H. und F. Schlichting (2000). Speaker discrimination in a foreign language: first language environment, second language learners. Forensic Linguistics: The International Journal of Speech, Language and the Law. 7(1), 95- 111. Swartz, B. (1992). Gender difference in voice onset time. Perceptual and Motor Skills 75, 983-992. Tate, D. A. (1979). Preliminary data on dialect in speech disguise. In Current issues in the phonetic sciences: Proc. of the IPS-77 Congress, Volume 9, Amsterdam, 847-850. Benjamins. 281 Temple, R. A. (1999). Phonetic and sociophonetic conditioning of voicing patterns in the stop consonants of French. In Proc. of the 14th ICPhS, San Francisco, 1409-1412. Ternes, E. (1976). Probleme der kontrastiven Phonetik. Forum Phoneticum (13). Hamburg: Buske. Theodore, R. M., J. L. Miller, und D. DeSteno (2007). The effect of speaking rate on voice-onset-time is talker specific. In Proc. of the 16th ICPhS, Saarbrücken, 473-476. Thompson, C. P. (1987). A language effect in voice identification. Applied Cognitive Psychology 1(2), 121-131. Torstensson, N. (2010). Judging the immigrant: Accents and attitudes. Umeå: Umeå University. Torstensson, N., E. J. Eriksson, und K. P. H. Sullivan (2004). Mimicked accents - Do speakers have similar cognitive prototypes? In Proc. of the 10th Australian International Conference on Speech Science & Technology, Macquarie University, Sydney, 271-276. Australian Speech Science & Technology Association Inc. Trubetzkoy, N. S. (1962). Grundzüge der Phonologie (3. Aufl.). Göttingen: Vandenhoeck und Ruprecht. Umeda, N. (1978). Occurrence of glottal stops in fluent speech. Journal of the Acoustical Society of America 64(1), 88-94. van Dommelen, W. A. (1983). Parameter interaction in the perception of French plosives. Phonetica 40, 32-62. Verhoeven, J. und P. Marïen (2010). Neurogenic foreign accent syndrome: Articulatory setting, segments and prosody in a Dutch speaker. Journal of Neurolinguistics 23, 599-614. Vieru-Dimulescu, B., P. Boula de Mareüil, und M. Adda-Decker (2007). Characterizing non-native French accents using automatic alignment. In Proc. of the 16th ICPhS, Saarbrücken, 2217-2220. Wadnerkar, M. B., P. E. Cowell, und S. P. Whiteside (2006). Speech across the menstrual cycle: A replication and extension study. Neuroscience Letters 408, 21-24. Wagner, I. (1998). Recent trends in voice disguise. IAFP Conference. Wagner, I. und O. Köster (1999). Perceptual recognition of familiar voices using falsetto as a type of voice disguise. In Proc. of the 14th ICPhS, Volume 2, San Francisco, 1381-1384. Whiteside, S. P., A. Hanson, und P. E. Cowell (2004). Hormones and temporal components of speech: sex differences and effects of menstrual cyclicity on speech. Neuroscience Letters 367, 44-47. 282 Whiteside, S. P., L. Henry, und R. Dobbin (2004). Sex differences in voice onset time: A developmental study of phonetic context effects in British English. Journal of the Acoustical Society of America 116, 1179-1183. Whiteside, S. P. und J. Marshall (2001). Developmental trends in voice onset time: some evidence for sex differences. Phonetica 58, 196-210. Witecy, B. (2010). Akzentbeurteilung bei Foreign Accent Syndrome. Masterarbeit (unveröff.), Philipps-Universität Marburg, Marburg. Witecy, B., L. Beckhoff, S. Neuhauser, und F. Domahs (2010). Akzentbeurteilung bei Foreign Accent Syndrome. 10. Jahrestagung der Gesellschaft für Aphasieforschung und -behandlung, Münster. Zetterholm, E., K. P. H. Sullivan, J. Green, E. Eriksson, und P. E. Czigler (2003). Imitation, expectation and acceptance: the role of age and first language in a nordic setting. In Proc. of the 15th ICPhS, Barcelona, 683-686. Zhang, C. (2007). An acoustic study on disguised voices. The International Journal of Speech, Language and the Law. 14(1), 154-156. 283 A. Fragebogen zur Akzentermittlung A.1. Fragebogen der ersten Probandengruppe Fragebogen zur Imitation eines fremdsprachigen Akzents Es ist nahezu unmöglich, den Akzent seiner Muttersprache beim Sprechen einer Fremdsprache abzulegen. D. h. als deutscher Muttersprachler werden Sie beispielsweise im englischsprachigen Ausland sehr schnell entweder als Deutscher oder zumindest als Nicht- Muttersprachler der englischen Sprache erkannt. Auch Nicht-Muttersprachler des Deutschen weisen einen für ihre Muttersprache typischen Akzent auf. Die folgende Befragung dient der Untersuchung der Fähigkeit deutscher Muttersprachler, einen fremdsprachigen Akzent zu imitieren. Bitte nehmen Sie an der Befragung nur teil, wenn Deutsch Ihre Muttersprache ist! 1. Welchen fremdsprachigen Akzent könnten Sie Ihrer Meinung nach am besten imitieren? Sie haben die Wahl zwischen einem bis maximal zwei der vorgegebenen Akzente. Akzent 1. Stimme 2. Stimme Amerikanisches Englisch Britisches Englisch Französisch Italienisch Russisch Schweizerdeutsch Slawisch (allgemein) Spanisch Türkisch Vietnamesisch Anderer Akzent ... Stimmenenthaltung 2. Woher sind Ihnen Ihre oben gewählten Akzente bekannt / vertraut? _________________________________________________________ 3. Welche Merkmale weisen diese Akzente Ihrer Meinung nach auf? Die Merkmale können z. B. Aussprache, Stimmgebung, Wortschatz oder Grammatik betreffen. 1. gewählter Akzent: 2. gewählter Akzent: 285 4. Angaben zur Person: Geschlecht: © männlich © weiblich Alter: In welcher Region oder in der Nähe welcher Großstadt haben Sie in den letzten 10-20 Jahren gelebt? (z. B. Thüringen oder Berlin; Mehrfachantworten möglich) Erlernte Fremdsprachen: 1. 2. 3. 4. Auslandsaufenthalt in einem der entsprechenden Länder: Studienfächer und Fachsemester: 5. Teilnahme am Experiment: Können Sie sich vorstellen, an einem Experiment teilzunehmen, in dem Sie einen Ihrer unter Punkt 1 gewählten fremdsprachigen Akzente imitieren? Ihre Imitationsversuche werden dabei aufgezeichnet (Audioaufnahmen). Die Sprachaufnahmen finden voraussichtlich im nächsten Semester statt. Es wird pro Sprecher zwei Aufzeichnungen geben, d. h. Sie müssen an zwei Terminen für das Experiment zur Verfügung stehen. Eine Aufzeichnung dauert voraussichtlich 15 min. © Ja, ich möchte am Experiment teilnehmen. © Nein, ich möchte nicht teilnehmen. Name*: E-Mail*: Telefon*: 6. Datum und Art/ Name der Veranstaltung, in der Sie diesen Fragebogen ausgefüllt haben: Datum: Veranstaltung: Vielen Dank für Ihre Teilnahme! *Ihre Daten werden ausschließlich zur Kontaktaufnahme mit Ihnen verwendet. Vorausgesetzt Sie möchten am Experiment teilnehmen. 286 A.2. Fragebogen der Kontrollgruppe Fragebogen zur Imitation eines fremdsprachigen Akzents Es ist nahezu unmöglich, den Akzent seiner Muttersprache beim Sprechen einer Fremdsprache abzulegen. D. h. als deutscher Muttersprachler werden Sie beispielsweise im Ausland sehr schnell entweder als Deutscher oder zumindest als Nicht-Muttersprachler der jeweiligen Sprache erkannt. Auch Nicht-Muttersprachler des Deutschen weisen einen für ihre Muttersprache typischen Akzent auf. Die folgende Befragung dient der Untersuchung der Fähigkeit deutscher Muttersprachler, einen fremdsprachigen Akzent zu imitieren. 1. Welche fremdsprachigen Akzente könnten Sie Ihrer Meinung nach am besten imitieren? 1. _________________________ 2. _________________________ 2. Woher sind Ihnen Ihre oben gewählten Akzente (Achtung nicht die Sprache! ) bekannt / vertraut? ___________________________________________________________ 3. Welche Merkmale weisen diese Akzente Ihrer Meinung nach auf? Die Merkmale können z. B. Aussprache, Stimmgebung, Wortschatz oder Grammatik betreffen. 1. gewählter Akzent: 2. gewählter Akzent: 287 4. Angaben zur Person: Geschlecht: © männlich © weiblich Alter: In welcher Region oder in der Nähe welcher Großstadt haben Sie in den letzten 10-20 Jahren gelebt? (z. B. Thüringen oder Berlin; Mehrfachantworten möglich) Erlernte Fremdsprachen: 1. 2. 3. 4. Auslandsaufenthalt in einem der entsprechenden Länder: Studienfächer und Fachsemester 5. Teilnahme am Experiment: Es werden noch dringend Probanden gesucht! Sie sollen in einem Experiment versuchen, einen Ihrer unter Punkt 1 gewählten fremdsprachigen Akzente zu imitieren. Ihre Imitationsversuche werden dabei aufgezeichnet (Audioaufnahmen). Die Sprachaufnahmen finden innerhalb der nächsten 4 - 6 Wochen statt. Es wird pro Sprecher zwei Aufzeichnungen geben, d. h. Sie müssen an zwei Terminen für das Experiment zur Verfügung stehen. Eine Aufzeichnung dauert voraussichtlich 15 min. © Ja, ich möchte am Experiment teilnehmen. © Nein, ich möchte nicht teilnehmen. Name*: E-Mail*: Telefon*: 6. Datum und Art/ Name der Veranstaltung, in der Sie diesen Fragebogen ausgefüllt haben: Datum: Veranstaltung: Vielen Dank für Ihre Teilnahme! *Ihre Daten werden ausschließlich zur Kontaktaufnahme mit Ihnen verwendet. Vorausgesetzt Sie möchten am Experiment teilnehmen. 288 B. Probandenbefragung der Sprecher B.1. Fragebogen für die Experimentteilnehmer Name Alter Geschlecht © männlich © weiblich Muttersprache: Regionale Herkunft: Studienfächer und FS: 1. 2. 3. Erlernte Fremdsprachen: 1. (außer Latein) 2. 3. 4. Auslandsaufenthalt: (mind. vier Wochen) Akzent(e) aus Experiment: Merkmale des Akzents: Akzent ist bekannt durch: © Alltag, z. B.: ... © Medien, z. B.: ... © Freunde/ Bekannte © Familie 289 Selbsteinschätzung: © Ja, sicher. War Ihr imitierter Akzent authentisch? © Ja, wahrscheinlich. © Nein, wahrscheinlich nicht. © Nein, sicher nicht. Könnten Sie einen imitierten Akzent von einem authentischem unterscheiden? © Ja, sicher. © Ja, wahrscheinlich. © Nein, wahrscheinlich nicht. © Nein, sicher nicht. Haben Sie Ihnen bekannte Hörprobleme? © ja © nein Haben Sie Ihnen bekannte Sprach-, Sprech- oder Stimmstörungen? © ja © nein Sprechen Sie die zugrundeliegende Sprache des Akzents flüssig? © ja © nein Sprechen Ihre Eltern die zugrundeliegende Sprache des Akzents? © ja © nein Haben Sie regelmäßigen Kontakt zu Nicht-Muttersprachlern des Deutschen? Zu Muttersprachlern welcher Sprache? © ja © nein Datum der Aufnahmen 1 und 2: 1. __. __. 2006 2. __. __. 2006 B.2. Fragebogen zum Übungsaufwand Haben Sie sich vor den Aufnahmen auf die Texte / die Imitation vorbereitet? 1. Nein. 2. Ja, kurz durchgelesen. 3. Ja, mehrmals durchgelesen. (Wie oft ungefähr? ) 4. Ja, einmal laut vorgelesen. 5. Ja, mehrmals laut vorgelesen. (Wie oft ungefähr? ) 6. Ja, ich habe mich sehr gut vorbereitet, z.B. durch ... (Hier könnte so etwas stehen wie „extra Filme/ Musik mit Deutsch sprechenden/ singenden französischen Muttersprachlern angeschaut/ angehört“ oder „habe mir Tipps von meiner russischen Freundin geben lassen“...) Bitte für beide Aufnahmen ausfüllen und ehrlich antworten! 290 C. Texte C.1. Text 1 Sind Sie allein? Hören Sie gut zu. Ich sag es nur einmal. Ich will eine Million Euro. Sie packen das Geld in fünf Umschläge. In jeden Umschlag 200-tausend Euro. Nur kleine Scheine. Dann stecken Sie das Geld, also die Umschläge, in zwei Beutel. Kommen Sie am Dienstag Nachmittag um 2 Uhr zur Bushaltestelle an der Deutschen Bank. Dort steigen Sie in die Linie 12 ein und fahren bis zur Haltestelle „Am Stadion“. Wenn Sie am Stadion angekommen sind, gehen Sie zur Kasse 2 und werfen das Geld dort in den Mülleimer. Und keine Tricks. Kommen Sie allein. Ohne Polizei. Kein Falschgeld. Sonst kann ich für nichts garantieren. Ich sag es noch einmal. Kommen Sie allein. C.2. Text 2 Die Zahl der Banküberfälle ist in diesem Jahr deutlich gesunken. Zwölf Überfälle waren es bisher, 32 im vergangenen Jahr. Die Polizei bezweifelt, dass die Zahl des Vorjahres erreicht wird. „Ob die vergleichsweise wenigen Banküberfälle mit der Euro-Einführung zu tun haben, darüber haben wir auch schon spekuliert“, sagte heute ein Polizeibeamter. Die verstärkten Sicherheitsvorkehrungen der Banken könnten Räuber abgeschreckt haben. Denn wegen des Euros werden die Banken gut überwacht und daher auch seltener beraubt. Gleichzeitig ist die mit der Einführung des Euro erwartete erhöhte Kriminalität ausgeblieben. Die Zahl der falschen Geldscheine stieg deutlich. Aber es gibt keine Hinweise dafür, dass Fälscher nun eilig geheime Falschgeld-Lager räumen. Ebenso wenig tauchen Geldscheine aus der Beute vergangener Raubtaten auf. Probleme mit Lösegeldern aus Erpressungsfällen sieht die Polizei nicht auf sich zukommen. Der Kaufhaus-Erpresser „Dagobert“ zum Beispiel hat nie Geld erhalten. Allerdings fehlt noch ein Teil der Beute aus dem Überfall auf die Deutsche Bank in Frankfurt am Main. 1998 hatten vier Täter umgerechnet zwölf Millionen Euro Lösegeld für ihre 16 Geiseln in der Bank erhalten. Davon fehlen noch immer zwei Millionen Euro. Vermutlich ist die fehlende Beute irgendwo sicher untergebracht. Zeit genug, das Geld zu waschen, hatten die Täter. Der letzte wurde zwei Jahre nach dem Überfall festgenommen. Außerdem hat es sich auch unter den Gangstern herumgesprochen, dass der Euro kommt: „Die werden nicht bis zum letzten Moment warten, um die Beute umzutauschen“, sagt ein Polizeibeamter des Landeskriminalamtes. (modifiziert nach Tagesspiegel Online, 19. 11. 2001) 291 C.3. Text 3 In Frankfurt sind drei Bankräuber zwischen 64 und 74 Jahren zu langen Haftstrafen verurteilt worden. Der mit 64 Jahren jüngste Angeklagte muss wegen schweren Raubes und schwerer Erpressung für zwölf Jahre hinter Gitter. Zu zehn Jahren wurde ein 73-Jähriger verurteilt. Das älteste Mitglied der Bande ist 74 und kommt für neun Jahre in Haft. Das Trio, das als „Opa-Bande“ bekannt wurde, überfiel zwischen 1986 und 2004 insgesamt 12 Banken. Die Männer erbeuteten bei ihren Taten jeweils mehrere 10-tausend Euro, insgesamt eine halbe Million Euro. Zwei Männer der „Opa-Bande“ gestehen mittlerweile die Überfälle. Der dritte schweigt. Bei ihren Überfällen hatten sie immer Pistolen aus dem Zweiten Weltkrieg dabei. Das Muster war bei allen Banküberfällen gleich: Die Täter sind immer kurz vor Feierabend in die Banken gekommen, wenn wenig Kunden da waren. Alle haben Masken und moderne Hosen getragen. Ein Mann hat an der Tür gewartet und aufgepasst, dass keine Polizei kommt. Die anderen zwei Männer sind mit ihren Pistolen zur Kasse gegangen. Dort haben sie die Angestellten gezwungen, Geld herauszugeben. Sie wollten meist nur kleine Scheine. Das Geld mussten die Angestellten in zwei Beutel packen. Sie sagten immer wieder „Bleiben Sie ruhig. Hören Sie gut zu. Und keine Tricks. Sonst passiert was“. Wenn die Polizei gekommen ist, waren die Täter schon längst wieder weg. C.4. Text 4 1. Deutsche Übersetzungsvorlage: Heute Abend kommt ein schöner Film im Kino. Das Kino befindet sich im Stadtzentrum. Gehen Sie diese Straße immer geradeaus. Dann kommen Sie an der Deutschen Bank und der Polizeistation vorbei. An der nächsten Kreuzung ist das Kino. Der Eintritt kostet 6 Euro. 2. Französische Übersetzung: Ce soir il y a un joli film au cin ´e ma. Le cin ´e ma se situe au centre-ville. Prenez cette rue toujours tout droit. Apr `e s passez devant la Deutsche Bank et le commissariat. Le cin ´e ma est à l’intersection suivante. L’entr ´e e coute six euros. 3. Englische Übersetzung: This evening a beautiful film is playing at the theater. The theater is in the city center. Go straight ahead on this street. Then pass the Deutsche Bank 292 and the police station. At the next crossroad is the theater. Admission costs six Euros. C.5. Aufgabenstellung zum Schreiben eines eigenen Textes Schreiben Sie einen eigenen Text, der die folgenden Wörter / Wortgruppen enthält: • Sie kommen allein! • Hören Sie nicht? / Hören Sie mich? • Umschlag • Sie fahren zur Bushaltestelle! • Deutsche Bank • Geld / Falschgeld • eine Million Euro • 12-tausend Euro • die Angestellte(n) an der Kasse • Packen Sie zwei Beutel! • Polizei • Pistole • die Täter sind in Haft Der Text sollte: • ca. 100 Wörter lang sein • in Ihrem gewählten Akzent (französisch / amerikanisch-englisch / türkisch / russisch) gesprochen werden • nicht nur in der Aussprache, sondern auch in der Grammatik verändert sein, z. B.: Wortstellung im Satz, Verbendungen verändert, anderer Kasus oder anderes Geschlecht der Wörter → alles so, wie Sie denken, dass ein Muttersprachler Ihres gewählten Akzents es auf diese Art und Weise formulieren würde (der Inhalt ist nebensächlich! ) 293 C.6. Aufgabenstellung zum Schreiben eines eigenen Textes für Nicht-Muttersprachler des Deutschen Schreiben Sie einen eigenen Text (ca. 100 Wörter), der die folgenden Wörter / Wortgruppen enthält: • Sie kommen allein! • Hören Sie nicht? / Hören Sie mich? • Umschlag • Sie fahren zur Bushaltestelle! • Deutsche Bank • Geld / Falschgeld • eine Million Euro • 12-tausend Euro • die Angestellte(n) an der Kasse • Packen Sie zwei Beutel! • Polizei • Pistole • die Täter sind in Haft Bitte schreiben Sie den Text ohne Hilfestellung durch einen deutschen Muttersprachler! Der Text muss nicht korrekt sein! 294 C.7. Transliterationsproben Die hier dargestellten Transliterationen der selbst verfassten Texte der Sprecherinnen Ff01 und F-nf01 sowie des spontansprachlichen Materials von Sprecherin Ff15 dienen als Transliterationsproben. Ff01 - Selbst verfasster Text; Erste Aufnahme Hallo? Sie haben gedacht die Täter sein in Haft? Sie haben gedacht Sie ganz schlau sind! Aber wir wollen haben das Geld sofort. Hören Sie mich? Holen Sie Geld von die Deutsche Bank. Kein Falschgeld. Die Angestellte an die Kasse soll packen zwei Beutel mit zwölftausend Euro und den Rest in eine Umschlag. Sie fahren zu Bushaltestelle und kommen Sie allein und bringen Sie die eine Million Euro mit. Werfen Sie die Geldbeutel in die Mülltonne. Die Umschlag in die Briefkasten bei die kleine Laden. Ich warne Sie: Keine Polizei. Wir haben Pistolen! Zweite Aufnahme [...] wir wollen das Geld haben sofort [...] Aber wir wollen haben das Geld sofort [...] an die Kasse sollen packen [...] Werfen Sie Geldbeutel [...] F-nf01 - Selbst verfasster Text; Erste Aufnahme Was würden Sie machen, wenn Sie eine Million Euro finden würden? Die Frage hab ich mich gestellt als ich in meinem neuen Haus eingezogen bin. Beim Umräumen hab ich einen alten Kasten im Keller entdeckt. Drin lagen das Geld, eine Pistole, ein dickes Buch sowie ein Umschlag. Der Umschlag schien leer zu sein. Als ich aber von meiner Lampe näher gekommen bin, um den Inhalt genau zu betrachten, sind Nummern aufgetaucht. Wahrscheinlich würden Sie mir jetzt raten: „Achten Sie nicht drauf! Packen Sie zwei Beutel! Gehen Sie mal zur Deutsche(n) Bank! “ Mal angenommen es sei Ihre Bank. „Und lassen Sie das Ganze auf Ihrem Konto einzahlen.“ Ich würde mich auf jeden Fall interessieren, wie die Angestellte an der Kasse wohl reagieren würde. Stattdessen habe ich aus Neugier versucht, die Nummer, die im Inneren des Umschlags geschrieben war, anzurufen. Ich hätte mich besser überlegen sollen. Bevor ich ein einziges Wort sagen konnte, ertönte eine strenge Stimme: „Bringen Sie mir mein Geld! Sofort! Sie fahren zur Bushaltestelle! Diejenige an der Kreuzung am Ende Ihrer Straße. Hören Sie mich? Sie kommen allein! Ich warte auf Sie! “ Die Pistole war nicht mal aufgeladen. Nach einer Weile entschied ich mich, trotzdem loszufahren. Als ich ankam stand die Polizei da. „Die Täter sind in Haft! Danke für Ihre Hilfe. Wir haben schon seit einiger Zeit die Telefongespräche abgehört. Jetzt wissen wir endlich, wo das Geld versteckt war. Wenn Sie nun 295 mal sein könnten ... nett sein könnten, und mir das Geld übergeben würden.“ So kam es, dass ich am Ende gar nix mehr davon hatte. Als ich dabei war, mich ein letztes Mal diesen Umschlag anzusehen, ist plötzlich die Nummer hundertdreiundneunzig erschienen. Mein Blick fiel auf das Buch, das noch im Kasten lag. Ich schlug es auf und fand an dieser Seite einen Scheck von zwölftausend Euro. Ohne Empfängernamen. Zweite Aufnahme [...] in meinen neuem Haus [...] Es würde mich auf jeden Fall [...] wie der Angestellte an der Kasse [...] im Inneren des Umschlag geschrieben war [...] ertönte eine strenge Stimme [...] war nicht mal geladen [...]. Ff15 - Spontansprache Also, ich heiße XXX, ich bin siebenundzwanzig Jahre alt und ich wohne in XXX. Ich studiere hier seit sechs Jahren Spanisch, Englisch und Psychologie und habe vor, nächstes Frühjahr mfertig zu werden mit dem Studium. Ich habe eine Sohn, der ist sechs Jahre alt und geht in die Kindergarten in die Philosophenweg. Im nächsten Sommer werden wir zurückziehen nach XXX, wo ich geboboren bin. Und ich werde mir hoffentlich eine schöne Arbeit suchen, um am Wochenende nebenbei noch eine Heilpraktikerausbildung bezahlen zu können. Ich mag XXX, weil XXX ist sehr jung, XXX hat viele Studenten und ich mag die Architektur in der Innenstadt, aber XXX ist auch sehr klein und manchmal mag ich es nicht viele Leute immer wieder zu treffen ob man will oder nicht. Allerdings hab ich viele Freunde, die kommen aus der ganzen Welt, so wie XXX aus Tschechien und XXX aus Russland und verschiedene andere Leute, die allerdings auch in diesem Jahr fertig werden mit dem Studium, sodass ich nicht so traurig sein werde, hier weg zu ziehen. 296 D. Fragebogen für Perzeptionsexperiment I und II Perzeptionsexperiment Teil A - Ist der gesprochene Akzent authentisch oder nicht-authentisch? 1. Durchgang: Sprecher authentisch nicht-authentisch Sprecher authentisch nicht-authentisch 1 21 2 22 3 23 4 24 5 25 6 26 7 27 8 28 9 29 10 30 Sprecher authentisch nicht-authentisch Sprecher authentisch nicht-authentisch 11 31 12 32 13 33 14 34 15 35 16 17 18 19 20 Abbildung D.1.: Fragebogen der Perzeptionsexperimente I (Teilexperiment 1 - Authentizitätsbeurteilung) und II exemplarisch an Durchgang 1 dargestellt 297 Perzeptionsexperiment Teil B - Welchen fremdsprachigen Akzent erkennen Sie? 6. Durchgang: Sprecher Akzent (weiß nicht) authentisch nicht-authentisch 1 2 3 4 5 6 7 8 9 10 Sprecher Akzent (weiß nicht) authentisch nicht-authentisch 11 12 13 14 15 16 17 18 19 20 Sprecher Akzent (weiß nicht) authentisch nicht-authentisch 21 22 23 24 25 26 27 28 29 30 Sprecher Akzent (weiß nicht) authentisch nicht-authentisch 31 32 33 34 35 Abbildung D.2.: Fragebogen des Perzeptionsexperiments I (Teilexperiment 2 - Identifikation) 298 E. Tabellen Tabelle E.1.: VOT-Werte der deutschen Muttersprachler (N=22) in unverstellter (uv.) und verstellter (fr.) Version der Texte 1 und 3 (1. Aufnahme); geordnet nach Plosiv-Vokal-Kontext; angegeben ist das arithmetische Mittel in ms gerundet auf eine Dezimalstelle / pa-/ / pO-/ / t/ +V / k/ +HV / k/ +ZV Gesamt uv. fr. uv. fr. uv. fr. uv. fr. uv. fr. uv. fr. Ff01 40,0 13,0 43,3 45,0 84,3 32,5 58,8 38,7 70,7 55,3 62,8 41,0 Ff02 69,0 49,0 59,7 35,7 80,0 44,5 68,9 54,6 72,3 59,1 70,5 51,5 Ff03 50,0 12,0 58,7 23,3 69,3 26,5 55,6 22,9 65,9 18,7 60,6 21,5 Ff04 25,0 15,5 45,0 31,7 60,0 31,0 53,9 43,8 44,3 44,0 48,8 38,1 Ff05 49,0 14,0 65,7 44,0 71,5 26,0 56,8 32,5 79,6 42,1 66,0 34,1 Ff06 70,5 21,0 53,7 35,3 70,0 57,8 67,0 49,0 68,3 36,1 66,5 42,9 Ff07 23,5 14,5 37,7 21,3 53,3 38,8 51,3 36,7 43,4 25,7 45,6 30,3 Ff08 35,5 7,5 44,7 19,0 51,5 19,8 51,0 35,6 41,4 30,1 46,4 27,3 Ff09 59,5 73,0 63,7 65,0 83,0 79,5 69,1 73,8 76,3 83,7 71,9 76,4 Ff10 50,5 19,5 41,7 17,0 57,8 31,0 69,8 29,8 65,1 37,3 61,6 29,7 Ff11 55,0 45,5 54,3 58,0 54,8 45,0 55,8 57,9 60,7 46,0 56,7 51,2 Ff12 35,0 7,5 43,7 19,3 68,8 15,3 57,3 41,6 63,0 31,9 57,3 29,2 Ff13 36,0 18,5 33,0 15,0 49,0 21,5 38,0 35,9 38,4 22,3 39,1 25,9 Ff14 29,5 20,0 39,7 17,0 55,8 34,0 46,9 42,0 50,3 31,0 47,0 32,9 Ff15 28,5 33,0 49,0 25,7 67,0 26,5 52,1 38,7 51,9 34,4 52,2 33,5 Fm01 37,0 14,0 47,3 24,0 49,3 35,8 62,1 50,9 68,3 34,9 57,8 37,3 Fm02 22,0 13,5 44,3 29,0 45,5 33,5 61,0 49,2 45,1 43,4 49,0 39,8 Fm03 39,5 12,5 28,7 12,7 49,8 28,0 46,9 22,0 41,6 22,9 43,1 21,3 Fm04 40,5 18,0 49,3 35,7 60,3 30,5 51,0 36,2 45,6 37,7 49,9 34,2 Fm05 25,0 11,0 54,3 37,3 51,3 17,5 52,9 33,7 42,7 36,6 47,7 30,5 Fm06 30,0 37,0 22,0 19,7 54,5 23,8 63,8 45,7 50,9 33,4 51,0 34,9 Fm07 30,0 26,0 46,3 -3,7 59,0 35,0 45,2 63,7 34,7 40,0 43,4 41,4 299 Tabelle E.2.: VOT-Mittelwerte der deutschen Muttersprachler (N=22) in unverstellter (uv.) und verstellter (fr.) Version der Texte 1 und 3 (1. Aufnahme) mit der Mittelwertsdifferenz und dem Standardfehler (SE) der Mittelwertsdifferenz; Angaben in ms gerundet auf eine Dezimalstelle verstellt unverstellt Mittelwertsdifferenz (SE) Ff01 41,0 62,8 -21,8 (5,5) Ff02 51,5 70,5 -19,0 (5,1) Ff03 21,5 60,6 -39,1 (3,4) Ff04 38,1 48,8 -10,7 (4,0) Ff05 34,1 66,0 -31,8 (6,9) Ff06 42,9 66,5 -23,6 (4,6) Ff07 30,3 45,6 -15,2 (4,0) Ff08 27,3 46,4 -19,1 (3,4) Ff09 76,4 71,9 4,4 (5,8) Ff10 29,7 61,6 -31,9 (6,6) Ff11 51,2 56,7 -5,5 (4,4) Ff12 29,2 57,3 -28,1 (5,4) Ff13 25,9 39,1 -13,2 (3,1) Ff14 32,9 47,0 -14,1 (4,1) Ff15 33,5 52,2 -18,6 (4,1) Fm01 37,3 57,8 -20,6 (5,1) Fm02 39,8 49,0 -9,2 (4,4) Fm03 21,3 43,1 -21,8 (4,3) Fm04 34,2 49,9 -15,7 (3,4) Fm05 30,5 47,7 -17,2 (3,9) Fm06 34,9 51,0 -16,0 (4,9) Fm07 41,4 43,4 -2,0 (7,5) 300 Tabelle E.3.: VOT-Werte initialer Fortis-Plosive im Französischen und Deutschen gesprochen von französischen Muttersprachlern. Angegeben sind die VOT-Werte pro Token und Sprecher (nur französische Produktion) sowie arithmetisches Mittel (Mw), Standardabweichung (s), Minimum (Min) und Maximum (Max) in ms F-nf01 F-nf02 F-nm01 F-nm02 Gesamt toujours 62 58 54 51 - tout (droit) 40 63 53 51 - passez 13 0 10 18 - commissariat 35 36 56 48 - coute 41 50 62 59 - Mw (s) - franz. 38,2 (17,5) 41,4 (25,3) 47 (21,0) 45,4 (15,9) 43 (4,0) Min - franz. 13 0 10 18 0 Max - franz. 62 63 62 59 63 Mw (s) - dt. 35,9 (17,2) 59,3 (21,4) 44,2 (24,6) 40,1 (10,7) 44,9 (10,2) Min - dt. 12 15 12 22 12 Max - dt. 84 109 100 68 109 Tabelle E.4.: Stimulus-Sprecher im Perzeptionsexperiment Sprechergruppe Sprecher Deutsche Muttersprachler (N= 26) Ff01, Ff02, Ff04, Ff05, Ff07, Ff08, Ff10, Ff11, Ff13, Fm01, Fm02, Fm03, Fm04, Fm05, Fm06, Fm07, AEf01, AEf02, AEf04, AEm01, AEm02, AEm03, AEm04, AEm06, Rm01, R-biling-m01 Nicht-deutsche Muttersprachler (N=9) F-nf01, F-nf02, F-nm01, F-nm02 AE-nm01, AE-nm02, I-nm01, R-nm01, Tsch-nf01 301 Narr Francke Attempto Verlag GmbH+Co. KG • Dischingerweg 5 • D-72070 Tübingen Tel. +49 (07071) 9797-0 • Fax +49 (07071) 97 97-11 • info@narr.de • www.narr.de NEUERSCHEINUNG JETZT BESTELLEN! Eilika Fobbe Forensische Linguistik Eine Einführung narr studienbücher 2011, 282 Seiten €[D] 24,90/ SFr 35,90 ISBN 978-3-8233-6654-6 Die Forensische Linguistik ist ein Teilgebiet der Angewandten Linguistik. Sie stellt die Methoden und Analyseverfahren ihrer Disziplin in den Dienst von Kriminalistik und Rechtsprechung. Ihre Aufgabe ist es, sprachliche Daten zu analysieren, die von rechtlicher Bedeutung sein können. Ein zentraler Arbeitsbereich forensischer Linguistik ist die Autorschaftsanalyse für inkriminierte Texte, z.B. für Tatschreiben, deren Verfasser nicht eindeutig feststeht oder gänzlich unbekannt ist. Weitere Anwendungsgebiete sind Bedeutungs- und Verständlichkeitsnachweise für Äußerungen, über deren Bedeutung vor Gericht gestritten wird und die z.B. im Zusammenhang mit dem Markenrecht, der Frage nach der Produkthaftung oder für die Auslegung von Verträgen eine Rolle spielen. Das vorliegende Studienbuch führt anhand authentischer Texte und exemplarischer Analysen in das Arbeitsfeld und in die wichtigsten Analysemethoden ein. Alle Kapitel sind mit konkreten Fällen illustriert, Aufgaben in den einzelnen Kapiteln ermöglichen eine unmittelbare Anwendung. Narr Francke Attempto Verlag GmbH + Co. KG Postfach 25 60 · D-72015 Tübingen · Fax (0 7071) 97 97-11 Internet: www.narr.de · E-Mail: info@narr.de Dieses Arbeitsbuch führt in den Gebrauch des Internationalen Phonetischen Alphabets (IPA) zur Transkription des Deutschen ein. Hierzu werden zunächst Kenntnisse zu standardsprachlichen Ausspracheregeln und stilistischer Variation innerhalb der Standardaussprache vermittelt. Im zweiten Teil geht es um die Problematik der engen Transkription, die am Beispiel standardsprachlicher Nachrichten und Gespräche und regionaler umgangssprachlicher Äußerungen demonstriert wird. Dabei gehen die Autoren auch auf das Varietätengefüge des Deutschen und einige exemplarisch ausgewählte Umgangssprachen ein. Das Lehrbuch dient somit der Aneignung des IPA wie der Einführung in die Varietätenproblematik und versucht auf diese Weise, Verbindungen zwischen traditioneller Phonetik und Varietätenlinguistik aufzuzeigen. Da eine zuverlässige enge Transkription erst durch den Gebrauch von Softwareprogrammen zur akustischen Analyse von Sprachaufnahmen möglich wird, wurde die Neuauflage um ein Kapitel erweitert, das in die zwei gebräuchlichsten freien Sprachanalyseprogramme, praat und WaveSurfer, einführt. Die beiliegende CD-ROM enthält Tonaufnahmen aller illustrierenden Beispiele sowie Übungen. Beate Rues / Beate Redecker Evelyn Koch / Uta Wallraff Adrian P. Simpson Phonetische Transkription des Deutschen Ein Arbeitsbuch mit CD narr studienbücher 2., überarb. und erg. Aufl . 2009 X, 161 Seiten + CD, €[D] 19,90/ SFr 35,90 ISBN 978-3-8233-6465-8 010709 Auslieferung Februar 2009.indd 7 13.02.2009 13: 41: 46 Uhr