Spanisch: Phonetik und Phonologie

Christoph Gabriel; Trudel Meisenburg; Maria Selig

eBooks

Spanisch: Phonetik und Phonologie

2013

978-3-8233-7722-1

Gunter Narr Verlag

Christoph Gabriel

Trudel Meisenburg

Maria Selig

Das Buch gibt Studierenden des Spanischen ein zugängliches Grundlagenwerk zur Lautlehre ihres Studienfachs an die Hand, in dem bewährtes Basiswissen (zu dem auch der Umgang mit der sprach - analysesoftware Praat gehört) mit neueren Theorieentwicklungen (u.a. Merkmalsgeometrie, Autosegmentale Phonologie und Optimalitätstheorie sowie im Bereich der Prosodie das Autosegmental-MetrischeModell der Intonationsforschung und verschiedene Analyseverfahren zum Sprachrhythmus) verknüpft wird.Spanisch wird dabei nicht als homogene Sprache aufgefasst, sondern der europäische Standard (kastilische Normaussprache) wird gleichberechtigt mit anderen Varietäten (v. a. aus Lateinamerika) behandelt. Den romanischen Hintergrund bilden die nachbarsprachen Portugiesisch und Katalanisch, aber auch französisch und Italienisch werden vergleichend herangezogen, während als Kontrastfolie das Deutsche dient. Auf diese Weise ergeben sich vielfältige varietätenlinguistische und sprachvergleichende Einblicke in die lautliche Struktur und Entwicklung des Spanischen.

Christoph Gabriel/ Trudel Meisenburg Maria Selig Spanisch: Phonetik und Phonologie Eine Einführung Christoph Gabriel / Trudel Meisenburg Maria Selig Spanisch: Phonetik und Phonologie Eine Einführung Christoph Gabriel ist Professor für Romanistische Linguistik an der Universität Hamburg. Trudel Meisenburg ist Professorin für Romanische Sprachwissenschaft an der Universität Osnabrück. Maria Selig ist Professorin für Romanische Sprachwissenschaft an der Universität Regensburg. Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über <http: / / dnb.dnb.de> abrufbar. © 2013 ∙ Narr Francke Attempto Verlag GmbH + Co. KG Dischingerweg 5 ∙ D-72070 Tübingen Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Gedruckt auf chlorfrei gebleichtem und säurefreiem Werkdruckpapier. Internet: http: / / www.narr-studienbuecher.de E-Mail: info@narr.de Printed in the EU ISSN 0941-8105 ISBN 978-3-8233-6722-2 Inhalt Vorbemerkung............................................................................................................ ix Akürzungen ................................................................................................................ xi 1. Einleitung ....................................................................................1 1.1 Der Forschungsgegenstand von Phonetik und Phonologie ...................... 1 1.2 Dimensionen und Funktionen lautsprachlicher Kommunikation.............. 2 1.3 Gliederungsebenen der Lautsprache.......................................................... 5 1.4 Phonologische Theoriebildung .................................................................. 8 1.5 Variation, Varietäten und Aussprachenormen........................................ 10 2. Die Lautseite sprachlicher Kommunikation: Phonetik .................17 2.1 Der Gegenstand der Phonetik .................................................................. 17 2.2 Artikulatorische Phonetik ........................................................................ 21 2.2.1 Lautproduktion: Atmung, Phonation, Artikulation ................................ 21 2.2.2 Artikulatoren und Artikulationsstellen.................................................... 24 2.2.3 Artikulationsmodi: Vokale, Konsonanten, Approximanten ................... 25 2.2.3.1 Vokalische Artikulationsmodi.................................................................. 25 2.2.3.2 Konsonantische Artikulationsmodi.......................................................... 26 2.2.3.3 Approximanten ......................................................................................... 27 2.2.4 Koartikulation ........................................................................................... 27 2.3 Akustische Phonetik ................................................................................. 28 2.3.1 Sprachschall .............................................................................................. 29 2.3.1.1 Parameter der Schallanalyse .................................................................... 29 2.3.1.2 Grundschallformen ................................................................................... 30 2.3.1.3 Spektren..................................................................................................... 32 2.3.2 Grundlagen akustischer Analysen............................................................ 34 2.3.2.1 Zur Digitalisierung von Sprachsignalen .................................................. 34 2.3.2.2 Zur Auswertung von Spektrogrammen ................................................... 35 2.3.3 Akustische Analysen selbst durchführen: Eine kleine Anleitung zum Gebrauch von Praat .................................................................................. 38 2.4 Perzeptive Phonetik .................................................................................. 43 2.4.1 Der Hörvorgang ........................................................................................ 44 2.4.2 Sprach(laut)hören ..................................................................................... 49 vi 2.5 Sprachlaute: Spanisch und Deutsch kontrastiv....................................... 56 2.5.1 Konsonanten.............................................................................................. 56 2.5.1.1 Plosive und Frikativapproximanten ........................................................ 57 2.5.1.2 Frikative und Affrikaten ........................................................................... 63 2.5.1.3 Nasale ........................................................................................................ 68 2.5.1.4 Laterale ...................................................................................................... 70 2.5.1.5 Vibranten ................................................................................................... 72 2.5.2 Approximanten ......................................................................................... 76 2.5.3 Vokale ........................................................................................................ 77 2.5.3.1 Monophthonge .......................................................................................... 78 2.5.3.2 Diphthonge und Hiate .............................................................................. 81 Übungsaufgaben........................................................................................ 85 3. System- und Regelhaftigkeit der Laute: Segmentale Phonologie.................................................................................89 3.1 Strukturalistische Phonologie .................................................................. 89 3.1.1 Grundbegriffe ............................................................................................ 90 3.1.2 Die Phoneme des Spanischen................................................................. 100 3.1.2.1 Vokalphoneme ........................................................................................ 100 3.1.2.2 Konsonantenphoneme ............................................................................ 101 3.1.2.3 Archiphoneme ......................................................................................... 102 3.1.2.4 Phonologisierung und Entphonologisierung ......................................... 104 3.1.2.5 Gleitlaute als Vokalallophone ................................................................ 106 3.2 Klassische generative Phonologie .......................................................... 109 3.3 Merkmalsgeometrie und Autosegmentale Phonologie ......................... 113 3.4 Optimalitätstheorie ................................................................................. 116 3.5 Exemplartheorie...................................................................................... 119 Übungsaufgaben...................................................................................... 120 4. Prosodie...................................................................................123 4.1 Prosodische Einheiten und prosodische Hierarchie ............................. 124 4.1.1 Prosodische Einheiten ............................................................................ 125 4.1.2 Prosodische Hierarchie ........................................................................... 128 4.2 Silbe, Silbenstrukturen und (Re-)Syllabierungsregeln ......................... 130 4.2.1 Was ist eine Silbe? .................................................................................. 130 4.2.2 Silbenstruktur.......................................................................................... 131 4.2.3 Silbenstrukturpräferenzen ...................................................................... 134 4.2.4 Silbenstrukturen des Spanischen ........................................................... 137 vii 4.2.4.1 Der Onset ................................................................................................. 137 4.2.4.2 Die Coda .................................................................................................. 141 4.2.4.3 Der Nukleus ............................................................................................. 143 4.2.5 Syllabierung und Resyllabierung ........................................................... 144 4.2.6 Hiate und Silbenkontraktion.................................................................. 145 4.3 Akzent und Akzentphonologie ............................................................... 147 4.3.1 Was heißt Akzent? .................................................................................. 147 4.3.2 Wortakzent und Satzprominenzen......................................................... 148 4.3.3 Wortakzent: phonologisch und phonetisch........................................... 148 4.3.4 Die Funktionen des Akzents ................................................................... 150 4.3.5 Der Wortakzent des Spanischen............................................................. 152 4.3.5.1 Palabras tónicas und palabras átonas ...................................................... 152 4.3.5.2 Das Drei-Silben-Fenster .......................................................................... 154 4.3.5.3 Der Wortakzent bei spanischen Nomina ............................................... 155 4.3.5.4 Der Wortakzent bei spanischen Verben ................................................ 158 4.3.6 Die orthographische Markierung des Wortakzents .............................. 161 4.3.7 Metrische Phonologie ............................................................................. 162 4.3.8 Nebenakzente und Akzentverschiebungen ........................................... 164 4.4 Rhythmus: Die zeitliche Gliederung der Sprache ................................. 167 4.4.1 Die klassische Rhythmustypologie: Silben- und akzentzählende Sprachen .................................................................................................. 168 4.4.2 Neuere Ansätze: Dauerbasierte Rhythmusmaße................................... 171 4.4.3 Rhythmische Besonderheiten im Spanischen: Dialekte, Kontakt- und Lernervarietäten .............................................................................. 176 4.5 Intonation ................................................................................................ 180 4.5.1 Tonsprachen und reine Intonationssprachen........................................ 181 4.5.2 Erfassen und Systematisieren: Konfigurationen und Ebenen .............. 184 4.5.2.1 Das Konfigurationsmodell von Navarro Tomás (1944) ....................... 185 4.5.2.2 Das Ebenenmodell von Quilis (1993).................................................... 187 4.5.3 Phonologisierung und Theoretisierung: Das Autosegmental Metrische Modell und seine Anwendung auf das Spanische ............... 189 4.5.3.1 Bausteine der Intonation im AM-Modell: Tonhöhenakzente und Grenztöne ................................................................................................ 189 4.5.3.2 Das Notationssystem Spanish ToBI (Sp_ToBI) ....................................... 192 4.5.4 Toninventare spanischer Varietäten im AM-Modell............................. 197 4.5.4.1 Madrid (Kastilisch) ................................................................................. 200 4.5.4.2 Buenos Aires (Porteño-Spanisch)............................................................ 201 viii 4.5.4.3 Mexiko-Stadt ........................................................................................... 203 4.5.5 Schnittstellenphänomene: Prosodische Phrasierung, Informationsstruktur, Diskurs ................................................................ 205 4.5.5.1 Prosodische Phrasierung in neutralen Sätzen....................................... 207 4.5.5.2 Intonation und Fokus-Hintergrund-Gliederung (FHG)......................... 209 4.5.5.3 Fokus, Wortstellung und Intonation...................................................... 211 4.5.5.4 Intonation komplexer Sätze und Diskursintonation............................. 213 Übungsaufgaben...................................................................................... 215 Anhang..................................................................................................................... 217 Literaturverzeichnis ................................................................................................ 219 Register .................................................................................................................... 231 Vorbemerkung Unser Lehrbuch wendet sich in erster Linie an Studierende des Spanischen und gibt ihnen ein zugängliches und zugleich anspruchsvolles Grundlagenwerk zur Lautlehre ihres Studienfachs an die Hand. Ziel ist es hierbei, bewährtes Grundlagenwissen zur Phonetik und Phonologie des Spanischen mit aktuellen Methoden phonetischer Datenanalyse und neueren Ansätzen phonologischer Theoriebildung wie der Merkmalsgeometrie, der Optimalitätstheorie und dem Autosegmental-Metrischen Modell der Intonationsforschung zu verknüpfen. Ein besonderer Schwerpunkt liegt dabei auf prosodischen Phänomenen wie Silbe, Akzent, Rhythmus und Intonation. Eingeführt wird zudem in den Umgang mit der Sprachanalysesoftware Praat. Aufbauend auf in der universitären Lehre erprobte Konzepte haben wir eine Darstellungsweise angestrebt, die für Studienanfänger nach dem Absolvieren eines Einführungskurses in die Romanische oder Spanische Sprachwissenschaft zugänglich ist, zugleich aber die Nutzung des Bandes für Fortgeschrittene, etwa zur Wiederholung bei der Prüfungsvorbereitung, ermöglicht. Das Spanische wird hierbei nicht als homogene Sprache aufgefasst; die Aussprache amerikanischer und europäischer Varietäten erfährt vielmehr eine gleichberechtigte Darstellung. Bei der Transkription orientieren wir uns am Verbreitungsgrad der Realisierungsvarianten und notieren entsprechend dem zahlenmäßigen Überwiegen der seseo-Varietäten bei caza, cerrar etc. durchgehend den alveolaren Frikativ / s/ , also [ kasa], [se ra ]. Ein weiteres Anliegen besteht darin, das Spanische nicht isoliert zu betrachten. Zu diesem Zwecke stellen wir Vergleiche mit anderen romanischen und nicht romanischen Sprachen an, wobei der Kontrastierung mit dem Deutschen ein besonderes Gewicht zukommt. Internetquellen sind nicht mit dem Datum des letzten Abrufs versehen; wir haben alle Links jedoch unmittelbar vor Drucklegung auf ihre Korrektheit hin überprüft. Einführende Werke lassen sich nicht verwirklichen, ohne die Adressaten mit einzubeziehen. So konnten wir auch beim Verfassen des vorliegenden Bands von kritischen und konstruktiven Beiträgen und Fragen von studentischer Seite profitieren. Dafür sind wir sehr dankbar. Unser Dank gilt auch all denjenigen, die uns bei der Durchsicht des Manuskripts, beim Korrekturlesen sowie beim Erstellen der Übungsaufgaben, des Literaturverzeichnisses und des Registers Hilfestellung geleistet haben. Zu nennen ist hier in erster Linie Carolin Buthke, der wir für ihre umfassende Unterstützung zu großem Dank verpflichtet sind. Weiterhin bedanken wir uns bei Ariadna Benet, Jonas Grünke, Kathrin Kraller, Manuela Kühnle, Henni g Mittag, Nils Netz, Annika Reuwand, Julia Rieck, Rafèu Sichel-Bazin und Franziska Stuntebeck. Nicht zuletzt danken wir Kathrin Heyng und Karin Burger für die kompetente verlagsseitige Betreuung der Veröffentlichung und dem Narr Verlag (Tübingen) für die Aufnahme des Bandes in die Reihe narr studienbücher. Hamburg, Osnabrück und Regensburg, im März 2013 Christoph Gabriel, Trudel Meisenburg und Maria Selig n Abkürzungen - Intonationsphonologie: Kennzeichen für intermediäre Grenztöne % Intonationsphonologie: Kennzeichen für Grenztöne * 1. Ungrammatische Form / 2. Historische Sprachwissenschaft: rekonstruierte Form / 3. Intonationsphonologie: Kennzeichen für Akzenttöne (z.B. H* = hoher Akzentton, L* = tiefer Akzentton # 1. schwache Wortgrenze / 2. Sprechpause, Sprechunflüssigkeiten ## starke Wortgrenze + Morphemgrenze ] Silbengrenze . Silbengrenze Hauptakzent (zugleich Silbengrenze) Nebenakzent (zugleich Silbengrenze) leichte Silbe - schwere Silbe Silbe phonologisches Wort phonologische Phrase Summe μ Mittelwert ! downstep ¡ upstep > 1. wird zu / 2. Intonationsphonologie: Gipfel wird erst nach der Tonsilbe erreicht < entstanden aus / …/ phonologische Umschrift […] phonetische Umschrift <…> graphische Notation V Dauern vokalischer Intervalle C Dauern konsonantischer Intervalle Abb. Abbildung Adj. Adjektiv afr. Altfranzösisch AM-Modell Autosegmental-Metrisches Modell andal. andalusisches Spanisch altgr. Altgriechisch BI Grenzmarkierungen, engl. break indices C 1. Coda / 2. Konsonant / 3. klitische Gruppe Cl Klitikon CLP Cercle Linguistique de Prague CR engl. continuation rise CRS engl. continuous renking scale CV Abfolge Konsonant - Vokal d débil (schwache/ leichte/ unbetonte Silbe) dB Dezibel dt. Deutsch engl. Englisch F Fokus (informationsstrukturelles Merkmal) f fuerte (starke/ schwere/ betonte Silbe) f. Femininum (Genus) F 0 Grundfrequenz F1, F2 ... erster Formant, zweiter Formant etc. FHG Fokus-Hintergrund-Gliederung fMRI Funktionale Magnetresonanztomographie ii fr. Französisch FTT engl. Fast Fourier Transformation G Gleitlaut GEN Generator gr. Griechisch H 1. Intonationsphonologie: Hochton Hz Hertz IP 1. Syntax: maximale Projektion der funktionalen Kategorie I (engl. inflection phrase) / 2. Intonationsphonologie: Intonationsphrase (prosodische Einheit) ip Intermediärphase oder kleine ip ‘ (prosodische Einheit) IPA engl. International Phonetic Alphabet it. Italienisch jap. Japanisch kanar. kanarisches Spanisch kHz Kilohertz L 1. Liquid / 2. Intonationsphonologie: Tiefton L1 Erstsprache/ Muttersprache L2 Zweitsprache/ Fremdsprache lat. Lateinisch M Intonationsphonologie: mittlerer Ton (engl. mid tone) N 1. Nasal / 2. Nukleus NGRAE sp. Nueva gramática de la lengua española, s. Literaturverzeichnis O 1. Obstruent / 2. Onset / 3. Objekt OL Obstruent - Liquid ORTE sp. Ortografía de la lengua española, s. Literaturverzeichnis OT Optimalitätstheorie P Fuß PBL engl. pre-boundary lengthening PET Positron-Emissions-Tomographie Pl. Plural PN Person-Numerus-Endung PVI paarweiser Variabilitätsindex R Reim REA engl. right ear advantage RFE Revista de Filología española rPVI ‘roher’ paarweiser Variabilitätsindex S Subjekt SAMPA engl. Speech Assessment Methods Phonetic Alphabet Sg. Singular SLH Strict Layer Hypothesis sp. Spanisch SP engl. sustained pitch SPE The Sound Pattern of English T Ton TM Tempus-Modus-Marker TV Themavokal ToBI engl. Tone and Break Indices UG Universalgrammatik V 1. Vokal / 2. Verb VarcoC Variabilitätskoeffizient für konsonantische Intervalle VarcoV Variabilitätskoeffizient für vokalische Intervalle VOT engl. voice onset time W Wurzel Wh Fragewort (vgl. engl. where, what, why etc.) ’ 1. Einleitung 1.1 Der Forschungsgegenstand von Phonetik und Phonologie In einem Laden, den er nie zuvor betreten hat, richtet ein Kunde nennen wir ihn Juan folgende Frage an die Verkäuferin: ¿Tiene mandarinas? Die Antwortet kommt prompt: ¡Claro que sí! Diese kurze verbale Interaktion ist ein alltäglicher Kommunikationsvorgang, der in ähnlicher Form immer wieder stattfinden kann: Ein Kunde hat mittels sprachlicher Zeichen einer Verkäuferin signalisiert, dass er eine bestimmte Obstsorte suche (vermutlich, um sie zu kaufen); die Verkäuferin signalisiert ihm, wiederum mit sprachlichen Zeichen, dass sie ihm diese Obstsorte selbstverständlich anbieten könne. Sie hätte auch wortlos auf die Kiste mit Mandarinen deuten können, die der Kunde offensichtlich übersehen hat. Damit wäre zwar das Informationsbedürfnis des Fragenden erfüllt gewesen, doch hätte er vielleicht den Laden verlassen, ohne Mandarinen zu kaufen, und das Verkaufgespräch wäre erfolglos geblieben. Alltägliche Gesprächssituationen wie diese scheinen auf den ersten Blick kaum der Rede wert zu sein: Warum soll man auch über eine kommunikative Routine nachdenken, die doch ohne weiteres Überlegen tagtäglich funktioniert? Eine solche Sichtweise ist als Alltagsperspektive durchaus sinnvoll, denn würden wir stets darüber reflektieren, was genau wir sagen wollen und wie wir es ausdrücken, kämen wir vor lauter Nachdenken vermutlich kaum zum Sprechen. Aus wissenschaftlicher Perspektive ist der kleine Verkaufsdialog jedoch unter unterschiedlichen Aspekten interessant: Man kann ihn inhaltlich-strategisch analysieren und sich z.B. fragen, warum die sprachliche Reaktion der Verkäuferin angemessener ist als eine rein gestische und ihn als einen bestimmten Typus sozialer Interaktion betrachten. Man kann jedoch auch speziell die von den Gesprächspartnern genutzten sprachlichen Verfahren in den Blick nehmen und diese in Bezug auf Textkohärenz, Satzbau, Wortwahl und Aussprache untersuchen. Mit den lautsprachlichen Aspekten der Kommunikation befassen sich Phonetik und die Phonologie, zwei sprachwissenschaftliche Teildisziplinen, die auch mit dem Terminus Lautlehre zusammengefasst werden. Die Tonaufnahme eines solchen Gesprächs dient dann als Datengrundlage zur Untersuchung der Regeln und Gesetzmäßigkeiten, die die Lautseite sprachlicher Zeichen in der verwendeten Sprache hier im Spanischen bestimmen. Nicht lautsprachliche Formen des Zeichenausdrucks fallen hingegen nicht in den Untersuchungsbereich der Lautlehre: So wird das uns alltäglich geläufige Nebeneinander von Sprechen und Schreiben (und Hören und Lesen) ausgeblendet eine berechtigte Einschränkung, denn (sofern wir nicht hörbehindert sind) ist die Lautsprache unsere grundlegende Ausdrucks- und Kommunikationsform, und auch beim Erwerb der Muttersprache (L1) werden wir zuerst mit der Lautseite von Sprache konfrontiert. Wie erklärt sich die Aufteilung der Lautlehre in die beiden Subdisziplinen Phonetik und Phonologie? Die Trennung geht zurück auf Nikolaus S. Trubetzkoy (= Nikolaj S. Trubeckoj, 1890-1938). Dieser bezog sich in seinen 1939 erschienen Grundzügen der Phonologie (Trubetzkoy 1989) auf Ferdinand de Saussure (1857-1913), der in seinem Cours de linguistique générale (Saussure 1916) vorgeschlagen hatte, zwischen der konkreten Sprachverwendung, der sog. parole, und dem dieser zugrundeliegenden Sprachsystem, der langue, zu differenzieren. Wissenschaftlicher Untersuchungsgegenstand ist nach Saussure ausschließlich die langue, verstanden als die Gesamtheit der Regularitäten, die für alle Mitglieder einer Sprachgemeinschaft gelten und die , 2 deren sprachliches Wissen ausmachen. Die parole hingegen sei lediglich insofern von Interesse, als man ausgehend von konkret produzierter Sprache auf die Beschaffenheit des Systems schließen könne. Trubetzkoy übernahm diese Unterscheidung und wandte sie auf den lautsprachlichen Bereich an: Die Phonetik solle sich mit der parole beschäftigen und mittels naturwissenschaftlicher Methoden die konkreten physikalischen und physiologischen Ereignisse des lautsprachlichen Kommunikationsakts untersuchen. Gegenstand der Phonologie sei hingegen die langue, die sog. Lautnormen, die der Vielfalt der in einer Sprechergemeinschaft konkret realisierten Lautformen in einem geordneten System von Einheiten und Regeln gegenüberstehen (vgl. Trubetzkoy 1989: 6). Die Trennung zweier lautbezogener linguistischer Disziplinen führte in der Folgezeit dazu, dass naturwissenschaftlich ausgerichtete Phonetiker einerseits und geistesbzw. kognitionswissenschaftlich orientierte Phonologen andererseits vergleichsweise getrennt voneinander arbeiteten. Für Trubetzkoy waren beide Disziplinen jedoch untrennbar miteinander verbunden, da die Einheiten und Regeln, die das System konstituieren, aus konkreten Lautungen abgeleitet sind und nur unter Rückgriff auf diese erfasst und verstanden werden können. Phonetik und Phonologie untersuchen die lautlichen Aspekte sprachlicher Kommunikation. Als experimentelle Wissenschaft widmet sich die Phonetik den physikalischen und physiologischen Prozessen lautsprachlicher Kommunikation. Die Phonologie arbeitet das System- und Regelhafte der Lautsprache heraus und sucht, dies modellhaft zu erfassen. Neben dem rein wissenschaftlichen Erkenntnisinteresse lassen sich für die lautsprachliche Forschung anwendungsbezogene Bereiche benennen. Einer davon ist die Verbesserung der Lerneraussprache im Fremdsprachenunterricht, wozu vertiefte Kenntnisse der artikulatorischen und auditorisch-perzeptiven Grundlagen der Lautsprache notwendig sind. Dies gilt auch für die Bereiche Sprecherziehung und Logopädie, die auf Optimierung der artikulatorischen Fähigkeiten bzw. auf die Behandlung physisch oder psychisch bedingter Schwierigkeiten beim Sprechen abzielen (vgl. Fiukowski 2010, Lauer & Birner-Janusch 2007). Auch die Therapiemaßnahmen bei Aphasie, d.h. beim pathologisch bedingten Verlust der Sprachfähigkeit, nutzen die Erkenntnisse über die physiologischen und neuronalen Prozesse, die sich beim Sprechen und bei der Sprachwahrnehmung vollziehen (vgl. Bauer & Auer 2008, Lutz 2004). Weitere Anwendungsbereiche liegen in der forensischen Phonetik, die mit vorwiegend kriminologischer Zielsetzung technische Verfahren zur Identifizierung und Individuierung von Stimmen entwickelt (vgl. Jessen 2012), sowie in den Bereichen Spracherkennung und Sprachsynthese (vgl. Fellbaum 2013). 1.2 Dimensionen und Funktionen lautsprachlicher Kommunikation Wie jede wissenschaftliche Disziplin befassen sich Phonetik und Phonologie mit ausgewählten Aspekten eines komplexen Geschehens. Die Konzentration auf die lautliche Seite sprachlicher Kommunikation zielt auf das Allgemeine; bei konkreten Kommunikationsereignissen werden daher individuelle und pragmatische Aspekte (Wer spricht wann und wo mit wem weshalb worüber? ) ausgeblendet. Abstrahiert wird von der Tatsache, dass lautsprachliche Zeichen von Situation zu Situation nie in völ- 3 lig identischer Form produziert werden, auch nicht, wenn es sich um ein und denselben Sprecher handelt. Dies ist für die Kommunikation auch nicht weiter schlimm, denn die Hörer blenden kleinere Abweichungen, die die Kommunikation nicht stören, automatisch aus. So ist es z.B. unerheblich, ob ein Sprecher des Spanischen den betonten Vokal im Wort pomo ‘Frucht’, der in offenen (d.h. auf einen Vokal endenden) Silben normalerweise als geschlossenes [o] 1 wie in dt. Ofen ausgesprochen wird, etwas offener realisiert und einen Laut produziert, der eher dem [ ] wie in dt. offen entspricht (zur Aussprache des spanischen o in unterschiedlichen lautlichen Umgebungen vgl. genauer 2.5.3.1). Die Hörer werden trotzdem pomo ‘Frucht’ verstehen, nicht zuletzt deshalb, weil es im Spanischen keine Wortpaare gibt, die sich nur durch den Kontrast zwischen offenem und geschlossenen o unterscheiden. Dies ist im Deutschen anders (vgl. unser Beispiel [ o f n] Ofen vs. [ f n] offen), ebenso wie im Französischen (z.B. [p m] pomme ‘Apfel’ vs. [pom] paume ‘Handfläche’). 2 Lautliche Va bilität kann aber auch Information vermitteln, die den Hörern ermöglich , in Bezug auf e geographische Herkunft einzuordnen. Realisiert z.B. in " tern wie calle ‘Straße’ und yo ‘ich’ den Laut [$' (der der deutschen sch-Aussprache spricht) @ XY' \ ^ ` { |@ Jalousie, } } [~ka$ 'X~ Y ' \} [$o]XY@' @ " ` darauf schließen, dass sie e { Río de la Plata { (Argentinien, Uruguay) zu tun haben, \@ @} šeísmo/ žeísmo |`} }}} eil der regionalen Aussprache ist. Aber nicht nur die regionale Zugehörigkeit des Sprechers, sondern auch die spezifischen Kontextbedingungen beeinflussen die lautsprachliche Kommunikation. Dies zeigt der Vergleich zwischen der informellen, spontanen Alltagskommunikation unter vertrauten Gesprächspartnern und dem kontrollierten, reflektierten Sprechen in öffentlichen Situationen oder auch beim Vorlesen. Wenn wir uns mit Freunden unterhalten, sind Schnellsprechformen, eine weniger sorgfältige Artikulation sowie häufige Pausen und Wiederholungen normal; es handelt sich dabei um typische Kennzeichen spontanen, ungeplanten Sprechens. Beim Sprechen in offiziellen Kontexten und beim Vorlesen artikulieren wir dagegen sorgfältiger und setzen gegebenenfalls Intonation (Sprachmelodie), Lautstärke und Sprechgeschwindigkeit bewusst zur stilistischen Gestaltung ein. Beim Vorlesen treten i.d.R. auch weniger sog. Sprechunflüssigkeiten auf, da wir bei dieser Form des Sprechens nicht zugleich formulieren müssen. Um derartige situationsbedingte Unterschiede angemessen zu berücksichtigen, untersucht man in der neueren Forschung unterschiedliche Datentypen (spontane Interaktion im freien Gespräch, im Labor erhobene Semi-Spontandaten, Leseaussprache etc.) und arbeitet die entsprechenden lautlichen Unterschiede heraus (vgl. 4.5.4 zur Datenanalyse speziell in der Intonationsforschung). Der (sprachliche und außersprachliche) Kontext ist auch insofern wichtig, als er wesentlich zum Gelingen sprachlicher Kommunikation beiträgt: Wenn wir miteinander sprechen, beruht unsere Verständigung nicht ausschließlich auf der Information, die die sprachlichen Zeichen ausdrücken. Vielmehr bringen die Kommunikationspartner Vorwissen mit, auf das sie im Gespräch aufbauen können. Dies gilt auch in lautlicher Hinsicht: Sehr häufige Wörter können wir z.B. nachlässig artikulieren und etwa Auslautsilben verschleifen oder weglassen, weil ihr häufiger Gebrauch dazu beiträgt, 1 Phonetische Transkriptionen, die die Lautung möglichst exakt wiedergeben, setzt man in eckige Klammern; zur Notation mithilfe des International Phonetic Alphabet (IPA) vgl. 2.1. 2 Bei Wörtern mit unterschiedlicher Bedeutung, die sich jeweils nur in einem Lautsegment unterscheiden, spricht man von sog. Minimalpaaren, vgl. hierzu genauer 1.3 und 3.1.1. ! ! " #$! " $% # % ! $" &'( 4 dass sie von den Hörern auch in reduzierter Form erkannt werden. Wir wissen zudem aus Erfahrung, welche Wörter häufig mit bestimmten anderen Wörtern in der Redekette auftreten, und wir können das Wissen um diese Kombinatorik beim Sprachverstehen nutzen (vgl. 2.4.2). Weiterhin sind für das Sprachverstehen auch visuell wahrgenommene Informationen relevant, denn außer beim Telefonieren nutzen die Gesprächspartner i.d.R. redebegleitende Gesten, Blickkontakt, mimische Veränderungen und Körperhaltung, um das auszudrücken, was sie mitteilen wollen. Diese Multimedialität der Kommunikation wird deutlich, wenn wir die Mitschrift eines spontanen Gesprächs unter Freunden lesen, denn der Inhalt ist ohne Angaben zu den visuell wahrnehmbaren Ausdrucksverfahren oft nur schwer zu verstehen. Grundsätzlich ist nicht nur relevant, was gesagt wird, sondern auch, wie es gesagt wird. Zusätzlich zu den bereits angesprochenen nicht sprachlichen Mitteln setzen wir auch sog. parasprachliche Mittel ein, d.h. solche, die an Lautsprache gebunden sind, aber über die rein inhaltliche Informationsvermittlung hinausgehen: So können z.B. Stimmqualität und Lautstärke Emotionen vermitteln oder über die Einstellung des Sprechers zum besprochenen Sachverhalt Auskunft geben. Die Mehrdimensionalität sprachlicher Kommunikation zeigt sich auch in den unterschiedlichen Funktionen unserer Fähigkeit, Schall zu produzieren und durch unseren Artikulationsapparat zu manipulieren. Wir haben bereits auf sprecherbezogene Informationen hingewiesen, die wir z.B. durch die Verwendung regionaler Aussprachevarianten erhalten. Man spricht hier von der indexikalischen Funktion lautsprachlicher Phänomene, da sie uns zu Schlüssen auf die Herkunft, die soziale Stellung oder den Charakter des Sprechers veranlassen und unser Verhalten ihm gegenüber bestimmen können. Derartige Stereotype mögen zwar klischeehaft sein, sie sind jedoch konventionalisiert und damit Untersuchungsgegenstand einer an sozialen Normen orientierten Linguistik. Indexikalisch ist auch die Stimmqualität: Sie erlaubt uns nicht nur das Wiedererkennen individueller Sprecher, sondern lässt uns auch auf Persönlichkeitstypen wie ‘energisch’, ‘arrogant’, ‘vulgär’ etc. schließen, und zwar unabhängig davon, ob ein Sprecher bewusst zu dieser Stilisierung greift oder nicht. Lautsprachliche Phänomene wie Lautstärke, Sprechtempo, (absolute) Tonhöhe oder Sorgfalt der Artikulation werden oft vernachlässigt, weil sie keine im eigentlichen Sinne bedeutungsunterscheidende Funktion haben. Man kann ein Wort schnell oder langsam, laut oder leise, auf hohem oder tiefem Tonniveau aussprechen die Wortbedeutung bleibt unverändert. Wie bereits erwähnt, kommt solchen parasprachlichen Phänomenen eine expressive Funktion zu, denn sie können Emotionen wie Verwunderung, Zweifel, Empörung, Begeisterung etc. ausdrücken. Hierbei handelt es sich oftmals um konventionalisierte Muster, die mit typisierten Emotionen verbunden in unserem Regelwissen inventarisiert sind. Hinzu kommt die regulative Funktion von Sprechtempo, Lautstärke, Pausensetzung und Intonation, die zusammen mit nicht sprachlichen Mitteln den Sprecherwechsel (engl. turn taking) in der Kommunikation regelt. Dass diese Funktion lautsprachlicher Phänomene lange Zeit wenig beachtet wurde, liegt u.a. am lange unangefochtenen Primat des Geschriebenen in der sprachwissenschaftlichen Forschung: In geschriebener Sprache stellt sich die Frage, wer als nächster das Wort ergreift, schlichtweg nicht; nur in der spontanen Interaktion muss der Sprecherwechsel im Gespräch selbst geregelt werden. Auch kann man spontane Gespräche erst analysieren, seit sie mithilfe akustischer Speicher- und Wiedergabemedien aufgezeichnet und unbeschränkt wiederholt werden können. Erst allmählich erkennt man, dass bestimmte Phänomene wie etwa das Verlangsamen oder Beschleunigen des 5 Sprechtempos oder die Veränderungen der Lautstärke nicht nur sprecherindividuell und/ oder zufällig sind, sondern auf sozial verbindliche Normen zurückgehen und als Verfahren der Gesprächsregulierung eingesetzt werden. Die wichtigste Aufgabe unserer Fähigkeit, Schall zu manipulieren und zu verändern, ist es aber, eine Unzahl von diskreten lautlichen Zeichenaußenseiten als Basis sprachlicher Kommunikation zu schaffen. Diese bedeutungsunterscheidende Funktion ist ein zentraler Gegenstand phonologischer Forschung, v.a. in der strukturalistischen Phonologie, die die Suche nach solchen phonologisch distinktiven Merkmalen im Lautkontinuum zu ihrer Hauptaufgabe gemacht hat. Unsere Fähigkeit zu artikulieren können wir dazu einsetzen, lautlich diskrete Zeichenformen zu schaffen. Die bedeutungsunterscheidende Funktion ist zentral für die sprachliche Kommunikation und steht im Mittelpunkt phonologischer Forschung; daneben können lautsprachliche Merkmale indexikalische, expressive und regulative Funktionen übernehmen. Für deren Analyse muss die kontextuelle Einbettung der Kommunikation berücksichtigt werden. 1.3 Gliederungsebenen der Lautsprache Wenn wir die Lautfolge [$tu l] Stuhl äußern, wollen wir die Vorstellung eines bestimmten Sitzmöbels (ungespolstert, mit Rückenlehne, für eine Person) evozieren. Sagen wir dagegen [bt] Bett, meinen wir ein Möbelstück, das zum Schlafen gedacht ist, und produzieren wir die Lautkette [$ta l] Stahl, beziehen wir uns auf etwas ganz anderes, nämlich eine metallische Legierung, die hauptsächlich aus Eisen besteht. Unsere Fähigkeit, verschiedene Sprachlaute zu äußern, nutzen wir, um unterschiedliche lautliche Zeichenaußenseiten (Signifikanten) zu produzieren, die es uns erlauben, etwas so zu bezeichnen, dass es als das Gemeinte erkennbar wird. Nun umfasst der Wortschatz einer Sprechergemeinschaft etwa 300.000 verschiedene Einheiten, ein gebildeter Sprecher kennt davon etwa 75.000 und benutzt regelmäßig etwa 30.000. Wie schaffen wir es, für die Vielfalt der zu unterscheidenden Konzepte hinreichend viele diskrete Zeichenaußenseiten zu finden? Der Vergleich der drei zitierten Wörter zeigt, dass wir dabei unterschiedlich vorgehen. Im Falle von [$tu l] und [bt] handelt es sich um Signifikanten, die keine lautliche Ähnlichkeit miteinander haben (außer dass es sich jeweils um einsilbige Wörter handelt, die mit einem Konsonanten beginnen und auch auf einen enden). Man sagt, dass sie, lautlich gesehen, maximal different sind. Dies ist ein ‘sicheres’ Verfahren zur Differenzierung, da kaum eine Verwechslungsmöglichkeit zwischen den beiden Signifikanten besteht. Die Gegenüberstellung von [$tu l] und [$ta l] zeigt jedoch, dass der lautliche Unterschied auch auf eine präzise Stelle beschränkt sein kann. In diesem Fall sagt man, dass die jeweiligen Wörter ein sog. Minimalpaar bilden und sich nur in einem bedeutungsdifferenzierenden Segment, hier dem Vokal u bzw. a, unterscheiden. Wie wir noch genauer erläutern werden (vgl. 3.1.1), nennt man die bedeutungsunterscheidenden Lautsegmente Phoneme und setzt sie zwischen Schrägstriche: / u/ vs. / a/ . Den gleichen Kontrast finden wir auch in anderen Wortpaaren, z.B. bei [fu ] Fuhre und [fa ] (ich) fahre. Dieses Minimalpaar können wir zum Ausgangspunkt nehmen, um an weiteren Stellen in der Lautkette nach bedeutungsdifferenzierenden Segmenten zu suchen und z.B. den Vokal in [fu ] mit dem in [fi ] viere zu # ! ) $! " $% &'* 6 kontrastieren, woraus sich das Phonempaar / u/ vs. / i/ ableiten lässt. In einem nächsten Schritt kann man den Anlautkonsonanten von [fi ] dem von [ti ] Tiere gegenüberstellen, woraus der phonemische Kontrast / f/ vs. / t/ resultiert. Dieses schrittweise Überprüfen lautlicher Signifikanten zeigt uns, dass diese sich in eine Folge von Phonemen aufgliedern, die wiederum in vielfältigen Oppositionsbeziehungen zu anderen Phonemeinheiten stehen. Wenn wir eine solche Suche im gesamten Wortschatz durchführen, stellen wir fest, dass in einer Einzelsprache nur eine begrenzte Anzahl von lautlichen Unterschieden genutzt wird. Im Falle des Deutschen führen derartige Vergleiche zu einer Anzahl von ca. 41 Phonemen (Wiese 2011: 43-59); im Spanischen sind es, wie wir in 3.1.2 noch genauer sehen werden, ca. zwei Dutzend. In den einzelnen Sprachen wird also mithilfe einer begrenzten Zahl von Phonemen eine unendlich viel größere Menge von lautlichen Signifikanten erzeugt. 3 Martinet (1960) hat hier ein sprachliches Ökonomieprinzip formuliert, nämlich das der doppelten Gegliedertheit der Sprache (fr. double articulation du langage): Durch die Kombination einer begrenzten Zahl von bedeutungs- oder funktionstragenden Einheiten (Morphemen) lassen sich unendlich viele Sätze mit immer neuen Bedeutungen bilden (erste Gliederungsebene, fr. première articulation). Die lautlichen Signifikanten dieser Morpheme bilden wir wiederum durch die Kombination einer begrenzten Zahl von Phonemen (zweite Gliederungsebene, fr. deuxième articulation). Beide Ebenen folgen dem ökonomischen Prinzip, nur ein begrenztes Inventar von kleineren Einheiten zu unterscheiden, aus diesen aber durch immer neue Kombinationen eine sehr viel höhere Menge von größeren Einheiten zu bilden (vgl. Gabriel & Meisenburg 2007: 90ff.). Das Prinzip der Gegliedertheit der lautlichen Signifikanten wurde schon früh erkannt, und in unserer Alphabetschrift machen wir uns diese Erkenntnis zunutze. Die Erfinder des Alphabets waren, so könnte man sagen, die ersten Phonologen, und zwar insofern als sie ein überschaubares Inventar von Buchstaben entwickelten, die einzeln oder in Kombination miteinander jeweils bestimmte lautliche Segmente symbolisieren. Auf diese Weise lässt sich ein lautlicher Signifikant als eine Folge von Buchstaben graphisch darstellen. 4 Die lautliche Analyse ist grundlegend für die alphabetische Verschriftung einer Sprache. Die in den einzelnen Sprachen gültigen Regeln der Zuordnung von Graphemen (Buchstaben) zu Lauten werden aber auch von zahlreichen anderen Faktoren mitbestimmt, sodass es hier keine eindeutigen Entsprechungen gibt. Für die Beschäftigung mit der Lautsprache ist ein kurzer Seitenblick auf die Alphabetschriften vor allem deshalb interessant, weil die jahrtausendelange Prägung der europäischen Kultur durch diese Art der Verschriftung für die Suche nach den Organisati- 3 Wir vereinfachen die Verhältnisse, denn erstens können neue Signifikanten auch durch die Kombination bereits bestehender erzeugt werden (Wortbildung), zweitens zeigen Phänomene wie Homonymie oder Polysemie (vgl. Gabriel & Meisenburg 2007: 71f.), dass der Grundsatz der Distinktivität lautlicher Signifikanten nicht uneingeschränkt gilt: Nicht jedes Konzept muss einem eigenständigen Signifikanten zugeordnet sein, damit es identifiziert werden kann. In aller Regel hilft uns nämlich hier der Kontext: Während man bei isolierter Verwendung des spanischen Worts llama nicht wissen kann, ob es sich um die 3. Person Sg. Präsens von llamar ‘rufen’ handelt oder ob das Konzept ‘Flamme’ oder ‘Lama’ evoziert werden soll, besteht kaum Verwechslungsmöglichkeit, wenn das Wort in einen größeren Zusammenhang eingebettet ist. 4 Die Grundlagen des Verhältnisses zwischen Lautung und Schreibung im Spanischen besprechen wir in 2.5 (bezogen auf Lautsegmente) bzw. in 4.3.6 (bezogen auf die Akzentuierung). Für Genaueres zum spanischen Schriftsystem vgl. Meisenburg (1996). 7 onsprinzipien lautsprachlicher Signifikanten nicht folgenlos geblieben ist. Buchstaben sind diskrete graphische Einheiten, die sich beliebig aneinanderfügen lassen. Wenn man Buchstaben mit Lauten gleichsetzt, könnte man zur Auffassung gelangen, dies geschehe auch beim Sprechen, und zwar indem man diskrete Laute wie Perlen auf einer Schnur aneinanderreihe. Dies ist jedoch nicht der Fall: Zu den wichtigsten Erkenntnissen von Phonetik und Phonologie gehört, dass sich unsere Artikulation beim Sprechen kontinuierlich und in Bezug auf mehrere Dimensionen verändert. Auch akustisch gesehen ist ein Sprachsignal ein lautliches Kontinuum. Laute, im Sinne von zeitlich eindeutig abgegrenzten diskreten Segmenten, sind etwas, was wir in das artikulatorisch-akustische Kontinuum ‘hineinhören’. Phonetik und Phonologie haben auf diese Erkenntnisse reagiert und sich zunehmend auf die Untersuchung der artikulatorischen und akustischen Merkmale konzentriert, die sich im lautlichen Kontinuum parallel, aber nicht notwendigerweise zeitlich synchronisiert, verändern. Diese sog. subsegmentalen Ansätze, die sich auf unterhalb der Segmentebene anzusetzende Phänomene konzentrieren, diskutieren wir in 3.3. Noch in einer zweiten Hinsicht haben Phonetik und Phonologie lange gebraucht, um sich von der Prägung durch die Alphabetschrift zu lösen. Die segmentale Gliederung in Laute bzw. Lautklassen stand so eindeutig im Vordergrund des Forschungsinteresses, dass lautliche Phänomene, die suprasegmental, also oberhalb der Segmente anzusiedeln sind, nur wenig beachtet wurden. Das betrifft die Regeln, die man bei der Verknüpfung von Artikulationsbewegungen beobachten kann, ebenso wie Akzentuierung, Rhythmus und Intonation, also Eigenschaften, die nicht an einzelne Lautsegmente gekoppelt sind, sondern sich auf größere Einheiten wie Silben, Wörter oder Phrasen erstrecken. Zu den neueren Entwicklungen lautsprachlicher Forschung gehört, dass diesen suprasegmentalen oder prosodischen Phänomenen deutlich mehr Aufmerksamkeit geschenkt wird als zuvor. 5 Auf der suprasegmentalen Gliederungsebene kommt zuerst der Silbe eine zentrale Funktion zu: Über Konzepte wie Reim, Versmaß und Silbentrennung ist sie den Sprechern meist intuitiv zugänglich; in Phonetik und Phonologie bildet sie die Basis für zahlreiche lautsprachliche Phänomene: Silben sind Träger des Wortakzents und stellen damit so etwas wie ‘Ankerpunkte’ für Tonkonturen dar; ihre Struktur hat Einfluss auf die Beschaffenheit konkret produzierter Segmente. So macht es z.B. im Deutschen einen Unterschied, ob der mit beiden Lippen produzierte stimmhafte Verschlusslaut [b] am Silbenanfang (auch: Anfangsrand oder Onset) oder im Endrand der Silbe, in der sog. Coda, steht: Während man ihn in ich habe stimmhaft artikuliert ([ ha.b ]), wird er regelhaft entstimmt, wenn er durch das Weglassen des Auslautvokals in die Codaposition der dann einzig verbleibenden Silbe rückt: ich hab [hap]. Die Silbe und ihre Struktur besprechen wir genauer in 4.2. Die Strukturierung des lautlichen Kontinuums ist komplex und verläuft auf mehreren Gliederungsebenen. Die segmentale Ebene betrifft die Gliederung in Segmente und ihre Klassifizierung zu minimalen bedeutungsunterscheidenden Einheiten, den Phonemen (2.5, 3.1). Auf einer subsegmentalen Ebene sind die artikulatorischen und akustischen Merkmale verortet, die zentral für das Verständnis des lautlichen Kontinuums sind, das wir beim Sprechen produzieren und beim Hören interpretieren (3.3). Silben, Wörter und Phrasen (4.1) sind Einheiten 5 Generell zu neueren sub- und suprasegmentalen Ansätzen vgl. Meisenburg & Selig (2004). # ! ) $! " $% &'* 8 der suprasegmentalen Gliederungsebenen und Träger von prosodischen Merkmalen wie z.B. Akzent (4.3), Sprachrhythmus (4.4) und Intonation (4.5). 1.4 Phonologische Theoriebildung In den letzten Abschnitten haben wir die funktionale Analyse, d.h. die Frage nach dem wozu der lautsprachlichen Phänomene, und die strukturelle Analyse, also die Frage nach dem was und wie, als zwei wichtige Aufgaben lautsprachlicher Forschung herausgestellt. Auch haben wir bereits angedeutet, dass es durchaus verschiedene Antworten auf diese Fragestellungen geben kann, die nicht immer miteinander vereinbar sind. Dieses Nebeneinander unterschiedlicher Ansätze hängt zum einen mit der Herausbildung von Phonetik und Phonologie als zwei Teildisziplinen lautsprachlicher Forschung zusammen; zum anderen bestehen zwischen einzelnen theoretischen Herangehensweisen auch Unterschiede, die auf voneinander abweichende Vorstellungen von der Organisation des menschlichen Sprachwissens zurückgehen. Die Anfänge der wissenschaftlichen Beschäftigung mit der Lautsprache im 19. Jh. wurden maßgeblich durch neue Untersuchungsmethoden bestimmt: Die Beschäftigung mit der Lautseite der Sprache begann zunächst als ‘Lautphysiologie’, die mithilfe neuer Techniken eine physiologische bzw. physikalische Beschreibung der Artikulation bzw. der Übertragung von Sprachlauten leisten wollte, teils mit praktischen Zielsetzungen wie z.B. Verbesserungen in der Gehörlosendidaktik. Für die weitere Entwicklung war vor allem ein Misserfolg von entscheidender Bedeutung: Es gelang nämlich nicht, den Sprachlaut als diskrete Einheit nachzuweisen. Stattdessen stellte man fest, dass sich die Artikulation kontinuierlich, also ohne Grenzziehungen um die Einzellaute vollzieht und zudem variabel und keinesfalls bei allen Sprechern identisch ist. Spätestens in den 1930er Jahren zeigten neue Techniken, mit deren Hilfe Schallwellen aufgezeichnet und sichtbar gemacht wurden, dass Lautsprache auch in akustischer Hinsicht keine Abfolge diskreter Lauteinheiten darstellt. Die Ergebnisse der ersten experimentalphonetischen Untersuchungen stellten damals gängige Vorstellungen von Lautsprache radikal in Frage. Die Problematik, dass die konkrete physische Existenz von kontextstabilen Einzellauten nicht nachgewiesen werden konnte, dass aber sowohl Sprechen als auch Hören offensichtlich auf solchen Einheiten beruhen, führte zur bereits erwähnten Trennung von Phonetik und Phonologie im Strukturalismus (vgl. 1.1): Man unterschied nun zwischen einer naturwissenschaftlichen Beschäftigung mit Artikulation, Schallwellen und Hörvorgängen einerseits und einer am Systemhaften der Lautsprache und dessen Erfassung interessierten Forschung auf der Basis geisteswissenschaftlicher Methoden andererseits. Die Entwicklung der phonologischen Theoriebildung wurde nachhaltig von Trubetzkoys Erkenntnis bestimmt, dass Phoneme als Bündel distinktiver Merkmale aufzufassen sind. Verbunden hiermit ist die Vorstellung, dass unser phonologisches Wissen als System organisiert ist: Die Abgrenzung der Phoneme voneinander funktioniere wie in einem mathematischen System, in dem der Stellenwert einer Einheit nur durch den Unterschied zu anderen Einheiten, also durch Relationen innerhalb des Systems, bestimmt ist. Dieses Prinzip der negativen Definition von Phonemen - jedes Phonem ist das, was die anderen nicht sind - führte häufig dazu, dass die Frage der Systemorganisation quasi zum Selbstzweck wurde; Ziel war es, die phonemischen 9 Oppositionen einer Sprache aus einer möglichst geringen Zahl von distinktiven Merkmalen abzuleiten. Ab Ende der 1960er Jahren erhielt die strukturalistische Phonologie Konkurrenz von der generativen Phonologie. In ihrer Anfangszeit ging diese (wie zuvor der Strukturalismus) von einer segmental bestimmten Strukturierung des lautsprachlichen Wissens aus und wollte lautliche Prozesse, wie sie in der Interaktion der einzelnen Lautsegmente miteinander zu verzeichnen sind, möglichst vollständig durch sog. phonologische Regeln erfassen (vgl. 3.2). Um auch segmentübergreifende Erscheinungen wie tonale und dauerbasierte Merkmale berücksichtigen zu können (Sprachmelodie, Silbenlängung etc.), wurden in der Folgezeit Ansätze entwickelt, die zusätzlich zur segmentalen Schicht weitere, von den Einzellauten unabhängige Repräsentationsebenen annehmen. Diese sog. autosegmentalen Ansätze stellen wir exemplarisch in 3.3 vor. Die wesentlichen Neuerungen der generativen Phonologie beruhen v.a. auf den sprachtheoretischen Annahmen, die Noam Chomsky (*1928), der Begründer der generativen Sprachwissenschaft und einer der Autoren des grundlegenden Werks The Sound Pattern of English (SPE, Chomsky & Halle 1968), in bewusster Abgrenzung vom Strukturalismus formuliert hat. Im Gegensatz zu diesem verlagerte die generative Sprachwissenschaft das Interesse von der Saussureschen langue, der zufolge das Sprachsystem als die Gesamtheit des Sprachwissens aller Sprecher einer Sprachgemeinschaft und damit als soziales Faktum aufzufassen ist, auf die kognitiven Fähigkeiten des Individuums und insbesondere auf dessen sprachliche Kompetenz. Als Folge dieses sog. cognitive turn rückte die mentale Grammatik des einzelnen Sprechers ins Zentrum des Interesses. Die sprachliche Kompetenz des Sprechers wurde verstanden als ein System von Einheiten und Verkettungsregeln, das die Erzeugung oder Generierung komplexer sprachlicher Einheiten wie Phrasen, Sätzen und Lautkombinationen etc. ermöglicht. Dabei ging es zunächst um die Kompetenz des sog. idealen Sprechers/ Hörers, dessen Sprachwissen nicht durch Performanzbedingungen gestört ist. Diese Idealisierung sollte die vollständige Erfassung aller Potentialitäten des Sprachsystems ermöglichen. Die Performanz kann nach Chomsky nur eingeschränkt als Repräsentation der Kompetenz angesehen werden, da Faktoren wie Müdigkeit, begrenztes Gedächtnis etc. die konkrete Sprachrealisierung stören und ein vollständiges Ausschöpfen der von der Kompetenz gebotenen Möglichkeiten daher undenkbar ist. Eine weitere Grundannahme des frühen generativen Modells bestand in der Auffassung, dass das Sprachwissen modular organisiert sei. Nach dieser Annahme bauen die unterschiedlichen sprachlichen Wissensbereiche zwar aufeinander auf, sind aber insofern autonom, als sie weitgehend unabhängig voneinander agieren: So wurde angenommen, dass bei der Produktion einer sprachlichen Äußerung eine von der syntaktischen Komponente erzeugte grammatische Struktur an eine Art ‘Lautgenerator’, die phonologische Komponente, weitergereicht werde, die dann die im mentalen Lexikon gespeicherten Repräsentationen der in der Konstruktion verwendeten Wörter in konkrete Lautformen überführt. Die Auffassung von der Modularität des Sprachwissens wird jedoch seit längerer Zeit in Frage gestellt, und es haben sich Ansätze entwickelt, die eine enge Interaktion der einzelnen sprachlichen Wissensbereiche annehmen. Als ein Beispiel hierfür besprechen wir die sog. Optimalitätstheorie, die dezidiert von einem Zusammenspiel unterschiedlicher Komponenten wie Syntax, Morphologie, Phonologie, aber auch Informationsstruktur ausgeht (vgl. 3.4, 4.2.5, 4.5.5.3). # ) % # ! ) &'+ 10 Die kognitive Verortung des Sprachlichen ist auch methodisch nicht folgenlos geblieben: Wenn es darum geht, das Sprachwissen des Individuums zu erfassen, dann ist es völlig ausreichend, bei der theoretischen Modellierung von den Sprachdaten und Grammatikalitätsurteilen eines einzigen kompetenten Muttersprachlers auszugehen. Verbunden damit ist der weitgehende Verzicht auf die Auswertung natürlich produzierter Sprachdaten mehrerer Sprecher (Korpora). Seit einiger Zeit ist hier jedoch eine Wende zu verzeichnen, und auch im Rahmen phonologischer Forschung, die auf generativen Konzepten aufbaut, werden theoretische Annahmen unter Rückgriff auf die Auswertung lautsprachlicher Korpora validiert. Zu nennen ist hier u.a. die Ausrichtung der sog. Laboratory Phonology (Cohn et al. 2012), ein Ensemble neuerer Forschungsaktivitäten, die zwar keine homogene theoretische Ausrichtung repräsentieren, doch von der Überzeugung geeint werden, die Weiterentwicklung phonologischer Theoriebildung müsse in stetiger Interaktion mit der Analyse natürlicher Sprachdaten und insbesondere durch die Auseinandersetzung mit der dort zu konstatierenden sprachlichen Variation vorangetrieben werden (vgl. u.a. Face 2004). Die Berücksichtigung von sprachlichen Varianten in ihren konkreten Vorkommensfrequenzen im Sprachgebrauch ist auch ein zentrales Anliegen der sog. Exemplartheorie, die wir in 3.5 kurz skizzieren. 1.5 Variation, Varietäten und Aussprachenormen Bereits mehrfach haben wir darauf hingewiesen, dass die Lautseite der Sprache nicht einheitlich ist, sondern in Abhängigkeit vom Sprecher und der kommunikativen Situation mehr oder minder stark variieren kann. Um die unterschiedlichen Dimensionen sprachlicher Variation zu erfassen, wurde eine Vielzahl von Termini geprägt, die wir zunächst kurz besprechen. Dass Sprache nicht homogen ist, wird durch alltägliche Erfahrungen gestützt: Je nach Land und Region klingt das Spanische unterschiedlich, sprachliches Verhalten differiert beispielsweise je nach sozialem Status und Gruppenzugehörigkeit der Sprecher, und diese bedienen sich wiederum entsprechend der jeweiligen kommunikativen Situation (gezielt oder unbewusst) bestimmter Ausdrucksmittel, die ihnen ihre Sprache bereitstellt. Sprachliche Vielfalt, wie sie uns tagtäglich begegnet, ist also nicht willkürlich verteilt, sondern vielmehr durch eine Vielfalt an innersprachlichen (d.h. dem System selbst inhärenten) und außersprachlichen (z.B. geographischen, sozialen, situativen) Faktoren geleitet. Jede Einzelsprache stellt damit eine Art Varietätengefüge dar. Um diese Architektur der Sprache zu erfassen, hat Coseriu (1980, 1992: 294ff.) die folgenden drei Dimensionen von Variation vorgeschlagen: • Die diatopische Variation betrifft die sprachliche Gliederung im Raum und bezieht sich auf Dialekte bzw. regionale Varianten. • Die diastratische Variation zielt ab auf die soziale Gliederung von Sprache und damit auf gruppen- oder schichtenspezifische Sprachverwendung; entsprechende Gruppensprachen oder Soziolekte lassen sich als sozial ‘hoch’ oder ‘niedrig’ konnotiert einstufen. • Die diaphasische Variation bezieht sich auf die Sprachverwendung in unterschiedlichen kommunikativen Situationen. Auch die entsprechend verwendeten Register oder Sprechstile können zwischen den Polen ‘hoch’ und ‘niedrig’ eingeordnet werden. 11 Dieses dreidimensionale Modell wurde von Koch & Oesterreicher (1985, 2011) durch eine vierte Dimension erweitert. Angenommen wird hier ein Kontinuum zwischen konzeptioneller Mündlichkeit und Schriftlichkeit bzw. kommunikativer Nähe und Distanz, wobei die mediale Differenzierung ‘graphisch’ vs. ‘phonisch’ den jeweiligen Polen tendenziell entspricht. Dass das Medium der Phonie aber nicht zwangsläufig mit konzeptioneller Mündlichkeit korrelieren muss, kann man sich anhand eines Beispiels leicht verdeutlichen: So wird etwa eine feierliche Rede aus Anlass einer Bibliothekseröffnung mündlich, also im phonischen Medium vorgetragen, doch ist sie mit vermutlich hohem Planungsaufwand entstanden, damit distanzsprachlich konzipiert, und weist in der Verwendung komplexer Satzbaumuster und gehobenen Vokabulars eher die typischen Merkmale des Geschriebenen als die eines nähesprachlichen Alltagsgesprächs auf. Die genannten Dimensionen sprachlicher Variation sind nicht isoliert zu betrachten, sondern sie können auf vielfältige Weise ineinandergreifen. So ist z.B. die sog. aspiración, d.h. die gehauchte Realisierung von / s/ im Silbenauslaut wie in mosca [ moh.ka], kein Bestandteil der kastilischen Normlautung; sie lässt sich vielmehr diatopisch einordnen und damit als typisches Merkmal des in Andalusien oder auch des in großen Teilen Lateinamerikas gesprochenen Spanisch charakterisieren (vgl. 2.5.1.2, 3.5). Auch das Ersetzen des Phonems / / durch / s/ und die daraus resultierende lautliche Gleichheit von Wörtern wie casa und caza (jeweils [ kasa]), der sog. seseo (vgl. 3.1.2), ist kein Bestandteil der kastilischen Lautung. Die Zuordnung des seseo zu einer bestimmten Region gestaltet sich jedoch schwierig, da er fast den gesamten hispanischen Raum erfasst hat und allein das in Kastilien und Nordspanien gesprochene Spanisch durch die phonemische Unterscheidung zwischen / / und / s/ und damit durch Differenzierung von caza [ kaa] und casa [ kasa] gekennzeichnet ist. Geographisch markierte Aussprachevarianten lassen sich auch im Rahmen der diaphasischen Variation einsetzen, nämlich etwa dann, wenn ein andalusischer Sprecher neben seinem lokal gefärbten Sprechstil auch über ein standardnahes, am kastilischen Spanisch orientiertes Register verfügt und seine Aussprache situationsbezogen anpasst. Dies wiederum impliziert eine diastratische Komponente, denn die Fähigkeit zum Register- oder Stilwechsel setzt die Beherrschung mehrerer sprachlicher (Sub-)Systeme voraus. Ob ein Sprecher neben einem lokal gefärbten auch ein neutrales Register zur Verfügung hat, ist i.d.R. an soziale Faktoren und insbesondere an den Zugang zu Bildungsinstitutionen gebunden, da zusätzlich zum muttersprachlich erworbenen (geographisch markierten) System eine als neutral empfundene Varietät erlernt werden muss. Welche Varietät als neutral und den verschiedenen Dialekten übergeordnet eingestuft wird, ist wiederum von Sprache zu Sprache unterschiedlich und wird von zahlreichen außersprachlichen Faktoren mitbestimmt. Für den europäischen Raum gilt das kastilische Spanisch, wie es in der Hauptstadt Madrid gesprochen wird, als prestigeträchtige Referenzvarietät; parallel hierzu haben sich in jüngerer Zeit auch in Lateinamerika eigene Standardvarietäten herausgebildet (s.u.). 6 Doch auch wenn ein Sprecher bspw. das kastilische Spanisch als L1 erworben hat, muss er die distanzsprachlichen Merkmale der habla culta wie komplexe Satzbaumuster, besondere stilis- 6 Die Aufwertung der zahlreichen Varietäten zeigt sich auch daran, dass die neue Akademiegrammatik (Nueva Gramática de la lengua española, NGRAE) von den 22 Sprachakademien des spanischsprachigen Raums gemeinsam erarbeitet wurde. ! $% ,$ $" - ,$ "." ! &'/ 12 tische Figuren, gehobenes und gegebenenfalls fachspezifisches Vokabular etc., gezielt erlernen, um in entsprechenden Situationen angemessen kommunizieren zu können. Bislang war bereits mehrfach von sprachlichen Varietäten die Rede. Wir verwenden diesen Terminus, da er, etwa im Gegensatz zum manchmal negativ konnotierten Begriff des Dialekts, explizit keine soziolinguistische Einordnung in einem Kontinuum zwischen ‘hoch’ und ‘niedrig’ vornimmt, sondern in neutraler Form auf ein wie auch immer beschaffenes Sprachsystem verweist. So lassen sich geographisch unterschiedlich gefärbte Sprachformen wie das in Andalusien, in Argentinien oder in Madrid gesprochene Spanisch gleichermaßen als Varietäten erfassen. Mit dem neutralen Terminus lässt sich auch die problematische Abgrenzung zwischen Sprache und Dialekt vermeiden, d.h. es muss keine Entscheidung getroffen werden, welchem Spanisch der Status einer überdachenden Sprache zugesprochen wird, der abweichende Formen als Dialekte unterzuordnen wären. Der Begriff der Varietät bezieht sich jedoch nicht nur auf die Dimension der diatopischen Variation. Man kann ihn gleichermaßen auf gruppenund/ oder berufsspezifische Sprachformen (sp. jergas) oder auf situationsbezogene, d.h. nähe- oder distanzsprachliche Register (sp. registros) anwenden und damit sowohl diastratische als auch diaphasische Aspekte mit einbeziehen. Innerhalb einer Sprechergemeinschaft bestehen zumindest im bildungssprachlichen Kontext jedoch durchaus Vorstellungen von einer korrekten Sprachverwendung und damit auch von einer normgerechten Aussprache, die als Ergebnis historisch gewachsener Normierungsprozesse aufzufassen ist. Für das Spanische gilt, dass den kastilischen Varietäten aufgrund der politischen Schlüsselposition Kastiliens eine zentrale Rolle zukommt. So wurde bereits im 13. Jh. unter Alfons X. (genannt der Weise, sp. El sabio, 1221-1284) der Begriff vom castellano drecho, d.h. vom ‘richtigen Spanisch’ geprägt, was auf den als vorbildhaft geltenden Sprachgebrauch am Hof im kastilischen Toledo abzielte (sp. uso cortesano). Auch das anschließend entstandene Konzept des buen uso ist lokal gebunden und nimmt Bezug auf die Sprachverwendung in den habsburgischen Hauptstädten Valladolid und Madrid (vgl. Kabatek & Pusch 2009: 258ff.). Im Zuge der nach dem Vorbild der Académie française erfolgten Gründung der Real Academia trat die Vorbildfunktion gebildeter Sprecher in den Vordergrund, wobei in diatopischer Hinsicht weiterhin der kastilische Sprachraum maßgeblich war. Die Varietäten anderer Regionen spielten lange Zeit nur als der hauptstädtischen habla culta untergeordnete Dialekte eine Rolle; ihre lautlichen Besonderheiten wurden unter dem Gesichtspunkt der Abweichung von der kastilischen Norm betrachtet und entsprechend im Rahmen dialektologischer Studien behandelt. Dies gilt auch für die in Amerika gesprochenen Varietäten des Spanischen, auch wenn hier inzwischen verstärkt Tendenzen zur Etablierung eigener nationaler Standards und Aussprachenormen zu verzeichnen sind. Als ein Beispiel sei die Situation der Rundfunkanstalten in Argentinien angeführt: Während in den 1930/ 40er Jahren dem Rundfunk eine der Schule gleichgestellte normgebende Kraft zugesprochen wurde und die Aussprache der Radiosprecher per Dekret auf die ‘gepflegte’ Lautung gemäß der kastilischen Norm festgelegt war, wurde dies 1957 dahingehend gelockert, dass umgangssprachliche Ausspracheformen explizit zugelassen wurden. In den entsprechenden Richtlinien von 1980 fand schließlich die Lautung keine Erwähnung mehr, was eine lokal gefärbte Aussprache im Rundfunk de facto ‘legalisierte’ (Vitale & Vázquez Villanueva 2004). Heutzutage werden für das argentinische Spanisch typische lautliche Merkmale wie die bereits erwähnten Phänomene aspiración und eísmo auch in distanzsprachlichen Kontexten ostentativ ver- 13 wendet. Damit hat sich ein lokaler Standard herausgebildet, der sich in Bezug auf seine Normen sowohl in lexikalisch-grammatischer 7 als auch in lautlicher Hinsicht deutlich von anderen Varietäten und insbesondere vom kastilischen Spanisch abhebt. Das hier angeführte argentinische Spanisch ist nur ein Beispiel unter vielen: Im gesamten spanischen Sprachraum haben sich divergierende Aussprachemuster herausgebildet, die wir exemplarisch in den Kapiteln zur segmentalen und prosodischen Phonologie besprechen werden. Welche der zahlreichen Aussprachevarianten sollten aber nun für eine Beschreibung der spanischen Lautung als Bezugspunkt aufgefasst werden, welche als Abweichungen hiervon gelten? Da sich neben dem kastilischen Spanisch eine Vielfalt an regionalen Normen entwickelt hat, erscheint es fragwürdig, die Aussprache einer dieser Varietäten als Referenzlautung anzusetzen und die übrigen als divergierende Unterformen zu charakterisieren. Da eine solche Entscheidung bestenfalls mit Blick auf die Geschichte zu begründen wäre, stellen wir unterschiedliche Varietäten wie kastilisches, andalusisches oder argentinisches Spanisch jeweils gleichberechtigt dar. Hieraus folgt, dass wir bei der Behandlung des spanischen Lautinventars z.B. das (nur in den kastilischen und nordspanischen Varietäten vorkommende) / / als ein varietätenspezifisches Phonem verzeichnen, ebenso wie das Phonem / / , das speziell für das argentinische Spanisch (und darüber hinaus für den gesamten Río de la Plata-Raum) charakteristisch ist, in europäischen Varietäten jedoch nicht in dieser Form auftritt. Im Folgenden geben wir einen knappen Überblick zum spanischen Varietätenraum (vgl. ausführlicher Hualde 2005: 19-35). Das europäische Sprachgebiet ist grob zweigeteilt und lässt sich in eine nördlich-zentrale und eine südliche Zone aufteilen. Typisch für die Varietäten der ersteren ist neben der Beibehaltung der phonemischen Opposition / / vs. / s/ vor allem die postvelare (d.h. weit hinten am Gaumen produzierte) Realisierung des Frikativphonems / x/ in Wörtern wie ajo [ ao] ‘Knoblauch’ oder mujer [mu e] ‘Frau’ (vgl. 2.5.1.2). Mit dem Katalanischen, dem Baskischen und dem Galicischen werden in Spanien neben Varietäten des Spanischen weitere Sprachen gesprochen, wobei jedoch nicht alle in den jeweiligen Gebieten lebenden Spanischsprecher bilingual sind. Die entsprechenden Gebiete sind in Abb. 1.5-1 durch Schraffierung hervorgehoben. Die Varietäten der südlichen Zone zeichnen sich u.a. durch die Abwesenheit des Kontrasts / / vs. / s/ (seseo), durch die aspiración von silbenfinalem / s/ sowie durch eine Abschwächung des / x/ zum Hauchlaut (wie in mu[h]er) aus. Das Spanische der kanarischen Inseln teilt die meisten dieser Merkmale mit der südlichen Zone, ist jedoch zusätzlich durch spezielle Eigenheiten charakterisiert (vgl. 2.5.1.2, 3.3). Für das rein flächenmäßig weitaus größere Sprachgebiet in Mittel- und Südamerika lassen sich mit Hualde (2005: 25ff.) sieben Zonen unterscheiden. Das amerikanische Spanisch steht in unterschiedlich starkem Maße im Kontakt mit autochthonen Sprachen, wobei Paraguay den größten Anteil an bilingualen Sprechern aufweist (Spanisch - Guaraní). Zu nennen sind weiterhin u.a. Nahuatl für das mexikanische Spanisch sowie Quechua und Aymara für die andinen Varietäten (Peru, Ecuador). Die genannten Kontaktsprachen sind in Abb. 1.5-2 in Kursivschrift notiert. Als weitere 7 Zu nennen sind hier z.B. die Verwendung des Pronomens vos für die nähesprachliche Anrede im Singular und die damit korrespondierenden, vom europäischen Spanisch abweichenden Verbformen (z.B. vos contás statt (tú) cuentas) sowie eine deutlich stärkere Tendenz zur sog. klitischen Dopplung, die auch unbelebte direkte Objekte betreffen kann (z.B. y al final me lo compré [ dir. Objekt al auto] statt (me) compré [ dir. Objekt el coche]). ,$ $" - ,$ "." ! ! $% &'/ Y 14 Kontaktsprache ist das Englische für das im Grenzgebiet zwischen USA und Mexiko gesprochene Spanisch zu nennen. Weiterhin sind infolge von Migration aus Lateinamerika in den USA große Hispanic communities entstanden, deren Sprecher neben dem Englischen das Spanische als Herkunftssprache verwenden. Für das mexikanische Spanisch, das auch die südlichen Grenzgebiete der USA umfasst, kann als typisches Merkmal die stabile silbenfinale / s/ -Realisierung wie in estos [ estos] sowie in komplexen Konsonantenverbindungen (construir [konstu i]) angeführt werden. Ein weiteres, durch den Kontakt mit mesoamerikanischen Sprachen wie dem Nahuatl bedingtes Merkmal ist die von anderen Varietäten des Spanischen abweichende Silbenaufteilung bei Wörtern wie a.tle.ta (anstelle von at.le.ta); die zweite Silbe beginnt hier mit dem komplexen Onset [tl], ebenso wie der absolute Anlaut des mexikanischen Ortsnamens Tlaxcala (4.2.5). In der zentralamerikanischen Zone werden Varietäten zusammengefasst, die sich einerseits vom mexikanischen und andererseits vom karibischen Spanisch abgrenzen. Ein besonderes Charakteristikum der in Costa Rica gesprochenen Varietät ist die an das Englische erinnernde r-Realisierung. Die karibischen Varietäten zeichnen sich u.a. durch eine starke Tendenz zur Reduktion stimmhafter intervokalischer Verschlusslaute aus, die bis zur kompletten Tilgung gehen kann. In Kombination mit der aspiración von vorkonsonantischem / s/ ergeben sich hieraus Realisierungen wie [peh kao] pescado. Dies kommt jedoch auch im andalusischen Spanisch vor. Das andine Spanisch (Peru, Ecuador, Bolivien) ist teils durch Besonderheiten charakterisiert, die sich durch den Kontakt mit dem Quechua erklären lassen. So treten im Hochlandspanischen von Peru bei der Markierung von akzentuierten Silben Tonhöhenbewegungen auf, die denen des Quechua entsprechen (vgl. hierzu O’Rourke 2004). Auch das paraguayische Spanisch ist nachhaltig durch den Sprachkontakt geprägt. Ein vermutlich aus dem Guaraní übernommenes Merkmal, das in anderen Varietäten des Spanischen nicht regelmäßig auftritt, ist der am Wortanfang und auch zwischen Vokalen platzierte Glottisschlag [], der in ähnlicher Form auch im Deutschen auftritt. Im chilenischen Spanisch ist die bereits für zahlreiche andere Varietäten (Andalusien, Argentinien, Karibik) angeführte / s/ -Aspiration zu verzeichnen. Ein typisches Merkmal besteht zudem darin, dass / k x/ in der Position vor / e/ und / i/ weiter vorne am Gaumen artikuliert werden als in anderen Varietäten. Damit klingt in der chilenischen Aussprache von gente ‘Leute’ die erste Silbe eher so wie dt. -chen (vgl. Hualde 2005: 30). Das Gebiet des rioplatensischen Spanisch umfasst die am Río de la Plata gelegenen Staaten Argentinien und Uruguay, wobei die nördlichen Provinzen Argentiniens (u.a. Corrientes, Misiones, Formosa) sprachlich eher dem paraguayischen Spanisch zuzuordnen sind. Die bereits erwähnten lautlichen Merkmale des argentinischen Spanisch, insbesondere der eísmo und die starke Tendenz zur / s/ -Aspirierung treffen auch weitgehend für Uruguay zu. 15 Abb. 1.5-1 Varietäten des europäischen Spanisch (nach Hualde 2005: 19ff.). ,$ $" - ,$ "." ! ! $% &'/ 16 Abb. 1.5-2 Die sieben Varietätenzonen des amerikanischen Spanisch (in unterschiedlichen Grauschattierungen, nach Hualde 2005: 25ff.); wichtige Kontaktsprachen (Nahuatl, Quechua, Aymara, Guaraní) werden kursiv angezeigt. 2. Die Lautseite sprachlicher Kommunikation: Phonetik 2.1 Der Gegenstand der Phonetik Dieses Kapitel ist der Phonetik gewidmet, die in ihren Teilbereichen artikulatorische (2.2), akustische (2.3) und auditive bzw. perzeptive Phonetik (2.4) lautsprachliche Kommunikation vornehmlich von ihrer materiellen Seite her untersucht. Sie liefert damit wichtige Grundlagen für die Klassifikation der Sprachlaute, wie sie in 2.5 für das Spanische - kontrastiert mit dem Deutschen - vorgestellt wird. Wir wollen aber zunächst fragen, was tatsächlich passiert, wenn wir in Lautsprache kommunizieren, wenn wir also sprechen und Gesprochenes wahrnehmen. Wir versetzen uns dazu wieder in die Situation von Juan, der wissen will, ob es in einem ihm bislang unbekannten Laden Mandarinen gibt. Ursprung, Ausgang und Steuerungszentrum für sämtliche Kommunikation und damit auch für unser sprachliches Handeln ist unser Gehirn, in dem unser gesamtes sprachliches Wissen gespeichert ist. Dabei können verschiedene Funktionen unterschieden werden, die während des Kommunikationsprozesses eng miteinander koordiniert sind (vgl. Abb. 2.1-1). Im Rahmen der kreativen Funktion hat Juan seinen Entschluss zur Nutzung der Lautsprache für die Kommunikation mit der Verkäuferin getroffen. Auch innerhalb dieses Zeichensystems hat er nun mehrere Möglichkeiten: So kann er bspw. das, was er ausdrücken will, als Frage oder als Aussagesatz (etwa mit einer indirekten Frage im Nebensatz) formulieren, er kann komplizierte Umschreibungen einbauen oder einen ganz einfachen Satz konstruieren etc. Derartige Entscheidungen werden meist sehr schnell und weitgehend unbewusst von der entsprechenden Gehirnfunktion getroffen. Mit der kreativen Funktion eng verbunden ist die Sendefunktion. Zur Produktion einer mündlichen Äußerung werden über die Nerven Impulse vom Gehirn zu den Muskeln geschickt, die für den Betrieb der Sprechwerkzeuge zuständig sind, für Lunge, Kehlkopf, Zunge usw. Die Impulse bewirken, dass diese Muskeln verschiedene Bewegungen durchführen: die Lunge zieht sich zusammen, die Stimmbänder vibrieren, der Unterkiefer geht auf und nieder, Zunge und Lippen verändern laufend ihre Position. Durch all diese Aktivitäten, deren Koordinierung über ständige Rückmeldungen ans Gehirn erfolgt, wird der von der Lunge ausgehende Luftstrom bei seinem Gang durch Kehlkopf, Rachen, Nasen- und Mundraum auf vielfältige Weise gestaltet - unterbrochen, behindert, frei durchgelassen -, sodass er den Mund in Folgen von komplexen, akustisch als Klänge und Geräusche wahrnehmbaren Druckwellen verlässt: Muskelbewegungen werden in Luftbewegungen - Schallwellen - umgesetzt. Außerhalb des Mundes bewegen sich die Druckwellen in alle Richtungen fort; sie werden immer schwächer, je weiter sie gelangen, und verebben schließlich ganz, wenn ihre ursprüngliche Energie aufgebraucht ist. Doch werden sie für gewöhnlich produziert, um vor dem Verebben auf ein (oder mehrere) Paar Ohren zu treffen, in unserem Fall auf die Ohren der Verkäuferin. Damit setzt beim Hörer die wiederum vom Gehirn gesteuerte Hörfunktion ein: Im Ohr bewegt sich das sehr empfindliche Trommelfell entsprechend den eintreffenden Druckwellen; diese Bewegungen werden auf Nerven übertragen, die vom inneren Ohr des Hörers zu seinem Gehirn laufen. Dort werden die vom Ohr kommenden Impulse 0 1 18 als lautliches Geschehen aufgenommen, das sich in seiner Qualität, Länge, Höhe, Lautstärke etc. laufend ändert. Die Verkäuferin hört Juans Frage. Hören bedeutet jedoch noch nicht verstehen. 1 Um zu einem Verständnis des lautlichen Geschehens zu gelangen, muss der Hörer es interpretieren, und zwar entsprechend seiner im Gehirn gespeicherten Sprachkenntnis. Die Verkäuferin stimmt also das, was sie hört, mit dem ab, was nach ihrem Wissen in ihrer Sprache möglich ist, und entschlüsselt bzw. interpretiert so Juans Äußerung, 2 bevor sie selbst die Rolle der Sprecherin übernimmt. In Abbildung 2.1-1 sind diese lautsprachlichen Produktions- und Rezeptionsprozesse skizziert. Durch die eckigen Klammern ist der Bereich angezeigt, der die Phonetik interessiert, die senkrechten Linien grenzen grob ihre drei klassischen Teilbereiche ab. Es folgt eine an Pompino-Marschall (2009: 2f.) angelehnte Definition von Phonetik. Abb. 2.1-1 Gegenstand der Phonetik und ihre Teilbereiche. Gegenstand der Phonetik sind die lautlichen Aspekte sprachlicher Kommunikation. Sie untersucht, wie Schallereignisse artikulatorisch zustandekommen (physikalische Prozesse bei der Sprachproduktion), wie sie akustisch zu messen und zu beschreiben sind (akustische Vorgänge der Schallproduktion und -übertragung) und wie sie auditiv wahrgenommen werden (perzeptive Vorgänge bei der Verarbeitung über das Gehör). Die kleinsten Analyseeinheiten der Phonetik sind Laute (auch Phone oder Segmente, sp. sonidos, fonos, segmentos), denen man sich ohrenphonetisch/ auditiv beim bewussten Nachvollziehen der Artikulationsbewegungen annähern kann - so etwa beim zeitlichen Überdehnen der Aussprache. Diese Minimalereignisse sind jedoch reine Beschreibungskategorien, die nicht als kleinste Bausteine der menschlichen Rede missverstanden werden dürfen: Beim Sprechen werden nicht einzelne Laute aneinan- 1 So können wir bspw. hören, dass etwas in einer fremden Sprache gesagt wird, ohne zu verstehen, was gesagt wird. 2 Damit eine Äußerung verstanden wird, muss sie nicht nur dem sprachlichen Wissen des Hörers entsprechen, sondern seinem allgemeinen (Welt-)Wissen. 0 19 dergefügt, sondern ein ganzer Lautstrom wird durch kontinuierliche Bewegungsabläufe moduliert (Pompino-Marschall 2009: 178). Bestimmte Eigenschaften sprachlicher Schallereignisse wie Akzent oder Intonation lassen sich nicht an einzelnen Lautsegmenten festmachen, sondern gehen über diese hinaus. Sie werden daher als suprasegmentale Merkmale gefasst und der Prosodie zugerechnet (vgl. Kap. 4). Eine wichtige Rolle als Trägerin prosodischer Eigenschaften (insbesondere des Akzents) spielt die der Wahrnehmung leicht zugängliche Silbe. Als kleinste suprasegmentale Komponente und elementare Produktionseinheit hat sie wesentlichen Anteil an verschiedenen lautlichen Prozessen sowie an der rhythmischen Strukturierung sprachlicher Äußerungen (vgl. 4.2). Mit Symbolphonetik und Messphonetik werden zwei kategorial verschiedene, doch aufeinander beziehbare Herangehensweisen an den Gegenstandsbereich der Phonetik unterschieden: Während die Messphonetik sich mit den Vorgängen befasst, die bei der Produktion, Übertragung und Rezeption von Sprachsignalen unter Zuhilfenahme von Geräten gemessen und in einer physikalischen Sprache dargestellt werden können, ist die Symbolphonetik durch den Gegenstand ‘Laut’, wie er sich perzeptiv aus komplexen Schallereignissen herauslösen lässt, bestimmt. Mit Hilfe eines begrenzten Zeichenvorrats stellt sie diese Schallereignisse symbolisch dar, sodass die phonetische Information in einer Symbolkette repräsentiert wird (Kohler 1995: 17). 3 Die Wiedergabe von Lauten durch (graphische) Symbole einer phonetischen Umschrift wird als Transkription bezeichnet. Auch die uns vertrauten Alphabetschriften zielen auf die Wiedergabe der Lautung ab, doch neben dem Lautbezug vermitteln sie dem Leser noch zahlreiche weitere Informationen, die nur einen mittelbaren oder gar keinen Bezug zur Lautseite aufweisen, während bestimmte lautliche Erscheinungen nicht oder nicht regelmäßig berücksichtigt werden. Zu letzteren gehört oft (so z.B. im Deutschen) die Kennzeichnung der Betonung, zu ersteren zählen Abstände zwischen Wörtern, Großschreibungen u.v.a. Auch werden häufig mehrere Schreibungen für ein und denselben Laut genutzt (vgl. im Deutschen <f>/ <v> für [f] wie in Fee/ Vieh oder im Spanischen / <v> für [b] wie in baca ‘Dachgepäckträger’ / vaca ‘Kuh’, beide [ baka]). Umgekehrt können verschiedene Laute durch ein einziges Schriftzeichen repräsentiert werden (vgl. [e ]/ [] durch <e> in dt. Weg/ weg oder [r]/ [] durch <r> in sp. raro ‘selten’ [ rao]). In der Rechtschreibung zeichnen sich zudem immer wieder Tendenzen ab, das, was inhaltlich zusammengehört, graphisch auch dann einander anzugleichen, wenn die Lautung abweicht, und andererseits das unterschiedlich zu schreiben, was nur zufällig gleich lautet, inhaltlich aber nichts miteinander zu tun hat. So teilen dt. Maus [mas] und Mäuse [ m z ] in der Lautung nur den Anfangskonsonanten, während sie graphisch weitgehend identisch gehalten sind. Dt. Häute und heute lauten dagegen völlig gleich, nämlich [ h t ], werden aber in der Schreibung deutlich voneinander geschieden. Um die Lautseite einer Sprache genauer und eindeutiger repräsentieren zu können, sind für Phonetik und Phonologie eigene Transkriptionssysteme entwickelt worden. Das bekannteste unter ihnen, das auch wir hier benutzen, ist das International Phonetic Alphabet (IPA, sp. Alfabeto Fonético Internacional bzw. AFI, vgl. 3 Neben ‘Symbol-’ und ‘Messphonetik’ sind für diese Herangehensweisen auch die Bezeichnungen ‘deskriptive Phonetik’ gegenüber ‘Signal-’ oder ‘Instrumentalphonetik’ in Gebrauch (vgl. Pompino-Marschall 2009: 2f.). 0 1 20 http: / / www.langsci.ucl.ac.uk/ ipa/ ). Nach dem Prinzip, dass zumindest jeder Laut, der in einer der Sprachen der Welt zur Bedeutungsunterscheidung beiträgt, durch ein eigenes Transkriptionszeichen repräsentiert sein soll, kommen in ihm alle Buchstaben des lateinischen Alphabets (mit einer in vielen Sprachen verbreiteten lautlichen Entsprechung) zum Einsatz, aber es werden auch die Buchstaben des griechischen und weiterer Alphabete genutzt. Gegebenenfalls werden die Zeichen durch sog. Diakritika (Unterscheidungszeichen) ergänzt. 4 Als maschinenlesbare Lautschrift, die nur die Zeichen der grundlegenden Tastaturbelegung nutzt, ist in den letzten Jahrzehnten SAMPA (Speech Assessment Methods Phonetic Alphabet) entwickelt worden. 5 Für das Spanische wird gelegentlich noch der Zeichensatz der Revista de Filología española (RFE) verwendet. 6 Während eine weite Transkription (sp. transcripción amplia) sich auf das symbolische Minimum zur eindeutigen segmentellen Differenzierung der transkribierten Einheiten beschränkt (und damit einer phonologischen Transkription gleichkommt, vgl. 3.1.2), symbolisiert eine enge Transkription (sp. transcripción estrecha) auch darüber hinausgehende phonetische Information. Da Letzteres in unterschiedlichem Ausmaß geschehen kann, gibt es zwischen weiter und enger Transkription zahlreiche Zwischenstufen. Behandelte (Sprach-)Formen, Äußerungen, Wörter, Laute sind im laufenden Text graphisch stets auszuzeichnen. Für gewöhnlich geschieht das durch Kursivsetzung. Wird speziell auf die (Ortho-)Graphie abgezielt, so stehen die entsprechenden Einheiten zwischen spitzen Klammern. Phonetische Transkriptionen stehen immer zwischen eckigen Klammern. Beispiele: ¿Tiene mandarinas? Beispielsatz <¿Tiene mandarinas? > graphische Repräsentation [ tjenemanda inas] IPA-Transkription [ tje .ne.man.da. ı .nas] IPA-Transkription (relativ eng) ["tjenemanda"4inas] SAMPA-Transkription [tjénemandarínas] RFE-Transkription Unter http: / / scripts.sil.org/ cms/ scripts/ page.php? item_id=DoulosSILfont lassen sich die unicode-basierten (und damit zwischen verschiedenen Rechnersystemen kompatiblen) phonetischen Zeichen der IPA-Schrift Doulos SIL kostenlos herunterladen. Unter http: / / phonetics.ucla.edu/ course/ chapter1/ chapter1.html kann man die den jeweiligen Zeichen entsprechenden Laute anhören. Weitere Darstellungen der Phonetik des Spanischen finden sich u.a. in Cloonan Cortez de Andersen (2010), Hidalgo Navarro & Quilis Merín (2012), Hualde (2005), Kubarth (2009), Martínez Celdrán & Fernández Planas (2007), NGRAE (2011), Quilis (1999), Schwegler et al. (2010). 4 Die für das Spanische relevanten Zeichen des IPA werden in 2.5 ausführlich vorgestellt. Ein Überblick über das gesamte Zeicheninventar (aus IPA 1999: ix) findet sich im Anhang. 5 Vgl. http: / / en.wikipedia.org/ wiki/ Speech_Assessment_Methods_Phonetic_Alphabet_chart. Eine Gegenüberstellung von IPA und SAMPA gibt auch Mayer (2012: 13). 6 Der Zeichensatz der Revista de Filología española ist - nach RFE 2 (1915), 374-376 - in Kubarth (2009: 331f.) abgebildet. Eine Gegenüberstellung der IPA- und RFE-Zeichen findet sich unter http: / / www.uiowa.edu/ %7Eacadtech/ phonetics/ spanish/ IPA.pdf. 21 2.2 Artikulatorische Phonetik Die artikulatorische Phonetik beschreibt die physiologischen Prozesse, die zur Produktion lautsprachlicher Äußerungen führen. Dieses Unterkapitel gilt den Grundlagen der artikulatorischen Phonetik. Dazu stellen wir mit Atmung, Phonation und Artikulation zunächst die drei Funktionskreise der Lautproduktion vor (2.2.1), bevor wir uns gründlicher mit der Artikulation beschäftigen: in 2.2.2 gehen wir auf Artikulatoren und Artikulationsstellen ein, in 2.2.3 auf verschiedene Artikulationsmodi, in 2.2.4 auf das Phänomen der Koartikulation. 2.2.1 Lautproduktion: Atmung, Phonation, Artikulation Alle an der Sprachproduktion beteiligten Organe haben primär andere, vitale Funktionen: sie dienen der Sauerstoffzufuhr, der Nahrungsaufnahme u.ä. Die Sprachproduktion stellt lediglich eine Sekundärfunktion dar, die der Primärfunktion entwicklungsgeschichtlich nachgeordnet ist. 7 Voraussetzung für das Sprechen ist das Atmen. Zur Lautproduktion muss zunächst ein Luftstrom erzeugt werden, wie er durch die Aktivitäten des Atmungssystems (Lunge, Zwerchfell, Luftröhre etc.) entsteht. Die Lunge ist durch ein System von Flüssigkeiten und Geweben mit dem Brustkorb und dem Zwerchfell verbunden. Beim Einatmen bewegt sich das Zwerchfell nach unten, der Brustraum wird vergrößert und das Lungenvolumen erweitert. Der Druck, mit dem die Luft beim ruhigen Ausatmen nach außen gepresst wird, ist allerdings für die Sprachproduktion zu hoch; deshalb müssen beim Sprechen die Muskeln dem natürlichen Ausatmungsdruck entgegenwirken und einen gleichmäßigen subglottalen Druck garantieren. Abb. 2.2-1 Das Atmungssystem. Von der Lunge kommend trifft die Atemluft am Ende der Luftröhre auf den Kehlkopf (sp. laringe; Adj. laryngal). Der Kehlkopf ist ein komplexes Ventil, das primär zum 7 Die Darstellung in diesem Abschnitt folgt in groben Zügen Pompino-Marschall (2009: 17ff.). " ! #$" % " ('( 0 1 22 Verschließen der unteren Atemwege gegenüber dem Eindringen von Nahrung oder sonstigen Fremdstoffen dient. In der lautsprachlichen Kommunikation besteht seine Funktion in der kontrollierten Stimmtonerzeugung oder Phonation: Im Kehlkopf befinden sich, an beweglichen Knorpeln befestigt, die sog. Stimmlippen (sp. cuerdas vocales), die einen von komplettem Verschluss bis zu weiter Öffnung regulierbaren Spalt, die Stimmritze oder Glottis (sp. glotis; Adj. glottal), umschließen. Abb. 2.2-2 Der Kehlkopf. Links: Spiegelbild, rechts: Querschnitt oberhalb der Stimmlippen (schematisch) (aus Fiukowski 2010: 36). a) b) Abb. 2.2-3 a) Glottis mit Stimmlippen (nach Schwegler et al. 2010: 136), b) Momentaufnahmen der Glottis während der Phonation (http: / / www.fb10.uni-bremen.de/ khwagner/ phonetik/ kapitel4.aspx), c) schematische Darstellung eines Phonationszyklus (http: / / www.reading.ac.uk/ AcaDepts/ ll/ speechlab/ multichannel/ lx/ vocal-fold-sequence.gif). Durch die Kehlkopfmuskulatur wird die Glottis an die Erfordernisse von Atmung und Stimmbildung angepasst. So sind die Stimmlippen bei der Ruheatmung weit geöffnet, und die Atemluft kann ungehindert passieren. Zur Stimmbildung dagegen wird die Glottis geschlossen und durch den subglottalen Druck so auseinandergepresst, dass die Stimmlippen durch die entweichende Luft in Schwingungen versetzt werden. Sie vollführen rasche Öffnungs- und Schließbewegungen, die den kontinuierlichen Luftstrom in eine Folge kleiner Luftstöße zerteilen (vgl. Abb. 2.2-3c). Das daraus resultierende Rohschallsignal ist ein Klanggemisch, das unterschiedlich ausfällt, je nachdem, Zungenwurzel Kehldeckelknorpel Taschenfalten Schildknorpel (Lippenritze) Stimmlippen Stimmritze Ringknorpel (Knorpelritze) Stimmfortsätze der Stellknorpel Luftröhre Stellknorpel c) Stimmlippen 23 wie lang die Stimmlippen sind, 8 wie stark sie gespannt werden, 9 wie stark der subglottale Druck ist 10 etc. Das Vibrieren der Stimmlippen ist Voraussetzung für alle stimmhaften Laute (Vokale und stimmhafte Konsonanten). Bei der Artikulation stimmloser Konsonanten schwingen die Stimmlippen nicht. Durch die Sprengung des Glottisverschlusses kann ein Geräusch erzeugt werden, wie es in verstärkter Form beim Husten auftritt. Die ‘Normalform’, der sog. Glottisschlag oder Knacklaut (sp. oclusión glotal) [], ist als Sprachlaut verbreitet, so etwa im Deutschen, wo er für gewöhnlich jedes vokalisch anlautende Wort einleitet (z.B. dt. [ ab nt] Abend). Ein Hauchlaut (sp. sonido aspirado) [h] entsteht, wenn sich die ausströmende Luft an den nicht völlig geöffneten Stimmlippen reibt. Wird während der Phonation zu viel Luft durch die Glottis gelassen, so klingt die Stimme insgesamt behaucht. 11 Als Aspiration (sp. aspiración) wird die behauchte Produktion bestimmter Lautphasen durch eine (noch) nicht schwingende teilgeöffnete Glottis bezeichnet (wie z.B. bei den Plosiven in dt. [t h a l] Tal, [p h as] Pass, [k h am] Kamm, vgl. 2.5.1.1). Glottisschlag und Behauchung von Plosiven sind im Spanischen nicht vertreten; ihre Vermeidung muss von deutschen Muttersprachlern bewusst erlernt werden. Eine besondere Stimmlippenstellung ermöglicht schließlich das Flüstern, bei dem die Stimmlippen geschlossen sind und die Luft nur durch das sog. Flüsterdreieck der Stellknorpel entweichen kann: Flüstern ist immer stimmlos. Abb. 2.2-4 Stellungen der Stimmlippen (Formen der Stimmritze) a Vitalatmungs- oder Ruhestellung, b weite Atemstellung, c Hauchstellung, d Stimmstellung, e Vollverschlussstellung, f Flüsterstellung (aus Fiukowski 2010: 37). Die eigentliche Artikulation geschieht supraglottal (also oberhalb der Glottis) im sog. Ansatzrohr (sp. tracto vocal), das vom Kehlkopf bis zu den Lippen reicht und Rachenraum (sp. faringe; Adj. pharyngal), Mundraum (sp. cavidad bucal; Adj. oral) und Nasenraum (sp. cavidad nasal; Adj. nasal) umfasst. Hier wird der vom Kehlkopf kommende Rohschall durch den Einsatz der verschiedenen Sprechwerkzeuge oder Artikulatoren moduliert und modifiziert (vgl. Abb. 2.2-5). 12 8 Männer haben in der Regel längere Stimmlippen als Frauen (17-24 mm gegenüber 13- 17 mm), weshalb ihre Stimmen tiefer klingen. 9 Durch unterschiedlich starke Spannung der Stimmlippen lässt sich die Höhe der Stimme innerhalb einer bestimmten Spannbreite steuern. Das wird zum Singen genutzt, ermöglicht aber auch beim Sprechen einen unterschiedlichen Tonhöhenverlauf. 10 Je stärker der subglottale Druck ist, desto lauter erscheint die Stimme. 11 Eine mit behauchter Stimme gesprochene Äußerung ist auf der folgenden Internetseite anzuhören: http: / / www.ims.uni-stuttgart.de/ phonetik/ EGG/ breathy.wav. 12 Auch durch die Position des Kehlkopfes, der auf und ab bewegt werden kann, wird die Länge des Ansatzrohres ständig verändert. a b c d e f " ! #$" % " ('( 0 1 24 2.2.2 Artikulatoren und Artikulationsstellen Als Artikulatoren werden die beweglichen Teile des Ansatzrohres bezeichnet, durch die dessen Form verändert wird, sodass an verschiedenen (Artikulations-)Stellen Enge- oder Verschlussbildungen erfolgen können. Zu den Artikulatoren zählen: • Das Velum, auch Gaumensegel (sp. velo de paladar) oder weicher Gaumen (sp. paladar blando) genannt, schließt sich als dünner Lappen hinten an den harten Gaumen an. In normaler Sprechstellung ist es angehoben und verschließt so den Nasenraum gegenüber dem Mundraum. Nur zur Bildung von nasalen (oder nasalisierten) Lauten wird es abgesenkt, sodass der aus dem Kehlkopf kommende Luftstrom (auch) durch die Nasenhöhle entweichen kann, z.B. [n], [m], [a]. Abb. 2.2-5 Die Sprechwerkzeuge: Sagittalschnitt durch Kehlkopf und Ansatzrohr. • Die Uvula (oder Zäpfchen, sp. úvula) hängt als muskulöser Fortsatz am Velum und dient als artikulierendes Organ zur Bildung uvularer Laute, z.B. [-]. • Die Zunge (lat. lingua, sp. lengua), die im Wesentlichen aus hoch beweglichem Muskelgewebe besteht, ermöglicht als wichtigster Artikulator durch zahlreiche unterschiedliche Positionen eine vielfältige Gestaltung des Mundraums. Ihre obere Fläche wird zu Beschreibungszwecken von vorn nach hinten unterteilt in Zungenspitze (lat. apex > Adj. apikal, sp. ápice), Zungenblatt (lat. lamina > Adj. laminal, sp. lámina), Zungenrücken (lat. dorsum > Adj. dorsal, sp. dorso) und Zungenwurzel (lat. radix). Zungenspitze und -blatt werden oft als Zungenkranz oder -saum (lat. corona > Adj. koronal, sp. corona) zusammengefasst. > nasal supraglottal subglottal weiches Gewebe hartes Gewebe beweglicher Unterkiefer Luftröhre Luftstrom aus der Lunge Speiseröhre Kehldeckel Epiglottis Rachenhöhle Pharynx > pharyngal Zäpfchen Uvula > uvular weicher Gaumen Velum > velar harter Gaumen Palatum > palatal Nasenhöhle Zahndamm Alveolen alveolar < Lippen Labia labial < Zähne Dentes dental < Kehlkopf Larynx > laryngal Stimmritze Glottis > glottal Zungenspitze Apex > apikal Zungenrücken Dorsum > dorsal 25 • Auch durch die Hebung und Senkung des Unterkiefers (lat. mandibula, sp. mandíbula) wird das Ansatzrohr in seiner Größe verändert. • Die Lippen (lat. labia > Adj. labial, sp. labios) schließlich dienen sowohl zur Verlängerung bzw. Verkürzung des Ansatzrohres als auch zur Bildung von Hindernissen für den Luftstrom. Als Artikulationsstellen werden die eher fixen Strukturen des Ansatzrohres bezeichnet: • Außer als Artikulator für nasale Laute dient das Velum auch als Artikulationsstelle, an der mittels Zunge als Artikulator velare Laute gebildet werden, z.B. [k]. • Am Palatum, dem harten Gaumen (lat. palatum > Adj. palatal, sp. paladar duro), der sich vor dem Velum wölbt, werden - wiederum mit Hilfe der Zunge - palatale Laute gebildet, z.B. [ç]. • Die Alveolen (oder Zahndamm > Adj. alveolar, sp. alvéolos) befinden sich am Übergang vom harten Gaumen zu den oberen Schneidezähnen. An ihnen entstehen - ebenfalls mit der Zunge als Artikulator - alveolare Laute, z.B. [d]. • Die oberen Schneidezähne (lat. dentes > Adj. dental, sp. dientes) können sowohl in Kontakt mit der Zunge als auch mit der Unterlippe als Artikulationsstelle fungieren. Die so gebildeten dentalen Laute lassen sich als (inter-)dentale und labiodentale weiter beschreiben, z.B. [], [f]. • Im Zusammenspiel der Oberlippe mit der Unterlippe entstehen (bi-)labiale Laute, z.B. [p]. Unter http: / / www.uiowa.edu/ %7Eacadtech/ phonetics/ anatomy.htm kann die Anatomie der Artikulation in einem interaktiven Diagramm nachvollzogen werden. 2.2.3 Artikulationsmodi: Vokale, Konsonanten, Approximanten Als Artikulationsmodus wird die Art und Weise der Schallproduktion bzw. -modifikation im Ansatzrohr bezeichnet. Die Namen der einzelnen Modi dienen zugleich als Oberbegriff zur Zusammenfassung der in ihnen produzierten Laute. 2.2.3.1 Vokalische Artikulationsmodi Bei der Phonation versetzt der von den Lungen kommende Luftstrom die Stimmlippen in Schwingungen und wird dabei zu komplexen Druckwellen umgestaltet. Können diese nach Verlassen des Kehlkopfes den Rachen- und Mundraum ohne weitere Behinderung passieren, so erscheinen die entsprechenden Schallereignisse als Vokale (sp. vocales). Diese erhalten ihre spezifische Klangfärbung allein durch die jeweilige Konfiguration des Ansatzrohres, das als Resonanzraum dient. Entscheidend sind hier die folgenden Parameter: • Hebung der Zunge bzw. Grad der Kieferöffnung (vertikal): hoch, mittel, tief bzw. geschlossen, halb geschlossen, halb offen, offen. [i] ist ein hoher (oder geschlossener), [a] ein tiefer (oder offener) Vokal. • Lage der Zunge bzw. des höchsten Zungenpunktes (horizontal): vorn (bzw. palatal), zentral, hinten (bzw. velar). [i] ist ein vorderer, [ ] (wie in dt. [ bıt ] bitte) ein zentraler, [u] ein hinterer Vokal. " ! #$" % " ('( 0 1 26 • Stellung der Lippen: gerundet (bzw. vorgestülpt) vs. ungerundet (bzw. gespreizt). [u] ist ein gerundeter, [i] ein ungerundeter Vokal. • Stellung des Velums: Wird durch die Senkung des Velums auch die Nasenhöhle als Resonanzraum miteinbezogen, so entstehen nasalisierte oder Nasalvokale, bei gehobenem Velum und damit Verschluss des Nasenraums Oralvokale. [] (wie in fr. [m] main ‘Hand’) ist ein Nasal-, [] (wie in fr. [m] mais ‘aber’) ein Oralvokal. • Grad der Muskelspannung: Vokale können mit mehr oder weniger Muskelspannung artikuliert werden und gelten entsprechend als gespannt gegenüber ungespannt. [i] (wie in dt. [ bi t ] biete) ist ein gespannter, [ı] (wie in dt. [ bıt ] bitte) ein ungespannter Vokal. • Dauer bzw. Quantität: lang vs. kurz. [a ] (wie in dt. [ a t ] Rate) ist ein langer, [a] (wie in dt. [ at ] Ratte) ein kurzer Vokal. Abb. 2.2-6 Parameter der Vokalartikulation. Gehen zwei Vokalstellungen in einer Silbe artikulatorisch unmittelbar ineinander über, so wird der betreffende Laut als Diphthong (sp. diptongo) bezeichnet, z.B. [ai ]. 2.2.3.2 Konsonantische Artikulationsmodi Kommt es im Ansatzrohr zu irgendwie gearteten Behinderungen des Luftstroms, so ist der Artikulationsmodus konsonantisch, es werden also Konsonanten (sp. consonantes) produziert. Innerhalb der Konsonanten werden die folgenden Artikulationsmodi unterschieden: • Verschluss zwischen Artikulator und Artikulationsstelle: Durch einen bei der Artikulation zu sprengenden Verschluss entstehen Verschlussbzw. Sprenglaute oder Plosive (sp. oclusivas), z.B. [k]. • Engpass zwischen Artikulator und Artikulationsstelle: Muss der Luftstrom auf seinem Weg durch Rachen- und Mundraum einen Engpass durchlaufen, so entsteht beim Passieren dieser Stelle ein Reibegeräusch, wie es für Reibelaute oder Frikative (sp. fricativas) charakteristisch ist, z.B. [f]. • Abfolge von Verschluss und Engpass: Geht ein Verschluss unmittelbar in einen Engpass über, sodass Plosiv und Frikativ zeitlich eng miteinander koordiniert sind, entstehen sog. Affrikaten (sp. africadas), z.B. [¢] • Verschluss im Mundraum bei Zuschaltung des Nasenraums: Wird der Durchgang zum Nasenraum durch Senken des Velums freigegeben, sodass der Ver- Mundraum Nasenraum Rachenraum (Pharynx) Stimmlippen, Stimmritze (Glottis) Unterkiefer Gaumen Lippen Zunge Velum Supraglottales System Subglottales System \} X £¤'} 27 schluss im Mundraum nicht wie bei den Plosiven gesprengt werden muss, sondern die Luft durch die Nase entweichen kann, bezeichnen wir die entsprechenden Laute als Nasale (sp. nasales), z.B. [n]. 13 • Wechsel zwischen Verschluss und Öffnung: Ein rascher Wechsel zwischen Verschluss und Öffnung ist charakteristisch für Vibranten (sp. vibrantes), zu denen vor allem r-Laute gehören. 14 Ein Vibrant entsteht bspw., wenn die Zungenspitze gegen die Alveolen oder die Uvula gegen die Hinterzunge vibriert: [r] bzw. [-]. • Gleichzeitigkeit von Verschluss und Öffnung (im Mundraum): Wird mit der Zunge mittig an den Alveolen oder am harten Gaumen ein Verschluss gebildet, sodass die Luft an der Seite vorbeiströmen kann, entstehen Laterale (sp. laterales), z.B. [l]. 15 Innerhalb der Konsonanten lassen sich weitere Gruppierungen vornehmen: • Frikative, Plosive und Affrikaten bilden gemeinsam die Klasse der echten Konsonanten oder Obstruenten (sp. obstruyentes), denn bei ihrer Artikulation muss ein tatsächliches Hindernis, eine Obstruktion, beseitigt werden. Sie zeichnen sich auch dadurch aus, dass sie entweder stimmlos (sp. sordo), d.h. ohne Beteiligung der Stimmlippen, oder stimmhaft (sp. sonoro), also mit vibrierenden Stimmlippen artikuliert werden können, z.B. [p] vs. [b]. • Alle anderen Sprachlaute gehören zur Klasse der Sonoranten (sp. sonorantes, resonantes), denn die Unterscheidung zwischen stimmlos und stimmhaft ist für sie nicht relevant. Sie zeichnen sich vielmehr durch sog. spontane Stimmhaftigkeit aus, da bei ihrer Artikulation die Stimmlippen immer vibrieren. • Da Laterale und Vibranten oft ein ähnliches Verhalten aufweisen, werden sie zur Gruppe der Liquide (‘Fließlaute’, sp. líquidas) zusammengefasst. 2.2.3.3 Approximanten An der Schwelle zwischen Konsonanten und Vokalen stehen die Approximanten, die auch als Halbkonsonanten, Halbvokale oder Gleitlaute bezeichnet werden (engl. glides, sp. aproximantes, semiconsonantes, semivocales, deslizadas). Sie nehmen eine Zwischenposition zwischen vokalischem und frikativischem Modus ein: Die Zunge wird weiter angehoben als für den entsprechenden Vokal, doch diese Engebildung erfolgt ohne die für Frikative typische Geräuschbildung, z.B. [j]. 2.2.4 Koartikulation Wenn wir im Vorangegangenen dargestellt haben, wie Sprachlaute an diversen Artikulationsstellen und in unterschiedlichen Artikulationsmodi produziert werden, so darf daraus nicht geschlossen werden, dass die beschriebenen Produktionsphasen beim Sprechen eine nach der anderen und unabhängig voneinander ablaufen würden. 13 Da bei der Artikulation von Nasalen oral ein Verschluss gebildet wird, werden Nasale mit Plosiven und Affrikaten auch zur Klasse der Verschlusslaute gerechnet. 14 Da r-Laute nicht alle durch einen raschen Wechsel zwischen Verschluss und Öffnung charakterisiert sind, sie aber dennoch ähnliches Verhalten aufweisen, werden sie nach dem griechischen r-Buchstaben < > Rho auch als rhotische Laute (engl. rhotics, sp. róticos) bezeichnet. 15 Da der Luftstrom bei den Lateralen den Mundraum weitgehend ungehindert passieren kann, werden sie auch (als Lateralapproximanten) den Approximanten (s. 2.2.3.3) zugeschlagen. " ! #$" % " ('( 0 1 28 Wie eingangs bereits angemerkt (vgl. 1.3 und 2.1), werden Laute keineswegs einzeln aneinandergereiht. Lautliche Äußerungen sind vielmehr kontinuierlich; die Phone, die wir für unsere Analysen aus dem Lautstrom isolieren, sind keine diskreten Lautereignisse, sondern nachträglich ausgegrenzte Momente eines fortwährenden Bewegungsablaufs, in dem es keine konstanten Abschnitte gibt. Die Bewegungen unserer Sprechwerkzeuge sind bei der Produktion der einzelnen Lautphasen so eng miteinander koordiniert, dass diese sich gegenseitig überlappen bzw. unmittelbar ineinander übergehen. In der Phonetik wird dies als Koartikulation (sp. coarticulación) bezeichnet, letzteres auch als Steuerung (Pompino-Marschall 2009: 237ff.). Unter Koartikulation versteht man die gegenseitige Beeinflussung lautlicher Segmente, wie sie durch die gleichzeitige Ausführung von Artikulationsbewegungen für benachbarte Sprachlaute verursacht wird. Verzahnung und Überlappung artikulatorischer Gesten lassen sich leicht an der Aussprache des deutschen Worts [l¥k] Glück (im Vergleich etwa zu [ast] Gast) nachvollziehen: • Die für [], [l] und [k] irrelevante Lippenrundung des Vokals [¥] ist schon während des []-Verschlusses präsent und wird bis zum Ende des Wortes beibehalten. • Die Öffnung des velaren Verschlusses [] erfolgt in den bereits vorher gebildeten Lateral [l]. • Aus der für [¥] typischen hohen Vorderlage bewegt sich der Zungenrücken kontinuierlich in Richtung des velaren Verschlusses [k]. • [k] ‘steuert’ [¥]: der Verschluss löst den Vokal in seiner kritischen Position ab. Durch Koartikulation können Artikulationsgesten also antizipatorisch vorweggenommen werden (‘regressive Koartikulation’) und/ oder persistent über das eigentliche Ziel hinaus erhalten bleiben (‘progressive Koartikulation’). Koartikulationseffekte werden nicht nur durch die lautliche Umgebung bedingt, sondern sie hängen auch von der jeweiligen Sprache, der Kommunikationssituation, der Sprechgeschwindigkeit und vom einzelnen Sprecher ab. In der Sprachentwicklung führen sie immer wieder zu Assimilationen, d.h. zur Angleichung zwischen benachbarten Segmenten. 16 2.3 Akustische Phonetik Die akustische Phonetik untersucht die physikalischen Vorgänge bei der Produktion und Übertragung von Sprachschall. In diesem Unterkapitel werden wir uns mit einigen Aspekten der akustischen Phonetik befassen. Dazu fragen wir, was Schallwellen sind und welche Typen akustischer (Sprach-)Signale wir unterscheiden (2.3.1). Wir beschäftigen uns mit grundlegenden akustischen Analysen und untersuchen in diesem Zusammenhang, wie Schallwellen digitalisiert werden (2.3.2). Im Rahmen einer kleinen Einführung in die Benutzung 16 Vgl. zur Koartikulation Fowler & Saltzman (1993), die Arbeiten in Hardcastle & Hewlett (1999) sowie http: / / www.sk.uni-bonn.de/ lehre/ informationen-materialien/ informationen-undmaterialien-kopho/ materialien-1/ hess/ artikulatorische-und-akustische-phonetik/ aap_3f.pdf. 29 der Sprachanalysesoftware Praat (Boersma & Weenink 2012) erproben wir schließlich, wie wir Oszillogramme und Sonagramme selbst erstellen und auswerten können (2.3.3). 17 2.3.1 Sprachschall Schall ist die auditive Wahrnehmung minimaler Luftdruckschwankungen, die sich wellenförmig im Raum ausbreiten. Solche Schallwellen entstehen, wenn elastische Körper in Schwingungen versetzt werden: die dadurch angeregten Luftmoleküle bewegen sich den Schwingungen entsprechend hin und her, wobei sie benachbarte Luftmoleküle ebenfalls in Bewegung versetzen, sodass der Schalldruck sich ausbreitet - vergleichbar den Wellenbewegungen, die von einer Reihe schunkelnder Menschen ausgelöst werden. Im Fall lautsprachlicher Äußerungen entstehen die Schallwellen durch die Schwingungen der Stimmlippen und des Ansatzrohrs. 2.3.1.1 Parameter der Schallanalyse Um Schall zu untersuchen, muss man ihn mit geeigneten technischen Einrichtungen messen. Das kann bspw. ein Mikrofon sein, das Luftdruckschwankungen in elektrische Signale umwandelt. Bei einem Mikrofon spannt sich eine flexible Membran über einem quasi luftdicht abgeschlossenen Raum (vgl. Abb. 2.3-1a). Entsprechend den eintreffenden Schallwellen verbiegt sich diese Membran, und zwar bei höherem Druck in den abgeschlossenen Raum hinein (b), bei niedrigerem Druck nach außen (c). Befestigt man an der Mitte der Membran einen Stift (d) und lässt ein Papierband gleichmäßig schnell an diesem Stift vorbeilaufen, so werden die Schwingungen auf dem Papier abgebildet (e). Auf diese Weise erhalten wir eine vertikale Darstellung des Schalldrucks gegen die Zeit; das akustische Ereignis wird sichtbar gemacht. Ein solches Bild eines Schwingungsvorgangs nennen wir Oszillogramm (sp. oscilograma). Ein wichtiger Parameter zur Analyse von Sprachschall ist die Häufigkeit der Schwingungen auf der Zeitachse, also die Häufigkeit der Verdichtung und Verdünnung der Luft. Sie bezeichnet man als Frequenz (sp. frecuencia). Die Frequenz wird in Hertz (Hz) gemessen; das Maß gibt die Zahl der Schwingungszyklen pro Sekunde an. Je schneller ein Körper schwingt, desto höher ist die Frequenz des Tones, und er wird auch als höher wahrgenommen; je langsamer die Schwingungen, desto niedriger die Frequenz und desto tiefer erscheint der Ton. Die für das menschliche Ohr wahrnehmbaren Frequenzen liegen zwischen 20 und 20.000 Hz (=20 kHz). Sie bilden das hörbare Frequenzband. Abb. 2.3-1 Messen und Aufzeichnen von Schallwellen mithilfe eines Mikrofons (aus Reetz 2003: 11). 17 Dieses Teilkapitel folgt über weite Strecken den Ausführungen in Reetz (2003: 3ff.) und Mayer (2010: 73ff.), die hier allerdings für unsere Zwecke stark vereinfacht werden. a b c d e ! " % " ('* 0 1 30 Die Intensität (sp. intensidad) eines Tons wird durch die Weite der Schwingung, durch ihre Amplitude, bestimmt. Bei einer großen Amplitude hören wir einen intensiven, lauten Ton, bei einer kleinen Amplitude einen schwachen, leisen Ton. Gemessen wird die Intensität in Dezibel (dB). Im mittleren Frequenzbereich (ca. 500- 5000 Hz) beträgt der Abstand von der Hörschwelle bis zur Schmerzgrenze ca. 130 dB. 2.3.1.2 Grundschallformen Die einfachste Schallform ist der reine (Sinus-)Ton, eine mit einer Pendelbewegung vergleichbare, einfache periodische Schwingung (Abb. 2.3-2). Periodische Schwingungen zeichnen sich durch ihren regelmäßigen Verlauf aus, d.h. sie wiederholen sich kontinuierlich mit exakt derselben Dauer. In der Praxis nimmt die Energie jedoch durch Faktoren wie Reibung und Luftwiderstand ab, sodass die Amplitude mit der Zeit kleiner wird. Abb. 2.3-2 Einfache Sinusschwingung auf der Zeitachse (nach Reetz 2003: 13). Reine Töne begegnen uns allerdings nur selten. Die meisten Schallquellen - und so auch der menschliche Stimmapparat - führen keine einfachen, sondern komplexe Schwingungen verschiedener Frequenzen aus, die in Klänge und Geräusche differenziert werden. Sind die komplexen Schwingungen (quasi-)periodisch, so verschmelzen sie zu Klängen oder Klangphasen, die sich mithilfe der Fourier-Analyse 18 in arithmetisch aufgebaute Teil- oder Partialtöne zerlegen lassen. Als Grundfrequenz oder F 0 (sp. frecuencia fundamental) bezeichnen wir die Frequenz des tiefsten Partialtons, durch die die Höhe des Signals bestimmt wird (bei Männern meist zwischen 80 und 200 Hz, bei Frauen zwischen 150 und 300 Hz). Die Frequenzen aller übrigen Partial- oder Obertöne (auch: Harmonische, sp. armónicos) sind jeweils ganzzahlige Vielfache von F 0 . Abb. 2.3-3 zeigt in a) die komplexe periodische Schwingung eines Klangs, die in b), c) und d) in ihre Einzelschwingungen zerlegt ist. Die Periodendauer des 100-Hz- Signals in b) beträgt mit 10 ms ein ganzzahliges Vielfaches des 200-Hz-Signals (5 ms) in c) und des 300-Hz-Signals (3,3¦ ms) in d). Das Summensignal a) hat die Periodendauer des kleinsten gemeinsamen Vielfachen von 3,3¦ ms, 5 ms und 10 ms, also 10 ms. Die Grundfrequenz F 0 des Klangs in a) beträgt folglich 100 Hz. Auch wenn unsere Stimmlippen schwingen, entstehen derartige Klangphasen. Da ihre Perioden sich nur in annähernd gleicher Form wiederholen, sprechen wir von quasi-periodischen Schwingungen (sp. vibraciones casi-periódicas). Sie sind kennzeichnend für die Artikulation von Vokalen, Approximanten und Nasalen. Abb. 2.3-4 zeigt die komplexen Schwingungen der Lautfolge [ma] (in [ masa]). Außer quasi-periodischen Klangphasen werden beim Sprechen Geräuschphasen produziert, die durch aperiodische Schwingungen (sp. vibraciones aperiódicas) gekennzeichnet sind; hier lassen sich keine arithmetischen Relationen zwischen den 18 Benannt nach dem französischen Mathematiker Joseph Fourier (1768-1830). 31 einzelnen Schwingungsbestandteilen ausmachen. Zu den Geräuschphasen gehört das Friktionsrauschen, das immer dann entsteht, wenn die Luft, wie bei Frikativen, durch eine Engebildung strömt. Abb. 2.3-5 zeigt das Oszillogramm einer solchen Geräuschphase (Frikativ [s] in [ masa]). Abb. 2.3-3 Summe a) eines b) 100-Hz-, c) 200-Hz- und d) 300-Hz-Sinussignals (nach Clark et al. 2007: 214). [ m a ] Abb. 2.3-4 Oszillogramm der Lautfolge [ma] (in [ masa]). Abb. 2.3-5 Oszillogramm des Frikativs [s] (in [ masa]). Zu den übrigen Grundschallformen, die sich im Sprachsignal unterscheiden lassen, gehört der Explosionsschall (auch Transiente oder Knall, sp. explosión), der bei der Sprengung eines oralen oder glottalen Verschlusses (also bei der Artikulation von ! " % " ('* 0 1 32 Plosiven) entsteht; ihm folgt unmittelbar nach der Verschlusslösung ein kurzes Friktionsrauschen. Während der Verschlussphase sind Plosive dagegen durch “stummen Schall” charakterisiert. Eine Kombination von Klang und Friktionsrauschen ergibt sich bei stimmhaften Frikativen, da hier die Stimmlippen zugleich vibrieren (vgl. Abb. 2.3-6, Mayer 2010: 79, Reetz 2003: 64). [ v a t ] Abb. 2.3-6 Oszillogramm der Lautfolge [ vat ] (aus dt. Krawatte). 2.3.1.3 Spektren Wir können jetzt verschiedene Schallformen nicht nur artikulatorisch (und perzeptiv), sondern mithilfe der oszillographischen Aufzeichnungen auch anhand akustischer Eigenschaften voneinander unterscheiden. Für andere Analysen sind Oszillogramme allerdings weniger geeignet. So können wir uns die akustischen Unterschiede zwischen verschiedenen Vokalen besser vergegenwärtigen, wenn wir die Schallwellen spektral auflösen. Wir haben oben schon gesehen, dass sich komplexe periodische Klänge mithilfe der Fourier-Analyse in einzelne Sinuskomponenten oder Harmonische zerlegen lassen (Abb. 2.3-3). Für die Darstellung in einem sog. (Linien-)Spektrum werden die in der Fourier-Analyse ermittelten Frequenzwerte der einzelnen Harmonischen durch Linien auf der horizontalen x-Achse abgetragen, die Amplitudenwerte sind auf der vertikalen y-Achse angezeigt. Abb. 2.3-7 zeigt das Linienspektrum der komplexen periodischen Schwingung aus Abb. 2.3-3. Wir wissen bereits, dass bei der Phonation durch das Vibrieren der Stimmlippen quasi-periodische Luftdruckschwankungen entstehen. Der Hohlraum zwischen Glottis und Lippen, das sog. Ansatzrohr, wirkt nun als akustisches Filter, durch das die meisten Frequenzen des Quell- oder Rohschallsignals gedämpft, bestimmte Frequenzbereiche jedoch selektiv verstärkt werden. Dies sind die sog. Eigen- oder Resonanzfrequenzen des Ansatzrohrs. Wo sie genau liegen, hängt von seiner Gestaltung ab: Wie in 2.2.3 behandelt, verändern wir durch die Bewegung von Zunge, Kiefer, Lippen 33 etc. die Konstellationen von Mund- und Rachenraum laufend, und entsprechend variiert auch die Filterwirkung dieser Räume, sodass jeweils andere Frequenzbereiche verstärkt werden. Diese variablen Resonanz- oder Eigenfrequenzen des Vokaltrakts heißen Formanten. Sie geben der Stimme ihr Timbre oder ihre Klangfarbe. Die Position der Formanten, die im Linienspektrum durch (Energie-)Gipfel in der Amplitude, die sog. Maxima, gekennzeichnet ist, liefert das entscheidende Kriterium zur akustischen Differenzierung von Vokalen. Außer Vokalen weisen auch Nasale und Liquide eine charakteristische Formantstruktur auf. In Abb. 2.3-8 sind diese Zusammenhänge im Rahmen des auf Fant (1960) zurückgehenden Quelle-Filter-Modells dargestellt. Mit den Formanten werden wir uns in Abschnitt 2.3.2 genauer befassen. Abb. 2.3-7 Linienspektrum des Klangs a) aus Abb. 2.3-3 (nach Clark et al. 2007: 225). Abb. 2.3-8 Schematische Darstellung der Veränderungen im Spektrum durch die Filterwirkung des Ansatzrohrs (aus Mayer 2010: 84). Auch aperiodische Schwingungen lassen sich spektral auflösen. Sie bilden jedoch keine Linien-, sondern kontinuierliche (Geräusch-)Spektren, denn ihre Frequenzkomponenten liegen unendlich dicht beieinander und können daher nicht als einzelne Linien dargestellt werden. Abb. 2.3-9 zeigt (nach Mayer 2010: 78) Spektren der Frikative [$] und [s]. Wie zu erkennen ist, sind bei [$] die Frequenzen zwischen 2 kHz und 4 kHz (hier grau unterlegt) stärker vertreten, denn die Amplitude ist in diesem Frequenzbereich bei [$] deutlich größer als bei [s] - ein typisches Charakteristikum, durch das sich postalveolare und alveolare Frikative voneinander unterscheiden. ! " % " ('* 0 1 34 Abb. 2.3-9 Spektraldarstellung der Frikative [$] (oben) und [s] (unten) (aus Mayer 2010: 78). 2.3.2 Grundlagen akustischer Analysen Während man für phonetische Analysen früher teure Spezialgeräte brauchte, lassen sich die meisten heute am Computer durchführen. Dazu muss das Sprachsignal jedoch zunächst einmal digitalisiert werden. 2.3.2.1 Zur Digitalisierung von Sprachsignalen Der simple Schwingungsschreiber, den wir in Abb. 2.3-1e kennengelernt haben, zeichnet die Schwingungen des Sinustons analog, also ihrem Verlauf gemäß, auf. Computer, wie sie heute für akustische Analysen verwendet werden, können allerdings nur endlich viele diskrete Zustände darstellen. Daher muss das analoge, kontinuierliche Signal, wie es vom menschlichen Sprechapparat erzeugt wird, in abzählbare digitale Werte überführt werden. Luftdruckwerte werden also zu diskreten Zeitpunkten in diskrete Zahlenwerte übersetzt. Dabei stellt sich die Frage, wie häufig das Signal gemessen oder abgetastet werden sollte, also welche Mess- oder Abtastrate (engl. sampling rate) sinnvollerweise benutzt wird. 19 Soll das Signal möglichst detailgetreu repräsentiert werden, so empfiehlt sich eine hohe Abtastrate, die jedoch viel Speicherplatz benötigt. Als Faustregel gilt, dass die Abtastrate mindestens etwas 19 Eine vergleichbare Frage stellt sich bei der Darstellung der Zeit durch digitale gegenüber analogen Uhren: Während eine analoge Uhr den Zeitverlauf kontinuierlich nachbildet, kann eine digitale Uhr immer nur diskrete, d.h. einzelne, nicht zusammenhängende Zeitschritte angeben, gleich ob sie die Zeit in Stunden, Minuten, Sekunden, Millisekunden oder noch genauer misst. 90 80 70 60 50 40 30 20 10 0 90 80 70 60 50 40 30 20 10 0 0 2000 4000 6000 0 2000 4000 6000 35 mehr als das Doppelte der höchsten auftretenden Frequenz betragen sollte. 20 Da das menschliche Gehör Frequenzen über 20 kHz nicht wahrnehmen kann, wird, wenn alle Frequenzkomponenten bis zur Wahrnehmungsgrenze im digitalen Signal repräsentiert sein sollen, eine Abtastrate von ca. 40 kHz gewählt. 21 Auch die Fourier-Analyse wird heute von Computerprogrammen mit digitalisierten Aufnahmen durchgeführt. 22 Während bei den Spektren, die wir bisher betrachtet haben, der Faktor Zeit ausgeklammert ist, wir also eine statische Darstellung erhalten, werden im Spektrogramm (auch Sonagramm, sp. espectrograma) mehrere Spektren aneinandergereiht und damit ein längerer Signalabschnitt in seine Frequenzbestandteile aufgelöst; wir können so beobachten, wie sich das Signal im Zeitverlauf verändert. Dabei gilt es, drei Dimensionen, nämlich Zeit, Frequenz und Amplitude, in einer zweidimensionalen Graphik unterzubringen. Die Zeit wird, wie im Oszillogramm, auf der x-Achse von links nach rechts abgetragen, während die Frequenzwerte auf der y-Achse von unten nach oben ‘hochgestapelt’ werden. Die Amplitudenwerte schließlich sind durch Graustufen repräsentiert: je höher die Amplitude, desto dunkler (bis zu tiefem Schwarz) erscheint der entsprechende Grauton; je geringer die Amplitude, desto heller ist er. Zwischen der Frequenzauflösung und der zeitlichen Auflösung besteht im Spektrogramm ein gegenseitiges Abhängigkeitsverhältnis. Je kürzer die Signalabschnitte, die der spektralen Analyse unterzogen werden, desto feiner wird die zeitliche Auflösung, und die artikulatorische Dynamik im Signal wird sichtbar. Die Frequenzauflösung ist in einem solchen Breitbandspektrogramm jedoch gröber, da dem Umwandlungsalgorithmus in den kurzen Abschnitten weniger Analysepunkte zur Verfügung stehen. Wählt man dagegen größere Signalabschnitte für die spektrale Analyse, so gibt es zwar genug Informationen, um die Frequenzen fein aufzulösen, doch die dynamischen Aspekte gehen im sog. Schmalbandspektrogramm verloren: die zeitliche Auflösung wird ungenau. 2.3.2.2 Zur Auswertung von Spektrogrammen Abb. 2.3-10 zeigt in a) ein Breitbandspektrogramm der Frage ¿Tiene mandarinas? Die Transkriptionszeichen sind den entsprechenden Signalabschnitten näherungsweise zugeordnet. Bei der Segmentierung wird deutlich, dass beim Sprechen nicht einzelne, unveränderliche Laute aneinandergereiht werden, sondern dass diese aufgrund der Koartikulation (vgl. 2.2.4) ineinander übergehen und sich kontinuierlich verändern, sodass eine exakte Abgrenzung oft nicht möglich ist. 20 Wie die Häufigkeit der Schwingungen berechnet sich auch die Abtastrate (als Anzahl sich wiederholender Vorgänge, d.h. Messpunkte bzw. Abtastintervalle) in der Einheit Hertz. Diese steht hier also für die Anzahl der Abtastintervalle pro Sekunde. 21 Die sampling rate für CDs beträgt bspw. 44,1 kHz. Da die für die akustischen Eigenschaften von Sprachlauten relevante Bandbreite etwa von 50 Hz bis 10 kHz reicht, ist für phonetische Analysen eine Abtastrate von 22 kHz empfehlenswert. Für das Telefon, das nur Frequenzen bis 4 kHz überträgt, begnügt man sich mit einer Abtastrate von 8 kHz. Aus der Beschränkung auf diesen Frequenzbereich resultiert die schlechtere Qualität der Telefonsignale. 22 Genauer gesagt handelt es sich um die Fast Fourier Transformation (FFT), einen Algorithmus, der die Fourier-Analyse diskreter Signale besonders effizient implementiert (Mayer 2010: 91). ! " % " ('* 0 1 36 0 Zeit (in Sekunden) 1,019 Abb. 2.3-10 a) Breitbandspektrogramm, b) Schmalbandspektrogramm und c) Schmalbandspektrogramm im Bereich 50-300 Hz der Frage ¿Tiene mandarinas? Die Fenstergröße (engl. window length), also die Länge des jeweils analysierten Signalstücks, beträgt beim Breitbandspektrogramm in Abb. 2.3-10a 5 ms (bei einer Abtastrate von 48 kHz). Die zeitliche Auflösung ist hier sehr fein, sodass in den stimmhaften Abschnitten jede Schließung der Stimmlippen eine senkrechte Linie erzeugt. 23 Die harmonischen Strukturen dagegen verschmelzen, und es werden nur größere Energiekonzentrationen sichtbar. Dies sind - wiederum in den stimmhaften Abschnitten - die durch die verstärkten Resonanzfrequenzen bedingten Formanten, die als Bereiche stärkster Schwärzung gut zu erkennen sind. Jeder Sonorant hat mehrere solcher Formanten, die, mit der niedrigsten Frequenz beginnend, als F 1 , F 2 usw. durchnummeriert werden. Für die Beschreibung der Qualität von Vokalen sind vor allem die beiden untersten Formanten, also F 1 und F 2 , ein Stück weit auch F 3 , wichtig. 24 Dabei korreliert F 1 negativ mit der Zungenhöhe, d.h. je höher die Zunge, desto niedriger ist der Frequenzbereich von F 1 . F 2 korreliert dagegen positiv mit der horizontalen Zungenposition von hinten nach vorn: je weiter vorn ein Vokal artikuliert wird, desto höher ist der Frequenzbereich von F 2 . So lässt sich in Abb. 2.3-10a erkennen, dass die Werte für F 1 und F 2 bei [a] näher beieinander sind als bei [e] oder [i]. Da [a] ein tiefer Vokal ist, liegt sein erster Formant höher als bei dem mittleren Vokal [e] und dem hohen Vokal [i]. In Bezug auf die horizontale Zungenposition nimmt [a] 23 Diesen Schließungen entspricht jeweils ein weiter Ausschlag im Oszillogramm (vgl. auch Abb. 2.3-13). 24 In den höheren Formanten (F 3 -F n ) liegen vor allem die klanglichen Eigenschaften der Individualstimme begründet. 300 50 [ t j e n e m a n d a i n a s ] 5000 0 5000 0 Frequenz in Hz b) c) F1 = 1. Formant F2 = 2. Formant F0 = Grundfrequenz Harmonische (Obertöne) Grundfrequenzverlauf 2. Harmonische a) voice bar Stimmlippenschließung 37 eine zentrale Position ein, deshalb ist sein zweiter Formant tiefer als der der vorderen Vokale [e] und [i]. In der Abfolge [je] in tiene lässt sich (durch zusätzliche Striche in Abb. 2.3-10a gekennzeichnet) erkennen, wie der Wert von F 1 beim Übergang vom hohen Approximanten [j] zum mittleren Vokal [e] ansteigt; der Wert von F 2 dagegen sinkt hier, weil der höchste Zungenpunkt bei [e] weniger weit vorn ist als bei [j]. Veränderungen im Verlauf der Formanten zeigen nicht nur die Dynamik beim Übergang zwischen Approximanten und Vokalen an, sondern sie sind als sog. Formanttransitionen oder -abbiegungen auch ein wichtiges Merkmal zur Identifizierung benachbarter Konsonanten. Besonders deutlich wird dies vor oder nach (stimmhaften) Plosiven. In Abb. 2.3-10a lassen sich z.B. Transitionen in den durch Rechtecke markierten Formanten des zweiten [a] in mandarinas erkennen: Während der vorangehende Plosiv [d] im Spektrogramm kaum auszumachen ist, weist F 1 zu Beginn des [a] einen Anstieg, F 2 dagegen einen Abfall der Frequenzwerte auf. Durch diese charakteristische Bewegung der Formanten ‘klingt das [d] im [a] nach’. Folgt der gleiche Vokal dagegen auf [b] oder [], so fallen die Abbiegungen aufgrund der anders gearteten Artikulationsbewegungen entsprechend anders aus; dann klingen [b] bzw. [] in diesem Vokal nach. Abb. 2.3-11 zeigt die spiegelbildlichen Formanttransitionen vor und nach stimmhaften Plosiven in Abhängigkeit vom Artikulationsort. Abb. 2.3-11 Formanttransitionen in Abhängigkeit vom Artikulationsort (aus Mayer 2010: 102). Außer dem ersten und dem letzten Konsonanten sind alle Segmente in Abb. 2.3-10 stimmhaft. Während der Verschlussphase des Plosivs am Anfang ist das Spektrogramm in a) weiß. Das auf den Explosionsschall (senkrechter Strich) folgende Friktionsrauschen weist eine unstrukturierte Schwärzung im höheren Frequenzbereich auf. In viel deutlicherer Ausprägung kennzeichnet eine solche unstrukturierte Schwärzung bei den höheren Frequenzen auch den Frikativ [s], der die Äußerung abschließt. 25 Da es sich um einen stimmlosen Konsonanten handelt, gibt es hier auch keine voice bar : so heißt der schwache horizontale graue Balken, der sich während der stimmhaften Abschnitte ganz unten im Bereich der Grundfrequenz des Sprechers abzeichnet. Abb. 2.3-10b zeigt denselben Signalabschnitt in einem Schmalbandspektrogramm. Hier ist die Fenstergröße mit 29 ms deutlich größer als im Breitbandspektrogramm, und die Stimmlippenschließungen werden nicht sichtbar. Dafür erscheinen jedoch in den stimmhaften Abschnitten die Harmonischen: ganz unten die Grundfrequenz und darüber, arithmetisch angeordnet, die weiteren Harmonischen oder Obertöne. 25 Wie in Abb. 2.3-9 zu sehen, steigt die Amplitude von [s] bis ca. 6000 Hz noch deutlich an. b d labial alveolar velar Hz 2500 1500 500 F3 F2 F1 t ! " % " ('* 0 1 38 Der Verlauf der Tonhöhe wird in Abb. 2.3-10b bei den höheren Harmonischen deutlicher als bei der Grundfrequenz, was an der Größe des betrachteten Frequenzspektrums liegt: wie im Breitbandspektrogramm umfasst es hier den Frequenzbereich von 0-5000 Hz (Skala links). Reduziert man diesen auf den für eine Männerstimme relevanten Höhenbereich, nämlich 50-300 Hz (Abb. 2.3-10c), so lässt sich der Tonhöhenverlauf, der die Sprachmelodie oder Intonation anzeigt, sehr gut erkennen. Daran können wir auch sehen, wo der Sprecher tonal markierte Akzente realisiert und welcher Stimmumfang ihm ungefähr zur Verfügung steht. In seiner Frage wird gleich eine Besonderheit des argentinischen Spanisch deutlich: Sie endet nämlich nicht mit einem Tonanstieg, wie er im europäischen Spanisch (und auch im Deutschen) zu erwarten wäre, sondern die Interrogativkontur ist fallend. Aspekte der Intonation werden in 4.5 ausführlich behandelt. 2.3.3 Akustische Analysen selbst durchführen: Eine kleine Anleitung zum Gebrauch von Praat In diesem Abschnitt werden wir anhand einer elementaren Einführung in das von Paul Boersma und David Weenink an der Universität Amsterdam entwickelte Sprachanalyseprogramm Praat 26 erkunden, wie wir selbst Oszillogramme und Spektrogramme erstellen und somit Sprachsignale phonetisch analysieren können. Während wir dafür so weit wie möglich unseren Musterdialog benutzen werden, empfiehlt es sich, die vorgestellten Analysen anhand eigener kleiner Aufnahmen jeweils selbst auszuprobieren. Unter http: / / www.praat.org lässt sich das Sprachanalyseprogramm Praat kostenlos herunterladen. Wenn Sie Praat öffnen, erscheint links das sog. Objektfenster ( Praat Objects , vgl. Abb. 2.3-12). 27 Alles, was Sie in Praat tun, tun Sie mit Objekten, die in diesem Fenster erscheinen müssen. Wenn Sie also ein Tondokument, das Sie auf Ihrer Festplatte gespeichert haben, mit Praat analysieren wollen, müssen Sie es zuerst in das Objektfenster laden. Aufnahmen, die Sie in Praat analysieren wollen, sollten im wav-Format gespeichert sein. Wenn Sie selbst eine Aufnahme erstellen wollen, klicken Sie in New > Record mono Sound. Dann öffnet sich der SoundRecorder. Wenn Sie einen leisen Rechner haben, können Sie für einfache Übungsaufnahmen das eingebaute Mikro benutzen, sonst schließen Sie eins an Ihren Rechner an. Die Sampling Frequency ist standardmäßig 26 Das komplett auf Englisch präsentierte Programm wird ständig aktualisiert und verbessert. Die hier genutzte Version ist 5.3.11 (Boersma & Weenink 2012). Eine ausführliche deutschsprachige Einführung, an der wir uns u.a. orientieren, liefert Mayer (2012), vgl. auch http: / / praatpfanne.lingphon.net/ . 27 Rechts erscheint das Graphikfenster (Praat Picture), mit dem Graphiken wie die in Abb. 2.3- 10 erstellt werden können. Auf diese Möglichkeiten werden wir hier nicht weiter eingehen, sondern verweisen auf die ausführliche Anleitung in Mayer (2012: 45ff.). 39 auf 44 100 Hz eingestellt. Um die Aufnahme zu beginnen, drücken Sie auf Record; wenn Sie fertig sind, auf Stop. Dann klicken Sie auf Save to list, und Ihre Aufnahme, die Sie beliebig benennen und auch auf Ihrer Festplatte speichern können, erscheint im Objektfenster. Abb. 2.3-12 Das Objektfenster (Praat Objects) (nach Mayer 2012: 26). Wir wollen mit Juans Frage einen schon auf der Festplatte vorhandenen Soundfile in Praat laden. Dazu klicken wir oben auf den Knopf Open (in älteren Versionen Read) > Read from file… und wählen den Soundfile aus, der als 1. Sound Parte5_Pers23 INT im Objektfenster erscheint. Während oberhalb und unterhalb der Objektliste Knöpfe für die Objektverwaltung angebracht sind (oben New, Open, Save; unten Rename, Remove etc.), finden Sie rechts neben den Objekten die Knöpfe für die verschiedenen Aktionen, die Sie mit den Objekten durchführen können (Anhören, Editieren, Annotieren, Manipulieren etc.). Wenn Sie ein Objekt ansehen und editieren wollen, wählen Sie es aus und klicken dann rechts auf View & Edit (vgl. Abb. 2.3- 12). Dann öffnet sich das Editorfenster, in dem das Signal in Form eines Oszillogramms angezeigt wird. In diesem Editorfenster, dessen Größe Sie beliebig verändern können, erledigen Sie alle interaktiven Arbeiten mit dem Objekt. Sie können einen Teil des Signals durch Mauszug auswählen und durch Klicken auf sel (unten links) hineinzoomen (bzw. durch Klicken auf out oder all wieder heraus). Sie können Zeitdauern messen: in den drei Balken unten finden Sie die Längenangaben für markierte Abschnitte, für den sichtbaren Abschnitt und für die gesamte Aufnahme. Wenn Sie diese Balken anklicken, können Sie den jeweiligen Teil anhören (vgl. Abb. 2.3-13). Aufnahme machen Dateien laden Objekte als Datei speichern Sound-Objekt (ausgewählt) TextGrid-Objekt (nicht ausgewählt) Liste der verfügbaren Objekte ausgewähltes Objekt umbenennen ausgewählte(s) Objekt(e) aus der Liste löschen Informationen zum ausgewählten Objekt (z.B. Abtastrate) Dynamisches Aktionsmenü ausgewähltes Sound-Objekt zur Annotation vorbereiten ausgewähltes Sound-Objekt anzeigen und editieren ausgewähltes Sound-Objekt abspielen ! " % " ('* 0 1 40 Von besonderem Interesse sind die Analysen, die Sie durch Betätigen der Knöpfe links oben im Editorfenster in Angriff nehmen können. Wenn Sie auf Spectrum > Show spectrogram gehen, nimmt das Oszillogramm nur noch die obere Hälfte des Analysefensters ein; im unteren Teil erscheint ein Breitbandspektrogramm des Signals. Die betrachtete Frequenzskala (View range) beträgt in der Standardeinstellung 0- 5000 Hz, die Fensterlänge (Window length) 0,005 s. Diese Werte (und noch viele weitere) können unter Spectrum > Spectrogram settings… (bzw. Advanced spectrogram settings…) verändert werden. Abb. 2.3-13 Editorfenster mit Praat-Analysen der Frage ¿Tiene mandarinas? Um die Grundfrequenz zu sehen, ist es nicht nötig, die Einstellungen wie in Abb. 2.3-10 auf ein Schmalbandspektrogramm umzustellen, sondern über Pitch > Show pitch blendet Praat den Verlauf von F 0 als blaue Linie in das Breitbandspektrogramm ein. Die entsprechende Frequenzskala erscheint ebenfalls in blau auf der rechten Seite des Spektrogramms. Die Standardeinstellung ist 75-500 Hz und damit Zoom out Abspielbalken u. Dauerangabe ausgewählter Signalabschnitt Abspielbalken u. Dauerangaben Show all (ganzes Signal im Fenster darstellen) Zoom in Zoom to selection Schritt zurück Signal (Oszillogramm) Spektrogramm (grau) Grundfrequenzverlauf (Pitch) blau Lautstärkeverlauf (Intensity) gelb Formantenverlauf (Formant) rot Skala Spektrogramm (schwarz) Skala Grundfrequenz (blau) Skala Lautstärke (grün) Eingeschaltete Praat-Analysen ( Show…) 41 eher für eine Frauenstimme passend. Für unsere Frage können wir sie über Pitch > Pitch settings… auf für eine Männerstimme günstigere 50-300 Hz (Pitch range) ändern. Wenn Sie auf Intensity > Show intensity klicken, erscheint im Spektrogramm eine gelbe Linie, die den Verlauf der Lautstärke anzeigt. Rechts ist in grün eine entsprechende Skala zu sehen, die von 50-100 dB reicht. Auch den Formantenverlauf kann man sich in Praat anzeigen lassen. Gehen Sie dazu auf Formant > Show formants, und rote Punkte deuten im Spektrogramm die Formantenkontur an. Abschließend wollen wir uns damit befassen, wie wir ein Sound-Objekt in Praat annotieren können. In Abb. 2.3-12 haben wir im dynamischen Aktionsmenü des Objektfensters schon den Knopf Annotate - und in der Objektliste ein TextGrid-Objekt als Ergebnis einer solchen Annotierungsaktion gesehen. Nach Mayer (2012: 67) handelt es sich bei der Annotation um “eine zeitlich ausgerichtete (time aligned), symbolische Beschreibung eines Signals […]”. D.h., dass ein bestimmter Zeitabschnitt oder ein Zeitpunkt des Signals mit einer Schilderung (einem Label oder Etikett) assoziiert wird. Das kann auf ganz verschiedenen Ebenen geschehen: auf der Segmentebene, wenn wir das Signal in einzelne Lautphasen segmentieren und diesen Transkriptionszeichen zuordnen; auf der Silbenebene, wenn wir Silbengrenzen setzen; auf der Wortebene, wenn wir eine orthographische Transkription einbringen; auf der syntaktischen Ebene, wenn wir Konstituentengrenzen setzen etc. All diese Annotierungsarten zielen auf Zeitabschnitte ab: es müssen Intervalle mit einem Anfangs- und einem Endpunkt ermittelt werden. Aber auch punktuelle Ereignisse können annotiert werden; etwa wenn wir den Gipfel eines Tonanstiegs kennzeichnen wollen. Für diese unterschiedlichen Arten der Annotierung hält Praat zwei verschiedene Typen von tiers vor (wie die Annotierungszeilen genannt werden): interval tiers (für Intervalle) und point tiers (für punktuelle Ereignisse). Um tiers zu erzeugen, müssen Sie im Objektfenster ein Sound-Objekt auswählen und dann auf Annotate - > To TextGrid… klicken. In die erste Zeile des Fensters, das sich daraufhin öffnet, schreiben Sie (an die Stelle von Mary John bell) die Namen der TextGrids, die Sie verwenden möchten, also z.B. IPA (für phonetische Transkription), Silben (für die Markierung von Silbengrenzen), Orth. (für die orthographische Wiedergabe), HL (für Hoch- und Tiefpunkte - High bzw. Low - im Grundfrequenzverlauf) - jeweils mit einfachem Abstand, aber ohne Kommata. Da es sich bei dem letzten tier um Zeitpunkte handelt, schreiben Sie hinter die Frage Which of these are point tiers? HL. Alle anderen tiers sind automatisch interval tiers. Wenn Sie nun auf OK klicken, erscheint im Objektfenster ein TextGrid-Objekt, das denselben Namen wie das zu annotierende Sound-Objekt trägt, also in unserem Fall 2. TextGrid Parte5_Pers 23INT. Um Sound- und TextGrid-Objekt in einem Editorfenster zu öffnen, müssen Sie beide gemeinsam durch Klicken auf das Sound-Objekt und STRG+Klicken (bzw. cmd+Klicken beim Mac) auf das TextGrid-Objekt auswählen und anschließend in View & Edit gehen. Das neue Editorfenster enthält außer den bereits bekannten Bestandteilen drei zusätzliche Menüs in der Menüzeile, nämlich Interval, Boundary und Tier. Sie dienen zur Bearbeitung der ti e rs , die sich zwischen dem Spektrogramm (und/ oder dem Oszillogramm) und den Abspielbalken in der unteren Hälfte des Fensters aneinanderreihen. Außerdem gibt es noch den sog. Label-Editor, eine weiße Fläche zwischen Menüzeile und Oszillogramm, in die Sie die Signalbeschreibung eingeben (vgl. Abb. 2.3-14). Zunächst müssen die Grenzen der Intervalle eingefügt werden. Beginnen wir mit der Grenze zwischen tiene und mandarinas. Dazu klicken wir einfach an der Stelle in ! " % " ('* 0 1 42 das Signal, an der wir den Übergang zwischen den beiden Wörtern vermuten. Dort erscheint eine senkrechte, oben rot gestrichelte, unten graue Linie, die am oberen Rand eines jeden tiers einen kleinen Kreis aufweist. Hören Sie sich unten auf dem obersten Abspielbalken die Signalteile vor und nach dieser provisorischen Grenze an und korrigieren Sie Ihre Setzung durch einen genaueren Klick. Wenn Sie meinen, die korrekten Intervalle ermittelt zu haben, klicken Sie in die ersten drei Kreise (denn hier fallen Segment-, Silben- und Wortgrenze zusammen), um für die drei interval tiers aus der provisorischen eine feste Grenze zu machen (die Sie aber jederzeit durch Mauszug verschieben oder über Boundary > Remove auch wieder entfernen können). Wenn Sie nun im Orth.-tier in den Abschnitt links der Grenze klicken, färbt dieser sich gelb, und das, was Sie tippen (in unserem Fall ¿Tiene) erscheint sowohl oben im Label-Editor als auch in der gelben Fläche. Dann klicken Sie in die Fläche rechts der Grenze (die sich nun gelb färbt) und schreiben mandarinas. Genauso verfahren Sie, um im IPA- und im Silben-tier die Silbengrenzen und schließlich im IPAtier die verbleibenden Segmentgrenzen zu setzen. Abb. 2.3-14 TextGrid-Editor mit verschiedenen Annotierungen der Frage ¿Tiene mandarinas? Wenn Sie die Schrift Doulos SIL auf Ihrem Rechner installiert haben, können Sie in Praat auch IPA-Zeichen verwenden. Übersichten darüber, welche Zeichenfolgen Sie eingeben müssen, um die IPA-Symbole zu erzeugen, die keinen gängigen Buchstaben des lateinischen Alphabets entsprechen, finden Sie am einfachsten, wenn Sie in die Suchmaske der Praat-Hilfe Phonetic Symbols eingeben. Im point tier HL wollen wir nun noch die Hoch- und Tiefpunkte des Intonationsverlaufs kennzeichnen. Dazu wählen wir durch Mauszug einen Teil des Signals aus und gehen in Pitch > Move cursor to maximum pitch bzw. Move cursor to minimum pitch. An der Stelle klicken Sie dann im point tier in den Kreis, um so die unten ausgewählt: Grenze (rot), Intervall (gelb); oben: Schreibfläche (Label-Editor) interval tiers IPA (aktiv) Silben Wörter (Orth.) point tier Hochu. Tiefton (HL) Grenzen (boundaries) blau Hochpunkt TextGrid-Menüs 43 ‘Grenze’ (die hier ein Punkt ist) zu bestätigen. Im Label-Editor können Sie diesen Punkt mit H bzw. L etikettieren. Wie alle in Praat neu erstellten oder veränderten Objekte existiert auch unser TextGrid-Objekt erst einmal nur im Praat-Arbeitsspeicher. Um es auch nach dem Beenden von Praat weiterverwenden zu können, sollten Sie es auf Ihrer Festplatte speichern. Dazu gehen Sie im TextGrid-Editor unter File > Save TextGrid as text file. Im gewünschten Ordner wird dann eine Datei mit der Endung TextGrid, in unserem Fall Parte5_Pers23_INT.TextGrid abgespeichert, die Sie bei Bedarf wieder in Praat öffnen können. Praat hat noch unendlich viele weitere Optionen und Funktionen. So lassen sich mithilfe von Skripten Analysen automatisieren, und Praat kann auch mit verschiedenen Tools kombiniert werden - so z.B. mit EasyAlign, das seit kurzem auch für Spanisch eine halbautomatische Segmentierung des Signals erlaubt (vgl. Goldman & Schwab 2011) oder mit dem Programm Correlatore, das Rhythmusanalysen unterstützt (vgl. 4.4). Auf die eine oder andere Funktion werden wir im Laufe des Buchs zurückkommen, ansonsten verweisen wir auf die in Praat eingebaute Hilfe und die einführende Literatur. 2.4 Perzeptive Phonetik Die Phonetik analysiert nicht nur die Produktion und Übertragung von Sprachlauten, sondern auch deren Wahrnehmung und Verarbeitung durch das menschliche Ohr und Gehirn. Als perzeptive Phonetik (sp. fonética perceptiva) konzentriert sie sich auf die physiologischen und neuronalen Vorgänge beim Hörer, wenn dieser die lautsprachliche Äußerung des Sprechers wahrnimmt und interpretiert. 28 Die Tatsache, dass die Bezeichnung ‘perzeptive Phonetik’ mit der Bezeichnung ‘auditive Phonetik’ (sp. fonética auditiva) konkurriert, zeigt, dass in diesem Forschungsgebiet die Grundannahmen über menschliche Sprache eine besonders wichtige Rolle spielen. Nach dem modularen Modell (vgl. etwa Kingston 2005 und 1.4) verläuft die Sprachverarbeitung linear, und die unterschiedlichen Bereiche (Hören, Sprachlauterkennung, syntaktische und lexikalische Verarbeitung, pragmatische Interpretation) werden nacheinander und in hierarchischer Folge durchlaufen. Nach diesem Ansatz kann man den Forschungsgegenstand einer Phonetik des Hörens als auditiv abgrenzen: Es geht um die Wahrnehmung des akustischen Ereignisses und die Extraktion der Phoneme bzw. der (distinktiven) Merkmale, die abschließend der phonologischen Repräsentation einer lexikalischen Einheit zugeordnet werden. Das Hören und die damit verbundene Kategorisierungsarbeit verlaufen nach dem modularen Modell autonom, also unabhängig von den späteren sprachlichen Verarbeitungsstufen, aber auch unabhängig von anderen kognitiven Aktivitäten (Sehen, Fühlen, Erwarten etc.). Außerdem sind, so dieser Ansatz, in unserem Gedächtnis lautliche Zeichenaußenseiten symbolisch und diskret, also entweder als Phonemketten (3.1) oder als Merkmalskonfigurationen (3.2), repräsentiert. Deshalb ist die Aufgabe des Moduls Hören phonologisch. Wir müssen aus der äußerst variablen und kontinualen lautsprachli- 28 Zusammenfassende Darstellungen zur lautsprachlichen Perzeption finden sich etwa bei Clark et al. (2007: 297-324), Goldstein (2008: 257-332), Kubarth (2009: 50-58), McQueen (2007), Neppert & Pétursson (2002: 167-206), Pisoni & Levi (2007), Pompino-Marschall (2009: 143-175). Vgl. auch die Beiträge in Pisoni & Remez (2005). " 2 " ('+ 0 1 44 chen Realität alles Irrelevante und ausschließlich Individuelle ausfiltern, um diese mit der abstrakten phonologischen Repräsentation gleichsetzen zu können. Eine Alternative zu diesem auditiven Ansatz sind mehrdimensionale Modellierungen des Hörens, die dieses als perzeptives Zuhören definieren. Solche Modelle werden von konnektionistischen, multimodalen und funktional ausgerichteten Ansätzen angeboten. Sie gehen davon aus, dass bei der Verarbeitung des Sprachsignals alle Bereiche der Kognition (Hören, Sehen, Fühlen etc.) und alle Bereiche des Wissens (sprachliches, nicht-sprachliches, kategoriales, analoges etc.) gleichzeitig aktiviert sind. Nach diesem Modell ist deshalb das Sprachhören mit anderen kognitiven Aktivitäten systematisch vernetzt. Wenn wir hören, stellen wir aufgrund unseres Erfahrungswissens immer schon Vermutungen darüber an, was als nächstes kommen kann, und identifizieren deshalb die lautsprachlichen Ereignisse nicht ausschließlich über auditive Mechanismen. 29 Wir werden im Folgenden sehen, dass es eine ganze Reihe von Evidenzen dafür gibt, dass das Hören nicht autonom, sondern verflochten mit anderen kognitiven Aktivitäten ist. Das bedeutet aber natürlich nicht, dass das Hören nicht trotzdem ein physiologischer Vorgang ist und als solcher analysiert werden muss. In einem ersten Schritt werden wir uns daher mit dem Ohr und seiner Anatomie sowie den neuronalen, also gehirnphysiologischen Aspekten des Hörvorgangs beschäftigen (2.4.1). Erst dann werden wir uns dem Sprachhören, also der Wahrnehmung sprachlicher Signale und ihrer Verarbeitung zuwenden (2.4.2). Die untersucht die physiologischen, neuronalen und kognitiven Vorgänge bei der Wahrnehmung und Verarbeitung von Lautsprache. Es gibt zwei unterschiedliche Ansätze bei der Interpretation dieser Vorgänge: Der modulare und auditive Ansatz betont die Autonomie der Lautwahrnehmung und geht von einer linearen Abfolge von Hören, Kategorisieren und Worterkennen aus. Der mehrdimensionale und perzeptive Ansatz betont dagegen die Vernetzung mehrerer kognitiver Aktivitäten bei der Lautspracherkennung. 2.4.1 Der Hörvorgang Das menschliche Gehörorgan kann in drei anatomische Bereiche aufgeteilt werden. Äußerlich sichtbar ist das Außenohr mit der Ohrmuschel, dem äußeren Gehörgang und mit dem ihn abschließenden Trommelfell. Das Mittelohr umfasst die an das Trommelfell anschließenden Gehörknöchelchen Hammer, Amboss und Steigbügel. Im Innenohr liegt die Hörschnecke oder Cochlea, das eigentliche Hörorgan. Abb. 2.4-1 zeigt die unterschiedlichen Bereiche des menschlichen Ohrs. Die knorpelige Muschel des Außenohrs unterstützt das Richtungshören, denn die akustische Information, die von vorne kommt, wird reflektiert und verstärkt, während die von hinten ankommenden Schallwellen gedämpft werden. Das Richtungshören wird außerdem dadurch ermöglicht, dass wir mit zwei Ohren hören und 29 Ein weiterer wichtiger Unterschied ist, dass die symbolische Repräsentation lautsprachlicher Signifikanten (durch Phoneme oder Merkmalkonfigurationen) von den konnektionistischen Ansätzen in Frage gestellt wird. Deshalb werden Indizien dafür gesammelt, dass nichtanalytische, ganzheitliche Repräsentationen, sog. Exemplare, Ziel des Perzeptionsvorgangs sind (vgl. 3.5). perzeptive Phonetik 45 daher zwei zeitlich leicht verschobene und unterschiedlich laute akustische Signale empfangen, wenn der Schall von der Seite kommt. Aus dem Abgleich der Differenzen zwischen diesen akustischen Impulsen können wir dann die räumliche Situierung des Schallereignisses erschließen. Der äußere Gehörgang, der etwa 2,5 cm lang ist, dient dem Schutz des Trommelfells. Außerdem verstärkt er durch seine Resonanz genau den Frequenzbereich um 3,4 kHz, der im menschlichen Sprechen besonders in Anspruch genommen wird. Am Ende des Gehörgangs liegt das Trommelfell, eine trichterförmige Membran, etwa 0,85 cm 2 groß und 0,1 mm dick, die auf einer Fläche von 0,55 cm 2 in Schwingungen versetzt werden kann. Das Mittelohr ist eine kleine Höhle in unserer Schädelstruktur. Da sie durch die Eustachische Röhre mit dem Mundraum verbunden ist, können Luftdruckunterschiede zwischen Außenohr und Mittelohr durch Schluckbewegungen ausgeglichen werden. Das ist wichtig, weil nur so die freie Beweglichkeit des Trommelfells und damit ein optimales Hören sichergestellt ist. An das Trommelfell schließen im Mittelohr die Gehörknöchelchen an: Unmittelbar am Trommelfell befindet sich der Hammer, der über den Amboss mit dem Steigbügel verbunden ist. Der Steigbügel wiederum liegt an dem nur 0,03 cm 2 großen ovalen Fenster an; das ist eine der beiden Membranen, die sich zwischen Mittelohr und Innenohr befinden. Die Gehörknöchelchen geben die Schwingungen des Trommelfells mechanisch an das ovale Fenster weiter. Da der Flächenunterschied zwischen Trommelfell und ovalem Fenster sehr groß ist, werden die Schwingungen durch die Gehörknöchelchen verstärkt. Gleichzeitig regeln die mit den Knöchelchen verbundenen Muskeln deren Beweglichkeit und sorgen dafür, dass sie bei einem zu lauten Schallereignis nicht den vollen Druck übertragen müssen. Abb. 2.4-1 Das menschliche Gehörorgan (nach Reetz & Jonman 2009: 227). Das eigentliche Hörorgan liegt im Innenohr. Es ist die Schnecke oder Cochlea, ein mit Lymphflüssigkeit gefülltes, schneckenförmig gewundenes Schlauchsystem, das in einen Hohlraum, das knöcherne Labyrinth, eingebettet ist. Die Schnecke besteht aus zwei Schläuchen, die ausgerollt etwa 3,5 cm lang sind. An der Spitze der Schnecke äußeres Ohr Mittelohr Innenohr Hammer Amboss Hörnerv Cochlea Ohrmuschel Gehörgang Trommelfell Paukenhöhle Steigbügel eustachische Röhre " 2 " ('+ 0 1 46 sind sie miteinander verbunden, aber am anderen Ende erreichen sie nur jeweils eine der beiden Membranen, die den Übergang zwischen Mittel- und Innenohr sichern. An das bereits genannte ovale Fenster, an dem die Schwingungen der Gehörknöchelchen ankommen, schließt der Schlauch an, der Vorhoftreppe genannt wird; die zweite Membran, das runde Fenster, ist der Endpunkt der sog. Paukentreppe. Zwischen Vorhof- und Paukentreppe liegt die Basilarmembran, die das Cortische Organ, unser eigentliches Hörorgan, trägt. Dieses besteht aus tausenden von Haarzellen (etwa 3500 innere Haarzellen und etwa 15 bis 20 000 äußere Haarzellen), die durch die Bewegungen der Lymphflüssigkeit in den Schläuchen aktiviert werden. In diesem Zustand veranlassen sie die Rezeptorzellen in der Basilarmembran zum Feuern, d.h. zum Weitergeben neuronaler Information über den Hörnerv an das Gehirn. Das Cortische Organ verwandelt also die mechanischen Schwingungen der Lymphflüssigkeit in neuronale Information. Abb. 2.4-2 Das Cortische Organ in schematischer Schnittdarstellung (aus Pompino-Marschall 2009: 146). Fassen wir hier kurz zusammen: Die am Außenohr eintreffenden Luftdruckunterschiede werden durch die Resonanz des Gehörgangs in bestimmten sprachrelevanten Frequenzen verstärkt und in Schwingungen des Trommelfells verwandelt. Diese versetzen die Gehörknöchelchen so in Bewegung, dass am Ende der Kette der an der Membran des ovalen Fensters anliegende Steigbügel die Schwingungen an die Lymphflüssigkeiten der Schnecke übermitteln kann. In der Schnecke nun vollzieht sich ein Prozess, der sich mit der Fourier-Analyse vergleichen lässt (2.3). Die Schwingungen werden nämlich nicht undifferenziert als Ganzes weitergegeben, sondern gemäß ihrer komplexen spektralen Zusammensetzung in unterschiedlich weit reichende Wanderwellen zerlegt. Jede Teilfrequenz eines Schallereignisses aktiviert eine unterschiedlich weit reichende Welle. Deshalb werden auch unterschiedliche Stellen der Basilarmembran berührt und folglich unterschiedliche Haarzellen aktiviert. Bspw. verebben hohe Frequenzen bereits am Beginn der Lymphschläuche, während niedrigere Frequenzen zu weiter reichenden Wanderwellen führen. Das Innenohr, so könnte man sagen, nimmt den Schall zeitlich-linear auf, ‘zerlegt’ ihn aber auch so, dass seine spektrale Zusammensetzung transparent wird. Die neuronale Information, die das 47 Gehirn vom Hörnerv erhält, ist sowohl hinsichtlich des zeitlichen Verlaufs als auch hinsichtlich der Frequenzen, die im Schallereignis vereint sind, spezifiziert. 30 Die neuronale Information des Hörnervs wird an die Großhirnrinde und dort an den cortex auditivus (im rechten und im linken Temporallappen) weitergeleitet. Jedes Ohr ist über zwei auditorische Bahnen mit der Großhirnrinde verbunden. Es gibt eine ventrale auditorische Bahn aus nacheinander geschalteten Nervenzellen, bei der die neuronale Information in der jeweiligen Gehirnhälfte bleibt, also gleichseitig vermittelt wird. Bei der zweiten auditorischen Bahn, der dorsalen, wird die Information dagegen zur gegenüberliegenden Gehirnhälfte vermittelt. Die ventrale Bahn ist für das Richtungshören zentral (Goldstein 2008: 291-313), die dorsale Bahn dagegen mit dem kategorialen Hören assoziiert. Wichtig ist außerdem, dass die neuronale Information auf ihrem Wege vom Cortischen Organ zur Großhirnrinde nicht unverändert bleibt, sondern mit anderen Informationen zusammengeführt wird: Die Reize der beiden Ohren werden in einer frühen Phase miteinander vernetzt. Bereits hier beginnt die Verrechnung der Informationen zur Lokalisierung der Schallquelle. Außerdem ist die ventrale Bahn mit dem visuellen System gekoppelt, sodass das Richtungshören auch durch visuelle Signale gestützt wird. Nach dem bisher Gesagten könnte es scheinen, dass die Verarbeitung der neuronalen Information aus dem Ohr linear, durch nacheinander geschaltete Reaktionen, und punktuell, also nur durch wenige spezialisierte Nervenzellen, erfolgt. Das ist nach neueren Erkenntnissen über menschliche Wahrnehmung und Kognition nicht der Fall. Man weiß inzwischen, dass es drei auditive Areale gibt. Um einen primären Kernbereich des cortex auditivus sind konzentrisch der sekundäre (‘Gürtel’) und der tertiäre auditive Kortex (‘erweiterter Gürtel’) angeordnet. Der Kernbereich erhält die neuronale Information zuerst und ist auf die Feststellung der Tonhöhe, also auf die reine Frequenz, ausgelegt. Die peripheren Bereiche, an die die Information weitergegeben wird, scheinen dagegen auf komplexere Schallereignisse spezialisiert zu sein (Rauschen, d.h. mehrere übereinanderliegende Frequenzen, menschliche Stimmen etc.). Außerdem hat man nachgewiesen, dass nicht nur der cortex auditivus, sondern auch andere Gehirnregionen bei der Lautwahrnehmung aktiviert werden. 31 Diese Beobachtung spricht dafür, dass im Hörvorgang nicht nur eine Nervenbahn zu einem präzisen Gehirnareal verfolgt wird, sondern dass neuronale Reaktionen an mehreren Stellen auftreten und im Wahrnehmungsvorgang synchronisiert sind. In Bezug auf die visuelle Wahrnehmung ist man sich inzwischen sogar ziemlich sicher, dass die Synthetisierung der analytischen Einzeldaten, in die das Gesehene im Auge aufgelöst wird (Konturen, Helligkeits- oder Farbkontraste etc.), nicht dadurch erfolgt, dass eine präzise, hierarchisch übergeordnete Nervenzelle aktiviert wird, die die Daten mit einer schematischen Repräsentation in Beziehung setzt (lokale Repräsentation bzw. Einzelzellenkodierung). Eine weitaus plausiblere Erklärung ist, dass die Synthetisierung der Einzeldaten zu einer Gesamtheit durch die Gleichzeitigkeit des Feuerns der 30 Die Lautstärke wird in der Hörschnecke anscheinend dadurch widergespiegelt, dass mehr Nervenzellen reagieren und die verstärkte Reaktion den erhöhten Dezibelwert weitergibt (Kubarth 2009: 34). 31 Vor allem die neuen bildgebenden Verfahren der Funktionalen Magnetresonanztomographie (fMRI) und der Positron-Emissions-Tomographie (PET) haben diese Erkenntnis ermöglicht. Sie können neuronale Reaktionen direkt, als körperliche Reaktionen im Gehirn, sichtbar machen. Vgl. dazu genauer Idsardi & Poeppel (2012); Goldstein (2008: 75-100); Pulvermüller (2007). " 2 " ('+ 0 1 48 vielen Nervenzellen, die am Wahrnehmungsvorgang beteiligt sind, erzeugt wird. Man könnte sagen, dass die Wahrnehmung einer Gestalt nicht durch die eine Nervenzelle am Ende des Wahrnehmungsvorgangs gesichert wird, sondern durch das Muster aus den vielen Nervenzellen, die von Anfang an parallel aktiviert sind (verteilte Repräsentation bzw. Ensemblekodierung). 32 Die Frage, welches dieser beiden Wahrnehmungsmodelle zutreffend ist, ist in Bezug auf die auditive Wahrnehmung noch nicht abschließend geklärt (Bernstein 2005). Gegen die Annahme, die Kognition sei eine streng linear geordnete Folge von verschiedenen Verarbeitungsschritten, spricht auch, dass bei der Übertragung der auditiven Information nicht nur afferent, vom Hörorgan zu den oberen Verarbeitungszentren in der Großhirnrinde (bottom-up), Information weitergegeben wird. Auch efferent, also vom Cortex nach unten (top-down), beeinflusst neuronale Information den Hörvorgang. Denn neuronale Signale aus dem Großhirn können bestimmte Nervenzellen inhibieren, also bei der Reizannahme behindern, bei anderen dagegen die Reaktionszeit beschleunigen. Ein ganz bekannter Nachweis einer solchen efferenten Beeinflussung des Hörens ist der sog. Cocktail-Party-Effekt. Wir können nämlich selektiv hören, also unsere Aufmerksamkeit so steuern, dass bestimmte Nervenzellen und damit die Aufnahme bestimmter akustischer Reize privilegiert sind. Ein selektives Hören liegt bspw. vor, wenn wir uns auf die Äußerungen eines Gesprächspartners konzentrieren. Wir können diese auch trotz des sonstigen Lärms einer Veranstaltung verstehen, weil wir sie, wie die Gestaltpsychologie sagt, als Figur vor dem Hintergrund der übrigen akustischen Phänomene prägnant machen - selbstverständlich ohne dass wir aufhören, die übrigen Geräusche zu hören. Deshalb können wir diese bei Bedarf auch in den Vordergrund rücken und ihrerseits fokussieren. 33 Bevor wir uns im nächsten Abschnitt auf die Sprachschallverarbeitung konzentrieren (2.4.2), noch einige Anmerkungen zur Psychoakustik. Als Psychoakustik werden die Bereiche der Akustik bezeichnet, die sich speziell mit der menschlichen Wahrnehmung von Schall beschäftigen (Zwicker 1982). Hier spielt die Beobachtung eine wichtige Rolle, dass das menschliche Hören anderen Regularitäten folgt als das Registrieren akustischer Signale durch technische Apparate. Bspw. hören Menschen nicht immer das, was die Apparate ‘hören’ können. Oft liegt nämlich die Reizschwelle für den Menschen höher als für die Maschine, sodass wir zwar nach der Analyse wissen, dass ein akustisches Ereignis vorgelegen hat, wir dieses aber selbst nicht wahrgenommen haben. Bekannt ist bspw., dass menschliches Hören nur bestimmte Frequenzbereiche erkennen kann. Unser Hörvermögen beginnt bei 16-20 Hz und 32 Zur Organisation des Gehirns und der kognitiven Prozesse vgl. etwa Goldstein (2008: 47- 100), zur Synchronisation der perzeptiven und kognitiven Prozesse Goldstein (2008: 101- 130); vgl. auch Hawkins (2010). Die inzwischen gesicherte Erkenntnis, dass viele Gehirnareale gleichzeitig aktiv sind, lässt auch die umstrittene motor-theory der Sprachwahrnehmung (Liberman et al. 1967) in einem neuen Licht erscheinen. Nach der motor-theory wird die kategorielle Interpretation des akustischen Signals durch die Verknüpfung mit abgespeicherten Artikulationsbewegungen ermöglicht. Inzwischen ist nachgewiesen, dass bei der auditiven Wahrnehmung auch Zellensembles aktiviert werden, die bei der Sprachartikulation beteiligt sind (Goldstein 2008: 331f.). Die Frage, welche Rolle abgespeicherte artikulatorische Bewegungsmuster bei der Perzeption von Lautsprache spielen, ist also weiterhin offen (Fowler & Galantucci 2005). 33 Zum Cocktail-Party-Effekt, der so heißt, weil er in den 50er Jahren entdeckt wurde, vgl. genauer Pompino-Marschall (2009: 151). Zur Figur-Grund-Beziehung in der Gestaltpsychologie vgl. Krefeld (1999: 127ff.). 49 endet bei 16-20 kHz. Wenn man die Frequenzen, die wir wahrnehmen können, zusätzlich daraufhin untersucht, ab welchem Schallpegel wir sie hören, dann zeichnet sich die Hörfläche des menschlichen Ohres ab. Sehr tiefe Frequenzen hören wir erst ab einer bestimmten Lautstärke, genauso sehr hohe Töne. Im mittleren Frequenzbereich, der auch genau den vom Sprachschall besetzten Frequenzen entspricht, hören wir dagegen gleichmäßig gut; bei geringem Schallpegel, wenn leise gesprochen wird, genauso wie bei mittlerer und hoher Lautstärke. Im Laufe der menschlichen Evolution haben sich also offensichtlich die Ohren den menschlichen Stimmen oder umgekehrt die Stimmen den Ohren angepasst (Neppert & Pétursson 2002: 59ff.). Das menschliche Hörorgan nimmt nicht wie eine Maschine gleichmäßig alles wahr, sondern präferiert bestimmte Frequenzbereiche. Auch hinsichtlich der Veränderungen akustischer Signale gibt es Reizschwellen. Bestimmte Dauerunterschiede sind zu kurz, als dass wir sie identifizieren können. Erst ab einer bestimmten zeitlichen Ausdehnung der Dauerdifferenz können wir entscheiden, ob etwas gleich lang, länger oder kürzer als etwas anderes ist. Auch Unterschiede in der Lautstärke oder Frequenzunterschiede nehmen wir erst ab einer bestimmten Größe wahr (Meisenburg & Selig 1998: 39). Zu diesen Begrenzungen hinsichtlich der menschlichen Wahrnehmungs- und Unterscheidungsfähigkeit kommt noch ein weiterer Unterschied zwischen dem ‘Hören’ der Apparate und dem Hören der Menschen hinzu, nämlich der der Kategorisierung. Die physikalischen Messskalen stimmen nur bedingt mit den Maßstäben überein, die Menschen an das wahrgenommene akustische Ereignis anlegen. Wir sehen das bereits daran, dass wir die Lautstärke eines Signals nur grob (laut oder leise) oder nur in Bezug zu einem anderen Signal (lauter oder leiser) einordnen können, jedoch über keine Messgröße verfügen, die dem physikalischen Dezibel (dB) vergleichbar ist. Auch hinsichtlich der Frequenz gilt dieser Unterschied zwischen physikalischer und perzeptiver Einordnung. Einige Menschen, nämlich solche mit absolutem Gehör, verfügen zwar über die Fähigkeit, Töne auf einer quasi-physikalischen Skala, der Tonleiter, einzuordnen. Die meisten Menschen können aber nur sagen, ob ein Ton höher oder tiefer als ein anderer ist - und manchmal hören sie auch nur, dass er anders ist. Diese Unterschiede zwischen Mensch und Maschine müssen bedacht werden, wenn man akustische Daten erhebt und analysiert. Man kann Sonagramme nicht ohne weiteres gleichsetzen mit dem, was ein normal veranlagter Hörer hört. Zuvor muss man sich vergewissern, dass die von den technischen Apparaturen registrierten Veränderungen des akustischen Signals auch solche sind, die vom Menschen bemerkt und ähnlich kategorisiert werden. 2.4.2 Sprach(laut)hören In diesem Abschnitt wollen wir uns genauer damit beschäftigen, wie das Hören von sprachlichen Signalen vor sich geht. Es ist eine immer noch offene Frage, ob die Wahrnehmung von Lautsprache anders verläuft als das Wahrnehmen sonstiger akustischer Ereignisse (Kingston 2005). Nach dem modularen Ansatz geht man davon aus, dass beide Signalarten zunächst gleich verarbeitet werden. Vertreter perzeptiver Ansätze nehmen dagegen an, dass das Hören von sprachlichen Zeichen von Anfang an durch sprachliches Wissen beeinflusst und gelenkt ist. Diese Debatte spiegelt sich auch in den Experimenten wider, die in der Psycholinguistik zur Lautsprachwahrnehmung gemacht wurden. Für die Gleichheit oder Ähnlichkeit der Wahrnehmung aller akustischen Signalarten spricht die Beobachtung, dass der Mensch von Geburt an die Fähigkeit zum kate- " 2 " ('+ 0 1 50 gorialen Hören besitzt; eine Fähigkeit, die er mit einer Reihe von Tieren (Chinchillas, Makaken, Wellensittiche, Zebrafinken, japanische Wachteln) teilt (vgl. Kingston 2005: 178f.). Es handelt sich deshalb ganz eindeutig um eine biologisch-physiologisch begründete auditive Fähigkeit, die nicht vom sprachlichen Wissen und vom Sprachgebrauch abhängen kann. Entdeckt wurde das kategoriale Hören bei Experimenten mit synthetisch erzeugten Sprachlauten. In den 50er Jahren hatte man in den berühmten Haskins-Laboratorien in New York eine Apparatur entwickelt, die Sonagramme, also visuelle Darstellungen von Sprachlauten, in akustische Signale umwandeln konnte. Damit war die Möglichkeit gegeben, lautsprachliche Signifikanten künstlich zu synthetisieren und gleichzeitig zu überprüfen, welche Manipulationen sich auf die Wahrnehmung der Signale auswirkten und welche nicht. Berühmt geworden sind die Versuche mit der Wahrnehmung von Plosiv-Vokal-Silben. Wir haben gesehen, dass sich die einzelnen Plosive durch die Formanttransitionen zum folgenden Vokal, und zwar vor allem beim zweiten Formanten, voneinander unterscheiden (2.3.2). Diese Beobachtung nutzte man, um durch die Manipulation von Sonagrammen ein Kontinuum zwischen [b] und [] zu simulieren, indem man die Transition des zweiten Formanten zwischen der Artikulation des labialen [b] bis zur Artikulation des velaren [] in 13 Einzelschritten veränderte (Abb. 2.4-3). Als man diese künstlichen Stimuli Versuchspersonen anbot, nahmen diese aber gerade nicht 13 verschiedene Schallereignisse wahr. Übereinstimmend hörten alle Versuchspersonen die ersten drei Stimuli als [bæ], den fünften bis neunten Stimulus als [dæ], die Stimuli elf bis dreizehn als [æ]. Die dazwischen liegenden Stimuli ordneten sie unterschiedlich ein; der vierte Stimulus wurde also von einigen als [bæ], von anderen als [dæ] interpretiert. Gleich war aber, dass die Wahrnehmung bei allen Probanden ‘kippte’. Diese hörten nie ein ‘mittleres’ [b] oder ein ‘mittleres’ [d], sondern ordneten die Stimuli immer eindeutig einer der beiden Kategorien zu. Die Hörer unterteilten das dargebotene akustische Kontinuum also in klar getrennte Wahrnehmungskategorien (Pompino-Marschall 2009: 162ff.). Anzumerken ist, dass das ‘Kippen’ der kategorialen Zuordnung bei den Vokalen geringer ausgeprägt ist und sich hier Anzeichen für eine kontinuale Wahrnehmung finden (Pompino-Marschall 2009: 163). Die kategoriale Wahrnehmung ist aber zweifellos ein sehr wichtiges Charakteristikum unseres Sprachhörens. Abb. 2.4-3 Versuchsanordnung zur kategorialen Wahrnehmung (aus Pompino-Marschall 2009: 163): 13stelliges Kontinuum zwischen [bæ] und [æ] (inks), kategoriale Wahrnehmung des Kontinuums als [bæ], [dæ] und [æ] (rechts). Die Kurven geben einmal die Identifizierungsleistungen bei den jeweiligen Phonemen wieder, die horizontale Kurve zeigt die Ergebnisse eines Diskriminationstests im Vergleich zur rechnerisch ermittelten Diskriminationsfunktion. Die Übereinstimmung zwischen den Antworten der Versuchspersonen und der rechnerisch ermittelten Kurve ist sehr hoch. 51 Eine weitere Experimentreihe versuchte nachzuweisen, dass die Lateralität des Gehirns auch für die Sprachschallwahrnehmung eine Rolle spielt. Als Lateralität bezeichnet man die Tatsache, dass die einzelnen Gehirnhälften für unterschiedliche Aufgaben spezialisiert sind (Hemisphärendominanz). Eine Gehirnhälfte, bei den meisten Menschen die linke, ist dominant für die Sprachverarbeitung zuständig. Der Nachweis, dass bereits beim Hören die Hemisphärendominanz greift, gelang Anfang der 60er Jahre des letzten Jahrhunderts. Bei Versuchspersonen, denen über Kopfhörer auf dem rechten und dem linken Ohr Zahlen, allerdings auf jedem Ohr unterschiedliche, vorgesprochen wurden, zeigte sich ein Rechts-Ohr-Vorteil (REA, engl. right ear advantage). Die Stimuli, die die Probanden auf dem rechten Ohr gehört hatten, konnten sie verlässlicher wiedergeben als die gleichzeitig links dargebotenen. Da die dorsalen Hörbahnen kreuzen und das rechte Ohr die neuronale Information direkt an die linke, also an die sprachverarbeitende Hemisphäre weiterleitet, entspricht dieses Ergebnis den Erwartungen. Denn die Informationen des linken Ohrs werden erst später über den sogenannten Balken von der rechten an die linke Gehirnhälfte weitergegeben, die Stimuli auf dem rechten Ohr haben also einen zeitlichen Vorsprung und können mehr Aufmerksamkeit beanspruchen. Wurden den Versuchspersonen dagegen Melodien oder ähnliche nicht sprachliche akustische Stimuli angeboten, war das linke Ohr im Vorteil. Es ist direkt mit der rechten Gehirnhälfte verbunden, die im Bereich der Verarbeitung von etwa Rhythmus oder Melodien dominant ist: hier werden daher bevorzugt Phänomene erfasst, die kontinual und nicht kategoriell strukturiert sind (Pompino-Marschall 2009: 168ff.). Die Beobachtungen zur Hemisphärendominanz sprechen dafür, dass wir früh im Wahrnehmungsvorgang zwischen sprachlichen und nicht sprachlichen akustischen Ereignissen trennen. Auch die Beobachtungen zur Normalisierung von akustischen Daten, die wir beim Sprachhören vollziehen, sind in diesem Zusammenhang aufschlussreich. Wichtig beim Hören von sprachlichen Äußerungen ist ja, dass wir die sprachlichen Zeichen erkennen, unabhängig davon, von wem und in welcher Situation sie ausgesprochen werden. Angesichts der immensen lautlichen Varianz sind dafür eine Reihe von Abstraktionsleistungen erforderlich, die wir vollziehen, ohne dass sie uns bewusst werden. Dies gilt bspw. für die sehr große Variation zwischen den einzelnen Sprechern bzw. Sprechertypen. Vergleicht man die Vokalrealisationen von erwachsenen Männern, Frauen und Kindern miteinander, fällt auf, dass die Formanten für ein [a], gesprochen von einem erwachsenen Mann, mit denen des [ ], gesprochen von einem Kind, identisch sind. Hier hilft uns unsere Fähigkeit zur Normalisierung. Im Hören ‘überspringen’ wir die Uneindeutigkeit der akustischen Information; wir hören die gleichen akustischen Daten sofort korrekt als [a], wenn ein Mann spricht, und als [ ], wenn stattdessen ein Kind unser Gesprächspartner ist. Wir beurteilen die Informationen also nicht immer gleichbleibend nach absoluten Frequenzwerten, sondern ordnen sie in unterschiedliche Referenzsysteme ein, je nach dem, ob wir einem Kind, einem Mann oder einer Frau zuhören (Abb. 2.4-4). " 2 " ('+ 0 1 52 Abb. 2.4-4 Durchschnittliche Formantenwerte englischer Vokale bei Männern (durchgezogen), Frauen (gestrichelt) und Kindern (gedoppelt) (auf der Abszisse sind die F 1 -Werte abgetragen, auf der Ordinate die F 2 -Werte) (aus Lieberman & Blumstein 1988: 178). Die bisher angeführten Experimente und ihre Ergebnisse lassen sich sehr gut mit der Vorstellung des modularen Ansatzes in Einklang bringen, Aufgabe des Hörens sei es, schnell und effektiv das variable und kontinuale akustische Ereignis in diskrete und kontextstabile Wahrnehmungskategorien wie bspw. Phoneme zu überführen und dabei die kontingenten, also zufälligen, von den phonologisch relevanten lautlichen Eigenschaften zu trennen. In Bezug auf unseren kleinen Verkaufsdialog könnten wir also sagen, dass es die Aufgabe des Käufers ist, die Äußerung der Verkäuferin, die gerade ¡Claro que sí! gesagt hat, zu normalisieren, um die spanischen Phoneme / k/ , / l/ , / a/ usw. korrekt identifizieren zu können. Der Käufer müsste auch davon absehen, dass die Verkäuferin stark erkältet ist und deshalb die ganze Äußerung nasalisiert erscheint. Auch die Beobachtung, dass sie mit erhöhter Sprechgeschwindigkeit artikuliert, würde vom Käufer ausgeblendet werden. Beides, die krankheitsbedingte Nasalisierung und das vielleicht persönlichkeitsbedingte Tempo sind nämlich nicht für die Identifizierung der sprachlichen Zeichen relevant. Diese, so der modulare Ansatz, erfolgt ausschließlich durch die Überführung der akustischen Varianz in invariante phonologische Einheiten, in unserem Fall in die Phonemfolgen / klao/ , / ke/ und / si/ , die die Identifizierung der gemeinten Wörter claro, que und sí erlaubt. Derartige Vorstellungen vom Hörvorgang werden aber zunehmend kritisiert. Ein erster Kritikpunkt ist, dass die Wahrnehmung und Verarbeitung von kontextueller Varianz durchaus ökonomisch sein kann. Es gibt eine Reihe von Experimenten, die zeigen, dass wir das akustische Ereignis im Wahrnehmungsvorgang nicht so drastisch reduzieren, dass nur noch phonologische Information übrig bleibt. Wir verarbeiten und speichern auch individuelle Stimmmerkmale der Sprecher, indexikalische und 53 expressive Merkmale, die für die Interpretation der Äußerung relevant sein können, vor allem aber auch zahlreiche kontextbedingte Variationen der Lautformen. Bei den Plosiven ist dies besonders auffällig. Plosive treten, ausgelöst durch die Koartikulation mit dem folgenden Vokal, in sehr unterschiedlichen Formen auf (2.2.4). Außerdem können Plosive gar nicht wahrgenommen werden, wenn man das folgende Vokalsegment wegschneidet - sie hören sich dann an wie ein nicht sprachliches Glissando bzw. Zirpen (Pompino-Marschall 2009: 161). All dies spricht dafür, dass wir Plosive, zusammen mit den Folgevokalen, in mehreren kontextspezifizierten Varianten wahrnehmen bzw. memorieren. Die Speicherung der kontextuellen Varianz bzw. der Koartikulationseffekte zwischen Plosiven und folgenden Vokalen kann sogar strategisch eingesetzt werden. Bereits bei der Konsonantenartikulation hört und sieht man nämlich, welcher der folgende Vokal sein wird, und kann dieses Wissen zur schnelleren Worterkennung nutzen. Auch das im Spanischen phonologisch nicht relevante Merkmal der Vokallängung können wir strategisch ausdeuten. Vor größeren syntaktischen Einschnitten sind Vokale als Silbenkerne häufig, wenn auch nicht systematisch, länger als gewöhnlich. Es lohnt sich deshalb, Information zur Dauer der lautlichen Segmente zu verarbeiten, auch wenn diese phonologisch gesehen irrelevant ist. Viele Untersuchungen zu den neuronalen Aktivitäten bei der Lautwahrnehmung haben gezeigt, dass wir sehr viele Informationen parallel und vernetzt verarbeiten können. Die Annahme, die Aufgabe des Hörens sei es, irrelevante lautliche Information auszusondern und nur das übrig zu lassen, was zur Identifizierung der Phoneme wichtig ist, muss deshalb hinterfragt werden (Nguyen 2012, Pisoni & Levi 2007). Mit der Beobachtung, dass wir beim Wahrnehmen von Sprachschall nicht ausschließlich nach phonologisch relevanter Information suchen, stimmt auch die Tatsache überein, dass unsere Perzeption in der face-to-face-Interaktion systematisch multimodal ist und nicht nur akustische, sondern auch andere Wahrnehmungsdaten bei der Interpretation des Gehörten verwendet (Rosenbaum 2005). In einem Experiment stellte man fest, dass eine Versuchsperson, der akustisch die Silbe [ba] angeboten wurde, die aber auf dem Bildschirm einen stumm geschalteten Sprecher sah, der die Silbe [a] äußerte, beide Wahrnehmungsdaten weiter verarbeitete. Sie reagierte gleichzeitig auf die auditive und die visuelle Information und ‘hörte’ deshalb den zwischen dem akustischen und optischen Stimulus liegenden Plosiv [da] (McGurk & MacDonald 1976). 34 Selbstverständlich handelt es sich um eine künstliche Versuchsanordnung. Aber auch unser Alltagswissen sagt uns, dass wir die Mundbewegungen unserer Kommunikationspartner als Informationsquelle nutzen, um das Gesagte zu erkennen. Wir sind als Hörer auch ohne weiteres imstande, defektive lautsprachliche Stimuli korrekt zu verarbeiten. Wir können Stimuli, in denen essentielle Bestandteile, etwa distinktive Merkmale, ganze Segmente oder sogar die Grundfrequenz F 0 , fehlen, trotz dieser akustischen Unvollständigkeit interpretieren. In einer sehr bekannten Versuchsanordnung bot man Probanden englische Wörter an, in denen eines der Segmente durch eine Pause oder durch Hüsteln ersetzt war. Die Probanden identifizierten das Wort dennoch. Auffälliger war, dass ihnen das Fehlen eines Lauts gar nicht bewusst wurde. Sie waren vielmehr der Überzeugung, ein vollständiges Wort gehört zu haben (Samuel 1981). Solche perzeptiven Ergänzungen und Reparaturen 34 Unter http: / / www.youtube.com/ watch? v=jtsfidRq2tw&NR=1 lässt sich der sog. McGurk- Effekt sehr gut nachvollziehen. " 2 " ('+ 0 1 54 nehmen wir übrigens nicht nur im Laborversuch vor. Auch Daten, die über das Telefon übertragen werden, sind im Vergleich zu normalen lautsprachlichen Daten akustisch gesehen defektiv. Aus Kostengründen ist das übertragene Frequenzspektrum reduziert und endet im oberen und unteren Bereich früher als das Spektrum, das in der Lautproduktion ausgenutzt wird. Was den unteren Frequenzbereich anbelangt, hat dies zur Konsequenz, dass wir am Telefon keine F 0 -Frequenzen hören. Automatisch und unbewusst erschließen wir aber dennoch aus den übrigen akustischen Informationen den Verlauf des Grundtons, der ja für das Erkennen der Intonation zentral ist (4.5). Genauso wenig können wir am Telefon die beiden Frikative [s] und [f] voneinander trennen, da sich diese ausschließlich durch die unterschiedlichen Friktionskonzentrationen im ausgeblendeten oberen Frequenzbereich unterscheiden. Wir sind deshalb auf unser semantisches Wissen angewiesen, um Reif und Reis am Telefon richtig zu interpretieren (Goldstein 2008: 285). Zahlreiche Experimente haben außerdem nachgewiesen, dass eine lexikalische Beeinflussung des Hörvorgangs auch bei normalen, nicht defektiven Stimuli die Regel ist. Dies zeigten Experimente, in denen man englischsprachigen Probanden ein akustisches Kontinuum zwischen dem stimmhaften und dem stimmlosen Plosiv [d] und [t] zusammen mit zwei alternativen Fortsetzungen, nämlich [æ$] wie in dash und [ª sk] wie in task anbot. Die lautlichen Kategorisierungen, die die Probanden vornahmen, waren durch den Wunsch bestimmt, als Ergebnis ein sinnvolles Lexem angeben zu können. Bei der Präsentation des Stimulus [æ$] wurden signifikant mehr [d] und bei der Präsentation des Stimulus [ª sk] signifikant mehr [t] identifiziert (Ganong 1980). Man stellte außerdem fest, dass die Probanden dann, wenn die angebotenen Fortsetzungen zu unterschiedlich häufig gebrauchten Lexemen gehörten, genau die lautliche Einordnung wählten, deren Ergebnis das Lexem mit der höheren Frequenz war. Auch die Frage, ob es sich bei der abgefragten Phonemfolge um eine häufige Kombination handelte oder nicht, oder die Frage, ob das von den Probanden erzielte Perzeptionsergebnis mit den grammatischen Regeln der betreffenden Sprache übereinstimmte, beeinflusste die Einordnung der dargebotenen lautlichen Stimuli (Kingston 1995: 187, Pierrehumbert 2012). In anderen Perzeptionstests, in denen es um die Wahrnehmung von wortähnlichen Lautketten vor einem komplexen lautlichen Hintergrund ging, stellte man fest, dass die Identifikation echter Lexeme wesentlich leichter ist als die von Nonsenswörtern. Ebenso werden unter schlechten akustischen Bedingungen häufig vorkommende Lexeme schneller und sicherer identifiziert als selten gebrauchte (Kingston 1995: 187). Diese Experimente belegen, dass unsere lautliche Wahrnehmung auch durch die Frequenz der jeweiligen Formen geprägt ist. Formen mit einer höheren Gebrauchsfrequenz können schneller und sicherer aufgerufen werden, sind also anders ‘präsent’ als seltene Lexeme. Auch was den Zeitpunkt der Worterkennung anbetrifft, stellte man eine Beeinflussung des Hörvorgangs durch lexikalisches Wissen fest. Viele Experimente konnten nachweisen, dass es nicht notwendig ist, die gesamte Phonemfolge zu hören, bevor die Identifikation des Lexems einsetzen kann. In vielen Fällen reichen der Anfang bzw. die Anfangssilbe des Wortes aus, um den Probanden zu einem Identifizierungsvorschlag - und zwar einem richtigen - zu veranlassen. Auf der Grundlage dieser Daten formulierte William Marslen-Wilson sein berühmtes Kohortenmodell, in dem er vorschlug, dass der Hörer, sobald das oder die ersten Phoneme identifiziert sind, sofort Kohorten von Lexemen mit derselben Phonemfolge aktiviert und nur solange mit der Phonemanalyse fortfährt, bis nur noch ein Kandidat übrigbleibt (Marslen- 55 Wilson 1989). 35 Auch andere Worterkennungsmodelle, etwa das bekannte TRACE- Modell von James McClelland und Jeffrey Elman, gehen von einer frühen Vernetzung akustischer und lexikalischer Informationen aus (McClelland & Ellman 1986, Gaskell 2007). Die angesprochenen Experimente zeigen, dass ein akustisches ‘Weniger’ die Kommunikation nicht gefährdet, weil die kontextuelle Einbettung des Sprachsignals bereits sehr früh Inferenzen und Reparaturen ermöglicht. Viele Perzeptionsdaten deuten außerdem darauf hin, dass bereits vor der vollständigen Identifikation der Phonemkette Hypothesenbildungen über die ausgesprochenen Lexeme einsetzen. In diese Richtung weisen auch funktionale Überlegungen. Primäres Ziel des Hörens muss sein, dem Gesagten Bedeutung zuschreiben zu können, nicht, das lautliche Ereignis zweifelsfrei zu identifizieren (McMurray & Farris-Trimble 2012: 373). Wenn wir diese funktionale Zielbestimmung berücksichtigen, wird klar, dass Kommunikation auch ohne eine explizite Phonemerkennung erfolgreich sein kann. Bereits Karl Bühler hat diesen Gedanken geäußert. Er hat zwei Herangehensweisen an die akustischen Daten nebeneinander gestellt: eine erste, die ausgehend von einigen besonders prägnanten Lautmerkmalen und unter Rückgriff auf die kontextuellen Informationen eine schnelle lexikalische Identifizierung vornimmt, die so lange gilt, wie der weitere Verlauf des Gesprächs mit dieser Identifizierung zu vereinen ist. Erst wenn Schwierigkeiten auftreten, wird eine zweite Strategie gewählt, die auf dem sorgfältigeren Zuhören und der intensiven Nutzung aller verfügbaren akustischen Information beruht und in eine eindeutige Identifizierung der Phonemkette mündet (Bühler 1934: 271ff., Krefeld 1998: 129-144). Ein solches Nebeneinander unterschiedlicher kognitiver Strategien würde bedeuten, dass bei gesteigerter Aufmerksamkeit (wie im Laborversuch) eine phonematische Analyse und die Identifikation vollständiger Phonemketten Ziel unseres Hörens ist, dass aber in zahlreichen anderen Routinekontexten eine approximative auditive Analyse und eine spekulative lexikalische Identifizierung ausreichen. Es ist ein Kennzeichen menschlichen Wahrnehmens und Erkennens, dass es nicht oder nicht nur nach den Maßgaben eines algorithmischen Modells verläuft, bei dem in hierarchisch aufeinander aufbauenden Verarbeitungsstufen Ergebnisse erzielt werden, die durch das Durchlaufen zahlreicher Verarbeitungs- und Kontrollschritte vereindeutigt sind. Menschen benutzen auch und vielleicht sogar häufiger probabilistische Heuristiken, schnelle Schlüsse auf etwas, von dem wir zwar nicht sicher sind, dass es richtig ist, bei dem wir aber aufgrund unserer Erfahrung quasi sicher sein können (Goldstein 2008: 112). Derartige schnelle, vorläufige - und natürlich auch revidierbare - Schlüsse können wir bei der Sprachwahrnehmung ziehen, weil uns auch in frühen Verarbeitungsstufen sprachliches Wissen zur Verfügung steht, das wir aus unserer Erfahrung abgeleitet haben. 35 Zu einer Neuformulierung des Modells, bei der nicht mehr vom Erkennen von Phonemen, sondern vom Erkennen von Merkmalen ausgegangen wird, vgl. Lahiri (2012). " 2 " ('+ 0 1 56 2.5 Sprachlaute: Spanisch und Deutsch kontrastiv In diesem Unterkapitel wollen wir die Sprachlaute des Spanischen unter Einbeziehung regionaler Variation anhand phonetischer Kriterien beschreiben und sie mit denen des Deutschen vergleichen. Dafür müssen wir große Abstraktionen vornehmen: Wie wir in den vorangehenden Abschnitten gesehen haben, fallen zwei Lautereignisse, auch wenn sie als gleich intendiert werden, nie völlig identisch aus, und Laute, die wir aufgrund unserer kategorialen Wahrnehmung auditiv als gleich empfinden, können durch die Erscheinung der Koartikulation (vgl. 2.2.4) artikulatorisch und akustisch sogar erhebliche Unterschiede aufweisen. Von all dieser individuellen und umgebungsbedingten Variation der einzelnen Laute sehen wir ab und fassen phonetisch ähnliche Realisierungen zusammen. Bei dem, was wir, untergliedert in Konsonanten (2.5.1), Approximanten (2.5.2) und Vokale (2.5.3) hier als Sprachlaute vorstellen, handelt es sich folglich um ganze Klassen von ähnlichen Lauten, die wir einheitlich transkribieren und in einer “normalisierten” Form beschreiben. Auch wenn die Phoneme des Spanischen erst in Abschnitt 3.1.2 systematisch behandelt werden, weisen wir bereits hier - u.a. durch die Notierung in Schrägstrichen bzw. eckigen Klammern - darauf hin, welche dieser Lautklassen welchen Phonemen zuzuschlagen sind. 36 2.5.1 Konsonanten ARTIKULATIONS- MODUS STELLE bilabial stl. sth. labiodental stl. sth. (inter-) dental stl. sth. alveolar stl. sth. postalveolar stl. sth. palatal stl. sth. velar stl. sth. uvular stl. sth. glottal Plosive p b t d c « k Frikative - - f v ® s z $ ¯ ç ° x ± h O b s t r u e n t e n Affrikaten p²f p²f t²s d²z t d²¯ «²° Nasale m ³ n ´ Laterale l µ gerollt ¶ r - L i q u i d e V i b r a n t e n geschlag. S o n o r a n t e n Approximanten (w) - ® · j w ± ¸ Abb. 2.5-1 Konsonanten des Spanischen (und einiger anderer Sprachen). 36 Dieses Teilkapitel folgt über weite Strecken den entsprechenden Ausführungen in Hualde (2005) und Kubarth (2009), ohne dass dies jeweils gesondert angezeigt wird. 57 In Abb. 2.5-1 sind die Konsonanten des Spanischen, des Deutschen sowie weiterer (vornehmlich romanischer) Sprachen zusammengestellt. Segmente, die in allen Varietäten des Spanischen mit Phonemstatus vertreten sind, erscheinen groß, fett und schwarz. Für die ebenfalls groß, aber nicht fett gedruckten Symbole gilt dieser Status nur in bestimmten Regionen des spanischen Sprachraums. Die kleineren schwarzen Zeichen stehen für allophonische Varianten. Nicht oder nur marginal im Spanischen, dafür aber in anderen (romanischen) Sprachen und/ oder im Deutschen auftretende Konsonanten erscheinen kleiner und grau. 37 2.5.1.1 Plosive und Frikativapproximanten Wie viele andere Sprachen (u.a. das Deutsche) verfügt das Spanische über drei Reihen von Plosiven, die nach der Artikulationsstelle in (bi-)labiale, alveolare (bzw. dentialveolare 38 ) und velare Verschlusslaute unterteilt werden. Aus der Perspektive der beteiligten Zungenpartie (Zungenkranz oder Zungenrücken) werden die beiden letzteren auch als koronale bzw. dorsale Plosive gefasst. Alle drei können jeweils stimmlos und stimmhaft auftreten: / p t k/ und / b d / . Die stimmlosen Plosive des Spanischen kommen vornehmlich am Wort- und Silbenanfang vor. Gemeinsam mit einem Liquid (/ l/ oder / / , nach / t/ nur / / ) können sie auch einen komplexen Anfangsrand bilden. In der Schreibung entsprechen ihnen in der Regel die Buchstaben , <t>, <c>. Für / k/ steht vor <e> und das Digraphem <qu>. stimmlose Plosive / p/ [p] [pan] pan ‘Brot’ [ sopa] sopa ‘Suppe’ [plan] plan ‘Höhe’ [ kompa] compra ‘Einkauf’ / t/ [t] [tan] tan ‘so’ [ lata] lata ‘Dose’ [ taxe] traje ‘Anzug’ [ leta] letra ‘Buchstabe’ / k/ [k] [kal] cal ‘Kalk’ [a ki] aquí ‘hier’ [kwel] cruel ‘grausam’ [ tekla] tecla ‘Taste’ Die Distribution der stimmhaften Plosive des Spanischen ist stark eingeschränkt. Als Plosive [b d ] kommen sie nur nach Pause (d.h. im absoluten Anlaut) oder aber nach Nasalkonsonant vor, [d] außerdem nach Lateral (vgl. Abb. 2.5-3, links und Mitte). In allen anderen Positionen - wenn ihnen also weder eine Pause noch ein homorganer, d.h. an derselben Artikulationsstelle gebildeter Konsonant vorangeht - unterliegen sie der sog. Spirantisierung (sp. espirantización): Lippen oder Zunge bilden keinen kompletten Verschluss, sondern nur eine mehr oder weniger eingeschränkte Enge, durch die die Luft wie im frikativischen Artikulationsmodus ausströmt. Dies geschieht jedoch in der Regel ohne Erzeugung des für Frikative charakteristischen Reibegeräuschs, was sich anhand von spektrographischen Analysen demonstrieren lässt: Das 37 Gegenüber der IPA-Klassifizierung (vgl. Anhang) bleiben einige Kategorien, die weder für das Spanische noch für das Deutsche relevant sind, ausgespart. Stattdessen wurden Affrikaten und weitere Approximanten in die Darstellung aufgenommen. 38 Da bei der Artikulation von sp. [t] und [d] die Zungenspitze die Rückseite der oberen Schneidezähne berührt, werden sie oft als (apiko)dental charakterisiert (vgl. z.B. Hualde 2005: 47). Unter Berufung auf Ladefoged & Maddieson (1996: 21) und Navarro Tomás (1977: 97) weist Martínez Celdrán (2008: 43f.) darauf hin, dass der Kontaktbereich die Alveolen miteinschließe, sodass die korrekte Beschreibung der Artikulationsstelle ‘laminodenti-alveolar’ sei. $% #$! " 3 $ % ! ! " % " $ " 2 ('/ 0 1 58 aperiodische Friktionsrauschen der Frikative fehlt hier; stattdessen wird eine deutliche Formantstruktur sichtbar (vgl. Abb. 2.5-3, rechts). Es erscheint daher sinnvoll, diese allophonischen Varianten der stimmhaften Plosive als Approximanten zu klassifizieren (vgl. Martínez Celdrán 1991, 2008). Um die phonetische Nähe zu den Frikativen aufzuzeigen, schlagen wir in Anlehnung an sp. aproximantes espirantes das Kompositum ‘Frikativapproximanten’ vor, denn zur Transkription dieser Laute werden die IPA-Zeichen für Frikative verwendet: [- ® ±]. 39 Während [-] und [±] dieselben Artikulationsstellen aufweisen wie [b] und [], wird die Enge bei der approximantischen Realisierung von / d/ zwischen Zungenspitze und Zähnen gebildet; es handelt sich also um einen (inter)dentalen Laut. Auch / b d / können zusammen mit den Liquiden / / oder / l/ (/ d/ nur mit / / ) einen komplexen Onset bilden. Wie aus den folgenden Beispielen ersichtlich wird, ist im Fall von [b]/ [-] die Schreibung mit oder <v> für die Aussprache völlig irrelevant; entscheidend für die Lautung ist allein der Kontext: Ein vorn mit <v> geschriebenes Wort wird nach einer Pause oder nach einem unmittelbar vorangehenden Nasalkonsonanten genauso mit anlautendem [b] gesprochen wie ein mit dem Buchstaben beginnendes. Im Fall des vorangehenden Nasalkonsonanten erfolgt - wiederum unabhängig von der Schreibung - seine automatische Anpassung an den bilabialen Plosiv: Er wird folglich immer bilabial (als [m]) gesprochen (vgl. 2.5.1.3). In allen anderen Fällen werden und <v> unterschiedslos als [-] realisiert. Spanischsprachige Kinder können also hier die Schreibung nicht aus der Aussprache herleiten, sondern müssen für jedes Wort lernen, ob es mit (b [be] alta, b de burro) oder <v> (v [be] 40 baja, v de vaca) geschrieben wird. / d/ wird durch <d> wiedergegeben und / / durch <g>, außer vor <e> und , wo das Digraphem <gu> stehen muss. stimmhafte Plosive / b/ [b] nach Pause nach Nasalkonsonant [ban] van ‘sie gehen’ [um baso] un vaso ‘ein Glas’ [ bote] bote ‘Schlag’ [um bote] un bote ‘ein Schlag’ [ basa] brasa ‘Glut’ [tam bla´ko] tan blanco ‘so weiß’ [-] in allen anderen Positionen [se -an] se van ‘sie gehen fort’ [dez -an] desván ‘Speicher’ [la -ata] la bata ‘der Kittel’ [ a-ol] árbol ‘Baum’ [ ko-e] cobre ‘Kupfer’ [a -la] hablar ‘sprechen’ / d/ [d] nach Pause nach Nasalkonsonant, nach Lateral [dan] dan ‘sie geben’ [un disko] un disco ‘eine Scheibe’ [ dama] drama ‘Drama’ [el disko] el disco ‘die Scheibe’ [®] in allen anderen Positionen [lo ®an] lo dan ‘sie geben es’ [loz ®an] los dan ‘sie geben sie’ [ pa®e] padre ‘Vater’ [ez ®uxulo] esdrújulo ‘3.letztbetont’ 39 Traditionell zählen die approximantischen Realisierungen der stimmhaften Plosive des Spanischen zu den Frikativen (vgl. Navarro Tomás 1977: 80 u.v.a.). Um den Approximantenstatus in der Transkription deutlich zu machen, wird ihrem IPA-Symbol bisweilen das (sub- oder supraskribierte) Diakritikon [¹] hinzugefügt, das für Senkung steht (so z.B. in NGRAE 2011). Der Einfachheit halber verzichten wir hier auf dieses zusätzliche Zeichen, haben [- ® ±] in Abb. 2.5-1 jedoch auch unter den Approximanten aufgeführt. 40 Im neuesten Regelwerk zur spanischen Orthographie wird empfohlen, den Namen des Buchstabens <v> zu uve zu vereinheitlichen (ORTE 2010: 69). 59 / / [] nach Pause 41 nach Nasalkonsonant [i sante] guisante ‘Erbse’ [u´i sante] un guisante ‘eine Erbse’ [ ato] grato ‘angenehm’ [ko´ losas] con glosas ‘mit Glossen’ [±] in allen andern Positionen [ a±o] hago ‘ich mache’ [ al±o] algo ‘etwas’ [ lo±o] logro ‘Gewinn’ [a±luti na] aglutinar ‘aufkleben’ Abb. 2.5-2 zeigt in sog. Sagittalschnitten die Stellung der Sprechwerkzeuge bei der Artikulation der spanischen Plosive und Frikativapproximanten. a) [p/ b] b) [-] c) [t/ d] d) [®] e) [k/ ] f) [±] Abb. 2.5-2 Sagittalschnitte der Artikulation spanischer Plosive und Frikativapproximanten (aus Kubarth 2009: 99, 102, 108). In Abb. 2.5-3 werden Spektrogramme von spanischen Äußerungen mit den verschiedenen Realisierungen der stimmhaften Plosive vorgestellt. Während [b] in bueno (nach Pause) und [d] in cual de ellos (nach Lateral) als stimmhafte Plosive den charakteristischen schmalen senkrechten Streifen der Verschlusslösung (engl. burst) aufweisen, setzt sich das Signal während des [-] in der Flexionsendung der Verbform soplaba unter leichter Absenkung und Schwächung der Formanten kontinuierlich fort. Vergleicht man die stimmhaften Plosive [b] und [d] mit den stimmlosen Plosiven [k] und [p] in cual und soplaba, so fällt auf, dass sich letztere nicht nur durch das Fehlen der voice bar von ersteren unterscheiden, sondern dass ihre Verschlussphase auch deutlich länger ist. b w e n o k w a l d e j o s s o p l a - a Abb. 2.5-3 Spektrogramme, links: sp. bueno (nach Pause), Mitte: sp. cual de ellos, rechts: sp. soplaba. Festzuhalten ist, dass die komplementäre Distribution, das Auftreten in einander ausschließenden Kontexten, wie wir es soeben für die Allophone [b d ] und [- ® ±] der stimmhaften Plosive präsentiert haben, eine (für Lerner hilfreiche) Vereinfachung darstellt. In der Realität haben wir es eher mit einem Kontinuum zu tun, das vom kompletten Verschluss bis zur vollständigen Tilgung reicht. Neben der lautlichen 41 [] entsteht auch, wenn der Gleitlaut [w] nach Pause oder nach Nasal verstärkt wird: [ weso]~[ weso], [ko´ weso] (con) hueso ‘(mit) Knochen’, [ wiski]~[ wiski] whisky/ güisqui ‘Whisky’ (vgl. 2.5.2). $% #$! " 3 $ % ! ! " % " $ " 2 ('/ 0 1 60 Umgebung steuern auch diatopische, diastratische und diaphasische Faktoren die tatsächliche Realisierung (vgl. dazu ausführlich NGRAE 2011: 144ff.). Da offene Silben im Spanischen bevorzugt werden (vgl. 4.2.4), sind Plosive in der Coda prinzipiell in einer schwachen Position, in der sie Neutralisierungs- und Tilgungsprozessen unterliegen. Den Tendenzen zur Öffnung der Silbe stehen jedoch etymologisierende Normierungsbestrebungen entgegen, wie sie zumindest teilweise für die Arbeit der Real Academia Española kennzeichnend sind. Sie haben dazu geführt, dass in der spanischen Orthographie viele der bereits im Schwinden begriffenen Konsonanten am wortinternen Silbenende ‘festgeschrieben’ wurden, weshalb sie heute - zumindest in einer gepflegten Aussprache - auch in der Lautung wieder präsent sind. Allerdings ist der Kontrast zwischen den stimmlosen und den stimmhaften Plosiven in der wortinternen Coda neutralisiert; als Standardaussprache kann - unabhängig von der Schreibung - der stimmhafte Frikativapproximant gelten, doch auch der stimmhafte oder, in emphatischer Sprechsituation, der stimmlose Plosiv sind möglich. Plosive in der wortinternen Coda [- ~ p] óptimo [ o-timo] ~ [ obtimo] ~ [ optimo] ‘bester’ obtiene [otjene] ~ [ob tjene] ~ [op tjene] ‘er/ sie erhält’ [® ~ t] étnico [ e®niko] ~ [ edniko] ~ [ etniko] ‘ethnisch’ admirar [a®mi a] ~ [admi a] ~ [atmi a] ‘bewundern’ [± ~ k] signo [ si±no] ~ [ sino] ~ [ sikno] ‘Zeichen’ pacto [ pa±to] ~ [ pato] ~ [ pakto] ‘Pakt’ Am Wortende ist im Spanischen nur der Plosiv / d/ möglich, der auch in dieser Position meist als Frikativapproximant [®] realisiert wird. Vor allem umgangssprachlich und in mehrsilbigen Wörtern ist aber auch die komplette Tilgung verbreitet, während in Nordspanien hier oft der stimmlose interdentale Frikativ [] artikuliert wird. Andere Plosive treten wortfinal nur in Entlehnungen auf, und zwar wenn eine ausgangssprachliche - schriftorientierte - Aussprache angestrebt wird. Aber auch hier kommt es häufig zu Neutralisierungen oder vollständigen Tilgungen, die teilweise auch in die Schreibung eingegangen sind. Plosive in der wortfinalen Coda / d/ <-d> [® ~ ~ 0 ] [sa lu®] ~ [sa lu] ~ [sa lu] salud ‘Gesundheit’ <-t> [t ~ ® ~ 0 ] [¢a let] ~ [¢a le®] ~ [¢a le] chalet/ chalé ‘Landhaus’ <-g> [±~x~k~ 0 ] [ise -e±]~[- -ex]~[- -ek]~[- -e] iceberg ‘Eisberg’ <-c/ -k> [k ~ ± ~ 0 ] [ko »ak] ~ [ko »a±]~ [ko »a] coñac/ coñá ‘Cognac’ <-b> [- ~ b ~ 0 ] [klu-] ~ [klub] ~ [klu] club ‘Club’ <-p> [p~b~-~ 0 ] [ ke¢up]~[ ke¢ub]~[ ke¢u-]~[ ke¢u] ketchup ‘Ketchup’ Abgesehen davon, dass das Deutsche keine Frikativapproximanten kennt, unterscheiden sich deutsche und spanische Plosive vor allem durch die Erscheinungen der Aspiration und der Entstimmung. Bei der Artikulation der stimmlosen Plosive im Spanischen beginnen die Stimmlippen im Moment der Verschlusslösung zum Vokal oder ganz kurz darauf zu vibrieren. Im Deutschen dagegen wird dieser Prozess in der Regel verzögert, sodass zwischen Plosiv und Vokal noch ein Geräuschlaut hörbar wird: Die stimmlosen Plosive werden in fast allen Positionen mehr oder weniger stark aspiriert. Die Zeit, die die Stimmlippen brauchen, um in Schwingung zu geraten, wird mit dem englischen Fachterminus als voice onset time bezeichnet, abgekürzt 61 VOT. Spanische Plosive haben folglich eine ganz kurze VOT, deutsche eine lange. Schematisch sind diese Zusammenhänge in Abb. 2.5-4 dargestellt. VOT p a p h a Abb. 2.5-4 Links: unaspirierter Plosiv; rechts: aspirierter Plosiv (schematische Darstellung nach Catford 1988: 58). In Oszillogramm und Spektrogramm ist die VOT, die auditiv als ‘Behauchung’ wahrgenommen wird, als aperiodisches Friktionsrauschen zu erkennen (vgl. Abb. 2.5-5). Hält man sich ein Stück dünnes Papier, eine Feder oder die Flamme einer brennenden Kerze dicht vor den Mund, während man Wörter wie dt. Panne, Tal oder Kappe sagt, so werden Papier, Feder oder Flamme durch die Aspiration in viel stärkere Bewegung versetzt, als das bei den nicht aspirierten spanischen Plosiven wie in pan, tapas oder capa der Fall ist. In enger Transkription des Deutschen wird die Aspiration durch ein kleines hochgestelltes [ h ] nach dem Zeichen für den Plosiv symbolisiert. Nach anlautendem [$], also in Wörtern wie [$ta l] Stahl (gegenüber [t h a l] Tal) oder [ $pan ] Spanne (gegenüber [ p h an ] Panne) werden die stimmlosen Plosive des Deutschen nicht aspiriert. Solche Wörter sind also ein guter Ausgangspunkt, um die Artikulation der nicht aspirierten Plosive des Spanischen zu üben. k p a k h a p h 0 VOT: 0,015 VOT: 0,008 0,33s 0 VOT: 0,047 VOT: 0,032 0,38s Abb. 2.5-5 Oszillo- und Spektrogramme, links: sp. capa, rechts: dt. Kappe; jeweils mit Angabe der voice onset time (VOT) in Sekunden. Bei voll stimmhaften Plosiven beginnt die Schwingung der Stimmlippen gleichzeitig mit der Verschlussbildung. Verzögert sich dagegen der Schwingungseinsatz, so sind die Plosive nur partiell stimmhaft; sie werden mehr oder weniger stark desonorisiert. In der Transkription wird diese Entstimmung durch einen kleinen Kreis unter oder über dem Zeichen für den stimmhaften Plosiv angezeigt: [b¼ d¼ ½]. In Abb. 2.5-6 5000 0 Lippen Glottis ('/ $% #$! " 3 $ % ! ! " % " $ " 2 a 0 1 62 ist die zeitliche Koordination der Stimmlippen zunächst wieder schematisch dargestellt. b a b¼ a Abb. 2.5-6 Links: voll stimmhafter Plosiv, die Stimmlippen schwingen seit Beginn des Verschlusses; rechts: partiell stimmhafter bzw. (teil)entstimmter Plosiv, die Schwingung setzt erst kurz vor Verschlusslösung ein (schematische Darstellung nach Catford 1988: 58). Bei den stimmhaften Plosiven des Spanischen beginnt die Schwingung der Stimmlippen gleichzeitig mit der Verschlussbildung, was sich im Sonagramm an der voice bar erkennen lässt (vgl. [b] in bueno und [d] in cual de ellos in Abb. 2.5-3 links und Mitte). Es handelt sich also um voll stimmhafte Plosive. Im Deutschen erfolgt der Einsatz der Schwingungen bei stimmhaften Plosiven zwar meist noch vor der Lösung des Verschlusses, doch ist er in der Regel so weit verzögert, dass sie desonorisiert erscheinen. Der Unterschied zwischen stimmlosen und stimmhaften Plosiven ist demnach im Deutschen anders als im Spanischen oft gar nicht in der Aktivität der Stimmlippen begründet, sondern wird aufgrund der An- oder Abwesenheit von Aspiration wahrgenommen, ist also durch die Dauer der VOT bestimmt: Einen nicht aspirierten Plosiv hören wir als stimmhaft, auch wenn die Stimmlippen gar nicht schwingen. Das wird in Abb. 2.5-7 deutlich, wo der Unterschied zwischen / p/ in Tanzpaar und / b/ in Tanzbar allein in der Aspiration des ersteren liegt. Beim / b/ in Tanzbar gibt es keine voice bar, und auch das Oszillogramm zeigt keine Schwingungen an; es ist also völlig entstimmt. Wenn wir diese Aussprachegewohnheit des Deutschen auf das Spanische übertragen, so müssen wir damit rechnen, dass unsere [b¼ d¼ ½]-Laute als stimmlose Plosive wahrgenommen werden. Um die Artikulation voll stimmhafter Plosive zu trainieren, ist es hilfreich, ihnen zunächst einen homorganen Nasal voranzusetzen, also von Formen wie [ m bweno], [ n di±a] oder [ ´ ol] auszugehen. t h a n ¾ p h a À t h a n ¾ b¼ a À 0 VOT: 0,030 VOT: 0,034 0,76s 0 VOT: 0,041 0,73s Abb. 2.5-7 Oszillo- und Spektrogramme, links: dt. Tanzpaar, rechts: dt. Tanzbar. Lippen Glottis 63 2.5.1.2 Frikative und Affrikaten Bei den Frikativen zeichnen sich die verschiedenen Dialekte des Spanischen durch vielfältige Variation aus. Während das kastilische Spanisch, das oft als europäischer Standard gilt, mit / f s x/ über vier stimmlose Frikativphoneme verfügt, kennt der lateinamerikanisch-südspanische Standard mit / f s x/ nur drei davon. Gemeinsam ist allen Varietäten, dass die entsprechenden stimmhaften Frikative zwar aufgrund von Assimilationen, also Anpassungen an die lautliche Umgebung, vorkommen können, aber nirgends als Phoneme des Spanischen vertreten sind. Von den stimmlosen Frikativphonemen wird nur / f/ überall relativ einheitlich als labiodentaler Frikativ [f] realisiert. 42 Außer in Lehnwörtern tritt dieser Konsonant nur am Wort- und Silbenanfang auf, wo ihm noch ein Liquid folgen kann. Kommt er in der Coda vor, so gibt es auch hier Schwächungsprozesse, die bis zu vollständiger Tilgung gehen können. Vor einem stimmhaften Konsonanten wird / f/ in der Coda sonorisiert: Dies ist die einzige Konstellation, in der im Spanischen der stimmhafte labiodentale Frikativ [v] (vgl. dt. [vas] was) möglich ist. In der Graphie steht für / f/ immer <f>. labiodentaler Frikativ / f/ [f] [ feo] feo ‘hässlich’ [fo netika] fonética ‘Phonetik’ [flo] flor ‘Blume’ [ kofe] cofre ‘Kiste’ [roz -i f ] rosbif ‘Roastbeef’ [av ±ano] afgano ‘Afghane’ Die übrigen stimmlosen Frikative weisen deutliche regionale Unterschiede auf: Bei der Aussprache von / s/ im kastilischen Spanisch wird die Enge zwischen der Spitze der längsgerillten Zunge und dem Zahndamm gebildet; der Konsonant ist also apikoalveolar, was in enger Transkription durch ein nach oben offenes Rechteck (für apikal) unter dem Zeichen angezeigt werden kann: [sÁ]. Wegen der nach innen gebogenen Zunge wird dieses [sÁ] im Spanischen auch als ese cóncava bezeichnet. Im lateinamerikanischen (und südeuropäischen) Spanisch wird / s/ dagegen mit stärker vorgeschobenem längsgerillten Zungenkörper artikuliert, sodass die Enge, wie in der Regel auch im Deutschen, zwischen Alveolen und Zungenblatt gebildet wird. Dieser s-Laut wird als prädorsoalveolar vom apikoalveolaren kastilischen [sÁ] unterschieden; wegen der nach oben gewölbten Zunge heißt er im Spanischen auch ese convexa. In enger Transkription kann diese Artikulationsstelle durch ein komplett geschlossenes Rechteck (für laminal) unter dem Lautsymbol genauer gekennzeichnet werden: [sÂ]. Bei der Artikulation des stimmlosen (inter)dentalen Frikativs / / ist die Zunge nicht gerillt, sondern flach. Dieser Laut, der der Aussprache des englischen <th> in think [´k] oder teeth [ti ] entspricht, ist neben dem alveolaren Frikativ nur im Konsonantensystem Nord- und Zentralspaniens sowie in kleineren Teilen Andalusiens verankert. Das sind die Gebiete, in denen folglich distinción, Unterscheidung zwischen / / und / s/ , praktiziert wird. Im lateinamerikanischen Spanisch wie auch auf den Kanarischen Inseln und im Großteil Andalusiens und der Extremadura wird / / durchgehend durch den prädorsoalveolaren Frikativ ersetzt, sodass hier nur ein einziges Phonem vorhanden ist. In der spanischen Dialektologie wird dieser Zusammenfall von / / und / s/ zu / s/ als seseo bezeichnet. 42 In ländlichen Gebieten Spaniens und Lateinamerikas kommt daneben auch die Realisierung als stimmloser bilabialer Frikativ [-] vor, nach Pompino-Marschall (2009: 101) der ‘Suppenblaselaut’. ('/ $% #$! " 3 $ % ! ! " % " $ " 2 0 1 64 In Teilen Andalusiens (vornehmlich im Südwesten dieser Region) sind / / und / s/ ebenfalls zu einem Phonem zusammengefallen, doch dies wird dental artikuliert, sodass es eher wie das kastilische [] klingt. Diese als ceceo bezeichnete Aussprache gilt als rustikal und ist damit nicht nur diatopisch, sondern auch diastratisch markiert. Dort, wo eine Opposition zwischen / / und / s/ fortbesteht, also distinción praktiziert wird, können beide Konsonanten sowohl im Anfangsrand als auch in der Coda von wortinitialen, -finalen und -internen Silben auftreten, während die Opposition in den seseo-Gebieten zu [sÂ] neutralisiert wird (in den ceceo-Gebieten entsprechend zu []). Vor dem alveolaren Plosiv / t/ und dem dentalen Frikativ / / wird silbenfinales / s/ immer prädorsoalveolar als [sÂ] artikuliert. Vor einem stimmhaften Konsonanten können beide Frikative auch stimmhaft auftreten. Die Stimmhaftigkeit des folgenden Konsonanten breitet sich dann auf den vorangehenden Frikativ aus und assimiliert ihn in diesem Merkmal, sodass [®] bzw. [z] statt [] bzw. [sÁ] gesprochen wird. Um den stimmhaften Frikativ [®] vom entsprechenden Approximanten zu unterscheiden, kann unter das Symbol ein kleines [Ã] gesetzt werden, das für Anhebung steht und deutlich macht, dass der Abstand zwischen Zunge und Zähnen so eng ist, dass ein echter Frikativ entsteht: [®Å]. Alternativ kann unter das Symbol für den stimmlosen Konsonanten ein kleines, oben offenes Dreieck gesetzt werden, das Stimmhaftigkeit anzeigt: [sÆ] bzw. [Æ]. In allen anderen Positionen sind diese Frikative immer stimmlos, und deutschsprachige Lerner sollten darauf achten, am Wortanfang nicht automatisch stimmhaftes [z] zu verwenden (vgl. dt. [ zp ] Suppe vs. sp. [ sopa] sopa). In der Schreibung des Spanischen wird / s/ durch den Buchstaben <s> wiedergegeben, / / durch den Buchstaben <z>; nur vor <e> und wird für / / fast immer der Buchstabe <c> gesetzt. In den Regionen, in denen der Kontrast zwischen / / und / s/ neutralisiert wurde, kann aus der Lautung nicht auf die Schreibung (<s> oder <c>/ <z>) geschlossen werden. dentaler Frikativ / / distinción / / [] [ ine] cine ‘Kino’ [ kaa] caza ‘Jagd’ [pa] paz ‘Friede’ [ mekla] mezcla ‘Mischung’ [®Å]~[Æ]~[] [xu®Å ±a] ~ [xuÆ ±a]~[xu ±a] juzgar ‘richten’ (apiko)alveolarer Frikativ / s/ distinción / s/ [sÁ] [sÁin] sin ‘ohne’ [ kasÁa] casa ‘Haus’ [masÁ] mas ‘mehr’ [sÁ]~[z]~[sÆ] [ asÁno]~[ azno]~[ asÆno] asno ‘Esel’ [sÂ] [esÂ ena] escena ‘Szene’ [ asÂta] hasta ‘bis’ (prädorso)alveolarer Frikativ / s/ Zusammenfall von / / und / s/ seseo / s/ [sÂ] [ sÂine]/ [sÂin] cine/ sin [ kasÂa] caza/ casa [masÂ]/ [pasÂ] mas/ paz [ asÂta] hasta [e sÂena] escena [ azno]~[ asÆno]~[ asÂno] asno [xuz ±a]~[xusÆ ±a]~[xusÂ ±a] juzgar In zahlreichen Varietäten des Spanischen unterliegt / s/ in der Coda allerdings noch viel weitergehenden Assimilationsprozessen, die neben genereller Schwächung vor allem die Aspiration (Artikulation als glottaler Frikativ [h]) und die völlige Tilgung einschließen (4.2.4.2). Nur in den nördlichen Regionen Spaniens und im Hochland Lateinamerikas ist / s/ in der Coda meist als alveolarer Frikativ bewahrt. Dort, wo Coda-s geschwächt wird, geschieht dies nicht einheitlich, sondern ist vielfältig variiert. Die Variation wird durch soziale Faktoren gesteuert, wenn Aspiration oder Tilgung verstärkt in informellen Sprechstilen und/ oder bei weniger gebildeten Spre- 65 chern auftreten. Doch auch der phonologische Kontext spielt eine wichtige Rolle: So ist die Schwächung des Coda-s in vorkonsonantischer Position am stärksten ausgeprägt, wobei es meist keinen Unterschied macht, ob die folgende Silbe innerhalb des Wortes oder am Anfang des nächsten Wortes mit einem Konsonanten beginnt. In den betroffenen Varietäten wird / s/ in diesen Fällen besonders häufig aspiriert. Im andalusischen Spanisch kann die Schwächung auch bewirken, dass der folgende Konsonant gelängt und gegebenenfalls (teil)entstimmt wird. Im kanarischen Spanisch dagegen werden / sb sd s/ als lange stimmhafte Plosive [b d ] realisiert. Die zweithäufigste Schwächungsposition ist der Auslaut vor einer Pause; hier finden sich sowohl Aspiration als auch Tilgung. Seltener tritt Schwächung von wortfinalem -s vor einem vokalisch anlautenden Wort auf, da der Konsonant hier normalerweise die Codaposition verlässt und als Anfangsrand der folgenden Silbe resyllabiert wird (vgl. 4.2). Aspiration und Tilgung von / s/ in Codaposition vor Konsonant __.(#)C [pah. tel] ~ [pa. tel] pastel ‘Kuchen’ [mah. ta®e] ~ [ma. ta®e] más tarde ‘später’ andal. [ a h k o] asco ‘Ekel’ [ mim¼mo] mismo ‘selbe’ [l . x at ] los gatos ‘die Katzen’ kanar. [la b ela] las velas ‘die Kerzen’ vs. [la -ela] la vela ‘die Kerze’ vor Pause __Ç [ bamoh] ~ [ bamo] ¡vamos! ‘gehen wir! ’ vor Vokal __#V [lo sotoh] ~ [lo soto] ~ [loh otoh]~[lo hotoh] los otros ‘die anderen’ Der velare Frikativ / x/ , im Spanischen nach dem Namen des Buchstaben <j> auch jota genannt, wird im europäischen Standard eher postvelar bzw. uvular als [] realisiert (wie in dt. Dach [da]), in Andalusien und auf den kanarischen Inseln dagegen oft als glottaler Frikativ [h] (wie in dt. hat [hat]). Auch im lateinamerikanischen Spanisch kommt [h] als Realisierung vor (so in der Karibik und in zentralamerikanischen und kolumbianischen Varietäten), während in Mexiko, Peru, Chile und Argentinien die Realisierung als velarer Frikativ [x] (wie in dt. [hox] hoch) vorherrscht. Vor den vorderen Vokalen / i/ und / e/ wird die Aussprache dieses Frikativs automatisch etwas weiter nach vorn verlagert. Im chilenischen Spanisch ist diese Anpassung an die Artikulation der vorderen Vokale so weit gegangen, dass der Frikativ hier palatal realisiert wird, also als [ç] (wie in dt. [ç] ich). / x/ tritt fast ausschließlich wort- und silbeninitial auf und wird in der (wortfinalen) Coda vorzugsweise getilgt. In der Schreibung steht für / x/ vornehmlich der Buchstabe <j>, vor <e> und auch <g>, wenn die lateinische Ausgangsform (das Etymon) ein <g> aufweist. velarer Frikativ / x/ [] [ io] giro < GYRUS ‘Dreh’ [i nete] jinete < ar. zeneti ‘Reiter’ [mu e] mujer < MULIEREM ‘Frau’ [ ente] gente < GENTEM ‘Leute’ [a mas] jamás ‘nie’ [ bao] bajo ‘niedrig’ [re lo] ~ [re lo] reloj ‘Uhr’ [h] [ hio]/ [hi nete]/ [mu he]/ [ hente]/ [ha mas]/ [ baho]/ [re loh] ~ [re lo] [x] [ xio]/ [xi nete]/ [mu xe]/ [ xente]/ [xa mas]/ [ baxo]/ [re lox] ~ [re lo] [ç] [ çio]/ [çi nete]/ [mu çe]/ [ çente] Mit dem Phonem / °/ soll hier unter den Frikativen ein weiterer Laut des Spanischen behandelt werden, dessen Realisierung als stimmhaft und (dorso)palatal eindeutig ('/ $% #$! " 3 $ % ! ! " % " $ " 2 0 1 66 ist, dessen Artikulationsmodus jedoch je nach Kontext und Varietät mehr oder weniger stark changiert: Der Frikativ [°] entsteht, wenn der Zungenrücken so dicht an den harten Gaumen angenähert wird, dass bei der Artikulation aufgrund der Engebildung ein Reibegeräusch erfolgt. Ist die Annäherung weniger ausgeprägt, ertönt statt des Frikativs der entsprechende Approximant [j] und damit ein weiterer Frikativapproximant. 43 Geht die Annäherung dagegen bis zum völligen Kontakt, der gesprengt werden muss, so erhalten wir den palatalen Plosiv [«]. Dieser geht in der Regel gleich in den Frikativ [°] über, sodass in solchen Fällen meist die Affrikate [«²°] realisiert wird. Fast überall im spanischsprachigen Raum hat / °/ heute den palatalen Lateral / µ/ (s. 2.5.1.4) ersetzt - ein Lautwandel, dessen Ergebnis auch als yeísmo bezeichnet wird. / °/ ist in seiner Distribution auf den Anfangsrand von Wörtern und Silben beschränkt, und es muss ihm immer unmittelbar ein Vokal folgen. Als kastilische Standardrealisierung gilt [°]; nach Nasal oder Lateral (die in diesem Kontext palatalisiert erscheinen) wird die Affrikate [«² °] artikuliert. Diese ist jedoch auch oft am Anfang einer Äußerung zu finden, und umgangssprachlich kann sie - wohl ausgehend von emphatischer Verstärkung - in allen Positionen auftreten (4.2.4.1). Im nördlichen Mexiko sowie in US- und zentralamerikanischen Varietäten ist es dagegen üblich, / °/ ganz ohne Reibegeräusch als [j] zu artikulieren; nach vorderem Vokal kann der Approximant sogar ganz entfallen. Im argentinischen Spanisch (und auch darüber hinaus in lateinamerikanischen Varietäten) finden wir statt (dorso)palatalem / °/ den postalveolaren Frikativ / ¯/ . Hier hat sich also auch die Artikulationsstelle verändert. / ¯/ wird im heutigen Argentinien nicht nur als stimmhaftes [¯] ( eísmo), sondern vor allem von jüngeren Leuten bevorzugt als stimmloser Frikativ [$] artikuliert ( eísmo). Geschrieben wird / °/ mit dem Buchstaben <y> oder, wenn aus / µ/ hervorgegangen, mit dem Doppelgraphem <ll>. Vor <e> (seltener vor <a>) kann ihm auch die Buchstabenfolge <hi> entsprechen. (dorso)palataler Frikativ / °/ [°] [ °eso] yeso ‘Gips’ [ °eno] lleno ‘voll’ [ °elo] hielo ‘Eis’ [ ma°o] mayo ‘Mai’ [ ma°a] malla ‘Masche’ [dez °elo] deshielo ‘Tauwetter’ [«²°] [en j «²°e sa] enyesar ‘gipsen’ [el j «²°eso] el yeso ‘der Gips’ [un j «²°u´ke] un yunque ‘ein Amboss’ [ «²°olo se] yo lo sé (vs. [lose °o] lo sé yo) ‘ich weiß es’, doch auch [ o«²°e] ¡oye! ‘hör! ’ [j] [ pojo] pollo ‘Huhn’ [ sija] ~ [ sia] silla ‘Stuhl’ postalveolarer Frikativ (Argentinien, Uruguay) / ¯/ [¯] [ ¯eso] yeso [ ¯eno] lleno aber [ °elo]~[ jelo] hielo [ ma¯o] mayo [ ma¯a] malla aber [dez °elo]~[dez jelo] deshielo [d²¯] [enÈd²¯e sa] enyesar [unÈ d²¯u´ke] un yunque [elÈ d²¯eso] el yeso [$] [ $eso]/ [ $eno]/ [ ma$o]/ [ ma$a] Wie wir in 2.2.3.2 gesehen haben, bestehen Affrikaten aus zwei Phasen: Die Verschlusslösung eines Plosivs geht an derselben Artikulationsstelle unmittelbar in das Reibegeräusch eines Frikativs über. Neben der Affrikate [«² °], die wir als eine mögliche Realisierung des palatalen Frikativs / °/ kennengelernt haben, besitzt das Spanische mit postalveolarem (oder präpalatalem) / t²$/ nur eine Affrikate, die zu den Phonemen gezählt wird. Sowohl Ort als auch Modus der Realisierung können je nach Regi- 43 Vgl. Martínez Celdrán & Fernández Planas (2007: 166). Sie transkribieren diesen Approximanten als [°] mit einem subskribierten [¹], um ihn vom Halbvokal [j] zu unterscheiden. 67 on variieren. So wird im kanarischen und kubanischen Spanisch häufig statt der Affrikate der palatale Verschlusslaut [c] artikuliert, der auch stimmhaft (als [«]) auftreten kann. In Teilen Mexikos ist dagegen Deaffrizierung üblich: Die Affrikate verliert ihren Plosivanteil und wird zum einfachen Frikativ. Außer in Entlehnungen kommt / t²$/ nur im Anfangsrand von Silben oder Wörtern vor; ein vorangehender Nasal oder Lateral wird in seiner Artikulationsstelle an die Affrikate angepasst und palatalisiert. In der Schreibung wird / t²$/ konsequent durch das Digraphem <ch> repräsentiert. postalveolare Affrikate / t²$/ [t²$] [ t²$iko] chico ‘Junge’ [mu t²$at²$o] muchacho ‘Junge’ [ an j t²$a] ancha ‘weit’ f. [kat²$] catch ‘Catch’ palataler Plosiv [c] [ ciko] / [mu caco] ~ [mu «a«o] postalveolarer Frikativ (Deaffrizierung) [$] [ $iko] / [mu $a$o] Abb. 2.5-8 zeigt Sagittalschnitte von spanischen Frikativen und Affrikaten. a) [f] b) [] c) [sÁ] d) [sÂ] e) [] f) [x] g) [°] h) [t²$]/ [«²°] Abb. 2.5-8 Sagittalschnitte der Artikulation spanischer Frikative und Affrikaten (aus Kubarth 2009: 99, 102, 108, 107). In Abb. 2.5-9 werden Oszillo- und Spektrogramme spanischer Äußerungen mit der Affrikate [t²$] und den Frikativen [s] und [x] vorgestellt. Bei [t²$] lässt sich gut die Abfolge von Verschluss (stummer Schall), Explosionsschall und unmittelbar folgendem Friktionsrauschen erkennen (vgl. 2.3.1.2). [s] und [x] unterscheiden sich deutlich in der Intensität der Friktion (unstrukturierte Schwärzung in höheren Frequenzbereichen). e n a n j t $ a s e ® e s p o x o Abb. 2.5-9 Oszillo- und Spektrogramme, links: sp. en ancha (capa), rechts: sp. se despojó. ('/ $% #$! " 3 $ % ! ! " % " $ " 2 0 1 68 2.5.1.3 Nasale Mit Plosiven, Frikativen und Affrikaten haben wir die große Gruppe der Obstruenten oder echten Konsonanten nun abgeschlossen und wenden uns mit den Nasalen der Gruppe der Sonoranten zu. Sie unterscheiden sich von den Obstruenten dadurch, dass es hier keine Paare gibt, die sich - wie etwa / p/ und / b/ - allein durch das Merkmal der Stimmhaftigkeit voneinander abgrenzen lassen. Sonoranten sind spontan immer stimmhaft, werden also mit Beteiligung der schwingenden Stimmlippen artikuliert. Außerdem ist die Behinderung des Luftstroms, durch die sich Konsonanten prinzipiell von Vokalen unterscheiden, hier stärker eingeschränkt: Wie wir in 2.2.3.2 gesehen haben, wird bei Nasalen zwar ein Verschluss im Mundraum gebildet, doch dieser wird nicht wie bei den Plosiven durch den Luftstrom aus der Lunge gesprengt. Die Luft entweicht vielmehr relativ ungehindert durch den Nasenraum, denn das Velum ist bei Nasalen abgesenkt und die Passage zur Nasenhöhle damit frei (vgl. Abb. 2.5-10). Mit bilabialem / m/ und alveolarem bzw. koronalem / n/ kennt das Spanische zwei Nasalkonsonanten, die auch im Deutschen vertreten sind. Mit palatalem / »/ kommt wie in den meisten anderen romanischen Sprachen noch ein Nasalkonsonant hinzu, der im Deutschen nur in Entlehnungen aus diesen Sprachen auftritt, z.B. in Cañon oder Cognac. Während die Aussprache im Deutschen hier meist in die Abfolge [nj] zerlegt wird, repräsentiert / »/ im Spanischen einen einzigen Laut, bei dessen Artikulation der Zungenrücken sich auf breiter Fläche an den harten Gaumen legt, während die Zungenspitze die Rückseite der unteren Schneidezähne berührt (vgl. Abb. 2.5-10c). Im Silbenanfangsrand werden diese spanischen Nasale regelmäßig als [m], [n] bzw. [»] realisiert; wortinitial tritt [»] allerdings nur in einigen wenigen Entlehnungen und expressiven Bildungen auf. In der Codaposition kommt es zu Neutralisierungen und Assimilationen (4.2.4.2). In der wortinternen Coda - aber auch in der wortfinalen Coda, wenn unmittelbar ein weiteres konsonantisch anlautendes Wort folgt - passen die spanischen Nasalkonsonanten ihre Artikulationsstelle grundsätzlich an die des nächsten Konsonanten an; sie werden also homorgan mit diesem realisiert. Vor bilabialen Plosiven (oder auch Nasalen) wird ein Nasalkonsonant also automatisch als bilabiales [m] gesprochen (wie in dt. [lmp] Lump), vor labiodentalen Frikativen als labiodentales [³] (wie in dt. [z³f] Senf), vor denti-alveolaren Plosiven oder (inter)dentalen Frikativen als dentales [nÈ] 44 , vor alveolaren Frikativen als alveolares [n] (wie in dt. [ans] Gans), vor postalveolaren und palatalen Affrikaten sowie vor dem palatalen Lateral des Kastilischen als palatalisiertes [n j ] 45 und vor velaren Plosiven oder Frikativen als velares [´] (wie in dt. [ba´k] Bank). Die einzige Ausnahme stellt silbenfinales [m] vor [n] dar: hier erfolgt keine Anpassung des ersten an den Ort des zweiten Nasalkonsonanten, sondern es wird die Abfolge [mn] artikuliert (wie in dt. [ h¥mn ] Hymne). Wenn nicht unmittelbar ein konsonantisch anlautendes Wort folgt, ist in wortfinaler Position im Spanischen nur / n/ möglich. Sowohl / m/ als auch / »/ sind hier ausgeschlossen, wie sich in der Entwicklung aus dem Lateinischen oder anhand von Entlehnungen zeigen lässt. In diesen wird finales [m] oder [»] meist als [n] ausgesprochen, auch wenn für ersteres in der Schreibung bisweilen <-m> bewahrt ist. In 44 Das nach unten offene Rechteck zeigt in der Transkription dentale Artikulation an. 45 Der palatalisierte Nasal [n j ] (in der Transkription zeigt hochgestelltes [ j ] die palatalisierte Aussprache an) unterscheidet sich artikulatorisch und akustisch vom palatalen Nasal [»], denn der Verschluss wird hier nur präpalatal gebildet (s. Abb. 2.5-10f; vgl. Quilis 1993: 229f., Martínez Celdrán & Fernández Planas 2007: 129ff.). 69 vielen Varietäten des Spanischen wird finales / n/ velar artikuliert, also als [´] gesprochen (wie in dt. [la´] lang), so z.B. in Andalusien, auf den Kanarischen Inseln, in der Karibik und an der südamerikanischen Pazifikküste. Dieser als Velarisierung bezeichnete Prozess, bei dem durch antizipierte Senkung des Velums oft auch der vorangehende Vokal nasalisiert wird, kann als Schwächung des Codakonsonanten gesehen werden. Geht die Schwächung bis zur Tilgung des Nasalkonsonanten, so bleibt die Nasalität in der Regel im vorangehenden Vokal erhalten, der folglich als (finaler) nasalisierter Vokal erscheint. 46 Folgt ein vokalisch anlautendes Wort (oder wird ein vokalisch anlautendes Suffix angefügt), so tritt der finale Nasalkonsonant in den Anfangsrand der nächsten Silbe und wird dort als [n] realisiert. In der Schreibung stehen prinzipiell <m> für / m/ , <n> für / n/ und <ñ> für / »/ . Die angesprochenen Anpassungen der Nasalkonsonanten in der Coda gehen nur wortintern und auch dort nur selektiv in die Schreibung ein: So wird der vor und bilabial gesprochene Nasal in dieser Position durch <m> wiedergegeben; vor <v>, <m> oder <f>, wo ebenfalls [m] bzw. [³] artikuliert wird, steht dagegen immer der Buchstabe <n>, der auch alle anderen Neutralisierungen und Assimilationen abdeckt. Nasale im Onset / m/ [m] [ kama] cama ‘Bett’ [ mata] mata ‘Strauch’ / n/ [n] [ kana] cana ‘weißes Haar’ [ nata] nata ‘Sahne’ / » / [ » ] [ ka »a ] caña ‘Rohr’ ([ » an du] ñandú ‘Nandu’) Nasale in vorkonsonantischer Coda vor bilabialem Plosiv [p] bzw. [b] und vor bilabialem Nasal [m] / n/ [m] [ kampo] campo ‘Feld’ [kom palo] con palo ‘mit Stock’ [sjem pjes] ciempiés ‘Tausendfüßler’ [sjem pjes] cien pies ‘100 Füße’ [ kambjo] cambio ‘Wechsel’ [um bote] un bote ‘ein Schlag’ [em bes] envés ‘Kehrseite’ [um baso] un vaso ‘ein Glas’ [immo al] inmoral ‘unsittlich’ [um mes] un mes ‘ein Monat’ vor labiodentalem Frikativ [f] / n/ [ ³ ] [e ³ femo] enfermo ‘krank’ [e ³ fjesta] en fiesta ‘beim Feiern’ vor denti-alveolarem Plosiv [t] bzw. [d] und vor dentalem Frikativ [] / n/ [ nÈ ] [ kan È to] canto ‘ich singe’ [un È tio] un tío ‘ein Typ’ [ an È do] ando ‘ich gehe’ [un È dia] un día ‘ein Tag’ [en È ima] encima ‘oben’ [en È ikulo] en círculo ‘kreisförmig’ vor alveolarem Frikativ [s] / n/ [ n ] [ manso] manso ‘zahm’ [un swe »o ] un sueño ‘ein Traum’ [en sima] encima ‘oben’ [en sikulo] en círculo ‘kreisförmig’ vor postalveolarer Affrikate [t²$], vor palataler Affrikate [«²°], vor palatalem Lateral [ µ ] / n/ [ n j ] [ an j t²$a] ancha ‘weit’ f. [un j t²$ik o ] un chico ‘ein Junge’ [en j «²°e sa] enyesar ‘gipsen’ [un j «²°u±o] un yugo ‘ein Joch’ [en j µ an È ta] enllantar ‘m. Felgen versehen’ [kon j µa-e ] con llave ‘mit Schlüssel’ vor velarem Plosiv [k/ ] und vor velarem Frikativ [x] / n/ [ ´ ] [ ba ´ ko] banco ‘Bank’ [u ´ kampo] un campo ‘ein Feld’ [ te ´ o] tengo ‘ich habe’ [u ´ ato] un gato ‘eine Katze’ [ a ´ xel] angel ‘Engel’ [ko ´ xu±o] con jugo ‘mit Saft’ 46 Auf ähnliche Weise sind die Nasalvokale des Französischen entstanden (3.2.1; Rothe 1978: 153ff.). ('/ $% #$! " 3 $ % ! ! " % " $ " 2 0 1 70 Ausnahme: vor alveolarem Nasal [n] / m/ [m] [a lumno] alumno ‘Schüler’ Nasale in wortfinaler Position / n/ [ n ] [pan] pan ‘Brot’ [ komen] comen ‘sie essen’ [kon] con < CUM ‘mit’ [ron] ron < engl. rum ‘Rum’ [ al-un]~[ al-um] álbum ‘Album’ [t²$am pan] champán < fr. champagne [$ª pa»] ‘Champagner’, neben [t²$am pa»a] champaña wortfinale Velarisierung / n/ [ ´ ] [ kome ´ ]/ [pa ´ ]/ [ro ´ ] etc. häufig mit Nasalisierung des vorangehenden Vokals, gegebenenfalls Tilgung des Nasals [ kome ´ ] ~ [ kome] vor Vokal / n/ [ n ] [pa ´ ], aber Pl. [ pa.nes] panes ‘Brote’ [ko ´ keso] con queso ‘mit Käse’, aber [ko n a±wa] con agua ‘mit Wasser’ Abb. 2.5-10 zeigt abschließend Sagittalschnitte der verschiedenen Artikulationen spanischer Nasalkonsonanten. a) [m] b) [n] c) [»] d) [³] e) [ nÈ ] f) [n j ] g) [´] Abb. 2.5-10 Sagittalschnitte der Artikulation spanischer Nasale (aus Kubarth 2009: 111). 2.5.1.4 Laterale Bei der Artikulation von Lateralen wird zwar mittig im Mundraum ein Verschluss gebildet, doch die Luft kann ungehindert an einer oder beiden Seiten vorbeiströmen (weshalb Laterale oft auch zu den Approximanten gerechnet werden). Die meisten Varietäten des Spanischen kennen heute nur noch einen Lateralkonsonanten, und zwar (apiko)alveolares / l/ , das dem / l/ des Deutschen vergleichbar ist. / l/ kann für sich allein den Anfangsrand einer Silbe besetzen oder gemeinsam mit den Plosiven / p b/ und / k / bzw. mit dem Frikativ / f/ den zweiten Bestandteil eines komplexen Onset bilden. / l/ kann auch in Codaposition auftreten, wobei es auch hier zu Anpassungen an den folgenden Konsonanten kommt; diese sind jedoch stärker eingeschränkt als im Fall der unter 2.5.1.3 behandelten Nasale: Vor denti-alveolaren Plosiven und vor dem (inter)dentalen Frikativ erscheint der Lateral dental als [lÈ], vor postalveolarer und palataler Affrikate (und vor palatalem Lateral) wird er zu [l j ] palatalisiert. In einigen Dialekten, so in Andalusien und in der Karibik, wird der Lateral in der Coda und im komplexen Onset auch als [] realisiert. Umgekehrt kann [] in der Coda als [l] erscheinen, 47 weshalb wir beide Phänomene gemeinsam im nächsten Abschnitt behandeln werden. In der Schreibung steht für / l/ immer der Buchstabe <l>. 47 Abgeleitet von griech. Rho für <r> und griech. Lambda für <l> nennt man solche Vertauschungen auch Rhotazismus (sp. rotacismo) bzw. Lambdazismus (sp. lambdacismo). 71 alveolarer Lateral im Onset / l/ [l] [ lo-o] lobo ‘Wolf’ [ palo] palo ‘Stock’ [ plomo] plomo ‘Blei’ [a -la] hablar ‘sprechen’ [ kla o ] claro ‘klar’ [ lo-o] globo ‘Kugel’ [ flo] flor ‘Blume’ [ t²$ufla] chufla ‘Spaß’ alveolarer Lateral in der Coda / l/ [l] [ olpe] golpe ‘Schlag’ [ kal-o] calvo ‘kahl’ [ salsa] salsa ‘Soße’ [ al±o] algo ‘etwas’ [ alma] alma ‘Seele’ [mil] mil ‘1000’ vor denti-alveolarem Plosiv [t] bzw. [d] und vor dentalem Frikativ [] / l/ [ lÈ ] [ al È to] alto ‘hoch’ [el È tio] el tío ‘der Typ’ [ kal È do] caldo ‘Brühe’ [el È dia] el día ‘der Tag’ [al È a] alzar ‘erhöhen’ [el È ikulo] el círculo ‘der Kreis’ vor postalveolarer Affrikate [t²$], vor palataler Affrikate [«²°], vor palatalem Lateral [ µ ] / l/ [ l j ] [ kol j t²$a] colcha ‘Bettdecke’ [el j t²$ik o ] el chico ‘der Junge’ [el j «²°eso] el yeso ‘der Gips’ [el j µanto ] el llanto ‘die Klage’ In ländlichen Gebieten im Nordosten Spaniens sowie in einigen wenigen lateinamerikanischen Varietäten gibt es mit dem palatalen / µ/ noch einen weiteren Lateralkonsonanten, der ursprünglich zum standardspanischen Inventar gehörte, inzwischen aber, wie in 2.5.1.2 bereits angesprochen, fast überall zum palatalen Frikativ / °/ geworden ist. Der mittige Verschluss wird dazu so weit gelockert, dass ein palataler Reibelaut oder Approximant entsteht. Der Wandel von / µ/ zu / °/ wird auch als yeísmo bezeichnet, während die Bewahrung des / µ/ als lleísmo gilt. 48 Ähnlich wie der palatale Nasal / »/ wird / µ/ , das nur im Anfangsrand von Silben auftreten kann, mit großflächigem Kontakt zwischen Zungenrücken und hartem Gaumen realisiert (s. Abb. 2.5-11d). In der Schreibung wird / µ/ durch das Doppelgraphem <ll> repräsentiert. palataler Lateral (lleísmo) / µ / [ µ ] [ µ a-e] llave ‘Schlüssel’ [pa e µa ] paella ‘Paella’ palataler Frikativ (yeísmo) / °/ [°] [ °a-e] llave [pa e° a ] paella Abb. 2.5-11 zeigt abschließend Sagittalschnitte der spanische Laterale. a) [l] b) [lÁ] c) [l j ] d) [ µ ] Abb. 2.5-11 Sagittalschnitte der Artikulation spanischer Laterale (aus Kubarth 2009: 113). 48 Ein ähnlicher Wandel von / µ/ zu / j/ hat etwas früher im Französischen stattgefunden, wo Schreibungen mit <ll> bis heute an den palatalen Lateral erinnern: z.B. fr. [ fiµ ] > [fij] fille ‘Tochter’. Im Italienischen ist / µ/ dagegen bis heute bewahrt: [ fiµa] figlia ‘Tochter’. ('/ $% #$! " 3 $ % ! ! " % " $ " 2 0 1 72 2.5.1.5 Vibranten Den Terminus ‘Vibrant’ verwenden wir hier als Oberbegriff für die Klasse der ‘r- Laute’ (engl. rhotics, sp. consonantes róticas), die sich in den Sprachen der Welt durch deutlich verschiedene Artikulationsorte und -modi auszeichnen, aber perzeptiv als ‘rartig’ wahrgenommen und meist auch mit einem (oder zwei) <r>-Buchstaben geschrieben werden. Aufgrund häufig ähnlichen Verhaltens werden Vibranten oder r- Laute mit den Lateralen zur Gruppe der Liquide zusammengefasst. Mit dem alveolar geschlagenen / / (engl. tap, sp. vibrante simple) und dem ebenfalls an den Alveolen gebildeten, aber mehrfach gerollten / r/ (engl. trill, sp. vibrante múltiple) kennt das Spanische zwei Vertreter aus der Gruppe der Vibranten. 49 Dabei ist allerdings nur der Trill ein ‘echter’ Vibrant, denn hier wird die Zungenspitze in Vibration versetzt, sodass sie wiederholt - also mindestens zweimal, häufig öfter - gegen die Alveolen flattert. Beim Tap kommt es dagegen nur zu einem einzigen raschen Kontakt zwischen Zungenspitze und Alveolen: Die Zunge schlägt einmal ganz kurz gegen den Zahndamm; deshalb spricht man hier von einem geschlagenen Laut. 50 Nur im Wortinneren zwischen Vokalen kann der Austausch von Tap und Trill zu einer neuen Bedeutung führen. 51 Der Wortanfang ist für den Tap gesperrt; hier erscheint automatisch immer der Trill. Das gilt auch für den Anfangsrand wortinterner Silben, wenn die vorangehende Silbe auf einen Konsonanten endet - wofür nur der Nasal / n/ und der Lateral / l/ infrage kommen. 52 In 2.5.1.2 haben wir gesehen, dass der Frikativ / s/ in der Coda oft getilgt wird. Vor dem Trill ist diese Tilgung die Regel - unabhängig davon, ob zwischen / s/ und Trill nur eine Silben- oder zugleich auch eine Wortgrenze verläuft. Dabei kann jedoch ein approximantischer r-Laut [·] vor dem Trill verbleiben. In allen anderen Positionen, d.h. an zweiter Stelle innerhalb eines komplexen Onset 53 (in der Kombination OL für Obstruent-Liquid nach / p b/ , / t d/ , / k / und / f/ ) und in der Coda, erscheint im Normalfall der Tap. In der Coda kann der r-Laut jedoch auch gerollt werden, ohne dass dies Auswirkungen auf die Bedeutung des Wortes nehmen würde. Mit einem Trill wird hier oft ein höherer Grad an Emphase ausgedrückt. Nur in der (wortinternen) Position zwischen Vokalen, wo durch Tap vs. Trill Bedeutungen differenziert werden können, wird der Unterschied zwischen den beiden r- 49 Der Einfachheit halber deutschen wir im weiteren die englischen Bezeichnungen trill und tap zu Trill und Tap ein. Dass im IPA [r], also der einfache kleine <r>-Buchstabe, als Transkriptionszeichen für einen vergleichsweise markierten r-Laut wie den gerollten Zungenspitzenvibranten dient, ist verschiedentlich kritisiert worden (vgl. Whitley 2003). In der spanischen Tradition wird der Trill, wenn nicht gleich Doppelschreibung gewählt wird, meist durch einen waagerechten Strich über dem Buchstaben wiedergegeben, also durch [rÉ ], wodurch [r] für den Tap frei wird (vgl. etwa Navarro Tomás 1977: 121). Hualde (2005: 16) folgt Whitleys (2003) Vorschlag und transkribiert den Trill durch [rÉ], den Tap durch []. Wie NGRAE (2011), Kubarth (2009) u.v.a. folgen wir der IPA-Transkription. 50 Wegen dieser Ungenauigkeit empfiehlt NGRAE (2011: 245), den Terminus vibrante nur für den gerollten r-Laut zu verwenden und das geschlagene r als percusiva zu bezeichnen (vgl. auch Blecua 2001: 14). 51 Das ist der Grund, weshalb die beiden r-Laute verschiedenen Phonemen zugeordnet werden, vgl. dazu genauer Abschnitt 3.1. 52 Da diese Konsonanten einer anderen Silbe angehören (als der Trill, um den es uns hier geht), bezeichnet man sie auch als heterosyllabisch. 53 Konsonanten, die zu derselben Silbe gehören wie der behandelte Laut, werden auch tautosyllabisch genannt. 73 Lauten auch in der Orthographie abgebildet. Während für den Tap immer der einfache <r>-Buchstabe steht, wird für den Trill hier die Doppelschreibung <rr> eingesetzt. In allen anderen Positionen wird auch der Trill durch einfaches <r> wiedergegeben, denn seine Realisierung als Trill ist hier jeweils vorhersagbar. alveolar gerollter Vibrant (Trill) / r/ vs. alveolar geschlagener Vibrant (Tap) / / V___V zwischen Vokalen (Kontrast) / r/ [r] [ kar o ] carro ‘Wagen’ [ pera] perra ‘Hündin’ [ke r ia ] querría ‘ich würde wollen’ [bi rej] virrey ‘Vizekönig’ / / [] [ kao] caro ‘teuer’ [ pea] pera ‘Birne’ [ke ia ] quería ‘ich wollte’ [ba ato] barato ‘billig’ immer Trill / r/ am Wortanfang #___ [r] [ roka] roca ‘Felsen’ [rej] rey ‘König’ im Silbenonset nach heterosyllabischem Konsonanten (/ n/ , / l/ , / s/ ) C.___ [ r ] [ onra] honra ‘Ehre’ [alre®e ®o] alrededor ‘ringsherum’ [irae lita]~[i·rae lita](~[izrae lita]) israelita ‘Israeli’ [do rokas]~[do· rokas](~[doz rokas]) dos rocas ‘zwei Felsen’ immer Tap / / an zweiter Position im Silbenonset (nach tautosyllabischem Konsonanten, OL) C___ [] [ boma] broma ‘Scherz’ [ fente] frente ‘Stirn’ [ ka-a] cabra ‘Ziege’ [la ®on ] ladrón ‘Dieb’ am Wortende vor vokalischem Anlaut V___#V[] [ se.a mi±os] ser amigos ‘Freunde sein’ vorwiegend Tap / / (Trill möglich) in Codaposition V___. [] [ pa.te] ~ [ par.te] parte ‘Teil’ [a mo] ~ [a mor ] ~ [a mor ] amor ~ ¡amorrr! ‘Liebe’ Wir haben bislang eine Norm beschrieben, die für den gesamten spanischsprachigen Raum angesetzt werden kann und für Lerner eine gute Orientierung bietet. Aber auch bei den r-Lauten ist Variation zu beobachten, die wir kurz skizzieren wollen. So werden Tap und Trill nicht immer mit tatsächlichem Kontakt zwischen Zungenspitze und Alveolen produziert, sondern es kann stattdessen auch hier nur zu einer Engebildung kommen. Wenn die Luft diese Enge relativ ungehindert passiert, werden Tap bzw. Trill zu Approximanten; kommt es dabei zu einem Reibegeräusch, so entstehen Frikative. In diesen Realisierungsarten, die in IPA durch [·] (für den Approximanten) bzw. [·Å] (für den Frikativ) symbolisiert werden, unterscheidet sich der Trill vom Tap nur durch seine größere Länge ([· ] bzw. [·Å ]). Bei der Artikulation als Frikativ entsteht durch die gerillte Zunge schnell eine Art Zischlaut: der alveolare Vibrant wird dann assibiliert, d.h. als Frikativ mit einem intensiven hohen Geräuschanteil (so die Definition für ‘Sibilant’) produziert. So erscheint bspw. in den zentralen Regionen Mexikos der wortfinale r-Laut vor einer Pause häufig als stimmloser Sibilant, was in IPA durch das Symbol [Ê] (für einen stimmlosen, alveolo-palatalen Frikativ) ausgedrückt werden kann. In Teilen Zentralamerikas, in der Andenregion, in Ecuador und ('/ $% #$! " 3 $ % ! ! " % " $ " 2 0 1 74 im nördlichen Argentinien wird dagegen der Trill oft als - diesmal stimmhafter - Sibilant realisiert (in IPA [Ë]). 54 Wie bei den Lateralen in 2.5.1.4 bereits angesprochen, gibt es in Teilen Andalusiens und der Extremadura sowie auf den Kanarischen Inseln und in der Karibik Tendenzen, den Kontrast zwischen den Liquiden / l/ und / / in der Coda zu neutralisieren. Die tatsächliche Realisierung schwankt dabei je nach Region zwischen dem Lateral [l] (Lambdazismus) und dem Tap [] (Rhotazismus). Durch Absenken der Zunge kann es daneben zu Vokalisierungen kommen, sodass der Liquid zum Gleitlaut [j] wird und mit dem vorangehenden Vokal einen Diphthong bildet. Mitunter erfolgt auch völlige Elision des Liquids in der Coda, was wortintern oft die Geminierung, also ‘Dopplung’ bzw. Längung des folgenden Konsonanten nach sich zieht. r-Laute als Approximanten / r/ [ · ] [ ka · o ] carro [ · iko] rico [ on · a ] honra / / [ · ] [ ka · o] caro [ b · oma] broma [ pa · te] parte r-Laute als Sibilanten / r/ [ Ë ]~ [Ê] [ ka Ëo ] ~ [ ka Êo ] carro / / [Ê] ~[ Ë ] [ko me Ê ] ~ [ko me Ë ] comer ‘essen’ Neutralisierung von Liquiden (L) in der Coda (V__.) ‘Vertauschung’: Lambdazismus/ Rhotazismus [V.] ~ [Vl.] [ kane] ~ [ ka lne ] carne ‘Fleisch’ [ko me] ~ [ko me l ] comer [Vl.] ~ [V . ] [ alto] ~ [ ato] alto ‘hoch’ [delan tal] ~ [delan ta] delantal ‘Schürze’ Vokalisierung [VL .] ~ [Vj.] [ poke] ~ [ pojk e ] porque ‘weil’ [ olpe] ~ [ ojpe] golpe ‘Schlag’ Elision [VL .] ~ [V 0 .] [kan ta] ~ [kan ta] cantar ‘singen’ [ alma] ~ [ ama] alma ‘Seele’ Elision mit Geminierung des folgenden Konsonanten [VL.C] ~ [VC.C] [ kane] ~ [ kanne] carne [ olpe] ~ [ oppe] golpe Anders als im Spanischen gibt es im Deutschen nur ein r-Phonem, und das wird in der Regel uvular realisiert: als stimmhafter uvularer Frikativ [] (bzw. Approximant [¸]), wenn der Luftstrom einen Engpass zwischen Zäpfchen und Hinterzunge passieren muss; als uvularer Vibrant [-], wenn der Luftstrom das Zäpfchen in Schwingungen versetzt, sodass es gegen die Hinterzunge vibriert. Die Realisierung als alveolarer Vibrant [r] (oder als Tap []) ist heute auf regionale (vor allem süddeutsche) Varietäten beschränkt. In der Coda wird der r-Laut im Deutschen zudem häufig vokalisiert (vgl. Becker 2012: 39); er bildet dann zusammen mit dem vorangehenden Vokal einen Diphthong (wie in [ e Àd ] Erde, [o À ] Ohr, [u À] Uhr), ein sog. r-Schwa (wie in [ le À] Lehrer) oder er geht in dem Vokal auf (wie in [$ª f] scharf oder Schaf). Auf das Spanische übertragen, stellen solche Aussprachegewohnheiten markante Charakteristika eines typisch deutschen Akzents dar. Um diesen zu vermeiden und auch um besser verstanden zu werden, lohnt es sich, einige Mühe auf das Erlernen von Tap und Trill zu verwenden. Hilfreich für den Erwerb des Tap ist die Orientierung am stimm- 54 In der Tradition der spanischen Dialektologie wird der assibilierte r-Laut durch [Ì] transkribiert. Für die stimmlose Variante kann [Ì¼] stehen (vgl. Hualde 2005: 186). 75 haften alveolaren Plosiv [d], für den man allerdings die Zungenspitze nur ganz kurz gegen die Alveolen schlagen lässt. 55 Um einen Tap nach einem Konsonanten zu produzieren, versuche man, rasch mehrmals hintereinander Wörter wie Brötchen, Tränen oder Birke als Bdötchen, Tdänen bzw. Bidke zu sprechen. Wenn dabei ein kurzes vokalisches Element zwischen die Konsonanten gerät (etwa B ö dötchen), so ist das, wie wir in Abb. 2.5-12d sehen werden, völlig normal und geschieht auch im Spanischen. Es sollte darauf geachtet werden, den Tap in der Coda immer als solchen zu artikulieren. Auch wenn, wie oben dargestellt, in einigen Varietäten des Spanischen Liquide in der Coda neutralisiert werden und es dort ebenfalls zu Vokalisierungen und Elisionen kommt, so entsprechen die Ergebnisse dieser Prozesse doch nie den r-Vokalisierungen des Deutschen. Typisch deutsche Aussprachen wie z.B. [p h oÀfa vo À ] für por favor klingen für spanische Ohren, wenn sie überhaupt verstanden werden, “höchst befremdlich” (Kubarth 2009: 118) und sollten deshalb nach Kräften vermieden werden. Zum Erlernen des Trills gibt es neben verschiedenen Demonstrationsvideos auch umfangreichen Erfahrungsaustausch in Internetforen mit zahlreichen mehr oder weniger hilfreichen Ratschlägen. 56 Eine vielversprechende Übung stellt Kubarth (2009: 116f.) vor: Nachdem man zunächst lautmalerisch das Zuklappen eines Buches nachahmt - der palatale Frikativ [ç] wird nach einigen Sekunden durch einen nicht gelösten Plosiv abgebremst [ç tÍ] -, erhöht man den Atemdruck, um den möglichst elastisch an den Alveolen anliegenden Zungenkranz ins Flattern zu bringen, etwa [ç tr¼ ¼ ]. Dieser stimmlose Vibrant sollte zunächst zwischen geflüsterten Vokalen trainiert werden (z.B. [a¼r¼ ¼ a¼], [u¼r¼ ¼ u¼] etc.), bevor die Sequenzen letztlich mit Stimmbandschwingungen unterlegt werden. Abb. 2.5-12 zeigt einen spanischen Trill und verschiedene Tap-Realisierungen in Oszillo- und Sonagrammen. Beim Trill in real(mente) (a) lassen sich deutlich drei Unterbrechungen des Luftstroms durch den Kontakt zwischen Zungenspitze und Alveolen erkennen. In den Öffnungsphasen sind im Oszillogramm kleine quasi-periodische Schwingungen mit geringer Intensität auszumachen. Beim Tap in (b) gibt es dagegen nur eine einzige kurze Unterbrechung des Luftstroms. Der Tap in (c) ist als Approximant realisiert worden, denn hier ist gar keine Unterbrechung zu verzeichnen. In (d) sind zwischen Plosiv und Tap die Ausschläge eines kleinen Sprossvokals (sp. elemento esvarabático) zu erkennen, der in seiner Formantstruktur dem folgenden Vokal ähnelt. r e a l a p a s a u m e · a s e t a a t a a) b) c) d) Abb. 2.5-12 Oszillo- und Spektrogramme von spanischen r-Lauten: a) real(mente), b) a pasar un (viajero), c) era, d) se trata. 55 Einen Tap anstelle eines Plosivs haben wir bei intervokalischem [t] und [d] im amerikanischen Englisch zu verzeichnen: brit. engl. [ bet ] ~ am. engl. [ bÎ] better. 56 So z.B. unter http: / / dict.leo.org/ forum/ viewGeneraldiscussion.php? idThread=195169&lp=esde&lang=de . r · $% #$! " 3 $ % ! ! " % " $ " 2 ('/ 0 1 76 Abb. 2.5-13 zeigt abschließend Sagittalschnitte von der Artikulation spanischer und im Vergleich dazu deutscher r-Laute. a) [r]/ [] b) [·] c) [] d) [-] Abb. 2.5-13 Sagittalschnitte der Artikulation der spanischen und deutschen r-Laute (a) und b) aus Kubarth 2009: 116, c) und d) aus Fiukowski 2010: 228). 2.5.2 Approximanten In 2.2.3 haben wir Approximanten oder Gleitlaute als Klasse von Lauten definiert, die zwischen dem konsonantischen (genauer frikativischen) und dem vokalischen Artikulationsmodus anzusiedeln sind: Sie weisen eine größere Engebildung als ein Vokal, aber eine geringere als ein Frikativ auf, und die Artikulation erfolgt ohne Friktionsgeräusch. Akustisch sind Approximanten durch eine deutliche Formantstruktur gekennzeichnet, die jedoch raschere Transitionen aufweist, als das bei Vokalen der Fall ist. Trotz dieser gemeinsamen Charakteristika ist es sinnvoll, die Klasse der Approximanten mit Martínez Celdrán & Fernández Planas (2007: 170) nach ihrer jeweiligen Nähe zu anderen Lautklassen in vier Untergruppen zu unterteilen. Die Frikativapproximanten (sp. aproximantes espirantes) [- ® ±], zu denen wir auch die approximantische Realisierung des Frikativs / °/ als [j] zählen können, haben wir in 2.5.1.1 und 2.5.1.2 bei der Behandlung der Obstruenten bereits kennengelernt. Die zweite Gruppe bilden die der Klasse der Sonoranten angehörenden Laterale [l] und [µ], die wegen fehlenden Friktionsgeräuschs zu den Approximanten gerechnet werden können. Zu den Sonoranten gehören auch die approximantischen Realisierungen der spanischen r-Laute als [·], die wir in 2.5.1.5 behandelt haben. Aus silbenstruktureller Sicht lassen sich die Mitglieder dieser drei Untergruppen klar den Konsonanten zuordnen: Sie treten im Onset oder in der Coda von Silben auf und können oft auch gemeinsam mit anderen Konsonanten einen komplexen Anfangsrand bilden (vgl. auch 4.2.4.1). Dies gilt nicht für die vierte Untergruppe der Approximanten, die als die eigentlichen Gleitlaute oder Halbvokale zu den vokalischen Segmenten gehören: sie kommen nur in unmittelbarer Nachbarschaft eines Vokals vor, mit dem sie gemeinsam den Nukleus der Silbe bilden und so einen Diphthong konstituieren (4.2.4.3). Dieser ist steigend, wenn der Gleitlaut dem Vokal vorangeht; fallend, wenn er ihm folgt (vgl. 2.5.3.2). Mit [j] und [w] kennt das Spanische zwei derartige Gleitlaute (oder Halbvokale), die in engem Bezug zu den hohen Vokalen [i] und [u] stehen. In Abb. 2.5-1 haben wir [j] und [w] zwar in Anlehnung an die IPA-Darstellungen als palatalen bzw. labiovelaren Approximanten in unsere Konsonantentabelle aufgenommen, doch es wäre auch denkbar, sie in einem Vokaltrapez im Umfeld der hohen Vokale unterzubringen, wo sie eine geringfügig zentralere Position einnehmen würden als diese (vgl. Martínez Celdrán & Fernández Planas 2007: 165). Gleitlaute unterscheiden sich von den Vokalen nur dadurch, dass sie 77 keinen eigenen Silbenkern bilden und nicht gelängt werden können. 57 Um die Nähe zu den Vokalen auch in der Transkription deutlich zu machen, werden statt [j] und [w] oft die mit einem Unterbogen versehenen Zeichen für die hohen Vokale verwendet, also [i ] und [u]. 58 Der Einfachheit halber gebrauchen wir im Normalfall die Symbole [j] und [w]. Welche Diphthonge durch die Kombination dieser Gleitlaute mit den Vokalen des Spanischen gebildet werden können, wird in Abschnitt 2.5.3.2 erörtert. Abb. 2.5-14 zeigt die Untergruppen der spanischen Approximanten nach Martínez Celdrán & Fernández Planas (2007: 170). Abb. 2.5-14 Klassifizierung der spanischen Approximanten (nach Martínez Celdrán & Fernández Planas 2007: 170). 2.5.3 Vokale Bei der Artikulation von Vokalen passiert der durch die Phonation in periodische Schwingungen versetzte Luftstrom den Mund- (und gegebenenfalls Nasen-)Raum, ohne dass er durch Engebildungen oder Verschlüsse irgendwelcher Art behindert wird. Vokale sind friktionslose, stimmhafte Laute, deren unterschiedliche Klangfarbe durch die jeweilige Konfiguration des Ansatzrohres entsteht; akustisch zeigt sich dies in der spezifischen Formantstruktur. Als Sonoritätsmaxima wirken Vokale zudem silbenbildend: sie sind präferierte Silbenkerne, und im Spanischen stimmt die Zahl der Vokale einer Äußerung mit der Zahl der Silben, in die diese sich untergliedern lässt, überein (4.2.1). In vielen Sprachen kann nicht nur ein Vokal allein den Kern der Silbe bilden, sondern es kommen auch Verbindungen aus zwei oder sogar drei vokalischen Segmenten 57 Wort- und silbeninitial zählt [j] allerdings zu den konsonantischen (Frikativ-)Approximanten, die in der Silbe die Onsetposition einnehmen, denn hier findet keine Resyllabierung vorangehender wortfinaler Konsonanten statt. [j] wird vielmehr in dieser Position oft zu [°] oder [«²°] verstärkt. Bei [w] resultiert die silben- oder wortinitiale Verstärkung dagegen in den Abfolgen [±w] oder [w] (vgl. [kam bja] cambiar ‘wechseln’ vs. [paa no.ja] ~ [paa no.°a] paranoia ‘Paranoia’, [dez °elo] deshielo ‘Tauwetter’, [kon j «²°elo] con hielo ‘mit Eis’; [ bweno] bueno ‘gut’ vs. [si we»a] ~ [si ±we»a] cigüeña ‘Storch’, [de we-o] ~ [de ±we-o] de huevo ‘aus Ei’, [ko´ we-o] con huevo ‘mit Ei’). Eine ausführliche Behandlung dieser Differenzierungen findet sich in Hualde (2005: 89, 165ff.), s. auch Martínez Celdrán & Fernández Planas (2007: 166ff.). Zur phonologischen Wertung vgl. Abschnitt 3.1.2. 58 So verfahren z.B. Hualde (2005: 16) und NGRAE (2011: 25); Letztere fasst diese Untergruppe der Approximanten als vocales satélites. Durch den Unterbogen kann symbolphonetisch jeder Vokal als Gleitlaut dargestellt werden, und diese Wiedergabe wird meist auch für die Diphthonge des Deutschen genutzt (vgl. Becker 2012: 35 und 2.5.1.5 für das sog. r-Schwa). In der spanischen Tradition ist es üblich, den Gleitlaut vor einem Vokal als Halbkonsonanten durch [j] bzw. [w] zu transkribieren, den auf den Vokal folgenden dagegen als Halbvokal durch [i] bzw. [u]. Approximanten - ® ± j(/ °) Frikativappr. l µ Lateralappr. · r-Appr. j(/ i ) w(/ u) Gleitlaute/ Halbvokale ('/ $% #$! " 3 $ % ! ! " % " $ " 2 0 1 78 dafür infrage. Wir werden zuerst die einfachen Vokale oder Monophthonge des Spanischen behandeln, bevor wir in 2.5.3.2 auf die Di- und Triphthonge eingehen und sie Vokalsequenzen gegenüberstellen, die auf zwei Silben verteilt sind und deshalb einen Hiatus darstellen. 2.5.3.1 Monophthonge Anders als die artikulatorisch leichter zu erfassenden Konsonanten können selbst die einfachen Vokale symbolphonetisch nicht in einer Tabelle mit den Koordinaten Artikulationsstelle und -modus präsentiert werden. Wie wir in 2.2.3 schon gesehen haben, erfolgt ihre Veranschaulichung in der Regel in einem trapezartigen oder dreieckigen Gebilde, das den Mundraum und die ungefähre Position der Zunge darin wiederzugeben sucht. Dabei zeigen die Eckpunkte für gewöhnlich links oben die höchste bzw. links unten die tiefste Position der Vorderzunge, rechts oben die höchste bzw. rechts unten die tiefste Position der Hinterzunge an. Zur Zungenhöhe (mit drei bis fünf verschiedenen Stufen) und dem artikulierenden Zungenteil (mit drei Unterteilungen) kommt als dritter Parameter die Lippenstellung, bei der gerundet (oder vorgestülpt, sp. redondeada) und ungerundet (oder gespreizt, sp. no redondeada) unterschieden werden. Wenn anhand dieser Parameter die Positionen für Vokale verschiedener Sprachen durch Punkte im Trapez oder Dreieck markiert werden, ist dies als Untergliederung artikulatorischer Kontinua auf jeden Fall arbiträr und kann jeweils nur eine ungefähre Annäherung an die lautsprachliche Realität darstellen, die zudem durch breite Streuung und vielfältige Koartikulationseffekte charakterisiert ist. 59 Abb. 2.5-15 Links: Trapezdarstellung der Vokale des Spanischen und des Deutschen; rechts: Dreiecksdarstellung der Vokalphoneme des Spanischen. 59 Vgl. hier auch die Tendenz zu einer nicht kategoriellen Wahrnehmung der Vokale (2.4.2). Der Referenzrahmen für die Erstellung von Vokaltrapezen, auf den wir auch hier zurückgreifen, ist das von dem englischen Phonetiker Daniel Jones (1881-1967) entwickelte System von Kardinalvokalen, das auf einer Kombination von artikulatorischen und auditiven Kriterien beruht (vgl. hierzu Kohler 1995: 67ff.). Ï Ð Ñ æ a o e u i halboffen semiabierta o u ø i ª a vorn/ palatal anterior hinten/ velar posterior zentral central hoch alta y e œ ¥ mittel media halbgeschlossen semicerrada À offen abierta tief baja Hebung der Zunge bei paarweisem Auftreten repräsentiert das rechte Symbol einen gerundeten Vokal geschlossen cerrada 79 In Abb. 2.5-15 sind links die Vokale des Spanischen und des Deutschen in einem solchen Vokaltrapez zusammengestellt. Vokale, denen im Spanischen (und im Deutschen) Phonemstatus zuerkannt wird, sind hier groß und fett eingekreist, potentielle Allophone erscheinen etwas kleiner, und die Pfeile deuten an, welche Vokalphoneme sie im Spanischen gegebenenfalls vertreten. Vokale, die sowohl im Spanischen als auch im Deutschen vorkommen, sind grau eingekreist; die spezifisch deutschen Vokale sind grau und einige nur im Spanischen auftretende Allophone schwarz. Trotz der Vielfalt der hier (nach NGRAE 2011: 92) erfassten potentiellen Variation bleibt festzuhalten, dass das Vokalsystem des Spanischen sehr einfach strukturiert ist und eine vergleichsweise große Stabilität aufweist. Deshalb ist die auf Variation verzichtende rechte Darstellung im Vokaldreieck für die meisten Zwecke völlig ausreichend. In Bezug auf die vertikale Dimension (Höhe der Zunge) hat das Spanische mit / i u/ , / e o/ und / a/ zwei hohe, zwei mittlere und einen tiefen Vokal. Es werden also nur drei Öffnungsgrade unterschieden - gegenüber fünf im Portugiesischen, Katalanischen, Französischen, Italienischen, Deutschen und vielen anderen Sprachen. Vor dem Vibranten / r/ und dem velaren Frikativ / x/ werden die mittleren Vokale / e/ und / o/ in der Regel halboffen anstatt wie sonst halbgeschlossen artikuliert, als [] und [ ] also. Tendenzen zu ihrer Öffnung gibt es auch in geschlossener Silbe, doch sind diese im spanischen Sprachraum nicht durchgehend auszumachen. Sie werden deshalb - wie auch die Öffnung vor / r/ und / x/ - nur in den Beispielen zu den mittleren Vokalen unten berücksichtigt und entfallen ansonsten in unseren Transkriptionen. Systematisch ist die Öffnung der mittleren Vokale vor einem silbenschließenden Konsonanten jedoch in einigen ostandalusischen Varietäten. Da der offene Charakter der Vokale hier auch nach dem üblichen Wegfall von silbenschließendem / s/ erhalten bleibt (s. 5.2.1.2), kann der Unterschied in der Realisierung (geschlossener vs. offener Vokal) letztlich zur Differenzierung von Singular und Plural in der Nominalflexion bzw. von 3. und 2. Person Singular in der Verbflexion genutzt werden, sodass ein komplexeres Vokalsystem resultiert. 60 In der horizontalen Dimension lassen sich mit / i e/ , / a/ und / u o/ zwei vordere, ein mittlerer und zwei hintere Vokale unterscheiden (wobei die beiden letzteren zugleich gerundet sind). Vordere gerundete Vokale, wie sie etwa das Französische und das Deutsche mit / y ø œ/ aufweisen (vgl. fr. [my] mur ‘Mauer’, [fø] feu ‘Feuer’, [pœ] peur ‘Angst’), kennt das Spanische nicht. Auch der Gegensatz zwischen gespannten bzw. langen und ungespannten bzw. kurzen Vokalen, wie er das Deutsche kennzeichnet (vgl. dt. [ bi t ] biete vs. [ bt ] bitte, [ hy t ] Hüte vs. [ h¥t ] Hütte, [ pu t ] Pute vs. [ pt ] Putte, [ hø l ] Höhle vs. [ hœl ] Hölle etc.), ist im Spanischen nicht vertreten. Allerdings sind unbetonte Vokale hier für gewöhnlich etwas weniger gespannt und auch kürzer als betonte. Gelängte Vokale treten dagegen im Spanischen oft bei Emphase auf. Auch wenn es in nachlässiger Aussprache zu Zentralisierungen kommen kann, bei denen in unbetonter Silbe / e/ zu [ ] und / a/ zu [À] tendiert (vgl. NGRAE 2011: 99f.), so entspricht das Ergebnis in aller Regel nicht den Schwalauten [ ] und [À], wie sie in unbetonten Silben des Deutschen weit verbreitet sind (vgl. dt. [ bt ] bitte, [ btÀ] bitter). Anders als im Deutschen wird ein vokalischer Anlaut im 60 Der tiefe Vokal / a/ wird hier in offener Silbe als [ª] realisiert und in geschlossener Silbe zu [æ] angehoben. Außerdem wird der Öffnungsgrad des finalen Vokals auf die vorangehenden Vokale übertragen, die entsprechend umgelautet werden (s. dazu genauer Hualde 2005: 130, Penny 2000: 125f. sowie unter 3.1.2). $% #$! " 3 $ % ! ! " % " $ " 2 ('/ 0 1 80 Spanischen nicht mit einem Glottisschlag oder Knacklaut eingeleitet (vgl. etwa dt. [ at´] Achtung mit sp. [aten sjon] atención ‘Achtung’. Zur Schreibung der spanischen Vokale dienen die fünf Vokalbuchstaben , 61 , <e>, <o> und <a>. Aus etymologischen Gründen kann ihnen gegebenenfalls ein <h> (ohne Lautwert) vorangehen. 62 Hohe Vokale / i/ [i] [ piso] piso ‘Stockwerk’ [is toja] historia HISTORIA ‘Geschichte’ / u/ [u] [ puso] puso ‘er/ sie stellte’ [ume a] humear FUMARE ‘qualmen’ Mittlere Vokale / e/ [e] [ peso] peso ‘Peso’ [e ®o] hedor FOETOR ‘Gestank’ __r, __x [] [ pra] perra ‘Hündin’ [ kxa] queja ‘Klage’ __C. [pa pl] papel ‘Papier’ [ tsta] testa ‘Haupt’ / o/ [o] [ poso] poso ‘ich setze ab’ [ oa] hora HORA ‘Stunde’ __r, __x [ ] [ ra] gorra ‘Mütze’ [ k xo] cojo ‘ich nehme’ __C. [ k sta] costa ‘Küste’ [m n t n] montón ‘Unmenge’ Tiefer Vokal / a/ [a] [ paso] paso ‘Schritt’ [a -e] haber HABERE ‘haben’ Mittlere und tiefe ostandalusische Vokale / e/ [e] [ bjene] viene ‘er/ sie kommt’ / / [] ([ bjens] >) [ bjn] vienes ‘du kommst’ / o/ [o] [ too] toro ‘Stier’ / / [ ] ([ to s] >) [ t ] toros ‘Stiere’ / a/ [a] [ pala] pala ‘Schaufel’ / æ/ [æ] ([ palæs] >) [ pælæ] palas ‘Schaufeln’ In 2.2.3 und 2.3.2 haben wir uns damit befasst, dass Vokale ihre spezifische Klangfärbung durch die jeweilige Konfiguration des Mundraums erhalten, denn dadurch werden bestimmte Resonanzfrequenzen, die Formanten, verstärkt. In Abb. 2.5-16 sind typische Frequenzwerte der beiden ersten Formanten spanischer und deutscher Vokale, wie sie von männlichen Muttersprachlern produziert wurden, in ein Koordinatensystem eingetragen: auf der y-Achse sehen wir die Werte für F 1 (die negativ mit der Zungenhöhe korrelieren), auf der x-Achse die Werte für F 2 (die der horizontalen Zungenposition von hinten nach vorn entsprechen). Verbindet man die Schnittpunkte für die einzelnen Vokale, so erhält man die akustische Entsprechung des oben eher impressionistisch erstellten Vokaltrapezes bzw. -dreiecks. Die Abbildung lässt zugleich gewichtige Unterschiede zwischen spanischen und deutschen Vokalen deutlich werden. So ist das spanische [e] offener als das deutsche; es ist etwa auf halbem Weg zwischen deutschem [e] und [] angesiedelt. Noch augenfälliger sind die Unterschie- 61 Nur für die Konjunktion [i] ‘und’ wird der Buchstabe <y> verwendet. 62 Außer im Digraphem <ch>, das konsequent für die Affrikate / t²$/ steht (s. 2.5.1.2), erscheint der Buchstabe <h> vornehmlich in zwei verschiedenen etymologischen Zusammenhängen: einmal setzt er - wie in historia oder hora - lateinisches < H > fort, das seinen Lautwert [h] schon in der Antike verloren hatte; zum anderen repräsentiert er den altkastilischen [h]-Laut, der sich - vermutlich unter baskischem Einfluss - seit dem 11. Jahrhundert aus wort- und silbeninitialem [f] entwickelt hat (Alarcos Llorach 1986: 254ff.). Aus der spanischen Phonie ist dieses [h] spätestens seit dem 16. Jahrhundert wieder verschwunden, sodass auch hier die Schreibung nur aus historischen Gründen erfolgt. 81 de beim spanischen [o], das dem deutschen [ ] nahekommt, während spanisches [u] in etwa die gleiche Zungenhöhe aufweist wie das deutsche [o], aber weiter vorn artikuliert wird. Abb. 2.5-16 Typische Frequenzwerte der beiden ersten Formanten spanischer und deutscher Vokale, männliche Sprecher (nach Martínez Celdrán & Fernández Planas 2007: 175 für die spanischen, Mayer 2010: 114 und 116 für die deutschen Werte). Abb. 2.5-17 zeigt abschließend Sagittalschnitte von der Artikulation der spanischen Vokale. a) [i] b) [e] c) [a] d) [o] e) [u] Abb. 2.5-17 Sagittalschnitte der Artikulation von sp. a) [i], b) [e], c) [a], d) [o], e) [u] (aus Kubarth 2009: 85). 2.5.3.2 Diphthonge und Hiate Wenn zwei Vokalstellungen innerhalb einer Silbe (also tautosyllabisch) unmittelbar ineinander übergehen, so bilden sie einen Diphthong (4.2.4.3). Die beiden Bestandteile dieses ‘Doppellauts’ sind dabei in der Regel nicht gleichwertig; vielmehr behält der eine Vokal seine Klangfülle und stellt das Sonoritätsmaximum dar, während der andere zum Approximanten (bzw. Gleitlaut oder Halbvokal) wird. Im Spanischen (wie in vielen anderen Sprachen) sind es vornehmlich die hohen Vokale / i/ und / u/ , die in Diphthongen als Gleitlaute [j] und [w] (bzw. [i ] und [u], s. 2.5.2) erscheinen. Gehen diese dem vollen Vokal voran, so spricht man wegen der zunehmenden Klangfülle von einem steigenden Diphthong (sp. diptongo creciente); folgt der Gleitlaut dem Vokal, so ist der Diphthong fallend (sp. diptongo decreciente). In einem Triphthong (wörtlich ‘Dreilaut’, sp. triptongo) ist der volle Vokal auf beiden Seiten von Gleitlauten umgeben, der Nukleus ist hier also steigend-fallend. deutsch spanisch a a o œ o u e i e i y u ('/ $% #$! " 3 $ % ! ! " % " $ " 2 0 1 82 Im Spanischen können [j] und [w] mit den Vokalen [e], [a] und [o] jeweils die steigenden Diphthonge [je]/ [we], [ja]/ [wa], [jo]/ [wo] (z.B. [ f wea] fuera ‘raus’) und die fallenden Diphthonge [ej]/ [ew], [aj]/ [aw], [oj]/ [ow] (z.B. [ r ejna] reina ‘Königin’) bilden (wobei [ow] wortintern nur in Entlehnungen - vornehmlich aus dem Katalanischen - vorkommt). Steigende Diphthonge werden im Spanischen prinzipiell bevorzugt, und das gilt auch, wenn die hohen Vokale / i/ und / u/ gemeinsam in einem Diphthong auftreten (vgl. NGRAE 2011: 333). Die Position des Approximanten kann hier jedoch regional schwanken, weshalb wir mit Kubarth (2009: 88) in diesen Fällen variable Diphthonge ansetzen: Sie werden als [ju] oder [iw] und andersherum als [wi] oder [uj] realisiert (z.B. [ bju®a]~[ biw®a] viuda ‘Witwe’). Eine Verbindung von [j] mit [i] oder [w] mit [u] ist im Spanischen nicht möglich, da sie praktisch alle Merkmale teilen und einander deshalb sehr ähnlich sind. Triphthonge werden nur mit / e/ oder / a/ als Vollvokal gebildet. Sie treten vornehmlich in der 2. Person Plural spanischer Verben auf (z.B. [estu ®jajs] estudiáis ‘ihr studiert’); in anderen Wörtern haben sie meist eine lautmalerische Funktion. Gehören unmittelbar benachbarte Vokale zwei verschiedenen Silben an, sind sie also heterosyllabisch, so bezeichnet man ihr Zusammentreffen an der Silbengrenze als Hiatus oder Hiat (sp. hiato). Im Spanischen (wie auch im Deutschen) sind Abfolgen von nicht hohen Vokalen, also Kombinationen aus / e/ , / a/ und / o/ in der Regel heterosyllabisch, so etwa die Vokale in sp./ dt. real. Anders als in der deutschen Aussprache [e ª l] werden die betroffenen Vokale im Spanischen jedoch nie durch Knacklaut (Glottisschlag) voneinander getrennt, sondern sie gleiten ohne Absetzen ineinander über (vgl. für ein Sonagramm dieses Hiatus im Spanischen Abb. 2.5-12a). Doch auch die Kombination von Vokal mit hohem Vokal ergibt nicht zwangsläufig einen Diphthong, sondern wird gegebenenfalls als Hiatus syllabiert. Das ist u.a. immer dann der Fall, wenn der hohe Vokal den Wortakzent trägt und wegen seiner daraus resultierenden größeren Klangfülle nicht als Gleitlaut realisiert wird. Bei allen anderen Vokalsequenzen, für die zumindest die kastilische Norm einen Hiatus ansetzt, lässt sich große Variation zwischen hetero- und tautosyllabischer Gruppierung der Vokale ausmachen, die durch sprachliche und außersprachliche Faktoren mitbestimmt wird. 63 Prinzipiell ist jedoch die Tendenz, Vokalfolgen tautosyllabisch in einer Silbe zusammenzuführen, im Spanischen weit verbreitet (4.2.6). Während bei gleichen Vokalen normalerweise die Kontraktion zu einem Monophthong erfolgt (z.B. [ke emos] ~ [ kemos] creemos ‘wir glauben’, [alko ol] ~ [al kol] alcohol ‘Alkohol’, [al-a aka] ~ [al -aka] albahaca ‘Basilikum’), werden in mehr oder weniger informellem Sprechen auch Sequenzen mit den mittleren Vokalen / e/ und / o/ , die eigentlich einen Hiatus bilden, diphthongisch realisiert, wobei die Gleitlaute [e] und [o] entstehen. 64 Zu derartigen Kontraktionen kommt es auch über Wortgrenzen hinweg, wenn 63 Hualde (2005: 80ff.) diskutiert die Regelmäßigkeiten dieser Variation ausführlich (vgl. auch Kubarth 2009: 93ff.). Zu den sprachlichen Faktoren, die einen Hiatus begünstigen, gehört etwa eine Morphemgrenze zwischen den betreffenden Vokalen oder die Nähe der Vokale zum Wortanfang sowie ein geringer Abstand zur folgenden Akzentsilbe. Die Tendenz, Hiate zugunsten von Diphthongen zu vermeiden, ist im lateinamerikanischen Spanisch stärker ausgeprägt als im europäischen. Sie kann zudem schnelles und/ oder informelles bzw. nachlässiges Sprechen kennzeichnen. 64 In nachlässigem Sprechen können diese weiter zu [j] oder [w] angehoben werden: [te ato] ~ [ teato] ~ [ tjato] teatro ‘Theater’, [almo a®a] ~ [al moa®a] ~ [al mwa®a] almohada ‘Kissen’ (vgl. NGRAE 2011: 339). 83 innerhalb einer Wortgruppe der letzte Vokal des vorangehenden mit dem ersten des folgenden Wortes in einer Silbe realisiert wird - was besonders häufig geschieht, wenn beide Vokale unbetont sind. Auch hier resultieren also Diphthonge, in denen sowohl hohe als auch mittlere Vokale als Gleitlaute fungieren ([mje mana] mi hermana ‘meine Schwester’, [sea ka-a] se acaba ‘es endet’), während gleiche Vokale wiederum zu Monophthongen zusammengezogen werden ([es ta-a ki] estaba aquí ‘es war hier’). In der spanischen Graphie werden Vollvokale und Gleitlaute durch die üblichen Vokalbuchstaben repräsentiert. Für [j] und [w] in Diphthongen stehen also in der Regel die Buchstaben und . Nur am Wortende wird <y> für [j] gesetzt. In 2.5.1.1 und 2.5.3 (Fußnoten 41 und 57) haben wir schon darauf hingewiesen, dass wort- und silbeninitiales [w] häufig durch [] verstärkt wird, was in der Schreibung nur sehr selektiv durch <g-> eine Entsprechung findet. Steht jedoch <g> am Wort- oder Silbenanfang, so ist [w] in [we] und [wi] durch <ü> wiederzugeben (z.B. <cigüeña> ‘Storch’): Das Trema zeigt hier an, dass die Abfolge <gu> vor <e> und nicht wie sonst für [] oder [±], sondern für [w] oder [±w] steht. In all den Wörtern, in denen für das potentielle [] vor initialem [w] kein <g-> geschrieben wird, steht aus historischen Gründen vor dem ein <h->. 65 Trägt in einer Vokalsequenz der hohe Vokal den Wortakzent, sodass diese als Hiatus realisiert wird, muss der entsprechende Vokalbuchstabe mit dem Akut (sp. tilde) als <í> oder <ú> gekennzeichnet werden (<día> ‘Tag’). Ist die Tonstelle auf einem nur aus hohen Vokalen bestehenden Diphthong graphisch anzuzeigen, so wird der Akut entsprechend der Präferenz für steigende Diphthonge auf den Buchstaben für den zweiten Vokal gesetzt (<interviú> ‘Interview’, NGRAE 2011: 333). Unabhängig davon, ob sie Diphthonge oder Hiate repräsentieren, darf im Spanischen zwischen Vokalbuchstaben keine Silbentrennung am Zeilenende erfolgen (ORTE 2010: 405). Steigende Diphthonge (und Hiate) [ je ] [ sje te ] siete ‘7’ [ na®j e ] nadie ‘niemand’ [ i.e ] [ ri. e ] ríe ‘er/ sie lacht’ [ i.e ]~[ je ] [kli en te ]~[ kljen te ] cliente ‘Kunde’ [mi.e man a ]~[mje man a ] mi hermana ‘meine Schwester’ [ we ] [ nwe-e] nueve ‘9’ [ tenwe] tenue ‘zart’ [ ( ) we-o] huevo ‘Ei’ [si (±)we»a] cigüeña ‘Storch’ [ u.e ] [ta -u. es ] tabúes ‘Tabus’ [ u.e ]~[ we ] [ku el]~[kwel] cruel ‘grausam’ [tu.e man a ]~[twe man a ] tu hermana ‘deine Schwester’ [ ja ] [o ®ja] odiar ‘hassen’ [ asjas] gracias ‘danke’ [ i.a ] [ di. a ] día ‘Tag’ [ i.a ]~[ ja ] [di a-lo]~[ dja-lo] diablo ‘Teufel’ [mi.a -wel a ]~[mja -wel a ] mi abuela ‘meine Großmutter’ [ wa ] [ kwato] cuatro ‘4’ [ rekwa] recua ‘Menge’ [ ()wante] guante ‘Handschuh’ [ a(±)wa] agua ‘Wasser’ [ u.a ] [konti nu.a]continúa‘er/ sie fährt fort’ 65 Dieses <h-> (wie in <huevo> ‘Ei’) diente in mittelalterlichen Texten dazu, wortinitiales als (halb-)vokalisch zu kennzeichnen und damit eine konsonantische Lesart (als [b] o.ä.) zu verhindern. Auch nach der Ausdifferenzierung der Buchstaben in und <v> ist diese graphotaktische Schreibung beibehalten worden. $% #$! " 3 $ % ! ! " % " $ " 2 ('/ 0 1 84 [ u.a ]~[ wa ] [anu al]~[a nwal] anual ‘jährlich’ [tu.a -wel a ]~[twa -wel a ] tu abuela ‘deine Großmutter’ [ jo ] [ra sjon] ración ‘Portion’ [ la-jo] labio ‘Lippe’ [ i.o ] [ ri. o ] río ‘Fluss’ [ i.o ]~[ jo ] [bi om.bo]~[ bjombo] biombo ‘Schirm’ [mi. ombe]~[ mjombe] mi hombre ‘mein Mann’ [ wo ] [sun twoso] suntuoso ‘prächtig’ [ bakwo] vacuo ‘leer’ [ u.o ] [ bu.o] búho ‘Uhu’ [ u.o ]~[ wo ] [ku ota]~[ kwota] cuota ‘Quote’ [tu ombe]~[ twombe] tu hombre ‘dein Mann’ Fallende Diphthonge (und Hiate) [e j ] [ bejnte] veinte ‘20’ [ rej] rey ‘König’ [e . i ] [re i] reír ‘lachen’ [e .i ]~[e j ] [re.i e]~[rej e] reiré ‘ich werde lachen’ [kan te.i.-aj le]~[kan tej-aj le] canté y bailé ‘ich sang und tanzte’ [ ew ] [ dew® a ] deuda ‘Schuld’ [ew opa] Europa ‘Europa’ [ e. u ] [re us a ] rehusa ‘er/ sie lehnt ab’ [ e.u ]~[ ew ] [re um a ]~[ rewm a ] reúma/ reuma ‘Rheuma’ [baj le.umbo leo]~[baj lewmbo leo] bailé un bolero ‘ich tanzte einen Bolero’ [ aj ] [ bajle] baile ‘Tanz’ [baj ni°a] vainilla ‘Vanille’ [ka aj] ¡caray! ‘Donnerwetter! ’ [ a. i ] [ka i® a ] caída ‘Sturz’ [ a.i ]~[ aj ] [ka.i mjento]~[kaj mjento] caimiento ‘Fall’ [ kanta.i. -ajla]~[ kantaj -ajla] canta y baila ‘er/ sie singt und tanzt’ [ aw ] [ k awsa ] causa ‘Ursache’ [k aw ® al ] caudal ‘reichhaltig’ [ a. u ] [ba ul] baúl ‘Koffer’ [a u°a] aúlla ‘er/ sie heult’ [ a.u ]~[ aw ] [a.u°a a]~[aw°a a] aullará ‘er/ sie wird heulen’ [ da.ummen saxe]~[ dawmmen saxe] da un mensaje ‘er/ sie gibt eine Nachricht’ [ oj ] [ bojna] boina ‘Baskenmütze’ [oj] hoy ‘heute’ [ o. i ] [o i® o ] oído ‘Gehör’ [ o.i ]~[ oj ] [o.i e ]~[oj e ] oiré ‘ich werde hören’ [lo.in tu°e]~[lojn tu°e] lo intuye ‘er/ sie ahnt es’ [ ow ] [bow] bou (kat.) ‘Fischtrawler’ [ o.u ]~[ ow ] [lo.uti lisa]~[lowti lisa] lo utiliza ‘er/ sie benutzt es’ (Variable) Diphthonge (und Hiate) aus hohen Vokalen [ju]~[iw] [ bju® a ]~[ biw® a ] viuda ‘Witwe’ [dju etiko]~[diw-] diurético ‘harntreibend’ [inte -ju]~[inte -iw] interviú ‘Interview’ [i.u]~[ju] [di. uno]~[ djuno] diurno ‘täglich’ [mi.uni ®a®]~[mjuni ®a®] mi unidad ‘meine Einheit’ [wi]~[uj] [ kwita]~[ kujta] cuita ‘Sorge’ [kwi ®a]~[kuj ®a] cuidar ‘sorgen’ [mwi]~[muj] muy ‘sehr’ [ ( ) wito]~[ ( ) ujto] güito ‘Aprikosenkern’ [a kwifeo]~[a kujfeo] acuífero ‘wasserführend’ [u.i]~[wi] [ko´klu. i®o]~[ko´ klwi®o] concluido ‘abgeschlossen’ [tu.is toja]~[twis toja] tu historia ‘deine Geschichte’ 85 Triphthonge [je j ] [estu ®jejs] estudiéis ‘ihr möget studieren’ [ wej ] [a-ei ±wejs] averigüéis ‘ihr möget ermitteln’ [bwej] buey ‘Ochse’ [j aj ] [kam bjajs] cambiáis ‘ihr wechselt’ [i.aj]~[jaj] y hay ‘u. es gibt’ [ waj ] [a-ei (±)wajs] averiguáis ‘ihr ermittelt’ [o.aj]~[o aj]~[waj] o hay ‘od. es gibt’ [ jaw ] [mjaw] miau ‘miau’ [ waw ] [()waw] guau ‘wau’ Im Deutschen gibt es - von Entlehnungen wie [e n al] genial, [pa ¾ l] partiell, [nª ¾ o n] Nation, [li´ stk] Linguistik u.ä. abgesehen - keine steigenden Diphthonge, und auch die Zahl der fallenden Diphthonge ist stärker eingeschränkt als im Spanischen: Es treten nur [a ], [a] und [ ] wie in [ la t ] leite, [ lat ] Laute, [ l t ], Leute/ läute auf. Dass zur Transkription der Gleitlaute hier die ungespannten Vokale [] und [] mit dem Diakritikon versehen werden, macht deutlich, dass diese deutschen Diphthonge weniger geschlossen sind als ihre spanischen Entsprechungen. Es ist also beim Erlernen des Spanischen auf eine geschlossene Aussprache der Diphthonge zu achten. In 2.5.1.5 haben wir schon darauf hingewiesen, dass r-Laute in der Coda im Deutschen häufig (halb)vokalisch realisiert werden, wodurch hier weitere (fallende) Diphthonge entstehen (vgl. z.B. dt. [i À] ihr, [me À ] mehr/ Meer, [nu À ] nur). Eine Übertragung dieser Aussprachegewohnheit ins Spanische sollte vermieden werden. Übungsaufgaben 1) Welches sind die drei Teilbereiche der Phonetik? Charakterisieren Sie diese kurz. 2) Was unterscheidet das International Phonetic Alphabet von einer gewöhnlichen Alphabetschrift? 3) Charakterisieren Sie die drei Funktionskreise der Lautproduktion. 4) Wie lassen sich Vokale gegenüber Konsonanten und Approximanten charakterisieren? 5) Kreuzen Sie die Merkmale der folgenden Vokale an. +vorne +gerundet +(halb)geschlossen [u] [e] [i] [y] [] 6) Ordnen Sie die Lautklassen den entsprechenden Artikulationsmodi zu. Lautklassen Artikulationsmodi A Plosiv zentrale Enge ohne Geräuschbildung B Nasal E seitliche Enge ohne Geräuschbildung C Vibrant kompletter Verschluss, Velum abgesenkt D Frikativ kompletter Verschluss, Velum angehoben E Lateraler Approximant zentrale Enge mit Geräuschbildung F Approximant intermittierende orale Verschlüsse 456789: 6; 8: 5<7 0 1 86 7) Wie sich die Formanten am eigenen Leibe erfahren lassen… Aufgabe a) - Bringen Sie Ihre Artikulatoren in die Position eines [a] (lautlos! ). - Klopfen Sie mit einem Stift oder dem Finger gegen die Seitenwand des Schildknorpels (in der Höhe des Adamsapfels). - Was hören Sie? - Gehen Sie nun - unter stetigem Klopfen - langsam von der Stellung des [a] zu der eines [i] über. - Was hören Sie? ‘Lösung’: - Die Tonhöhe des Klopfgeräuschs wandert mit der Aufwärtsbewegung des Unterkiefers nach unten. - Sie entspricht der Frequenz von F 1 , die von ~850 Hz für [a] auf ~240 Hz bei [i] heruntergeht. Aufgabe b) - Beobachten Sie Ihre Artikulationsbewegungen beim Übergang von [u] zu [y] und wieder zurück etc. - Welche Lageveränderung der hochgewölbten Zunge stellen Sie fest? - Wo hat die Zunge jeweils den kleinsten Abstand? - Wiederholen Sie die Verschiebung von [u] zu [y] und wieder zurück mit Flüsterstimme. - Was hören Sie? ‘Lösung’: - Die Tonhöhe des Flüstergeräuschs wandert mit der Zungenbewegung von oben (beim [y]) nach unten (beim [u]). - Sie entspricht der Frequenz von F 2 , die von ca. 600 Hz für [u] auf über 2000 Hz für [y] ansteigt. Aufgabe c) - Wiederholen Sie das Flüsterexperiment mit dem Übergang von [i] zu [y] und zurück. - Was hören Sie? ‘Lösung’: - Lippenrundung und -vorstülpung führt ebenfalls zu einem Absenken des zweiten Formanten. 8) Nehmen Sie sich in Praat mit der Äußerung Die Damen und die Diener auf. Editieren Sie das Signal und lassen Sie sich auch das Spektrogramm anzeigen. Versuchen Sie nun, das [d] aus Damen möglichst genau zu markieren. Hören Sie dann den unmittelbar folgenden Abschnitt (oberster Abspielbalken unter dem Spektrogramm) an. Auch wenn das [d] als Plosiv gar nicht mehr im Signal präsent ist, müssten Sie trotzdem weiterhin Damen und nicht etwa Amen hören. Woran liegt das? Vergleichen Sie Formanten und Formanttransitionen in Damen und Diener. 9) Nehmen Sie eine kleine Äußerung auf (z.B. die Frage Haben Sie Mandarinen? ) und erproben Sie in Praat alle in 3.3.3 vorgestellten Analysen und Annotierungen. 10) Das Ohr unterzieht den Sprachschall einer Fourier-Analyse. Erläutern Sie, was eine Fourieranalyse ist. Wo findet diese Fourier-Analyse statt? Wie vollzieht sie sich genau? 87 11) Nehmen Sie sich mit den deutschen Wörtern Panne, Tal und Kappe sowie Spanne, Stahl und Skat auf. Erstellen Sie Oszillo- und Sonagramme und vergleichen Sie die voice onset time bei den anlautenden Plosiven mit der bei den Plosiven nach <S>. 12) Nehmen Sie spanische Muttersprachler und deutschsprachige Lerner mit Äußerungen wie ¿Conoces un sitio para comer tapas? auf. Erstellen Sie Oszillo- und Sonagramme und messen Sie in den mit stimmlosen Plosiven beginnenden Wörtern jeweils die voice onset time. Wiederholen Sie die Aufgabe mit den Lernern nach einer intensiven Übungsphase. 13) Nehmen Sie spanische Muttersprachler und deutschsprachige Lerner mit Äußerungen wie Bueno, dígame, por favor, donde está el garaje auf. Erstellen Sie Oszillo- und Sonagramme und untersuchen Sie die stimmhaften Plosive auf Anzeichen von Stimmhaftigkeit. Wie lassen sich voll stimmhafte Plosive trainieren? 14) Nehmen Sie Muttersprachler aus verschiedenen spanischsprachigen Regionen Europas und Lateinamerikas mit den spanischen Sprichwörtern No hay dolor que la mujer no sepa hacer meno und Corazón alegre hace fuego de la nieve auf. Transkribieren Sie die Aufnahmen, analysieren Sie alle Plosive, Frikative und Approximanten so genau wie möglich und klassifizieren Sie diese nach artikulatorischen und akustischen Kriterien. 456789: 6; 8: 5<7 3. System- und Regelhaftigkeit der Laute: Segmentale Phonologie Phonetik und Phonologie untersuchen beide die lautliche Seite der sprachlichen Kommunikation, doch sie tun dies mit unterschiedlichen Interessensschwerpunkten: Wie wir in Kapitel 2 gesehen haben, befasst sich die Phonetik mit der Materialität des Sprachschalls und untersucht, wie dieser artikulatorisch zustandekommt, wie er physikalisch/ akustisch gemessen und beschrieben werden kann und wie er auditiv wahrgenommen wird. Die Phonologie dagegen interessiert sich für die lautliche Seite ausschließlich unter dem Aspekt ihrer Systembzw. Regelhaftigkeit: Sie will die Strukturen, Prinzipien und Beschränkungen ermitteln, nach denen die Lautseite von Sprachen funktioniert. 1 Phonologie als sprachwissenschaftliche Teildisziplin ist im Rahmen des Strukturalismus (3.1) entwickelt worden, und wir stellen ihre Grundbegriffe (3.1.1) und die Phoneme des Spanischen (3.1.2) zunächst vor diesem Hintergrund vor. Es folgt in 3.2 eine Einführung in die klassische generative Phonologie, bevor mit Merkmalsgeometrie und Autosegmentaler Phonologie (3.3), Optimalitätstheorie (3.4) und Exemplartheorie (3.5) neuere Ansätze behandelt werden. All diesen nachstrukturalistischen Theorien ist gemein, dass sie in größerem Maße phonologische Prozesse in den Blick nehmen. 2 3.1 Strukturalistische Phonologie Das Konzept der Phonologie (sp. fonología), wie es im Rahmen des 1926 gegründeten Cercle Linguistique de Prague (CLP) von dem russischen Sprachwissenschaftler Nikolaus S. Trubetzkoy (1890-1938) entworfen 3 und u.a. von Roman Jakobson (1896-1982) fortgeführt worden ist, gilt als wichtigste Leistung des sprachwissenschaftlichen Strukturalismus: 4 Es etabliert die Phonologie als eigene Teildisziplin der Linguistik und macht sie zugleich zur Grundlagendisziplin strukturalistischer Sprachanalyse. 5 1 Phonologie wird aus diesem Grunde bisweilen auch als ‘funktionale Phonetik’ bezeichnet, vgl. etwa Maas (2006). 2 Unter diesem Gesichtspunkt werden nachstrukturalistische Ansätze oft auch unter dem Stichwort ‘Prozessphonologie’ zusammengefasst (vgl. Krefeld 2001). 3 Trubetzkoys Hauptwerk, seine auf Deutsch verfassten Grundzüge der Phonologie, ist 1939 posthum erschienen und seitdem mehrfach neu aufgelegt worden (zuletzt 7 1989). 4 Der CLP, der auch als Prager Schule bekannt wurde, organisierte 1930 eine erste phonologische Konferenz in Prag und rief eine internationale Arbeitsgemeinschaft für phonologische Forschung ins Leben. Innerhalb des amerikanischen Strukturalismus mit seinem Hauptvertreter Leonard Bloomfield (1887-1949) hat die Phonologie (bzw. Phonemik) eine eigenständige Entwicklung genommen, die wir hier nicht gesondert behandeln. 5 1950 erscheint mit der Fonología española von Emilio Alarcos Llorach (1922-1998) eine erste Anwendung der strukturalistischen Prinzipien auf das Spanische ( 4 1986). In den strukturalistischen Rahmen gehören u.a. auch die Arbeiten von Antonio Quilis (1933-2003), vgl. insbesondere Quilis (1993). = 1 90 3.1.1 Grundbegriffe Ausgangspunkt für die strukturalistische Phonologie sind Daten aus konkreten sprachlichen Äußerungen als Einheiten der parole oder des Sprechakts (sp. habla), durch deren Analyse die phonologischen Strukturen der abstrakten langue oder des Sprachgebildes 6 (sp. lengua) ermittelt und beschrieben werden sollen. Das grundlegende Kriterium, um aus der enormen Vielfalt der konkreten lautlichen Realisierungen das Allgemeine oder Konstante als Eigenschaften der langue herauszufiltern, liegt in der Möglichkeit zur Bedeutungsdifferenzierung (sp. capacidad diferenciadora): die Laute, mit deren Hilfe in einer bestimmten Sprache Bedeutungen unterschieden werden und die damit in distinktiver Opposition (sp. oposición distintiva) zu anderen Lauten stehen, gehören als Phoneme (sp. fonemas) zum Phonemsystem dieser Sprache. Von allen anderen Eigenschaften dieser Laute kann dagegen abstrahiert werden. Ziel der strukturalistischen Phonologie ist es, diese bedeutungsdifferenzierenden Einheiten oder Phoneme für die Sprachen der Welt zu ermitteln und zu inventarisieren, um das einem solchen Inventar zugrundeliegende System als intern strukturiertes, durch Oppositionsrelationen gegliedertes Ganzes zu beschreiben. In 2.5 haben wir Sprachlaute des Spanischen und des Deutschen nach artikulatorischen Eigenschaften unter Berücksichtigung der akustischen und auditiven Korrelate phonetisch beschrieben und klassifiziert. Dabei haben wir bereits große Abstraktionen vorgenommen, denn obwohl zwei Laute nie völlig gleich artikuliert werden, haben wir aus der Vielfalt möglicher Lautbildungen diejenigen, die wir aufgrund unserer kategorialen Wahrnehmung (vgl. 2.4.2) als gleich einstufen und die ähnliche artikulatorische und akustische Merkmale aufweisen, zu Lautklassen zusammengefasst. Wir haben also alle zufälligen oder individuellen Eigenschaften ausgeblendet und nur noch diejenigen berücksichtigt, die das typische Klanggepräge einer solchen Lautklasse ausmachen, sodass wir sie anhand weniger Merkmale charakterisieren können - z.B. als palatalen Nasal [»] oder als hohen, vorderen Vokal [i]. Die Phonologie (in ihrer strukturalistischen Ausprägung) interessiert sich nun dafür, welche dieser Laute oder besser Lautklassen in einzelnen Sprachen genutzt werden, um Bedeutungen zu differenzieren, und damit als Phoneme dieser Sprache gefasst werden können. Um diese Phoneme (als Einheiten der langue) zu bestimmen, geht sie also in der Abstraktion vom Laut (sp. sonido) oder Phon (sp. fono) als Segment (sp. segmento) konkreter individueller parole-Äußerungen zum Laut (bzw. zur Lautklasse) als Ergebnis (symbol)phonetischer Analyse noch einen Schritt weiter: als Merkmale der phonologisch relevanten Lautklassen bleiben nur noch diejenigen Eigenschaften erhalten, die in einer Sprache distinktiv, weil bedeutungsunterscheidend sind. Diese Eigenschaften kennzeichnen die Phoneme als kleinste bedeutungsdifferenzierende Einheiten einer Sprache. Das Phonem als minimale Einheit der langue ist zwar nicht in noch kleinere aufeinander folgende Segmente unterteilbar, es lässt sich jedoch als Bündel der distinktiven Merkmale (sp. rasgos pertinentes/ distintivos) verstehen, die der betreffenden Lautklasse beim Abstraktionsprozess zum Phonem als Charakteristika verblieben sind. Durch die Inventarisierung der Phoneme anhand dieser distinktiven Merkmale wird die Struktur des Phonemsystems einer Sprache deutlich. Alle Phoneme teilen eine Reihe von distinktiven Merkmalen mit einigen anderen Phonemen, sie müssen sich 6 ‘Sprechakt’ und ‘Sprachgebilde’ sind die von Trubetzkoy verwendeten deutschen Ausdrücke für Saussures parole und langue. = 91 jedoch mindestens in jeweils einem Merkmal von allen anderen Phonemen derselben Sprache unterscheiden. Phoneme sind die kleinsten bedeutungsdifferenzierenden Einheiten innerhalb eines Sprachsystems. Sie stellen zugleich Bündel distinktiver Merkmale dar. Um die Phoneme einer Sprache zu ermitteln, bedient man sich des Verfahrens der Kommutation (sp. conmutación), was soviel wie ‘Austausch’ bedeutet: Man tauscht in einem Wort einen Laut gegen einen anderen aus und schaut, ob dadurch ein anderes Wort (mit einer anderen Bedeutung) entsteht. Wir wollen das zunächst am Beispiel der r-Laute im Deutschen und im Spanischen verdeutlichen (vgl. 2.5.1.5) und dazu auch das Japanische heranziehen. Ob wir den r-Laut in deutschen Wörtern wie Ratte oder führe uvular (als Frikativ, Vibrant oder Approximant) oder alveolar (als Tap, Trill oder Approximant) artikulieren, ob wir also [ at ]/ [ fy ], [ -at ]/ [ fy - ], [ ¸at ]/ [ fy ¸ ], [ at ]/ [ fy ], [ rat ]/ [ fy r ] oder [ ·at ]/ [ fy · ] aussprechen, sagt zwar eventuell etwas über unsere Herkunft aus und mag je nach Region ungewöhnlich klingen, doch es ändert nichts an der Bedeutung dieser Wörter, die eindeutig als Ratte oder führe identifizierbar bleiben. Erst wenn wir den r-Laut bspw. durch einen Lateral ersetzen, also [ lat ] und [ fy l ] sagen, bedeuten diese Wörter (nun Latte und fühle) etwas anderes. Während sich also [], [-], [¸], [], [r] und [·] im Deutschen als mehr oder weniger gebräuchliche Varianten einem einzigen Phonem zuordnen lassen, das man bspw. / r/ nennen kann, sind wir mit dem Wechsel zum Lateral [l] in den Bereich eines anderen Phonems geraten, denn hier führt der Austausch zu einer Bedeutungsveränderung; der Unterschied zwischen den beiden Lauten ist im Deutschen distinktiv, sie stehen zueinander in (phonologischer) Opposition (sp. oposición distintiva/ fonológica). Es lässt sich auch sagen, dass hier das Merkmal [lateral] 7 , das / l/ kennzeichnet, gegenüber dem Merkmal [vibrant] des / r/ distinktiv ist. Die Merkmale [alveolar] gegenüber [uvular] (also die Artikulationsstelle) oder [gerollt] gegenüber [geschlagen], [frikativ] oder [approximantisch] (weitere Artikulationsmodi), sind dagegen für die r-Laute des Deutschen nicht distinktiv, sondern irrelevant oder redundant und damit für die phonologische Betrachtung uninteressant. Wörter wie dt. [ at ] und [ lat ], in denen man durch den Austausch eines einzigen Lauts eine andere Bedeutung erhält und dadurch die Zugehörigkeit dieser Laute zu verschiedenen Phonemen nachweisen kann, nennen wir Minimalpaare (sp. pares mínimos). [r] und [l] vertreten nun keineswegs in allen Sprachen verschiedene Phoneme. So gibt es bspw. im Japanischen nur ein einziges Liquidphonem / r/ , seine Realisierung als [l] würde automatisch diesem Phonem zugeschlagen, denn die [r] und [l] charakterisierenden Merkmale sind hier nicht distinktiv. Die beiden Laute können keine Minimalpaare differenzieren, vertauscht man sie, so ändert sich die Bedeutung japanischer Wörter dadurch nicht; die Aussprache [kalate] anstelle von [kaate] wird ebenso als Karate identifiziert. 8 Aus diesem Grunde fällt es Menschen mit Japanisch 7 Merkmale als Eigenschaften phonologischer Einheiten werden in eckigen Klammern notiert. Zur systematischen Erfassung distinktiver Merkmale s.u. 8 Der japanische r-Laut wird für gewöhnlich als apikoalveolarer (oder postalveolarer) Schlag realisiert. Da zwischen den Merkmalen [zentral] und [lateral] nicht unterschieden wird, kann seine Aussprache zumindest für westliche Ohren auch lateral erscheinen. In japanischen Entlehnungen wird [l] regelmäßig durch [] ersetzt, z.B. engl. lemonade > jap. [emone do] (Crawford 2009: 15). = 1 92 als Muttersprache auch oft schwer, diese Laute in Sprachen, in denen sie, wie im Deutschen oder im Englischen, verschiedene Phoneme repräsentieren, korrekt zu verwenden. Selbst perzeptiv sind Laute, denen in der eigenen Sprache kein Phonemunterschied entspricht, nicht leicht zu unterscheiden. Wie wir in 2.5.1.5 gesehen haben, müssen dagegen im Spanischen bereits die möglichen r-Realisierungen zwei verschiedenen Phonemen zugeordnet werden, und zwar entweder dem Trill / r/ oder dem Tap / / . Der Artikulationsmodus [gerollt] : [geschlagen] ist hier ein distinktives Merkmal, denn durch den Austausch dieser beiden Konsonanten in wortmedialer Position zwischen Vokalen können Bedeutungen verändert werden: [ pero] perro mit gerolltem Vibranten bedeutet ‘Hund’, [ peo] pero mit geschlagenem Konsonanten bedeutet ‘aber’. Wie im Deutschen - und anders als im Japanischen - repräsentiert der alveolare Lateral [l] auch im Spanischen wiederum ein eigenes Phonem: [ pelo] pelo bedeutet ‘Haar’. / r/ , / / und / l/ können wir demnach als Phoneme des Spanischen registrieren, denn es gibt zahlreiche Wörter, die eine andere Bedeutung allein dadurch erhalten, dass man in ihnen / r/ gegen / / oder / l/ vertauscht. Wenn wir uns auf Laute in ihrer Eigenschaft als Phoneme beziehen, setzen wir die sie vertretenden Symbole zur Unterscheidung von der phonetischen Notation in Schrägstriche: sp. / r/ , / / , / l/ vs. dt. / r/ , / l/ vs. jap. / r/ . Welche Lautunterschiede auch Phonemunterschieden entsprechen, welche Merkmale demnach distinktiv sind, ist also von Sprache zu Sprache verschieden. Aus der potentiell unbegrenzten Zahl artikulatorischer oder akustischer Möglichkeiten trifft jede Sprache eine begrenzte, für sie spezifische Auswahl, die das Phonemsystem dieser Sprache strukturiert. Das Inventar der Phoneme und der sie konstituierenden Merkmale muss daher für jede Sprache gesondert erstellt werden. Je nach Beziehung der Oppositionsglieder untereinander und zum phonologischen Gesamtsystem können auf der Basis der distinktiven Merkmale verschiedene Arten von Oppositionen unterschieden werden (vgl. Trubetzkoy 1989: 59ff.). So spricht man von graduellen Oppositionen, wenn ihre Glieder durch verschiedene Grade derselben Eigenschaft gekennzeichnet sind, etwa durch verschiedene Öffnungsgrade bei den Vokalen. Dabei lassen sich im Unterschied zu binären Oppositionen ganze Relationsketten ausmachen, deren Glieder sich jeweils um einen Grad gegeneinander absetzen (z.B. sp. / u/ : / o/ : / a/ wie in / puso/ puso ‘er/ sie legte’ : / poso/ poso ‘ich lege’ : / paso/ paso ‘ich übergebe’). Mehrdimensionale Oppositionen zeichnen sich dadurch aus, dass die Merkmale, die beiden Elementen gemeinsam sind, auch noch bei anderen Phonemen auftreten: so stehen / p/ : / t/ im Spanischen (wie im Minimalpaar / pan/ pan ‘Brot’ : / tan/ tan ‘so’) in mehrdimensionaler Opposition, da sie die Merkmale [plosiv] und [stimmlos] (bzw. [-stimmhaft]) mit / k/ (wie in / kal/ cal ‘Kalk’ : / tal/ tal ‘solch’ etc.) teilen. Die Opposition / p/ : / b/ (wie im Minimalpaar / polo/ polo ‘Pol’ : / bolo/ bolo ‘Kegel’) ist dagegen eindimensional, denn kein weiteres Phonempaar weist die Merkmale [plosiv] und [bilabial] auf. Sie ist zugleich privativ (im Gegensatz zu äquipollent), denn die beiden Elemente unterscheiden sich voneinander nur durch ein einziges Merkmal, nämlich durch die Anbzw. Abwesenheit der Stimmbeteiligung: bei der Artikulation von / b/ schwingen die Stimmlippen, = 93 es ist daher [+stimmhaft], bei / p/ schwingen sie nicht, folglich ist es [-stimmhaft]. 9 Die Opposition zwischen / b/ und / p/ ist außerdem proportional (im Gegensatz zu isoliert), denn das für dieses Phonempaar geltende distinktive Merkmal [±stimmhaft] wiederholt sich bei anderen Phonempaaren des Spanischen, so bei / d/ : / t/ und / / : / k/ , die sich ebenfalls einzig durch die Stimmbeteiligung voneinander unterscheiden. 10 Der Bezug zwischen Reihen von Phonempaaren, die auf proportionalen Oppositionen beruhen, wird auch als Korrelation bezeichnet. Die Plosive / p t k/ : / b d / sind im Spanischen durch die Stimmbeteiligungskorrelation aufeinander bezogen. In strukturalistischer Tradition bezieht sich der Terminus ‘Opposition’ auf die paradigmatische Achse, auf der die Austauschbarkeit von bedeutungsdifferenzierenden Segmenten untersucht wird (z.B. sp. / p/ : / t/ in dem Minimalpaar / pan/ : / tan/ ). Für die syntagmatische Achse, also für die Relationen zwischen Segmenten, die innerhalb sprachlicher Äußerungen miteinander vorkommen (bspw. die Phoneme / t/ , / a/ und / n/ in sp. / tan/ ), waren die Termini ‘Kontrast’ und ‘kontrastieren’ vorgesehen. Heute werden Kontrast und Opposition jedoch weitgehend synonym gebraucht (vgl. etwa Hall 2011: 37f.), und wir schließen uns dieser Praxis an. Folglich muss gegebenenfalls spezifiziert werden, auf welche der beiden Ebenen man sich bezieht. Auf der syntagmatischen Achse spielt die Distribution (sp. distribución) der Laute, ihre Verteilung in Silbe, Wort und Morphem, eine herausragende Rolle. Jede Sprache hat nicht nur einen festen Satz von Phonemen, sondern es sind auch immer nur ganz bestimmte Abfolgen dieser Phoneme im Wort bzw. in der Wortgruppe zugelassen; der Bau von Silben, Morphemen und Wörtern verläuft nach vorgegebenen Gesetzmäßigkeiten. Hier gibt es universelle Bedingungen (solche, die in allen Sprachen befolgt werden), aber auch viele einzelsprachspezifische Regularitäten. Die Beschränkungen, die in einer Sprache für die Verbindungen ihrer Phoneme zu Lautgruppen gelten, werden auch als Phonotaktik (sp. fonotáctica) bezeichnet (4.2.1). Keine Sprache nutzt alle durch ihre Phonotaktik gegebenen Kombinationsmöglichkeiten tatsächlich zur Bildung von sprachlichen Signifikanten. In 2.5.1.1 haben wir bspw. gesehen, dass im Spanischen ein Plosiv gemeinsam mit einem Liquid einen komplexen Silbenanfangsrand bilden kann, was sich an Wörtern wie sp. [ plano] plano ‘eben’ oder [ ano] grano ‘Korn’ nachweisen lässt. Diese Bedingung erfüllt auch ein Wort wie [ tano] trano, das aufgrund seiner Bauweise durchaus ein spanisches Wort sein könnte. Es fehlt ihm zwar eine Bedeutung, und deshalb ist es im Lexikon des Spanischen nicht verzeichnet, doch das ist dem Zufall geschuldet; wir haben es mit einer zufälligen Lücke, einem accidental gap (sp. vacío accidental) zu tun. 11 Die Lautfolge [ tlano] tlano dagegen ist kein potentielles, sondern ein unmögliches Wort des Spanischen, denn anders als die übrigen Plosive können / t/ und / d/ mit einem Lateral keinen gemeinsamen Anfangsrand bilden. Hier ist also keine zufällige, son- 9 Bei äquipollenten Oppositionen besitzt dagegen jedes der beiden Phoneme ein Merkmal, das das andere nicht hat, so z.B. dt. / r/ : / l/ mit den Merkmalen [vibrant] : [lateral]. 10 Als Beispiel für eine isolierte Opposition kann wiederum / r/ : / l/ im Deutschen herhalten, denn kein weiteres Oppositionspaar teilt die sie unterscheidenden Merkmale. 11 Pseudowörter oder Logatome (sp. pseudo-palabras), die allen phonotaktischen Beschränkungen entsprechen, werden gern in (psycho-)linguistischen Experimenten genutzt, um bspw. bestimmte Hypothesen zur Sprachverarbeitung zu testen. So haben Carreiras & Perea (2004) ermittelt, dass spanische Probanden Pseudowörter mit im Spanischen häufig vorkommenden Silbenstrukturen schneller vorlesen können als solche mit selteneren (vgl. auch 4.3.5.3). = 1 94 dern eine systematische Lücke, ein systematic gap (sp. vacío sistemático) zu verzeichnen. Eine systematische Lücke oder Kombinationsbeschränkung im Anfangsrand besteht - im Spanischen wie im Deutschen - auch für die umgekehrte Abfolge Liquid+Plosiv: Wörter, deren Silben mit / rt-/ , / lk-/ o.ä. beginnen, sind hier nicht vorgesehen. Was die Coda angeht, so verhalten Spanisch und Deutsch sich allerdings unterschiedlich: Coda-Abfolgen aus Liquid + Plosiv sind im Deutschen durchaus geläufig (vgl. z.B. dt. / f rt/ fort, / kalk/ Kalk etc.), im Spanischen existieren sie nicht. Aber nicht nur für die Kombination von Lauten gibt es Beschränkungen, sondern über die Distribution wird generell geregelt, wo welche Phoneme in Silbe, Morphem und/ oder Wort vorkommen können. So haben wir oben aufgrund von Minimalpaaren wie [ pero] perro : [ peo] pero ermittelt, dass für das Spanische mit Tap / / und Trill / r/ zwei verschiedene r-Phoneme anzusetzen sind. Wie wir in 2.5.1.5 gesehen haben, ist die Opposition zwischen / / und / r/ aber auf die wortinterne Position zwischen Vokalen beschränkt. Am Wortanfang (und silbeninitial nach Konsonant) kann nur der Trill vorkommen, an zweiter Stelle im Onset nur der Tap. 12 In der Coda sind zwar beide möglich, aber sie können hier keine Bedeutungen differenzieren. Die Opposition zwischen Tap und Trill ist also in allen anderen Positionen neutralisiert. Wird eine phonologische Opposition (bzw. ein Kontrast) in bestimmten Kontexten aufgegeben, so bezeichnen wir dies als Neutralisierung (sp. neutralización). Der im Falle der Neutralisierung verbleibende Laut, der die Gesamtheit der distinktiven Eigenschaften beider Phoneme vertritt, wird in der Terminologie der Prager Schule als Archiphonem (sp. archifonema) bezeichnet und in der phonologischen Notation durch einen Großbuchstaben wiedergegeben. Bei der Neutralisierung der Opposition zwischen Tap und Trill würde man in dieser Tradition also phonologisch bspw. / Roka/ roca ‘Felsen’, / bRoma/ broma ‘Scherz’ und / paR.te/ parte ‘Teil’ notieren (Alarcos Llorach 1981: 98, 183f.). Da man dabei wissen muss, dass die Neutralisierung je nach Position zu unterschiedlichen Ergebnissen führt, wird in anderen strukturalistischen Ansätzen die Existenz eines Archiphonems / R/ auf die wort- und silbenfinale Position beschränkt, während im Anlaut defektive Distribution zu verzeichnen wäre (Quilis 1993: 42, Hidalgo Navarro & Quilis Merin 2012: 216, 234). Ein weiteres Beispiel für die Neutralisierung von phonologischen Oppositionen haben wir bei der Behandlung der spanischen Nasale in 2.5.1.3 kennengelernt: Während [m], [n] und [»] im Onset kontrastieren und deshalb als Phoneme des Spanischen zu werten sind (/ kama/ cama ‘Bett’, / kana/ cana ‘weißes Haar’, / ka»a/ caña ‘Rohr’), ist dieser Kontrast in der Coda neutralisiert. Als einziges distinktives Merkmal bleibt [nasal], sodass hier für die phonologische Notation ein Archiphonem / N/ angesetzt werden kann: / kaNpo/ campo ‘Feld’, / iNmo al/ inmoral ‘unsittlich’, / kaNto/ canto ‘ich singe’, / baNko/ banco ‘Bank’ etc. Manchmal lassen sich jedoch für zwei (oder mehr) Laute einer bestimmten Sprache in keiner der möglichen Positionen Minimalpaare finden; sie kontrastieren nie miteinander. Sind diese Laute zudem einander phonetisch ähnlich (s.u.), so können sie einem einzigen Phonem zugeordnet werden und gelten dann als Allophone (sp. alófonos) dieses Phonems. Es werden zwei Gruppen von Allophonen unterschieden: 12 Manchmal wird in solchen Fällen auch von einer defektiven Distribution oder Verteilung gesprochen (vgl. Hall 2011: 38). Vgl. dazu genauer 3.1.2.3. = 95 Diejenigen Allophone, die sich, wie die verschiedenen Realisierungen des Phonems / r/ im Deutschen, unabhängig von der Position beliebig miteinander vertauschen lassen, werden auch als Allophone in freier oder fakultativer Variation (sp. variación/ alternancia libre) bezeichnet. Dabei bezieht sich ‘frei’ bzw. ‘fakultativ’ nur auf die prinzipielle Möglichkeit der Vertauschung (ohne dass eine Bedeutungsveränderung erfolgt). Es soll damit keineswegs geleugnet werden, dass die Variation in aller Regel nicht nur durch diatopische, sondern auch durch diastratische und/ oder diaphasische Faktoren gesteuert wird, in dieser Hinsicht also nicht ‘frei’ ist. Als Beispiel für Allophone in freier Variation soll uns hier die aspiración dienen, das Schwanken zwischen [s] und [h] in der Codaposition, wie es in verschiedenen Dialekten des Spanischen verbreitet ist: [pas. tel] ~ [pah. tel] pastel ‘Kuchen’ (vgl. 2.5.1.2). Oft können aber Allophone eines Phonems nicht einfach miteinander vertauscht werden - nicht, weil sich eine andere Bedeutung ergeben würde (dann hätten wir es nicht mit Allophonen, sondern mit Phonemen zu tun), sondern weil unsere Sprachen in bestimmten lautlichen Umgebungen bestimmte Restriktionen aufweisen, die die Vertauschung unmöglich machen. So bilden wir z.B. sowohl im Deutschen als auch im Spanischen den Verschluss, um ein [k] zu artikulieren, je nach folgendem Laut an unterschiedlichen Stellen des weichen und auch des harten Gaumens. Das wird deutlich, wenn wir etwa die spanischen Wörter [ kupo] cupo ‘Beitrag’, [ komo] como ‘wie’, [ kaso] caso ‘Fall’, [ keso] queso ‘Käse’, [ kita] quita ‘er/ sie zieht ab’ hintereinander artikulieren. Unzweifelhaft velar ist der Verschluss nur vor den Vokalen [u], [o] und [a]; je weiter vorn die Vokale artikuliert werden, desto weiter schiebt sich auch die Artikulationsstelle für [k] nach vorn, sodass vor [e] und [i] eher ein palataler (oder prävelarer) Verschlusslaut resultiert. In 2.2.4 haben wir gesehen, dass dies aus phonetischer Sicht als Koartikulationseffekt erklärt werden kann: Laute sind eng miteinander verzahnt und beeinflussen sich gegenseitig. Aus phonologischer Perspektive können wir sagen, dass es sich bei velarem und palatalem [k] um Allophone des Phonems / k/ handelt, die diesmal nicht frei vertauschbar sind, sondern sich in komplementärer Distribution (sp. distribución complementaria) befinden: dort, wo das eine vorkommt, kann das andere nicht vorkommen und umgekehrt. Die Variation wird also durch die Umgebung determiniert; sie ist kombinatorisch bzw. kontextbedingt (sp. variación/ alternancia condicionada). Ein spezifisch deutsches Beispiel für solche kombinatorischen Varianten oder Allophone in komplementärer Distribution stellen der palatale, der velare und der uvulare Frikativ, also [ç], [x] und [], dar. Als ich- und ach-Laute auditiv, artikulatorisch und akustisch deutlich zu unterscheiden, tragen sie dennoch untereinander nicht zur Bedeutungsdifferenzierung bei, sondern lassen sich einem einzigen Phonem zuordnen, das meist als / x/ bezeichnet wird. 13 Sie sind auch keine freien Varianten, unter denen wir beliebig auswählen könnten, sondern ihre Distribution ist von der Qualität des vorangehenden Lauts abhängig: [ç], das auch am Wort- und Morphemanfang auftritt, folgt morphemintern auf mittlere und hohe Vorderzungenvokale sowie auf sonorante Konsonanten, z.B. [-ç n] -chen, [ç] ich, [çt] echt, [ by çÀ] Bücher, [vlç] welch; [x] folgt auf hohe und mittlere Hinterzungenvokale, z.B. [bu x] Buch, [ho x] hoch; [] auf tiefe (hintere) Vokale, z.B. [da] Dach, [d ] doch. 14 13 Hall (2011: 64f.) argumentiert dafür, dass / ç/ statt / x/ als Phonem anzusetzen sei. 14 Generalisierung des ach-Lauts finden wir dagegen im Alemannischen (Südwestdeutschland, deutschsprachige Schweiz), das sich u.a. durch diese Erscheinung von der Standardaussprache des Deutschen absetzt. = 1 96 Laute als Allophone eines Phonems aufzufassen ist jedoch nur sinnvoll, wenn sie phonetisch ähnlich (oder verwandt) sind. So ließen sich allein nach dem Distributionskriterium dt. [´] und [h] als Allophone eines Phonems ansehen, da sie komplementär verteilt sind: [´] kann wort- und morpheminitial gar nicht vorkommen, im Wortinnern können ihm die Vokale [ ] und [À] folgen (z.B. [ l´ ] Länge, [ l´À] länger). Das sind genau die Vokale, vor denen [h], das vornehmlich wort- und morpheminitial erscheint, im Wortinnern nicht auftreten kann. Doch ist die Zuordnung von dt. [´] und [h] zu einem einzigen Phonem, die schon intuitiv abwegig erscheint, aufgrund der mangelnden phonetischen Ähnlichkeit zwischen den beiden Lauten abzulehnen, denn sie besitzen keine gemeinsamen phonetischen Merkmale. Die Allophone [ç], [x] und [] des Phonems / x/ teilen dagegen die Merkmale [stimmlos], [frikativ] und [dorsal]. 15 In komplementärer Distribution stehen auch die stimmhaften Plosive und die entsprechenden Frikativapproximanten des Spanischen, mit denen wir uns in 2.5.1.1 befasst haben: [b d ] kommen nur im absoluten Anlaut und nach Nasal vor ([d] auch nach Lateral), in allen anderen Positionen werden für gewöhnlich [- ® ±] artikuliert. Ein Vertauschen von [b] und [-], [d] und [®], [] und [±] kann also niemals zu einer anderen Bedeutung führen; es entsteht dadurch vielmehr eine Aussprache, die Hualde (2005: 9) am Beispiel von intervokalischem [d] ([ lado] statt [ la®o] lado ‘Seite’) zumindest in nicht emphatischem Kontext als “funny” charakterisiert hat. [b ~ -], [d ~ ®], [ ~ ±] können demnach als kontextbedingte Allophone den Phonemen / b d / zugeschlagen werden. Man könnte jetzt fragen, warum / b d / als Phoneme des Spanischen angesetzt werden und nicht etwa / - ® ±/ . Der Grund liegt in der Plausibilität der Erklärung für die damit verbundenen Prozesse: es ist eher nachzuvollziehen, dass stimmhafte Plosive zwischen Vokalen (bzw. zwischen Liquiden und Vokalen) als Approximanten realisiert werden, als umgekehrt, dass Frikativapproximanten im absoluten Anlaut und nach Nasal als Plosive erscheinen. Die Realisierung in intervokalischer Position lässt sich nämlich im weitesten Sinne als Assimilation oder Angleichung (sp. asimilación) fassen und damit phonetisch erklären: dadurch dass der Verschluss in eine (friktionslose) Enge geöffnet wird, gleichen sich die stimmhaften Plosive ein gutes Stück weit an die sie umgebenden Vokale an. 16 Im absoluten Anlaut, einer starken Position, findet eine solche Angleichung (die sich auch als Schwächung fassen lässt) nicht statt, sodass der Konsonant weiterhin als Plosiv realisiert wird. 17 In 3.2 15 Eine exakte Definition phonetischer Ähnlichkeit, insbesondere die Feststellung, wo Ähnlichkeit aufhört und Unähnlichkeit beginnt, ist jedoch schwierig. Vgl. dazu Kohler (1995: 89ff.). 16 Als phonetischer Prozess kann die Assimilation oft als eine Verstärkung von Koartikulationseffekten gesehen werden (vgl. 2.2.4). 17 Eine Schwächung, die in intervokalischer Position von einem ursprünglich stimmlosen Plosiv bis zum völligen Schwund gehen kann, lässt sich auch historisch in der Entwicklung der romanischen Sprachen nachzeichnen: Auf dem Weg zum Spanischen ist in lat. AMÔCA [a mi ka] ‘Freundin’ der Plosiv zwischen den Vokalen zunächst stimmhaft geworden ([a mia]), bevor die weitere Veränderung zum Frikativapproximanten eintrat: [a mi±a]. Im Französischen ist der (intervokalisch geschwächte) Konsonant schon früh völlig ausgefallen, und das Wort ist zweisilbig geworden: afr. [a mi ], mfr. [a mi ], fr. [a mi] amie. Eine ähnliche Entwicklung zeichnet sich im umgangssprachlichen Spanisch für die Endungen des Partizips Perfekt -ado/ -ada ab: lat. AMÕTUM [a ma tum] ‘geliebt’ > [a mado] > [a ma®o] > [a mao] > [a mao] > [a maw] (vgl. Hualde 2005: 111f.). = 97 werden wir sehen, wie sich solche Prozesse mithilfe phonologischer Regeln formalisieren lassen. Wir haben oben das Phonem als Bündel distinktiver Merkmale definiert. Es stellt also keine Letztgröße dar, sondern ist in sich strukturiert und daher weiter analysierbar. Das Phonemsystem einer Sprache ist durch Oppositionen bzw. Oppositionsreihen oder Korrelationen gegliedert, die wiederum auf den distinktiven Merkmalen der Phoneme beruhen. 18 In der Weiterentwicklung der Phonologie hat sich das Forschungsinteresse auf die systematische Erfassung und Inventarisierung der distinktiven Merkmale gerichtet: Es sollte die (kleinstmögliche) Anzahl Merkmale ermittelt werden, die notwendig sind, um die Phoneme aller Sprachen vollständig zu charakterisieren und so alle potentiellen Kontraste zu erfassen. Anhand der distinktiven Merkmale lassen sich zudem die Phoneme in natürliche Klassen untergliedern, in Gruppen, die sich etwa in Bezug auf bestimmte phonotaktische Beschränkungen oder andere Regelmäßigkeiten gleich verhalten (wie wir es bspw. oben bei den Obstruenten und Liquiden des Spanischen und des Deutschen gesehen haben). In den 50er Jahren des 20. Jh.s hatten Roman Jakobson und seine Kollegen (vor allem Morris Halle und Gunnar Fant) ein Merkmalsinventar vorgeschlagen, für das sie universelle Gültigkeit postulierten. Die von ihnen ermittelten zwölf Merkmale bilden binäre Oppositionen, bei denen es nur um das Vorhandensein oder Nichtvorhandensein (+/ -) einer bestimmten lautlichen Eigenschaft geht. Die Merkmale beruhen vornehmlich auf akustischer Basis, doch lassen sich ihnen artikulatorische Korrelate zuordnen (vgl. Jakobson et al. 1952, Jakobson & Halle 1956 sowie Jakobson & Waugh 1979). Zum Jakobsonschen Merkmalsinventar gehören etwa die grundlegenden Schallquellenmerkmale [±vokalisch] und [±konsonantisch], die in ihrer Binarität bereits eine vierfache Gliederung von Lautsystemen ermöglichen. In der Folgezeit ist dieses Inventar immer wieder revidiert und verfeinert worden (z.B. von Chomsky & Halle 1968, Halle & Clements 1983, McCarthy 1988), wobei erneut artikulatorische Definitionen in den Vordergrund getreten sind. In Anlehnung an Hall (2011: 101ff.) stellen wir im Folgenden die Merkmale vor, die nach dem heutigen Wissensstand in den Sprachen der Welt distinktiv sein können. 19 Sie lassen sich in Oberklassenmerkmale (zur Erfassung ‘großer’ Segmentklassen), laryngale Merkmale (zu den verschiedenen Stellungen der Stimmbänder), Merkmale der Artikulationsart (zur Art und Weise der Behinderung des Luftstroms) und Ortsmerkmale (zur Erfassung der Artikulationsstellen und Zungenpositionen von Konsonanten und Vokalen) unterteilen. Oberklassenmerkmale (major class features, sp. rasgos principales) 20 • Konsonantisch (consonantal, sp. consonante) [±kons] [±cons]: (friktionsbildende) Enge oder völliger Verschluss im Ansatzrohr. Vokale, Approximanten (und auch Laryngale) sind [-kons]. 18 Das phonetische Symbol, durch das ein Phonem repräsentiert wird, kann demnach als Kurzform verstanden werden, die die Auflistung der das Phonem charakterisierenden Merkmale ersetzt. 19 Daneben ist auch eine informelle Notation der Merkmale weiterhin verbreitet, und auch wir greifen je nach Bedarf darauf zurück. 20 Neben der deutschen (und vor der spanischen) wird hier wegen der internationalen Verbreitung jeweils auch die englische Bezeichnung der Merkmale und Merkmalsklassen aufgeführt, gegebenenfalls folgt auch die englische Abkürzung. Die spanischen Namen der Merkmale stammen größtenteils aus NGRAE (2011: 56ff.). = 1 98 • Sonorantisch (sonorant, sp. sonante) [±son]: spontane Stimmhaftigkeit (Resonanzqualität). Obstruenten (und Laryngale) sind [-son]. • Approximantisch (approximant, sp. aproximante) [±appr]: keine Behinderung bzw. friktionslose Engebildung im Ansatzrohr. Vokale, Laterale, Gleitlaute sind [+appr], alle sonstigen [-appr]. Laryngale Merkmale (laryngeal features, sp. rasgos de laringalización) • Stimmhaft (voiced, sp. sonoro) [±sth] [±voice]: Stimmlippen schwingen. • Aspiriert (aspirated / spread glottis, sp. glotis dilatada) [±asp] [±spread gl]: Stimmlippen sind gespreizt, z.B. [h]. • Glottalisiert (glottalized / constricted glottis, sp. constricción glotal) [±glottal] [±constr gl]: Stimmlippen bilden einen Verschluss, z.B. []. Merkmale der Artikulationsart (manner features, sp. rasgos de modo de articulación) • Kontinuierlich/ Dauernd (continuant, sp. continuo) [±kont]/ [±dnd] [±cont]: kein völliger Verschluss im mediosagittalen (mittigen) Bereich des Ansatzrohrs. Plosive, Affrikaten, Nasalkonsonanten, Laterale, geschlagene Vibranten sind [-kont] bzw. [-dnd]. • Nasal (nasal, sp. nasal) [±nas]: Velum ist gesenkt, Luftstrom entweicht durch den Nasenraum. • Lateral (lateral, sp. lateral) [±lat]: zentraler oraler Verschluss, seitlich keine Blockierung. • Sibilantisch/ Gerillt/ Geräuschstark (strident, sp. estridente) [±sibil]: (Zisch-)Laute mit intensivem hochfrequenten Geräuschanteil. Die Zunge ist dabei in Längsrichtung gefurcht (engl. grooved) (Kubarth 2009: 32f.). [s] ist [+sibil], [] ist [-sibil]. • Verteilt/ Distribuiert (distributed, sp. distribuido) [±distr]: Ausmaß der Fläche, auf der sich Kontakt bzw. Enge ausbreiten. Laute mit großflächigem Kontakt in der Länge des Ansatzrohres (wie [$ ç]) sind [+distr]; Laute wie [s t] sind [-distr]. • Verzögert gelöst (delayed release, sp. relajación retardada) [±del rel]: Verzögerte Lösung eines Verschlusses. Affrikaten sind [+del rel]. Ortsmerkmale (place features) • Labial (labial, sp. labial) [ LAB ]: Artikulation mit einer oder beiden Lippen. • Rund (round, sp. redondeado) [±rnd]: Lippen sind gerundet. • Koronal (coronal, sp. coronal) [ KOR ] [ COR ]: Artikulation mit Zungenspitze oder Zungenblatt. • Anterior (anterior, sp. anterior) [±ant]: Hindernis im vorderen Teil des Ansatzrohres (alveolar, dental). Am (vorderen) harten Gaumen artikulierte Laute sind [-ant]. • Apikal (apical, sp. apical) [±apik] [±apic]: Artikulation mit der Zungenspitze. Die Artikulation mit dem Zungenblatt ist [-apik]. • Dorsal (dorsal, sp. dorsal) [ DORS ]: Artikulation mit dem Zungenrücken (Dorsum). • Hinten (back, sp. retraído) [±hint] [±back]: Zungenkörper wird von neutraler Position aus zurückgezogen. Mit vorverlagertem Dorsum artikulierte Laute sind [-hint]. • Hoch (high, sp. alto) [±hoch] [±high]: Zungenkörper wird über die neutrale Position hinaus angehoben. Bei nicht angehobenem Dorsum sind Laute [-hoch]. • Tief/ Niedrig (low, sp. bajo) [±tief]/ [±niedr] [±low]: Zungenkörper wird über die neutrale Position hinaus gesenkt. Bei nicht gesenktem Dorsum sind Laute [-tief]/ [-niedr]. = 99 • Vorgeschobene Zungenwurzel (Advanced Tongue Root, sp. raíz lingual avanzada, RLA) [±ATR]: Zungenwurzel ist bei der Artikulation weiter vorn. • Gespannt (tense, sp. redondeado, sp. tenso) [±gesp] [±tense]: Zusätzliche Anspannung der supraglottalen Muskulatur. • Radikal (radical/ pharyngeal/ guttural, sp. radical) [ RAD ]: Artikulation mit der Zungenwurzel, pharyngale Laute. Die Ortsmerkmale [ LAB ], [ COR ], [ DORS ] und [ RAD ], die den vier Artikulatoren Lippen, Zungenkranz, Zungenrücken und Zungenwurzel entsprechen, sind nach neueren Auffassungen nicht wie alle übrigen Merkmale als binär, sondern als einwertige oder privative (Kategorial-)Merkmale aufzufassen, denn sie implizieren kein Entweder/ Oder, sondern stehen für einen mehrdimensionalen Gegensatz. Zur Unterscheidung von den binären Merkmalen werden sie deshalb meist mit Kapitälchen geschrieben (vgl. Hall 2011: 103f., 111, 125f.). 21 Mit Hilfe der distinktiven Merkmale lassen sich Laute und Lautklassen in Form von Merkmalsmatrizen darstellen. Abb. 3.1-1 zeigt, wie sich die großen Lautgruppen anhand der Oberklassenmerkmale spezifizieren lassen. Abb. 3.1-2 verdeutlicht, dass vier Ortsmerkmale ausreichen, um zehn Vokalphoneme eindeutig zu charakterisieren und gegeneinander abzugrenzen. Für die fünf Vokalphoneme des Spanischen genügen die Merkmale [±hoch], [±tief], [±hint] (vgl. NGRAE 2011: 79). Obstruenten Nasale Liquide Laryngale Vokale [kons] + + + - - [son] - + + - + [appr] - - + - + Abb. 3.1-1 Spezifizierung durch Oberklassenmerkmale. i y u e ø o œ a [hoch] + + + - - - - - - - [tief] - - - - - - + + + + [hint] - - + - - + - - + + [rnd] - + + - + + - + + - Abb. 3.1-2 Darstellung von Oralvokalen in einer Merkmalsmatrix. Auf die Prager Schule geht auch der Begriff der Markiertheit (engl. markedness, sp. marcación oder marcadez) zurück, der in der Phonologie und darüber hinaus in allen sprachwissenschaftlichen Teildisziplinen eine wichtige Rolle spielt. So hat schon Trubetzkoy (1989: 67) die Glieder bestimmter Oppositionen danach unterschieden, ob sie merkmallos oder merkmalhaltig sind: In der privativen Opposition / t/ : / d/ etwa besitzt / d/ das Merkmal [+sth], denn zusätzlich zu den Merkmalen, die beide Konsonanten teilen, schwingen bei der Realisierung von / d/ die Stimmlippen, bei / t/ dagegen nicht. / t/ ist damit das merkmallose oder unmarkierte Glied dieser Opposition, / d/ das markierte (sp. no marcado / marcado). Die Existenz eines markierten 21 In der einflussreichen Darstellung von Chomsky & Halle (1968), an der sich auch Hall (2011) orientiert, galten jedoch alle Merkmale als binär, sodass auch Ortsmerkmale wie [±lab] weiterhin benutzt werden. = 1 100 Lauts wie / d/ impliziert, dass es ein unmarkiertes Gegenstück wie / t/ gibt, während die Umkehrung nicht gilt. Unmarkierte Laute repräsentieren nämlich in den Sprachen der Welt das Gewöhnliche, Unauffällige, Häufige und Weitverbreitete; markierte Laute sind dagegen in weniger Sprachen vertreten, und dort, wo sie vorkommen, ist ihre Distribution gegenüber ihren unmarkierten Gegenstücken stärker eingeschränkt. Markierte Laute werden im kindlichen Spracherwerb später gelernt als unmarkierte, und sie gehen im Fall von Aphasie, also bei einer erworbenen Sprachstörung, eher verloren. Auch gegenüber Sprachwandel sind markierte Laute anfälliger. Bei Neutralisierungen ist es in der Regel der unmarkierte Laut, der als Ergebnis eines solchen Prozesses bestehen bleibt. Um auf unser Beispiel / t/ : / d/ zurückzukommen: / t/ ist in den Sprachen der Welt häufiger als / d/ , und alle Sprachen, in deren Phonemsystem / d/ vertreten ist, haben zwangsläufig auch / t/ . Im Deutschen kommt / t/ in allen Positionen vor, in denen auch / d/ realisiert werden kann (z.B. [ da´k ] danke, [ ta´k ] tanke, [ bo d n] Boden, [ bo t n] Boten); darüber hinaus kann / t/ aber auch in der Silbencoda auftreten, die für / d/ gesperrt ist; hier findet Neutralisierung zum stimmlosen, unmarkierten Konsonanten statt ([ a t n] raten, [ dÀ] Räder, aber [a t] Rat, Rad). Das Konzept der Markiertheit gilt nicht nur für Laute, sondern es erlaubt sprachübergreifende Generalisierungen für alle Arten von sprachlichen Einheiten und bildet damit eine wichtige Grundlage der Sprachtypologie (vgl. Ludwig 2001, De Lacy 2006). In 4.2.4 werden wir die Silbenstrukturen des Spanischen unter dem Aspekt ihrer (Un-)Markiertheit betrachten. 3.1.2 Die Phoneme des Spanischen Nachdem wir in 2.5 die Sprachlaute des Spanischen vorgestellt haben, konzentrieren wir uns in diesem Abschnitt auf deren phonologische Wertung. Wir folgen damit dem zentralen Anliegen des Strukturalismus, die Phoneme einer Sprache zu ermitteln und ihre Beziehungen im einzelsprachlichen Phonemsystem zu klären (3.1.1). Die Analyse der spanischen Phoneme gibt uns die Gelegenheit, mit Phonologisierung (sp. fonologización) und Entphonologisierung (sp. desfonologización) (3.1.2.4) weitere zentrale Begriffe der strukturalistischen Phonologie vorzustellen sowie das Konzept der Archiphoneme (3.1.2.3) und die Einordnung der Gleitlaute als Allophone der Vokalphoneme / i u/ (3.1.2.5) zu diskutieren. Zuvor gehen wir jedoch in 3.1.2.1 auf das Vokalsystem des Spanischen ein und stellen in 3.1.2.2 das konsonantische Phoneminventar vor, bei dem eine starke Abhängigkeit von der Silbenstruktur zu beobachten ist. 3.1.2.1 Vokalphoneme 22 Mit nur fünf Vokalphonemen, die sich durch Minimalpaarreihen wie / piso/ : / peso/ : / paso/ : / poso/ : / puso/ nachweisen lassen, hat das Spanische ein relativ einfaches Vokalsystem, das typologisch, also im Sprachvergleich, unmarkiert ist (Hualde 2005: 120f., NGRAE 2011: 74). Dieselben Oppositionen sind auch in unbetonten Silben möglich (vgl. / pi so/ : / pe so/ : / pa so/ : / po so/ und Klitika wie / si/ : 22 Zum Vokalphonemsystem des Spanischen vgl. z.B. Alarcos Llorach (1986: 145-160), Campos-Astorkiza (2012), Hualde (2005: 120-137), NGRAE (2011: 73-114), Quilis (1993: 141- 193; 2005: 37-45). = 101 / se/ : / su/ ). 23 Im Unterschied zu vielen anderen Sprachen spielt also die Akzentposition (4.3) für die Zahl und die Art der Vokalphoneme keine Rolle. 24 Wie ein solches Vokalsystem umstrukturiert werden kann, wollen wir exemplarisch anhand ostandalusischer und andenspanischer Varietäten vorstellen. In den ersteren ist infolge der Tilgung von Coda-s der unterschiedliche Öffnungsgrad der mittleren sowie die divergierende Position der tiefen Vokale phonologisiert worden (vgl. Penny 2000: 122ff.; 2.5.3.1 und 3.1.2.4). 25 Damit sind acht Vokalphoneme anzusetzen, die u.a. zur Differenzierung von Numerus in der Nominal- und Person in der Verbalflexion herangezogen werden (z.B. / lobo/ Sg. : / lob / Pl. lobo/ s, / kªntª/ 3. Sg : / kªntæ/ 2. Sg. canta/ s). 26 In den peruanischen Anden hat der Sprachkontakt mit den sog. indigenen Sprachen ein entgegengesetztes Ergebnis gezeitigt: Da Quechua und Aymara jeweils nur über ein dreigliedriges Vokalsystem verfügen (/ a / ), ist der Unterschied zwischen hohen und mittleren Vokalen stellenweise auch in der spanischen Kontaktvarietät aufgegeben worden, sodass sich die Zahl der Vokalphoneme hier auf drei reduziert (NGRAE 2011: 96). In Abb. 3.1-3 sind die Vokalsysteme dieser Varietäten in einer informellen Merkmalsmatrix einander gegenübergestellt: vorn hinten vorn hinten vorn hinten hoch i u hoch i u mittelhoch e o hoch e o mittel e o mitteltief tief a tief æ ª tief a Abb. 3.1-3 Das spanische Vokalsystem (links) in Gegenüberstellung mit dem System ostandalusischer (Mitte) und andenspanischer Varietäten (rechts). 3.1.2.2 Konsonantenphoneme 27 Auch das konsonantische Phoneminventar des Spanischen ist mit unter 20 Phonemen vergleichsweise klein. Je nach Position in der Silbe ist zudem die Variation beträchtlich, denn zahlreiche Kontraste sind auf den Silbenanfangsrand oder Onset beschränkt. Das gilt für die Plosive, die nur im Onset an den drei Artikulationsorten 23 Die geschlossenen Vokale / i/ und / u/ kommen in (betonten oder unbetonten) Auslautsilben allerdings selten vor. Unbetont erscheinen sie in Entlehnungen wie tribu oder crisis sowie in Kosewörtern und Spitznamen, sog. Hypokoristika (Luci, Maru etc.) (Alarcos Llorach 1986: 150). 24 Im Italienischen ist die phonologische Opposition zwischen / e/ : / / und / o/ : / / nur unter dem Hauptton, also in der Silbe mit dem Wortakzent, möglich (it. / venti/ venti ‘Winde’ : / vnti/ venti ‘20’; / korso/ corso ‘korsisch’ : / k rso/ corso ‘Lauf’). Noch größer ist die Differenz zwischen dem Vokalismus in betonten und unbetonten Silben in Sprachen wie dem Englischen (4.3.3, 4.4.1). 25 Auch in der französischen Normaussprache ist der Unterschied zwischen mittelhohen und mitteltiefen Vokalen phonologisch distinktiv, sodass / e/ und / / bzw. / o/ und / / Phoneme sind (fr. / fe/ fée ‘Fee’ vs. / f/ fait ‘Tatsache’; / pom/ paume ‘Handfläche’ vs. / p m/ pomme ‘Apfel’). 26 Dass die Öffnung phonetisch auch auf die vorangehenden Vokale übertragen wird, ist der sog. Vokalharmonie (sp. armonía vocálica) geschuldet: [ l - ], [ kæntæ]. 27 Zu den Konsonantenphonemen des Spanischen vgl. Alarcos Llorach (1986: 161-179), Campos-Astorkiza (2012), Hualde (2005: 138-189), NGRAE (2011: 115-263), Quilis (1993: 194- 359; 2005: 46-66). = 1 102 labial, alveolar und velar jeweils über die Stimmtonopposition [±sth] kontrastieren / pasta/ : / basta/ etc., 28 während Frikative und Affrikate bis auf / s/ (bzw. / / ) und marginal / x/ von vornherein nur in der Onsetposition erscheinen können. Die drei Nasalphoneme sind lediglich im Anfangsrand wortinterner Silben phonologisch distinktiv, 29 während der Kontrast in der Coda neutralisiert wird. Eine Opposition zwischen Tap und Trill schließlich besteht nur wortintern zwischen Vokalen. Abb. 3.1-4 präsentiert die Konsonantphoneme des Spanischen. Phoneme, die nur eine beschränkte regionale Verbreitung haben, sind in der Tabelle in Klammern gesetzt. labial dental alveolar postalveolar palatal velar -sth / p/ / t/ / k/ Plosive +sth / b/ / d/ / / Affrikate -sth / t²$/ -sth / f/ (/ / ) / s/ / x/ Frikative +sth (/ ¯/ ) / °/ Nasale +sth / m/ / n/ / »/ Laterale +sth / l/ (/ µ/ ) Tap / / Vibranten Trill / r/ Abb. 3.1-4 Konsonantenphoneme des Spanischen. 3.1.2.3 Archiphoneme Wie in 3.1.1 bereits dargestellt, hat die strukturalistische Phonologie das Konzept des Archiphonems entwickelt, um damit das Ergebnis von Neutralisierungen zu notieren. Das Archiphonem zeichnet sich durch die Gesamtheit der distinktiven Eigenschaften aus, die den von der Neutralisierung betroffenen Phonemen gemein ist. Die distinktiven Merkmale, durch die sich die Phoneme in den übrigen Kontexten voneinander unterscheiden, sind dagegen neutralisiert. In diesem Abschnitt wollen wir untersuchen, wie das Konzept des Archiphonems die Strukturen des spanischen Phonemsystems besser erfassbar machen kann. Neutralisierungen finden im Spanischen vorzugsweise in der Coda statt. Hier wird bspw. die Stimmtonkorrelation ([±sth]), die für die Plosivphoneme im Onset distinktiv ist (/ p t k/ : / b d / ), zugunsten eines breiten Spektrums allophonischer Variation aufgegeben (z.B. [ apto]~[ abto]~[ a-to]~[ a to]~[ ato]). Diese kann also zwischen stimmlosem und stimmhaftem Plosiv, Frikativapproximant und Tilgung frei variieren, wobei die Realisierung als stimmhafter Frikativapproximant die geläufige ist (2.5.1.1). Aus diesen quantitativen Überlegungen heraus werden in zahlreichen traditionellen Beschreibungen der spanischen Phonologie für Plosive in der Coda die Archiphoneme / B D G/ angesetzt (so etwa von Alarcos Llorach 1986: 184, Quilis 1993: 50ff.). Wenn man jedoch bedenkt, dass ein Archiphonem das unmarkierte Glied der Opposition sein sollte, scheint es sinnvoller, hier / P T K/ anzusetzen (Kubarth 28 Für Beispiele verweisen wir auf die entsprechenden Abschnitte in 2.5. 29 / »/ kommt im Wortanlaut nur in Entlehnungen und expressiven Bildungen wie / »u/ ñu ‘Gnu’ und / »iki »ake/ ñiquiñaque ‘nutzloses Zeug’ vor, sodass dort nur die Opposition zwischen / m/ und / n/ übrigbleibt. = 103 2009: 100f.), um anzuzeigen, dass die Stimmtonopposition in der Silbencoda aufgehoben ist. Wir notieren deshalb phonologisch / aPto/ . Die bereits mehrfach angesprochene Neutralisierung der Oppositionen zwischen den Nasalen, die sich sowohl in der wortinternen als auch in der wortfinalen Coda beobachten lässt, betrifft mit [labial], [alveolar] und [palatal] die Ortsmerkmale dieser Konsonanten. Sie sind hier aufgrund der Nasalassimilation einzig durch den Folgekonsonanten determiniert, während im absoluten Auslaut nur die alveolare (bzw. in velarisierenden Varietäten die velare) Realisierung möglich ist. Um dem gerecht zu werden, setzen wir das Archiphonem / N/ an. Es signalisiert, dass als Gesamtheit der distinktiven Eigenschaften nur das Merkmal [+nas] übrig ist (2.5.1.3, 3.1.1, 3.3). In generativen Ansätzen geht man in solchen Fällen vom Konzept der Unterspezifikation (engl. underspecification, sp. subespecificación) aus. Danach sind die Nasalkonsonanten in der Codaposition hinsichtlich ihres Artikulationsorts nicht determiniert (vgl. Harris 1984); für Plosive gibt es hier bezüglich des Merkmals [±sth] keine Festlegung. Die Codakonsonanten gelten in solchen Fällen als unterspezifiziert (vgl. zu diesem Konzept Archangeli 1988). Verschiedentlich wird für die Codaposition auch ein Archiphonem / L/ angesetzt (Kubarth 2009: 114), da der palatale Lateral / µ/ nur im Onset auftreten kann. Es scheint jedoch sinnvoller, hier eine defektive Distribution von / µ/ zu postulieren, dessen Stellenwert im spanischen Phonemsystem inzwischen marginal ist. Wir gehen deshalb auch für die Codaposition von / l/ aus. Wir haben schon mehrfach auf die besondere Situation der Opposition zwischen dem Tap / / und dem Trill / r/ hingewiesen, die auf die wortinterne intervokalische Position beschränkt ist. Im Wortanlaut und im wortinternen Onset nach Konsonant ist nur der Trill möglich, in den übrigen Positionen ist der Tap die normale Realisierung. In emphatischer Rede kann in der Coda jedoch auch der Trill / r/ auftreten. Da der Trill eindeutig das markierte Glied in der Opposition darstellt, scheint es nicht sehr sinnvoll, für den Anlaut eine Neutralisierung zum Trill anzusetzen; hier ist eher von einer systematischen Stärkung des Wortanfangs auszugehen (Bakovi× 1994), der für den unmarkierten Tap folglich gesperrt ist. Mit Quilis (1993: 42) und Hidalgo Navarro & Quilis Merin (2012: 216, 234) können wir hier auch von einer defektiven Distribution sprechen und transkribieren mit dem Trill / r/ . Die defektive Distribution ist übrigens nicht direkt sichtbar, sondern muss gesondert in den Distributionsregeln für das Phonem / / vermerkt werden. Die phonologische Transkription mit / r/ macht aber klar, dass die Realisierung anders als im Silben- und Wortauslaut bzw. im komplexen Onset nicht frei variieren kann, sondern auf den Trill festgelegt ist. Trotz der potentiellen Variation in der Silbencoda scheint es auch hier nicht sinnvoll, ein Archiphonem / R/ anzusetzen, denn wie Hualde (2005: 182f.) vermerkt hat, würde dies im Widerspruch zu der Tatsache stehen, dass der wortfinale r-Laut bei der Resyllabierung mit einem folgenden vokalisch anlautenden Wort nur als [], nie aber als [r] realisiert werden kann ([a maa ese] amar a ese vs. [a mara ese] amarra ese). Hier wie in der komplexen Coda transkribieren wir deshalb phonologisch / / . Abb. 3.1-5 fasst Phoneme und Archiphoneme, die in der Coda des Spanischen auftreten können, zusammen. 30 30 / t²$/ , / f/ und / x/ , die als Codakonsonanten nur im Wortauslaut bzw. nur in Entlehnungen vorkommen, sind nicht in die Tabelle aufgenommen (4.2.4.2). = 1 104 labial dental alveolar velar Plosive / P/ / T/ / K/ Frikative (/ / ) / s/ Nasale / N/ Laterale / l/ Vibranten / / Abb. 3.1-5 Phoneme und Archiphoneme in der einfachen Coda. 3.1.2.4 Phonologisierung und Entphonologisierung In allen Varietäten des Spanischen gibt es nasalisierte Vokale als kombinatorische Varianten der Vokalphoneme. Das artikulatorische Merkmal der Nasalität ([+nas]) wird durch das Phänomen der Assimilation von den Nasalkonsonanten auf die benachbarten Vokale übertragen, und zwar in folgenden Kontexten (NGRAE 2011: 100- 103): • im Wortinnern zwischen zwei Nasalkonsonanten ([m- »-na] mañana), • zu Beginn einer Intonationsphrase (ip/ IP; 4.1.1) vor einem Nasalkonsonanten in der Coda, wenn die nächste Silbe mit Konsonant beginnt ([ entan] ¡entran! ), • in einigen diatopischen Varietäten auch vor [n] und [´] am Wortende ([p-n] oder [p-´] pan). Solange die Nasalkonsonanten artikuliert werden, handelt es sich bei den nasalisierten Vokalen um kombinatorische Varianten in komplementärer Distribution (3.1.1). Wird jedoch nach einer Tilgung der Nasalkonsonanten die Nasalisierung der Vokale beibehalten, so können die nasalisierten Allophone den Status von Phonemen erlangen. Dies ist in der französischen Sprachgeschichte eingetreten. In der Coda des Altfranzösischen gab es Nasalkonsonanten, deren Reflex wir heute nur noch in der Graphie finden: afr. [t²$-nt] chant ‘Gesang’ und [t²$at] chat ‘Katze’ waren also keine Minimalpaare, weil sie bereits durch die unterschiedliche Zahl von Segmenten unterschieden wurden. Seit gegen Ende der altfranzösischen Periode die Nasalkonsonanten in der Silbencoda getilgt wurden, beruht der lautliche Unterschied zwischen fr. [$-] chant vs. [$a] chat jedoch nur noch auf der nasalen vs. oralen Qualität der Vokale; die Nasalvokale sind also phonologisiert worden. Ein solcher Prozess der Phonologisierung (sp. fonologización) von Nasalvokalen kann heute im karibischen Spanisch und in einigen weiteren Regionen Lateinamerikas beobachtet werden. Hier wird der wortfinale Nasalkonsonant elidiert, ohne dass die Nasalisierung des vorangehenden Vokals aufgegeben wird. In Minimalpaaren wie [ enta] entra vs. [ ent-] entran hat die Nasalisierung der Vokale bedeutungsunterscheidende Funktion (NGRAE 2011: 104), und das Inventar der Vokalphoneme müsste hier folglich um die Nasalvokale erweitert werden. 31 Die Zahl der Frikativphoneme variiert in den spanischen Varietäten. Im kastilischen Standard und im Nordspanischen, wo die Opposition zwischen dentalem / / und alveolarem / s/ weiter aufrechterhalten wird, gibt es mit / f s ° x/ fünf Frika- 31 Auch die in 3.1.2.1 bereits angesprochene Entwicklung im Vokalsystem ostandalusischer Varietäten stellt eine Phonologisierung von Allophonen in komplementärer Distribution dar. = 105 tivphoneme (sistema distinguidor, distinción). In Lateinamerika, großen Teilen Andalusiens und der Extremadura sowie im kanarischen Spanisch hat das alveolare / s/ den dentalen Frikativ / / ersetzt (seseo), sodass in diesen Varietäten mit / f s ° x/ nur noch vier Frikativphoneme vertreten sind. In kleineren ländlichen Gebieten Südspaniens hat der Ersetzungsprozess in umgekehrter Reihenfolge stattgefunden. Der dentale Frikativ / / hat hier den alveolaren Frikativ / s/ ersetzt (ceceo). Auch diese Varietäten haben nur ein vierstufiges System von Frikativphonemen (/ f ° x/ ). distinción labial dental alveolar palatal velar -sth +sth / f/ / / / s/ / °/ / x/ seseo labial koronal palatal velar -sth +sth / f/ / s/ / °/ / x/ ceceo labial koronal palatal velar -sth +sth / f/ / / / °/ / x/ Abb. 3.1-6 Frikative Konsonantenphoneme im Spanischen. Wenn wir von den wenigen ceceo-Varietäten absehen, kommt der stimmlose dentale Frikativ / / nur im sistema distinguidor, also im kastilischen Standard und in nordspanischen Varietäten vor. Dort hat er, genauso wie der alveolare Frikativ / s/ , Phonemstatus; / sieNto/ siento und / ieNto/ ciento bilden bspw. ein Minimalpaar. Im seseo und im ceceo ist dies nicht der Fall, weil die beiden Wörter hier sowohl in der zugrundeliegenden phonologischen Form als auch in der phonetischen Realisierung homophon sind; im seseo gilt jeweils die Realisierung [ sjento], im ceceo [ jento] (siento~ciento). Sowohl seseo als auch ceceo sind aufgrund einer Entphonologisierung entstanden, weil die lautliche Distinktion zwischen dentalem und alveolarem 32 stimmlosen Frikativ - mit jeweils unterschiedlichem Ergebnis - aufgegeben wurde. Zu einer weiteren Entphonologisierung kommt es durch das Phänomen des yeísmo (2.5.1.4). So nennen wir eine bereits im Mittelalter einsetzende Lautentwicklung, die dazu geführt hat, dass der palatale Lateral [µ] heute fast überall in der spanischsprachigen Welt durch den palatalen Frikativ [°] ersetzt worden ist. Die meisten spanischen Varietäten kennen folglich nur noch ein Lateralphonem, nämlich alveolares / l/ (Alonso-Cortés 2010, Hualde 2005: 178-181, NGRAE 2011: 223). Das lleísmo genannte konservativere Phonemsystem (sp. subsistema lleísta / distinguidor) mit der Unterscheidung zweier Lateralphoneme / l/ und / µ/ (z.B. / polo/ polo : / poµo/ pollo) hat nur noch sehr beschränkte Gültigkeit. Im System des yeísmo gibt es nur ein Lateralphonem, nämlich das alveolare / l/ . Die Opposition im gerade angeführten Minimalpaar ist aber weiterhin gewährleistet. Zwar stehen sich nicht mehr zwei laterale Phoneme gegenüber, sondern der Lateral / l/ kontrastiert mit dem Frikativ / °/ / polo/ : / po°o/ . 33 32 Die Opposition kann auch auf den Kontrast zwischen zwei unterschiedlichen Artikulationsarten, nämlich [±sibil], zurückgeführt werden (3.1.1). Für die phonologische Argumentation ist es nicht relevant, welches Merkmal angesetzt wird. Ausschlaggebend ist allein, dass aufgrund einer einschlägigen Merkmalkombination die Distinktivität der Phoneme gewährleistet ist. 33 Der eísmo bzw. eísmo des argentinischen Spanisch stellt eine Weiterentwicklung des yeísmo dar: / °/ ist hier vom palatalen zum postalveolaren Frikativ geworden. = 1 106 lleísmo yeísmo / °/ / l/ / µ/ / l/ / °/ Abb. 3.1-7 Phonemoppositionen im lleísmo und im yéismo. Wie die Gegenüberstellung der beiden Systeme in Abb. 3.1-7 zeigt, ist durch den yeísmo aber eine andere Opposition aufgehoben, nämlich die zwischen / µ/ und / °/ . / po°o/ [ po°o] pollo ‘Huhn’ und / po°o/ [ po°o] poyo ‘Bank’ sind, anders als im lleísmo, homophon. Der yeísmo hat zur Entphonologisierung der Opposition zwischen dem Lateralphonem / / und dem Frikativphonem / / geführt. 3.1.2.5 Gleitlaute als Vokalallophone Im Spanischen gibt es mit [j] und [w] zwei Gleitlaute (engl. glides, sp. semiconsonantes / semivocales / deslizadas / vocales satélites), deren phonologische Wertung teilweise kontrovers diskutiert wird. Sie entstehen, wenn die geschlossenen Vokale / i/ und / u/ mit einer größeren Engebildung artikuliert werden. Dies geschieht in komplexen vokalischen Silbenkernen, also in Diphthongen (sp. diptongos) und Triphthongen (sp. triptongos), wie sie aus der Verbindung von zwei bzw. drei vokalischen Artikulationsstellungen in einem Silbenkern resultieren. Sie unterscheiden sich darin vom Hiat(us) (sp. hiato), bei dem zwei Vollvokale aufeinandertreffen und jeweils eigene Silbenkerne bilden. Während [aj] hay einsilbig ist und als Diphthong artikuliert wird, bilden die Vokale in [a i] ahí zwei eigenständige Silbenkerne, die im Hiatus stehen (2.5.3.2). Bei lexikalischen Diphthongen (bzw. lexikalisch-morphologischen Triphthongen) ist die einsilbige Artikulation fest in der phonologischen Form der Lexeme (/ mui/ [muj]~[mwi] muy) bzw. Flexionsmorpheme (/ estu diais/ [estu ®jajs] estudiais) verankert. Darüber hinaus werden Diphthonge und Triphthonge in der parole, bspw. in Schnellsprechformen wie / di ablo/ [ dja-lo] diablo spontan gebildet. Vor allem aber die Resyllabierung in der phonologischen Phrase führt zu einer Vielzahl von neuen Diphthongen und Triphthongen. Hiate stellen markierte Silbenkontakte dar und werden deshalb in vielen Sprachen der Welt eher vermieden. Auch das Spanische hat eine starke Tendenz zur Vermeidung von Hiaten (sp. tendencia antihiática) (4.2.3), und Vokale, die an Wortgrenzen aufeinandertreffen, werden daher in aller Regel zu Diphthongen oder Triphthongen verschmolzen (/ a#es tado/ [ajs ta®o] ha estado) (4.2.5). Bevor die Frage beantwortet werden kann, welche phonologische Wertung die Gleitlaute erhalten sollen, muss zunächst geklärt werden, ob die spanischen Dibzw. Triphthonge als ein Phonem oder als Folge von Phonemen angesehen werden sollen. 34 Für eine bibzw. triphonematische Lösung spricht, dass im Spanischen (anders als im Deutschen) in einem Diphthong Gleitlaut und Vollvokal unabhängig voneinander ausgetauscht werden können ([pjes] pies : [pwes] pues, [sejs] seis : [sojs] sois). Auch können in phonologischen Phrasen immer neue Kombinationen aus Gleit- 34 Die lexikalischen Diphthonge des Deutschen werden bspw. wie einfache Vokale behandelt und als Phoneme gewertet (Wiese 2011: 48). = 107 laut und Vokal entstehen, sodass eine Wertung des Diphthongs als ein Phonem - und nicht als eine Kombination von mehreren Phonemen - wenig angebracht scheint. 35 Was nun die phonologische Einordnung der Gleitlaute angeht, so ließen [j] und [w] sich ausgehend von Minimalpaaren wie [pjes] pies : [pwes] pues als oppositionsbildende Segmente, also als eigenständige Phoneme / j/ bzw. / w/ , bewerten (Kubarth 2009: 92f.). Für diese Lösung spricht, dass in Minimalpaaren wie [oj] hoy vs. [o i] oí, [aj] hay vs. [a i] ahí oder [pje] pie vs. [pi e] pié der Gleitlaut dem ihm zugeordneten Vokal gegenübersteht. Die genaue Analyse dieser Minimalpaare zeigt aber, dass die lautliche Opposition besser mit einem prosodischen Phänomen, nämlich dem Wortakzent, erklärt werden kann. Wenn die Vokale / i/ und / u/ den Akzent tragen, werden sie immer als Vollvokale realisiert. Deshalb sind oí und ahí zweisilbig und nicht diphthongisch. Es ist also ein silbenstruktureller und kein segmentaler Gegensatz, der durch die Wortpaare exemplifiziert wird. Auch der Gegensatz zwischen pié und pie liegt darin, dass in pié die silbische Aussprache des / i/ und damit die Realisierung eines Hiatus von der traditionellen Norm gefordert wird. 36 In pie ist die Realisierung als Diphthong dagegen in der zugrundeliegenden phonologischen Form verankert. Auch hier liegt also ein Unterschied hinsichtlich der Silbenzahl vor, nicht ein segmentaler Unterschied. Überlegungen wie diese haben dazu geführt, die Gleitlaute [j] und [w] als Allophone der Vokalphoneme / i/ und / u/ einzuordnen (Alarcos Llorach 1986: 152f., Hualde 2005: 54f., NGRAE 2011: 332). Genauer handelt es sich bei den Gleitlauten um kombinatorische Varianten, die dann auftreten, wenn / i/ bzw. / u/ unmittelbar vor oder nach einem Vokal stehen und nicht betont sind, was in der Umgebung eines nicht hohen Vokals als Default gelten kann (Hualde 2005: 80). Ist der hohe Vokal dagegen betont, so muss in der phonologischen Transkription die ihm folgende Silbengrenze markiert werden, um seine Herabstufung zum Gleitlaut zu verhindern. 37 In der phonologischen Form werden die Vokalphoneme / i/ und / u/ angegeben und die Gleitlautrealisierung an der phonetischen Oberfläche nach der gerade formulierten Regel abgeleitet: Gleitlautbildung im Spanischen Gleitlaut: / tiera/ [ tjera] tierra ‘Erde’ / lei/ [lej] ley ‘Gesetz’ / pueNte/ [ pwente] puente ‘Brücke’ / deuda/ [ dew®a] deuda ‘Schuld’ 35 Gerade in diesem zweiten Punkt unterscheiden sich das Spanische und das Deutsche deutlich, denn ein Diphthong wie in dt. Abschaum kann nur als lexikalischer Diphthong auftreten. Ein Hiatus, wie er in der Folge Sascha umbringen entsteht, führt im Deutschen dagegen nie zu einer diphthongischen Artikulation, weil vokalisch anlautende Silben vor der Tilgung der Silbengrenze geschützt sind. Ein weiterer Unterschied zum Deutschen liegt in der Syllabierung: Im Spanischen werden fallende Diphthonge, wenn sie in Kontakt mit einer vokalisch anlautenden Folgesilbe kommen, auf zwei Silben verteilt: [lej] ley vs. [ le.jes] leyes; [ o.jes. ta.®e] hoy es tarde (Alarcos Llorach 1986: 151). Im Deutschen bleiben die lexikalischen Diphthonge dagegen immer in einer Silbe vereint (blau.er). 36 Formen wie pié mit Hiatustilgung und lautlicher Realisierung als Diphthong sind allerdings inzwischen weit verbreitet (Hualde 2005: 81, Anm. 11). 37 Hualde (2005: 78, 80), der die Regel zur Gleitlautbildung formuliert hat, umgeht diese Sonderregelung für die betonten Vokale, indem er den Akzent unmittelbar am Vokalzeichen festmacht, also / péine/ , / piérna/ bzw. / tía/ , / aí/ schreibt. = 1 108 kein Gleitlaut, sondern Hiatus: / o i/ [o i] oí ‘ich hörte’ / a i/ [a i] ahí ‘hier’ / ti.a/ [ tia] tía ‘Tante’ Die Einordnung der Gleitlaute als Allophone der Vokalphoneme / i/ und / u/ ist eine elegante, beschreibungsökonomische Lösung. Sie führt dazu, dass das Inventar der spanischen Vokalphoneme weiterhin auf fünf beschränkt bleibt, weil die Gleitlaute mittels der genannten Regel aus den bereits vorhandenen Vokalphonemen / i/ und / u/ abgeleitet werden. Es reicht, in die phonologische Repräsentation der Lexeme die prosodische Information über die Stelle des Wortakzents einzufügen. Ein Lexem wie tierra hat also die phonologische Form / tiera/ , die mittels der Gleitlautbildungsregel in die phonetische Oberfläche [ tjera] überführt wird. Diese Regel gilt allerdings nicht ausnahmslos, denn in Lexemen wie piar / pi a/ [pi a] wird der unbetonte Vokal / i/ nicht zum Gleitlaut [j] herabgestuft. Dieser und die wenigen anderen Fällen, in denen auch bei unbetontem / i/ und / u/ zumindest nach der traditionellen Normaussprache ein Hiatus artikuliert werden soll, machen in der phonologischen Form ebenfalls die Markierung einer Silbengrenze zwischen den Vokalen erforderlich, um auf diese Weise zu signalisieren, dass ein lexikalisch verankerter Hiatus vorliegt und die Vokale nicht zu einem Diphthong verschmolzen werden sollen (Hualde 2005: 81-86). Lexikalischer Hiat / pi. a/ [pi a] piar ‘zirpen’ / po.i bi/ [poi -i] prohibir ‘verbieten’ / u. i/ [u i] huir ‘fliehen’ Auch für den stimmhaften palatalen Frikativ / / ist die phonologische Wertung als Allophon von / i/ vorgeschlagen worden. Dies hängt mit den deutlichen Positionsbeschränkungen dieses Frikativs zusammen: In phonologischer Opposition zu anderen Konsonantenphonemen steht er nur im einfachen Onset (z.B. [°a] ya vs. [da] da; [ a°a] haya : [ a-a] haba). Bedingt durch den lautlichen Kontext, aber auch aufgrund diasystematischer Faktoren variiert zudem die lautliche Realisierung dieses Frikativs deutlich. Allein im kastilischen Standard sind als Allophone der Frikativ [°], der Plosiv [«] und die Affrikate [«² °] belegt; im mexikanischen und US-amerikanischen Spanisch tritt außerdem [j] als Realisierungsvariante auf. Alle diese Allophone sind palatal und stimmhaft, es variiert nur der Grad der konsonantischen Engebildung, der von geringer frikativischer Enge über den völligen Verschluss bis zur Affrikate mit maximaler Konstriktion reicht. Die Verteilung der Allophone ist teilweise kontextuell geregelt: So ist die Artikulation als starker Konsonant, also als Plosiv oder Affrikate, in der Position im absoluten Wortanlaut nach Pause sowie im Silbenanlaut nach Nasal oder Lateral regelmäßig, tritt aber normalerweise nicht wortintern zwischen Vokalen auf. 38 Aber auch in den Positionen, die konsonantische Verstärkungen auslösen können, ist weiterhin die frikativische Variante zu finden (Hualde 2005: 165f., Kubarth 2009: 108, NGRAE 2011: 193f.). 39 38 Im nähesprachlichen Madrider Spanisch kommen jedoch auch Formen wie [ o«e] ¡oye! vor (Hualde 2005: 166). 39 Im argentinischen Spanisch ist der palatale stimmhafte Frikativ [°] zum postalveolaren stimmhaften Frikativ [¯] bzw. stimmlos [$] vorverlagert worden ( eísmo/ eísmo; 2.5.1.2); hier ist also die phonologische Kontinuität zu [i]~[°] abgerissen (vgl. Hualde 2005: 169). = 0 109 Die Positionsbeschränkungen (nur unmittelbar vor Vokal im einfachen Onset) rücken den Frikativ in die Nähe der Gleitlaute, und mit [j] kann man ihn auch artikulatorisch in Verbindung bringen. Abb. 3.1-8 zeigt das Kontinuum, das durch die unterschiedlichen Grade der Engebildung zwischen Zungenrücken und Palatum gebildet wird; [°] und [j] sind auf dieser Skala unmittelbar benachbart. Vokal Gleitlaut Frikativ Plosiv Affikate [i] [j] [°] [«] [«²°] minimal Ø Konstriktion Ù maximal Abb. 3.1-8 Artikulationskontinuum zwischen [i] und [« ²°]. Aufgrund der Nähe zum Gleitlaut [j] könnte [°] also wie dieser als Allophon von / i/ eingeordnet werden. 40 Diese radikale Lösung ist möglich, weil es im Spanischen keine Minimalpaare gibt, in denen / °/ in Opposition zu / i/ steht (Kubarth 2009: 91). Einer solchen maximal ökonomischen Konfiguration des spanischen Phonemsystems widerspricht aber die Sprachgeschichte. Der yeísmo, d.h. der Ersatz des palatalen Laterals / µ/ durch / °/ zeigt, dass der palatale Frikativ wie ein konsonantisches Segment behandelt wird. Auch seine Weiterentwicklung zu den alveolaren Frikativen des argentinischen Spanisch wäre mit einer phonologischen Einordnung im Bereich der Vokale nicht vereinbar. 3.2 Klassische generative Phonologie Im einführenden Kapitel haben wir dargestellt, wie sich im Zuge des sog. cognitive turn die Sichtweise von der Saussureschen langue als kollektivem Zeichenvorrat der Sprachgemeinschaft zur Chomskyschen Konzeption der individuellen Kompetenz des einzelnen Sprechers gewandelt hat (vgl. 1.4). Analog zur Grundannahme der generativen Syntaxtheorie, dass sich unterschiedliche Satzmuster durch Regeln aus einer zugrundeliegenden Struktur ableiten lassen (vgl. Chomsky 1957), wurde vorgeschlagen, phonologische Prozesse ebenfalls durch Regeln zu erfassen. Diese vermitteln zwischen der im mentalen Lexikon gespeicherten zugrundeliegenden phonologischen Form (auch: phonologische Repräsentation) und den konkret vom Sprecher produzierten Äußerungen, die sich als phonetische Oberfläche (auch: phonetische Repräsentation) fassen lassen. Mit dem Blick auf solche Prozesse wurde das Konzept vom phonologischen Wissen, das im Strukturalismus vornehmlich auf die Bestandsaufnahme einzelsprachlicher Phoneminventare und die Beschreibung ihrer Distribution ausgerichtet war, dynamisiert. Kurz nach dem Erscheinen des auf das Englische bezogenen Initialwerks The Sound Pattern of English (abgekürzt als SPE, Chomsky & Halle 1968) wurde dieser als Klassische Generative Phonologie bekannt gewordene Ansatz auch auf romanische Sprachen, darunter das Spanische, angewandt (z.B. Harris 1969, Cressey 1978). Die Klassische Generative Phonologie erfasst den Zusammenhang zwischen zugrundeliegender phonologischer Form und phonetischer Oberfläche mithilfe von 40 Vgl. dazu die Zusammenfassung der Forschungsdiskussion in Kubarth (2009: 90ff.). = 1 110 Regeln des Formats A B / C. Dies ist zu lesen als ‘A wird realisiert als B im Kontext C’, wobei mit A das zugrundeliegende Phonem / …/ und mit B der an der phonetischen Oberfläche konkret realisierte Laut […] gemeint ist. Durch den Kontext C wird die Position des betreffenden Elements (angegeben durch den Unterstrich ‘__’) in der Redekette wie folgt spezifiziert: A Ù B / __ X ‘A wird als B realisiert vor Segment X’ A Ù B / Y __ ‘… nach Segment Y’ A Ù B / X __ Y ‘… zwischen Segment X und Segment Y’ A Ù B / __ Y(Z) ‘… vor Segment Y oder Segment Y und Segment Z’ A Ù B / __ ‘… vor entweder Segment X oder Segment Y’ Da die Realisierung eines Phonems nicht nur von der segmentalen Umgebung, sondern auch von Wort- und Silbengrenzen abhängen kann, werden diesbezügliche Informationen im Bedarfsfall in die Regelschreibweise integriert. Dabei steht die Raute ‘#’ für eine schwache Wortgrenze wie etwa zwischen Artikel und Substantiv (z.B. la # manzana); die doppelte Raute ‘##’ zeigt eine starke Wortgrenze an, das Pluszeichen ‘+’ eine Morphemgrenze (z.B. com+e ## manzana+s). Silbengrenzen werden i.d.R. durch ‘] Ú ’ markiert. Im Folgenden stellen wir mit der Auslautverhärtung zunächst einen phonologischen Prozess dar, der neben dem Deutschen auch das Katalanische betrifft, bevor wir einige typische Prozesse des Spanischen in Form von generativen Regeln erfassen. Für das Deutsche gilt, dass Obstruenten (d.h. Plosive und Frikative) im Silbenauslaut grundsätzlich stimmlos sind: Während das [d] in Kinder [ kındÀ] und kindisch [ kındı$] stimmhaft ([+sth]) ist, wird das entsprechende Segment in Kind [kınt] und kindlich [ kıntlıç] stimmlos realisiert. Ein Kontrast von stimmlosen vs. stimmhaften Segmenten ist in dieser Position also ausgeschlossen, d.h. es existiert kein Minimalpaar aus zwei Wörtern, die auf [d] vs. [t] auslauten. Trotzdem sind / d/ und / t/ Phoneme des Deutschen, da sich ein entsprechender Kontrast in anderen Positionen feststellen lässt, so etwa im Anlaut der Wörter Dorf / d/ vs. Torf / t/ ). Im Fall der identisch als [a t] ausgesprochenen Wörter Rad und Rat wird der zugrundeliegende Kontrast hörbar, wenn man ein Suffix wie etwa die Genitivendung -es anfügt: Rades [ a d s] vs. Rates [ a t s]. Die Neutralisierung (vgl. 3.1.1) des Merkmals [±sth] zeigt sich auch in Ausdrücken wie ein braves [ ba v s] Kind vs. das Kind ist brav [ba f], in Verbformen wie (er) las [la s] vs. (sie) lasen [ la z n] oder im katalanischen Adjektiv ‘stumm’, das in der maskulinen Form mut [mut], in der längeren femininen Form jedoch muda [ mu® ] lautet. 41 Dies kann man erfassen, indem man für die phonologisch zugrundeliegenden Formen jeweils das stimmhafte Segment ansetzt (z.B. kat. / mud/ , / muda/ ) 41 Die Orthographie des Deutschen bleibt unabhängig von der stimmlosen bzw. stimmhaften Realisierung konsistent, d.h. man notiert z.B. immer <d>, auch wenn ein stimmloses [t] produziert wird, während die stärker an der lautlichen Oberfläche orientierte Schreibung des Katalanischen das Resultat des Entstimmungsprozesses notiert (vgl. Meisenburg 2009). Auch die Auslautverhärtung des Türkischen wird in der Schrift reflektiert, z.B. kitaplar [kıtaplar] ‘Buch’ vs. kitabım [kıtabÏm] ‘mein Buch’ (vgl. Kornfilt 1997: 491f.). X Y = 0 111 und eine Entstimmungs- oder Desonorisierungsregel formuliert, die je nach Position des Segments in der Silbe die korrekte Oberflächenform herleitet: Auslautverhärtung [-son] Ù [-sth] / __] Ú Obstruenten werden im Silbenauslaut stimmlos realisiert. Auch Assimilationsprozesse wie die Anpassung des Artikulationsorts eines Nasalkonsonanten an das nachfolgende Lautsegment, die sowohl im Deutschen als auch im Spanischen (vgl. 2.5.1.3) und darüber hinaus in einer Vielzahl weiterer Sprachen regelmäßig auftreten, lassen sich mithilfe der generativen Regelschreibweise erfassen. So wird das Negationsmorphem inwie in sp. intolerable oder inaceptable vor bilabialen Konsonanten mit ebenfalls bilabialem Nasal realisiert ([im]posible); in gleicher Weise erfolgt die Anpassung des Nasals vor labiodentalen und velaren Konsonanten wie in sp. [i³]flexible bzw. [i´]capaz. Dasselbe geschieht auch über Wortgrenzen hinweg wie z.B. in en Pamplona, wo die Präposition mit bilabialem Nasal, also als [em] realisiert wird (vgl. dagegen [en] Neuquén). Im klassischen generativen Rahmen wurden hierfür komplexe Regeln postuliert, die die unterschiedlichen Artikulationsorte des potentiell auf den betreffenden Nasal folgenden Konsonanten einzeln auflisten (z.B. dental, koronal etc.; vgl. Kubarth 2009: 139). Dies rührt daher, dass in SPE phonologische Merkmale isoliert betrachtet, nicht jedoch zu Klassen oder Inventaren von Merkmalen zusammengefasst wurden, wie dies etwa in der später entstandenen Merkmalsgeometrie der Fall ist (vgl. 3.3). Hält man sich jedoch vor Augen, dass es bei der Nasalassimilation stets um die Anpassung des Nasals an den Artikulationsort des nachfolgenden Konsonanten geht, lässt sich dies in Form einer generativen Regel wie folgt zusammenfassend darstellen (vgl. D’Introno et al. 1995: 344f.). Der griechische Buchstabe Û besagt dabei, dass die Merkmalswerte ‘+’ oder ‘-’ bzw. bei einstelligen Merkmalen das Merkmal selbst jeweils identisch sein müssen; ORT fasst alle potentiell möglichen Ortsmerkmale (vgl. 3.1.1) zusammen: Hat der nachfolgende Konsonant bspw. das Merkmal [ LAB ] (wie in posible), muss der Nasalkonsonant auch den Wert [ LAB ] aufweisen (wie in im-). Die Raute gibt an, dass der Prozess, wie z.B. in en # Pamplona [empam plona], auch über eine schwache Wortgrenze hinweg erfolgt. Nasalassimilation [+nas] Ù / __ (#) Nasale passen sich in Bezug auf ihr Ortsmerkmal dem folgenden Konsonanten an. In 3.1.1 haben wir die Realisierung intervokalischer Verschlusslaute als Frikativapproximanten als eine Form von Assimilation im weiteren Sinne charakterisiert, denn in Fällen wie lado ‘Seite’ [ la®o] wird ein einzelnes Lautsegment (hier: der stimmhafte Plosiv / d/ zwischen zwei Vokalen) durch stärkere artikulatorische Öffnung an seine vokalische Umgebung angepasst. Auch diesen meist als Spirantisierung (sp. espirantización) bezeichneten Prozess kann man mithilfe der eingeführten Regelnotation darstellen. Wir haben in 2.5.1.1 gesehen, dass die stimmhaften Plosive, die wir durch die Merkmale [-son] (für Obstruenten), [-kont] (wegen des mittigen Verschlusses im Ansatzrohr) und [+sth] erfassen können, nur dann nicht zu Frikativapproximanten werden, wenn der vorangehende Laut ein Nasal ist. Um für die Spi- +nas ÛORT +kons ÛORT = 1 112 rantisierung, die in der Umkehrung des Vorzeichens von [-kont] zu [+kont] besteht, den Kontext zu spezifizieren, reicht also das Merkmal [-nas] aus. Spirantisierung Ù [+kont] / (#) ___ Stimmhafte Plosive werden nach allen Lauten außer nach Nasalen spirantisiert. Die Sache hat jedoch einen Haken, und unsere Regel greift zu weit, denn wie wir ebenfalls in 2.5.1.1 gesehen haben, verhalten sich die drei stimmhaften Verschlusslaute / b d / insofern unterschiedlich, als zwar / b/ und / / auch nach dem Lateral / l/ spirantisiert werden (z.B. el vaso [el -aso], el gato [el ±ato]), / d/ jedoch nicht (z.B. el disco [el disko]). Phonetisch lässt sich das dadurch erklären, dass der Verschluss für [d] durch das homorgane [l] bereits gebildet ist und nur noch gelöst werden muss, was weniger Aufwand bedeutet als hier einen Frikativapproximanten zu realisieren. Da aber in unserer Regel / l/ durch das Merkmal [-nas] ebenfalls erfasst wird, treffen wir für den koronalen Plosiv / d/ eine falsche Vorhersage. Die Frage, wie dieser Prozess in einer einzigen Regel exakt formuliert werden könnte, muss hier offenbleiben, da sich mithilfe der oben angeführten Merkmale keine Möglichkeit einer entsprechenden Gruppierung abzeichnet. 42 Bereits in den 1970er Jahren wurde die generative Phonologie in der hier dargestellten Form kritisiert. So haben bspw. Donegan & Stampe (1979) im Rahmen der sog. Natürlichen Phonologie für eine Unterscheidung zwischen (übereinzelsprachlich gültigen) Prozessen und (sprachspezifischen) Regeln plädiert. Zu ersteren zähle etwa die Nasalassimilation, die über unterschiedlichste Sprachen hinweg generell auftrete; zu den letzteren wird die Spirantisierung gerechnet, die u.a. für das Spanische spezifisch ist, im Französischen oder Italienischen jedoch nicht vorkommt. Wenn man beide Typen von Oberflächenalternanzen mit ein und demselben Regelformat erfasse, könne man nach Donegan & Stampe (1979) dem Unterschied zwischen beiden nicht gerecht werden (vgl. auch Kubarth 2009: 138f.). Fraglich ist allerdings, ob die hier vorgestellte strikte Trennung zwischen Prozessen und Regeln überhaupt möglich und sinnvoll ist: So lässt sich die Anpassung von Nasalen an ihre segmentale Umgebung als ein Koartikulationsphänomen verstehen, das übereinzelsprachlich auftritt. Ob und bis zu welchem Grade es allerdings phonologisiert wird (also in allen Kontexten systematisch und regelhaft auftritt) und wie im Spanischen in die Normlautung Eingang findet (e[mp]amplona, i[mb]estigación), ist wiederum eine andere Frage. Im Deutschen, wo die Nasale / m/ und / n/ auch vor bilabialen Plosiven kontrastieren können (Unbilden [ nbldnÝ] vs. umbilden [ mbldnÝ]), ist ihre koartikulatorische Anpassung an den Folgekonsonanten eher ein Phänomen von nachlässiger Aussprache bei schnellem Sprechen (z.B. Unbilden [ mbldnÝ]). Davon unberührt war 42 Kubarths (2009: 134f.) Vorschlag, den Kontext für die Spirantisierung statt als [-nas] als [+kont] zu fassen, um Nasale und Laterale als Laute mit einem mediosagittalen Verschluss auszuschließen (wobei [+lat] als Bedingung für die nicht koronalen Plosive gesondert eingebracht werden muss), ist insofern problematisch, als der Tap / / auch als [-kont] zu charakterisieren ist (vgl. Hall 2011: 108, NGRAE 2011: 248), nach dem Tap aber systematisch Spirantisierung erfolgt (z.B. árbol [ a-ol], cuerda [ kwe®a], árbol [ la±o]. -son +sth -kont [-nas] = = 113 das Hauptanliegen der Natürlichen Phonologie, möglichst oberflächennahe phonologische Repräsentationen zu erstellen, um auf diese Weise die Vermittlung zwischen zugrundeliegender Struktur und phonetischer Realisierung nachvollziehbarer zu gestalten (vgl. auch Hurch & Rhodes 1996). 3.3 Merkmalsgeometrie und Autosegmentale Phonologie Grundlegende Idee der im Wesentlichen von Clements (1985) entwickelten Merkmalsgeometrie (sp. geometría de los rasgos) ist, dass phonologische Merkmale nicht voneinander unabhängig in einem Bündel zusammengefasst sind, sondern dass sie hierarchisch organisiert miteinander interagieren. Abb. 3.3-1 repräsentiert die angenommene Hierarchie in Form eines Merkmalsbaums. Abb. 3.3-1 Modell der Merkmalsgeometrie nach Hall (2011: 192). Der die gesamte Baumstruktur dominierende Wurzelknoten enthält die Oberklassenmerkmale [±kons], [±son] und [±appr] (vgl. 3.3.1) und dominiert den sog. Ortsknoten [ORT] 43 . Dieser steht wiederum in der Hierarchie über den Artikulatorknoten, die den vier Artikulatoren ‘labial’ (mit einer oder beiden Lippen), ‘koronal’ (mit der Zungenspitze oder dem Zungenblatt), ‘dorsal’ (mit dem Dorsum oder Zungenrücken) und ‘radikal’ (mit der Zungenwurzel, vgl. lat. radix) entsprechen. Eine weitere Spezifizierung ergibt sich durch die von den Artikulatorknoten dominierten binären Ortsmerkmale. Die hierarchische Struktur macht dabei deutlich, dass diese jeweils nur auf das ihnen übergeordnete Merkmal und damit auf eine bestimmte Klasse von Lauten zutreffen: So können nur labiale Laute gerundet oder ungerundet sein ([±rnd]), und nur auf koronal gebildete Laute treffen die Merkmale [±ant] (Hindernis im vorderen Teil des Ansatzrohr) und [±apik] (Artikulation mit der Zungenspitze) zu. Die artikulatorischen Merkmale [±hoch], [±tief] und [±hint] beziehen sich schließlich allein auf dorsale Laute, während die Zungenwurzel als Artikulator mit der pharyngalen Artikulationsstelle gleichzusetzen ist. 44 43 Der Ortsknoten (engl. place node) wird oft auch mit dem Kürzel PA bezeichnet, was für engl. place of articulation (bzw. sp. punto de articulación) steht. In NGRAE (2011: 10) wird dafür sp. zona de articulación bzw. ZA benutzt. 44 Die Darstellung in Abb. 3.3-1 enthält nicht alle Merkmale, die zur vollständigen Charakterisierung einzelner Segmente vonnöten sind, so etwa die Merkmale für Stimmhaftigkeit [±sth] und Aspiriertheit [±asp]. Diese werden im merkmalsgeometrischen Rahmen i.d.R. unterhalb des sog. Laryngalknotens [LARYNGAL] angesetzt, der sich hierarchisch auf gleicher Ebene wie der Ortsknoten befindet (vgl. Hall 2011: 196ff.) und Abb. 3.3-6. Wurzelknoten Ortsknoten Artikulatorknoten ±kons ±son ±appr [ORT] [LAB] [KOR] [DORS] [RAD] [±rnd] [±ant] [±apik] [±hoch] [±tief] [±hint] = 1 114 Betrachten wir nun anhand von / n/ und / p/ , wie sich einzelne Lautsegmente in Form von Merkmalsbäumen darstellen lassen. Abb. 3.3-2 Darstellung von / n/ und / p/ in Form vom Merkmalsbäumen. Der Prozess der Nasalassimilation, den wir in 3.2 mithilfe einer generativen Regel beschrieben haben, lässt sich im merkmalsgeometrischen Rahmen erfassen, indem man annimmt, dass sich die Ortsmerkmale des zweiten Segments auf das vorangehende ausbreiten. Anhand des Beispiels en Pamplona [empamplona] kann man sich dies so vorstellen, dass sich die Ortsmerkmale von / p/ auf den vorausgehenden Nasalkonsonanten / n/ ausbreiten und diese sozusagen überschreiben. Wie in Abb. 3.3-3 skizziert, wird hierzu angenommen, dass bei / n/ die Verbindung zum Ortsknoten (links) ‘gekappt’ wird und stattdessen eine neue Assoziationslinie zum Ortsknoten von / p/ entsteht (Mitte). Der Ortsknoten von / n/ wird getilgt, Resultat ist die phonetische Realisierung von en als [em] (rechts). Man spricht hier auch von Merkmalsausbreitung (engl. feature spreading). Zur Vereinfachung verzichten wir auf die Darstellung der spezifischen Ortsmerkmale unterhalb des Artikulatorknotens. Abb. 3.3-3 Merkmalsgeometrische Darstellung der Nasalassimilation anhand von e[m] Pamplona. Das Anliegen der Merkmalsgeometrie, subsegmentale Phänomene ohne strikte Anbindung an die Segmente zu erfassen, lässt sich problemlos mit der bereits Ende der 1970er Jahre entstandenen und kontinuierlich weiterentwickelten Autosegmentalen Phonologie verbinden. Die Grundidee dieses von Goldsmith (1979) erarbeiteten Ansatzes besteht darin, dass über der segmentalen eine weitere Ebene angenommen wird. Diese wurde zunächst mit Blick auf suprasegmentale Eigenschaften (vgl. 1.3 sowie ausführlich Kap. 4) entwickelt, um zu erfassen, welche Prozesse in Tonsprachen ablaufen, die lexikalische Bedeutungskontraste mithilfe von Tonhöhenbewegungen (Verlauf der Grundfrequenz, F 0 ) ausdrücken können. Ein bekanntes Beispiel Wurzelknoten Ortsknoten Artikulatorknoten +kons +son -appr [ORT] [KOR] [+ant] [-apik] / n/ +kons -son -appr [ORT] [LAB] / p/ [-rnd] +kons +son -appr [ORT] [KOR] / n +kons -son -appr [ORT] [LAB] p/ +kons +son -appr [ORT] [KOR] = +kons -son -appr [ORT] [LAB] +kons +son -appr +kons -son -appr [ORT] [LAB] [m p] = = 115 für eine Tonsprache ist neben zahlreichen afrikanischen Sprachen, anhand derer Goldsmith vornehmlich argumentiert, das Mandarin-Chinesische, auf das wir in 4.5.1 noch genauer eingehen. Es soll uns auch hier zum besseren Verständnis des autosegmentalen Modells dienen: Wenn man im Mandarin-Chinesischen die Segmentabfolge [ma] mit einer hohen F 0 -Kontur produziert (1. Ton), bedeutet das Wort m ‘ Mutter’ ; ist die Tonkontur hingegen steigend (2. Ton), resultiert die Bedeutung ‘Hanf’ (má ). Im Rahmen der autosegmentalen Phonologie symbolisiert man die lexikalischen Töne durch Großbuchstaben H (engl. high) bzw. L (engl. low), woraus sich für die beiden genannten Töne die Repräsentationen H (1. Ton, hoch) bzw. LH (2. Ton, steigend) ergeben. Da lexikalische Töne nicht in einem Eins-zu-eins-Verhältnis an einzelne Segmente gebunden sind, sondern wie im Fall von má mehrere tonale Elemente, nämlich L und H, mit einer einzigen tontragenden Einheit (engl. tone bearing unit) verbunden sein können, werden sie als sog. Autosegmente auf einer gesonderten Ebene (Tonschicht) repräsentiert, vgl. Abb. 3.3-4. Abb. 3.3-4 Repräsentation lexikalischer Töne im autosegmentalen Modell. Die Assoziation zwischen der Ebene der tontragenden Einheiten (hier jeweils die Silbe [ma]) mit den auf der Tonschicht repräsentierten Merkmalen impliziert notwendigerweise eine zeitliche Dimension: So ist etwa bei má die Abfolge aus Tief- und Hochton (LH) vorgegeben, woraus sich eine steigende F 0 -Kontur ergibt. Die Annahme einer von der Segmentebene unabhängigen Zeit- oder Skelettschicht, verstanden als Abfolge diskreter Zeiteinheiten, die mit den Symbolen C (Konsonant) und V (Vokal) oder mithilfe abstrakter X-Positionen repräsentiert werden kann, ermöglicht die Darstellung unterschiedlicher Assoziationsbeziehungen zwischen den Ebenen. So lassen sich Diphthonge wie in sp. bueno (vgl. 2.5.3.2, 3.1.2) als Zuordnung zweier vokalischer Segmente / u/ und / e/ zu ein und derselben X- (bzw. V-)Position interpretieren; phonetisch realisiert wird dann die Abfolge von Gleitlaut und Vokal [we]. Ebenso lassen sich phonologisch zusammengehörende komplexe Elemente wie die spanische Affrikate / ¢/ (vgl. 2.5.1.2, 3.1.2) als mit einer einzigen Position assoziiert darstellen. Auch kann umgekehrt die Zuordnung zweier Positionen der Zeitschicht zu ein und demselben Segment sinnvoll sein, z.B. dann, wenn wie im kanarischen Spanisch kompensatorische Längungseffekte auftreten: Wie in 2.5.1.2 gezeigt, wird bei der Abfolge / sb/ wie in las velas in dieser Varietät das / s/ getilgt und stattdessen ein gelängtes [b] realisiert, d.h. [la b ela] (statt [laz -elas]). Abb. 3.3-5 gibt die Repräsentationen für den Diphthong, die Affrikate und das gelängte / b/ . Abb. 3.3-5 Diphthong / ue/ , Affrikate / t$/ und gelängtes / b/ im autosegmentalen Modell. H mÞ L H má Tonschicht C C b t $ C u e V Zeitschicht Segmentschicht = 1 116 Ein klarer Vorteil des multilinearen Ansatzes besteht darin, dass sich Fälle von Merkmalsausbreitung, wie sie bei der Nasalassimilation oder bei der kompensatorischen Längung auftreten, mithilfe der Zeitschicht plausibel darstellen lassen. In Abb. 3.3-6 skizzieren wir die Analyse der kompensatorischen Längung in las velas [la b ela] im autosegmentalen Rahmen. Abb. 3.3-6 / s/ -Ausfall und kompensatorische Längung in las velas [la b ela] (kanarisches Spanisch). Nach dem Ausfall des / s/ im Auslaut des Artikels las und des Nomens velas (dargestellt mittels Durchstreichung der Verbindungslinie zur Zeitschicht) assoziiert die segmental nicht mehr gefüllte C-Position (auch engl. slot) mit dem benachbarten Merkmalsbündel (/ b/ ). Dieses breitet sich folglich über zwei C-slots aus (angezeigt durch die gestrichelte Assoziationslinie im grau hinterlegten Kasten); Resultat ist die Längung des Verschlusslauts ([b ]; grau umrahmter Kasten). 3.4 Optimalitätstheorie Mit der Optimalitätstheorie (OT, engl. optimality theory, sp. teoría de la optimidad) kam zu Beginn der 1990er Jahre ein Ansatz auf, der in Abkehr von der modularen Konzeption des sprachlichen Wissens von einer engen Verzahnung der grammatischen Komponenten (Phonologie, Morphologie, Syntax etc.) ausgeht. Das Initialwerk von Alan Prince und Peter Smolensky Optimality Theory: Constraint Interaction in Generative Grammar zirkulierte seit 1993 als sog. ‘graue’ Literatur und wurde erst 2004 in Buchform publiziert (Prince & Smolensky 2004). Anders als in den bisher besprochenen Ansätzen wird in der OT die Vermittlung zwischen zugrundeliegenden phonologischen Repräsentationen und den entsprechenden phonetischen Oberflächenrealisierungen nicht durch Regeln, sondern mithilfe von Beschränkungen, den sog. Constraints (sp. restricciones), erfasst. Es wird angenommen, dass eine Generatorfunktion (GEN) ein Set von potentiell möglichen Outputformen zu einer als Input 45 bezeichneten zugrundeliegenden Form erzeugt und dass im Rahmen einer Evaluation (EVAL) aus diesen Kandidaten die beste (= ‘optimale’) Form ausgewählt wird. Man nimmt an, dass die Constraints, die den Auswahlprozess steuern, übereinzelsprachlich gültig 45 Die optimalitätstheoretische Verwendung des Begriffs entspricht nicht dem Input-Begriff, wie er aus der Spracherwerbsforschung bekannt ist. Dort meint man damit die sprachlichen Daten, mit denen Kinder beim L1-Erwerb konfrontiert werden; hier bezieht er sich auf die zugrundeliegenden Repräsentationen. +kons -son -appr [ORT] [KOR] s +kons -son -appr [ORT] [LAB] b C C [LARYNGAL] [+sth] +kont +sibil -distr C V a l l C V e V C s a = = Zeitschicht Segmentschicht merkmalsgeometrische Darstellung Ù [b ] = 117 sind und in ihrer hierarchischen Anordnung wie ein Filter wirken. Der Unterschied zwischen Sprachen bzw. Varietäten manifestiert sich allein im jeweils unterschiedlichen Aufbau dieser Constrainthierarchie; einzelsprachliche Grammatiken werden folglich als Beschränkungshierarchien verstanden. Der optimale Kandidat ist derjenige, der als letzter eine der Beschränkungen verletzt und somit in der Evaluation ‘am weitesten kommt’. Grundsätzlich unterscheidet man zwischen unterschiedlichen Arten von Constraints: Eine erste Gruppe, die sog. Treueconstraints (engl. faithfulness constraints, sp. restricciones de fidelidad), sorgt dafür, dass der Abstand zwischen Input- und Outputform möglichst gering bleibt. Hierzu zählen z.B. der Constraint M AX -IO (engl. maximal representation of input segments in the output); er besagt, dass keine als zugrundeliegend angenommenen Segmente weggelassen werden dürfen. Die Beschränkung D EP -IO (engl. dependency between input and output) verbietet umgekehrt das Hinzufügen zusätzlicher Segmente. Häufig verwendet wird auch der Constraint I DENT (F), demzufolge die im Input enthaltenen Merkmale in der Outputform nicht verändert sein dürfen. Es ist offensichtlich, dass phonologische Prozesse gegen Treueconstraints verstoßen. So verletzen bspw. Assimilationen die Beschränkung I DENT (F): Auch wenn weder Segmente hinzugefügt noch weggelassen werden, ergeben sich doch Merkmalsdiskrepanzen zwischen zugrundeliegender phonologischer Form (Input) und phonetischer Oberflächenrealisierung (Output). Eine zweite Gruppe von Beschränkungen stellen die sog. Markiertheitsconstraints (engl. markedness constraints, sp. restricciones de marcación) dar. Diese sorgen für unmarkierte Strukturen, d.h. für solche, die in den Sprachen der Welt häufig auftreten und deswegen als ‘normal’ oder ‘natürlich’ angesehen werden (vgl. 3.1.1). Weit verbreitete Markiertheitsbeschränkungen betreffen die Struktur der Silbe (vgl. 4.2) und verbieten bspw. Silben ohne Onset (Anfangsrand) oder solche, die eine Coda (d.h. silbenabschließendes Segment) aufweisen. Die entsprechenden Beschränkungen O NSET und N O C ODA werden von einer Form wie dt. oft [ ft] offensichtlich verletzt. Eine dritte Art von Constraints bezieht sich auf die Übereinstimmung (engl. alignment) zwischen verschiedenen sprachlichen Ebenen. Einer dieser sog. Alignmentconstraints (sp. restricciones de alineamiento) betrifft die Übereinstimmung zwischen Wort- und Silbenanfang (A LIGN -L EFT ) eine Beschränkung, die etwa durch Resyllabierung verletzt wird (4.2.5). Als solche bezeichnet man Umordnungen in der Silbenstruktur, durch die ein wortfinaler Codakonsonant in den Anfangsrand des nachfolgenden, vokalisch anlautenden Worts gerät: So entsprechen in dem Satz vienen estudiantes [ bje.ne.nàes.tu. ®jan.tes] ‘es kommen Studenten’ die in der phonetischen Umschrift mit Punkten markierten Silbengrenzen nicht den Wortgrenzen (angezeigt durch den senkrechten Strich). Offensichtlicher Nachteil der Resyllabierung ist, dass Wortanfänge durch andere Anlautkonsonanten ‘maskiert’ werden und die Grenzen zwischen den einzelnen Wörtern in der Redekette somit schwerer auszumachen sind. Vorteilhaft ist hingegen, dass auf diese Weise unmarkierte Silbenstrukturen entstehen, d.h. solche, die einen Anfangsrand aufweisen und damit nicht gegen die Beschränkung O NSET verstoßen. Im Rahmen der OT lassen sich solche unterschiedlichen Präferenzen mithilfe einer Beschränkungshierarchie ausdrücken, in der die Constraints nach ihrer (einzelsprachlichen) Relevanz geordnet werden. Im Falle der spanischen Resyllabierung muss der Constraint O NSET höher eingestuft werden als die Beschränkung A LIGN -L EFT ; er dominiert diese also, was durch das Zeichen ‘»’ ausgedrückt wird: O NSET » A LIGN -L EFT . Abb. 3.4-1 gibt eine schematische Darstellung des optimalitätstheoretischen Modells. = 1 118 Abb. 3.4-1 Das optimalitätstheoretische Modell (C = Constraint, Kand. = Kandidat). Evaluationsprozesse werden in Form von Tableaus dargestellt, wobei in der linken Spalte die Outputformen und in der obersten Tabellenzeile rechts die Constraints stehen. Diese sind von links nach rechts in absteigender Hierarchie angeordnet, sodass die Kandidaten bei der Evaluation zuerst die höherrangigen Constraints passieren müssen. Verletzt ein Kandidat eine Beschränkung, wird dies durch einen Stern (*) markiert; eine fatale Verletzung, die zum Ausschluss des Kandidaten führt, erhält zusätzlich ein Ausrufezeichen (*! ). Nach einer fatalen Verletzung erscheinen die restlichen Tabellenzellen des Kandidaten grau schattiert, um anzuzeigen, dass weitere Constraintverletzungen keinen Einfluss mehr auf das Ergebnis der Evaluation haben. Der ‘Sieger’ des Auswahlprozesses, d.h. der optimale Kandidat, wird durch eine Hand mit ausgestrecktem Zeigefinger ( ) markiert; vgl. Abb. 3.4-2. Im Folgenden verdeutlichen wir das Funktionieren der OT anhand der Nasalassimilation, die wir bereits aus strukturalistischer, prozessphonologischer und autosegmentaler Perspektive dargestellt haben (vgl. 3.1, 3.2, 3.3). Hierzu benötigen wir zunächst die folgenden Beschränkungen, die wir in leicht modifizierter Form von Colina (2009: 34f.) übernehmen: • I DENT (place) Im Input enthaltene Ortsmerkmale entsprechen den im Output enthaltenen. • C ODA C OND Eine Coda lizenziert keine Ortsmerkmale. Die erste Beschränkung stellt einen typischen Treueconstraint dar, der sich allgemein auf Ortsmerkmale bezieht. Der Markiertheitsconstraint C ODA C OND (Coda condition) erfasst die Tatsache, dass in den Sprachen der Welt Codakonsonanten tendenziell keine eigenen Ortsmerkmale aufweisen, d.h. keine solchen ‘lizenzieren’. Dies gilt auch für das Spanische, wo z.B. Nasale entweder koronal sind (wie im absoluten Auslaut, vgl. sin [sin] oder álbum [ al-un]) oder an den Nachfolgekonsonanten assimiliert werden. Das nachfolgend gegebene Tableau stellt die Evaluation dreier möglicher Outputformen für die zugrundeliegende Form / tano/ dar. C ODA C OND I DENT (place) (1) [ta´o] * (2) [tano] *! (3) [tamo] *! * Abb. 3.4-2 OT-Tableau zur Nasalassimilation in / tano/ [ta´o] (nach Colina 2009: 35). Die Kandidaten (2) [tano] und (3) [tamo] verletzen aufgrund ihrer ‘eigenen’ Ortsmerkmale die Beschränkung C ODA C OND und sind damit aus dem Rennen; es verbleibt Output Kand. 1 […] Kand. 2 […] Kand. 3 […] Kand. 4 […] Kand. n […] EVAL C 1 » C 2 » … » C n Optimale Form […] GEN Input / …/ = 119 die Form [ta´o] (Kandidat 1), die Nasalassimilation aufweist und damit nur gegen den hierarchisch tief angesiedelten Constraint I DENT (place) verstößt. Diese Beschränkung wird zwar auch von Kandidat (3) verletzt, doch ist dieser aufgrund seiner fatalen Verletzung von C ODA C OND kein Konkurrent mehr. In den Kapiteln zur Silbenphonologie (4.2) und Intonation (4.5) werden wir weitere Anwendungsbereiche der OT vorstellen. 3.5 Exemplartheorie Als ein Gegenmodell zu den bisher behandelten Ansätzen, die auf strukturalistischer bzw. generativer Theoriebildung beruhen, lässt sich die sog. Exemplartheorie (engl. exemplar theory, sp. teoría de los ejemplares) auffassen, die v.a. von Bybee (2001, 2006) und Pierrehumbert (2001) in die phonologische Diskussion eingebracht wurde (für eine zusammenfassende Darstellung vgl. Pustka 2009: 90ff.). Die Exemplartheorie lässt sich im Bereich der kognitiven Linguistik verorten. Ihr Interesse ist weniger auf die (abstrakte) Modellierung des sprachlichen Wissens (d.h. der langue bzw. Kompetenz) ausgerichtet, sondern sie setzt die sprachlichen Strukturen in unmittelbare Beziehung zum Sprachgebrauch, den sie folglich auf der Basis umfangreicher Datenkorpora zu rekonstruieren sucht. Grundlegende Idee der Exemplartheorie ist, dass die Repräsentation eines Ausdrucks im sprachlichen Wissen eines Sprechers in stetiger Interaktion steht mit den gegebenenfalls stark variierenden Realisierungen, mit denen der Sprecher als Hörer tagtäglich konfrontiert wird. Dazu muss man sich vorstellen, dass jede wahrgenommene Realisierung eines Worts (sog. token) auf seine Repräsentation einwirkt und diese beständig verändern kann. Phonologische Formen werden nicht als abstrakte Entitäten verstanden, sondern als Cluster von sog. Exemplaren, die um einen Prototypen herum organisiert sind. Wenn die konkret produzierten Entsprechungen solcher Exemplare im Sprachgebrauch häufiger vorkommen, gewinnen diese an lexikalischer Stärke; wird umgekehrt eine Realisierungsform immer seltener gebraucht (abnehmende token-Frequenz), rückt auch das ihm entsprechende Exemplar im mentalen Lexikon weiter an die Peripherie und verschwindet gegebenenfalls ganz. Wir verdeutlichen uns die exemplartheoretische Herangehensweise anhand der sog. aspiración, d.h. der Realisierung von / s/ in der Codaposition als glottaler Frikativ [h] (2.5.1.2). Im Spanischen von Buenos Aires ist die [h]-Realisierung insbesondere wortintern vor stimmlosen Verschlusslauten wie in mosca [ m hka] stark verbreitet (ca. 80 %; vgl. Hualde 2005: 162); daneben werden zu 12 % Formen des Typs [ m ska] produziert; in 8 % der Fälle schließlich fällt der Frikativ völlig aus (Typ: [ m ka]). Man kann davon ausgehen, dass die aspiración in früheren Phasen des argentinischen Spanisch deutlich weniger verbreitet war als heute. Interessant ist, dass gerade Angehörige der sozial höher gestellten Schichten die aspiración vermutlich bewusst eingesetzt haben, um sich gegen die [s]-Aussprache der italienischen Einwanderer abzugrenzen. Da in italienischen Varietäten kein der spanischen aspiración vergleichbares Phänomen auftritt, produzierten die Einwanderer in ihrem Lernerspanisch konsequent Formen wie [m ska], [pasta], [k sta] etc. was der damaligen zielsprachlichen Normlautung entsprach. Heutzutage ist die [s]-Aussprache in präkonsonantischer Position marginal (vgl. die oben genannten Zahlen); wenn sie auf- = 1 120 tritt, gilt sie als sozial niedrig markiert (vgl. Peåková et al. 2012b: 367). 46 Die folgende, an Pustka (2009: 91) orientierte Abbildung stellt dar, wie sich der Wandel der Vorkommensfrequenzen von [m ska] und [m hka] auf die Repräsentation des Worts mosca auswirkt. Abb. 3.5-1 Sprachgebrauch und Repräsentation in der Exemplartheorie am Beispiel von mosca. Solange im Sprachgebrauch (fast) ausschließlich die Realisierung [m ska] auftritt, bleibt die Repräsentation / moska/ erhalten (Etappe 1). Verwenden einzelne Sprecher zunehmend die aspirierte Form [m hka], erhält die Repräsentation von mosca einen weiteren Prototypen, nämlich / mohka/ ; Resultat ist die Suppletionsform / moska/ ~ / mohka/ (Etappe 2). Die beiden Formen können unterschiedlich gewichtet sein: Während in Etappe 2 / moska/ die maßgebliche Form ist, wird sie in Etappe 3 aufgrund der Zunahme von [m hka]-Realisierungen im Sprachgebrauch marginalisiert. Übungsaufgaben 1) Überprüfen Sie anhand von Minimalpaaren, welchem Phonem oder welchen Phonemen [s] und [z] im Spanischen und im Deutschen zuzuschlagen sind. Testen Sie Ihre Analyse an verschiedenen Positionen im Wort, und begründen Sie Ihre Antwort ausführlich anhand von schlagkräftigen Beispielen aus beiden Sprachen. 2) Diskutieren Sie, warum [s] und [h] ähnlich genug sind, um im Spanischen als Allophone eines Phonems gelten zu können. Lassen sich auch [x] und [h] als Allophone eines Phonems klassifizieren? Welches Phonem wäre dies? Handelt es sich um freie oder kontextbedingte Variation? Erläutern Sie Ihre Antworten anhand von Beispielen. 46 Im 4. Kapitel zur Prosodie gehen wir genauer auf den migrationsbedingten Kontakt zwischen Spanisch und Italienisch in Argentinien ein (vgl. 4.3.3 und 4.5.4.2). Bloomershine (2006) befasst sich ebenfalls im Rahmen der Exemplartheorie mit der regionalen Aussprache in Puerto Rico und Mexiko und diskutiert dabei ebenfalls die aspiración. [m ska] Repräsentation Sprachgebrauch [m ska] [m ska] [m ska] [m ska] [m ska] [m ska][m ska] [m ska] / m ska/ [m ska] [m ska] [m hka] [m hka] [m ska] [m ska] [m hka][m ska] [m ska] / m ska/ / m hka/ [m hka] [m hka] [m hka] [m hka] [m ska] [m hka] [m ska] [m hka] [m hka] / m hka/ / m ska/ Etappe (1) Etappe (2) Etappe (3) 121 3) Ermitteln Sie systematische Unterschiede in der Phonotaktik des Spanischen und des Deutschen. 4) Finden Sie heraus, ob es Sprachen gibt, in denen Silben mit der Abfolge Liquid- Plosiv beginnen können, und stellen Sie das Ergebnis Ihrer Suche anhand von Beispielen vor. 5) Nennen Sie die Allophone von / b/ im Spanischen und begründen Sie ausführlich warum die Benutzung unterschiedlicher Allophone in gleicher Position nicht für eine Bedeutungsverschiebung sorgt. 6) Was wird unter eindimensionalen, mehrdimensionalen und binären Oppositionen von austauschbaren, bedeutungsdifferenzierenden Segmenten verstanden? Untermauern Sie Ihre Erklärung mit unterschiedlichen Beispielen. 7) Erläutern Sie, was unter vacío accidental und vacío sistemático zu verstehen ist, und geben Sie spanische Beispiele, auf die diese Beschreibung zutreffen würde. Geben Sie an, welche Phonotaktik hinter Ihren Beispielen steht. 8) Beschreiben Sie anhand eines konkreten Lauts, wann die Neutralisierung einer phonologischen Opposition auftreten kann. Sind diese Neutralisierungen sprachabhängig oder sprachunabhängig? Begründen Sie ihre Aussage. 9) Was versteht die Prager Schule unter einem Archiphonem? Beschreiben Sie die phonologische Schreibweise für dieses Phänomen und benennen Sie konkrete Beispiele aus dem Spanischen. 10) Was ist unter der kombinatorischen Variation eines Lauts zu verstehen? 11) Erläutern Sie was mit den Phonemen / b d / in intervokalischer Position passiert und warum dies so ist. Führen Sie Beispiele in Ihrer Erklärung an. 12) Was ist eine Entphonologisierung? Gibt es solche Prozesse in der spanischen Sprachgeschichte? Erläutern Sie diesen Prozess anhand eines konkreten Beispiels. 13) Inwiefern ist die Silbenstruktur für das Inventar der spanischen Konsonantenphoneme relevant? 14) Erläutern Sie, warum eine phonologische Wertung des stimmhaften Frikativs / °/ als Allophon des Vokals / i/ vorgeschlagen wurde. Warum ist dieser Vorschlag problematisch? 15) Skizzieren Sie anhand von Minimalpaaren die phonologischen Opposition, die im lleísmo möglich sind. Vergleichen Sie damit die Oppositionsmöglichkeiten im yeísmo sowie im eísmo/ eísmo. 456789: 6; 8: 5<7 4. Prosodie Bereits in der Einleitung (1.3) haben wir davon gesprochen, dass Lautsprache nicht als ein Aneinanderreihen von eigenständigen lautlichen Segmenten verstanden werden darf. Sprechen heißt nicht, Laute wie Perlen auf einer Schnur miteinander zu verbinden. Wie wir im letzten Kapitel gesehen haben, berücksichtigt die Phonologie diese Erkenntnis inzwischen in verstärktem Maße. Durch die Konzentration auf subsegmentale Merkmale in der Merkmalsgeometrie und das Einbeziehen segmentunabhängiger Beschreibungsebenen in den autosegmentalen Ansätzen hat sie die phonologischen Erkenntnismöglichkeiten beträchtlich erweitert (3.3). Im Folgenden werden wir die Überwindung einer ausschließlich segmentbezogenen Perspektive in eine andere Richtung weiterverfolgen. Wir werden uns der suprasegmentalen Phonologie zuwenden, die zeigt, dass es eine ganze Reihe von lautsprachlichen Phänomenen gibt, die nicht an Einzelsegmente, sondern an größere Einheiten gebunden sind. Ihre Beschreibung und Erklärung setzt eine Perspektivierung voraus, die über das Segment hinausgeht, die also suprasegmental ist. Man spricht hier auch von Prosodie bzw. von prosodischer Phonologie. Der Terminus geht auf einen altgriechischen Fachausdruck aus der Rhetorik zurück; ê Ú ῳ ë Û (prosodía) heißt ‘das Dazugesungene’. Dieselbe Bedeutung hat auch das lateinische Wort accentus < ADCANTUS , das in der lateinischen Rhetorik den griechischen Fachausdruck übersetzt und die etymologische Basis für unser Wort ‘Akzent’ ist. Wenn wir hier auf die griechisch-lateinische rhetorische Tradition verweisen, dann nicht nur, um die Etymologie wichtiger Fachtermini der prosodischen Forschung zu klären. Es soll auch ein Hinweis auf eine vorwissenschaftliche Tradition sein, die für Phänomene wie Akzentuierung oder Metrum und Rhythmus Beschreibungskonzepte entwickelt hat, die die prosodische Phonologie aufnehmen konnte. Dieses ideengeschichtliche Erbe ist allerdings nicht ganz unproblematisch, denn man vergisst leicht, dass der Gegenstand der Rhetorik der Bereich der distanzsprachlichen Kommunikation ist. In der Metrik ist es sogar die gebundene Rede, dichterische Texte also, die einer durchgehenden rhythmischen bzw. akzentuellen Überformung unterworfen werden. Vor diesem Hintergrund ist es verständlich, dass die Prosodie in der antiken Rhetorik als etwas ‘Dazugesungenes’ definiert wurde; in der Tat handelt es sich ja bei der Dichtung um Kommunikation, in der die prosodischen Dimensionen der Lautsprache über das Normalmaß hinaus reflektiert und funktionalisiert werden. Eines der wichtigsten Ergebnisse neuerer Forschung dürfte sein, dass die Auffassung von Prosodie als einer allenfalls stilistisch interessanten Dimension revidiert wurde. Man muss hier nur an den Spracherwerb denken und an die zentrale Rolle, die neuere Studien prosodischen Phänomenen für die ersten Phasen der Sprachwahrnehmung und des Sprachlernens zuweisen. 1 Die Prosodie ist ein integraler Bestandteil 1 So haben Ramus et al. (1999) gezeigt, dass Neugeborene ihre Muttersprache (L1) von einer anderen Sprache unterscheiden können, wenn beide verschiedenen rhythmischen Klassen angehören (vgl. 4.4.2). Weiterhin nutzen Kinder vermutlich einzelsprachliche Betonungsmuster, um grammatische Eigenschaften wie die Abfolge von Objekt und Verb zu erwerben (vgl. Guasti et al. 2001). So entspricht das Betonungsmuster ‘stark - schwach’ der Wortstellung Objekt - Verb (z.B. dt. [ O das BUCH][ V lesen], türk. [ O K TABI][ V okumak]), während ‘schwach-stark’ mit VO korreliert (z.B. sp. [ V leer][ O el LIBRO], fr. [ V lire][ O le LIVRE]). Es wird 124 der Lautsprache und den segmentalen Phänomenen keinesfalls nachgeordnet. Zum Sprechen gehören Silbenmuster (4.2), Akzentkontraste (4.3), rhythmische Dauerunterschiede (4.4) und intonatorische Modulationen (Sprachmelodie, 4.5). Das betrifft nähesprachliche Varietäten ebenso wie im Medium der Phonie realisierte Distanzsprache. Im Alltagsgespräch funktioniert Prosodie allerdings anders als in vorgelesenen schriftlichen Texten oder etwa in der Dichtung. Sie übernimmt im Gespräch wichtige parasprachliche Aufgaben (Signalisierung emotionaler Beteiligung), sie unterstützt die Formulierungsarbeit (Regelung des Sprecherwechsels, Bewältigung von Formulierungsschwierigkeiten), und sie signalisiert die informationsstrukturelle Gliederung (Phrasierung, Fokussierung) sowie pragmatische Funktionen (Abtönung) teils im Zusammenspiel mit, teils auch anstelle von syntaktischen Ausdrucksverfahren. Auf die Rolle der Prosodie in der (phonischen) Nähekommunikation können wir in dieser Einführung nicht detailliert eingehen, nicht zuletzt, weil eingehende prosodische Analysen nähesprachlicher Korpora erst in Ansätzen vorhanden sind (4.5.5). Wir werden die kommunikativen Unterschiede zwischen Nähe- und Distanzsprache jedoch berücksichtigen und präzisieren, ob wir uns auf spontansprachliche Interaktion oder auf in Laborsituationen entstandene Daten (Vorleseaussprache, semi-spontansprachliches Material) beziehen. Das Kapitel zur Prosodie ist folgendermaßen aufgebaut: Zunächst wird das Gesamtkonzept der prosodischen Einheiten und der prosodischen Hierarchie vorgestellt, die im Rahmen der neuen multilinearen und hierarchischen Modellierung des phonologischen Wissens bzw. der phonologischen Kompetenz abgegrenzt werden (4.1). Danach werden wir ausführlich auf die Silbe eingehen, die für die prosodische Organisation grundlegend ist (4.2). Die nächsten Unterkapitel gehen dem Funktionieren der sog. prosodischen Eigenschaften nach: Wir beschäftigen uns mit den lautlichen Phänomenen, die sich auf mehrere Segmente erstrecken und nur in größeren prosodischen Kontexten erkannt werden können. Das sind Tonhöhe, Dauer, Intensität und Artikulationsgenauigkeit. Wir untersuchen, wie diese im Spanischen als Akzent, genauer als Wortakzent, funktionalisiert werden (4.3), wie sie im Bereich des Rhythmus eingesetzt sind (4.4) und wie sie in der Intonation funktionieren (4.5). 4.1 Prosodische Einheiten und prosodische Hierarchie Bereits vor und während der Zeit, in der die strukturalistische Phonologie (3.1) und die klassische generative Phonologie (3.2) dominierten, gab es Ansätze, die von mehreren Ebenen der lautlichen Strukturbildung ausgingen und Einheiten wie die Silbe, das Wort oder das Syntagma in die Analyse einbezogen. Das gilt bspw. für die vorstrukturalistische Phonetik von Eduard Sievers (1901) oder für die Untersuchungen von Ernst Pulgram (1970) zur lateinisch-romanischen Lautentwicklung (vgl. hierzu v.a. Vennemann 1986). Seit den späten 80er und 90er Jahren des letzten Jahrhunderts ist eine Abkehr von der vornehmlich segmentalen Perspektive, wie sie in Strukturalismus und klassischer generativer Phonologie vorherrschend war, zu verzeichnen. In 3.3 haben wir gesehen, dass die Analyse von Tonsprachen zur Annahme angenommen, dass Neugeborene in der Lage sind, solche Betonungsmuster voneinander zu unterscheiden, und diese Informationen nutzen, um die Wortstellungsregeln ihrer Sprache zu erwerben. Diese Art von ‘Unterstützung’ eines Erwerbsbereichs (hier: Wortstellung) durch Evidenz aus einem anderen (hier: Phonologie) wird oft als Bootstrapping bezeichnet. 125 segmentunabhängiger (autosegmentaler) Strukturebenen geführt hat. Auch die Untersuchung von Akzent und Intonation machten segmentunabhängige Darstellungsebenen und neue suprasegmentale Bezugsgrößen erforderlich. Die Kritik und die daraus folgende Entwicklung der autosegmentalen und der prosodischen Forschungsansätze können wir am Beispiel des Wortakzents genauer nachvollziehen. In der klassischen generativen Phonologie wurde der Wortakzent als Merkmal eines der Segmente aufgefasst, die in der zugrundeliegenden phonologischen Repräsentation des Lexems das Merkmal [+vok] (für vokalisch) aufwiesen. Der Wortakzent war, nach dieser Auffassung, ein Merkmal von derselben Qualität wie bspw. [±hoch] oder [±stimmhaft]. Geht man von einer solchen Interpretation des Akzents aus, kann man aber z.B. nicht erklären, warum in der Entwicklung vom Lateinischen zum Spanischen die Position des Akzents innerhalb der Segmentkette immer gleich bleibt (Menéndez Pidal 1962: 36), obwohl sich das jeweilige Segment, dem es als Merkmal zugeschrieben wird, in seinen anderen Merkmalen deutlich verändert (z.B. lat. D RMìS > duermes ‘du schläfst’). Erklärbar werden solche Phänomene erst, wenn man den Wortakzent unabhängig von der Segmentstruktur definiert. Denn erstens ist seine phonetische Realisierung nicht auf das vokalische Segment beschränkt, sondern erstreckt sich auf die ganze Silbe und teilweise sogar darüber hinaus (4.5.3.2). Zweitens hat die Akzentverteilung, also die Frage, welche der zur Verfügung stehenden Silben die Betonung erhält, nichts mit den Segmenten zu tun, sondern wird von den suprasegmentalen, prosodischen Verhältnissen bestimmt. Diese können durch lexikalisch-syntaktische Beschreibungskategorien wie die von der klassischen generativen Phonologie berücksichtigten Morphem- und Wortgrenzen nicht hinreichend erfasst werden. Die Kritik am klassischen generativen Modell führte deshalb dazu, dass man die prosodischen Eigenschaften wie die distinktiven Merkmale unabhängig von den Segmenten auf eigenen Schichten (engl. tiers, sp. niveles) situierte und somit von einem unilinearen zu einem multilinearen Modell überging. Sie führte aber auch dazu, dass man sich auf die prosodische Tradition zurückbesann und weitere suprasegmentale, also prosodische Einheiten wie die Silbe oder den Fuß für die Beschreibung und Erklärung der lautlichen Strukturierung einsetzte. 4.1.1 Prosodische Einheiten Die Frage nach den prosodischen Einheiten, die bei der Herleitung phonologischer und phonetischer Regularitäten zusätzlich zu den Segmenten angesetzt werden müssen, wird in der Forschung unterschiedlich beantwortet. Es gibt Einheiten, die unumstritten sind, bei anderen bestehen Zweifel, ob sie benötigt werden. Denn während einige die Bezugsdomänen für zahlreiche und voneinander unabhängige Regeln sind - so z.B. die Silbe, ohne die viele lautliche Phänomene weder beschrieben noch hergeleitet werden können (Blevins 1995) -, sind andere - etwa die Klitische Gruppe - manchmal nur auf eine einzige Regel bezogen bzw. nicht für alle Sprachen relevant (4.1.2). Im Folgenden werden wir die Einheiten beschreiben, die in der prosodischen Forschung gängigerweise unterschieden werden. Die erste suprasegmentale Einheit, diejenige, die direkt den Segmenten übergeordnet ist, ist die Silbe (sp. sílaba), symbolisiert durch das kleine gr. Sigma (Ú). 2 Die Silbe ist eine prosodische Einheit, die auch von linguistisch nicht geschulten Spre- 2 Leider hat sich noch keine einheitliche Symbolisierung für prosodische Einheiten durchgesetzt; wir werden im Folgenden nur die von uns verwendeten Symbole vorstellen. 126 chern identifiziert werden kann. Außerdem gibt es sowohl artikulatorische als auch perzeptive Daten, die zeigen, dass sie eine zentrale Rolle in der Sprachproduktion und in der Sprachverarbeitung spielt. In der Silbe sind mehrere Segmente zusammengefasst, oder besser gesagt: Ein Silbenkern, der im Spanischen und in vielen anderen Sprachen immer ein Vokal ist, eröffnet in seinem Vor- und Nachfeld den Platz für konsonantische Segmente. Die prosodische Organisation der Lautkette in Silben kann deshalb erklären, warum Vokale und Konsonanten nicht zufällig, sondern nach bestimmten Mustern verteilt sind. Außerdem ist die Silbe die grundlegende Einheit für eine Reihe phonologischer Prozesse sowie für Dauer-, Ton- und Intensitätsphänomene. Da die Silbe eine zentrale prosodische Einheit ist, werden wir sie in einem eigenen Abschnitt behandeln (4.2). So wie in der Silbe Segmente nach einem bestimmten Muster vereint sind, sind im Fuß (sp. pie) mehrere Silben zusammengefasst. Diese Einheit wird mit dem lat. Großbuchstaben P symbolisiert. Die Einheit des Fußes ist aus der klassischen Metrik übernommen; in der altgr. und lat. Verslehre wird ein regelmäßig wiederkehrendes metrisches Muster aus starken und schwachen Silben als Fuß bezeichnet. Die Unterscheidung zwischen starken (f = sp. fuerte) und schwachen (d = sp. débil) Silben beruht entweder auf dem Silbengewicht (stark = schwer, schwach = leicht) (4.2.2) oder auf der Betonung (stark = betont, schwach = unbetont) (4.3). Der Fuß umfasst maximal drei Silben, von denen eine und nur eine stark ist. Die schwache(n) Silbe(n) stehen entweder vor oder nach der starken Silbe, sodass sich vier mögliche Fußtypen ergeben: die rechtsdominanten Jambus (Ú d Ú f ) bzw. Daktylus (Ú d Ú d Ú f ) mit der Silbenabfolge débil - (débil -) fuerte und die linksdominanten Trochäus (Ú f Ú d ) bzw. Anapäst (Ú f Ú d Ú d ) mit der Abfolge fuerte (- débil) - débil. In der prosodischen Phonologie werden häufig nur Jambus und Trochäus, also die beiden binären Füße eingesetzt (4.3.7). Da der Fuß eine wichtige Rolle bei der Zuweisung des Wortakzentes spielt, werden wir im entsprechenden Abschnitt noch genauer auf diese Einheit eingehen (4.3). Die nächste prosodische Einheit, also diejenige, die unmittelbar auf die Strukturierungsebene der Füße folgt, ist das phonologische Wort. Symbolisiert wird es durch das kleine gr. Omega ( ). Das phonologische Wort steht in einem Spannungsverhältnis zum lexikalischen Wort: Oft fällt es mit diesem zusammen; es gibt jedoch auch Fälle, in denen die prosodischen Verhältnisse nicht mit den lexikalischen übereinstimmen, so z.B., wenn die Bestandteile zusammengesetzter Wörter bei manchen (Komposita) als prosodisch eigenständig behandelt werden, obwohl sie lexikalisch gesehen zu einer Einheit verschmolzen sind (4.3.8). Das phonologische Wort ist in vielen Sprachen und auch im Spanischen die Domäne der Wortakzentzuweisung, d.h. die Silbenbzw. Fußstrukturen der phonologischen Wörter regeln, welche der Wortsilben stark ist und deshalb betont wird. Im Spanischen bleibt außerdem, wie im Deutschen, die Möglichkeit einer Wortakzentuierung auch dann erhalten, wenn das phonologische Wort in die übergeordnete prosodische Einheit der phonologischen Phrase eingebettet ist (4.3.3). Das ist nicht in allen Sprachen der Fall: So verlieren im Französischen die phonologischen Wörter ihren Akzent zugunsten eines sog. Phrasenakzents, sodass nur die phonologische Phrase, nicht aber die einzelnen Wörter, einen Akzent erhalten (Pustka 2011: 132). Das phonologische Wort ist in einer Vielzahl von Sprachen außerdem die Domäne für sog. Sandhi-Phänomene. Als Sandhi bezeichnet man in der altindischen Grammatiktradition die lautlichen Angleichungen, die sich beim Verknüpfen zweier Wortformen in der Lautkette ergeben. Sandhi-Phänomene wie z.B. die Assimilation (vgl. 127 2.5.1.3, 3.2) verstärken in vielen Sprachen die Kohärenz prosodischer Einheiten, weil die Segmente innerhalb der übergeordneten Konstituenten sich gegenseitig beeinflussen. Das phonologische Wort kann außerdem die Domäne von Prozessen wie Konsonantenverstärkung, Entstimmung von Konsonanten etc. sein, durch die die Wortgrenzen, vor allem der Wortanfang, verdeutlicht werden. Sandhi-Phänomene sind im Spanischen wortintern (internes Sandhi), aber auch auf der Ebene der phonologischen Phrase (externes Sandhi) belegt. Denn anders als im Deutschen besteht hier die Tendenz, in der Lautkette die Wortgrenzen zugunsten der internen Kohärenz der phonologischen Phrase aufzugeben. Im Spanischen werden in phonologischen Phrasen die Silbengrenzen über die Wortgrenzen hinweg neu bestimmt (Resyllabierung; 4.2.5). Deshalb ist das phonologische Wort nur für die Bestimmung des Wortakzents, nicht aber für segment- und silbenbezogene Sandhi-Prozesse und die Syllabierung relevant. Neben dem phonologischen Wort ist auch die Klitische Gruppe bei der Frage der Akzentzuweisung im Spanischen zu berücksichtigen. Die Klitische Gruppe, die im Folgenden mit dem lat. Buchstaben C symbolisiert wird, ist die prosodische Einheit, deren Notwendigkeit am stärksten angezweifelt wird. 3 Eine Klitische Gruppe besteht aus einem phonologischen Wort und den Klitika, die dieses an sich bindet (Nespor & Vogel 2007: 145-163). Viele Forscher sind der Ansicht, dass man hier besser von einem komplexen phonologischen Wort sprechen sollte, vielleicht so, wie man dies bei Derivationen oder bei manchen Komposita tut. Allerdings verhalten sich Klitika in Hinblick auf Akzentuierung und Sandhi-Phänomene anders als Derivationsmorpheme oder lexikalische Bestandteile von zusammengesetzten Wörtern. So können bspw. nur die nachgestellten Klitika im Spanischen eine Akzentverschiebung auslösen (4.3.7). Wir werden daher im Folgenden davon ausgehen, dass zumindest bei der Beschreibung der Akzentstruktur des Spanischen neben dem phonologischen Wort auch die Klitische Gruppe eine Rolle spielt. 4 Phonologische Wörter bzw. Klitische Gruppen sind auf einer nächsthöheren Ebene in der phonologischen Phrase zusammengefasst. Die Symbolisierung für diese prosodische Einheit ist der gr. Buchstabe Phi (î). Wie wir gesehen haben, ist die phonologische Phrase im Spanischen als Domäne von externen Sandhi-Phänomenen bzw. von Resyllabierungen relevant. Ähnlich wie innerhalb des phonologischen Wortes signalisieren auch die Sandhi-Phänomene innerhalb der phonologischen Phrase die Kohärenz zwischen den Konstituenten. Die Abgrenzung dieser Einheit richtet sich nach syntaktisch-semantischen und informationsstrukturellen Kriterien. Eine phonologische Phrase gruppiert einzelne Wörter zu kohärenten und begrenzt autonomen Einheiten. Sie entspricht deshalb oft einer syntaktischen Konstituente, etwa einer Nominalphrase, einer Adverbialphrase oder einer einfachen Verbalphrase. Die Abgrenzung phonologischer Phrasen berührt das Verhältnis von Syntax und Prosodie, die sog. Syntax-Prosodie-Schnittstelle (engl. syntax-prosody interface, sp. interfaz sintaxis-prosodia; vgl. Selkirk 1984). Die Frage nach den Bezügen zwischen prosodischer Phrasierung und syntaktischer Gliederung wird in der Forschung meist so beantwortet, dass keine vollständige Isomorphie gegeben ist, die prosodische Strukturierung sich aber an der syntaktischen orientiert, weil dies die semantische Kohärenz begünstigt (vgl. Frota 2012). Phonologische Phrasen können unterschied- 3 Eine Zusammenfassung der Diskussion findet sich bei Nespor & Vogel (2007: XV-XX). 4 In der NGRAE (2011: 356) ist das Äquivalent der Klitischen Gruppe der grupo acentual: “Las palabras átonas se agrupan con las tónicas para formar un GRUPO ACENTUAL .” 128 lich lang sein und somit Konstituenten unterschiedlicher Komplexität repräsentieren. Prosodische Phänomene wie die Blockierung von Sandhi-Effekten an den Grenzen der phonologischen Phrase, phrasenfinale Intonationsbewegungen, Pausensetzungen und ähnliches sind durch die syntaktische Struktur nicht vollständig determiniert (Truckenbrodt 2007, Gabriel 2007). Die Phrasierung wird auch durch pragmatische Faktoren wie Emphase und Expressivität, durch eurhythmische Faktoren wie das Vermeiden von zu langen Phrasen oder durch die Sprechgeschwindigkeit bestimmt. Das, was zahlreiche prosodische Ansätze als phonologische Phrase abgrenzen und nahe an der syntaktischen Struktur verorten, wird in der autosegmental-metrischen Phonologie als Intermediärphrase direkt aus der Verteilung der Tonbewegungen abgeleitet (vgl. 4.5.3.1, 4.5.5), wodurch die relative Autonomie der prosodischen Strukturierung zum Ausdruck kommt (Frota 2012: 256f.). Intermediärphrasen werden durch das Kürzel ip symbolisiert, um ihre Unterordnung unter die hierarchisch übergeordnete Intonationsphrase (IP) auszudrücken. Beide prosodischen Einheiten sind durch spezifische Tonhöhenbewegungen abgegrenzt; durch diese kann der Sprecher signalisieren, dass er eine semantisch-syntaktische Einheit beginnt bzw. beendet. Er kann weiterhin signalisieren, ob es sich um eine Teileinheit - also eine Intermediärphrase (ip) - handelt und die Äußerung noch weitergeht, oder ob er am Ende der gesamten Intonationsphrase (IP) und damit am Ende der Sinneinheit angekommen ist. Mit der Intermediär- und Intonationsphrase sind die zentralen Bezugspunkte für die Zuweisung der auf der autosegmentalen Tonschicht verankerten Intonationsbewegungen genannt. Wir werden auf diese beiden hierarchisch am höchsten stehenden prosodischen Einheiten noch genauer im Abschnitt zur Intonation eingehen (4.5.3). 4.1.2 Prosodische Hierarchie Die bisherige Darstellung der prosodischen Einheiten hat gezeigt, dass diese hierarchisch aufeinander bezogen sind. Ein Fuß umfasst mehrere Silben, ein phonologisches Wort mehrere Füße, eine phonologische Phrase mehrere phonologische Wörter. Das Verhältnis der prosodischen Einheiten kann also als die Relation zwischen den Teilen und dem von ihnen konstituierten Ganzen gesehen werden. Umgekehrt dürfte auch deutlich geworden sein, dass die hierarchisch höheren Einheiten ihren Teilen in dem Sinne vorgeordnet sind, dass sie diese nach bestimmten Regeln miteinander verknüpfen bzw. bestimmte Eigenschaften, etwa Töne oder die Akzentposition, an sie weitergeben. Nach dem Vorbild der syntaktischen Konstituentenstruktur des generativen Modells wurde deshalb eine prosodische Grammatik entwickelt, die alle prosodischen Einheiten, die für lautsprachliche Regularitäten relevant sind, in einer umfassenden prosodischen Hierarchie miteinander in Beziehung bringt (Selkirk 1984, Nespor & Vogel 2007). Die prosodische Hierarchie orientiert sich an den syntaktischen Modellen der formalen Grammatik, in erster Linie an Chomskys Prinzipien- und Parametertheorie (vgl. Gabriel & Müller 2013). Sie schlägt einheitliche Strukturierungsprinzipien auf allen Ebenen der prosodischen Hierarchie vor: Auch in den prosodischen Phrasen nimmt eines der Elemente eine besondere Stellung ein, nämlich die des Kopfes der Phrase (Nespor & Vogel 2007: 1-25). Als Kopf einer Phrase wird dabei das prominentere Element bezeichnet, etwa die betonte Silbe im Fuß oder der Fuß mit dem Wortakzent innerhalb des phonologischen Wortes. Dabei ‘vererben’ sich die Stärkerelationen von den oberen Knoten zu den untergeordneten, sodass sich am Ende eine durchgehende Linie von der obersten Ebene der Intonationsphrase bis zur untersten, 129 den Silben, ergibt. Solche durchgehenden Stärkelinien sind bspw. wichtig, wenn es darum geht, die Assoziation der Töne mit den Wortsilben zu regeln. Die in der prosodischen Hierarchie als metrisch stark ausgezeichneten Silben sind der Ankerpunkt für die Verknüpfung der autosegmentalen Tonschicht mit der silbischen Struktur (4.5.3). Anhand des Beispielsatzes María compraba una revista exemplifizieren wir die einzelnen prosodischen Einheiten und zeigen, in welcher Beziehung sie zueinander stehen. Abb. 4.1-1 Konstituenten der prosodischen Hierarchie (nach Kubarth 2009: 76). Die Orientierung an den syntaktischen Modellen geht nicht so weit, dass die Unterschiede zwischen syntaktischer und prosodischer Strukturierung ignoriert würden. Die prosodische Hierarchie ist wesentlich flacher als die syntaktische, weil rekursive Strukturen in der Prosodie problematisch sind: Eine prosodische Einheit wie die Silbe kann nicht eine Silbe als eine ihrer Konstituenten einschließen. Sie setzt sich ausschließlich aus Konstituenten der unmittelbar darunterliegenden Strukturierungsebene, in diesem Falle aus Segmenten, zusammen. Auch auf die übergeordneten prosodischen Einheiten ist die syntaktische Rekursivität nicht unmittelbar übertragbar. Ein Satz, der aus mehrfach eingebetteten Sätzen besteht, wird prosodisch gesehen zu einer Aneinanderreihung von Intermediär- (bzw. phonologischen) Phrasen, die die unterschiedlichen Einbettungsgrade nicht erkennen lassen. 5 In der Prosodie kommt es also zu einer einfachen Reihung von Konstituenten derselben Strukturierungsebene, nicht zu mehrfacher Subordination (Unterordnung). Die Erkenntnis, dass sich in Bezug auf die Rekursivität syntaktische und prosodische Strukturgebung unterscheiden, führte zur Strict Layer Hypothesis (sp. hipótesis de estratificación rigurosa/ uniforme), d.h. zu dem Postulat, dass alle prosodischen Strukturierungsebenen in einer unveränderbaren Reihenfolge aufeinander aufbauen. Dies bedeutet, dass jede prosodische Konstituente einer Ebene x n nur Konstituenten der unmittelbar darunterliegenden prosodischen Ebene x n-1 dominieren kann und selbst wiederum vollständig in einer Konstituente auf der Ebene x n+1 aufgeht (Nespor 1993: 168). Ein phonologisches Wort könnte demnach keine Silben dominieren, weil dazwischen die Ebene der Fußstruktur liegt etc. Die Strict Layer Hypothesis ist allerdings inzwischen in die Diskussion geraten (Frota 2012, Truckenbrodt 2007). Gerade die Klitische Gruppe (C) hat zu der Frage Anlass gegeben, ob es nicht sinnvoller ist, die Silben von Klitika direkt dem Wortknoten unterzuordnen (vgl. Abb. 4.1-1). In der 5 Man kann sich das leicht vergegenwärtigen, wenn man folgenden Satz vorliest: Der, der den, der die Telefonzelle, die an der Brücke, die über die Autobahn führt, steht, beschädigt hat, gesehen hat, soll mir bitte Bescheid sagen (Gabriel & Meisenburg 2007: 34). IP î î C C C P P P P Ú ta Ú vis- Ú re- Ú na Ú u- Ú ba Ú pra- Ú com- Ú a Ú rí- Ú Ma- Intonationsphrase Phonologische Phrase / Intermediärphrase Phonologisches Wort Klitische Gruppe Silbe Fuß 130 Intonationsphonologie werden von einigen Forschern inzwischen rekursive Strukturen für die oberen Ebenen der prosodischen Hierarchie vorgeschlagen (Ladd 2008: 297f.). Das Modell wird heute flexibel gehandhabt und den einzelsprachlichen Gegebenheiten angepasst. Eine stärkere Einbeziehung der funktionalen Perspektive, die Abgrenzung (größere Phrasen) und interne Kohärenzstiftung (etwa durch Sandhi- Phänomene) in Einklang bringen könnte, steht jedoch noch aus. 4.2 Silbe, Silbenstrukturen und (Re-)Syllabierungsregeln Im Folgenden erläutern wir zunächst, was unter einer Silbe zu verstehen ist (4.2.1), und stellen ihre interne Struktur vor (4.2.2). Anschließend gehen wir auf die Silbenstrukturpräferenzen ein, die die Verkettung der Segmente zu Silben und die Verkettung der Silben zu Wörtern und Phrasen regulieren (4.2.3). Anschließend erläutern wir die Silbenstrukturen des Spanischen und den Einfluss der Silbenposition auf die Segmente (4.2.4). Dann skizzieren wir, wie sich eine wichtige prosodische Charakteristik des Spanischen, nämlich die Neubestimmung der Silbengrenzen in der Äußerung (Resyllabierung), auswirkt (4.2.5). Im letzten Abschnitt gehen wir darauf ein, wie im Spanischen das Aufeinandertreffen zweier Vokale im Silbenkontakt (Hiatus) behandelt wird (4.2.6). 4.2.1 Was ist eine Silbe? Die Silbe (Ú) ist eine prosodische Einheit, die jeder Sprecher ohne Schwierigkeiten identifizieren kann. Bereits Kinder sind dazu in der Lage: In Abzählreimen verbinden sie leicht und sicher ihre Zeigegesten mit den einzelnen Silben; auch in Kinderliedern werden die einzelnen Töne der Melodie ohne Schwierigkeiten mit Wortsilben verknüpft. Dieses spontane und problemlose Identifizieren von Silben zeigt, dass man als Kind nicht mühsam lernen muss, was Silben sind. Dass die intuitive Kenntnis auch später nicht verloren geht, sieht man an silbenbasierten Sprachspielen wie dem vesre (abgeleitet aus re.vés > ves.re), das in der argentinischen Jugendsprache verbreitet ist. Dort wird die Reihenfolge der Wortsilben vertauscht, um neue Signifikanten zu bilden: So wird z.B. das Wort pa.trón zu trom.pa umgestaltet, wobei aufgrund der veränderten segmentalen Kombinatorik die Nasalassimilation von / n/ zu [m] auftritt (vgl. 3.2). Auch in der Lyrik spielt die Silbe eine wichtige Rolle; ein häufig gewähltes Versmaß im Spanischen ist der Achtsilbler, der in einer Zeile acht Silben vereint. 6 Wenn wir über die Prinzipien unserer Artikulation und unserer Perzeption nachdenken, können wir auch begründen, warum die silbische Gliederung der Lautkette ein anthropologisches Universale ist. Silben sind eine Kombination von artikulatorischen Schließ- und Öffnungsbewegungen. In perzeptiver Hinsicht sind sie durch die Verknüpfung auditiver Kontraste gekennzeichnet. Die Silbe vereint ein Sonoritätsmaximum (Vokal) und darum herum geordnete Sonoritätsminima (Konsonan- 6 Am Zeilenende spielt der Wortakzent eine Rolle, weil die vorletzte (siebte) Silbe mit der Haupttonsilbe eines Wortes identisch sein muss. Da nicht alle spanischen Wörter dem paroxytonen Betonungsmuster entsprechen, bei dem eine unbetonte Silbe dem Hauptton folgt, kann es bei endbetonten (oxytonen) Wörtern zu Versen mit nur sieben Silben kommen; bei Wörtern, die auf der vorvorletzten Silbe betont sind (Proparoxytona), können auch Verse mit neun Silben entstehen (vgl. 4.3.6). 0 > 131 ten). Beide Phänomene kommen unseren Artikulationsmöglichkeiten und unserer Perzeption entgegen. Die Sprechwerkzeuge sind auf das kontrastreiche Abwechseln zwischen Vokalen und Konsonanten besser eingestellt als auf eine Reihung von Segmenten, die artikulatorisch gesehen nur geringfügig untereinander differieren. Außerdem können wir leichter die starken Kontraste zwischen Vokalen und Konsonanten wahrnehmen als innerhalb eines relativ gleichbleibenden Sonoritätsverlaufs einzelne Vokale oder einzelne Konsonanten abgrenzen (Pompino-Marschall 2009: 237ff.). Auch der Spracherwerb spricht für die wichtige Rolle der Silbe. Er beginnt mit der sog. Lallphase, in der die Kleinkinder durch das ständige Abwechseln von konsonantischer Schließung und vokalischer Öffnung in Silbenfolgen wie [papapa] ihre Artikulationswerkzeuge erproben und langsam für komplexere Artikulationen vorbereiten. Das intuitive Verständnis der Silbe seitens der Laien kontrastiert mit der Tatsache, dass es keine eindeutigen phonetischen Entsprechungen der Silbe im Sinne einer abgeschlossenen Einheit gibt (Ladefoged & Maddieson 1996: 281f.). Silbengrenzen sind weder im akustischen Signal noch in der artikulatorischen Bewegung klar erkennbar, und Assimilationsprozesse zwischen Segmenten wirken über die Silbengrenze hinweg (3.2.1). Es gibt aber zahlreiche Evidenzen dafür, dass die Silbenstruktur ein wichtiger Faktor bei der Lautproduktion und -rezeption der Sprecher ist und deshalb in der phonologischen Theoriebildung und Beschreibung berücksichtigt werden muss. Bspw. ist im Spanischen im akustischen Signal ein deutlicher Unterschied zwischen der Realisierung eines konsonantischen Segments am Anfang und am Ende einer Silbe zu erkennen (NGRAE 2011: 284ff.). Auch sprachgeschichtliche Daten zeigen, dass für Konsonanten die unterschiedlichen Positionen innerhalb der Silbe wichtig sind. Am Silbenanfang, in der Onsetposition, entwickeln sich Konsonanten anders als in der Coda nach dem vokalischen Silbenkern. In der Synchronie sind die unterschiedlichen Silbenpositionen die Basis für die Phonotaktik, d.h. die Regeln, die bestimmen, wo die Segmente stehen können und wie sie miteinander kombiniert werden. Bspw. kann das Phonem / µ/ im Spanischen nie in der Codaposition auftreten, sondern ist auf den Onset (am Wortanfang oder innerhalb eines Wortes) eingeschränkt (z.B. [µa ma] llamar, [ka µe] calle, vgl. 4.2.4.3). Auch wenn wir keine phonetischen Indizien für die Silbe im Sinne einer artikulatorisch und/ oder akustisch abgeschlossenen Einheit finden, so spielt die Silbe dennoch eine wichtige Rolle als Konstruktionsmuster, nach dem wir Laute beim Sprechen verbinden. Wir verketten die Segmente nicht nach den unzähligen Möglichkeiten, die sich rein rechnerisch aus ihrer Zahl ergeben. Stattdessen folgen wir einem silbischen Muster. Erst dieses Muster lässt Segmentfolgen zu einer artikulatorisch und lautlich angemessenen Einheit werden. Zec (2007) nennt deshalb die Silbe “an organizing principle for grouping segments into sequences” (162). 7 4.2.2 Silbenstruktur Die Hinweise auf die Relevanz der Silbe für Artikulation und Perzeption haben gezeigt, dass die Lautklasse der Vokale eine zentrale Rolle spielt, denn sie bestimmen die interne Struktur der Silbe: Jeder Vokal ist automatisch ein Silbenkern (auch: Nukleus, sp. núcleo) und damit der Sonoritätsgipfel der Silbe, also das Segment, das die 7 Zu weiteren Evidenzen für die Existenz der Silbe als Bestandteil des phonologischen Wissens der Sprecher vgl. Blevins (1995) und Hall (2011: 205-211). 132 größte Schallfülle hat. Um diesen vokalischen Gipfel herum gruppieren sich konsonantische Segmente im Vorfeld (Silbenkopf oder Onset, sp. ataque oder inicio) und/ oder Nachfeld (Silbenendrand oder Coda, sp. coda). Nukleus und Coda bilden gemeinsam den Reim (sp. rima). Alle Silbenkonstituenten können einfach oder komplex sein, d.h. potentiell aus einem oder mehreren Segmenten bestehen. Die folgende Tabelle verdeutlicht dies anhand von Beispielen. Silbe (Ú) Onset Reim Nukleus Coda a árabe a árabe a l alto m a s más t e s tres p e rs perspicaz b je n bien b jaj s cambiáis Abb. 4.2-1 Silbenstrukturen des Spanischen (vgl. Hualde 2005: 71). Obligatorischer Silbenbestandteil ist nur der Nukleus, und er allein kann bereits eine Silbe bilden (z.B. [a] in [ a.a.be] árabe). Fakultativ sind dagegen sowohl der Onset als auch die Coda. Silben, die keine Coda aufweisen (a, tú, árabe), nennt man offene Silben (sp. sílabas abiertas/ libres) (V, CV, CCV etc.), Silben mit Konsonanten in der Codaposition (al(to), más, tres) geschlossene Silben (sp. sílabas cerradas/ trabadas) (VC, CVC, CVCC etc.). Silben, die keinen Onset haben (a, al(to), á(rabe)), sind nackt (V, VC etc.), Silben mit Onset (tú, tres, (á)rabe, más, (al)to) bedeckt (CV, CVC, CCV etc.). Die folgende Tabelle fasst diese unterschiedlichen Silbentypen zusammen. offen geschlossen nackt a, á(rabe) al(to) bedeckt tú, (á)ra.be tres, más Abb. 4.2-2 Silbentypen. Wie Abb. 4.2-3 zeigt, lässt sich die Silbe auch als Konstituentenstruktur repräsentieren; wir stellen hier das Wort más in Form eines solchen Silbenstrukturbaums dar. Wir haben bereits gesagt, dass Silbenpositionen einfach oder komplex, d.h. mit nur einem oder mehreren Segment(en) besetzt sein können; im letzteren Fall sagt man auch, dass die betreffende Konstituente verzweigt. In den Beispielen aus Abb. 4.2-1 ist der Nukleus von más (V) einfach bzw. unverzweigt, der aus Gleitlaut (G) und Vokal (V) bestehende von bien (GV) oder (cam)biais (GVG) dagegen komplex bzw. verzweigt. Auch der Onset kann einfach oder komplex sein: So besteht er in der zweiten und dritten Silbe von [ a.a.-e] árabe 8 nur aus den einfachen Konsonanten [] bzw. [-] (V.CV.CV), der Onset von [tes] tres dagegen aus den zwei Konsonanten [t] 8 Die Silbengrenze wird im Bedarfsfall durch einen Punkt markiert. 0 > 133 (CCVC). Silben mit einer einfachen Coda liegen in [ al.to] alto oder [mas] más vor, in denen [l] bzw. [s] Coda-Konsonanten sind (VC.CV bzw. CVC). Eine komplexe Coda findet sich in der ersten Silbe von [pes.pi kas] perspicaz (CVCC.CV.CVC). Wir werden weiter unten sehen, dass im Spanischen maximal zwei Konsonanten im Onset und in der Coda zugelassen sind. In anderen Sprachen, etwa im Deutschen oder Französischen, ist die Zahl der Segmente, die in diesen beiden Positionen auftreten können, höher (dt. Strumpf: CCCVCCC, Herbst: CVCCCC; fr. stress: CCCVC, mixte: CVCCC). Abb. 4.2-3 Silbenstrukturbaum von sp. más. Die Argumente dafür, Nukleus und Coda zum Reim zusammenzufassen, sind i.d.R. auch Nichtlinguisten geläufig. Im Deutschen reimen sich Haus und Maus, im Spanischen ver und placer. Wörter reimen sich also, wenn Nukleus und Coda der betonten Wortsilbe gleich sind. Der Onset der Silben kann dagegen variieren, ohne dass der Reim davon betroffen ist. Ein weiteres Indiz für die engere Zusammengehörigkeit von Nukleus und Coda sind die Kombinationsbeschränkungen, die hier gelten. Im Spanischen können nach komplexen Nuklei (Diphthong oder Triphthong) nur einfache Codas stehen; der Onset unterliegt dagegen keinen derartigen Kombinationsbeschränkungen. Ein komplexer Nukleus kann sowohl auf einen einfachen als auch auf einen komplexen Onset folgen (4.2.4.1). Ein drittes Argument kommt aus der Metrischen Phonologie (4.3.7), die festgestellt hat, dass der Wortakzent in vielen Sprachen durch das Silbengewicht (Unterscheidung leichter und schwerer Silben) geregelt wird, und zwar insofern als der Wortakzent i.d.R. auf schwere Silben fällt (“stress to weight”). Die Bestimmung des Silbengewichts ist einfach: Eine Silbe ist leicht, wenn sie keine Coda und einen unverzweigten Nukleus hat. Schwere Silben haben entweder einen verzweigten Nukleus, im Spanischen also einen Diphthong oder Triphthong, 9 oder einen verzweigten Reim, enthalten also Nukleus und Coda. Dagegen ist der Onset für das Silbengewicht irrelevant: Ob ein einfacher, ein komplexer oder gar kein Onset vorliegt, hat keinen Einfluss auf das Silbengewicht. Abb. 4.2-4 fasst dies zusammen. 9 Wie das Lateinische zeigt, ist eine Silbe auch dann schwer, wenn sie einen Langvokal als Nukleus hat. Die Silbenschwere kann man daraus ableiten, dass der Nukleusvokal sich gewissermaßen selbst verdoppelt. Im Spanischen spielen Langvokale jedoch keine Rolle. Ú (Silbe) O (Onset) R (Reim) N (Nukleus) C (Coda) a V s] C [m C 134 Abb. 4.2-4 Silbenstruktur leichter und schwerer Silben. 4.2.3 Silbenstrukturpräferenzen Die silbische Strukturierung ist durch den artikulatorischen Gegensatz zwischen vokalischer Öffnung und konsonantischem Verschluss und durch den auditiven Kontrast zwischen Sonoritätsmaximum und -minimum bestimmt. Der Nukleus wird von dem Segment besetzt, das den höchsten Öffnungsgrad und die höchste Sonorität aufweist. Die Silbenränder (Onset und Coda), umfassen dagegen Segmente, die geschlossener bzw. weniger sonor sind. Vom Onset bis zum Nukleus ergibt sich deshalb eine Zunahme von Öffnung und Sonorität, umgekehrt nehmen Öffnungsgrad und Sonorität vom Nukleus zur Coda ab. Man kann diesen Sonoritätsverlauf wie folgt darstellen. Abb. 4.2-5 Präferierter Sonoritätsverlauf in der Silbe. Diese präferierte Sonoritätsbewegung kann bestimmte distributionelle Beschränkungen von Segmenten erklären. Bspw. erscheint die Folge / rt/ weder im Spanischen noch im Deutschen im Onset einer Silbe. Im Deutschen ist sie aber als komplexe Coda ohne weiteres denkbar (Hort). Die umgekehrte Reihenfolge der Segmente / tr/ ist sowohl im Spanischen als auch im Deutschen ein geläufiger Onset, aber in beiden Sprachen ist / tr/ als Coda ausgeschlossen. Ausgehend von der Beobachtung, dass der Sonoritätsverlauf am Silbenende gegenläufig (abnehmend) zum Verlauf am Silbenanfang (ansteigend) ist, kann man folgende Regelmäßigkeit formulieren: Der Liquid / r/ muss sonorer als der Plosiv / t/ sein, denn / rt/ passt in die Position mit der abnehmenden, / tr/ dagegen in die mit der ansteigenden Sonorität. Dafür spricht, dass Plosive artikulatorisch gesehen ein Maximum an Verschluss/ Obstruktion haben, Liquide als Sonoranten dagegen näher an der vokalischen Artikulation liegen und in einigen Sprachen sogar silbenbildend sein können (2.5.1.5). Wenn man die vielfältigen Beobachtungen zusammenfasst, die die Reihenfolge und die Kombinationsmöglichkeiten der Segmente zu Silben betreffen, kann man eine Sonoritätshierarchie der Lautklassen erstellen. Diese kann von Sprache zu Sprache verschieden sein; für das Spanische ist folgende Reihung der Lautklassen sinnvoll: Ú O R N C (C) V Ú O R N C (C) C C V Ú O R N C (C) V G leicht schwer schwer Onset Nukleus Coda 0 > 135 7 offene Vokale a 6 mittlere Vokale e o 5 geschlossene Vokale i u 4 Gleitlaute j w 3 Liquide l (µ) r 2 Nasale m n » 1 Obstruenten f () s x ° ¢ b d p t k Abb. 4.2-6 Sonoritätshierarchie der spanischen Lautklassen (mit steigender Sonorität von unten nach oben) (nach Hualde 2005: 72). Die Anordnung der Lautklassen nach ihrem Sonoritätsgrad resultiert aus folgenden Beobachtungen: Zunächst werden die Lautklassen auf einer Stufe eingeordnet, die im Spanischen nicht miteinander in einer Silbenposition kombiniert werden können. Da Kombinationen von Plosiven und Frikativen im Onset ausgeschlossen sind, erhalten beide Lautklassen einen einheitlichen Sonoritätswert. 10 Liquide und Nasale werden unterschiedlich bewertet, denn als zweite Bestandteile von verzweigten Onsets kommen nur Liquide, nicht Nasale, vor (tres). In der Coda ist die Kombination der beiden Lautklassen nur in Entlehnungen möglich (film). Es ist daher sinnvoll, die Liquide mit einem höheren Sonoritätswert einzustufen. Was die Vokale betrifft, könnte man einen einheitlichen Sonoritätswert ansetzen, da jeder Vokal eine eigenständige Silbe bilden kann und seine Kombinationsmöglichkeiten mit den konsonantischen Segmenten unbeschränkt sind. Allerdings verhalten sich die Vokale je nach Öffnungsgrad unterschiedlich, sobald zwei Vokale an Silbengrenzen im Hiatus aufeinander treffen. Derartige Hiate werden im Spanischen häufig durch die Herabstufung eines der Vokale zum Gleitlaut getilgt (4.2.6). Der offene Vokal / a/ bleibt auch bei hiatischem Silbenkontakt immer ein Vollvokal und erhält deshalb den höchsten Sonoritätsgrad. Dagegen werden die geschlossenen Vokale / i/ und / u/ fast immer zu Gleitlauten herabgestuft und erhalten folglich einen niedrigeren Sonoritätsgrad, der für die Gleitlaute [j] und [w] noch einmal herabgestuft wird. Die mittleren Vokale / e/ und / o/ verhalten sich bei der Gleitlautbildung je nach Varietät unterschiedlich und werden deshalb auf einer mittleren Position eingeordnet. Auf diese Weise können wir die obligatorische Stellung der Gleitlaute zwischen Nukleus und Onset bzw. Nukleus und Coda erklären und berücksichtigen, dass sie auch mit den geschlossenen Vokalen in diphthongischen Nuklei kombiniert werden können (viuda, muy). Auch wenn es für die unterschiedliche Sonorität der Lautklassen (ähnlich wie für die Silbengrenzen) keine unmittelbare artikulatorische oder akustische Entsprechung gibt und wir es also mit einer phonologischen Hierarchisierung zu tun haben, kann dieses Konzept sowohl zahlreiche Fälle von diachronem Wandel als auch eine Reihe von synchronen phonologischen Prozessen plausibel erklären. Wenn man die Silbeninventare unterschiedlicher Sprachen analysiert, zeigt sich, dass auch hinsichtlich des Komplexitätsgrades von Silben universelle Tendenzen erkennbar sind. Im Sprachvergleich lässt sich eine deutliche Präferenz für einfache Silbenstrukturen ausmachen. Dies betrifft sowohl die Anzahl der Segmente, die in den einzelnen Silbenpositionen auftreten, als auch die Positionen selbst. In jeder 10 In der Coda gilt diese Beobachtung nur eingeschränkt. Komplexe Codas können auch die Kombination von Plosiv + Frikativ / s/ enthalten (biceps, clubs). Da / s/ aber in silbenphonologischer Hinsicht eine Sonderrolle einnimmt (4.2.4.1), ist es sinnvoll, zwischen der Lautklasse Frikativ und dem Segment / s/ zu unterscheiden. 136 Sprache gibt es den Silbentypus CV, und einige Sprachen erlauben nur diesen; weitaus weniger Sprachen lassen den Typus CCCVCCC zu. Wichtig ist außerdem, dass in einer Sprache, die Silbentypen wie CCCVCCC mit dreifachem Onset und dreifacher Coda erlaubt, auch die CV-Struktur mit einfachem Onset und unverzweigtem Reim möglich sein muss, was umgekehrt nicht gilt. In einem solchen Falle spricht man von einer Implikationshierarchie. Wenn in einer Sprache komplexe Silbenstrukturen vorkommen, impliziert dies, dass auch einfachere Silbenstrukturen möglich sein müssen. Dagegen implizieren einfache Silbenstrukturen nicht, dass auch komplexe Strukturen zulässig sind. Das Komplexe setzt das Einfache voraus, aber nicht umgekehrt. 11 Mit der Präferenz für einfache Silbenstrukturen ist die Präferenz für starke Sonitäritätskontraste verknüpft. Idealerweise folgen konsonantische und vokalische Segmente unmittelbar aufeinander, denn dann ist ein maximaler Kontrast zwischen Sonoritätsminima und -maxima gegeben. Die Präferenz für eine klare Sonoritätsdifferenz gilt auch im Silbenkontakt. Auch hier sollten Vokale und Konsonanten direkt miteinander verknüpft sein und auf diese Weise klare Sonoritätskontraste garantieren. Diese Präferenz führt zu zwei Kandidaten für die ideale Silbenstruktur, denn sowohl CVals auch VC-Silben gewährleisten, dass Vokale und Konsonanten im Silbenkontakt unmittelbar aufeinandertreffen (CV.CV bzw. VC.VC). Sprachtypologische Untersuchungen zeigen aber, dass die CV-Silbe, also eine Silbe mit Onset, aber ohne Coda, präferiert ist. Bevorzugt wird damit eine Silbenstruktur, bei der die maximale Obstruktion bzw. die minimale Sonorität zuerst und die Öffnung bzw. der Sonoritätsanstieg danach kommt. Auch bei der Syllabierung, also bei der Festlegung der Silbengrenzen, gilt diese Maxime. Bei der Syllabierung der Folge VCV wird die Grenze immer vor dem Konsonanten angesetzt (V.CV). 12 Die Regel, dass jede Silbe mit einem Onset beginnen sollte, impliziert, dass die Coda dispräferiert ist: In jeder VCV-Folge wird der Konsonant automatisch in die Position des Onset verschoben (V.CV), und in VC.CV-Sequenzen verringert der Konsonant in der Codaposition den präferierten starken Sonoritätskontrast zwischen Vokal und Onsetkonsonant. Die angeführten Beobachtungen können zu folgenden Silbenstrukturpräferenzen zusammengeführt werden: • Die präferierte Silbe hat a) einen Onset und b) keine Coda. In der präferierten Silbe sind c) alle Konstituenten einfach. • Der präferierte Onset umfasst a) ein Segment. Umfasst der Onset mehrere Segmente, sollte b) die Sonorität vom ersten zu den weiteren Segmenten zunehmen. • Die Coda ist a) dispräferiert. Wenn eine Silbe eine Coda hat, enthält die präferierte Coda b) ein Segment. Umfasst die Coda mehrere Segmente, sollte c) die Sonorität vom ersten zum zweiten Segment abnehmen. Silbentypen, die den Silbenstrukturpräferenzen widersprechen, sind nicht falsch, denn diese sind keine Gesetze; sie geben vielmehr die Rahmenbedingungen für eine Bewertung der Silbenstrukturen ab. Insbesondere in der Optimalitätstheorie (3.5) lässt sich gut zeigen, dass Sprachen unterschiedliche Silbenstrukturen zulassen kön- 11 Auch der kindliche Spracherwerb zeigt die Präferenz für CV-Silben. Wenn die ersten Wörter erworben werden, formen Kleinkinder diese oft so um, dass einfache CV.CV-Folgen entstehen wie z.B. bei Spiegel [pi .be] (vgl. Wiese 2011: 69). 12 Dies gilt uneingeschränkt für wortinterne Silben. Stimmen die Silbengrenzen dagegen mit Morphem- oder Wortgrenzen überein, kommt es zu einem Konflikt zwischen den prosodischen Maximen, die auf gute Silbenstrukturen hinarbeiten, und den lexikalischen Maximen, die die lautliche Identität der sprachlichen Signifikanten sichern sollen (vgl. 4.2.5). 0 > 137 nen, die Auswahl und die Frequenz dieser Strukturen aber nicht zufällig ist, sondern sich an universellen Beschränkungen (engl. constraints) wie den angeführten Silbenstrukturpräferenzen orientiert (Colina 2009). 4.2.4 Silbenstrukturen des Spanischen Im Spanischen ist im Unterschied zum Deutschen die Präferenz für einfache Silbenstrukturen deutlich ausgeprägt. Dennoch sind komplexe Silbenstrukturen zulässig. Die Maximalsilbe umfasst fünf Segmente (transportar, CCVCC; claustro, CCVGC; industrial, CCGVC). Durch Hiatustilgung (4.2.6) können im spontanen Sprechen sogar noch komplexere Silben entstehen (piedra instalada [ pje.®ajns.tala®a] (CCVGCC); NGRAE 2011: 297). Komplexe Silben sind im Spanischen aber in der Minderzahl. Wesentlich häufiger sind Silben, die nur zwei oder drei Segmente umfassen. Mehrheitlich handelt es sich um CV-Silben, also um den Silbentypus, der typologisch gesehen unmarkiert und in allen Sprachen vertreten ist (NGRAE 2011: 294f.). Die starke Präferenz des Spanischen für die CV-Silbe zeigt sich nicht nur in deren hoher Frequenz. Es gibt außerdem eine Reihe von segmentalen und prosodischen Verfahren, die darauf ausgerichtet sind, die CV-Struktur in der Äußerung auch dann zu erzeugen, wenn sie in der lexikalischen Repräsentation der Lexeme nicht angelegt ist. Dazu gehören die Abschwächung s - und Tilgungsprozesse bei Codakonsonanten (4.2.4.2) und die Resyllabierung (4.2.5). Gerade Letztere zeigt den hohen Stellenwert, den die silbenstrukturelle Optimierung im Spanischen einnimmt. Bei der erneuten Festlegung der Silbengrenzen in der Äußerung werden die Maximen, die zu unmarkierten Silbenstrukturen führen, höher eingestuft als diejenigen, die die Konstanz der phonischen Signifikanten und damit die Wiedererkennbarkeit der Lexeme betreffen. Deshalb werden Wortgrenzen bei der Resyllabierung ignoriert und eine Folge wie más adelante als má.sa.de.lan.te syllabiert. Alle drei Silbenpositionen können im Spanischen einfach oder komplex sein. In der Position des Nukleus ist neben den Verbindungen von Gleitlaut und Vokal, den Diphthongen (GV, VG) (bien, vais), auch die Verbindung eines Vokals mit zwei Gleitlauten, ein Triphthong, möglich (GVG). Im Onset und in der Coda können maximal zwei Konsonanten auftreten (pra.do, glo.bo etc., ads.cribir, ins.truc.tor etc.). Komplexe Onsets mit zwei Konsonanten und diphthongischen Nuklei können miteinander kombiniert werden (claustro, CCVGC; industria, CCGV). Nach einem komplexen Nukleus ist dagegen nur die einfache Coda möglich (muerte, CGVC; austral, VGC; vgl. 4.2.4.3). 4.2.4.1 Der Onset Obwohl das Spanische CV-Silben bevorzugt, sind Silben ohne Onset, also nackte Silben, am Wortanfang und wortintern im Hiatus 13 möglich. Der Nukleus einer nackten Silbe kann ein einfacher Vokal, aber auch ein Diphthong sein; Triphthonge sind ausgeschlossen (NGRAE 2011: 293f.). 13 Nach einem Konsonanten sind nackte Silben wortintern dagegen fast ausgeschlossen. Anders als im Deutschen werden im Spanischen bei der Syllabierung Morphemgrenzen nur bedingt beachtet. nos + otros wird daher als no.so.tros mit dem Codakonsonanten im Onset der Folgesilbe syllabiert. In reflektierter Aussprache kann die Morphemgrenze zwar wieder hörbar gemacht werden, aber diese Syllabierung ist im Spanischen hochgradig markiert (Hualde 2005: 73). 138 Abb. 4.2-7 Silben ohne Onset (nackte Silben): amor, real, austral. Silben mit Onset überwiegen allerdings deutlich. Der bevorzugte Onset im Spanischen ist unverzweigt (C). Es gibt keine Kombinationsrestriktionen zwischen Onset und Reim. Daher sind z.B. folgende Silbentypen möglich: Abb. 4.2-8 Silben mit unverzweigtem Onset: tú, perspicaz, bien. Der unverzweigte Onset ist die Silbenposition, in der der Differenzierungsgrad zwischen den verschiedenen konsonantischen Artikulationen am höchsten ist: alle Konsonanten des Spanischen können dort auftreten. Dies gilt ausnahmslos für den Onset wortinterner Silben. Der Wortanlaut ist für das Konsonantphonem / / gesperrt. Zudem ist das Auftreten des palatalen Nasals / »/ im Wortanlaut auf wenige, stilistisch markierte Lexeme und auf Entlehnungen beschränkt. Die folgende Tabelle zeigt Beispiele für unverzweigte Onsets im Wortanlaut und im wortinternen Silbenanlaut: labial dental alveolar palatal velar plos. pe.so co.po tu co.to ca.sa chi.co be.so lla.ve da.ma la.do ga.ma la.go affr. chi.co co.che frik. fi.no so.fá ce.ro ca.za su ca.sa jo.ta o.jo ya po.yo nas. ma.ta ca.ma na.ta ca.na (ñu) ca.ña lat. lo.ro po.lo llo.ro po.llo vibr. ri.co pe.rro pe.ro Abb. 4.2-9 Konsonanten im unverzweigten Onset (Wortanlaut und wortinterner Silbenanlaut). Ú R N a V mo Ú R N a V C l C re Ú R N a V C s C tal w G Ú R N u V R N j G C n C e V O t C Ú R O p C N e V C C s C pi kas Ú O b C 0 > 139 Auch der verzweigte Onset kommt im Spanischen vor; allerdings sind hier mit der Folge Obstruent + Liquid (OL) maximal zwei Segmente möglich. 14 labial alveolar velar Plosiv+Liquid pra.do pla.no tru.co cru.do cla.ve com.pra em.pleo le.tra ma.crote.cla bra.vo blu.sa dro.ga gru.po glo.bo co.bre ha.blar pie.dra ma.gro in.glés Frikativ + Liquid frí.o fla.co ci.fra mu.fla Abb. 4.2-10 OL-Sequenzen in verzweigten Onsets wortanlautender und wortinterner Silben. Wie die Tabelle zeigt, sind nicht alle Obstruenten erlaubt: Nur die Plosive sowie der labiodentale stimmlose Frikativ / f/ können als erster Konsonant auftreten. Alle anderen Frikative sowie die Affrikate / ¢/ sind für komplexe Onsets gesperrt. Die dentalen Plosive können außerdem nicht mit / l/ kombiniert werden. 15 Im Deutschen ist der Komplexitätsgrad verzweigter Onsets wesentlich höher. Silbenanfangsränder mit drei Konsonanten sind möglich und geläufig (Strumpf; Wiese 2011: 73). Außerdem treten neben OL-Sequenzen auch die Kombinationen Frikativ+Plosiv, Plosiv+Nasal und Nasal+Nasal auf (draußen, fleißig, Stelle, Wrack, Knecht, Mnemotechnik etc.). 16 Im Vergleich zu OL liegt bei derartigen Onsets aber ein nicht optimaler Sonoritätsverlauf vor, weil der Kontrast zwischen den beiden Onsetkonsonanten gering ist. Abb. 4.2-11 zeigt die unterschiedliche Sonoritätsbewegung in einer spanischen und einer deutschen Silbe anhand der in Abb. 4.2-6 vorgestellten Sonoritätshierarchie an. t e s k n ç t 1 3 6 1 1 2 6 1 1 Abb. 4.2-11 Sonoritätsbewegung in der spanischen Silbe tres und in der deutschen Silbe Knecht. 17 14 In älteren Sprachzuständen bestand die Tendenz, verzweigte Onsets durch das Einfügen eines Sprossvokals aufzuspalten (CCV > CV.CV). Im mittelalterlichen Spanisch sind z.B. cró.ni.ca (mit verzweigtem Onset) und co.ró.ni.ca (mit zwei einfachen Onsets) als Varianten des heutigen Lexems crónica belegt (NGRAE 2011: 303). Die Tendenz zur Aufspaltung komplexer Onsets scheint zumindest bis zum Anfang des letzten Jahrhunderts weiterbestanden zu haben (Kubarth 2009: 163). 15 Dies gilt zumindest für das europäische Spanisch. Durch den Kontakt mit der mesoamerikanischen Sprache Nahuatl ist z.B. im mexikanischen Spanisch in Lehnwörtern die Folge [tl] im Wortanlaut und im wortinternen Silbenanlaut möglich geworden (NGRAE 2011: 302f.). Zur Syllabierung dieser Konsonantenverbindung vgl. 4.2.5. 16 Im Spanischen repräsentiert die Graphie von Lehnwörtern teilweise noch die komplexen Onsets der Gebersprachen, so in den aus dem Altgriechischen entlehnten psique oder gnomo. Die betreffenden Wörter werden aber lautlich stets mit vereinfachtem Onset, also als [sike] und [nomo], realisiert (NGRAE 2011: 303ff.). 17 Der Einfachheit halber übernehmen wir hier die Sonoritätsgrade der spanischen Sonoritätshierarchie; im Deutschen müssten Plosive und Frikative zwei unterschiedliche Sonoritätsgrade erhalten (vgl. Wiese 2011: 71f.). 140 Der hohe Stellenwert, den Sonoritätskontraste und ein kontinuierlicher Sonoritätsverlauf im Spanischen haben, lässt sich auch daran erkennen, dass die Kombination des Frikativs [s] mit einem weiteren konsonantischen Segment im Onset (sC(C)V) nicht möglich ist. 18 Eine solche tautosyllabische Sequenz (sp. secuencia tautosilábica) ist aber in anderen Sprachen, unter anderem im Lateinischen, erlaubt. Bei der Weiterentwicklung lateinischer Wörter zum Altspanischen tritt zur Optimierung des Sonoritätsverlaufs ein sog. Sprossvokal (sp. vocal protética/ esvarabática) auf, der die Konsonantensequenz im Onset heterosyllabisch (sp. heterosilábico) auf zwei Silben verteilt (Vs.C(C)V), so z.B. in lat. SCHOLA > sp. es.cue.la. Auch heute ist das Einfügen eines prothetischen Vokals noch produktiv. Engl. stress wird zu sp. es.trés, ebenso engl. standard zu sp. es.tán.dar. Bei diesen Wörtern wird das Einfügen des Sprossvokals durch die Schreibung reflektiert; in anderen Fällen manifestiert sich der Sprossvokal nur in der Aussprache, so z.B. in engl. stop [es top] (Hualde 2005: 77). Der Onset kann als eine prinzipiell starke Konsonantenposition eingestuft werden. Dies gilt besonders für den Wortanlaut. Da dieser für die Worterkennung eine zentrale Rolle spielt (2.4.2), sind Konsonanten in dieser Position nicht den Abschwächungsprozessen (sp. debilitamiento) unterworfen, die für Codakonsonanten sowohl in der Synchronie als auch in der Diachronie im Spanischen typisch sind (4.2.4.2). Im Wortanlaut, teilweise auch im wortinternen Silbenanlaut, ist beim (dorso)palatalen Frikativ / °/ sogar die Tendenz zu einem konsonantischen Stärkungsprozess (sp. reforzamiento) festzustellen. / °/ wird im Anlaut zur Palatalaffrikate [«² °], in lateinamerikanischen Varietäten zur postalveolaren Affrikate [ï], im argentinischen Spanisch zu [¯] bzw. [$], verstärkt (yo ‘ich’ [«² °o]~[ïo]~[¯o]~[$o]; vgl. genauer 2.5.1.2). Auch die Tatsache, dass steigende Diphthonge im Wort- oder Silbenanlaut dazu tendieren, den Gleitlaut zu einem Konsonanten weiterzuentwickeln (2.5.3.2), zeigt, dass die Onsetposition die Verstärkung der artikulatorischen Obstruktionsbewegungen bzw. die Minimierung der Sonorität begünstigt. Die Allophonie der stimmhaften Plosive ist allerdings ein Hinweis darauf, dass man noch genauer zwischen den verschiedenen Kontexten unterscheiden muss, in die die betreffende Silbe eingebettet ist. Für den Onset einer Silbe im Phrasenanlaut gilt die Einordnung als starke Konsonantenposition ohne jede Einschränkung. Im Wortanlaut nach Pause, also zu Beginn einer phonologischen Phrase, werden / b d / als Plosive, d.h. mit maximaler Obstruktion, ausgesprochen (¡vamos! [ bamos]). Im phraseninternen Wortanlaut und im wortinternen Silbenanlaut werden sie dagegen als Frikativapproximanten mit einem deutlich geringeren Grad an Obstruktion realisiert (se van [se -an]; vgl. 2.5.1.1). In einigen Varietäten des Spanischen ist der Onset wortinterner Silben nach Vokal (im Falle von -ado/ -ada) durch Tilgungsprozesse (sp. elisión) gefährdet: So werden etwa im karibischen Spanisch, das sich durch eine starke Tendenz zur Konsonantenschwächung auszeichnet (consonantismo débil), Formen wie encantado und pescado mit auslautendem [ao]~[aw] realisiert (NGRAE 2011: 146ff.). 18 Der Konsonant [s] hat eine Sonderstellung in der Sonoritätshierarchie, da er ein lokales Sonoritätsmaximum erzeugt. Eine Folge wie engl. [stðp] hat einen Onset mit einem abnehmenden (! ) Sonoritätsverlauf. Das silbenstrukturelle Verhalten von [s] ist deshalb in mehreren Sprachen abweichend in dem Sinne, dass es in Kombinationen auftritt, die nicht dem ansonsten gültigen Sonoritätsverlauf entsprechen (vgl. Hall 2011: 247f. und Pustka 2011: 114). 0 > 141 4.2.4.2 Die Coda Die im Spanischen häufigste Silbenstruktur ist die (C)CV-Silbe, also die offene Silbe ohne Coda (NGRAE 2011: 296f., Quilis 1992: 62). Bei dieser Präferenz handelt es sich nicht ausschließlich um ein quantitatives Phänomen. Weitere Hinweise auf die starke Bevorzugung offener Silben geben die verbreiteten Abschwächungsbzw. Tilgungsprozesse in der Coda, die eingeschränkte Distribution sowie die Assimilationen der Konsonanten in dieser Position. Die folgende Tabelle gibt jeweils Beispiele für die Konsonanten, die in der einfachen Coda in wortinternen und wortfinalen Silben auftreten können. labial (dental) alveolar palatal velar ap.to ét.ni.co ac.to crep de.fi.cit sánd.wich frac ab.do.men ad.jun.to sig.no / P T K/ club ver.dad grog af.ga.no mez.cla as.no / f () s x/ chef na.riz tres reloj am.bos can.to / N/ al.bum pan al.to / l/ sal car.ta / / mar Abb. 4.2-12 Konsonanten in der unverzweigten Coda wortinterner und wortfinaler Silben. / / und dental sind geklammert, weil der dentale Frikativ in den verbreiteten seseo-Varietäten durch / s/ ersetzt wird. Dieses Inventar zeigt, dass die Distribution der Konsonanten in der einfachen Coda von der im einfachen Onset abweicht; Hualde (2005: 76) spricht hier von einer “clear imbalance”. Im Onset sind alle Konsonanten des Spanischen zugelassen (4.2.4.1); die Codaposition ist dagegen durch eine Reihe von Einschränkungen gekennzeichnet: • Palatale Konsonantphoneme wie / °/ , / »/ und / µ/ sind für die Codaposition gesperrt. Bei den Lateralen kann nur / l/ auftreten. Die palatale (bzw. postalveolare) Affrikate / ¢/ ist zwar in Lehnwörtern in der wortfinalen Coda belegt wie in sándwich oder in katalanischen Eigennamen wie Roig [ro¢] oder Blanch [blan j ¢] 19 ; häufig wird aber durch das Einfügen eines Sprossvokals die Affrikate zum Onset einer zweiten Silbe [ ro¢ e ], sodass / ¢/ als Codakonsonant peripher bleibt. • Nur dentale und alveolare Konsonanten treten regelmäßig in der Codaposition auf, labiale und velare Konsonanten jedoch nur in Lehnwörtern. In der wortinternen Coda treten / s/ , / / , / N/ , / l/ und / / auf. Im Wortauslaut kommt der Plosiv / d/ hinzu, der phonetisch zumeist als Frikativapproximant [®] realisiert 19 Die spanische Aussprache geht auf die falsche Interpretation des Digraphen <ch> zurück, der im Katalanischen für [k] und nicht wie im Spanischen für die Affrikate [¢] steht. 142 oder ganz getilgt wird (2.5.1.1). 20 Schwächung (Aspiration) bis Tilgung ist auch bei Coda-s in zahlreichen Varietäten zu beobachten. Dieses Phänomen ist u.a. für das andalusische und das argentinische Spanisch typisch (vgl. 1.5, 2.5.1.2, 3.1.2.2). • In der Coda sind zahlreiche phonologische Oppositionen neutralisiert. Bei den Plosiven betrifft dies die Opposition stimmlos/ stimmhaft, d.h. es gibt keine Minimalpaare, in denen in der Coda / p t k/ und / b d / kontrastieren. Diese Neutralisierung kann phonologisch mithilfe der Archiphoneme / P T K/ gekennzeichnet werden, z.B. apto / aP.to/ , abdomen / aP. do.meN/ (3.1.1). In der Lautung reichen die Realisierungen vom stimmhaften Frikativapproximanten bis zum stimmlosen Plosiv bzw. bis zur Tilgung (2.5.1.1). • Bei Nasalen ist die Opposition im Artikulationsort neutralisiert. In der wortinternen Coda übernimmt der Nasal den Artikulationsort des folgenden silbeninitialen Konsonanten (2.5.1.3). Da deshalb der Artikulationsort vorhersagbar ist und nicht mehr oppositionsbildend eingesetzt werden kann, lässt sich phonologisch das Archiphonem / N/ ansetzen (/ aN.bos/ [ ambos] ambos, / kaN.to/ [ kanÈto], / aN.¢o/ [ an j ¢o] ancho, / aN.xel/ [ a´xel] ángel). Im Wortauslaut führt die Neutralisierung dazu, dass phrasenfinal oder phrasenintern vor Vokal nur der dentale Nasal / n/ auftritt. 21 • Auch bei Vibranten und Lateralen gibt es in der Codaposition keine phonologischen Oppositionen. Der palatale Lateral / µ/ kann silben- und wortfinal nicht auftreten, und während bei den r-Lauten sowohl Tap als auch Trill vorkommen können, ist der Tap die verbreitete und vergleichsweise unmarkierte Realisierung, weshalb hier die Phoneme / l/ und / / angesetzt werden können (/ al.to/ [ alÈto] alto, / ka.ta/ [ kata]~[ karta] carta). Im andalusischen und karibischen Spanisch geht die Schwächung der artikulatorischen Distinktivität noch weiter. Die Opposition zwischen den Liquiden ist in diesen Varietäten in der Silbenkoda neutralisiert (2.5.1.5). • Bei den Frikativen können hinsichtlich der Stimmhaftigkeit Assimilierungsprozesse an den folgenden Konsonanten auftreten, z.B. asno / as.no/ [ azno] (2.5.1.2). Die Einschränkungen für Konsonanten in der Codaposition und die vielfältigen Schwächungs- und Tilgungsprozesse machen die starke Präferenz des Spanischen für offene Silben deutlich. So treten verzweigte Codas ausschließlich in Lehnwörtern wie z.B. pers.picaz, ads.cribir, cons.tancia etc. auf (NGRAE 2011: 319). In der verzweigten Coda können, wie in Abb. 4.2-13 illustriert, maximal zwei Konsonanten stehen. 22 Bei sorgfältiger, an der Schreibung orientierter Aussprache werden beide Codakonsonanten ausgesprochen; oft werden komplexe Codas jedoch durch Tilgungsprozesse vereinfacht. In der Verbindung Plosiv+/ s/ wird der Plosiv getilgt (/ bi.seps/ 20 Entlehnte Wörter werden manchmal durch das Einfügen eines Vokals an die spanischen Silbenbedingungen angepasst, wodurch Doppelformen wie frac [fak] fraque [fake] entstehen können (vgl. NGRAE 2011: 312ff.). 21 In den Varietäten, in denen der Nasalkonsonant in wortauslautender Position velarisiert wird, erscheint hier [´] (2.5.1.3). 22 Corps und karst sind Ausnahmen und werden nur bei sorgfältiger Aussprache mit drei Konsonanten im Auslaut realisiert. 0 > 143 [ bises] biceps). 23 Die Sequenz Nasal+/ s/ wird durch Nasaltilgung vereinfacht (/ trans/ [tas] trans-). Die Kombinationen [ls], [lf], [s] und [f] sind dagegen relativ stabil, was mit dem klaren Sonoritätskontrast zwischen Frikativ und Liquid erklärt werden kann (NGRAE 2011: 324). labial dental velar bi.ceps ro.bots ex.tra tó.rax Plosive abs.ten.ción clubs ads.cri.bir Frikative post.data test Nasale ins.truc.tor a.fri.kaans Laterale sols.ti.cio vals Vibranten pers.pi.caz surf Abb. 4.2-13 Verzweigte Codas in wortinterner und wortfinaler Position. 4.2.4.3 Der Nukleus Im Spanischen muss der Nukleus einer Silbe immer ein Vokal sein. Dies ist nicht in allen Sprachen der Fall. So können im Deutschen unbetonte Vokale in Auslautsilben dann getilgt werden, wenn ein Sonorant als Silbenkern übrigbleibt, z.B. haben [ hab n] > [ habmÝ]. 24 Im Spanischen muss dagegen jede Silbe einen vokalischen Nukleus enthalten. Der Nukleus kann einfach (V) oder verzweigt sein und einen steigenden (GV) oder fallenden (VG) Diphthong umfassen. Möglich sind auch verzweigte Nuklei mit drei Segmenten (GVG), also triphthongische Nuklei (2.5.3.2). Abb. 4.2-14 Einfache und verzweigte Nuklei: más, bien, buey. Ist der Nukleus verzweigt, kann die Codaposition nur einfach besetzt sein (muer.te, sies.ta vs. trans.cribir). 25 Diese phonotaktische Regularität ist ein weiterer Hinweis darauf, dass Nukleus und Coda eng zusammengehören und in einer übergeordneten Konstituente, dem Reim, zusammengefasst werden können (4.2.2). Bei den triphthongischen Nuklei gilt die zusätzliche Einschränkung, dass danach nur eine einfache Coda mit / s/ als flexivischem Konsonanten möglich ist (cam.biáis, con.ti.nuáis). 23 Plosive werden auch in den Verbindungen Sonorant+Plosiv (folk, record) und / s/ +Plosiv (postdata, test) getilgt; gleiches gilt für die dreikonsonantigen Codas in karst und corps. 24 Silbenbildende Konsonanten werden in der IPA-Transkription mit einem kleinen Strich unter dem betreffenden Konsonantensymbol markiert. In einigen Sprachen, etwa im Tschechischen, können auch Vibranten silbenbildend sein, z.B. prst ‘Finger’. 25 Durch die Hiatustilgung beim spontanen Sprechen ist diese Regel teilweise aufgehoben, vgl. [ pje.®ajns.tala.®a] piedra instalada. R N j G C n C e V Ú R O m C N a V C Ú O b C s C R N w G e V Ú O b C j G 144 4.2.5 Syllabierung und Resyllabierung Unter Syllabierung (sp. silabación oder silabificación) versteht man das Festlegen der Silbengrenzen in einer Folge von Segmenten. Da jeder Vokal automatisch ein Nukleus ist, geht es hierbei um die Verteilung der konsonantischen Segmente auf die einzelnen Silben. Die Syllabierung orientiert sich an den beiden Prinzipien, die wir bereits als maßgebend für die Silbenstruktur angeführt haben: an einem guten Sonoritätsverlauf und an starken Sonoritätskontrasten. Eine Segmentfolge VCV wird daher so syllabiert, dass der Konsonant als Onset der zweiten Silbe zugewiesen wird (V.CV, 4.2.3). Bei einer Folge VCCV ergeben sich zwei Möglichkeiten, weil die Silbengrenze entweder zwischen den beiden Konsonanten oder vor den beiden Konsonanten liegen kann. Welche Möglichkeit gewählt wird, hängt vom Sonoritätsverlauf innerhalb der Konsonantenfolge ab. Die Silbengrenze wird vor dem Konsonanten angesetzt, der die geringste Sonorität hat. Auf diese Weise entsteht ein optimaler Sonoritätsverlauf: alto mit dem Sonoritätsverlauf 7316 (vgl. Abb. 4.2-11) wird al.to (73.16) syllabiert, sodass die abnehmende Sonorität vom Nukleus zum Silbenendrand garantiert bleibt; abrir mit der Konsonantenfolge OL wird dagegen als a.brir (7.1353) syllabiert, sodass beide Konsonanten den verzweigten Onset der zweiten Silbe bilden. Auch bei Folgen von mehr als zwei zwischenvokalischen Konsonanten wird die Silbengrenze nach diesem Prinzip festgelegt, z.B. in mons.truo (2621.1346). Eine Ausnahme bilden die Folgen [dl] und [tl] sowie die Verbindung von [s] oder [z] mit Sonoranten. Obwohl die Plosive [d] und [t] sowie die Frikative [s] und [z] den geringeren Sonoritätsgrad aufweisen, werden sie als Codakonsonanten der vorhergehenden Silbe zugeordnet (ad.lá.te.re, at.las, is.la, as.no). Grund hierfür ist, dass diese Konsonantensequenzen nicht im Wortanlaut auftreten. Zusätzlich zum Sonoritätsverlauf muss bei der Syllabierung also auch beachtet werden, ob die Onsets, die aus der Syllabierung resultieren, geläufige Anlautkombinationen sind. 26 Bisher haben wir die Frage der Syllabierung nur für einzelne Wörter betrachtet. Für das Deutsche ist dies auch ausreichend, da Silbengrenzen hier nur innerhalb von Wörtern gesetzt werden und Wort- und Silbengrenzen miteinander korrelieren: Die isoliert geltenden Syllabierungen werden auch dann beibehalten, wenn diese Wörter zu komplexeren Konstruktionen verknüpft werden und sich im Silbenkontakt neue Silbenstrukturen ergeben könnten, wie z.B. in der Präpositionalphrase mit einem Auto [mıt. aı.n m. a.to]. Markierte Silbenstrukturen wie die beiden nackten Silben [ aı] und [ a] werden in Kauf genommen, um die Wortgrenzen intakt zu halten. 27 Das Spanische wählt die entgegengesetzte Lösung: Die entsprechende Sequenz con un auto wird hier [ko.nu. naw.to] syllabiert; durch die Verschiebung des Codakonsonanten von con in den Onset der ersten Silbe von auto entsteht eine CV-Silbe. Nicht die Bewahrung der Wort- oder Morphemgrenzen ist hier also das primäre Ziel; wichtiger ist es, in der Lautkette gute Silbenstrukturen zu haben. Jede Äußerung wird daher einer erneuten Syllabierung, der sog. Resyllabierung (sp. resilabación), unterworfen, bei 26 Im mexikanischen Spanisch wird [tl] aufgrund des Kontakts zum Nahuatl, wo diese Anlautverbindung geläufig ist, häufig als Onset syllabiert, z.B. a.tlas (NGRAE 2011: 326). 27 Der Glottisverschluss, der jedem vokalisch anlautenden Wort automatisch vorangeht, wird nicht als Phonem des Deutschen gewertet, sondern hat lediglich eine delimitative Funktion, da er die Wortgrenze signalisiert (vgl. Kohler 1995: 100ff.). 0 > 145 der die Prinzipien der Silbenbildung über die Wortgrenzen hinweg zur Anwendung kommen. 28 Im optimalitätstheoretischen Rahmen (3.4) lässt sich der Unterschied zwischen dem Deutschen und dem Spanischen mithilfe der folgenden Constraints modellieren: • O NSET Die Silbe hat einen Onset (Anfangsrand). • A LIGN -L EFT Der linke Rand eines grammatischen Wortes (d.h. einer in der konkreten Rede produzierten Wortform) stimmt mit dem linken Rand einer Silbe überein. Um den Unterschied zwischen dem Deutschen und dem Spanischen zu erfassen, muss man davon ausgehen, dass A LIGN -L EFT im Deutschen in der Beschränkungshierarchie höher steht als im Spanischen. Betrachten wir hierzu die folgenden Tableaus: sp. / koN#uN#auto/ O NSET A LIGN -L EFT (1) [ko.nu. naw.to] ** (2) [kon.un. aw.to] *! ! dt. / mıt#aın m#ato/ A LIGN -L EFT O NSET (1) [mı.taı .n . ma.to] *! ! (2) [mıt. aı .n m. a.to] ** Abb. 4.2-15 OT-Tableau zur (Re-)Syllabierung im Spanischen (oben) und im Deutschen (unten). Im Spanischen verstößt Kandidat (2) [kon.un. aw.to] zweimal gegen den in der Hierarchie hoch stehenden Constraint O NSET und scheidet damit zugunsten von Kandidat (1) [ko.nu. naw.to] aus. Im Deutschen ist der Fall umgekehrt: Hier steht A LIGN -L EFT in der Beschränkungshierarchie höher, weshalb Kandidat (1) [mı. taı.n . ma.to] wegen der zweifachen Verletzung dieses Constraint ausscheidet. Die Optimalitätstheorie bietet die Möglichkeit darzustellen, wie Konflikte zwischen miteinander konkurrierenden Maximen geregelt werden. Ein solcher Fall liegt bei der Resyllabierung vor: Bei der Festlegung von Silbengrenzen steht die Präferenz für gute Silbenstrukturen der Präferenz für ein leichtes Wiedererkennen der Signifikanten in allen Kontexten gegenüber. 4.2.6 Hiate und Silbenkontraktion An der Silbengrenze können auch zwei Vokale miteinander in Kontakt kommen ((C)V.V(C)). Dann spricht man von einem Hiatus (auch: Hiat, sp. hiato). Hiate sind im Spanischen sowohl wortals auch phrasenintern prinzipiell möglich. Bei ihrer lautlicher Realisierung muss man darauf achten, dass anders als im Deutschen die Vokale nicht durch den sog. Knacklaut (Glottisverschluss) voneinander getrennt werden, vgl. ein Auto [ aın a.to]. Die beiden Vokale sind sowohl artikulatorisch als auch 28 Die Resyllabierung erfolgt in den Grenzen der phonologischen Phrase (î) (4.1.1). Da diese i.d.R. einer Sinneinheit entspricht, ist ihr Umfang bei der spontanen Sprachproduktion gut vorhersehbar, sodass sowohl die Vorgängerals auch die Folgesilbe beim Sprechen gleichermaßen präsent sein können. Gleichzeitig trägt das Fehlen der Resyllabierung an den Phrasengrenzen dazu bei, die Abgrenzung der Phrasen lautlich prägnanter zu machen. 146 im Schallereignis durch nahtlose Übergänge miteinander verbunden, so z.B. in real [ real] oder in la hora [la oa]). Der Hiatus ist silbenphonologisch gesehen ein dispräferierter Silbenkontakt. Bevorzugt sind Silbenkontakte mit einem eindeutigen Sonoritätsgefälle zwischen den Segmenten (4.2.3). Wenn zwei Vokale an der Silbengrenze aufeinandertreffen, entsteht aber nur ein geringer artikulatorischer Kontrast und kein bzw. ein minimales Sonoritätsgefälle. Das Spanische hat deshalb eine ausgeprägte Tendenz zur Hiatustilgung (sp. tendencia antihiática, NGRAE 2011: 353ff.). Es gibt eine Reihe von Prozessen, die zur Verschmelzung der Vokale in einem Nukleus und damit zur Silbenkontraktion führen. Diese können sowohl phrasenintern, d.h. an Wortgrenzen wie in ocho horas [ o¢oas], als auch wortintern auftreten (área [ aea]). Mit dem Terminus Synalöphe (sp. sinalefa) bezeichnet man die phraseninterne Hiatustilgung; werden Hiate im Wortinnern getilgt, spricht man von Synärese (sp. sinéresis). Wieviele und welche Hiate getilgt werden, wird durch varietätenlinguistische Faktoren beeinflusst. Hiatustilgungen treten häufig im informellen Alltagssprechen auf; manche sind jedoch diastratisch markiert und sollten deshalb in gepflegter Aussprache vermieden werden (Kubarth 2009: 94-97). Auch phonetische Faktoren nehmen hier Einfluss. So spielt der Grad der Differenz zwischen den Vokalen eine Rolle: Treffen an der Silbengrenze zwei identische Vokale aufeinander, werden sie in aller Regel kontrahiert, d.h. in Sequenzen wie coordinar oder la amiga werden nur bei sehr sorgfältiger Artikulation zwei getrennte Vokale mit dazwischen liegender Silbengrenze realisiert. Die normalerweise erfolgende Vokalkontraktion lässt sich allenfalls in der Dauer erkennen ([ko®i na], [la mi±a], [ la n¢a mesa] la hancha mesa ‘der breite Tisch’), wobei phonologisch gesehen zwei vokalische Nuklei vorliegen (vgl. Hualde 2005: 90f. und NGRAE 2011: 340f.). 29 Treffen unterschiedliche Vokale an den Silbengrenzen aufeinander, ist die Silbenkontraktion durch Vokalverschmelzung ausgeschlossen. Um eine tautosyllabische Artikulation der Vokale möglich zu machen, wird daher einer der Vokale zum Gleitlaut abgeschwächt. Auf diese Weise entstehen komplexe diphthongische, teilweise sogar triphthongischer Nuklei (VV > GV, VG; VVV > GVG). Die Frage, ob eine Hiatustilgung eintritt und welcher der Vokale dabei abgeschwächt wird, hängt vom Wortakzent, dem Sonoritätsgrad der Vokale und deren Reihenfolge ab. Generell gelten folgende Prinzipien (2.5.3.2): • Eine Hiatustilgung tritt fast immer auf, wenn beide Vokale unbetont sind wie in [mje ma.no] mi hermano. • Zum Gleitlaut abgeschwächt wird der Vokal mit dem geringeren Öffnungsgrad bzw. der geringeren Sonorität, vgl. [twa -we.lo] tu abuelo, [law njon] la union. Die geschlossenen Vokale [i] und [u] werden, wenn unbetont, fast immer zu Gleitlauten. In informellen Sprechstilen werden teilweise auch die halb geschlossenen Vokale [e] und [o] bis zu den Halbvokalen [e] und [o] bzw. den Gleitlauten [j] und [w] abgeschwächt, vgl. [sja ka-a] se acaba; [ tja.to] teatro (Hualde 2005: 70). • Bei gleichem Öffnungsgrad wird der erste der Vokale abgeschwächt, vgl. [ esteona menÈto] este ornamento, aber: [ kamaaos kua] cámara oscura. 29 Auch beim Kontakt zweier identischer Konsonanten an einer Silbengrenze (comen nueces) kann eine gelängte Artikulation entstehen (obwohl das Spanische phonologisch gesehen weder gelängte Vokale noch gelängte Konsonanten kennt). Die Längung ist aber nur bei / n/ und / l/ sehr deutlich (Hualde 2005: 97f.). = 147 • Bei auslautendem unbetontem / e/ kann statt Abschwächung zum Halbvokal auch Tilgung erfolgen, z.B. [estindi -i®wo] este individuo. Die Hiatustilgung kann auch zu triphthongischen Nuklei führen. Dies ist aber nur dann möglich, wenn die Folge der Vokale einem ansteigenden, maximalen und dann fallenden Sonoritätsverlauf mit nur einem Sonoritätsgipfel entspricht, z.B. [ aeaes te¢a] area estrecha vor. Dagegen wird in einer Folge wie [ sale jenta] sale y entra nur der zweite Hiatus getilgt, da die Sonorität vom ersten zum zweiten Vokal abfällt. 4.3 Akzent und Akzentphonologie Im diesem Unterkapitel beschäftigen wir uns mit dem spanischen Wortakzent und seinem Verhältnis zur Prominenzgebung im Satz bzw. in der Äußerung. Wir klären zunächst die Trennung zwischen Wortakzent und Satzprominenzen (4.3.2) und die zwischen dem phonologischen Akzent und dessen phonetischer Realisierung (4.3.3). Um die Funktionen des Akzents geht es in 4.3.4. Anschließend erläutern wir die phonologischen Regeln, die die Position des Wortakzents im Spanischen bestimmen (4.3.5), und behandeln die Frage, wie der Wortakzent graphisch wiedergegeben wird (4.3.6). In den letzten beiden Abschnitten gehen wir auf die Metrische Phonologie ein, die einen einheitlichen Beschreibungsrahmen für die Akzentuierung auf Wort- und Satzebene vorschlägt (4.3.7). Dieser ist bei der Beschreibung von Nebenakzenten und Akzentverschiebungen wichtig (4.3.8). 4.3.1 Was heißt Akzent? Das Wort Akzent ist polysem. Bevor wir beginnen, mit diesem Begriff zu arbeiten, müssen wir daher klären, auf welche der Bedeutungen dieses auch alltagssprachlich verwendeten Worts wir uns beziehen werden. Eine der Verwendungen können wir ausschließen: Wir werden uns nicht auf die Ausspracheeigenheiten beziehen, die Fremdsprachenlerner fälschlich von ihrer Muttersprache auf die Zielsprache übertragen und die dann als Akzent bezeichnet werden (vgl. aber 4.4.3). Eine weitere Bedeutung zeigt sich in der Bezeichnung graphischer Diakritika wie dem Akut <á> oder dem Gravis <à> als (graphische) Akzente. Auch in der spanischen Orthographie wird eines dieser diakritischen Zeichen verwendet, nämlich der Akut <á> (sp. acento ortográfico oder tilde). Dieser wird zur graphischen Repräsentation der Wortbetonung eingesetzt, wie z.B. in <entonación> ‘Intonation’; <esdrújula> ‘drittletztbetont’. 30 Wir werden später noch genauer auf die Regeln eingehen, nach denen die Wortbetonung im Spanischen graphisch markiert wird (4.3.6). Im Zentrum dieses Kapitels steht aber der Akzent im Sinne der Betonung als lautliches, d.h. phonologisches und phonetisches Phänomen. Als Akzent bezeichnet man in der Phonologie und Phonetik die lautliche Hervorhebung (Prominenz, sp. prominencia) einer prosodischen Einheit gegenüber den benachbarten. 30 Im Französischen werden diese graphischen Diakritika dagegen zur Angabe der Vokalqualität genutzt (<père> ‘Vater’ [] vs. <épée> ‘Schwert’ [e]). 148 Der Akzent ist ein relationales Phänomen: Eine betonte Silbe wird nur durch den Kontrast zu den unbetonten oder schwächer betonten Silben in der unmittelbaren Nachbarschaft erkennbar. Weiterhin ist der Akzent kein binäres, sondern ein graduelles Phänomen; man unterscheidet normalerweise drei Betonungsgrade. Neben den unbetonten Silben gibt es den Hauptakzent und den schwächeren Nebenakzent. In der IPA-Umschrift wird ersterer durch einen hochgestellten, letzterer durch einen tiefgestellten geraden Strich vor der betonten Silbe angezeigt: [mai neo] marinero ‘Matrose’. 4.3.2 Wortakzent und Satzprominenzen In einigen neueren phonologischen Ansätzen wird das Prinzip des unterschiedlichen Prominenzgrades benachbarter prosodischer Einheiten gleichermaßen auf alle Ebenen der prosodischen Hierarchie übertragen (4.1.1). Diese Ansätze behandeln dann das Wort, die phonologische Phrase und die Äußerung bzw. die Intonationsphrase als Domänen der Akzentzuweisung gleich (4.3.7). Wir schließen uns dieser Auffassung nicht an, sondern beschränken unsere Überlegungen auf das Phänomen des Wortakzentes, denn es gibt deutliche sachliche Unterschiede zwischen der Prominenz von Silben innerhalb von Wörtern oder Füßen und der Prominenz von Konstituenten in der Äußerung, sodass eine Trennung der beiden Untersuchungsgegenstände angebracht erscheint (vgl. Hualde 2006). Auf den oberen Ebenen der prosodischen Hierarchie (phonologische Phrase oder Intermediärphrase, Intonationsphrase) wird die Prominenzgebung von semantischen und pragmatischen Gesichtspunkten, also von inhaltlichen Faktoren, bestimmt. Ob ein Wort als Konstituente einer Phrase bzw. einer Äußerung betont wird und welche Art der Betonung der Sprecher dafür wählt, hängt mit seinem Stellenwert in der Informationsstruktur bzw. mit seinem Fokussierungsgrad zusammen. Die Prominenzgebung ist folglich von der kommunikativen Funktion der jeweiligen Konstituente innerhalb der kontextuell determinierten Äußerung bestimmt. Dagegen wird die Frage, welche der Silben eines Worts den Hauptton tragen kann, nicht durch inhaltliche, sondern durch formale Faktoren determiniert. Die feste Position des Wortakzents ermöglicht uns das Erkennen der Wortsignifikanten im Lautstrom. Ausschließlich signifikantenbezogen ist auch die rhythmische Funktion der Akzentuierung, das Abwechseln starker und schwacher Silben zur Optimierung der Artikulation und Perzeption von Lautsprache. Innerhalb des Worts bzw. innerhalb der Fußstrukturen ist die Prominenzzuweisung also formal, auf der Phrasen- und Äußerungsebene dagegen semantisch-pragmatisch motiviert. Aufgrund dieser unterschiedlichen Funktion werden wir Wortakzent und Satzprominenzen getrennt behandeln. Im Folgenden konzentrieren wir uns auf den Wortakzent als Bestandteil unseres lexikalischen Wissens. In 4.5 werden wir Satzprominenzen und ihr Zusammenspiel mit den Wortakzenten genauer behandeln. 4.3.3 Wortakzent: phonologisch und phonetisch Eine weitere wichtige Unterscheidung ist die zwischen der phonologischen und der phonetischen Dimension des Akzents. Wenn man untersucht, welche der möglichen Konstituenten in einer prosodischen Einheit regelhaft den Akzent erhalten kann, geht es um die virtuelle Akzentposition, also um die phonologische Positionierung des Akzents in prosodischen Einheiten, die noch nicht pragmatisch eingebettet sind (Ak- = 149 zentpositionierung). Wenn man dagegen die lautsprachlichen Phänomene meint, mit denen die Betonung der betreffenden Konstituente in einer Äußerung erreicht wird, interessiert man sich für die Realisierung des Akzents, also für dessen phonetische Korrelate (Akzentrealisierung). Die Unterscheidung zwischen der phonologischen Frage der Akzentpositionierung und der phonetischen der Akzentrealisierung ist wichtig, weil die phonetische Realisierung des Wortakzents davon abhängt, an welcher Stelle das betreffende lexikalische Wort in der Äußerung auftritt. Ist es bspw. Bestandteil der syntaktischen Konstituente, die den neutralen Satzfokus bildet, so ist seine akzentuierte Silbe der Ankerpunkt für die F 0 -Bewegung des Nuklearakzents (4.5.5). Steht es dagegen in einer defokalisierten Konstituente kann seine Akzentsilbe in tonaler Hinsicht unrealisiert bleiben, sich aber dennoch durch Dauer- oder Intensitätssteigerung von den anderen unbetonten Wortsilben unterscheiden. Kontextfrei lässt sich nur die Akzentposition, nicht aber die konkrete Akzentrealisierung bestimmen. Diese ergibt sich erst aus dem Zusammenspiel zwischen Wortakzentpositionen und Intonationsstruktur der Äußerung. Man darf sich nicht davon täuschen lassen, dass wir Wörter isolieren und in metasprachlicher Absicht zitieren können, denn auch in diesem Fall weisen wir ihnen in der betreffenden Äußerung eine bestimmte Funktion und damit eine bestimmte intonatorische Kontur zu. Eine solche isoliert geäußerte Nennform ist deshalb eine ganz spezifische Verwendung eines Lexems. Aus ihr kann nicht auf die Realisierung des Wortakzents in anderen syntaktischen, semantischen und pragmatischen Kontexten geschlossen werden (Kim 2011). Die Trennung zwischen dem virtuellen Wortakzent und den Realisierungstypen ist für die Bestimmung der phonetischen Korrelate des Wortakzents wichtig. Lange Zeit war man sich darüber uneinig, ob der spanische Wortakzent eher tonal oder quantitativ ist, ob er also eher über Bewegungen der Grundfrequenz (F 0 , sp. frecuencia fundamental) oder über die längere Dauer (sp. duración) der vokalischen Nuklei signalisiert wird. 31 Diese Frage kann nicht eindeutig beantwortet werden, denn in einigen Fällen tragen beide prosodischen Variationsdimensionen zur Signalisierung der prominenten Silbe bei, in anderen Fällen dagegen nur eine. In isolierten Zitierformen dominiert bspw. die Veränderung von F 0 in Gestalt einer deutlichen Bewegung nach oben (Kubarth 2009: 188f.). Auch bei der kontrastiven Hervorhebung eines Worts wird die akzentuierte Silbe mit einer steigenden oder steigend-fallenden F 0 -Bewegung markiert (vgl. genauer 4.5.5). In den Positionen am Ende der Intermediärbzw. der Intonationsphrase sowie in defokalisierten Kontexten mit flachen Intonationsverläufen wird die Wortakzentsilbe dagegen fast ausschließlich durch Längung markiert (Hualde 2005: 242-245, Ortega-Llebaria & Prieto 2009). Noch zwei weitere phonetische Korrelate des Wortakzents müssen in Betracht gezogen werden. Dies sind die Intensität bzw. Lautstärke (sp. intensidad) und der Artikulationsaufwand (sp. energía articulatoria). Die Intensität ist schwer zu messen, und die Vorstellung, betonte Silben würden mit größeren Amplituden und damit mit größerer Lautstärke geäußert, ist im Einzelfall nur bedingt nachzuweisen (Kim 2011, Kubarth 2009: 215-216). Perzeptionsexperimente haben aber gezeigt, dass dann, 31 Die entsprechende Diskussion referieren Quilis (1981: 319-332), D’Introno et al. (1995: 125-129), Hidalgo & Quilis (2004: 222-225) und Kubarth (2009: 188). Im Spanischen ist der Kontrast zwischen normalen Silben und den Silben, die unter dem Akzent gelängt sind, deutlich geringer als etwa im Italienischen oder Französischen (vgl. 4.4.1). 150 wenn tonale Hinweise auf die Wortakzentsilbe fehlen, auch die Intensitätssteigerung als Betonungsstrategie eingesetzt werden kann (Ortega-Llebaria & Prieto 2009). Auch ein größerer artikulatorischer Aufwand kann betonte Wortsilben kennzeichnen. Die Segmente der betonten Silbe werden deutlicher artikuliert, d.h. die mit den Segmenten verbundenen Konfigurationen des Ansatzrohrs werden vollständig ausgeführt und stärker voneinander getrennt. Akustisch lässt sich diese deutlichere Artikulation an der klareren spektralen Trennung zwischen den einzelnen Vokalbzw. Konsonantenphonemen ablesen. 32 Die Möglichkeit, die Artikulation zur Differenzierung zwischen betonten und unbetonten Silben zu nutzen, wird vor allem in sog. akzentzählenden Sprachen wie dem Englischen oder dem Deutschen genutzt (vgl. 4.4.1). In diesen Sprachen treten Vollvokale prinzipiell nur in betonten Silben auf, während unbetonte Silben durch Reduktionsvokale bzw. ein reduziertes vokalisches Inventar gekennzeichnet sind. Im Spanischen als silbenzählender Sprache sind dagegen auch in unbetonten Silben die Artikulationsintensität und die Distinktivität der Segmente hoch. 33 Phonetische Untersuchungen haben aber gezeigt, dass auch im Spanischen in betonten Silben eine Steigerung der Artikulationsgenauigkeit zu beobachten ist. Im Unterschied zur Kennzeichnung der Betonung durch Tonhöhenbewegungen oder durch Längung scheint die artikulatorische Ungleichbehandlung betonter und unbetonter Silben sogar unabhängig von der Position bzw. vom Fokussierungsgrad des betreffenden Worts zu sein (Kim 2011). Die akzenttragende Silbe kann im Spanischen durch F 0 -Bewegung, durch längere Dauer, durch höhere Intensität und/ oder durch größere Artikulationsgenauigkeit von den umgebenden unbetonten Silben abgehoben werden. Die genannten prosodischen Dimensionen tragen in unterschiedlichem Maße zur Hervorhebung der Akzentsilbe bei, wobei v.a. F 0 und Dauer relevant zu sein scheinen. Auf welche prosodischen Variationsmöglichkeiten zurückgegriffen wird, hängt davon ab, welche informationsstrukturelle, pragmatische und stilistische Funktion das Wort in der Äußerung hat. 4.3.4 Die Funktionen des Akzents Es ist vermutlich eine prosodische Universalie, dass betonte und unbetonte Silben miteinander alternieren. Ebenso wie sich Sonoritätsmaxima (vokalische Nuklei) und -minima (konsonantische Silbenränder) abwechseln und auf diese Weise eine Silben- 32 Vgl. Hidalgo & Quilis (2004: 221), die von einer “mayor energía articulatoria, mayor abertura en las vocales, mayor tensión y mayor cierre de los órganos articulatorios en las consonantes que rodean al núcleo silábico, mayor sonoridad y mayor perceptibilidad” sprechen. 33 Hualde (2005: 240) vergleicht die Sonagramme je einer Realisierung des spanischen Worts hipopótamo [ipo potamo] und der engl. Entsprechung hippopotamus [hp pôª m s] (nordamerikanischer Sprecher). Die englische Äußerung zeigt deutlich die akustischen Konsequenzen der nicht vollständig ausgeführten artikulatorischen Bewegungen in den unbetonten Silben im Gegensatz zu der artikulatorischen Intensität, mit der dieselben Segmente / p/ und / o/ in der betonten Silbe geäußert werden. Dagegen sind die akustischen Korrelate von / p/ und / o/ in der spanischen Äußerung in der unbetonten und der betonten Silbe nahezu identisch. = 151 struktur schaffen, die sowohl an die Artikulation als auch an die Perzeption optimal angepasst ist (4.2.1), kann man davon ausgehen, dass auch das Abwechseln prominenter mit nicht prominenten Silben unseren artikulatorischen und auditiven Möglichkeiten besser entspricht, als wenn Silben von gleichem Stärkegrad aneinandergereiht würden. Aus dieser Beobachtung leitet man die rhythmische Funktion des Akzents ab (Hayes 1995): Der Wechsel zwischen starken und schwachen Silben hat die Aufgabe, in lautlichen Äußerungen Kontraste zu schaffen, die diese gliedern und besser produzier- und wahrnehmbar machen. Einige Ansätze gehen sogar so weit zu sagen, dass es eine anthropologische Konstante ist, Äußerung eurhythmisch zu gliedern, also auf die regelmäßige Wiederkehr gleicher Abfolgen von starken und schwachen Silben zu achten. Diese Auffassung vertritt bspw. die Metrische Phonologie (4.3.7). Mit dem relationalen Charakter des Akzents, der sich erst im Nebeneinander von starken und schwachen Einheiten realisieren kann, ist außerdem seine kulminative Funktion verbunden. Bereits Trubetzkoy (1989: 180, 185ff.) hat darauf aufmerksam gemacht, dass die gipfelbildende starke Silbe die schwachen Silben um sich herum gruppiert. Diese sind entweder vortonig und führen damit auf den Prominenzgipfel hin oder nachtonig, d.h. vom Prominenzgipfel wegführend. So wird durch jede prominente Silbe eine Akzentdomäne abgegrenzt (Hulst 1999: 5). Die nächsten beiden Funktionen des Akzents sind komplementär zu denken und hängen mit den Regeln der Positionierung der akzentuierten Silbe zusammen. Eine delimitative Funktion hat der Akzent dann, wenn er immer dieselbe Position im Verhältnis zum Anfang oder Ende der Akzentdomäne einnimmt. So wird etwa im Polnischen regelhaft die vorletzte, im Tschechischen dagegen die erste Wortsilbe akzentuiert (Dogil et al. 1999). Aus der Position des Akzents kann der Hörer in diesen Sprachen daher unmittelbar auf das Wortende bzw. den Wortanfang schließen. Eine solche delimitative Funktion hat der Akzent aber nur, wenn seine Position innerhalb der Akzentdomäne nach einfachen positionsbezogenen Regeln vorhersagbar ist. 34 In vielen Sprachen - und auch im Spanischen - ist die Position des Akzents aber nicht ausschließlich durch die Silbenzahl bestimmt. Da die Akzentverteilung auch nicht vollständig von anderen Faktoren, etwa vom Silbengewicht, determiniert wird, hat das Spanische einen sog. freien Akzent. Der Akzent hat deshalb eine distinktive Funktion. Im Spanischen können Wörter, die die gleichen Phoneme in der gleichen Reihenfolge aufweisen, allein durch die Position der prominenten Silbe unterschieden werden. Dies ist etwa bei número ‘Nummer’ und numero ‘ich zähle’ der Fall. 35 Diese bedeutungsunterscheidende Funktion des freien Akzents wird im Spanischen im Bereich der Verbflexion systematisch eingesetzt: Der Unterschied in Person und Tempus zwischen numero ‘ich zähle’ und numeró ‘er zählte’ wird lautlich allein durch die Akzentuierung signalisiert (4.3.5.4). Die bisher angeführten Funktionen sind ausschließlich auf die Formseite der Sprache bezogen (Eurhythmie, Distinktivität der lautlichen Signifikanten etc.) und betreffen die Prominenz von Silben innerhalb von Einheiten, die in der prosodischen Hierarchie am unteren Ende der Skala stehen (Fuß, Wort). Inhaltlich begründet ist 34 Dies ist z.B. auch im Französischen der Fall. Allerdings ist hier nicht das einzelne Wort, sondern die phonologische Phrase die Domäne der Akzentzuweisung. Es wird deshalb nur die letzte Silbe einer phonologischen Phrase betont vorausgesetzt, sie hat einen Vollvokal als Nukleus (vgl. Meisenburg & Selig 1998: 148-160, Pustka 2011: 130-136). 35 Im Folgenden markieren wir die betonte Silbe durch Fettdruck in der zitierten Form. 152 dagegen die Fokussierung von Wörtern durch eine von der normalen Realisierung abweichende, besondere Betonung. Die Domäne eines solchen acento enfático o de insistencia (Quilis 2005: 75) ist die Äußerung; als semantisch-pragmatisches Phänomen hat er die Funktion, eine Konstituente kontrastiv hervorzuheben. Wir werden deshalb in 4.5.5 genauer auf diesen Typus von Prominenzgebung eingehen. 4.3.5 Der Wortakzent des Spanischen Über den Wortakzent im Spanischen ist viel nachgedacht worden (Harris 1995: 867). Ein Grund dafür ist, dass die spanische Orthographie bereits seit mehreren Jahrhunderten den Wortakzent in bestimmten Fällen mit dem Akut markiert (4.3.6). Die deskriptiven Grammatiken des Spanischen mussten sich daher im Rahmen orthographischer Überlegungen immer wieder mit den Regeln der Wortakzentsetzung befassen. Ein zweiter Grund dürfte sein, dass der Wortakzent im Spanischen Regularitäten folgt, die vom phonologischen Standpunkt her komplex und damit interessant sind. Es stellt sich nämlich die Frage, ob hinter der Verteilung der Akzentsilben ein bestimmtes phonologisches Regelwissen steht oder ob die Position des Wortakzents so wie die Phonemfolge der lautlichen Signifikanten zum idiosynkratischen Bestandteil unseres sprachlichen Wissens gehört. Zu fragen ist also, ob wir spanische Wörter korrekt betonen können, weil wir Regeln beachten oder weil wir die korrekte Betonung mit jedem einzelnen Wort gelernt haben. 4.3.5.1 Palabras tónicas und palabras átonas Als erste Frage muss im Zusammenhang mit dem spanischen Wortakzent geklärt werden, welche Wörter betonbar sind und welche nicht (NGRAE 2011: 370ff.). Diese beiden Gruppen werden als palabras tónicas (betonbar) und palabras átonas (nicht betonbar) unterschieden. Da das Spanische beide Worttypen kennt, kann die Akzentdomäne, die durch einen Wortakzent abgegrenzt wird, folglich über das einzelne Wort hinausgehen. Wenn außer der palabra tónica auch palabras átonas wie Artikel oder Objektpronomina zu dem betreffenden Syntagma gehören, grenzt der Wortakzent aufgrund seiner kulminativen Funktion eine Klitische Gruppe ab (4.3.4). Die Unterscheidung zwischen palabras tónicas und átonas ist eine phonologische, denn in der konkreten Äußerung können abweichende Akzentuierungen auftreten. Es gibt bspw. Kontexte, in denen palabras tónicas regelmäßig ohne Wortakzent realisiert werden: So sind in Anredesyntagmen vorangestellte Titel wie señor i.d.R. deakzentuiert, und nur das zweite Element, der Name, erhält einen Akzent (NGRAE 2011: 373- 375). 36 Umgekehrt können die palabras átonas etwa im Falle eines Kontrastfokus eine Akzentuierung erhalten. 37 Die Trennung von palabras tónicas und átonas kann mit der Unterscheidung zwischen Inhalts- oder lexikalischen Wörtern (sp. palabras léxicas; Substantive, Adjek- 36 Dass es sich um einen deakzentuierenden Kontext handelt, erkennt man daran, dass sich in diesen Anredesyntagmen Schwundformen (señor > so) oder Kurzformen wie don entwickelt haben (don ist eine Weiterentwicklung lat. DOMINUS , das in betonter Entwicklung dueño ergibt, vgl. NGRAE 2011: 374). 37 Definite Artikel sind normalerweise nicht betonbar, können aber in einer Äußerung wie he dicho ‘LA capital’, no ‘el capital’ metasprachlichen Kontrastfokus erhalten. Allerdings bemerkt Hualde (2005: 233), dass auch in solchen Fällen die Akzentuierung der Klitika selten auftritt und der Kontrast eher mit anderen sprachlichen Mitteln ausgedrückt wird. = 153 tive, Adverbien, Verben) und Funktions- oder grammatischen Wörtern (sp. palabras gramaticales; Determinanten, Pronomina, Präpositionen, Konjunktionen) in Verbindung gebracht werden (NGRAE 2011: 371). Inhaltswörter haben einen eigenen Wortakzent, während Funktionswörter in die Akzentdomäne des syntaktisch und inhaltlich zugeordneten lexikalischen Wortes eingegliedert werden. Dazu passt die Beobachtung, dass zahlreiche Funktionswörter im Spanischen nicht isoliert verwendet werden können, sondern immer zusammen mit einem anderen akzentuierbaren Wort auftreten. Bei den Nominaldeterminanten und den Objektpronomina spricht man von Klitika, d.h. von Formen, die nicht akzentogen/ betonbar sind und die nicht isoliert vorkommen, sondern immer zusammen mit einem lexikalischen ‘Wirt’ auftreten (Gabriel & Meisenburg 2007: 159f.). Bei den Klitika sind die Verhältnisse im Spanischen komplex. In einem Nominal- oder Verbalsyntagma werden Determinanten und Objektpronomina normalerweise nicht betont; einen Akzent erhält nur das lexikalische Wort, also das Substantiv wie in el amigo / un amigo 38 bzw. das Verb wie in lo veo. Es gibt jedoch pragmatische Bedingungen, unter denen Determinanten bzw. Pronomina akzentuiert werden müssen. Bei den Nominaldeterminanten ist dies etwa bei der kontrastiven Fokussierung der Fall. Während beim indefiniten Artikel eine solche Akzentuierung ohne weiteres vorgenommen werden kann, ist sie beim definiten Artikel und bei den Objektpronomina nicht möglich. Man muss in solchen Fällen auf einen betonbaren Demonstrativdeterminanten oder ein betonbares Objektpronomen ausweichen: el amigo Ù este amigo, lo veo Ù lo veo a él. Deshalb gibt es bei bestimmten Nominaldeterminanten bzw. Objektpronomina zwei parallele Paradigmen, eine erste Reihe von Formen, die nicht betont werden können, und eine zweite Reihe von Formen, die in betonten Positionen auftreten. Als Beispiel seien hier die unbetonten und betonten Objektpronomina angeführt. unbetonte Personalpronomina betonte Personalpronomina me nos (a) mí (a) nosotros, -as te (os) (os) (a) ti/ vos (a) usted (a) vosotros, -as / (a) ustedes lo, la los, las (a) él, (a) ella (a) ellos, (a) ellas le les (a) él, (a) ella (a) ellos, (a) ellas se (a) sí (mismo) etc. Abb. 4.3-1 Unbetonte und betonte Objektpronomina des Spanischen. Auch bei den Possessiva ist eine solche Doppelung von unbetonten und betonten Formen zu beobachten (unbetontes vorangestelltes mi, tu etc.; betontes nachgestelltes mío, tuyo etc.). Die Subjektpronomina (yo, tú/ vos, él etc.) sind im Spanischen dagegen immer betont, da in allen pragmatisch unmarkierten Kontexten die flektierten Verbformen zur Subjektkennzeichnung ausreichen. Die Objektpronomina schließen sich proklitisch, d.h. vorangestellt (te lo digo), der enklitisch, d.h. nachgestellt (dígamelo), an die Verbform an. In diesen klitischen Gruppen verändern die unbetonbaren Klitika die Position des Wortakzents nicht. So 38 Die NGRAE (2011: 410f.), Hidalgo & Quilis (2004: 232), Hualde (2005: 234) und Quilis (1981: 315) gehen davon aus, dass der indefinite Artikel im Unterschied zum definiten auch in den unmarkierten Verwendungen zusätzlich zum Substantiv akzentuiert ist. o 154 können bei den enklitischen Pronomina in Formen wie dígamelo oder contándoselo auf die Akzentsilbe mehr als zwei unbetonte Silben folgen, doch die Regel des Drei- Silben-Fensters (4.3.5.2) wird nicht verletzt, da die unbetonbaren klitischen Pronomina bei der Akzentzuweisung nicht berücksichtigt werden; die Regel ist sozusagen ‘blind gegenüber den Klitika (vgl. aber 4.3.8). 4.3.5.2 Das Drei-Silben-Fenster Eine Regel zur die Bestimmung des Wortakzents gilt im Spanischen ausnahmslos: Er fällt immer auf eine der letzten drei Silben eines Worts. Innerhalb dieses Drei-Silben- Fensters (sp. ventana de la tres sílabas) kann die Akzentposition allerdings wechseln. Somit gibt es drei Typen von Wortbetonung, nämlich Wörter mit dem Akzent • auf der vorletzten Silbe, der Pänultima ((x)xõx), also mit paroxytoner Betonung, • auf der letzten Silbe, der Ultima ((x)xxõ), also mit oxytoner Betonung, • auf der vorvorletzten Silbe, der Antepänultima ((x)xõxx), also mit proparoxytoner Betonung. 39 Die Wortakzentmuster treten mit unterschiedlicher Frequenz auf: Nach den Auswertungen von Quilis (1981: 333ff.) kommen im gesprochenen Spanisch Wörter mit Betonung auf der vorletzten Silbe, sog. palabras llanas, am häufigsten vor (79,50%); danach folgen endbetonte Wörter, sog. palabras agudas (17,68%), schließlich Wörter mit Betonung auf der vorvorletzten Silbe, sog. palabras esdrújulas (2,76%). Die folgende Tabelle illustriert die unterschiedlichen Akzentpositionen: palabras … llanas … agudas … esdrújulas Substantive mesa orden señora rigor canción dominó obstáculo helicóptero régimen Adjektive triste móvil feliz francés múltiple excéntrico Adverbien adelante allí máxime Verbformen hablo hablé hablábamos Abb. 4.3-2 Akzentmuster des Spanischen. Die Tabelle könnte den Eindruck vermitteln, die Akzentposition innerhalb des Drei- Silben-Fensters könne frei gewählt werden und es sei eine Sache des Zufalls, welches Akzentmuster bei einem Wort jeweils vorliegt. Für eine solche Auffassung spricht, dass es im Spanischen im Rahmen des Drei-Silben-Fensters einen freien Akzent mit distinktiver Funktion gibt (hablo vs. habló etc.; 4.3.4). Doch die Akzentposition ist nicht völlig beliebig. Je nach Wortart lassen sich eine Reihe von Faktoren erkennen, die die Position des Akzents beeinflussen: 40 Bei den Nomina sind es phonologische 39 Es gibt zwei Terminologien, die bei der Beschreibung der Akzentregeln in der Phonologie verwendet werden. Die Akzentposition wird entweder mit Adjektiven bezeichnet, die auf das Altgriechische zurückgehen (oxyton, paroxyton, proparoxyton), oder mit Bezeichnungen, die aus dem Lateinischen stammen (Ultima, Pänultima, Antepänultima). Wir werden im Folgenden v.a. die aus dem Lateinischen stammende Terminologie verwenden. 40 Man kann daher nur bedingt von einem freien Akzent im Spanischen sprechen (Hulst 1999: 16f.). Für Kager (1995: 368) haben Sprachen wie das Spanische ein “bounded system”, da die Akzentposition aufgrund des Drei-Silben-Fensters bereits fest geregelt ist. = 155 Faktoren, nämlich Silbenstruktur und Silbengewicht, aus denen Regularitäten für die Akzentposition abgeleitet werden können (4.3.4.3). Die Akzentpositionierung bei den Verbformen wird dagegen durch morphologische Faktoren bestimmt, nämlich dadurch, dass die einzelnen Flexionsparadigmen fest mit bestimmten Akzentverteilungsmustern verknüpft sind, die für alle Verben gelten (4.3.4.4). 4.3.5.3 Der Wortakzent bei spanischen Nomina Anders als bei Verben spielen bei Nomina (Substantiven und Adjektiven) morphologische Faktoren bei der Bestimmung der akzenttragenden Silbe keine Rolle. Die flexivische Pluralmarkierung, also das Suffix -s bzw. -es, wird bei der Akzentzuweisung nicht berücksichtigt. 41 Die Akzentsilbe ist in der Singular- und in der Pluralform dieselbe. Singular mesa ciudad título móvil Plural mesas ciudades títulos móviles Abb. 4.3-3 Akzentuierung der Singular- und Pluralformen von Nomina. Die Akzentzuweisung orientiert sich hier also an der Einheit des Lexems. 42 Wir können bei den folgenden Überlegungen zur Akzentuierung der Nomina daher vom lexikalischen Wort ausgehen, welches mit der Singularform übereinstimmt. 43 Nachdem wir die Flexionsmorphologie als Faktor bei der Akzentzuweisung ausgeschlossen haben, müssen wir die Relevanz von phonologischen Faktoren überprüfen. Ein möglicher Faktor bei der Zuweisung der Akzentposition bei Nomina ist die Silbenstruktur bzw. das Silbengewicht (“stress to weight”, vgl. 4.2.2 und Abb. 4.2- 4). Eine Silbe ist schwer, wenn ihr Reim bzw. ihr Nukleus verzweigt, sie also auf einen Konsonanten oder auf einen Diphthong endet. Eine leichte Silbe hat dagegen einen unverzweigten Reim mit einem einfachen vokalischen Nukleus. Die Frage ist, ob das Silbengewicht bei der Akzentzuweisung eine Rolle spielt. Bei der Betonung von mujer und araguaney einerseits und mesa oder aguda andererseits spielt das Silbengewicht offensichtlich eine Rolle: Mujer und araguaney haben eine schwere, weil auf Konsonant bzw. Gleitlaut endende Ultimasilbe, die deshalb den Wortakzent auf sich zieht. Dagegen ist in mesa oder aguda die Ultimasilbe leicht, und der Akzent fällt auf die vorangehende Pänultima (Hayes 1995: 50). Auch die 41 Anders als Flexionsmorpheme beeinflussen Wortbildungsmorpheme auch bei den Nomina die Akzentposition (vgl. dazu weiter unten). Zur Akzentzuweisung bei Komposita vgl. 4.3.8. 42 Die sechs (! ) Lexeme, die von der Regel abweichen, beeinträchtigen die Gültigkeit deren Regel nicht. Zum großen Teil erklärt sich die abweichende Akzentuierung der Pluralform durch die Regel des Drei-Silben-Fensters: espécimen/ especímenes; régimen/ regímenes; hipérbaton/ hiperbatones, auch: hipérbatos; ómicron/ omicrones/ auch: (las) ómicron; carácter/ caracteres; júnior/ juniores. 43 Im Rahmen der Metrischen Phonologie wurde versucht, auch den unbetonten Auslautvokal von Nomina, die lateinischen Etyma fortsetzen, flexivisch zu interpretieren und die Auslautsilben daher als extrametrisch, d.h. als ‘akzentuell irrelevant’, einzustufen. In diesem Ansatz geht man von Formen wie me<sa> (eine extrametrische Silbe <sa>), señor (ohne extrametrische Silbe) und ví<bo><ra> (zwei extrametrische Silben <bo> und <ra>) aus und bestimmt die Position des Akzents durch die Regel ‘Betone die letzte Silbe des Stamms’ (Roca 1999). Allerdings muss auch bei dieser Herleitung die Antepänultimabetonung (víbora) durch die Annahme prosodischer Markierungen im Lexikon begründet werden. 156 Betonung von señores wird durch das Silbengewicht richtig bestimmt, denn die Flexionsendung -es geht, wie wir oben gesehen haben, nicht in die Akzentberechnung ein. Die Ultima- und die Pänultimabetonung der Nomina kann man also mit dem Silbengewicht in Verbindung bringen. Etwa 95% der Akzentpositionen bei spanischen Nomina können durch das Silbengewicht erklärt werden (Hualde 2005: 223). Die Regel, dass eine schwere Ultima betont wird, eine leichte dagegen die Akzentposition nach links ‘weiterreicht’, gilt somit in der überwiegenden Mehrzahl der spanischen Nomina. Allerdings gibt es Ausnahmen zu dieser Regel. So findet sich Pänultimabetonungen trotz schwerer Ultima (joven, lápiz, difícil, vóle, yóquey) und Ultimabetonungen trotz leichter Ultima (papá, canesú). Dennoch ist es angesichts des klaren Überwiegens regelkonformer Fälle nicht verwunderlich, dass aus dieser häufigen und damit unmarkierten Akzentverteilung die Regeln abgeleitet werden, die bei Neuschöpfungen die Position der betonten Silbe bestimmen. Wie eine Reihe von Experimenten gezeigt hat, ist die bei Logatomen, also nach den phonologischen Regeln des Spanischen konstruierten Pseudowörtern, und Akronymen, Wortbildungen aus Anfangsbuchstaben oder Anfangssilben eines Namenssyntagmas, der Fall. Solche Wortneuschöpfungen werden von spanischen Muttersprachlern in der Mehrzahl nach der Silbengewichtsregel betont. Ultimabetonung wird dann gewählt, wenn die Endsilbe auf Konsonant endet (*panaquil; IMER = Instituto Mexicano de la Radio). Bei leichter Ultima fällt die Entscheidung dagegen zugunsten der Pänultimabetonung (*bochaca; CONAPO = Consejo Nacional de Población). Auch für den vesre, bei dem die Wortsilben ihre Position vertauschen (vgl. 4.2.1), sowie für die in der Jugendsprache häufigen Wortkürzungen gilt die Regel, dass in den neu entstandenen Wörtern oxytone Betonung bei schwerer, paroxytone Betonung bei leichter Ultima gewählt wird (trabajo > jotraba; tango > gotán; el profesor > el profe; Antonio > Antón etc., vgl. Hualde 2005: 227-228, Kubarth 2009: 178f., NGRAE 2011: 400f.). Aber die Positionierung des Wortakzents auf einer der beiden letzten Silben ist nicht für alle spanischen Nomina verbindlich. Für einen Teil, nämlich die palabras esdrújulas, gilt, dass sie nach einem dritten Akzentmuster betont werden, nämlich nach der Antepänultimabetonung. Wörter wie esdrújula oder águila, retórica oder éxito, haben den Wortakzent auf der vorvorletzten Silbe, nutzen also die ventana de las tres sílabas vollständig aus. Dieses Akzentmuster kann man allerdings nicht mit den synchronen phonologischen Regeln, sondern nur historisch erklären. Wie bereits in 4.1.1 und 4.2.2 gesagt, wurde der Wortakzent im Lateinischen durch das Silbengewicht, und zwar durch das Gewicht der Pänultimasilbe, bestimmt. Anders als im Spanischen konnte im Lateinischen die Ultima, also die letzte Wortsilbe, nicht betont werden. Alle zweisilbigen Wörter wurden daher prinzipiell auf der vorletzten Silbe akzentuiert. Hatte ein Wort mehr als zwei Silben, kamen zwei Akzentpositionen in Frage, nämlich die Pänultima und die Antepänultima, die zweite mögliche Akzentsilbe. Der Akzent fiel auf die Pänultima, wenn diese schwer war, also entweder eine konsonantische Coda oder einen verzweigten Nukleus (Diphthong oder Langvokal) aufwies. Eine leichte Pänultima führte dagegen zur Weitergabe des Akzents nach links, also zur Betonung der Antepänultima. Deshalb gab es im Lateinischen zahlreiche Wörter, die regelhaft Antepänultimabetonung zeigten. Als sich das (Vulgär-)Lateinische zum Altspanischen weiterentwickelte, wurde die Unterscheidung zwischen langen und kurzen Vokalen aufgegeben. Dies bedeutete auch, dass die lateinischen Silbengewichtsregeln nicht mehr gelten konnten. Die Akzentstellen der Nomina wurden aber nicht neu berechnet, sondern die Lexeme, auch = 157 die Lexeme mit einer Antepänultimabetonung, behielten ihre Akzentuierung bei und ‘vererbten’ sie an das Spanische weiter (Menéndez Pidal 1962: 36). Zudem gab es im Laufe der Sprachgeschichte immer wieder Entlehnungen aus dem lateinischen Kulturadstrat (sog. cultismos), und zwar ohne dass die Wortbetonung an die Empfängersprache Spanisch angepasst wurde. Deshalb existieren auch im modernen Spanisch Nomina, die eine Antepänultimabetonung aufweisen, obwohl diese aus den synchronen phonologischen Regeln nicht mehr hergeleitet werden kann (vgl. Meisenburg 2005). Die Antepänultimabetonung ist im Gegensatz zur Pänultima- und Ultimabetonung ein markiertes Akzentmuster. Der Akzent auf der drittletzten Wortsilbe tritt zu selten auf, um noch Ausgangspunkt einer allgemeingültigen produktiven Akzentregel sein zu können. Die Antepänultimabetonung hat inzwischen sogar die Konnotation eines cultismo erhalten. Im Substandard wird bei Wörtern, die nach der Normaussprache eine Pänultimabetonung haben, manchmal hyperkorrekt die Antepänultimabetonung gewählt. Es scheint ‘gelehrter’ zu klingen, wenn man *intervalo statt intervalo sagt (NGRAE 2011: 385-386). Wir können die Regularitäten bei der Betonung der spanischen Nomina folgendermaßen zusammenfassen: • Betone die Auslautsilbe (Ultima), wenn diese schwer ist. • Ist die Ultimasilbe leicht, betone die vorletzte Silbe (Pänultima). • Beachte, dass manche Nomina auf der Antepänultima betont werden. • Beachte außerdem, dass es zu den ersten beiden Regeln Ausnahmen gibt. Auch Abb. 4.3-4 verdeutlicht diese Regularitäten. A: Unmarkierte und regelhafte Akzentmuster Pänultima-Akzentuierung bei leichter Ultima (-V) Ultima-Akzentuierung bei schwerer Ultima (-VC/ VG) acuerdo, abeja, mesa etc. mujer, cristal, jardín, caray etc. B: Markierte Akzentuierung Antepänultima-Akzentuierung 44 águila, éxito, índole etc. C: Ausnahmen Pänultima-Akzentuierung bei schwerer Ultima (-VC oder -VG) Ultima-Akzentuierung bei leichter Ultima (-V) árbol, crisis, origen, huésped etc. café, mamá, menú, ojalá etc. Abb. 4.3-4 Regeln und Ausnahmen bei der Akzentuierung spanischer Nomina (nach NGRAE 2011: 380). Insgesamt bleibt die Akzentuierung der Nomina im Spanischen komplex. Es gibt Regeln, es gibt markierte und unmarkierte Betonungsmuster, und es gibt Ausnahmen. Weiterhin liegen bei zahlreichen Wörtern konkurrierende Betonungsmuster vor, die 44 Eine Betonung der Antepänultima ist ausgeschlossen, wenn sich der Nukleus der Ultimasilbe verzweigt. Dieser Typus von schwerer Ultimasilbe führt zur Betonung der Pänultima (avarícia etc.). Antepänultimabetonung ist auch ausgeschlossen, wenn die Ultimasilbe mit einem Palatalkonsonanten beginnt (derecho etc.). Dieser Typus von Akzentzuweisung erklärt sich aus der geschlossenen und damit schweren Pänultimasilbe der lateinischen Etyma (derecho < DIRECTUM etc.). Zur etymologischen Erklärung und zu den Schwierigkeiten, eine synchrone Regel zu formulieren, vgl. Roca (1999: 697-702). 158 durch diaphasische oder diatopische Variation bedingt sind (diastratisch: kilómetro (Norm) / kilometro (Substandard); diatopisch: fútbol (europäisches und südliches lateinamerikanisches Spanisch) / futbol (mexikanisches und zentralamerikanisches Spanisch; vgl. NGRAE 2011: 383-390). Die Nueva Gramática de la Lengua Española schreibt: La heterogeneidad de los hechos relacionados con la acentuación se origina porque al núcleo de voces patrimoniales que constituye la base fundamental del léxico, se añaden a lo largo de los siglos elementos periféricos de historia compleja y de estructuras fónicas procedentes de otras lenguas, además de un importante grupo de cultismos y de nombres propios, antropónimos y topónimos. Todos estos elementos aparecen en el léxico del español y alteran en mayor o menor medida las tendencias generales. (NGRAE 2011: 390). Abschließend noch eine kurze Bemerkung zum Verhältnis zwischen Akzentuierung und Wortbildung, und zwar zur Wortbildung durch Derivation. 45 Derivation durch präfigierte Morpheme beeinflusst die Akzentposition nicht, denn diese orientiert sich am rechten Endrand eines Lexems, nicht an dessen Initialsilben. So bleibt bei Negationspräfixen der Akzent weiterhin auf derselben Wortsilbe (popular/ impopular; vgl. NGRAE 2011: 391). Bei der Suffigierung wird dagegen wiederum das Drei-Silben- Fenster auf das neu entstandene Wort angewandt. Bei den meisten Wortbildungssuffixen fällt der Wortakzent damit auf das angefügte Suffix, und der Akzent des lexikalischen Stammes wird vollständig getilgt. Man nennt die betonten Suffixe sufijos tónicos (leche > lechero, nación > nacional, veinte > veintésimo). Daneben gibt es einige wenige sufijos átonos, nämlich -ico, -io, -il. Sie können selbst keinen Wortakzent tragen, führen aber dazu, dass der Akzent des Simplex sich unter Umständen verlagert, und zwar auf die letzte Stammsilbe (árabe > arábico, Hércules > hercúleo, tacto > táctil). 4.3.5.4 Der Wortakzent bei spanischen Verben Während sich bei den Nomina die Zuweisung des Wortakzents auf das kontextfreie lexikalische Wort bezieht, ist sie in spanischen Verbformen morphologisch geregelt und auf das grammatische Wort bezogen, also auf die hinsichtlich der syntaktischen Funktionen durch das Anfügen von Flexionsmorphemen spezifizierte Wortform. Die Möglichkeit, die Akzentposition innerhalb der letzten drei Silben eines Worts zu variieren, wird im Spanischen dazu genutzt, bestimmte Tempora und Modi mit bestimmten Betonungsmustern zu verknüpfen. Um die Akzentverteilungsmuster besser zu verstehen, ist es zunächst notwendig, die morphologische Struktur spanischer Verben zu rekapitulieren. Eine flektierte Verbform kann im Spanischen in Stamm und Endung aufgegliedert werden. Diese beiden Bestandteile lassen sich weiter in den Stamm, bestehend aus Wurzel (W) und Themavokal (TV), sowie die Endung, bestehend aus Tempus-Modus-Marker (TM) und Person-Numerus-Endung (PN) analysieren (vgl. Schpak-Dolt 2012: 47-52), vgl. Abb. 4.3-5. 45 Zur Akzentuierung bei der Wortbildung vgl. D’Introno et al. (1995: 421-423), Hualde (2006), Kubarth (2009: 198-199) und NGRAE (2011: 390-402). Zur spanischen Wortbildung vgl. Schpak-Dolt (2012: 68-133); zur Akzentuierung von Komposita vgl. 4.3.8. = 159 Abb. 4.3-5 Die morphologische Binnenstruktur spanischer Verben. Die morphologische Steuerung des Akzents äußert sich in einem spezifischen Akzentmuster für jedes Tempus-Modus-Paradigma, das für dieses Paradigma in allen Konjugationsklassen einheitlich gilt. So fällt der Akzent im futuro simple und im condicional simple auf den Tempus-Modus-Marker (TM) -rabzw. -rí-, und dies durchgehend für alle Personen und Numeri. Auch im pretérito imperfecto indicativo und subjuntivo (-se und -ra) fällt der Akzent immer auf eine einheitliche Position; im Unterschied zum Futur und Konditional ist das aber der Themavokal (TV). Diese säulenartige Akzentverteilung sieht in der a-Konjugation folgendermaßen aus: 46 futuro simple condicional simple W TV TM PN W TV TM PN habl a ré habl a ría habl a rá s habl a ría s habl a rá habl a ría habl a re mos habl a ría mos (habl a ré is) (habl a ría is) habl a rá n habl a ría n pretérito imperfecto simple indicativo pretérito imperfecto simple subjuntivo (-se) pretérito imperfecto simple subjuntivo (-ra) W TV TM PN W TV TM PN W TV TM PN habl a ba habl a se habl a ra habl a ba s habl a se s habl a ra s habl a ba habl a se habl a ra habl á ba mos habl á se mos habl a ra mos (habl a ba is) (habl a se is) (habl a rá is) habl a ba n habl a se n habl a ra n Abb. 4.3-6 Akzentmuster im futuro simple, condicional, imperfecto indicativo und im subjuntivo. Die Tabellen in Abb. 4.3-6 zeigen die einheitliche Akzentpositionierung. Im futuro simple und im condicional ist die Silbe unmittelbar nach dem Themenvokal (TV) betont, in den drei Paradigmen des imperfecto die TV-Silbe. Die Anzahl der Silben, die auf die betreffende Bezugssilbe folgen, spielt für die Akzentzuweisung dagegen keine 46 Einen vollständigen Überblick über alle drei Konjugationsklassen (-ar, -er, -ir) und alle Modi und Tempora gibt Kubarth (2009: 184). Verb Stamm W gan gan TV a a Endung TM re ra PN mos s 160 Rolle (hablaba und hablábamos); irrelevant ist auch das Silbengewicht (hablabais trotz schwerer Endsilbe). Dem Muster einer solchen einheitlichen Bezugssilbe folgt auch das pretérito simple der regelmäßigen Verben. Allerdings ist hier die genaue morphologische Kennzeichnung der Akzentsilbe nicht mehr transparent, da sich Themavokal, TM-Marker und PN-Morphem überlagern (Kubarth 2009: 185f.). Morphologisch reguliert bleibt das Akzentmuster trotzdem, da die einheitliche Positionierung der Akzentsilbe innerhalb der Verbform das Paradigma eint. pretérito simple habl é habl aste habl ó habl amos (habl asteis) habl aron Abb. 4.3-7 Akzentmuster im pretérito simple der regelmäßigen Verben. Einem anderen Muster folgt dagegen der presente indicativo bzw. subjuntivo bei allen Verben. 47 In diesen Paradigmen gibt es keine einheitliche Akzentposition. Dies hängt damit zusammen, dass sich hier die lateinische Unterscheidung zwischen stammbetonten und endungsbetonten Formen fortsetzt. Aber auch dieses Muster ist morphologisch reguliert, da der Akzentsilbenwechsel mit dem Wechsel der Personen verknüpft ist. presente indicativo presente subjuntivo habl o habl e habl as habl es habl a habl e habl amos habl emos (habl aís) (habl éis) habl an habl en Abb. 4.3-8 Akzentmuster im presente indicativo und subjuntivo. Den Akzent auf der Wurzelsilbe haben die 1., 2. und 3. Singular und Plural, endungsbetont sind dagegen die 1. und 2. Plural (mit einer Akzentverteilung, die wiederum unabhängig von der Silbenzahl der Endung ist). Die Akzentalternanz wird in einer Reihe von Verben durch das Abwechseln von diphthongierten Formen bei Wurzelbetonung (pienso) und nicht diphthongierten Formen bei Endungsbetonung (pensamos) gestützt. 47 Im pretérito simple der Verben mit sog. starken Perfekt (andar, estar, haber, hacer, poder, tener etc.) liegt ebenfalls eine Alternanz von Wurzel- und Endungsbetonung vor, jedoch mit anderer Verteilung. Wurzelbetont sind die 1. und 3. Singular (pude, pudo), endungsbetont die 2. Singular und das Pluralparadigma (pudiste, pudimos etc.). = 161 4.3.6 Die orthographische Markierung des Wortakzents Die spanische Orthographie kennzeichnet die Akzentposition nur dann, wenn sie nicht den beiden regelhaft gewichtssensitiven Akzentverteilungen bei den palabras llanas und agudas entspricht. Nur im Falle der markierten Antepänultimabetonung und bei den Ausnahmen zur gewichtssensitiven Pänultima- und Ultimabetonung wird die Akzentposition durch einen graphischen Akut angezeigt. Nicht gekennzeichnet werden also Fälle wie mesa (paroxyton bei leichter, auf Vokal endender Ultima) oder señor (oxyton bei schwerer, auf Konsonant endender Ultima). Da die Flexionssuffixe die Akzentverteilung nicht verändern, sind auf <-s>, <-n> bzw. <-es> endende Wörter fest mit dem paroxytonen Betonungsmuster assoziiert und werden deshalb graphisch nicht gekennzeichnet (hablan, señores: paroxyton bei flexivischem Endkonsonanten bzw. flexivischer Ultimasilbe). Dies gilt auch dann, wenn die betreffenden Grapheme nicht zu einer Flexionsendung gehören. Deshalb wird bei phonologisch nicht regelhaft betontem crisis oder origen (paroxyton trotz konsonantisch auslautender Ultima) kein Akut gesetzt. Mit einem Akut gekennzeichnet wird die Wortakzentsilbe: • bei allen palabras esdrújulas: fábrica, fórmula, depósito, Aristóteles, amábamos etc.; auch bei Verbformen mit nachgestellten Klitika wird die Akzentstelle markiert, sobald sich durch die Silben der Klitika Antepänultimabetonung oder eine noch weiter nach links verschobene Betonung ergibt: ¡cántalo! , ¡cántamelo! ; • bei den palabras agudas nur dann, wenn die Ultima auf einen Vokalbuchstaben oder auf <-s> oder <-n> endet: dominó, bungaló, cantó, hablé, ahí, allá; ebenso francés, entonación, comerán etc.; • bei den palabras llanas nur dann, wenn die Ultima auf einen anderen Konsonantbuchstaben als <-s> und <-n> endet: árbol, fútbol (vs. mex. futbol), lápiz, útil, ágil etc. 48 Außerdem kennzeichnet der Akut betonbare Funktionswörter bzw. homophone lexikalische Formen. Dies führt in vielen Fällen zu graphischer Homophonendifferenzierung: el definiter Artikel él betontes Pronomen este Demonstrativdeterminant éste Demonstrativpronomen se unbetontes Reflexivpronomen sé 1. Sing. Präs. von saber tu Possessivdeterminant tú betontes Pronomen mi Possessivdeterminant mí betontes Pronomen si Konjunktion sí Partikel, bet. Pronomen mas Konjunktion más Steigerungspartikel que Konjunktion qué Fragepronomen quien Relativpronomen quién Fragepronomen Abb. 4.3-9 Graphische Homophonendifferenzierung durch den Akut. 48 <y> zur Wiedergabe des wortfinalen Gleitlauts zählt nicht zu den Vokalbuchstaben. Die regelkonforme oxytone Betonung bei mamey wird daher nicht markiert, wohl aber die nicht regelkonforme paroxytone Betonung bei yóckey. wird dagegen als Vokalgraphem gewertet, auch wenn es einen Approximanten wiedergibt. Deshalb wird die mit der halbvokalischen Realisierung verbundene oxytone Betonung des Diphthongs in samurái und bonsái mit dem Akut markiert (Hualde 2005: 247f.). 162 4.3.7 Metrische Phonologie Die Beschreibung des spanischen Wortakzents, die wir vorgestellt haben, berücksichtigt zwei prosodische Ebenen: die der Silbe und die des phonologischen Wortes. In dieser Hinsicht orientieren wir uns an traditionellen Beschreibungen, die den Akzent direkt an der silbischen Struktur des Wortes festmachen. Im Bereich der Akzentphonologie gibt es mit der Metrischen Phonologie aber auch eine alternative Theorie. Diese vertritt wie die autosegmentale Phonologie (3.4) einen nicht linearen Ansatz. Beide Forschungsrichtungen haben sich von der Beschränkung phonologischer Regeln auf die Segmentebene gelöst und schlagen übergeordnete prosodische Strukturierungsebenen wie den Fuß (P), das phonologische Wort ( ) oder die phonologische Phrase (î) vor (4.1.2). Während die autosegmentale Phonologie sich u.a. mit der Zuweisung von Tönen beschäftigt, stellt die Metrische Phonologie die Frage nach den Regeln der Akzentuierung. 49 Wie ihr Name zeigt, orientiert sie sich dabei an Konzepten der klassischen Verslehre, der Metrik. Sie geht davon aus, dass die Akzentzuweisung durch das Zusammenwirken übergeordneter prosodischer Ebenen mit der Ebene des Fußes erfolgt. Wie bereits in 4.1.1 gesagt, ist der Fuß eine maximal dreigliedrige Folge von Silben, von denen eine stärker (f = fuerte) ist als die andere(n) (d = débil). Die Metrische Phonologie postuliert, dass nicht nur die gebundene Rede, sondern Lautsprache allgemein die prosodische Gliederung nach dem Fußprinzip respektiert. Sie geht davon aus, dass wir uns beim Sprechen an universellen rhythmischen Prinzipien orientieren, nämlich am Wechsel zwischen starken und schwachen Silben. In Einklang mit diesem Grundsatz postuliert die Metrische Phonologie, dass die Zuweisung des Wortakzents im Spanischen auf der Grundlage von phonologischen Regeln erfolgt und nicht idiosynkratisch mit jedem Lexem abgespeichert wird. Da sie außerdem davon ausgeht, dass alle Ebenen der prosodischen Strukturierung durch dieselben Regularitäten bestimmt sind, können die phonologischen Regeln, nach denen der Wortakzent determiniert wird, mit bestimmten eurhythmischen Regeln in Verbindung gebracht werden, die auch für die Zuweisung von Nebenakzenten oder für Akzentverschiebungen gelten. Diese zweite Fragestellung, die der Setzung von Nebenakzenten sowie Akzentverschiebungen und Deakzentuierungen in der Äußerung nachgeht, werden wir in 4.3.8 weiterverfolgen. Die Zuweisung des Wortakzents im Spanischen geschieht auf der Basis universeller Prinzipien, die einzelsprachlich parametrisiert sind. Folgende Parameter bzw. folgende Parameterwerte werden vorgeschlagen (Kager 1995: 370-373, Kubarth 2009: 192f.): • Gebundenheit: Nach der Option gebundener Fußstrukturen umfassen Füße maximal zwei Silben. Ungebunden sind Füße dagegen, wenn in der betreffenden Sprache keine maximale Silbenzahl festgelegt ist. Für das Spanische gilt: Füße sind gebunden, d.h. auf maximal zwei Silben beschränkt. • Dominanz auf Fußebene: Füße sind je nach Sprache entweder linksdominant (betonte Silbe zuerst, Trochäus) oder rechtsdominant (betonte Silbe zuletzt, Jambus). Das Spanische hat linksdominante zweisilbige Füße. • Gewichtssensitivität: Sprachen, die gewichtssensitiv sind, erlauben in der betonten Position nur schwere Silben. Das Spanische ist bedingt gewichtssensitiv, da 49 Zur Metrischen Phonologie vgl. Dufter (2003: 58-80), Hall (2011: 271-290), Kager (1995, 2007), Kubarth (2009: 190-196) und Nespor (1993: 149-185, 235-263). = 163 zwar die Silbenschwere eine Rolle bei der Akzentzuweisung spielt, der Wortakzent aber auch leichten Silben zugewiesen werden kann. • Konstruktionsrichtung: Die Silben eines Wortes werden ausgehend vom rechten oder vom linken Rand zu Füßen geordnet. Das Spanische weist Fußstrukturen von rechts nach links zu, beginnt also am Wortende. • Dominanz auf Wortebene: Der Fuß, dessen dominante Silbe den Wortakzent erhält, kann am linken Wortrand (Wortanfang) oder am rechten (Wortende) liegen. Im Spanischen erhält die betonte Silbe des letzten Fußes die Wortakzentzuweisung. Der Wortakzent ist also am Wortende lokalisiert. Wir verdeutlichen die genannten Regularitäten im Folgenden anhand eines Beispiels und präsentieren die metrische Struktur des Worts inescrupuloso gemäß den beiden Darstellungsverfahren der Metrischen Phonologie, dem Strukturbaum (sp. árbol métrico) und dem Gitter (sp. red métrica). Abb. 4.3-10 Metrischer Baum zu inescrupuloso. Im metrischen Baum (Abb. 4.3-10) werden die Konstituenten auf den einzelnen prosodischen Ebenen angegeben. Gleichzeitig werden die Köpfe der einzelnen Konstituenten, also die starken Positionen, markiert. Der Wortakzent ergibt sich aus den Stärkerelationen innerhalb der prosodischen Hierarchie. Er fällt auf die Silbe, die direkt unter den dominanten Verzweigungen steht. Im metrischen Gitter (Abb. 4.3- 11) erhalten alle betonbaren Silben einen Schlag (angezeigt durch ‘*’). Dann beginnt die Fußzuweisung, und zwar, wie oben präzisiert, am rechten Wortrand mit der letzten Wortsilbe. Sie führt zu drei Trochäen, deren jeweils erste Silben einen weiteren Schlag, also einen Fußakzent, erhalten. Der Wortakzent wird der betonten Silbe des Trochäus am Wortende zugewiesen, die damit die höchste Zahl an Schlägen aufweist und als Akzentposition gewählt wird. * * * * * * * * * * i -nes -cru -pu -lo so Abb. 4.3-11 Metrisches Gitter zu inescrupuloso. Das analysierte Lexem ist bewusst gewählt, da die Analyse nach den vorgeschlagenen Parametrisierungen unproblematisch ist: Der metrische Algorithmus errechnet nach beiden Modellen die korrekte Position des Wortakzents. Nicht so einfach ist die Zuweisung des Wortakzents bei Ultimabetonung, denn am Wortende kann kein vollständiger Trochäus stehen; eine unbetonte Silbe nach dem Akzent fehlt und die f i- d nes- f d f Wortknoten f cru- d pu- f lo- d so d Fußknoten Silbenknoten 164 Fußstruktur ist deshalb unvollständig. Kubarth (2009: 196ff.) schlägt deshalb vor, für das Spanische von der Gleichwertigkeit des Trochäus (Ú÷) 50 mit einer schweren Silbe (-) auszugehen. Bei Ultimabetonung wird dann ein eigenständiger, nur eine schwere Silbe umfassender Fuß am Wortende angesetzt, der wie die starke Silbe des Trochäus den Wortakzent erhält. 51 Die Gitterstrukturen zu den Wörtern taberna und perejil sollen diesen Ansatz verdeutlichen. * * * * * * * * Ú (Ú ÷ ) Ú Ú ( ) ta -ber -na pe -re -jil Abb. 4.3-12 Verfußung und Wortakzentzuweisung bei taberna und perejil (nach Kubarth 2009: 197). Ob die Position des Wortakzents, wie in der Metrischen Phonologie angenommen, durch Verfußung jedes Mal aufs Neue errechnet wird oder ob sie Bestandteil unseres lexikalischen Wissens ist, bedarf noch weiterer Klärung. 4.3.8 Nebenakzente und Akzentverschiebungen Wie bereits gesagt, spielt die Fußstruktur im Rahmen der Metrischen Phonologie eine zentrale Rolle. Man geht davon aus, dass die Sprecher auf den gleichmäßigen Wechsel zwischen starken und schwachen Silben sowohl auf Wortals auch auf Phrasenebene achten (Nespor 1993: 235-263). Dieses eurhythmische Prinzip erklärt, warum im Englischen oder Deutschen beim unmittelbaren Aufeinandertreffen zweier Wortakzentsilben (engl. accent clash, sp. choque acentual) eine Akzentverschiebung auftritt: So verschiebt sich im engl. Wort thirteen der Wortakzent von der letzten auf die vorletzte Silbe, wenn eine betonte Silbe nachfolgt wie in thirteen+men [ù ti n men]; gleiches gilt für dt. Bahnhof, wo sich im Kompositum die Akzentstelle auf die Ultima verschiebt: Haupt+Bahnhof [ haptba nho f] (vgl. Nespor 1993: 242ff., Visch 1999: 188-196). Mit eurhythmischen Prinzipien begründet die Metrische Phonologie weiterhin die Tatsache, dass eine längere Folge von unbetonten Silben durch die zusätzliche Setzung von Nebenakzenten intern differenziert wird, damit eine gleichmäßig abwechselnde Prominenzkontur zwischen starken und schwachen Silben auch unabhängig vom Hauptakzent gewährleistet werden kann. Im Spanischen scheinen diese eurhythmischen Prinzipien bei der Akzentkollision eine geringere Rolle zu spielen als im Englischen und Deutschen (NGRAE 2011: 423f.). In einem Kompositum wie cartón piedra werden trotz des Aufeinandertreffens zweier akzenttragender Silben beide Wortakzente realisiert; der Akzent fällt jedoch 50 Mit Ú wird eine Silbe symbolisiert, deren Silbengewicht nicht in die Berechnung des Akzents eingeht. ÷ symbolisiert eine leichte, - eine schwere Silbe. 51 Die Antepänultimabetonung muss dagegen weiterhin mit der Annahme einer extrametrischen Ultima begründet werden. Kubarth (2009: 197) stützt seine Analyse auf die Tatsache, dass in der spanischen Verslehre gleichermaßen eine betonte Ultima, eine Pänultima mit nachfolgender unbetonter Silbe und eine Antepänultima mit zwei nachfolgenden unbetonten Silben die letzte Versposition ausfüllen können. In der Metrischen Phonologie werden die Silben, die bei der trochäischen Verfußung am Anfang eines Wortes übrigbleiben (a(náli)<sis>), als degenerierte, also unvollständige Füße eingeordnet. Zu den Schwierigkeiten einer solchen Analyse vgl. Marotta (2012). = 165 im ersten Teil des Kompositums (cartón) schwächer aus. Die Verschiebung des Akzents ist hingegen selten und scheint nur zusammengesetzte Eigennamen zu betreffen wie z.B. José Mari [xose mai] (vgl. Hualde 2006, NGRAE 2011: 424). Anders verhält es sich bei zusätzlichen Nebenakzenten (sp. acento secundario), die auch in traditionellen Ansätze angenommen werden (Navarro Tomás 1977: 195ff.; vgl. auch Hualde 2010). Längere Abfolgen unbetonter Silben werden im Spanischen i.d.R. durch die Setzung von Nebenakzenten intern weiter differenziert: So ist etwa bei isolierter Aussprache von bienvenido auf der ersten Silbe bienmeist ein F 0 -Gipfel zu verzeichnen, der zwar nicht den mit der Hauptakzenttonstelle -niassoziierten übertrifft, andererseits aber prominent genug ist, um die erste Silbe deutlich von der folgenden, unbetonten Silbe zu differenzieren. Abb. 4.3-13 Realisierung des Nebenakzents in bienvenido (NGRAE 2011: 369). Die Platzierung von Nebenakzenten ist nicht zufällig (Harris 1983, Roca 1996). Aus der Annahme, die akzentuelle Gliederung erfolge über die Zuweisung von Füßen, folgt die Regel, dass Tonsilben durch mindestens eine unbetonte Silbe voneinander getrennt sein müssen; Akzentverteilungen wie *[bjembe ni®o] oder *[ damelo] ¡dámelo! als Beispiel für einen nachtonigen Nebenakzent sind dementsprechend ausgeschlossen. 52 Die Regel, dass Haupt- und Nebenakzent nicht adjazent sein können, gilt also unabhängig von der Position des Nebenakzents (vor oder nach dem Hauptakzent) und betrifft sowohl das phonologische Wort als auch die Klitische Gruppe (4.3.5.2). Vortonige Nebenakzente können bei Wörtern, die mehr als eine Silbe vor der Akzentsilbe aufweisen, unbeschränkt auftreten. Den Regeln der Verfußung folgend werden sie von rechts nach links auf jeder zweiten Silbe platziert werden, z.B. (constan)(tino)(poli)(tano) [kons.tanti.nopo.li ta.no]. Bleibt bei der Verfußung eine Silbe am Wortanfang übrig, wird diese meist in den ersten Fuß integriert und dieser damit in einen Daktylus umgewandelt, z.B. i(nhospi)(tali)dad > (inhospi)(tali)dad [inos.pita.li ®a®], vgl. Kubarth 2009: 206). Vortonige Nebenakzente werden oft durch einen F 0 -Gipfel ohne Längung der Silbe markiert (Hualde 2005: 246, NGRAE 2011: 369). In distanzsprachlichen Sprechstilen, so z.B. in Rundfunknachrichten oder 52 Hualde (2010) geht davon aus, dass wenn der Nebenakzent nicht weiter nach links ausweichen kann, auch benachbarte Silben akzenttragend sein können. In diesem Fall werde der Nebenakzent allein durch F 0 , der nachfolgende Hauptakzent nur durch die Silbenlängung realisiert. 166 politischen Reden, wird von dieser Akzentuierung teils so intensiv Gebrauch gemacht, dass der ganze Text hierdurch einen emphatischen Charakter erhält (Hualde 2006, Kubarth 2009: 205). Die Realisierung eines nachtonigen Nebenakzents in der Klitischen Gruppe ist nur am rechten Rand der Intonationsphrase am Satzende möglich. In dieser Position treten Nebenakzente in einigen amerikanischen Varietäten des Spanischen sowie im Aragonesischen bei Imperativen wie ¡tómatelo! [ to.ma.telo] auf; im informellen Register des argentinischen Spanisch, das bei den Imperativen ohnehin eine von den übrigen Varietäten abweichende Akzentuierung aufweist (¡tomá! anstelle von ¡toma! ). hat sich die Hauptakzentposition sogar vom Verb auf das Klitikon verlagert [toma.te lo] (vgl. NGRAE 2011: 413). Nebenakzente spielen auch bei zusammengesetzten Wörtern eine wichtige Rolle; die Akzentzuweisung in Komposita verläuft nach zwei möglichen Verfahren. Wenn jedes Glied seinen Wortakzent behält, entsteht ein sog. syntagmatisches Kompositum (compuesto sintagmático, NGRAE 2011: 394), das prosodisch gesehen als Verbindung zweier phonologischer Wörter ( ) zu einer Phrase (î) mit zwei Hauptakzenten aufzufassen ist, z.B. camión cisterna ‘Tankwagen’. Stärker lexikalisierte Komposita (compuestos propios, NGRAE 2011: 392) hingegen werden als eigene phonologische Wörter mit nur einer Akzentstelle aufgefasst, z.B. hierbabuena. 53 Auch im Falle der Adverbbildungen mit -mente geht die traditionelle Grammatik davon aus, dass ein syntagmatisches Kompositum mit zwei Wortakzenten vorliegt. Daher behalten die Adjektive, deren Akzentsilbe orthographisch mit einem Akut markiert wird, diese in der Adverbform mit -mente bei (z.B. rápidamente, cortésmente). Die syntagmatische Durchsichtigkeit der Adverbbildung ist jedoch umstritten, da der Grammatikalisierungsgrad des Suffixes -mente weit fortgeschritten ist. Aus prosodischer Sicht ist es hier sinnvoller, einen Nebenakzent auf der adjektivischen Basis anzunehmen, der in Schnellsprechformen wiederum fehlen kann (NGRAE 2011: 395f.). 53 Die Zuordnung zu den beiden Klassen von Komposita ist nicht immer eindeutig; es ist sinnvoll, hier von einem Kontinuum auszugehen. Für weitere Beispiel vgl. Hualde (2005: 226f.), Kubarth (2009: 202ff.) und NGRAE (2011: 392f.); speziell zur Frage der Akzentsetzung in Komposita vgl. Hualde (2006). 1 ! " 167 4.4 Rhythmus: Die zeitliche Gliederung der Sprache Der Begriff Rhythmus (gr. rhythmós ‘gleichmäßige Bewegung, Ebenmaß, Takt’) ist uns aus unterschiedlichen alltagssprachlichen Bereichen geläufig. Grundsätzlich versteht man hierunter das gleichmäßige Wiederkehren zeitlicher Einheiten. So spricht man etwa vom Biorhythmus und meint damit die regelmäßige Wiederkehr von Zuständen unseres Organismus wie Schlaf- und Wachphasen. Unter dem musikalischen Rhythmus versteht man, wie in Abb. 4.4-1 gezeigt, regelmäßig wiederkehrende Muster langer und kurzer Notenwerte (hier jeweils: punktierte Viertelnote Achtelnote Viertelnote), die sich von einem gleichbleibenden Grundschlag (auch: Grundpuls) abheben. Da die einzelnen Schläge des Grundpulses nicht als gleich stark wahrgenommen werden, entsteht eine Betonungs- oder Akzentstruktur, die man als Metrum bezeichnet. Die metrische Struktur unseres Beispiels (1. Zählzeit: schwer 2. Zählzeit: leicht 3. Zählzeit: leicht) ergibt einen Dreivierteltakt und entspricht, wenn man sie auf spanische Wörter überträgt, antepänultimabetonten palabras esdrújulas wie z.B. régimen, múltiple oder máximo (vgl. 4.3.5.2). Abb. 4.4-1 Metrum (hier: Dreivierteltakt, unteres System) und Rhythmus (oberes System) in der Musik. Aus der regelmäßigen Abfolge unterschiedlicher Notenwerte (hier: punktierte Viertel, Achtel, Viertel) ergibt sich ein (wieder-)erkennbarer Rhythmus. Im Kapitel zum Akzent haben wir gelernt, dass die Sprachen der Welt unterschiedliche prosodische Parameter nutzen, um betonte Silben (auch: akzentuierte, metrisch starke oder Tonsilben; sp. sílabas acentuadas, métricamente fuertes oder tónicas) von unbetonten abzuheben und sie damit prominenter, also für die Wahrnehmung in irgendeiner Weise auffälliger zu machen. Wir haben bereits gesagt, dass das wichtigste Korrelat der Betonung im Spanischen die mit der akzentuierten Silbe verbundene Tonhöhenbewegung ist (zur Form dieser Tonhöhenbewegungen vgl. 4.5.4). Zusätzlich wird mit der Längung betonter Silben ein zeitliches Kriterium genutzt (4.2.3). Nach Delattre (1966: 189) sind betonte Silben im Spanischen ca. 30 % länger als unbetonte; in anderen Sprachen ist dieser Unterschied noch stärker ausgeprägt (Deutsch: 44 %, Englisch: 60 %, Französisch: 78 %). 54 Längungseffekte treten auch bei der prosodischen Gliederung größerer Einheiten auf wie z.B. unmittelbar vor den Grenzen von Intonationsphrasen. Derartige dauerbasierte Charakteristika, wie sie sich u.a. aus den Betonungsmustern (Verteilung von Prominenzen in Wort und Satz, vgl. 4.2.5) und dem systematischen Gebrauch von Längungseffekten ergeben, bestimmen neben der Sprachmelodie (Intonation, vgl. 4.5) die Prosodie einer Sprache maßgeblich. Man fasst sie unter dem Begriff des ‘Sprachrhythmus’ (sp. ritmo del habla) zusammen. 54 Im Französischen wird immer die letzte Silbe einer Wortgruppe betont, wodurch sich positionsbedingt ein zusätzlicher Längungseffekt ergibt (vgl. Pustka 2011: 130f.). Zur Längung der Tonsilben im Italienischen vgl. 4.4.3. 168 Unter Sprachrhythmus versteht man die zeitliche Gliederung der Sprache, wie sie sich aus der systematischen Verteilung kürzerer und längerer Einheiten und aus der wiederkehrenden Abfolge von Prominenzen ergibt. Den Sprechern selbst sind die rhythmischen Eigenschaften ihrer Sprache oft nur wenig bewusst; diese bestimmen jedoch die Wahrnehmung des besonderen Klanges einer Sprache maßgeblich. Wenn man bspw. als Zuhörer aus der Ferne bereits erkennt, welche Sprache oder Varietät eine Gruppe von Personen spricht, bevor man einzelne Wörter oder gar Sätze heraushören und verstehen kann, so liegt dies oft daran, dass man die betreffende Sprache aufgrund ihrer prosodischen und insbesondere rhythmischen Besonderheiten identifiziert. Ebenso ist der Sprachrhythmus oft dafür verantwortlich, dass ein fortgeschrittener Lerner einer Fremdsprache als Nicht- Muttersprachler zu erkennen ist selbst wenn er flüssig und idiomatisch spricht, keine grammatischen Fehler macht, auf der Lautebene die einzelnen Segmente der Zielsprache perfekt produziert und sogar deren Sprachmelodie erfolgreich ‘imitieren’ kann. Mit der grundlegenden prosodischen Eigenschaft des Sprachrhythmus befassen wir uns in diesem Kapitel genauer. Dabei konzentrieren wir uns auf den Rhythmus als dauerbasiertes Phänomen, wie er sich aus der systematischen Verteilung längerer und kürzerer Einheiten des Sprachsignals (entsprechend den langen und kurzen Notenwerten in Abb. 4.4-1) ergibt und auch in der neueren Rhythmusforschung im Mittelpunkt des Interesses steht. Bevor wir in 4.4.2 intensiver auf diese eingehen, diskutieren wir die sog. klassische Rhythmustypologie (4.4.1). In einem dritten Schritt kommen wir auf die rhythmischen Charakteristika spanischer Varietäten zu sprechen, wobei wir auch nicht muttersprachliches Spanisch mit einbeziehen (4.4.3). 4.4.1 Die klassische Rhythmustypologie: Silben- und akzentzählende Sprachen Das Bewusstsein darüber, dass die Gestaltung der lautlichen Oberfläche einer Sprache ebenso wie die Musik maßgeblich von zeitlichen Verhältnissen bestimmt wird, ist nicht neu. Entsprechende Zeugnisse stammen bereits aus dem späten 18. Jh. (Steele 1775) und wurden u.a. von Lloyd James (1940) aufgegriffen, der in einer Abhandlung über die Übermittlung von Sprachsignalen mittels der neuen Telefontechnik feststellte, dass manche Sprachen dem Englischen in Bezug auf wiederkehrende zeitliche Muster ähnlich sind und manche nicht. Für die dem Englischen gleichenden Sprachen prägte er den Terminus Morse code rhythm. Sie sind dadurch gekennzeichnet, dass die Abstände zwischen akzentuierten Silben gleich lang erscheinen, während zwischen diesen Tonsilben eine jeweils unterschiedliche Anzahl von unbetonten Silben platziert sein kann. Hieraus ergibt sich ein klanglicher Eindruck, der an ein Morsesignal erinnert. In anderen Sprachen wie etwa dem Spanischen erscheinen die Abstände zwischen den Anfangsrändern (Onset, vgl. 4.2) aller Silben also der betonten wie der unbetonten ungefähr gleich lang; eine solche Abfolge tendenziell gleichlanger Silben erinnerte Lloyd James an eine Maschinengewehrsalve daher der Terminus machine gun rhythm. Der Phonetiker Pike (1945) übernahm diese Einteilung der Sprachen in zwei rhythmische Klassen und prägte hierfür die heute geläufige Terminologie der akzentzählenden und silbenzählenden Sprachen (engl. stresstimed vs. syllable-timed languages, sp. lenguas de ritmo acentual vs. silábico). Beiden Sprachengruppen gemein sei so Pike , dass sie entweder in Bezug auf die Abstände zwischen betonten Silben oder zwischen allen Silbenonsets nach Gleichförmig- 1 ! " 169 keit streben. Diese grundlegende Idee ist als sog. Isochroniehypothese (gr. ísos ‘gleich’ + chrónos ‘Zeit’) bekannt geworden. Der Ansatz, die rhythmischen Eigenschaften der Sprachen der Welt mithilfe einer solchen Dichotomie zu erfassen, wurde von Abercrombie (1967) in seinen Elements of General Phonetics übernommen: Every language […] is spoken with one kind of rhythm or with the other. In the one kind, known as a syllable-timed rhythm, the periodic recurrence of movement is supplied by the syllable-producing process […] the syllables recur at equal intervals of time they are isochronous […]. In the other kind, known as a stress-timed rhythm, the periodic recurrence is supplied by the stressproducing process […] the stressed syllables are isochronous (Abercrombie 1967: 96f.). Zu den silbenzählenden Sprachen werden die meisten romanischen Sprachen wie das Spanische, das Französische, das Italienische und das brasilianische Portugiesisch sowie auch typologisch weit entfernte Sprachen wie Chinesisch oder Türkisch gerechnet. Der Gruppe der akzentzählenden Sprachen schlägt man neben dem Deutschen und dem Englischen u.a. das Niederländische, das europäische Portugiesisch und auch viele slawische Sprachen wie z.B. das Russische zu. Abb. 4.4-2 stellt die unterschiedlichen Isochronietendenzen schematisch dar. Die grau schattierten Felder repräsentieren akzentuierte Silben (Ú), die weißen entsprechen den unbetonten (Ú); die Pfeile verweisen auf tendenziell gleiche Abstände. 55 Abb. 4.4-2 Silbenzählende (oben) und akzentzählende Sprachen (unten). Hält man sich vor Augen, durch welche phonologischen Eigenschaften silbenbzw. akzentzählende Sprachen charakterisiert sind, dann fällt auf, dass in letzteren die Vokale in unbetonten Silben regelhaft reduziert werden (zum Deutschen vgl. 2.5.3.1), oft sogar bis zur völligen Tilgung, während in silbenzählenden Sprachen keine oder kaum Vokalreduktion erfolgt. 56 Zugleich zeichnen sich akzentzählende Sprachen dadurch aus, dass sie meist deutlich komplexere Silben erlauben (z.B. CVCCCCC wie in dt. (du) schimpfst) als silbenzählende Sprachen, die wie das Spanische eine starke Tendenz zu regelmäßigen Abfolgen von CV-Silben aufweisen (vgl. 4.2). Wie das folgende Beispiel zeigt, wird die Komplexität der Silbenstrukturen in akzentzählenden Sprachen durch die Eigenschaft der Vokalreduktion noch verstärkt: 55 Neben den silben- und akzentzählenden Sprachen wurde mit den sog. morenzählenden Sprachen ein dritter Typ identifiziert, als deren Prototyp das Japanische gilt. Hierbei ist die Grundeinheit die Mora, eine Art ‘Gewichtsmaß’ für Sprachen, die zwischen ‘leichten’ (einmorigen) und ‘schweren’ (zweimorigen) Silben unterscheiden (vgl. Pompino-Marschall 2009: 248). 56 Eine Ausnahme ist das Katalanische, das zu den silbenzählenden Sprachen gerechnet wird, jedoch regelmäßige Vokalreduktion aufweist. So wird z.B. im Zentralkatalanischen zugrundeliegendes / a/ in unbetonter Position als Schwa realisiert, z.B. bany ‘Bad’ / ba»/ Ù [ba»] vs. banyar ‘baden’ / ba»a/ Ù [b »a]. 170 (4: 1) a. sp. fonología [fo.no.lo xi.a] b. engl. phonology [f nð.l .d¯i] oder (Schnellsprechform) [ fnð.l .d¯i] Während im spanischen Wort fonología sowohl die Vokale der metrisch starken Silbe -gíals auch die der unbetonten Silben als Vollvokale realisiert werden, tritt im englischen Pendant hierzu in den unbetonten Silben Vokalreduktion auf: So wird der Vokal der vorletzten Silbe (oder Pänultima, vgl. 4.3) normalerweise zum Schwa-Laut [ ] reduziert, und der Vokal in der vortonigen Silbe phokann sogar vollkommen getilgt werden. Hierdurch entsteht in der Schnellsprechform (Beispiel 4: 1b) ein komplexer Onset [fn], eine Konsonantenkombination, die im Spanischen auch bei hoher Sprechgeschwindigkeit kaum vorkommt. Die Zugehörigkeit einer Sprache zum silben- oder zum akzentzählenden Typ korreliert also mit phonologischen Faktoren wie Vokalreduktion und Silbenstruktur. Dauer (1983) hat diese Erkenntnis zum Anlass genommen, die klassische Rhythmustypologie durch entsprechende Messungen zu überprüfen: auf der Basis von u.a. spanischen, italienischen und englischen Daten hat sie gezeigt, dass die postulierte, auf der Isochroniehypothese basierende Dichotomie empirisch nicht haltbar ist. Anstelle der Klassifizierung als akzent- oder silbenzählend schlug sie vor, die verschiedenen Sprachen auf einem Kontinuum zwischen zwei Polen zu situieren, die durch phonologische Eigenschaften wie die genannten bestimmt sind. Auer & Uhmann (1998: 253) haben neben Vokalreduktion und Silbenstruktur weitere Faktoren wie die Komplexität der Akzentregeln und die Stabilität der Silbengrenzen bei unterschiedlicher Sprechgeschwindigkeit 57 hinzugenommen und auf dieser Basis eine Typologie prototypischer akzent- und silbenzählender Sprachen aufgestellt. Zwischen diesen beiden Polen lassen sich bspw. die Sprachen Spanisch und Italienisch, die im Sinne der klassischen Rhythmustypologie lapidar dem silbenzählenden Typus zugeschlagen wurden, differenzierter einordnen, wobei das Spanische wegen der geringeren Längungseffekte und der weniger komplexen Silbenstrukturen näher am silbenzählenden Pol anzusiedeln ist (vgl. auch Bertinetto 1989, Auer 2001). Nachdem klar geworden war, dass weder die ursprüngliche Isochroniehypothese noch die damit verbundene Dichotomie empirisch haltbar sind, hat sich die Rhythmusforschung in unterschiedliche Richtungen weiterentwickelt. Zum einen wurde die u.a. von Dauer (1983) und Auer & Uhmann (1998) vorgeschlagene Herangehensweise weitergeführt, die auf Korrelationen zwischen phonologischen Eigenschaften (Silbenstruktur, Vokalreduktion) abzielt. Ein weiterer Forschungszweig nimmt die phonetische Oberfläche stärker in den Blick und setzt die Dauern bestimmter Einheiten des Sprachsignals zueinander in Relation (vgl. Schafroth & Selig 2012: 7ff.). Einige der sich hieraus ergebenden Rhythmusmaße (engl. rhythm metrics, sp. métricas rítmicas) werden wir im folgenden Kapitel eingehend besprechen. 57 Damit ist gemeint, dass sich in akzentzählenden Sprachen bei hoher Sprechgeschwindigkeit Silbengrenzen oft verschieben, z.B. wenn Vokale elidiert werden (vgl. das englische Beispiel in 4: 1b: vier Silben ([f nð.l .d¯i]) bei langsamem, drei Silben bei schnellem Sprechtempo [ fnð.l .d¯i]). In silbenzählenden Sprachen wie dem Spanischen bleiben Silbengrenzen und -anzahl eher konstant; jedoch sind entsprechende Verschiebungen auch hier nicht ausgeschlossen, vgl. die sog. sinalefa (Zusammenziehen aufeinanderfolgender Vokale) und die in schnellem Sprechtempo auftretende Gleitlautbildung bei Vokalabfolgen, die normgemäß als Hiatus realisiert werden, z.B. Va al teatro / baalteato/ Ù [bal tja.to]; vgl. 2.5.3.2 und 4.2). 1 ! " 171 4.4.2 Neuere Ansätze: Dauerbasierte Rhythmusmaße In einem einflussreichen Aufsatz haben Ramus et al. (1999) gezeigt, dass Neugeborene ihre Umgebungssprache auf der Basis der Dauer von Vokalen erkennen können und dafür argumentiert, nicht mehr die Silbe als Basis für die Rhythmusanalyse anzusehen, sondern vielmehr die Länge vokalischer und intervokalischer (d.h. konsonantischer) Intervalle im Sprachsignal als grundlegend zu betrachten. Diese Intervalle müssen nicht immer mit Silbengrenzen zusammenfallen: So umfasst etwa in la platea [la.pla.te.a] ‘Parkett (im Theater)’ das dritte vokalische Intervall die beiden Segmente [e.a], obwohl diese in der Regel als Hiatus (vgl. 2.5.3.2 und 4.2) realisiert und durch eine Silbengrenze voneinander getrennt werden. Ebenso gelten die aufeinanderfolgenden Konsonanten [pl] als ein einziges konsonantisches Intervall. Abb. 4.4-3 Segmentierung von sp. la platea mit Grundfrequenzverlauf (weiße gestrichelte Linie). Laut Ramus et al. (1999) wird der rhythmische Eindruck, den die Hörer von einer Sprache haben, maßgeblich durch zwei Aspekte bestimmt, die sich in Form von dauerbasierten Rhythmusmaßen erfassen lassen: Zum einen durch den prozentualen Gesamtanteil des vokalischen Materials im Sprachsignal (%V), zum anderen durch die Variabilität der vokalischen und konsonantischen Intervalle. Diese wird ausgedrückt durch die Standardabweichung 58 der Dauern vokalischer bzw. konsonantischer Intervalle ( V bzw. C, zu lesen als ‘Delta V bzw. C’). Abb. 4.4-4 zeigt die Verteilung der von Ramus et al. (1999) untersuchten Sprachen in Bezug auf den vokalischen Anteil (%V) und die Variabilität der konsonantischen Intervalle (ûC); analysiert wurde die Leseaussprache von vier weiblichen Versuchspersonen pro Sprache (je fünf Aussagesätze mit 15-19 Silben). 58 Die Standardabweichung ist ein Maß für die Streubreite der Werte eines Merkmals (Beispiel: Dauer der vokalischen Intervalle) um dessen Mittelwert; sie drückt damit die durchschnittliche ‘Entfernung’ der Dauern aller vokalischen Intervalle vom Mittelwert aus. vokalische (v) und konsonant. (c) Intervalle Segmente (IPA) Silbenstruktur orthogr. Transkription 172 Abb. 4.4-4 Das Spanische im Vergleich zu anderen Sprachen nach Ramus et al. (1999: 273). Auf der x-Achse ist der prozentuale Gesamtanteil vokalischen Materials aufgetragen (%V), auf der y-Achse der Wert für die Variabilität der konsonantischen Intervalle (ûC). Wie aus Abb. 4.4-4 hervorgeht, weisen traditionell als akzentzählend charakterisierte Sprachen wie Englisch oder Niederländisch geringere Werte für %V auf, jedoch sind sie durch eine höhere Variabilität konsonantischer Intervalle (ûC) charakterisiert als die romanischen Sprachen (hier: Spanisch, Italienisch, Französisch und Katalanisch) und auch als das Japanische. Allerdings lassen sich auch innerhalb der Gruppe der silbenzählenden Sprachen gewisse Unterschiede konstatieren: Vergleicht man das Spanische mit dem Italienischen, so liegt letzteres in Bezug auf beide Werte höher. Dies lässt sich u.a. dadurch erklären, dass das Italienische komplexere Silbenstrukturen zulässt als das Spanische (z.B. den Anfangsrand [ strato] in it. strato ‘Schicht’ im Gegensatz zu sp. estrato [es tato]) und zudem im Vergleich zum Spanischen eine deutlich stärkere Tendenz zur Längung betonter Silben aufweist (vgl. Krämer 2009: 163f. und 4.4.3). Die schematische Darstellung in Abb. 4.4-5 verbindet die klassische Rhythmustypologie mit der intervallbasierten Analyse: Die hellgrauen Flächen in der jeweils zweiten Reihe symbolisieren vokalische Intervalle (v). Diese sind in silbenzählenden Sprachen (oben) in Bezug auf ihre Dauer weniger variabel und machen in akzentzählenden Sprachen (unten) einen geringeren Gesamtanteil im Sprachsignal aus. Abb. 4.4-5 Vokalische Intervalle in silbenzählenden (oben) und akzentzählenden Sprachen (unten). Dunkelgrau: betonte Silbe (Ú), weiß: unbetonte Silbe (Ú), hellgrau: vokalisches Intervall (v). Grabe & Low (2002) haben dafür argumentiert, dass beim Bemessen der Intervallvariabilität auch die Frage mit einbezogen werden sollte, ob sich aufeinanderfolgende (vokalische bzw. konsonantische) Intervalle in ihrer Dauer stark voneinander unterscheiden oder ob die Längenunterschiede zwischen benachbarten Intervallen eher EN Englisch DU Niederländisch PO Polnisch SP Spanisch IT Italienisch FR Französisch CA Katalanisch JA Japanisch 1 ! " 173 gering sind. Sie haben deshalb den sog. paarweisen Variabilitätsindex (PVI, engl. pair-wise variability index, sp. índice de variabilidad por pares) vorgeschlagen, der das erste mit dem zweiten Intervall vergleicht, das zweite mit dem dritten, das dritte mit dem vierten etc. Der Vorteil dieser Herangehensweise wird in Abb. 4.4-6 deutlich: Berechnet man für die hypothetischen Sprachen A und B den vokalischen Gesamtanteil und die Standardabweichung vokalischer Intervalldauern (ûV), ergeben sich jeweils identische Werte. Die Berechnung des vokalischen PVI bezieht jedoch die jeweils unterschiedliche Distribution (Verteilung) der einzelnen Intervalle im Sprachsignal mit ein und berücksichtigt, dass in Sprache A die aufeinanderfolgenden vokalischen Intervalle tendenziell gleich sind (hier: drei kurze vokalische Intervalle, gefolgt von zwei langen), wohingegen sich in Sprache B lange und kurze vokalische Intervalle abwechseln. Der vokalische PVI-Wert ist damit für Sprache A niedriger als für Sprache B. Silbenzählende Sprachen wie das Spanische entsprechen dem Typ A, akzentzählende Sprachen wie das Deutsche oder das Englische dem Typ B (vgl. Grabe & Low 2002: 528). Abb. 4.4-6 Schematischer Vergleich der Abfolge vokalischer (grau schraffiert) und konsonantischer Intervalle in einer Sprache A (gleichmäßige Abfolge vokalischer Intervalldauern: niedriger Wert für den vokalischen PVI) und einer Sprache B (unregelmäßige Abfolge vokalischer Intervalldauern: hoher Wert für den vokalischen PVI). Als ein letztes Verfahren für die Berechnung der Dauervariabilität führen wir den sog. Variabilitätskoeffizienten für vokalische bzw. konsonantische Intervalle (VarcoV bzw. VarcoC; vgl. Dellwo & Wagner 2003, Dellwo 2006) an. Es handelt sich um einen in Bezug auf die Sprechgeschwindigkeit normalisierten Wert, der berechnet wird, indem man die Standardabweichung der Intervalle (also den bereits eingeführten Wert für ûV bzw. ûC) durch deren gemittelte Dauer teilt und (zur Vermeidung allzu vieler Nachkommastellen) mit 100 multipliziert. Wie White & Mattys (2007: 508) gezeigt haben, unterscheiden sich silben - und akzentzählende Sprachen insbesondere in Bezug auf den VarcoV-Wert, der für ihre Daten (je fünf gelesene Aussagesätze von sechs Sprechern pro Sprache) im Spanischen mit 41 niedriger liegt als etwa im Englischen mit 64 oder im Niederländischen mit 65. Das Französische, eine weitere silbenzählende Sprache, weist hier einen Wert von 50 auf und liegt damit zwar über dem für das Spanische errechneten Wert, jedoch deutlich unter den Werten sog. akzentzählender Sprachen. Die besprochenen Berechnungsverfahren zum Erfassen des Sprachrhythmus auf der Basis dauerbasierter Eigenschaften können allerdings keinen Absolutheitsanspruch erheben. Da sich die Verteilung längerer und kürzerer Intervalle aus der Kombinatorik der einzelnen Wörter eines Textes bzw. einer Äußerung ergibt, hängen die Ergebnisse stark davon ab, welches Sprachmaterial untersucht wird. Damit die Resultate über die untersuchten Sprachen hinweg vergleichbar sind, ist es wichtig, Daten zu analysieren, die in Bezug auf das Vorkommen einzelner Silbentypen für die jeweilige Sprache repräsentativ sind. Um den Einfluss segmentaler Kombinatorik so weit wie möglich auszuschließen, wurde in jüngeren Studien auch Material verwendet, (A) (B) 174 das für die untersuchten Sprachen gleichartig bzw. identisch ist (z.B. nur aus CV- Silben bestehende Sätze oder in einzelsprachliche Kontexte eingebettete, für alle Sprachen gleiche Fantasiewörter, vgl. etwa Benet et al. 2012). Generell kann man nicht erwarten, dass verschiedene Studien mit z.T. sehr unterschiedlichem Testdesign für eine bestimmte Sprache oder Varietät zu exakt den gleichen Ergebnissen kommen. Aussagekräftig sind aber die Relationen zwischen den Werten für unterschiedliche Sprachen bzw. Varietäten innerhalb einer Studie bzw. bei methodisch parallel vorgehenden Studien. Zusammenfassend lässt sich sagen, dass die auf den Dauern vokalischer und konsonantischer Intervalle basierenden Rhythmusmaße die Einteilung der Sprachen in rhythmische Klassen flexibler machen, da mögliche Zwischenstufen auf einem Kontinuum zwischen den Polen ‘silbenzählend’ und ‘akzentzählend’ ausgedrückt werden können. Es ergeben sich hierbei folgende Korrelationen: - Silbenzählende Sprachen weisen tendenziell hohe Werte für %V und niedrige Werte für den vokalischen und konsonantischen PVI sowie für VarcoV/ C auf. - Akzentzählende Sprachen zeichnen sich durch tendenziell niedrige Werte für %V und hohe Werte für den vokalischen und konsonantischen PVI sowie für VarcoV/ C aus. Zusammenfassung: Dauerbasierte Rhythmusmaße Die vorgestellten Rhythmusmaße lassen sich wie folgt als Formeln darstellen: %V * 100 1. Bilde die Summe (ý) aus den einzelnen Dauern (d V ) der vokalischen Intervalle (1 bis n) des zu analysierenden Satzes. 2. Teile das Ergebnis durch die Gesamtdauer des zu analysierenden Satzes (d Satz ). 3. Multipliziere das Ergebnis mit 100. V/ C 1. Bilde jeweils die Differenz zwischen den einzelnen Dauern der vokalischen bzw. konsonantischen Intervalle (1 bis n) und dem Mittelwert aller vokalischen bzw. konsonantischen Intervalle ( μ V/ C ). Der Mittelwert wird berechnet, indem man die Dauern der einzelnen Intervalle aufsummiert und durch die Anzahl der Intervalle teilt. 2. Quadriere jeweils die Einzelergebnisse und summiere sie auf. 3. Teile die sich hieraus ergebende Summe durch die Anzahl der Intervalle (n). 4. Ziehe aus dem Ergebnis die Quadratwurzel. n 1 d Satz d V n (d V1/ C1 - μ V/ C ) 2 +…+(d Vn/ Cn - μ V/ C ) 2 1 ! " 175 PVI | d k - d k+1 | / (n - 1) 1. Bilde jeweils die Differenz zwischen den Dauern d von zwei aufeinanderfolgenden Intervallen (d k - d k+1 ), d.h. subtrahiere die Dauer des zweiten Intervalls von der des ersten (k=1 Ù 1+1 = 2), die des dritten von der des zweiten (k=2 Ù 2+1 = 3) etc. 2. Bilde die Summe (ý) aus den einzelnen Dauerdifferenzen 3. Teile das Ergebnis durch die Anzahl der Paare (n-1). Mit dieser Formel berechnet man den sog. ‘rohen’ PVI-Wert (rPVI) für vokalische bzw. konsonantische Intervalle. Darüber hinaus haben Grabe & Low (2002) einen normalisierten PVI (nPVI) vorgeschlagen, bei dem die einzelnen Dauerdifferenzen der Paare (s.o., Schritt 1) jeweils durch den Mittelwert der so miteinander verrechneten Intervalldauern des betreffenden Paares geteilt werden. VarcoC/ V 1. Multipliziere den ûV/ C-Wert (s.o.) mit 100. 2. Dividiere das Ergebnis durch den Mittelwert ( μ ) aller vokalischer bzw. konsonantischer Intervalle. Berechnung der Rhythmusmaße mit Correlatore Die Berechnung der Rhythmusmaße muss nicht manuell erfolgen, sondern kann auf der Basis entsprechend vorbereiteter Praat TextGrids (vgl. 2.3.3) mit der von Paolo Mairano entwickelten Software Correlatore vorgenommen werden, die kostenfrei unter http: / / www.lfsag.unito.it/ correlatore/ index_en.html heruntergeladen werden kann (vgl. Mairano & Romano 2010). Hierzu ist zunächst die (für Windows oder Mac verfügbare) Software auf dem Rechner zu installieren. Befinden sich die TextGrids im selben Ordner wie das Programm, werden sie beim Start automatisch gefunden; andernfalls müssen sie über die Funktion Open file bzw. Open folder in den Arbeitsspeicher geladen werden. Für die Berechnungen benötigt Correlatore TextGrids mit jeweils nur einem interval tier, der die Segmentierung in vokalische und konsonantische Intervalle enthält. Zur deren Vorbereitung kann man die Software EasyAlign nutzen, die eine halbautomatische Segmentierung des Sprachsignals ermöglicht (vgl. 2.3.3). Die Intervalle müssen im TextGrid jeweils mit den Kleinbuchstaben c und v bezeichnet werden (der oberste tier in Abb. 4.4-8 gibt ein entsprechendes Beispiel). Sprachliches Material, das für die Analyse nicht berücksichtigt werden soll, z.B. Sprechpausen oder Passagen mit Sprechunflüssigkeiten (engl. hesitation phenomena, sp. disfluencia), kann entweder mit der Raute ‘#’ kennzeichnet werden oder frei bleiben. Um die Rhythmusmaße zu berechnen, müssen die geladenen TextGrids markiert werden. Klickt man auf den Befehl Segmentation and rhythm metrics, öffnet sich ein Fenster. Bei der hier beschriebenen Vorgehensweise mittels CV-Segmentierung muss aus einem Dropdown-Menü zunächst die entsprechende Label-Konvention (CV) ausgewählt werden. Beim Klicken auf den Befehl Go! öffnet sich ein weiteres Fenster, in dem die einzelnen Intervalldauern sowie Werte für die unterschiedlichen Rhythmusmaße tabellarisch n-1 k=1 μ V/ C V/ C * 100 176 aufgelistet sind. Diese Werte lassen sich als Textdatei sichern (Save to file) sowie als Grafik darstellen (Draw chart) und dann in allen gängigen Grafikformaten (jpg, gif etc.) abspeichern. Um eine Grafik zu erstellen, müssen die Werte zunächst dem sog. report zugefügt werden, eine Art Zwischenspeicher, auf den das in Correlatore integrierte Grafikprogramm zugreift (Add to report). Es kann jeweils ausgewählt werden, welches Rhythmusmaß auf der xbzw. y-Achse aufgetragen werden soll. Weitere Informationen sind in der Hilfsfunktion des Programms enthalten. 4.4.3 Rhythmische Besonderheiten im Spanischen: Dialekte, Kontakt- und Lernervarietäten Wir haben in 4.4.2 gesagt, dass das Spanische traditionell zur Gruppe der silbenzählenden Sprachen gerechnet wird. Zugleich haben wir darauf hingewiesen, dass das Erfassen rhythmischer Charakteristika durch Intervallmessungen und die darauf basierenden Rhythmusmaße eine flexible Einteilung auch innerhalb ein und derselben Sprachgruppe erlaubt. Es liegt also nahe, dass sich auch einzelne Dialekte einer Sprache in Bezug auf dauerbasierte Merkmale unterscheiden. Im Folgenden wollen wir mit dem kastilischen Spanisch (Madrid) und dem argentinischen Porteño-Spanisch (Buenos Aires) zwei Varietäten betrachten, die nicht nur in Bezug auf die Phoneminventare (vgl. 2.5.1.2, 3.1.2), sondern auch in der Prosodie stark voneinander abweichen. Wir gehen in diesem Abschnitt nur auf den Sprachrhythmus ein; tonale Unterschiede zwischen diesen beiden Varietäten skizzieren wir im Kapitel zur Intonation (vgl. 4.5.4). Die in Abschnitt 4.4.2 erwähnte Auswertung von Ramus et al. (1999) hat gezeigt, dass das europäische Spanisch in Bezug auf den vokalischen Gesamtanteil (%V) und die Variabilität konsonantischer Intervalle (ûC) niedrigere Werte aufweist als das Italienische. Vor diesem Hintergrund ist es interessant, mit dem in der argentinischen Hauptstadt gesprochenen Porteño-Spanischen (< puerto ‘Hafen’ von Buenos Aires) eine Varietät zu betrachten, die aufgrund migrationsbedingten Kontakts maßgeblich durch das Italienische beeinflusst ist. 59 Dabei wollen wir überprüfen, inwieweit sich der italienische Einfluss auch im Sprachrhythmus manifestiert. Zwischen ca. 1860 und 1950 haben sich etwa 3,5 Mio. italienische Immigranten aus unterschiedlichen Regionen in Argentinien niedergelassen, die meisten von ihnen in der Hauptstadt und in den angrenzenden Provinzen. Der Großraum Buenos Aires war folglich durch einen hohen Anteil italienischer Bevölkerung bestimmt, die nach und nach das Spanische als Zweitsprache erlernte. Nach einer längeren Periode spanisch-italienischer Zweisprachigkeit, insbesondere im urbanen Milieu der Hauptstadt, ist Argentinien heute zwar eindeutig ein spanischsprachiges Land, doch lassen sich im Sprachrhythmus des argentinischen Spanisch deutliche Spuren dieses Kontakts nachweisen (vgl. Gabriel & Kireva 2012, Peåková et al. 2012b). McMahon (2004) hat dafür argumentiert, die ‘Italianisierung’ als ein Phänomen des Transfers prosodischer Eigenschaften aufzufassen: beim Erlernen der neuen Sprache übertragen die italienischen Einwanderer prosodische Merkmale ihrer Muttersprache Italienisch (L1) auf die Fremdsprache Spanisch (L2). 59 So weist das Porteño-Spanische im familiären Wortschatz zahlreiche italienische Lehnwörter auf, die in anderen Varietäten des Spanischen nicht gebräuchlich sind (z.B. laburo ‘Arbeit’< it. lavoro; manyar ‘essen’ < it. mangiare). 1 ! " 177 Unter Transfer (lat. transferre ‘hinübertragen’; auch: Trans- oder Interferenz) versteht man das Übertragen muttersprachlicher Strukturen auf eine Fremdsprache (oder umgekehrt von einer Fremd- oder Zweitsprache auf die Muttersprache). Transfer erfolgt auf allen sprachlichen Ebenen und kann sowohl Wortschatz (Lexik), Formenbestand (Morphologie), Wortstellung (Syntax), Bedeutungsebene (Semantik) sowie segmentale und prosodische Phonologie betreffen. Die Übertragung lautlicher Eigenheiten ist maßgeblich für die Wahrnehmung eines fremdsprachlichen Akzents. Vor dem Hintergrund der Transferhypothese ist die prosodische und insbesondere rhythmische Beschaffenheit des heutigen Porteño-Spanischen nicht zuletzt dadurch zu erklären, dass sich Eigenschaften der Lernervarietät im Spanischen Argentiniens verfestigt haben. Bezogen auf den Sprachrhythmus besteht also zu erwarten, dass sich die italienisch beeinflusste argentinische Kontaktvarietät ähnlich verhält wie das Italienische. Sie sollte zudem dem L2-Spanischen italienischer Muttersprachler gleichen, die heute die europäische Standardvarietät des kastilischen Spanisch in Madrid erlernen und dabei den Sprachrhythmus ihrer Muttersprache auf die Zielsprache übertragen. Kontakt- und Lernervarietäten sollten also ähnliche rhythmische Charakteristika aufweisen. Benet et al. (2012) und Gabriel & Kireva (2012) haben auf der Basis der Auswertung von gelesenen und semi-spontansprachlichen Daten gezeigt, dass dies in der Tat der Fall ist. Wie Abb. 4.4-7 zeigt, weist das Italienische sowohl einen höheren vokalischen Gesamtanteil (%V) als auch einen höheren VarcoV-Wert auf als das kastilische Spanisch, was im Großen und Ganzen den aus der Literatur bekannten Werten entspricht (vgl. Ramus et al. 1999). Die für die hier skizzierte Studie aufgenommenen italienischen Sprecher leben seit einigen Jahren in Madrid und haben dort das kastilische Spanisch als Fremdsprache erlernt. Die von ihnen produzierten fremdsprachlichen Daten des (L2-)Spanischen zeigen, dass der Sprachrhythmus der Muttersprache in die Zielsprache transferiert wird. Ausschlaggebend ist hierbei vor allem die starke Längung der Tonsilben, die aus dem Italienischen übernommen wird. Interessanterweise gehen hierbei die L2-Werte jeweils sogar über die Werte des Italienischen hinaus eine solche ‘Verstärkung’ rhythmischer Eigenschaften beim Transfer ist bereits in ähnlichen Studien bei anderen Sprachenkombinationen festgestellt worden (vgl. White & Mattys 2007). Gleiches gilt auch für die italienisch beeinflusste Kontaktvarietät, das Porteño-Spanische: Die Werte für %V und VarcoV unterscheiden sich nur unwesentlich von denen des L2-Spanischen italienischer Muttersprachler Ergebnisse, die die Transferhypothese stützen. Vergleichende Studien zu weiteren spanischen Varietäten haben gezeigt, dass hier ebenfalls wenn auch in geringerem Umfang rhythmische Unterschiede bestehen: So hat Toledo (2010) Daten aus den Regionen Aragón, Granada und Canarias miteinander verglichen und für die beiden erstgenannten Varietäten auf der Basis von PVI-Berechnungen eine höhere Variabilität vokalischer Intervalle festgestellt. Weiterhin hat O’Rourke (2008) Daten aus zwei peruanischen Varietäten analysiert und gezeigt, dass das Spanische monolingualer Sprecher aus Lima einen höheren vokalischen PVI aufweist als die Varietät der bilingualen Sprecher aus Cuzco, die neben dem Spanischen das Quechua verwenden. In Bezug auf möglichen rhythmischen Transfer beim L2-Erwerb wurde zudem gezeigt, dass Sprecher akzentbzw. silbenzählender Sprachen die rhythmischen Eigenschaften ihrer L1 jeweils auf die der anderen Gruppe angehörende Zielsprache über- 178 tragen; so etwa in der bereits erwähnten Studie von White & Mattys (2007), die das L2-Spanische englischer Muttersprachler und das L2-Englische spanischer L1-Sprecher untersucht haben. Eine Übertragung dauerbasierter Merkmale wurde auch für den Erwerb der Fremdsprache Deutsch durch argentinische Muttersprachler konstatiert (vgl. Pulzován de Egger 2002). Abb. 4.4-7 Vokalischer Gesamtanteil (%V) und Dauervariabilität vokalischer Intervalle (VarcoV) in den Varietäten Spanisch L1 (Kastilisch), Italienisch, L2-Spanisch italienischer Muttersprachler und Porteño-Spanisch. Material: Lesetext El viento del norte y el sol bzw. La tramontana e il sole; Mittelwerte von je sechs Sprechern pro Varietät. Mithilfe von Praat und Correlatore lassen sich derartige Studien selbst durchführen. So findet man im universitären Kontext bspw. leicht Spanischlerner mit unterschiedlichem sprachlichen Hintergrund; das von ihnen produzierte fremdsprachliche Spanisch kann dann mit Kontrolldaten von spanischen Muttersprachlern sowie mit entsprechendem Material aus der L1 der Lerner verglichen werden. Grundsätzlich ist es hilfreich, sich bei der Segmentierung in C- und V-Intervalle an phonetischen Kriterien zu orientieren, die in der Literatur bereits erprobt wurden. Der folgende Kasten gibt hierzu einen Überblick. Phonetische Kriterien zur Segmentierung bei der Rhythmusanalyse Abb. 4.4-8 illustriert die Segmentierung und Annotation unseres Beispielsatzes ¿Tiene mandarinas? in einem Praat TextGrid, wie es als Grundlage für die Rhythmusanalyse dienen kann. Der erste tier enthält die Segmentierung in konsonantische und vokalische Intervalle, jeweils mit Kleinbuchstaben c und v bezeichnet; der zweite beinhaltet die phonetische Transkription der einzelnen Segmente. Im dritten tier werden die einzelnen Silben nach Silbentyp klassifiziert (z.B. Tie- [tje] Ù CVV, ne- [ne] Ù CV, man- [man] Ù CVC etc.); dies kann sinnvoll sein, wenn man das Material in Bezug auf die enthaltenen Silbenstrukturen kontrollieren möchte. Im vierten tier wird der vom Sprecher produzierte Text in Form einer orthographischen Transkription wiedergegeben. Die tiers lassen sich mit Hilfe von EasyAlign automatisch erstellen (vgl. 2.3.3). Wichtig ist, dass für die Analyse mit Correlatore nur der erste tier benötigt wird (vgl. Kasten in Abschnitt 4.4.2). Hierzu dupliziert man am besten das gesamte TextGrid und löscht die nicht benötigten tiers (Menü Tier > zu löschenden tier markieren > Befehl Remove entire tier). %V VarcoV Porteño-Spanisch Spanisch L2 Italienisch Spanisch L1 (Kastilisch) 50 45 40 40 35 45 50 55 1 ! " 179 Abb. 4.4-8 Segmentierung und Annotation des Beispielsatzes ¿Tiene mandarinas? Die Segmentierung des Sprachsignals in konsonantische und vokalische Intervalle ist im Einzelfall oft weniger trivial als man vielleicht zunächst denkt. Sie erfordert bestimmte Entscheidungen, die bei der Vorbereitung des Materials konsequent durchgehalten werden müssen, um die Ergebnisse konstant zu halten. Folgendes sollte man dabei beachten: Sprechpausen und durch Sprechunflüssigkeiten gekennzeichnete Passagen werden nicht berücksichtigt. Gleitlaute werden zum vokalischen Intervall gezählt, wenn im Sonagramm keine Friktion erkennbar ist (Grabe & Low 2002). Grundsätzlich sind die vom Sprecher konkret produzierten Lautsegmente Ausgangspunkt für die Segmentierung, nicht etwa die von der Norm vorgesehene Aussprache oder gar die zugrundeliegenden Phoneme. Wenn das Material bspw. den in intervokalischer Position regelhaft spirantisierten Plosiv / d/ enthält, wird dieser nur dann als konsonantisch gewertet, wenn die Friktion von [®] im Sonagramm erkennbar ist. Wird das betreffende Segment, wie es normalerweise der Fall ist, als friktionsloser Approximant realisiert (vgl. 2.5.1.1, 4.2.3), zählt es zum vokalischen Intervall. Beginnt das Sprachsignal nach einer Sprechpause mit einem Plosiv, so wird dessen Beginn einheitlich 0,05 Sekunden vor der (im Sonagramm sichtbaren) Verschlusslösung gesetzt (Mok & Dellwo 2008). Ein Beispiel hierfür ist das mit [t] anlautende Wort tienen in Abb. 4.4-8. Intervallgrenzen werden an sog. positiven Nulldurchgängen gesetzt, d.h. dort, wo die im Oszillgramm dargestellte Schwingungskurve die Nulllinie von unten durchschreitet. Hierzu muss man mit der Zoom-Funktion in Praat (Knopf in; links unten) das Oszillogramm entsprechend vergrößern; der positive Nulldurchgang an der Grenze vom vokalischen zum konsonantischen Intervall in mandarinas (a|nd) ist in Abb. 4.4-9 durch die gestrichelte Linie angezeigt. 180 Abb. 4.4-9 Beispiel für die Setzung einer Intervallgrenze am positiven Nulldurchgang (gestrichelte Linie in Oszillogramm und Spektrogramm). 4.5 Intonation Nachdem wir uns mit den dauerbasierten Charakteristika verschiedener Sprachen und insbesondere des Spanischen befasst haben, wenden wir uns mit der Sprachmelodie oder Intonation einer zweiten zentralen prosodischen Eigenschaft von Sprache zu. Unter Intonation versteht man den systematischen Gebrauch des Tonhöhenverlaufs (Grundfrequenz; F 0 ) in einem Sprachsystem. Grundsätzlich differenziert man zwischen zwei Sprachtypen, den Tonsprachen und den sog. reinen Intonationssprachen (engl. intonation-only languages, Gussenhoven 2004: 12). In einem ersten Schritt skizzieren wir, was diese beiden Typen in Bezug auf die systematische Verwendung von F 0 unterscheidet (4.5.1), bevor wir in einem weiteren Schritt auf das modellhafte Erfassen der Tonalität im traditionsreichen Ansatz nach Navarro Tomás (1944) eingehen (4.5.2) und uns anschließend mit dem sog. Autosegmental-Metrischen (AM-)Modell vertraut machen, das insbesondere in der neueren Forschung für die Beschreibung und Analyse des Spanischen nutzbar gemacht wurde (4.5.3). Diesem theoretischen Rahmen ist auch die exemplarische Darstellung der Tonsysteme des in Madrid, Buenos Aires und Mexiko-Stadt gesprochenen Spanisch verpflichtet (4.5.4). Abschließend behandeln wir mit der prosodischen Phrasierung die Strukturierung größerer Einheiten durch F 0 und nehmen das Zusammenspiel von Prosodie und Syntax bei der Vermittlung der Informationsstruktur in den Blick (4.5.5). # 181 4.5.1 Tonsprachen und reine Intonationssprachen In 4.3.4 haben wir gezeigt, dass der Wortakzent im Spanischen eine kontrastive Funktion hat und dass er außer durch die (in den meisten Varietäten eher geringe) Längung der Tonsilbe vor allem durch eine Bewegung der Grundfrequenz markiert wird. Wie Abb. 4.5-1 verdeutlicht, manifestiert sich der Unterschied zwischen dem Substantiv número und den Verbformen numero (1. Sg. Präs.) und numeró (3. Sg. Perf.) maßgeblich in der Tonkontur der einzelnen Wörter, genauer gesagt im F 0 -Gipfel, der jeweils die betonte Silbe anzeigt. Auf die spezifische Form dieser als Tonhöhenakzente (auch: Akzenttöne, engl. pitch accents, sp. acentos tonales) bezeichneten F 0 -Gipfel gehen wir in 4.5.3 und 4.5.4 genauer ein. Wichtig ist, dass Tonhöhenakzente nicht immer als Hochpunkte/ Gipfel realisiert werden müssen; ausschlaggebend ist vielmehr die wie auch immer geartete Bewegung der Kontur, die sich im Umfeld der betonten Silbe auch als Tiefpunkt/ Tal manifestieren kann. [mi n u m e o me n u m e o m e n u m e o ] Abb. 4.5-1 F 0 -Konturen von sp. mi número, me numero, me numeró (nach Hualde 2005: 241). Den Ausdruck lexikalischer Kontraste (d.h. unterschiedlicher Wortbedeutungen) durch die unterschiedliche Position der Akzentstelle und die damit verbundene Tonhöhenbewegung in ansonsten lautlich identischen Wörtern kennen wir auch aus anderen Sprachen: So kontrastiert z.B. im Deutschen Tenor ‘hohe Männerstimme’ mit Tenor ‘Inhalt, Duktus (eines Schriftstücks o.ä.)’ oder umfahren ‘fahrend ausweichen’ mit umfahren ‘fahrend anstoßen und zu Boden werfen’, im Englischen content ‘Inhalt’ mit content ‘zufrieden’ oder im Italienischen calamità ‘Niederlage’ mit calamita ‘Magnet’. In sog. Tonsprachen ist es auch möglich, in einsilbigen Wörtern, die segmental identisch sind, lexikalische Kontraste durch Tonhöhenunterschiede auszudrücken. Dies hat zur Folge, dass in diesen Sprachen (fast) jede Silbe für eine bestimmte F 0 - Bewegung spezifiziert ist. Ein Beispiel hierfür ist das Mandarin-Chinesische, 60 das über vier lexikalische Töne sowie einen sog. neutralen Ton verfügt. Wird z.B. die Silbe [ma] mit einer hohen F 0 -Kontur ausgesprochen (1. Ton), resultiert das Wort m ‘Mutter’. Dieselbe segmentale Sequenz mit dem 2. Ton (steigend) bedeutet ‘Hanf’ (má ), mit dem 3. Ton (fallend-steigend) ‘Pferd’ (m ) und mit dem 4. Ton (fallend) ‘(be)schimpfen’ (mà ). In Abb. 4.5-2 sind die F 0 -Konturen der vier lexikalischen Töne dargestellt. 60 Neben dem Chinesischen zählen zahlreiche weitere asiatische und auch afrikanische Sprachen zu dieser Sprachgruppe; für einen Überblick vgl. Yip (2004). 182 Abb. 4.5-2 Die vier lexikalischen Töne des Mandarin-Chinesischen. Bei dem tonal nicht spezifizierten ma (neutraler Ton) handelt es sich um eine Interrogativpartikel, die aus einem Aussageeinen Fragesatz macht, z.B. M mà m ‘Die Mutter beschimpft das Pferd’ Ù M mà m ma? ? ‘Beschimpft die Mutter das Pferd? ’. 61 In Abb. 4.5-3 geben wir eine mögliche tonale Realisierung dieses Fragesatzes wieder. Während bei den ersten beiden Wörtern die lexikalischen Töne (1. Ton hoch bzw. 4. Ton fallend) gut zu erkennen sind, weist im Wort m (3. Ton fallend-steigend) die F 0 -Kontur eine Unterbrechung auf. Grund hierfür ist die sog. Knarrstimme (engl. creaky voice), die oft auftritt, wenn wie für den 3. Ton typisch die Grundfrequenz ein für den Sprecher besonders tiefes Register erreicht. Deutlich erkennbar ist jedoch der F 0 -Anstieg am Ende der Silbe, der im zeitlichen Rahmen der tonal unspezifizierten Fragepartikel ma bis zum Ende des Satzes weitergeführt wird. [ ma ] 1. Ton [ ma ] 4. Ton [ ma ] 3. Ton [ ma ] neutral 50 100 200 300 [ ma ] 1. Ton [ ma ] 4. Ton [ ma ] 3. Ton [ ma ] neutral 50 100 200 300 Abb. 4.5-3 Links: F 0 -Verlauf des chinesischen Fragesatzes M mà m ma? ? ; rechts: stilisierte Tonkontur. Die in Abb. 4.5-3 steigende Schlusskontur ergibt sich also aus der Kombinatorik der lexikalischen Töne. Befindet sich unmittelbar vor der Fragepartikel ein Wort mit fallendem Ton wie z.B. dàifu ‘Arzt’ in N shì dàifu ma? ? ‘Bist du Arzt? ’, kann die Gesamtkontur des Fragesatzes auch fallend sein. Dies ist möglich, da der interrogative Satzmodus bereits eindeutig durch die Fragepartikel angezeigt wird. Auch im Spanischen weisen Fragesätze, die durch funktionale Elemente eindeutig als solche markiert werden, nicht zwangsläufig eine steigende Schlusskontur auf. Dies ist der Fall bei sog. Teil- oder Ergänzungsfragen (auch: Wort-, Pronominal- oder Wh-Fragen 62 , sp. interrogativas parciales oder pronominales) wie ¿Qué compraste? , wo 61 Die Beispielsätze sind zwar grammatisch, aber abgesehen vom konstruierten Inhalt nicht besonders idiomatisch, da im Chinesischen alle (nicht zusammengesetzten) Wörter zwar einsilbig sind, in konkreter Rede jedoch nicht immer in ihrer monosyllabischen Grundform auftreten. Ein gängiges Verfahren ist die Verdoppelung der lexikalischen Grundeinheit wie in m ma ‘Mutter’. Durch Verwendung des Zweisilbers ergibt sich hier eine Art ‘prosodisches Gleichgewicht’ zwischen Subjekt (m ma) und Verbalphrase (mà m ). 62 Der Terminus ‘Wh-Frage’ entstammt der Terminologie der generativen Syntaxforschung und rührt daher, dass englische Fragewörter meist mit <wh> beginnen (z.B. who, where). # 183 der Satzmodus durch das Fragewort qué anzeigt wird. Bei spanischen Ja/ Nein-Fragen (auch: absolute oder totale Fragen, sp. interrogativas absolutas oder totales) kann die Intonation jedoch als einzige Markierung des Fragemodus fungieren: So besteht der Unterschied zwischen der Aussage Tienen mandarinas und der Frage ¿Tienen mandarinas? allein darin, dass im Interrogativsatz die Tonkontur nach der letzten betonten Silbe -ribis zum rechten Satzrand hin kontinuierlich ansteigt. 63 Neben der Markierung des Satzmodus hat die Intonation eine regulative Funktion: So kann ein Sprecher durch die Modulation der Stimme die Abgeschlossenheit seines Redebeitrags anzeigen und damit im Diskurs einen Sprecherwechsel einleiten oder durch eine steigende Kontur zum Satzende hin deutlich machen, dass er noch weitersprechen möchte. Ferner wird F 0 genutzt, um größere Redeeinheiten intern zu strukturieren und bspw. Wichtiges hervorzuheben oder bereits Erwähntes in den Hintergrund zu rücken, also um die sog. informationsstrukturelle Gliederung eines Satzes oder einer größeren Äußerung zu markieren (vgl. 4.5.5). Schließlich ist die parasprachliche Funktion der Intonation zu nennen, wenn sie z.B. zum Ausdruck von Emotionen genutzt wird; bei Freude bspw. durch eine Vergrößerung der tonalen Spannweite hoch tief (auch: Ambitus, engl. pitch range, sp. campo tonal), bei Trauer durch ein eingeschränktes, komprimiertes F 0 -Register. 64 Die tonale Markierung lexikalischer Kontraste im Sinne der für das Chinesische typischen Eigenschaft ist im Spanischen jedoch nicht möglich. Das Spanische zählt damit zur Gruppe der reinen Intonationssprachen, also zu den Sprachen, die eine systematisch organisierte Sprachmelodie aufweisen, nicht jedoch über die Möglichkeit verfügen, lexikalische Kontraste in einsilbigen Wörtern durch Tonhöhenkontraste auszudrücken. In reinen Intonationssprachen wird die Tonhöhe systematisch genutzt, um Satzmodus, Sprecherwechsel sowie Informationsstruktur zu markieren und parasprachliche Informationen wie z.B. Emotionen wiederzugeben. Tonsprachen drücken darüber hinaus auch lexikalische Kontraste durch F 0 aus. Eine grundlegende, wahrscheinlich universelle (und damit für Ton- und reine Intonationssprachen zutreffende) Eigenschaft der Sprachmelodie ist, dass diese über eine Äußerung vom Anfang bis zum Ende hin absinkt. Daraus ergibt sich eine fallende Gesamtkontur, wobei jedes F 0 -Maximum etwas tiefer ist als das ihm vorausgehende. Dieses Phänomen, das vermutlich auf das Absinken des subglottalen Drucks zurückzuführen ist (Pompino-Marschall 2009: 246), wird als Deklination 65 oder mit dem englischen Terminus downtrend (sp. escalonamiento descendente) bezeichnet. Dieses Absinken des Referenzpunktes ist den Sprechern nicht bewusst, da es bei der Intonation 63 Dies gilt bspw. für das in Madrid gesprochene Spanisch; andere Varietäten kennen hiervon abweichende Fragekonturen, vgl. 4.5.4. 64 Die Intonation ist jedoch selten einziger Ausdruck von Emotionen: So drückt sich eine positive Einstellung des Sprechers oft durch stärkere Stimmhaftigkeit, eine negative jedoch durch Entstimmung des gesamten Sprachsignals aus (vgl. Kohler & Niebuhr 2007). Einen Überblick zur parasprachlichen Funktion von F 0 gibt Kubarth (2009: 219ff.). 65 Man sollte sich nicht dadurch irritieren lassen, dass der gleiche Terminus in der Morphologie die Flexion nominaler Kategorien (Substantive, Adjektive, Pronomina) bezeichnet. In der phonologischen Fachliteratur wird nicht immer zwischen Deklination/ downtrend und dem weiter unten erläuterten Phänomen des downstep unterschieden. 184 ohnehin um relative F 0 -Kontraste und nicht um absolute Tonhöhen geht. Das bedeutet, dass ein am Schluss einer Äußerung platzierter Tonhöhengipfel als solcher wahrgenommen wird, auch wenn er absolut gesehen tiefer ist als der Beginn der Äußerung. Manche Sprachen, darunter das Spanische, kennen zusätzlich das Phänomen des finalen Absenkens (engl. final lowering, sp. descenso final, vgl. Prieto et al. 1996), das darin besteht, dass der Grundfrequenzverlauf in einer tonalen Einheit noch stärker absinkt, als regulär vorhergesagt würde. Deklination und finales Absenken sind in der F 0 -Kontur des spanischen Aussagesatzes María está comiendo mandarinas in Abb. 4.5nnen. Abb. 4.5-4 Spanischer Aussagesatz mit fallender Gesamtkontur (Deklination und final lowering); Darstellung orientiert an Pompino-Marschall (2009: 247). Hieraus resultiert jedoch nicht, dass Intonationskonturen in ihrem Gesamtverlauf grundsätzlich fallend sind: So haben wir schon gesehen, dass eine Wortfolge wie Tienen mandarinas durch den finalen Anstieg als Fragesatz markiert werden kann (s.o. ¿Tienen mandarinas? ÿ). Auch bei der internen Gliederung größerer Redeeinheiten treten solche Tonhöhenanstiege auf (sog. prosodische Phrasierung, vgl. 4.5.5.1) oder auch einfach dann, wenn ein Sprecher anzeigen möchte, dass er noch nicht zu Ende gesprochen hat und das Wort deshalb nicht an den Gesprächspartner abgeben möchte (regulative Funktion). Neben diesen F 0 -Anstiegen am Schluss einer Äußerung oder vor einer prosodischen Grenze kommt es auch vor, dass aufeinanderfolgende Tonhöhengipfel innerhalb einer prosodischen Einheit heraufbzw. herabgestuft, also höher bzw. tiefer realisiert werden als erwartet. Dieses Phänomen bezeichnet man auch im Deutschen meist mit den englischen Termini upstep bzw. downstep (sp. escalonamiento ascendente vs. descendente). Da es in verschiedenen Sprachen und Varietäten unterschiedlich verwendet wird, verweisen wir hierzu auf die Darstellung der spanischen Intonation in 4.5.4 und 4.5.5. 4.5.2 Erfassen und Systematisieren: Konfigurationen und Ebenen Bis in die 1980er Jahre war die Intonationsforschung weitgehend der linguistischen Schule des Strukturalismus verpflichtet und vornehmlich auf die Beschreibung, Inventarisierung und Systematisierung wiedererkennbarer Tonmuster in einzelnen Sprachen ausgerichtet. Bolinger (1951) hat in einer zusammenfassenden Darstellung zwischen zwei Typen von Ansätzen unterschieden, die entweder die gesamte tonale Konfiguration einer Äußerung als Grundeinheit der Analyse betrachten oder eine obere Grundfrequenz untere Grundfrequenz final lowering 4 gut zu erke # 185 Aufspaltung des Tonhöhenkontinuums in mehrere Ebenen vornehmen. Ziel war jeweils eine Bestandsaufnahme der in der zu beschreibenden Sprache vorliegenden F 0 - Konturen und deren Zuordnung zu bestimmten semantisch-pragmatischen Funktionen bzw. Satzmodi (z.B. steigende Schlusskontur: Fragesatz, fallende Schlusskontur: Aussagesatz etc.). Dabei ging man von der strukturalistischen Grundannahme aus, dass nur das sprachwissenschaftlich relevant ist, was eine Funktion im System erfüllt. Die Frage nach der Repräsentation der Tonkonturen im sprachlichen Wissen stand dabei ebenso wenig im Zentrum des Interesses wie die Relation zwischen abstrakter phonologischer Form und konkreter phonetischer Oberflächenrealisierung. Auch war zunächst keine Einbettung der prosodischen Komponente in den Kontext eines globalen Grammatikmodells angestrebt. Im Folgenden illustrieren wir zunächst die Konfigurationsanalyse anhand der einflussreichen Arbeit zur spanischen Intonation von Navarro Tomás (1944; vgl. 4.5.2.1); den ebenenbezogenen Ansatz stellen wir anhand der von Quilis (1993) vorgeschlagenen Analyse dar (4.5.2.2). Eine detaillierte Bestandsaufnahme der spanischen Intonation erfolgt dann im autosegmental-metrischen Rahmen (4.5.3, 4.5.4). 4.5.2.1 Das Konfigurationsmodell von Navarro Tomás (1944) Tomás Navarro Tomás (1884-1979), der Begründer der experimentellen Phonetik in Spanien, hat als erster die Intonation des Spanischen umfassend beschrieben und systematisierend dargestellt. Ansätze dazu sind bereits in seinem Manual de pronunciación española (1932: 209-135) enthalten; im erstmals 1944 veröffentlichten und seitdem mehrfach wieder aufgelegten Manual de entonación española hat er sie weiter ausgearbeitet. Grundlegend für die Beschreibung der spanischen Tonkonturen ist dabei die Aufteilung des Redekontinuums in sog. grupos melódicos, die wiederum in einzelne Abschnitte unterteilt sein können. Hierin lehnt sich das Modell an die sog. Britische Intonationsschule um Forscher wie Jones (1918), Palmer (1922) und Amstrong & Ward (1926) an, die für das Englische zunächst mit eher sprachdidaktischem als linguistischem Fokus eine Aufteilung der Intonationsphrase in prehead, head und nucleus vorgeschlagen haben (vgl. Wells 2006: 207ff.). Obligatorischer Bestandteil eines grupo melódico ist nach Navarro Tomás der sog. Nukleus (dt. Kern, sp. núcleo), der die letzte betonte Silbe als Trägerin des sog. Nuklearakzents (sp. acento nuclear) 66 sowie eventuelle nachtonige Silben umfasst. Dass ein grupo melódico nur aus einem Nukleus besteht, ist jedoch eher die Ausnahme. Normalerweise geht ihm ein sog. Kopf (sp. cabeza) voran, der von der ersten betonten Silbe der melodischen Gruppe bis zum linken Rand des als Nukleus bezeichneten Teils reicht. Sind der ersten Tonsilbe des Kopfes unbetonte Silben vorgeschaltet, werden diese nicht dem Kopf zugerechnet, sondern als ein weiterer fakultativer Abschnitt aufgefasst. Diesen dem prehead der Britischen Schule entsprechenden, bei Navaro Tomás jedoch nicht genauer benannten Anfangsteil des grupo melódico hat Kubarth (2009: 236) in seiner Darstellung des Modells als ‘Auftakt’ bezeichnet. Beispiel (4: 2) zeigt eine mögliche Aufteilung des (verkürzten) ersten Satzes aus dem Nordwind-Text 67 in melodische 66 Unter dem Nuklearakzent (auch Satzakzent) versteht man die am stärksten wahrgenommene Tonsilbe in einer größeren prosodischen Einheit (vgl. 4.5.5.1). 67 In der lateinamerikanischen Version schließt der erste Satz des Textes nicht wie in den Beispielen (4: 2) und (4: 4) angegeben, sondern wird durch den temporalen Nebensatz … cuando pasó un viajero envuelto en una gruesa capa ergänzt (s. Anhang). 186 Gruppen, wobei der dritte grupo melódico in Ermangelung einer vortonigen Silbe am Beginn des Kopfes keinen Auftakt aufweist. (4: 2) Auftakt Kopf (cabeza) Nukleus (núcleo) El viento del norte y el sol es- -taban dispu- tándose sobre cual de ellos era el más fuerte. Die melodische Gestaltung des Nukleus, also der Schlusskontur (sp. inflexión final), ist nach Navarro Tomás für die semantisch-pragmatische Interpretation einer Äußerung maßgeblich. Diese Nuklearkonfiguration wird auch im autosegmental-metrischen Ansatz als zentrale Analyseeinheit wieder aufgegriffen (vgl. 4.5.4). Bei den Aussagesätzen unterscheidet Navarro Tomás zwischen fünf distinktiven F 0 -Verläufen, die er in Anlehnung an den Phonembegriff als Toneme (sp. tonemas) bezeichnet und deren Tonumfang in Form von Halbtönen (sp. semitonos) angegeben wird (vgl. Navarro Tomás 1944: 51ff., 69f.). In Beispiel (4: 3) wird der Tonhöhenverlauf der fünf tonemas charakterisiert. (4: 3) Tonem Beschreibung der F 0 -Kontur a. cadencia stark fallend (um 8 Halbtöne) a.’ semicadencia leicht fallend (um 2-4 Halbtöne) b. anticadencia stark steigend (um 4-5 Halbtöne) b.’ semianticadencia leicht steigend (um 2-3 Halbtöne) c. suspensión gleichbleibend Der starke finale F 0 -Abfall der cadencia markiert in der Regel das Ende einer abgeschlossenen neutralen Aussage; in der abgeschwächten Form der semicadencia tritt der F 0 -Abfall innerhalb größerer prosodischer Einheiten auf. Die stark steigende anticadencia dient innerhalb größerer Äußerungen zur internen Strukturierung, so etwa zwischen Haupt- und Nebensatz; die leicht steigende semianticadencia zeigt oft das Ende der einzelnen Glieder in Aufzählungen an oder auch die Untergliederung zwischen einzelnen Satzgliedern wie einem komplexen Subjekt und der folgenden Verbalphrase. Die tonal gleichbleibende suspensión ist nach Navarro Tomás auf Einschübe wie z.B. adverbiale Ergänzungen, Appositionen oder Vokative beschränkt. In (4: 4) geben wir ein Beispiel für eine mögliche tonale Beschreibung des bereits in (4: 2) analysierten Satzes. Die drei gestrichelten Linien zeigen jeweils approximativ ein tiefes, mittleres bzw. hohes Tonniveau an. Es handelt sich jedoch nicht um eine Einteilung des F 0 -Kontinuums im Sinne des Ebenen-Ansatzes, der unterschiedliche Tonhöhenniveaus dezidiert in die Beschreibung der Konturen mit einbezieht (vgl. 4.5.2.2). (4: 4) El viento del norte semianticadencia y el sol semianticadencia estaban disputándose anticadencia sobre cual de ellos semianticadencia era el mas fuerte cadencia # 187 Die hiermit angesprochene Untergliederung größerer Redeeinheiten durch tonale Signale wird auch als prosodische Phrasierung bezeichnet; in Abschnitt 4.5.5 befassen wir uns im Rahmen des Autosegmental-Metrischen Modells genauer mit diesem Phänomen. Für Fragesätze hat Navarro Tomás (1944: Kapitel 4) eine umfangreiche Typologie von tonal unterschiedlich markierten Strukturen ausgearbeitet, die hier nicht im Einzelnen dargestellt werden soll (für eine Zusammenfassung vgl. Kubarth 2009: 239- 243). Generell unterscheidet er zwischen der Ja/ Nein- und der Ergänzungsfrage. Der erste Fragetyp ist (zumindest in der von Navarro Tomás analysierten kastilischen Standardvarietät) durch eine fallend-steigende Kontur (Kopf: fallend, Nukleus: steigend) gekennzeichnet (4: 5a); beim zweiten Typ wird das im Spanischen normalerweise an den Satzanfang gestellte Wh-Wort durch einen F 0 -Gipfel markiert, woraus sich eine fallende Gesamtkontur über Kopf und Nukleus hin ergibt (4: 5b): (4: 5) a. ¿Tienen mandarinas? b. ¿Quién trajo el paquete? Die in Navarro Tomás’ Konfigurationsmodell postulierten Musterkonturen sind jeweils mit bestimmten satzsemantischen und pragmatischen Funktionen verbunden, also im strukturalistischen Sinne als Verbund von Form und Funktion und damit als phonologisch zugrundeliegende Toneinheiten (tonemas) aufzufassen. Letztlich bleibt aber unklar, wie der Zusammenhang zwischen diesen tonemas und der konkret von den Sprechern produzierten Oberfläche (F 0 -Kontur) beschaffen ist, da nur idealisierte Konturen präsentiert werden und somit die potentielle phonetische Variation tonaler Konturen nicht erfasst wird. 4.5.2.2 Das Ebenenmodell von Quilis (1993) Während das Konfigurationsmodell in seiner Grundidee der Britischen Intonationsschule verpflichtet ist, orientiert sich das im Folgenden darzustellende Modell eher an der US-amerikanischen Tradition und übernimmt die Idee unterschiedlicher tonaler Ebenen von Forschern wie Pike (1945), der für das Englische vier solcher tonal levels angesetzt hat. Antonio Quilis nimmt in seinem Tratado de fonología y fonética españolas (1993) 68 für das Spanische drei niveles tonales an, die wie folgt durchnummeriert werden: / 3/ alto, / 2/ medio und / 1/ bajo; hinzu kommen mit der fallenden ( ) und der steigenden (ÿ) Schlusskontur zwei sog. junturas terminales (Quilis 1993: 422f.). In seinem Analyseverfahren greift Quilis (1993: 447-453) auf real produzierte F 0 -Konturen zurück und versieht einzelne Silben mit einer das Tonniveau bezeichnenden Ziffer / 1-3/ . Dabei ist Niveau / 3/ weitgehend auf emphatische Sprechweise beschränkt, so etwa auf die afirmación enfática, die pregunta pronominal enfática und die exclamación. Das Ende einer jeden Intonationseinheit wird mit dem Symbol für die fallende oder steigende Schlusskontur versehen ( bzw. ÿ). Die einzelnen Grundelemente fasst Quilis (1993: 424) als fonemas prosódicos oder suprasegmentales auf; die sich hieraus ergebenden kontrastierenden Tonkombinationen werden als morfemas de entonación verstanden, die den segmentalen Phonemen übergeordnet sind. In (4: 6) 68 In Quilis (1993) sind zahlreiche Arbeiten zusammengefasst; die dort vorgeschlagene Intonationsanalyse geht teils auf deutlich ältere Studien zurück (z.B. Quilis 1975, 1981). 188 illustrieren wir die distinktive Funktion solcher Intonationsmorpheme anhand der Gegenüberstellung eines Aussagesatzes und des syntaktisch identischen Fragesatzes in der von Quilis (1993: 428, 430) vorgeschlagenen Analyse. In der Originaldarstellung im Tratado werden real gemessene F 0 -Konturen reproduziert, die hier schematisch wiedergegeben werden. (4: 6) 1 2 1 2 1 1 2 1 1 2 / estubiéroN esperáNdo / / estubiéroN esperáNdo ÿ/ 69 a. Estuvieron esperando. b. ¿Estuvieron esperando? Als konstitutiv für den satzsemantischen Unterschied zwischen Aussage und Frage führt Quilis die Schlusskonturen / 2 1 / bzw. / 1 2 ÿ/ an. Diese werden wie die Notation in Schrägstrichen deutlich macht als phonologisch zugrundeliegende Einheiten aufgefasst. Kubarth (2009: 246f.) hat zu Recht auf die Problematik des Ansatzes hingewiesen: Die Ebenennotation steht oft in deutlichem Widerspruch zur produzierten F 0 -Kontur, so etwa bei der mit / 1 2/ bezifferten Silbenabfolge -peránin Beispiel (4: 6a). Zwar ist eine Diskrepanz zwischen konkret produzierter Oberfläche und zugrundeliegender phonologischer Struktur durchaus nichts Ungewöhnliches, doch wird hier nicht explizit gemacht, weshalb ein und dieselbe Tonsilbe, nämlich die Nuklearsilbe -ránim Falle des Aussagesatzes zugrundeliegend mit einem mittleren Ton / 2/ , im Fragesatz jedoch mit einen Tiefton / 1/ verbunden sein soll. Nachvollziehbarer wäre die Annahme, dass der mit der Nuklearsilbe verbundene Ton zugrundeliegend jeweils identisch ist. Die unterschiedlichen F 0 -Konturen könnten dann als Oberflächenvariation interpretiert werden, die durch die nachfolgende juntura terminal ( vs. ÿ) bedingt wird. Auch ist bei den einzelnen Analysen nicht immer nachvollziehbar, welche Silben überhaupt tonal spezifiziert sind: So werden bei den in (4: 6) wiedergegebenen Beispielen in esperando sowohl die Tonsilbe -ranals auch die vor- und nachtonige Silbe (-pe-, -do) mit einem eigenen nivel tonal versehen, während dies im Fall von estuvieron nur für die haupt- und nebenakzenttragenden Silben (es-, -vie-) gilt. Zudem werden einige Silben mit zwei niveles tonales versehen, ohne dass dies unmittelbar einleuchtet. Betrachten wir hierzu die von Quilis (1993: 432, 453) vorgeschlagene Analyse zweier Wh- und einer Ja/ Nein-Frage: (4: 7) 2 1 2 1 2 2 1 21 2 2 3 / kuáNdo biénes / / ké bás a aéR / / kiéres beníR ÿ/ a. ¿Cuándo vienes? b. ¿Qué vas a hacer? c. ¿Quieres venir? Während in (4: 7a) ¿Cuándo vienes? die letzte Silbe der Äußerung mit / 1/ tonal einfach spezifiziert ist, trägt die Endsilbe in (4: 7b) ¿Qué vas a hacer? eine Art ‘doppelten’ Ton / 21/ , obwohl die F 0 -Kontur keinen Unterschied aufweist. Auf den ersten Blick könnte dies zwar der Tatsache geschuldet sein, dass hacer im Gegensatz zu vienes endbetont ist, doch trägt auch das gleichfalls oxytone venir in (4: 7c) nur einen einfa- 69 Mit Großbuchstaben wie / N/ und / R/ verweist Quilis auf die entsprechenden Archiphoneme (vgl. 3.1.1); betonte Silben werden gemäß der Transkriptionskonvention der Revista de Filología española (RFE) durch den Akut angezeigt. # 189 chen Ton. Ein grundsätzlicher Vorteil der Spezifizierung ein und derselben Silbe mit mehreren tonalen Grundelementen ist jedoch darin zu sehen, dass dies ein differenzierteres Erfassen der im zeitlichen Rahmen der betreffenden Silbe konstatierten F 0 - Bewegung ermöglicht. Im Rahmen des Autosegmental-Metrischen Modells, das wir in den folgenden Abschnitten vorstellen, wird diese Idee konsequent weiterverfolgt. 4.5.3 Phonologisierung und Theoretisierung: Das Autosegmental-Metrische Modell und seine Anwendung auf das Spanische In Abschnitt 4.5.2 haben wir zwei Ansätze zum Erfassen der spanischen Intonation vorgestellt, die von dem seit dem Strukturalismus grundlegenden Unterschied zwischen phonologischer Struktur und phonetischer Oberfläche ausgehen. Wir haben jedoch auch darauf hingewiesen, dass in beiden Ansätzen der Bezug zwischen den Ebenen nicht immer hinreichend präzisiert wird. Das im Folgenden einzuführende Autosegmental-Metrische (AM-)Modell versteht sich ebenfalls als ein phonologisches Analysemodell, doch lässt sich der Anspruch einer durchgehenden Ebenentrennung hier konsequenter einlösen. Zusätzlich zur Phonologisierung der Intonationsforschung ist ein verstärktes Bemühen um Einbettung in den Kontext umfassender Grammatikmodelle zu verzeichnen, also eine stärkere Theoretisierung der Intonationsforschung. Dies zeigt sich unter anderem daran, dass das Verhältnis zwischen unterschiedlichen Analyseebenen, etwa zwischen phonetischer Oberfläche und phonologischer Struktur, aber auch zwischen einzelnen phonologischen Ebenen (Segmentstruktur, Tonstruktur), genauer definiert wird. Zum anderen rücken sog. Schnittstellenphänomene wie etwa der Zusammenhang von Intonation und Wortstellung stärker ins Blickfeld Aspekte sprachlicher Struktur, die sich weder ausschließlich phonologisch/ prosodisch noch ausschließlich syntaktisch erfassen lassen, sondern als Produkte des komplexen Zusammenspiels unterschiedlicher Ebenen (Phonologie, Syntax) zu erklären sind und damit bei der Analyse einen Rückgriff auf mehrere Module des sprachlichen Wissens erfordern (vgl. hierzu 4.5.5). In diesem Abschnitt stellen wir zunächst die Grundannahmen des theoretischen Rahmens dar (4.5.3.1) und führen in die für das Spanische adaptierte Version des AM-basierten Transkriptionssystems ToBI (Tone and Break Indices) ein (4.5.3.2), bevor wir die Intonation dreier spanischer Varietäten in den Blick nehmen (4.5.4) und uns abschließend der Diskursgliederung mittels F 0 und dem Zusammenhang zwischen Syntax, Prosodie und Informationsstruktur widmen. 4.5.3.1 Bausteine der Intonation im AM-Modell: Tonhöhenakzente und Grenztöne Das ursprünglich von Pierrehumbert (1980) für die Analyse der englischen Intonation entwickelte AM-Modell (vgl. auch Ladd 2008) stellt derzeit einen in der internationalen Intonationsforschung weit verbreiteten Ansatz dar, auf dessen Grundlage in jüngster Zeit auch Vorschläge für die Modellierung der spanischen Intonation erarbeitet wurden. Eine zentrale Annahme ist die Unterscheidung zwischen zwei Typen von tonalen Grundeinheiten, den sog. Tonhöhenakzenten (auch: Akzenttöne, engl. pitch accents, sp. acentos tonales; gekennzeichnet durch den Asterisk ‘*’) und den sog. Grenztönen (engl. boundary tones, sp. tonos de frontera oder de juntura; angezeigt durch das Prozentzeichen ‘%’). Erstere sind mit den metrisch starken (auch: betonten, akzentuierten oder Ton-)Silben (sp. sílabas métricamente fuertes) verbunden, Letztere 190 mit den Rändern größerer oder kleinerer prosodischer Einheiten. Man sagt auch, dass die Töne mit akzentuierten Silben bzw. prosodischen Grenzen assoziieren. Gemäß der Prosodischen Hierarchie (Selkirk 1984, Nespor & Vogel 2007; vgl. 4.1) wird bei der tonalen Grenzmarkierung zwischen hierarchisch höheren Intonationsphrasen (IP) und den von ihnen dominierten Intermediärphrasen (ip) unterschieden. Entsprechend differenziert man auch zwischen zwei Arten von grenzmarkierenden Tönen, die mit den Rändern dieser Phrasen assoziieren: Während die mit der IP-Ebene verbundenen tonalen Grundelemente in der Regel einfach als Grenztöne bezeichnet werden (L%, H% etc.), spricht man in Bezug auf die hierarchisch tiefer angesiedelten ip-Grenztöne auch von Phrasentönen (engl. phrase accents, sp. acentos de frase; symbolisiert durch das Minuszeichen ‘-’). 70 Weiterhin wird eine terminologische Unterscheidung zwischen zwei Typen von metrisch starken Silben und den mit ihnen assoziierten Tonhöhenakzenten gemacht: Das ist einmal der Nuklearakzent (auch: Satzakzent; engl. nuclear accent, sp. acento nuclear) - die am stärksten wahrgenommene Akzentstelle, die sich im Spanischen normalerweise am rechten Satzrand befindet (bei orthographischen Transkriptionen durch Großbuchstaben hervorgehoben); zum anderen die Pränuklearakzente (engl. prenuclear accents, sp. acentos prenucleares), die diesem vorausgehen. In einer radikalen Vereinfachung des Ebenenmodells (4.5.2.2) werden nur zwei relative Tonhöhen angenommen, ein Hochton H (engl. high tone, sp. tono alto) und ein Tiefton L (engl. low tone, sp. tono bajo); in neueren Versionen kommt allerdings nur in Form eines Grenztons manchmal ein mittlerer Ton M (engl. mid tone, sp. tono medio) hinzu, der teilweise auch in den nachfolgend diskutierten Analysen der spanischen Intonation eine Rolle spielt. Wichtig ist, dass sowohl Tonhöhenakzente als auch Grenztöne einfach oder komplex, d.h. aus allen potentiell möglichen Kombinationen von Einzeltönen zusammengesetzt sein können (z.B. L, H, LH, HL, LHL, LM etc.). Bei komplexen Tonhöhenakzenten zeigt der Asterisk ‘*’ die sog. Alignierung (engl. alignment, sp. alineamiento) des betreffenden Tons, d.h. die Position des F 0 -Gipfels bzw. -abfalls im Verhältnis zur metrisch starken Silbe an (vgl. 4.5.3.2). In Abb. 4.5-5 wird gezeigt, wie die im AM-Modell angenommenen tonalen Basiseinheiten mit den Ebenen der Prosodischen Hierarchie verbunden sind. Im Gegensatz zur in 4.1 gegebenen Darstellung handelt es sich um eine reduzierte Fassung der Prosodischen Hierarchie, die auf die hier relevanten Ebenen beschränkt ist: Die Silbe (Ú) als potentieller Ankerpunkt für Tonhöhenakzente; der Fuß ( ) als erste kombinatorische Einheit unterhalb des phonologischen Wortes ( ), das wiederum als Domäne des Wortakzents für die tonale Gestaltung einzelner lexikalischer Einheiten relevant ist; die Intermediärphrase (ip) und die Intonationsphrase (IP). 71 Im AM-Modell sind sowohl die Tonhöhenakzente als auch die Grenztöne auf einer autonomen Tonschicht (engl. tonal tier, sp. nivel tonal) repräsentiert, die von den Ebenen der Proso- 70 Den Terminus phrase accent hat Pierrehumbert (1980) aus einer Arbeit von Bruce (1977) zum Wort- und Satzakzent des Schwedischen übernommen. In späteren Versionen des AM- Modells wurde er zum mit der Intermediärphrase assoziierten Grenzton uminterpretiert; auch wir sprechen im Folgenden von ip-Grenztönen. 71 Die (ohnehin umstrittene) Ebene der Klitischen Gruppe wird nicht in die Darstellung mit einbezogen; sie wäre oberhalb der Wortebene anzusetzen und würde eventuelle nichtakzentogene Funktionswörter wie Artikel oder unbetonte Objektpronomina beinhalten, die in die Akzentdomäne desjenigen lexikalischen Wortes fallen, an das sie klitisch gebunden sind (vgl. die Diskussion in 4.1 und 4.3.5.1). # 191 dischen Hierarchie unabhängig ist. Dies stellt einen wichtigen Unterschied zum Ebenenmodell nach Quilis (1993) dar, der die Töne den Silben direkt zuordnet und damit keine gesonderte Tonschicht annimmt (vgl. 4.5.2.2). Aus der Annahme einer autonomen Tonschicht erklärt sich zum Teil auch der Name des Modells: die Tonschicht ist autosegmental, d.h. von den auf der Silbenschicht (Ú) zu Silben kombinierten Segmenten unabhängig und explizit nicht in die Prosodische Hierarchie eingebunden. Das Modell hat damit sozusagen einen dreidimensionalen Charakter, was in Abb. 4.5- 5 durch die Darstellung der Tonschicht in Form eines grauen Quaders angedeutet wird. Der zweite Teil der Bezeichnung, also der Bestandteil ‘metrisch’, erklärt sich durch die zentrale Bedeutung der metrischen Struktur für die Organisation der Intonation. Gemeint ist damit die Abhängigkeit der Tonkontur von den Akzentstellen der Wörter und damit auch von den Regeln, die die Akzentzuweisung steuern (vgl. 4.3). In Abb. 4.5-5 wird die jeweilige Assoziierung der Töne mit den Ebenen der Prosodischen Hierarchie hier: Silbe (Ú) bzw. ip und IP durch gestrichelte Linien verdeutlicht; die Klammerung des Grenztons am linken Rand der IP zeigt an, dass dieser optional ist und bspw. nur dann vorkommt, wenn ein Sprecher etwa in emphatischer Rede eine Äußerung mit einem besonders hohen F 0 -Wert ansetzt. Da es sich um ein allgemeines Modell handelt, werden (mit Ausnahme des fakultativen hohen initialen Grenztons %H) keine spezifischen Töne angegeben; die Symbole T*, Tbzw. T% stehen hier für jeden beliebigen Tonhöhenakzent, ipbzw. IP-Grenzton. Der letzte Tonhöhenakzent in der IP ist der Nuklear- oder Satzakzent (durch einen Kreis markiert); metrisch starke Silben sind durch Unterstreichung gekennzeichnet (Ú). Abb. 4.5-5 Prosodische Hierarchie und Tonschicht im AM-Modell. Grundlegend für die AM-basierte Intonationsphonologie ist weiterhin die bereits angesprochene strikte Trennung zwischen der phonologisch zugrundeliegenden Tonstruktur und der vom Sprecher produzierten F 0 -Kontur. Diese wird aufgefasst als das Resultat sog. phonetischer Interpolation zwischen den tonalen Zielpunkten (engl. tonal targets, sp. metas tonales), die durch die auf der Tonschicht repräsentierten, zugrundeliegenden Tonhöhenakzente und Grenztöne determiniert werden. Anders als im bereits vorgestellten Konfigurationsansatz, der sozusagen ‘fertige’ Musterkonturen als zugrundeliegend annimmt, geht man hier davon aus, dass die phonologische phonol. Wort 192 Struktur lediglich die Eck- und Wendepunkte der Kontur determiniert. Wie dies genau funktioniert, erläutern wir in Abschnitt 4.5.3.2. Aus dem Bedürfnis, die Intonation stärker in den Kontext umfassender Grammatikmodelle einzubinden, folgt auch das Bestreben, die Intonation einer Sprache in Form einer tonalen Grammatik (auch: Intonationsgrammatik, engl. tonal grammar) zu erfassen. Mit dem Modell der wohlgeformten Intonationsphrase haben Beckman & Pierrehumbert (1986) eine übereinzelsprachlich gültige Tongrammatik erarbeitet, die alle in einer IP potentiell möglichen Tonkombinationen enthält. 72 Das in Abb. 4.5- 6 wiedergegebene Modell ist wie folgt zu lesen: Am linken Rand der IP kann fakultativ ein hoher Grenzton erscheinen (%H); der Grenzton am rechten Rand ist hingegen obligatorisch (H% oder L%) und kann mit einem hohen oder tiefen intermediären Grenzton (H- oder L-) zusammenfallen. Die tiefgestellte Ziffer 1 besagt, dass das in der entsprechend markierten Klammer befindliche Element in jeder IP mindestens einmal vorkommt. So besteht eine Intonationsphrase (IP) aus mindestens einer Intermediärphrase (ip), und diese muss mindestens einen Tonhöhenakzent beinhalten. Abb. 4.5-6 Die wohlgeformte Intonationsphrase nach Beckman & Pierrehumbert (1986). 4.5.3.2 Das Notationssystem Spanish ToBI (Sp_ToBI) Eine der ersten umfassenden Beschreibungen der spanischen Intonation auf autosegmental-metrischer Basis hat Sosa (1999) mit seiner Monographie La entonación del español vorgelegt, die u.a. auf seiner Dissertation (Sosa 1991) aufbaut. Parallel hierzu wurde in den frühen 1990er Jahren zunächst für das Englische auf der Basis des AM-Modells das Notationssystem Tone and Break Indices entwickelt (ToBI, Silverman et al. 1992, Beckman et al. 2005), das in der Folgezeit für die tonale Analyse zahlreicher Sprachen adaptiert wurde, darunter das Deutsche (Grice & Baumann 2002, Féry 2012), das Italienische (Grice et al. 2006) und auch das Spanische. Die erste Version des Spanish ToBI (Sp_ToBI) wurde von Beckman et al. (2002) vorgeschlagen, mehrfach überarbeitet (Hualde 2002, 2003a, Sosa 2003, Face 2002, Face & Prieto 2007, Kubarth 2009: 255-308, Estebas-Vilaplana & Prieto 2009) und für die Analyse der tonalen Besonderheiten verschiedener Varietäten ausdifferenziert (Prieto & Roseano 2010). Auch das Intonationskapitel im Phonologie-Band der neuen Akademiegrammatik richtet sich nach diesem Notationssystem (NGRAE 2011: 435-488). 72 Die wohlgeformte Intonationsphrase nach Beckman & Pierrehumbert (1986) ist auf die Grundelemente L (Tiefton) und H (Hochton) beschränkt und enthält nur monotonale Grenztöne sowie mono- und bitonale Tonhöhenakzente. Der mittlere Ton M wurde erst später eingeführt, ebenso wie komplexere Tonverbindungen bei den Grenztönen und Tonhöhenakzenten. H* L* H*+L L*+H L+H* H+L* H - L - H % L % (%H) 1 1 # 193 Wir stellen nun die jüngste Version der spanischen ToBI-Notation exemplarisch vor; für eine umfassende Dokumentation verweisen wir auf die umfangreiche Internetdokumentation, die unter dem Titel Sp_ToBI Training materials neben Informationen zum theoretischen Hintergrund auch umfangreiches Beispielmaterial zum Erlernen und Einüben der Notationsmethode bietet: http: / / prosodia.upf.edu/ sp_tobi/ en (vgl. Aguilar et al. 2009). Ausgangsziel von ToBI ist es, ein einheitliches Notationssystem für konkret produzierte F 0 -Konturen bereitzustellen, um in einem weiteren Schritt auf die als zugrundeliegend anzunehmenden Töne zu schließen. Bei den Tonhöhenakzenten betrachtet man den (steigenden, fallenden oder gleichbleibenden) F 0 -Verlauf im zeitlichen Rahmen metrisch starker Silben: Ist der F 0 -Verlauf dort gleichbleibend tief bzw. hoch, notiert man L* bzw. H* und bringt damit zum Ausdruck, dass ein tiefer bzw. hoher Ton mit der akzentuierten Silbe assoziiert (vgl. Abb. 4.5-7, Töne 1 und 2). Bei komplexen Tönen zeigt der Asterisk die Alignierungseigenschaft, also den F 0 -Verlauf im Verhältnis zur Tonsilbe, an. Erfolgt bei einer steigenden Kontur (low high: L+H) 73 der Anstieg im zeitlichen Rahmen der Tonsilbe und wird der Gipfel innerhalb dieser erreicht, markiert man den hohen Teilton mit dem Asterisk und notiert L+H* (Ton 3); der ihm vorausgehende Teilton L wird als sog. leading tone (von engl. to lead ‘führen, vorangehen’, sp. tono conductor) bezeichnet (vgl. Grice 1995). Handelt es sich um einen heraufgestuften Tonhöhengipfel (upstep, vgl. 4.5.1), zeigt man dies mit dem umgedrehten Ausrufezeichen ‘¡’ an (Ton 4); einen späten Gipfel, der erst nach der Tonsilbe erreicht wird, markiert man mit ‘>’ (Ton 5; vgl. Aguilar et al. 2009, Prieto & Roseano 2010). Ist bei einer steigenden Kontur der F 0 -Verlauf in der metrisch starken Silbe zunächst flach und erfolgt der Anstieg erst in der nachtonigen Silbe, notiert man L*+H (Abb. 4.5-7, Ton 6); der Teilton H wird dann als trailing tone (von engl. to trail ‘nachfolgen’, sp. tono seguidor) bezeichnet. Ein in der betonten Silbe fallender Tonhöhenverlauf wird mit H+L* wiedergegeben (Ton 7). Ein weiteres zentrales Konzept ist das der sog. elbows (wörtl. ‘Ellbogen’, sp. punto de inflexión), worunter man den Übergang vom flachen zum steigenden bzw. fallenden Teil einer F 0 -Kontur (oder umgekehrt) versteht. In den schematischen Darstellungen in Abb. 4.5-7 sind diese Übergänge jeweils idealisiert als Ecken in der Kontur dargestellt, jedoch ist deren genaue Lokalisierung im Sprachsignal nicht immer einfach, da die konkret produzierte Sprachmelodie fließend ist (Del Giudice et al. 2007). Ton Schema Beschreibung (1) L* Gleichbleibend tiefe Kontur (tiefes Plateau) im unteren Bereich der tonalen Spanne des Sprechers (2) H* Gleichbleibend hohe Kontur (hohes Plateau) im oberen Bereich der tonalen Spanne des Sprechers (3) L+H* F 0 -Anstieg und Tonhöhengipfel innerhalb der metrisch starken Silbe 73 Bei komplexen Tonhöhenakzenten werden die Teiltöne meist durch Pluszeichen miteinander verbunden; es gibt jedoch auch Ansätze wie z.B. Féry (2012), die hierauf verzichten. Anstelle von L+H ist dann einfach LH zu notieren. 194 (4) L+¡H* F 0 -Anstieg und ‘heraufgestufter’ (upstepped) Tonhöhengipfel innerhalb der metrisch starken Silbe; höhere tonale Spannweite (pitch range) als bei L+H* (5) L+>H* F 0 -Anstieg innerhalb der metrisch starken Silbe; Tonhöhengipfel in der nachtonigen Silbe oder später, also nach ‘rechts’ verlagert (engl. delayed peak, sp. pico tardío oder desplazado) (6) L*+H Tiefes Plateau innerhalb der metrisch starken Silbe und nachfolgender F 0 -Anstieg; Tonhöhengipfel innerhalb der nachtonigen Silbe (7) H+L* F 0 -Abfall, dessen Beginn mit dem linken Rand und dessen Ende (tiefer Zielpunkt L) ungefähr mit dem rechten Rand der metrisch starken Silbe aligniert sind (8) L+H*+L F 0 -Anstieg und -abfall innerhalb der metrisch starken Silbe. Der Tonhöhengipfel wird in der Regel in der Mitte der Tonsilbe erreicht. Abb. 4.5-7 Schematische Darstellung der Tonhöhenakzente des Spanischen (nach Aguilar et al. 2009, Prieto & Roseano 2010). Die metrisch starke Silbe ist grau hervorgehoben; die schwarze Linie zeigt den F0-Verlauf an. Das Vorkommen der in Abb. 4.5-7 aufgelisteten Tonhöhenakzente wird im folgenden Abschnitt exemplarisch anhand von drei spanischen Varietäten dokumentiert; in diesem Zusammenhang werden wir auch sehen, wie das (zunächst anhand des kastilischen Spanisch erarbeitete) aus zwei monotonalen und fünf bitonalen Tonhöhenakzenten bestehende Inventar für die Analyse dialektaler Besonderheiten erweitert wurde: Ein Beispiel hierfür ist der als Ton (8) in Abb. 4.5-7 geführte tritonale Tonhöhenakzent L+H*+L, der von Gabriel et al. (2010) für die Analyse des argentinischen Porteño-Spanisch eingeführt wurde. Da die entsprechende Kontur im Gegensatz zu den bitonalen Akzenten nicht nur durch einen, sondern durch zwei elbows gekennzeichnet ist (Übergang flach - steigend und fallend - flach), sind hierfür drei tonale Zielpunkte anzusetzen (vgl. 4.5.4.2). Neben den Tonhöhenakzenten werden im Rahmen von ToBI sog. Grenzmarkierungen angenommen und in Form von durchnummerierten break indices (BI) notiert. Dabei wird zwischen stärkeren und schwächeren prosodischen Grenzen unterschieden: Mit BI 4 wird die Grenze der Intonationsphrase (IP) gekennzeichnet, mit BI 3 die einer Intermediärphrase (ip). 74 Weiterhin werden bei der ToBI-Notation Übergänge zwischen phonologischen Wörtern (BI 1) sowie zwischen phonologischem Wort und nicht akzentogenem Funktionswort angegeben (BI 0). Der break index BI 0 bezeichnet hier sozusagen eine ‘Nicht-Grenze’. Ein Beispiel für eine entsprechende Notation findet sich in Abb. 4.5-9. Für die Intonation relevant sind die durch BI 3 und BI 4 be- 74 BI 2 ist für das Spanische nicht relevant; hiermit ist eine Ebene gemeint, die der für manche Sprachen angesetzten Phonologischen Phrase entspricht und die bspw. im Italienischen als Domäne für bestimmte phonologische Prozesse wie etwa das raddoppiamento (fono-)sintattico angesehen wird (vgl. Krämer 2009: 196f). # 195 zeichneten Grenzen, von denen angenommen wird, dass sie mit Grenztönen des Typs Tbzw. T% verbunden sind. Aguilar et al. (2009) setzen hier zusätzlich zu den tonalen Grundeinheiten L und H auch einen mittleren Ton M an, um die an den Rändern der Intonations- und Intermediärphrasen zu beobachtenden Tonhöhenbewegungen genauer zu erfassen. Hierzu werden, wie auch bei den Tonhöhenakzenten, sowohl einzelne als auch komplexe Töne angesetzt (z.B. LH für ein tiefe Kontur mit anschließendem Anstieg bis zur Grenze); die Kombination HH bezeichnet jedoch nicht zwei aufeinanderfolgende Hochtöne, sondern einen stärkeren Anstieg als es bei H der Fall ist. Das Inventar von Grenztönen (BI 3 und BI 4) wird in Abb. 4.5-8 zusammengefasst. Grau hinterlegt ist hier die unmittelbar der Grenze vorausgehende Silbe, unabhängig davon, ob sie betont ist oder nicht. Wie aus der Darstellung ersichtlich wird, kommen nicht alle Grenztöne auf beiden Ebenen vor. Auch hier gilt, dass das Inventar tonaler Grenzmarkierungen zunächst anhand des kastilischen Spanisch aufgestellt und zunehmend erweitert wurde, einerseits mit Blick auf die Vielfalt der Oberflächenrealisierungen intermediärer Phrasengrenzen (vgl. 4.5.5.1 und 4.5.5.4), andererseits in Anbetracht dialektaler Unterschiede (vgl. Prieto & Roseano 2010). Die Tabelle in Abb. 4.5-8 umfasst das von Aguilar et al. (2009) vorgeschlagene Grundrepertoire sowie den hohen Grenzton H% (Ton 3), der im mexikanischen Spanisch in bestimmten Fragesatztypen als BI 4 auftritt (vgl. De-la-Mota et al. 2010: 346 und 4.5.4.3). Ton Schema Beschreibung (1) L-, L% Gleichbleibend tiefe oder abfallende F 0 -Kontur, erreicht an der ipbzw. IP-Grenze den unteren Bereich der tonalen Spannweite des Sprechers (2) M-, M% Gleichbleibend mittlere oder leicht abfallende F 0 - Kontur, erreicht an der ipbzw. IP-Grenze den mittleren Bereich der tonalen Spannweite des Sprechers (3) H-, H% F 0 -Anstieg bis zur ipbzw. IP-Grenze (4) HH-, HH% Starker F 0 -Anstieg bis zur ipbzw. IP-Grenze (5) LH-, LH% Tiefe F 0 -Kontur mit anschließendem F 0 -Anstieg bis zur ipbzw. IP-Grenze (6) LM% Tiefe F 0 -Kontur mit anschließendem leichten F 0 - Anstieg bis zur IP-Grenze (7) HL-, HL% F 0 -Anstieg und -Abfall bis zur IP-Grenze oder gleichbleibend hohe Kontur mit abschließendem F 0 - Abfall bis zur IP-Grenze 196 (8) LHL-, LHL% Tiefe Kontur mit anschließendem F 0 -Anstieg und -Abfall bis zur ipbzw. IP-Grenze Abb. 4.5-8 Schematische Darstellung der Grenztöne des Spanischen (nach Aguilar et al. 2009, Prieto & Roseano 2010). Die sich unmittelbar vor der Grenze befindende Silbe ist grau hervorgehoben; die schwarze Linie zeigt den F0-Verlauf an. Die in Abb. 4.5-7 und 4.5-8 zusammengefassten Tonhöhenakzente und Grenztöne sind zunächst nichts anderes als Labels, die zum schematischen Erfassen der vom Sprecher produzierten F 0 -Kontur dienen. Versieht man eine identifizierte F 0 -Bewegung mit einem bestimmten Tonhöhenakzent oder Grenzton, sagt dies letztlich noch nichts darüber aus, ob der betreffende Ton auch als phonologisch zugrundeliegende Einheit angesehen werden sollte. Hierzu sind weiterführende Überlegungen notwendig, was wir anhand der in Abb. 4.5-9 vorgeschlagenen ToBI-Annotation des Aussagesatzes Está agarrando un gajo de mandarina (produziert von einem Sprecher aus Buenos Aires) 75 verdeutlichen wollen. Die in Abb. 4.5-9 wiedergegebene Äußerung besteht aus einer Intonationsphrase (IP), die in zwei Intermediärphrasen (ip) aufgeteilt ist; die Phrasengrenze wird durch einen hohen ip-Grenzton (H-) angezeigt. Die beiden metrisch starken Silben in der ersten Intermediärphrase ( ip Está agarrando) werden wie für alle spanischen Varietäten typisch durch steigende Tonhöhenakzente markiert, wobei im ersten Fall (está) das F 0 -Maximum am rechten Rand der Tonsilbe erreicht wird (Label: L+H*; vgl. Abb. 4.5-7), während bei agarrando die Kontur über die Grenze der metrisch starken Silbe hin ansteigt und der Tonhöhengipfel am Ende der nachtonigen Silbe platziert ist (nach rechts verlagerter Tonhöhengipfel). Um die vom Sprecher produzierte Kontur korrekt zu erfassen, ist hier gemäß Abb. 4.5-7 der Tonhöhenakzent L+>H* anzusetzen. Die zweite Intermediärphrase ( ip un gajo de mandarina) beinhaltet ebenfalls zwei metrisch starke Silben, wobei die erste als steigender Tonhöhenakzent L+H* realisiert wird (gajo), die zweite als Tiefton L* (mandarina). Der fundamentale Unterschied zwischen Nuklear-/ Satzakzent und den ihm vorausgehenden Pränuklearakzenten rechtfertigt die Annahme zweier phonologisch zugrundeliegender Töne: So erfüllt der Nuklearakzent (hier: L*) eine pragmatische Funktion, und zwar insofern als er obligatorisch mit neuer Information verbunden ist (sog. Fokus). Dies gilt nicht für Pränuklearakzente, denn diese können auch bereits bekannte Information markieren (genauer hierzu in Abschnitt 4.5.5). In der ersten ip liegt jedoch kein vergleichbarer Kontrast vor; es handelt sich um zwei aufeinander folgende Pränuklearakzente. Hier kann also von kontextbedingter Oberflächenvariation ausgegangen werden, die durch den hohen ip-Grenzton Hbedingt ist. Ein Analysevorschlag kann also wie folgt lauten: Pränuklearakzente sind im Spanischen von Buenos Aires zugrundeliegend immer / L+H*/ , in der Position vor Hwerden sie jedoch phonetisch als [L+>H*] realisiert. 76 75 Die Intonation des Spanischen von Buenos Aires wird in 4.5.4.2 genauer vorgestellt. 76 Dies entspricht der kontextbedingten Allophonie, die wir in 3.1 kennengelernt haben, wie z.B. beim Phonem / d/ , das je nach Position als eines seiner Allophone [d] oder [®] realisiert wird. Weiterhin ist auch in der Intonation freie Variation möglich: So wird z.B. im Spanischen von Buenos Aires der Nuklearakzent in einigen Fällen fallend als [H+L*] realisiert, ohne dass ein kontextueller oder pragmatischer Unterschied nachweisbar ist (vgl. 4.5.4.2). # 197 Abb. 4.5-9 ToBI-Notation der F 0 -Kontur von Está agarrando un gajo de mandarina (Sprecher aus Buenos Aires). Von oben nach unten: Break indices (BI), phonetisch realisierte Tonhöhenakzente und Grenztöne, phonologisch zugrundeliegende Töne (Tonschicht). Ein weiterer Hinweis soll der Schlusskontur und deren Analyse in Abb. 4.5-9 gelten: Entsprechend der aus der Prosodischen Hierarchie resultierenden Strict Layer Hypothesis (sp. hipótesis de estratificación rigurosa, vgl. 4.1) fällt die Grenze einer Intonationsphrase (IP) stets mit einer ip-Grenze zusammen. Daraus ergibt sich, dass am Schluss einer IP immer zwei zugrundeliegende Töne, nämlich ein ip-Grenzton (Phrasenton) und ein IP-Grenzton, anzunehmen sind. In der linearen Darstellung der Tonschicht (vgl. den grau schraffierten Quader in Abb. 4.5-9) erscheinen diese nacheinander (hier: L- L%); in der konkret produzierten F 0 -Kontur werden beide Töne jedoch sozusagen ‘in einem’ realisiert, weshalb wir in der oberflächennahen ToBI- Annotation der Kontur in Abb. 4.5-9 nur den Grenzton L% notiert haben. Theoretisch lässt sich dies erfassen, indem man annimmt, dass sich die in Bezug auf ihre tonale Spezifizierung identischen Grenztöne der ip und der IP überlagern und nur einen einzigen tonalen Zielpunkt L bilden. Durch die Verbindung zwischen diesem und dem vorausgehenden, ebenfalls tiefen Nuklearakzent (L*) auf der Silbe -riergibt sich eine gleichbleibend tiefe Kontur über die nachtonige Silbe -na hinweg bis zum IP-Ende. 4.5.4 Toninventare spanischer Varietäten im AM-Modell Die meisten Studien zur spanischen Intonation legen die kastilische Varietät von Madrid zugrunde (u.a. Face 2002, Kubarth 2009, Estebas-Vilaplana & Prieto 2010). Wir kontrastieren im Folgenden das Kastilische mit einer süd- und einer mittelamerikanischen Varietät (Buenos Aires und Ciudad de México) und folgen dabei im Wesentlichen dem von Prieto & Roseano (2010) herausgegebenen Handbuch, in dem die Intonation zehn amerikanischer und europäischer Varietäten analysiert wird. Aus Platzgründen können wir jeweils nur besonders charakteristische Aspekte hervorheben; umfassende Beschreibungen der Tonsysteme finden sich in den Einzelkapiteln in Prieto & Roseano (2010). Die dort vorgeschlagenen ToBI-basierten Analysen nehmen 198 eine zentrale Idee des Konfigurationsansatzes nach Navarro Tomás (1944) auf, nach dem die Intonation unterschiedlicher Satztypen vornehmlich an deren Nuklearkonfiguration (vgl. 4.5.2.1) festgemacht wird. Im Rahmen des AM-Modells versteht man darunter die Kombination aus Nuklearakzent und darauf folgendem IP- Grenzton. Die einzelnen Darstellungen der Intonation spanischer Dialekte in Prieto & Roseano (2010) nutzen jeweils vergleichbare Korpora aus semi-spontansprachlichen Daten (s. Kasten). Entsprechende Hörbeispiele finden sich auf der Website des Atlas interactivo de la entonación del español unter http: / / prosodia.upf.edu/ atlasentonacion/ . Datentypen in der Intonationsforschung Je nach Untersuchungsinteresse kann es sinnvoll sein, unterschiedliches Sprachmaterial zu analysieren. Generell können drei Datentypen unterschieden werden: spontansprachlich semi-spontansprachlich gelesen Spontansprachliche Daten sind solche, die in natürlicher Umgebung und ohne jegliche Anweisung erhoben wurden, z.B. im Rahmen von ungesteuerten Gesprächen. Da lautsprachliches Material jedoch aus datenschutzrechtlichen Gründen nur mit Zustimmung der Sprecher aufgenommen und für die Forschung verwendet werden darf, ist die Natürlichkeit der erhobenen Daten schon allein aufgrund der künstlichen Aufnahmesituation in gewissem Maße eingeschränkt. Allerdings kann sich auch in Aufnahmen freier Konversation nach geringer Zeit eine vergleichsweise natürliche Gesprächsatmosphäre einstellen. Ein Nachteil von spontansprachlichem Material besteht allerdings darin, dass die Daten nicht kontrolliert sind und das Korpus bestimmte Strukturen, die untersucht werden sollen, gegebenenfalls in zu geringer Anzahl oder gar nicht enthält. Zudem ist die Vergleichbarkeit von verschiedenen spontansprachlichen Aufnahmen nur sehr eingeschränkt, da die Bedingungen der Datenerhebung naturgemäß von Mal zu Mal anders sind. Unter semi-spontansprachlichen Daten versteht man solche, die von den Sprechern gezielt evoziert werden. Sie sind damit zwar weniger natürlich als spontansprachliches Material, doch für spezifische Untersuchungsinteressen gegebenenfalls deutlich ergiebiger. In der Intonationsforschung haben sich u.a. die folgenden drei Erhebungsmethoden bewährt: Aufbauend auf Kasper & Dahl (1991) hat Prieto (2001) für das Katalanische einen Intonationsfragebogen (engl. intonation survey, sp. encuesta de situaciones) entwickelt. Es handelt sich dabei um eine induktive Methode, bei der den Probanden verschiedene alltägliche Situationen präsentiert werden, in denen sie entsprechend verbal reagieren sollen. Auf diese Weise kann der jeweilige pragmatische Kontext kontrolliert werden; die erhobenen Daten variieren jedoch von Sprecher zu Sprecher, da keine Vorgaben in Bezug auf die Wortwahl oder die Satzstruktur gemacht werden. Das nachfolgende Beispiel aus der kastilischen Version der encuesta evoziert eine neutrale Ja/ Nein-Frage. Interviewer: Entras en una tienda y le preguntas al tendero si tiene mermelada. Proband: (mögliche Äußerungen) ¿Tiene mermelada? / Hola, ¿tienes mermelada? / … Auf der Website des Atlas interactivo de la entonación del español stehen unter http: / / prosodia.upf.edu/ atlasentonacion/ metodologia/ index.html verschie- # 199 dene Versionen des Fragebogens zur Verfügung, die lexikalisch an unterschiedliche Dialekte angepasst sind. Mithilfe eines sog. Map Task lassen sich gezielt unterschiedliche Typen von Fragesätzen erheben. Hierzu werden zwei Probanden mit je einer fiktiven Landkarte ausgestattet, wobei auf einer der beiden Karten ein Weg eingezeichnet ist. Einer der Teilnehmer hat die Aufgabe, von seinem Gesprächspartner diesen Weg zu erfragen, und zwar ohne dass die Probanden sich gegenseitig in die Pläne schauen können. Da die Pläne geringfügig voneinander abweichen, ergeben sich zahlreiche unterschiedliche Fragesätze. Aufnahmen solcher Map Task-Dialoge in unterschiedlichen spanischen Varietäten bietet der Atlas interactivo de la entonación del español. Informationen zum Map Task sowie Vorlagen für Karten finden sich unter http: / / groups.inf.ed.ac.uk/ maptask/ . Mithilfe von visuellen Stimuli wie Bildergeschichten lassen sich Strukturen mit unterschiedlicher Informationsverteilung evozieren. Hierzu werden die Sprecher gebeten, Fragen zu einzelnen Bildern zu beantworten. Diese Methode wurde z.B. von Gabriel (2007, 2010) angewendet, um die tonale Markierung neuer Information (Fokus, vgl. 4.5.5) im Spanischen zu untersuchen. Im folgenden Beispiel ist der Fokus durch [ F …] hervorgehoben): Interviewer: ¿Qué pasa en el dibujo? Proband: (mögliche Äußerungen) [ F Blancanieves secuestra a Tarzán.] / [ F Blancanieves está secuestrando a Tarzán.] / … Interviewer: ¿Quién secuestra a Tarzán? Proband: (mögliche Äußerungen) [ F Blancanieves] secuestra a Tarzán. / Lo secuestra [ F Blan- canieves]. / Es [ F Blancanieves quien se- cuestra a Tarzán. / La que secuestra a Tarzán es [ F Blancanieves]. / … Gelesene Daten lassen sich schließlich am besten kontrollieren und bieten damit die Möglichkeit des unmittelbaren Vergleichs mit entsprechend erhobenen Korpora. So kann vorher festgelegt werden, welche Strukturen (einfache oder komplexe Sätze, verschiedene Satzmodi etc.) die Probanden produzieren und welches lexikalische Material diese enthalten. Dies kann z.B. von Vorteil sein, wenn man die tonale Realisierung prosodischer Grenzen untersucht: Da sich ip- und IP-Grenztöne am deutlichsten in der phonetischen Oberfläche manifestieren, wenn zwischen der prosodischen Grenze und dem vorausgegangen Tonhöhenakzent ‘möglichst viel Platz ist’, sollte man hierfür Sätze konstruieren, in denen vor einer potentiellen ip- Grenze bzw. am Schluss der IP antepänultimabetonte Wörter auftreten (vgl. D’Imperio et al. 2005, Frota et al. 2007, Gabriel et al. 2011). Ein Nachteil von gelesenen Daten ist jedoch, dass es sich hierbei um eine spezielle Leseaussprache handelt, die von der des natürlichen Gesprächs stark abweichen kann. Sprachmaterial, das unter kontrollierten Laborbedingungen (z.B. in einer schallisolierten Kammer) erhoben wurde, wird auch manchmal als laborphonologisch bezeichnet. In der Forschungspraxis bietet es sich oft an, laborphonologische und in natürlichem Umfeld erhobene Daten miteinander zu kombinieren und das Korpus so anzulegen, dass bspw. gelesene Daten die (semi-)spontansprachlichen ergänzen können, wenn letztere keine oder nicht hinreichend viele Belege für ein bestimmtes Phänomen liefern. Grundsätzlich kann auch auf bereits bestehende Korpora zurückgegriffen werden; der Bestand des Hamburger Zentrums für 200 Sprachkorpora (http: / / www.corpora.uni-hamburg.de/ ) beinhaltet auch spanische Sprachdaten, die auf Antrag genutzt werden können. Will man schließlich die diachrone Entwicklung der Intonation untersuchen, ist man darauf angewiesen, verfügbare Daten aus älteren Sprachzuständen (z.B. alte Interviews, historische Aufnahmen politischer Reden etc.) zugrundezulegen, mit vergleichbarem zeitgenössischen Sprachmaterial zu kontrastieren und Unterschiede und Gemeinsamkeiten herauszuarbeiten (vgl. Peåková et al. 2012b als Beispiel für eine solche diachrone Studie). Da diese Methode nur für den begrenzten Zeitraum seit dem Aufkommen der Tonaufzeichnung anwendbar ist, muss man für frühere Jahrhunderte auf das in der diachronen Linguistik übliche Verfahren der Rekonstruktion zurückgreifen. So hat z.B. Hualde (2003b, 2004) die Intonationssysteme heutiger romanischer Sprachen verglichen und auf dieser Basis den Versuch unternommen, die protoromanische Intonation zu rekonstruieren. 4.5.4.1 Madrid (Kastilisch) Die kastilische Intonation ist dadurch gekennzeichnet, dass Pränuklearakzente im Normalfall mit einem späten Tonhöhengipfel realisiert werden (L+>H*), der Nuklearakzent hingegen als Tiefton L* (Estebas-Vilaplana & Prieto 2010: 19). In Verbindung mit dem schließenden Grenzton ergibt sich hieraus für neutrale Aussagesätze wie Bebe una limonada (als Antwort auf eine Frage wie ¿Qué hace la mujer en la foto? ) die Nuklearkonfiguration L* L%. Hualde (2002, 2005: 257) hat für diesen Satztyp gezeigt, dass der Nuklearakzent auch steigend mit frühem F 0 -Gipfel realisiert werden kann (L+H*) 77 , woraus sich als Nuklearkonfiguration L+H* L% ergibt. Diese wiederum tritt nach Estebas-Vilaplana & Prieto (2010: 24, 44) vorwiegend dann auf, wenn der am rechten Rand der IP platzierte Satzteil korrigierend hervorgehoben wird wie in No, quiero limones (als Replik auf eine Äußerung wie Me pidió un par de naranjas, ¿no? ). Man spricht hier auch von kontrastiver Fokussierung (vgl. 4.5.5). Wie bereits in Abschnitt 4.5.1 gesagt, zeichnen sich kastilische Ja/ Nein-Fragen wie ¿Tiene mermelada? durch eine steigende Schlusskontur aus. Da es sich um einen starken F 0 -Anstieg handelt, setzen Estebas-Vilaplana & Prieto (2010) den Grenzton HH% an; als Nuklearkonfiguration ergibt sich also L* HH%. Bei Wh-Fragen des Typs ¿Qué hora es? sind zwei unterschiedliche Schlusskonturen möglich, wobei die Nuklearkonfiguration entweder der einer Ja/ Nein-Frage gleicht (L* HH%) oder mit der eines neutralen Aussagesatzes identisch ist (L* L%), vgl. Abb. 4.5-10. Dass die ansonsten den interrogativen Satzmodus markierende steigende Kontur bei Wh-Fragen nicht zwingend erforderlich ist, lässt sich insofern nachvollziehen, als derartige Sätze durch das Frage- oder Wh-Wort bereits eindeutig als Fragesätze erkennbar sind; die tonale Markierung erfolgt somit zusätzlich und ist optional. Wird die Schlusskontur einer Wh-Frage als L* L% realisiert, unterscheidet sich ihre Gesamtkontur dennoch deutlich von der eines Aussagesatzes, und zwar insofern als die metrisch starke Silbe des Wh-Wortes (in diesem Fall das einsilbige qué) nicht mit dem (ansonsten in pränuklearer Position üblichen) steigenden Tonhöhenakzent L+>H* assoziiert, sondern mit einem Hochton H*. Hier zeigt sich auch, dass das Bestimmen der Nuklearkonfiguration nicht ausreichend ist, um die Intonation verschiedener Satztypen in ihrer Gänze erfassen zu können. 77 Dieser Ton wird bei Hualde (2002, 2005) abweichend von der hier verwendeten Notation als LH* notiert. # 201 Abb. 4.5-10 Oben: Wh-Frage ¿Qué hora es? mit steigender Nuklearkonfiguration L* HH%. Unten: Dieselbe Struktur mit der Nuklearkonfiguration L* L% (Estabas-Vilaplana 2010: 36). 4.5.4.2 Buenos Aires (Porteño-Spanisch) Aus Abschnitt 4.4.3 wissen wir bereits, dass das argentinische Porteño-Spanisch, die in Buenos Aires (und mittlerweile auch weit über die Grenzen der Hauptstadt hinaus) gesprochene Varietät, in Bezug auf die Prosodie durch migrationsbedingten Sprachkontakt vom Italienischen beeinflusst ist. Auch in der Intonation zeigt sich dieser Einfluss deutlich: So unterscheiden sich die Pränuklearakzente des Porteño-Spanischen von denen der meisten anderen spanischen Varietäten dahingehend, dass sie keinen nach rechts verschobenen F 0 -Gipfel aufweisen, sondern dass dieser innerhalb der metrisch starken Silbe erreicht wird (L+H*; vgl. Abb. 4.5-9 sowie Gabriel et al. 202 2010: 289). 78 Dies ist eine Eigenschaft, die das Porteño-Spanische mit zahlreichen italienischen Varietäten teilt (vgl. Gabriel & Kireva 2012). Der Nuklearakzent hingegen wird wie im kastilischen Spanisch im Normalfall als Tiefton L* realisiert; daneben tritt als fakultative Variante der fallende Tonhöhenakzent H+L* auf. Hieraus ergibt sich für den neutralen Aussagesatz die Nuklearkonfiguration L* L% bzw. H+L* L%. Auch hier wird deutlich, dass der Unterschied zum kastilischen Dialekt nicht allein in der Schlusskontur begründet ist, sondern dass das der Nuklearkonfiguration vorausgehende Material hier: die Form der Pränuklearakzente mit einbezogen werden muss. Eine weitere Besonderheit der porteño-spanischen Intonation zeigt sich, wenn man Aussagesätze mit kontrastiv hervorgehobenen Satzteilen mit einbezieht. In 4.5.4.1 haben wir für das kastilische Spanisch gesehen, dass bei kontrastivem Fokus der Nuklearakzent nicht als Tiefton L*, sondern als steigender Tonhöhenakzent L+H* realisiert wird. Im Porteño-Spanischen wird der F 0 -Gipfel bei kontrastiver Fokussierung nicht erst am rechten Rand der metrisch starken Silbe, sondern schon ungefähr in deren Mitte erreicht. Danach fällt die Kontur wieder steil ab und gelangt am rechten Rand der Tonsilbe erneut auf das Ausgangsniveau. Um eine solche Kontur mit zwei elbows zu erfassen (vgl. 4.5.3.2), müssen drei tonale Zielpunkte angenommen werden; dementsprechend wurde hierfür ein tritonaler Tonhöhenakzent L+H*+L eingeführt (Gabriel et al. 2010, Feldhausen et al. 2011a). Die steigend-fallende Kontur dieses Tons, der außer in kontrastiven Kontexten auch in exklamativen Ausdrücken auftritt (z.B. als Nuklearakzent in begeisterten Ausrufen wie ¡Qué ricas medialunas! ), ist in Abb. 4.5-11 (oben) sehr schön sichtbar. Auch die tonale Gestaltung des neutralen Fragesatzes unterscheidet sich deutlich vom kastilischen Spanisch: Anstelle einer steigenden Schlusskontur finden wir hier eine fallende Nuklearkonfiguration, bestehend aus einem heraufgestuften Nuklearakzent L+¡H* und dem komplexen Grenzton HL%. Ein Blick auf die F 0 -Kontur der Frage ¿Volvió Natalia? (Abb. 4.5-11, unten) zeigt deutlich, dass der F 0 -Gipfel des Nuklearakzents ein höheres Niveau erreicht als der des vorausgehenden Pränuklearakzents: Dies entspricht nicht der regulären Deklination (Abfall der Grundfrequenz, vgl. 4.5.1); der Nuklearakzent muss also als heraufgestuft (upstepped) gelten. Der schließende Grenzton wird als komplexer Ton HL% analysiert, da die Tonkontur nach dem Erreichen des F 0 -Maximums des Nuklearakzents nicht gleich wieder abfällt (in dem Fall würde ein monotonaler Grenzton L% und damit ein einziger tonaler Zielpunkt ausreichen); vor dem Tonhöhenabfall zum rechten Rand der IP hin ergibt sich hier ein hohes Plateau. 78 Allerdings wird der zugrundeliegende Ton / L+H*/ phonetisch als [L+H>*] realisiert, wenn er einer mit Hmarkierten ip-Grenze vorangeht (vgl. Abb. 4.5-9 in 4.5.3.2). 203 Abb. 4.5-11 Oben: Korrigierende Aussage No. ¡Naranjas! (als Replik auf ¿Me pidió un par de limones ¿no? ) mit der Nuklearkonfiguration L+H*+L L% (Gabriel et al. 2010: 293). Unten: Neutraler Fragesatz ¿Volvió Natalia? mit der Nuklearkonfiguration L+¡H* HL%. Bei den Wh-Fragen unterscheidet sich das Porteño-Spanische nicht nennenswert von der kastilischen Varietät: Auch hier liegt die Nuklearkonfiguration L* L% vor; das Wh-Wort wird ebenfalls durch einen Hochton H* markiert (Gabriel 2010: 303f.). 4.5.4.3 Mexiko-Stadt Das mexikanische Spanisch unterscheidet sich in Bezug auf die Alignierungseigenschaften pränuklearer Tonhöhenakzente nicht vom kastilischen Dialekt, insofern als auch hier im Regelfall ein nach rechts verschobener F 0 -Gipfel auftritt (L+>H*). In neutralen Aussagesätzen wird der Nuklearakzent im Normalfall als Tiefton L* realisiert und alternativ hierzu als steigender Ton L+H*, woraus sich die Nuklearkonfiguration L* L% bzw. L+H* L% ergibt (De-la-Mota et al. 2010: 325). Als ein typisches Kennzeichen mexikanischer Intonation kann die sog. Zirkumflexkontur gelten, eine steigend-fallende Nuklearkonfiguration, die abweichend von anderen spanischen Va- # 204 rietäten nicht nur in pragmatisch markierten Kontexten (z.B. bei kontrastiver Hervorhebung des letzten Satzgliedes, vgl. für das kastilische Spanisch 4.5.4.1), sondern auch in neutralen Aussagesätzen auftritt (Hualde 2005: 266f., De-la-Mota et al. 2010: 324ff.). Abhängig davon, ob der Nuklearakzent das F 0 -Niveau des vorausgehenden Gipfels erreicht bzw. gar übersteigt oder ob die reguläre Deklination eintritt, wird die Nuklearkonfiguration als L+¡H* L% oder L+H* L% analysiert. Abb. 4.5-12 Oben: Ja/ Nein-Frage ¿Tiene mermelada? mit der Nuklearkonfiguration L* LH%. Unten: Wh-Frage ¿Y tú de qué pueblo vienes? mit der Nuklearkonfiguration L+H* HL% (Zirkumflexkontur; De-la-Mota et al. 2010: 330, 336). Die Intonation neutraler Fragesätze ähnelt dem Muster des kastilischen Spanisch insofern, als es auch hier zu einem finaler F 0 -Anstieg kommt, jedoch ist dieser weniger steil und erfolgt auch etwas später, nach einem kurzen tiefen Plateau. Dieser verspätete Anstieg der Schlusskontur lässt sich durch den komplexen Grenzton LH% wiedergeben (Abb. 4.5-12 oben). In Wh-Fragen wird, ebenfalls wie in den beiden bereits besprochenen Varietäten, das Fragewort durch einen Hochton H* hervorgeho- # 205 ben. Die Gesamtkontur unterscheidet sich jedoch von der des kastilischen und argentinischen Spanisch insofern, als auch hier die oben genannte Zirkumflexkontur auftreten kann. Diese ist in Abb. 4.5-12 (unten) sehr gut sichtbar. In Abb. 4.5-13 stellen wir abschließend die F 0 -Konturen eines neutralen Deklarativsatzes in den drei behandelten Varietäten einander gegenüber. Abb. 4.5-13 Schematische Darstellung der F 0 -Konturen des neutralen Deklarativsatzes María compraba libros in den Varietäten von Madrid, Buenos Aires und Mexiko-Stadt. 4.5.5 Schnittstellenphänomene: Prosodische Phrasierung, Informationsstruktur, Diskurs In Folgenden beschäftigen wir uns mit Aspekten der Intonation, die sich nur erfassen lassen, wenn man neben der phonologischen weitere sprachliche Ebenen, wie etwa die syntaktische Struktur oder die Informationsverteilung im Satz bzw. im weiteren Diskurs, mit einbezieht. Aufgrund dieser Interaktion einzelner Teilbereiche des sprachlichen Wissens spricht man hier auch von sog. Schnittstellen (engl. interface, sp. interfaz) zwischen Phonologie und Syntax bzw. zwischen Phonologie und Informationsstruktur. Bevor wir dies im Einzelnen darstellen, machen wir uns mit den wichtigsten Grundbegriffen der Informationsstruktur vertraut. Unter Informationsstruktur (sp. estructura informativa oder informacional) versteht man die Verteilung von alter und neuer Information in einem Satz bzw. in einer größeren Einheit des Diskurses. Eine systematische Auseinandersetzung mit diesem Aspekt begann im ersten Drittel des 20. Jh.s im Prager Strukturalismus, der den Terminus der Funktionalen Satzperspektive geprägt hat. Im Rahmen des sog. Dreiebenenmodells wurde hier neben der syntaktischen und der semantischen Beschreibungsebene eine informationsstrukturelle Ebene angenommen (vgl. Daneå et al. 1974). Zum Erfassen der informationsstrukturellen Gliederung von Sätzen wurden in der Literatur mehrere Dichotomien (Gegensatzpaare) vorgeschlagen. Nach der Prager Schule ist die Informationsstruktur eines Satzes durch den Kontrast zwischen alter, L+>H* L+>H* L* [ F Ma- -rí- -a com- -pra- -ba LI- -bros] L- L% L+H* L+H* L* [ F Ma- -rí- -a com- -pra- -ba LI- -bros] L- L% Madrid Buenos Aires L+>H* L+>H L+¡H* [ F Ma- -rí- -a com- -pra- -ba LI- -bros] L- L% Mexiko-Stadt 206 gegebener Information, dem sog. Thema (sp. tema), und der im Kontext neuen Information, dem sog. Rhema (sp. rema), charakterisiert, vgl. Beispiel (4: 8). (4: 8) a. Érase una vez un rey. b. [ Thema El rey] [ Rhema tenía un hijo]. Dem nordamerikanischen Strukturalismus entstammt das Begriffspaar Topic (sp. tópico) und Comment (sp. comentario). Unter Topic ist nach Hocket (1958: 201) der Gegenstand einer Aussage zu verstehen, der den betreffenden Satz inhaltlich an den vorherigen Diskurs anbindet (“what the sentence is about”) und der dann durch weitere Informationen ergänzt bzw. kommentiert wird. Ist das Topic durch besondere syntaktische Konstruktionen als solches markiert, spricht man von Topikalisierung. Ein in vielen Sprachen, u.a. im Spanischen, häufiges Topikalisiserungsverfahren ist die sog. Linksversetzung (auch: Linksdislokation, sp. dislocación a la izquierda) von einzelnen Satzgliedern und deren Wiederaufnahme durch entsprechende Pronomina im Kernsatz; vgl. die Beispiele in (4: 9). In der neueren Forschung, v.a. in generativ ausgerichteten Arbeiten, wird die Informationsstruktur von Sätzen meist mithilfe der Dichotomie Hintergrund vs. Fokus (engl. background vs. focus, sp. fondo vs. foco) als Fokus-Hintergrund-Gliederung (FHG) beschrieben. Dabei bilden die (mutmaßlich) gemeinsamen Annahmen von Sprecher und Hörer zum Zeitpunkt der Äußerung (auch: Präsupposition, engl. presupposition, sp. presuposición) den Hintergrund, von dem sich der Fokus als neue Information abhebt wie z.B. im Satz [ H María] [ F(okus) come mandarinas] (als Antwort auf ¿Qué hace María? ). Man spricht hier auch von neutralem oder Informationsfokus. Wird nicht nur neue Information transportiert, sondern zugleich eine (mutmaßlich) falsche Information korrigiert wie in Come [ F mandarinas] (als Korrektur zu María come manzanas ¿verdad? ), spricht man von kontrastivem Fokus. Weiterhin unterscheidet man zwischen engem Fokus, der nur ein Satzglied umfasst wie in ¿Qué come María? María come [ F mandarinas], und weitem Fokus, der sich über mehrere Konstituenten erstreckt, z.B. ¿Qué hace María? María [ F come mandarinas y toma agua con gas]. Wenn der gesamte Satz für den Hörer neue Information vermittelt, z.B. bei einer Antwort auf die Frage ¿Qué pasa? , spricht man auch von neutralen Sätzen bzw. von gesamtfokaler Lesart oder Satzfokus. Die drei Dichotomien Thema Rhema, Topic Comment und Hintergrund Fokus überschneiden sich inhaltlich teilweise; sie sind jedoch nicht vollkommen austauschbar. Will man komplexere Sätze informationsstrukturell erfassen, kommt man in der Regel nicht mit einem der drei Gegensatzpaare aus. In der neueren Forschung werden deshalb die beiden letztgenannten Dichotomien meist miteinander kombiniert. (4: 9) a. Kontext: ¿Qué compra María en el kiosco? [María, [en el kiosco, [compra [ F el peRIÓdico]]]] Topic 1 Topic 2 |--------------Comment---------------------| Hintergrund Fokus b. Kontext: ¿Dónde compra María el periódico? [María, [el periódico, [lo compra [ F en el KIOSco]]]] Topic 1 Topic 2 |-------------- Comment ---------------------| Hintergrund Fokus In (4: 9a) drückt der Kernsatz compra el periódico einen Kommentar zu den durch Linksdislokation als Topics markierten Satzgliedern María und en el kiosco aus, die je- # 207 weils bekannte Information aus dem sprachlichen Kontext aufgreifen. Der Kernsatz selbst ist wiederum zweigeteilt, insofern als die (bereits bekannte) Hintergrundinformation compra mit der neuen Information (Fokus) des Objekts [ F el periódico] kontrastiert. Gleiches gilt für (4: 9b): Auch hier werden zwei linksversetzte Topics durch einen Comment ergänzt, der in Hintergrund und Fokus aufgeteilt ist. Wir haben bereits gesagt, dass die Topikalisierungsstrategie der Linksdislokation dadurch gekennzeichnet ist, dass die linksversetzten Satzglieder pronominal wiederaufgenommen werden. Ein Beispiel hierfür ist das klitische Objektpronomen lo in (4: 9b), das das linksdislozierte Objekt aufgreift. Da das Spanische eine sog. Null-Subjekt-Sprache 79 ist und auch keine Elemente aufweist, die präpositional eingeleitete Konstituenten wie z.B. Ortsangaben ersetzen können, erscheint in (4: 9a) im Kernsatz kein pronominales Element. Im Französischen wäre dies anders; hier würde ein topikalisiertes Subjekt durch ein klitisches Pronomen, eine Ortsangabe durch das Pronominaladverb y aufgenommen, z.B. Marie i , au marché j , elle i y j achète des pommes ‘Marie, auf dem Markt, die kauft da Äpfel’ (die tiefgestellten Buchstaben geben den Bezug an). Im Folgenden betrachten wir zunächst die prosodische Phrasierung in neutralen Sätzen (4.5.5.1), bevor wir uns mit dem Zusammenhang von Fokus-Hintergrund- Gliederung und Intonation in syntaktisch einfachen Sätzen (4.5.5.2) und dem Wechselspiel zwischen Informationsstruktur und Syntax befassen (4.5.5.3). In einem weiteren Schritt gehen wir exemplarisch auf die Intonation syntaktisch komplexer Sätze und auf tonale Signale der Diskursgliederung ein (4.5.5.4). 4.5.5.1 Prosodische Phrasierung in neutralen Sätzen In 4.5.3.1 haben wir mit der Intermediärphrase (ip) eine von der Intonationsphrase (IP) dominierte Ebene der Prosodischen Hierarchie eingeführt, die der Unterteilung in kleinere prosodische Einheiten dient. Wie D’Imperio et al. (2005) und Frota et al. (2007) in sprachvergleichenden Studien zur Phrasierung informationsstrukturell neutraler Sätze in verschiedenen romanischen Sprachen gezeigt haben, wird die Einteilung einer IP in mehrere Intermediärphrasen durch verschiedene Faktoren bestimmt. Zu nennen ist hierbei insbesondere das prosodische und syntaktische ‘Gewicht’ der einzelnen Satzglieder: So lässt sich über die Sprachen hinweg eine Tendenz zum Abtrennen von Konstituenten beobachten, die lang und damit prosodisch ‘schwer’ sind, z.B. wenn das Subjekt aus Vor- und Nachnamen besteht wie Verónica Diego Solana (im Gegensatz zu einfach María). Gleiches gilt für syntaktisch komplexe Konstituenten wie z.B. un gajo de mandarina (Nominalphrase mit spezifizierendem Präpositionaladjunkt), un libro increíblemente interesante (Nominalphrase mit spezifizierender Adjektivphrase) oder el libro que compraste ayer (Nominalphrase mit Relativsatz). Das bereits in Abb. 4.5-9 (Abschnitt 4.5.3.2) analysierte Beispiel (4: 10) weist eine solche ip- Grenze auf, die sich unter Rückgriff auf die syntaktische Komplexität des Objekts und damit als ein Effekt der Interaktion von Phonologie und Syntax erklären lässt. (4: 10) ( IP ( ip Está agarrando) ( ip un gajo de mandarina)) | H- 79 In Null-Subjekt-Sprachen (vgl. Gabriel & Meisenburg 2007: 39ff., 73, 142) kann das Subjekt unausgedrückt bleiben, wenn es aus dem Kontext ersichtlich ist. Subjektpronomina werden in der Regel nur verwendet, um einen Kontrast auszudrücken wie z.B. in Juan i y María j toman la merienda. Él i toma café, ella j toma mate cocido. 208 Eine ip-Grenze kann sich in unterschiedlicher Weise tonal manifestieren. Die Kontur in Abb. 4.5-9 weist einen kontinuierlichen F 0 -Anstieg vom letzten Tonhöhenakzent bis zur Phrasengrenze auf, den man in der englischen Terminologie als continuation rise (CR, sp. tono continuativo) bezeichnet (Label: H-). Im kastilischen Spanisch werden nach Frota et al. (2007: 153) knapp 90 % der ip-Grenzen in neutralen Aussagesätzen als ein solcher Anstieg realisiert; in den restlichen Fällen tritt ein sog. sustained pitch (SP, sp. tono sostenido) auf, der sich phonetisch als ein gleichbleibend hohes F 0 -Plateau manifestiert. In anderen Sprachen wie etwa dem Italienischen treten CR und SP ungefähr gleich häufig auf. Wichtig ist, dass durch das Einfügen einer ip- Grenze die reguläre Deklination (vgl. 4.5.1 und Abb. 4.5-4) unterbrochen wird. Da in den von D’Imperio et al. (2005) und Frota et al. (2007) untersuchten neutralen Sätzen kein pragmatischer Unterschied zwischen CR und SP zu verzeichnen ist, kann man annehmen, dass es sich hierbei um freie Oberflächenvariation handelt. Hier kann also ein phonologisch zugrundeliegender ip-Grenzton / H-/ angesetzt werden, der entweder als CR [H-] oder sozusagen in ‘herabgestufter’ Form als SP [! H-] realisiert wird. In Abb. 4.5-14 stellen wir diese auch in anderen Varietäten des Spanischen häufig auftretenden Grenzsignale schematisch dar. 80 Für den letzten Tonhöhenakzent vor der ip-Grenze wird entsprechend dem Toninventar des kastilischen Spanisch / L+>H*/ als zugrundeliegend angesetzt. Abb. 4.5-14 Schematische Darstellung einer ip-Grenze (zugrundeliegend / H-/ ) mit phonetischer Realisierung als continuation rise ([H-], links) bzw. sustained pitch ([! H-], rechts). Die metrisch starke Silbe vor der Grenze ist schraffiert, die Tonschicht grau hervorgehoben. Zusätzlich zur tonalen Markierung tritt vor prosodischen Grenzen meist auch eine Längung ein, die die letzte Silbe, das gesamte letzte Wort oder auch die letzte metrisch starke Silbe vor der Grenze betreffen kann. Dieser in der englischen Terminologie als pre-boundary lengthening (PBL, sp. alargamiento pre-frontera) bezeichnete Effekt hat bei systematischem Auftreten einen Einfluss auf den Sprachrhythmus (vgl. 4.4.1), da sich hierdurch sowohl der vokalische Gesamtanteil (%V) als auch der Wert für die Variabilität vokalischer Intervalle (VarcoV) erhöht (vgl. 4.4.2). Nach Frota et al. (2007: 135) tritt PBL im Italienischen und im Katalanischen zu 100 % auf, im kastilischen Spanisch hingegen nur zu ca. 40 %. 80 Weitere Grenzsignale werden, mit besonderer Berücksichtigung des argentinischen Spanisch, in Gabriel et al. (2011) diskutiert. continuation rise [H-] / ... L+>H* sustained pitch H- …/ / ... L+>H* H- …/ [¡H-] # 209 Für die kastilische Varietät lässt sich festhalten, dass neutrale Deklarativsätze in der Regel auch dann eine ip-Grenze nach dem Subjekt aufweisen, wenn das oben besprochene Kriterium der (prosodischen oder syntaktischen) Schwere nicht gegeben ist: Auch einfache neutrale Aussagesätze wie María compraba libros werden hier normalerweise als ((S)(VO)) phrasiert, während etwa im Italienischen oder im Europäischen Portugiesisch meist keine entsprechende ip-Grenze vorliegt und damit das Phrasierungsmuster (SVO) vorherrschend ist (vgl. Frota et al. 2007). Für das Porteño- Spanische haben Gabriel et al. (2011) gezeigt, dass es in Bezug auf das vorherrschende Phrasierungsmuster dem kastilischen Spanisch entspricht. Bei der phonetischen Realisierung wird zu ungefähr gleichen Teilen CR und SP verwendet, worin sich italienischer Einfluss zeigt. 4.5.5.2 Intonation und Fokus-Hintergrund-Gliederung (FHG) Weiterhin ist die prosodische Phrasierung eines Satzes durch dessen informationsstrukturelle Gliederung bestimmt. Wir betrachten dieses Schnittstellenphänomen im Folgenden exemplarisch anhand der Interaktion von FHG und Intonation. In 4.5.4.1 und 4.5.4.2 haben wir anhand des Spanischen von Madrid und Buenos Aires gesehen, dass sich Deklarativsätze mit finalem kontrastivem Fokus dadurch auszeichnen, dass der Nuklearakzent durch einen anderen Tonhöhenakzent realisiert wird, als es normalerweise in neutralen Sätzen (und auch bei finalem Informationsfokus) der Fall ist. Wir fassen dies in Abb. 4.5-15 tabellarisch zusammen. Nuklearkonfiguration Madrid Buenos Aires ¿Qué pasaba? [ F María compraba LIbros]. L* L-L% L* L-L% ¿Qué compraba María? María compraba [ F LIbros]. L* L-L% L* L-L% María compraba una revista ¿verdad? (No). María compraba [ F LIbros]. L+H* L-L% L+H*+L L-L% Abb. 4.5-15 Nuklearkonfiguration im neutralen Deklarativsatz sowie bei finalem neutralen und kontrastiv fokussierten Objekt. Wird ein Element fokussiert, das sich typischerweise am Anfang des Satzes befindet wie das Subjekt in ¿Quién le dio el diario a su hermano? [ F María] le dio el diario a su hermano, verschiebt sich der Nuklearakzent an den linken Satzrand. 81 Danach erfolgt in der Regel ein steiler F 0 -Abfall mit einer anschließenden flachen Kontur bis zum Ende der IP. Dies lässt sich analysieren, indem man unmittelbar nach dem fokussierten Subjekt einen ip-Grenzton Lansetzt; zwischen diesem und der (ebenfalls tiefen) Nuklearkonfiguration L* L-L% ergibt sich durch Interpolation ein tiefes Plateau. Dabei werden die Tonhöhenakzente im Bereich des Hintergrunds auf der phonetischen Oberfläche reduziert oder gar ganz getilgt. Man spricht hier auch von postfokaler Deakzentuierung. Dies gilt unabhängig davon, ob es sich beim fokussierten Subjekt um (neutralen) Informationsfokus oder um kontrastive Fokussierung handelt. Abb. 4.5-16 zeigt die F 0 -Kontur eines SVO-Satzes mit kontrastiv fokussiertem Subjekt. 81 Übereinzelsprachlich kann man beobachten, dass der Fokus in irgendeiner Weise ‘prominenter’, also sprachlich auffälliger ist als der Hintergrund. Dies lässt sich in Form der ursprünglich von Chomsky (1971) formulierten Fokusprominenzregel zusammenfassen. Entsprechend muss der Nuklearakzent als die am stärksten wahrgenommene Akzentstelle (vgl. 4.5.2.1 und 4.5.3.1) mit dem fokussierten Element einhergehen. 210 Abb. 4.5-16 F 0 -Kontur des Deklarativsatzes [ F María] le dio el diario a su hermano mit satzinitial fokussiertem Subjekt und postfokaler Deakzentuierung (kastilisches Spanisch). Betrachten wir nun nochmals die ersten beiden Beispiele aus Abb. 4.5-15: Weder die Satzstellung (SVO) noch die Nuklearkonfiguration (L* L-L%) geben Auskunft darüber, ob es sich bei María compraba LIbros um einen Satz mit gesamtfokaler Lesart (Tabellenzeile 1) oder um eine Konstruktion mit neutral fokussiertem Objekt handelt (Zeile 2). Dennoch ist es möglich, den Unterschied zwischen diesen beiden Lesarten tonal zu markieren, und zwar durch Einfügen einer hohen ip-Grenze (H-) an der informationsstrukturellen Grenze zwischen Hintergrund und Fokus, im konkreten Fall unmittelbar vor dem fokussierten Objekt (vgl. Hualde 2005). Dieses ‘Hochziehen’ der F 0 -Kontur bewirkt einen Spannungsaufbau über die präsupponierte Information (Hintergrund) hinweg bis zum Beginn der neuen Information (Fokus); Korpusauswertungen haben jedoch gezeigt, dass die tonale Markierung der Fokusdomäne nicht von allen Sprechern und auch nicht von ein und demselben Sprecher durchgehend vorgenommen wird (Gabriel 2007, Peåková et al. 2012a). Es handelt sich also um einen fakultativen Effekt, den wir in Abb. 4.5-17 schematisch darstellen. Abb. 4.5-17 Schematische Darstellung der F 0 -Kontur des Deklarativsatzes María compra [ F un libro] mit neutral fokussiertem Objekt (Porteño-Spanisch). In gleicher Weise kann die Fokusdomäne markiert werden, wenn sie sich über die Verbalphrase erstreckt (weiter Fokus), so etwa in der Lesart María [ F compra un libro] (als Antwort auf ¿Qué hace María? ) durch Einfügen von Hnach dem Subjekt. L+H* L+H* L* Ma- -rí- -a com- -pra [ F un LI- -bro] H- L- L% # 211 4.5.5.3 Fokus, Wortstellung und Intonation Im letzten Abschnitt haben wir uns damit befasst, wie die FHG bei gleichbleibender Wortstellung durch tonale Mittel (besondere Tonhöhenakzente für Kontrastfokus, Verlagerung des Nuklearakzents an den linken Satzrand, Intermediärphrasierung) ausgedrückt werden kann. Im Folgenden wenden wir uns mit der Interaktion von Wortstellung und Intonation einem weiteren phonosyntaktischen Schnittstellenphänomen zu und betrachten hierzu exemplarisch Sätze mit transitivem Verb und (neutral) fokussiertem Subjekt. In 4.5.5.2 haben wir gezeigt, dass ein Subjekt in seiner satzinitialen Basisposition durch Verlagerung des Nuklearakzents und postfokale Deakzentuierung als Fokus gekennzeichnet werden kann (vgl. Abb. 4.5-16). Neben dieser tonalen Fokussierungsstrategie, deren Resultat eine prosodisch markierte Struktur mit nicht finalem Nuklearakzent ist (Beispiele 4: 11a, b), 82 lässt sich im Spanischen die Wortstellung so abändern, dass das fokussierte (und durch den Nuklearakzent hervorgehobene) Element am Schluss des Satzes auftritt. Resultat dieser syntaktischen Strategie ist eine prosodisch unmarkierte Struktur mit dem Nuklearakzent am rechten Rand der Intonationsphrase (Beispiele 4: 11c, d). (4: 11) ¿Quién comió la manzana? a. [ F MaRÍa] comió la manzana. [ F S]VO b. [ F MaRÍa] la comió. [ F S]Cl+V c. Comió la manzana [ F MaRÍa]. VO[ F S] d. La comió [ F MaRÍa]. Cl+V[ F S] Empirische Arbeiten zur Fokusmarkierung im Spanischen haben gezeigt, dass die rein prosodische Strategie varietätenübergreifend bevorzugt wird, wenn das Objekt eine volle Nominalphrase ist ([ F S]VO, 4: 11a), während die Sprecher zur Verwendung der syntaktischen Strategie tendieren, wenn das Objekt als Klitikon (Cl, hier: la comió) am Verb realisiert wird (Cl+V[ F S], 4: 11d). Die Variante VO[ F S] (4: 11c) wird von den Sprechern zwar in der Regel als möglich akzeptiert, aber nur selten produziert (vgl. Gabriel 2007, 2010). Als Beispiel nennen wir hier die Verteilung der in Gabriel (2010: 202) analysierten Produktionsdaten von 25 Sprechern aus Buenos Aires: Während 95 % der Sätze mit voller Objekt-Nominalphrase dem Typus [ F S]VO entsprechen (tonale Markierung), wählen nur 5 % der Probanden die syntaktische Fokussierungsstrategie VO[ F S]. In Sätzen mit klitisch realisiertem Objekt ist das Bild umgekehrt: Nur in 27 % der Fälle befindet sich das Subjekt am Satzanfang, also [ F S]Cl+V, während in 73 % das fokussierte Subjekt in Endstellung auftritt (Cl+V[ F S]). Offensichtlich nehmen die Sprecher eine prosodisch markierte F 0 -Kontur (initialer Nuklearakzent, ip-Grenzton nach dem Fokus, postfokale Deakzentuierung; vgl. Abb. 4.5-16) in Kauf, um den syntaktischen ‘Mehraufwand’ der Umstellung des Subjekts zu vermeiden. Wird das Objekt jedoch als nicht akzentogenes, mit dem Verb verbundenes Element und nicht als volle Nominalphrase realisiert, scheint der syntaktische Aufwand geringer zu sein, sodass das Streben nach prosodisch unmarkierten Strukturen die Oberhand gewinnt. Man kann also sagen, dass Phonologie und Syntax als Komponenten des sprachlichen Wissens miteinander im Wettstreit liegen. 82 In der generativ-syntaktischen Literatur (z.B. Zubizarreta 1998, Ordóñez 2000) wurde vielfach behauptet, dies sei nur bei kontrastivem Fokus möglich eine Auffassung, die der Überprüfung anhand von Korpusdaten nicht standhält. Wir wollen diese Diskussion hier nicht weiter verfolgen und verweisen auf Gabriel (2007, 2010). 212 In 3.4 haben wir mit der Optimalitätstheorie (OT) einen theoretischen Rahmen eingeführt, in dem ein solcher ‘Wettstreit’ genuiner Bestandteil ist. Mithilfe des Modells der überlappenden Beschränkungen (engl. overlapping constraints, sp. restricciones en superposición, Boersma & Hayes 2001) lässt sich zudem erfassen, dass bestimmte Oberflächenformen (in unserem Fall die Beispiele 4: 11b und c) zwar möglich sind, im konkreten Sprachgebrauch jedoch weniger oft vorkommen als die konkurrierenden Varianten (Beispiele 4: 11 a bzw. d). Wir skizzieren im Folgenden eine mögliche Anwendung des overlapping constraints-Modell auf die Beispiele (4: 11). Hierzu benötigen wir zunächst die folgenden Beschränkungen: S TAY Satzglieder verbleiben in ihrer Basisposition. S TRESS F OCUS (SF) Das fokussierte Satzglied ist prosodisch prominenter als das präsupponierte Material. A LIGN F OCUS R IGHT (AFR) Der Fokus befindet sich am rechten Satzrand. Als Input für den Generator (GEN), der die zu bewertenden Kandidaten erstellt, wird die Auswahl lexikalischer Einheiten angenommen, die ein Sprecher benötigt, um seine Äußerungsabsicht zu versprachlichen. Will er z.B. die Frage ¿Quién comió la manzana? beantworten, indem er in einem vollständigen Satz aussagt, 83 dass Maria den Apfel gegessen hat, sind dies im Einzelnen der Eigenname María, das Substantiv manzana nebst entsprechendem definiten Artikel (la) sowie die passende Form des Verbs comer, also comió (da die abgeschlossene Handlung in der Vergangenheit ausgedrückt wird). Auf der Basis grundlegender Regeln syntaktischen Strukturaufbaus (vgl. Gabriel & Müller 2013: 124-133) erstellt GEN aus diesem lexikalischen Material alle potentiellen Stellungsabfolgen und versieht diese mit in der jeweiligen Varietät möglichen F 0 -Konturen. Auf diese Weise ist der Umfang der zu evaluierenden Strukturen von vornherein beschränkt. Das Tableau in Abb. 4.5-18 zeigt die Evaluation (EVAL) dreier Kandidaten. 84 SF S TAY AFR (1) [ F MaRÍa] comió la manzana. *(! ) (2) Comió la manzana [ F MaRÍa] *(! ) (3) [ F María] comió la manZAna. *! Abb. 4.5-18 OT-Tableau für drei mögliche Kandidaten eines Aussagesatzes mit transitivem Verb, nominalem Objekt und fokussiertem Subjekt. Die Position des Nuklearakzents wird durch Großschreibung der entsprechenden Silbe angezeigt. Kandidat (3) scheidet aus, da Nuklearakzent (manZAna) und Fokus ([ F María]) nicht miteinander korrelieren und damit die in der Hierarchie hoch angesiedelte Beschränkung S TRESS F OCUS verletzt wird. Diese fatale Verletzung, die zum Ausschluss aus dem Wettbewerb führt, wird im Tableau durch ‘*! ’ markiert. Die Kandidaten (1) und (2) werden dagegen gleichermaßen als korrekte Formen bewertet (angezeigt durch ‘ ’), weil S TAY und A LIGN F OCUS R IGHT hierarchisch gleichgeordnet sind (zu erkennen durch die gestrichelte Linie zwischen den beiden Constraints). Durch diese Art der Evaluation lässt sich jedoch nicht zum Ausdruck bringen, dass (1) die von den Sprechern 83 Selbstverständlich kann der Sprecher auch einfach nur die erfragte Konstituente nennen, also mit einem Einwortsatz antworten: ¿Quién se comió la manzana? María. 84 Zusätzlich zu 4: 11a, c (Kand. 1 und 2) wurde ein weiterer Kandidat aufgenommen (3). # 213 häufiger produzierte Variante ist, während (2) zwar als akzeptabel gilt, aber nur selten vorkommt. Im overlapping constraints-Modell können solche Fälle von freier Variation (Optionalität) in Bezug auf ihre Vorkommenstendenzen erfasst werden. In unserem konkreten Fall wäre davon auszugehen, dass die Beschränkungen S TAY und A LIGN F OCUS R IGHT auf einer kontinuierlichen Skala (continuous ranking scale, CRS) dicht beieinanderliegen und sich dergestalt überlappen, dass bei der Ableitung der Hierarchie im konkreten Evaluationsvorgang entweder S TAY oder A LIGN F OCUS R IGHT die jeweils andere Beschränkung dominiert: Liegt das Teilranking S TAY » A LIGN F OCUS R IGHT vor, wird Kandidat (1) als optimale Form bewertet; ist die Hierarchie umgekehrt, also A LIGN F O- CUS R IGHT » S TAY , dann ist Kandidat (2) der Sieger. Wie aus Abb. 4.5-19 hervorgeht, ist die Wahrscheinlichkeit, dass Kandidat (1) [ F MaRÍa] comió la manzana als optimale Form gewählt wird, deutlich größer (~ 95 % [ F S]VO, Gabriel 2010: 202): Da S TAY auf der CRS höher angesiedelt ist als A LIGN F OCUS R IGHT und der Überlappungsbereich vergleichsweise gering ist, resultiert nur in wenigen Fällen (5 %) das Teilranking A LIGN F OCUS R IGHT » S TAY und damit die in empirischen Sprachdaten selten auftretende Form Comió la manzana [ F MaRÍa] (Kandidat 2). Abb. 4.5-19 Continuous ranking scale (CRS) mit den überlappenden Beschränkungen S TAY und AFR. 4.5.5.4 Intonation komplexer Sätze und Diskursintonation Komplexe Sätze werden durch prosodische Phrasierung in kleinere Einheiten untergliedert. Je nach Stärke der tonalen Markierung kann es sich hierbei um IP- oder ip- Grenzen handeln. Dabei gilt als Faustregel, dass bei zunehmender Länge und Komplexität der Satzkonstruktion auch mehr satzinterne IP-Grenzen vorkommen. Nebensätze werden normalerweise getrennt phrasiert; sind diese komplex und wiederum in eine komplexe Satzkonstruktion eingebunden, liegt meist eine IP-Grenze vor. Es ist klar, dass sich hierfür kaum allgemeingültige Regeln aufstellen lassen und dass die konkrete prosodische Phrasierung stark vom Sprechtempo sowie vom individuellen Redestil des Sprechers abhängt. Zudem ist auch nicht immer einfach zu entscheiden, ob eine vorliegende Grenze dem BI-Niveau 3 (ip) oder 4 (IP) entspricht. Nachfolgend geben wir ein Beispiel für eine mögliche Phrasierung des ersten Satzes aus dem Nordwind-Text. (4: 12) ( IP ( ip El viento del norte) ( ip y el sol) ( ip estaban disputándose) ( ip sobre cuál de ellos) ( ip era el más fuerte), ( IP cuando pasó un viajero) ( ip envuelto en una gruesa capa)). In Bezug auf die Phrasierung bestimmter Satzkonstruktionen lassen sich allerdings deutliche Tendenzen konstatieren. So werden in segmentierten Sätzen des Typs S TRESS F OCUS SF » S TAY » AFR S TAY AFR S TRESS F OCUS S TAY AFR SF » AFR » S TAY Optimale Form: Kand. (1) [ F MaRÍa] comió la manzana. [ F S]VO (95%) Optimale Form: Kand. (2) Comió la manzana [ F MaRÍa]. VO[ F S] (5%) 214 María, en el kiosco, compra el periódico (vgl. Beispiel 4: 9a) die linksdislozierten Topic- Konstituenten in der Regel durch einen hohen intermediären Grenzton Hvom Kernsatz abgetrennt, wobei die ip-Grenzen wiederum in unterschiedlicher Form phonetisch realisiert werden können (vgl. 4.5.5.1 und Abb. 4.5-14). In Abb. 4.5-20, die die F 0 -Kontur zum bereits besprochenen Beispiel (4: 9a) repräsentiert, liegen zwei verschiedene Oberflächenformen des ip-Grenztons / H-/ vor, nämlich [H-] (CR) und [! H-] (SP). Weiterhin ist innerhalb des Kernsatzes die ebenfalls bereits diskutierte Phrasengrenze zwischen der Verbform compra und dem neutral fokussierten Objekt el Abb. 4.5-20 Phrasierung des segmentierten Satzes María, en el kiosco, compra [ F el periódico] mit zwei linksdislozierten Topics und eng fokussiertem Objekt (Kastilisch). Zur prosodischen Gliederung und zur Intonation größerer Diskurseinheiten im Spanischen liegen bislang nur wenige AM-basierte Studien vor. Bisherige Analysen spontansprachlicher Daten im Rahmen des AM-Modells haben u.a. gezeigt, dass sowohl die reguläre Deklination als auch der für das Spanische typische Effekt des final lowering (finales Absenken, vgl. 4.5.1) hier weniger stark ausgeprägt sind als in gelesenen Daten. So ist das finale Absenken im kastilischen Spanisch auf bestimmte pragmatische Kontexte begrenzt und tritt vorzugsweise beim Vermitteln bereits erwähnter oder vorhersagbarer Information (Face 2003) oder in subjektiven Behauptungen auf (Rao 2006). Erste Untersuchungen zum Porteño-Spanischen haben gezeigt, dass die bisher als freie Variation charakterisierte Alternanz der ip-Grenzmarkierungen continuation rise (CR [H-]) und sustained pitch (SP [! H-]; vgl. 4.5.5.1) möglicherweise vom größeren Kontext im Diskurs bestimmt ist und die beiden Varianten daher tentativ bestimmten pragmatischen Funktionen zuzuordnen sind: Während CR vor allem in Aufzählungen auftritt, wird SP vorwiegend in Aussagen mit narrativem Charakter verwendet (Feldhausen et al. 2011b). Die Analyse spontaner Sprachdaten ermöglicht also, die pragmatische Funktion von tonalen Grenzmarkierungen genauer zu erfassen, als das etwa in gelesenen Daten geschehen kann. In Bezug auf die Realisierung und Distribution von Tonhöhenakzenten treten in der Spontansprache häufiger Fälle von Deakzentuierung auf, als es in laborsprachlichen Daten der Fall ist, und zwar nicht nur in Form von postfokaler Deakzentuierung (vgl. 4.5.5.2), sondern auch in pränuklearer Position, wo nach Rao (2006) ca. 30 % der akzentogenen Wörter keinen Tonhöhenakzent tragen. Auch sind Tonhöhenakzente, die auf der Basis von Labordaten als kontrastiv oder emphatisch charakterisiert periódico zu sehen, hier realisiert als sustained pitch ([! H-]). 215 wurden (Kastilisch: L+H*; Porteño-Spanisch: L+H*+L; vgl. 4.5.4.1 bzw. 4.5.4.2), in der Spontansprache nicht auf korrigierende oder exklamative Kontexte beschränkt (Face 2003, Rao 2006, Feldhausen et al. 2011b, Peåková et al. 2012). Für das Porteño- Spanische wurde zudem gezeigt, dass der tritonale Tonhöhenakzent L+H*+L, abweichend von den Labordaten, auch als Pränuklearakzent auftritt (Peåková et al. 2012: 376). Das stärkere Vorkommen tonaler Hervorhebungsstrategien in der Spontansprache wird dann plausibel, wenn man sich vor Augen hält, dass hier ganze Passagen einen emphatischen Charakter annehmen können (z.B. wenn der Sprecher begeistert von einem Ereignis berichtet), wohingegen sich dies in der Laborsprache auf gezielt evozierte Hervorhebungen beschränkt (z.B. Korrekturen). Die Beschäftigung mit spontanen Sprachdaten ist also als eine notwendige und wichtige Erweiterung zur Analyse von Labordaten zu sehen, da auf diese Weise ein zuvor unter Laborbedingungen postuliertes Toninventar im Hinblick auf seine Angemessenheit überprüft und die kontextuelle Verteilung von Grenztönen und Tonhöhenakzenten genauer bestimmt werden kann. Übungsaufgaben 1) Was sind prosodische Einheiten? Zählen Sie die prosodischen Einheiten auf, die normalerweise unterschieden werden und definieren Sie diese kurz. 2) Erläutern Sie, warum die CV-Silbe typologisch gesehen die am wenigsten markierte Silbenstruktur ist. An welchen Phänomenen erkennt man, dass das Spanische CV-Silben bevorzugt? 3) Syllabieren Sie den folgenden Satz: Desde el punto de vista acústico, las realizaciones aproximantes presentan algunas características específicas. Welchen Unterschied stellen Sie im Vergleich zur Syllabierung der isolierten Wörter desde, acústico, realizaciones, presentan fest? Warum werden diese innerhalb der Äußerung anders syllabiert als bei isolierter Verwendung? 4) Welche Formen hat das französische Wort champagne im Spanischen angenommen? Erläutern Sie diese aus silbenphonologischer Sicht. 5) Erläutern Sie die Weiterentwicklung des englischen Worts spleen im Spanischen. 6) Erläutern Sie anhand von Beispielen, was unter palabras esdrújulas zu verstehen ist und stellen Sie einen Bezug zur Akzentphonologie des Spanischen her. 7) Bestimmen Sie die Position des Wortakzents in den folgenden Beispielen: alto, altos, se ñ or, se ñ ores, limpieza, limpiaparabrisas, esplendor, esplendorosamente. Welche Regeln haben Sie dabei angewandt? 8) Erläutern Sie, warum in den folgenden Beispielen die Wortakzentsilbe graphisch durch den Akut gekennzeichnet ist: límpido, espléndido, línea, esplín, conclusión, (vos) cantás, buqué, chantillí, cantó, bíceps, biología, ciempiés, espontáneamente, ávidamente. 9) Beschreiben Sie, wann und wofür Längungen bestimmter Silben im Spanischen auftreten. 10) Können Tonhöhenunterschiede für einen Bedeutungsunterschied sorgen? Belegen Sie Ihre Argumentation mit Beispielen aus unterschiedlichen Sprachen. 456789: 6; 8: 5<7 216 11) Diskutieren Sie, ob der Tonhöhenverlauf im Spanischen am Ende einer Frage sinkt oder steigt. Geben Sie jeweils Beispielsätze an. 12) Welche unterschiedlichen Funktionen kann die Intonation übernehmen? 13) Nehmen Sie den Lesetext El viento del norte y el sol bzw. Einst stritten sich Nordwind und Sonne (s. Anhang) von spanischen und deutschen Muttersprachlern sowie von Spanischlernern (L1 Deutsch) und von Deutschlernern (L1 Spanisch) auf. Analysieren Sie den Sprachrhythmus der beiden muttersprachlichen und der beiden Lernervarietäten entsprechend den in 4.4.3 genannten Kriterien. Welche Erwartungen haben Sie in Bezug auf die rhythmische Beschaffenheit der vier Datensätze? Wo zeigt sich gegebenenfalls prosodischer Transfer? 14) Das Europäische Portugiesisch wird traditionell als eher akzentzählende Sprache aufgefasst. Welche Hypothese lässt sich für die rhythmische Beschaffenheit des L2-Portugiesischen spanischer Muttersprachler aufstellen? 15) Informieren Sie sich über das Intonationssystem des Deutschen und analysieren Sie die für Aufgabe (1) erhobenen Lernerdaten (L2 Deutsch, produziert von spanischen Muttersprachlern; L2 Spanisch, produziert von deutschen Muttersprachlern) in Bezug auf die Realisierung der Tonhöhenakzente. Welche Erwartungen haben Sie bezüglich des tonalen Transfers? 16) Lesen Sie Absatz 4.5.4.3 erneut und informieren Sie sich in der dort angeführten Literatur eingehender über die Intonation des mexikanischen Spanisch. Wie wird in dieser Varietät die kontrastive Fokussierung eines Objekts in satzfinaler Position markiert? 17) Erstellen Sie einen visuellen Stimulus (Zeichnung), der die folgende Situation zeigt: Verónica le da un libro a Juan. Bitten Sie spanische Muttersprachler, hierzu die nachfolgenden Fragen zu beantworten, wobei Antworten, die aus nur einem Satzglied bestehen, vermieden werden sollen. (a) ¿Qué pasa en el dibujo? (mögliche Antwort: Verónica le da un libro a JUAN.) (b) ¿Qué hace Verónica? (mögliche Antwort: Le da un libro a JUAN.) (c) ¿Qué le da Verónica a Juan? (mögliche Antworten: Verónica le da un LIbro a Juan. Verónica le da a Juan un LIbro. Le da un LIbro. Un LIbro le da a Juan etc.) (d) ¿A quién le da Verónica un libro? (mögliche Antworten: Le da un libro a JUAN. A JUAN le da un libro etc.) Analysieren Sie die Daten unter folgenden Gesichtspunkten: Welche Wortstellungsmuster werden verwendet? Wird bei neutraler Wortstellung die Fokusdomäne (enger vs. weiter Fokus) durch eine intermediäre Phrasengrenze angezeigt? Wenn ja, wie wird diese Grenze phonetisch realisiert? Anhang aus IPA (1999: ix) 218 Der Nordwind und die Sonne Kastilisch El viento norte y el sol porfiaban sobre cuál de ellos era el más fuerte, cuando acertó a pasar un viajero envuelto en ancha capa. Convinieron en que quien antes lograra obligar al viajero a quitarse la capa sería considerado más poderoso. El viento norte sopló con gran furia, pero cuanto más soplaba, más se arrebujaba en su capa el viajero; por fin el viento norte abandonó la empresa. Entonces brilló el sol con ardor, e inmediatamente se despojó de su capa el viajero; por lo que el viento norte hubo de reconocer la superioridad del sol. (Quilis & Fernández 1996: 190) Lateinamerikanisches Spanisch El viento del norte y el sol estaban disputándose sobre cuál de ellos era el más fuerte, cuando pasó un viajero envuelto en una gruesa capa. Se pusieron de acuerdo en que el primero que lograra que el viajero se quitara la capa sería considerado más fuerte que el otro. Entonces, el viento del norte sopló tan fuerte como pudo, pero cuanto más soplaba más estrechamente se ceñía el viajero la capa al cuerpo hasta que, al fin, el viento del norte se rindió. Luego, el sol brilló calurosamente y de inmediato el viajero se despojó de su capa. Así, el viento del norte se vio obligado a reconocer que el sol era el más valiente de los dos. (http: / / www.uiowa.edu/ ~acadtech/ dialects/ ) Deutsch Einst stritten sich Nordwind und Sonne, wer von ihnen beiden wohl der Stärkere wäre, als ein Wanderer, der in einen warmen Mantel gehüllt war, des Weges daherkam. Sie wurden einig, dass derjenige für den Stärkeren gelten sollte, der den Wanderer zwingen würde, seinen Mantel abzunehmen. Der Nordwind blies mit aller Macht, aber je mehr er blies, desto fester hüllte sich der Wanderer in seinen Mantel ein. Endlich gab der Nordwind den Kampf auf. Nun erwärmte die Sonne die Luft mit ihren freundlichen Strahlen, und schon nach wenigen Augenblicken zog der Wanderer seinen Mantel aus. Da musste der Nordwind zugeben, dass die Sonne von ihnen beiden der Stärkere war. (IPA 1999: 89) Literaturverzeichnis Abercrombie, David (1967): Elements of General Phonetics. Edinburgh: Edinburgh University Press. Aguilar, Lourdes; de-la-Mota, Carme & Prieto, Pilar (2009): Sp_ToBI. Training materials. http: / / prosodia.upf.edu/ sp_tobi/ en Alarcos Llorach, Emilio ( 4 1986): Fonología española. Madrid: Gredos ( 1 1950). Alonso-Cortés, Ángel (2010): El sistema fonemático del español normativo reexaminado. In: Zeitschrift für Romanische Philologie 55, 602-608. Archangeli, Diana (1988): Aspects of underspecification theory. In: Phonology 5, 183-207. Armstrong, Lilias E. & Ward, Ida C. (1926): Handbook of English intonation. Leipzig: Teubner. Auer, Peter (2001): Silben- und akzentzählende Sprachen. In: Haspelmath, Martin; König, Ekkehard; Oesterreicher, Wulf & Raible, Wolfgang (eds.): Language Typology and Language Universals. An International Handbook. Berlin: De Gruyter, 1391-1399. Auer, Peter & Uhmann, Susanne (1988): Silben- und akzentzählende Sprachen. Literaturüberblick und Diskussion. In: Zeitschrift für Sprachwissenschaft 7, 214-259. Bakovi×, Eric (1994): Strong onsets and Spanish fortition. In: Giordano, Chris & Ardron, Daniel (eds.): MIT working papers in linguistics 23, 21-39. Bauer, Angelika & Auer, Peter (2008): Aphasie im Alltag. Stuttgart: Thieme. Becker, Thomas (2012): Einführung in die Phonetik und Phonologie des Deutschen. Darmstadt: Wissenschaftliche Buchgesellschaft. Beckman, Mary E.; Díaz-Campos, Manuel; Tevis McGory, Julia & Morgan, Terrell A. (2002): Intonation across Spanish, in the Tones and Break Indices Framework. In: Probus 14, 9-36. Beckman, Mary E.; Hirschberg, Julia & Shattuck-Hufnagel, Stefanie (2005): The Original ToBI System and the Evolution of the ToBI Framework. In: Jun, Sun-Ah (ed.): Prosodic Typology: The Phonology of Intonation and Phrasing. Oxford: Oxford University Press, 9- 54. Beckman, Mary E. & Pierrehumbert, Janet B. (1986): Intonational Structure in Japanese and English. In: Phonology Yearbook 3, 255-309. Benet, Ariadna; Gabriel, Christoph; Kireva, Elena & Peåková, Andrea (2012): Prosodic transfer from Italian to Spanish: Rhythmic Properties of L2 Speech and Argentinean Porteño. In: Proceedings of Speech Prosody 2012, Shanghai, China. http: / / www.speechprosody2012.org/ uploadfiles/ file/ sp2012_submission_176.pdf Bernstein, Lynne E. (2005): Phonetic Processing by the speech perceiving brain. In: Pisoni, David B. & Remez, Robert E. (eds.): The Handbook of Speech Perception. Malden, Mass.: Blackwell, 79-98. Bertinetto, Pier M. (1989): Reflections on the dichotomy ‘stressvs. syllable-timing’. In: Revue de Phonétique Appliquée 91/ 93, 99-130. Blecua, Beatriz (2001): Las vibrantes del español: manifestaciones acústicas y procesos fonéticos. Ph.D. Diss. Barcelona: Universitat Autònoma de Barcelona. Blevins, Juliette (1995): The Syllable in Phonological Theory. In: Goldsmith, John A. (ed.): The Handbook of Phonological Theory. Oxford: Blackwell, 206-244. Boersma, Paul & Hayes, Bruce (2001): Empirical Tests of the Gradual Learning Algorithm. In: Linguistic Inquiry 32, 45-86. Boersma, Paul & Weenink, David (2012): Praat: doing phonetics by computer [Computer program]. Version 5.3.11. http: / / www.praat.org/ 220 Bolinger, Dwight (1951): Intonation: Levels vs. configurations. In: Word 7, 199-210. Bruce, Gösta (1977): Swedish Word Accents in Sentence Perspective. Lund: Gleerup. Bühler, Karl (1934): Sprachtheorie. Jena: Gustav Fischer. [Nachdruck Stuttgart: Gustav Fischer, 1982]. Bybee, Joan (2006): From usage to grammar. The mind’s response to repetition. In: Language 82, 711-733. Campos-Astorkiza, Rebeka (2012): The Phonemes of Spanish. In: Hualde, José Ignacio; Olarrea, Antxon & O’Rourke, Erin (eds.): The Handbook of Hispanic Linguistics. Oxford: Blackwell, 89-109. Carreiras, Manuel & Perea, Manuel (2004): Naming pseudowords in Spanish: Effects of syllable frequency. In: Brain and Language 90, 393-400. Chomsky, Noam (1957): Syntactic structures. ’s-Gravenhage: Mouton. Chomsky, Noam (1971): Deep Structure, Surface Structure and Semantic Interpretation. In: Steinberg, Danny D. & Jakubovits, Leon A. (eds.): Semantics: An interdisciplinary Reader in Philosophy, Linguistics and Psychology. Cambridge: Cambridge University Press, 183-216. Chomsky, Noam & Halle, Morris (1968): The Sound Pattern of English. New York: Harper & Row. Clark, John; Yallop, Colin & Fletcher, Janet ( 3 2007): An Introduction to Phonetics and Phonology. Malden, Mass.: Blackwell ( 1 1990). Clements, George (1985): The geometry of phonological features. In: Phonology Yearbook 2, 225-252. Cloonan Cortez de Andersen, Denise (2010): Contornos del habla: fonología y fonética del español. New Haven & London: Yale University Press. Cohn, Abigail C.; Fougeron, Cécile & Huffman, Marie K. (eds.) (2012): The Oxford Handbook of Laboratory Phonology. Oxford: Oxford University Press. Colina, Sonia (2009): Spanish phonology. A syllabic perspective. Washington: Georgetown University Press. Coseriu, Eugenio (1952): Sistema, norma y habla. In: Revista de la Factultad de Humanidades y Ciencias 9. Montevideo: 113-181 (Dt. Übersetzung in: Sprachtheorie und Allgemeine Sprachwissenschaft (1975). München: Fink, 11-101). Coseriu, Eugenio (1980): ‘Historische’ Sprache und ‘Dialekt’. In: Göschel, Joachim (ed.): Dialekt und Dialektologie. Wiesbaden: Steiner, 106-122. Coseriu, Eugenio ( 2 1992): Einführung in die Allgemeine Sprachwissenschaft. Tübingen: Francke ( 1 1988). Crawford, Clifford J. (2009): Adaptation and Transmission in Japanese Loanword Phonology. Ph.D. Diss., Cornell University. Cressey, William W. (1978): Spanish phonology and morphology. A generative view. Washington: Georgetown University Press. D’Imperio, Mariapaola; Elordieta, Gorka; Frota, Sonia; Prieto, Pilar & Vigário, Marina (2005): Intonational phrasing in Romance: The role of syntactic and prosodic structure. In: Frota, Sonia; Vigário, Marina & Freitas, Maria Jo-o (eds.): Prosodies. Berlin: De Gruyter, 59-98. D’Introno, Francesco; del Teso, Enrique & Weston, Rosemary (1995): Fonética y fonología actual del español. Madrid: Cátedra. Daneå, Frantiåek et al. (1974): Zur Terminologie der FSP. In: Daneå, Frantiåek (ed.): Papers on Functional Sentence Perspective. Prag: Academia, 217-222. Dauer, Rebecca (1983): Stress-timing and syllable-timing reanalyzed. In: Journal of Phonetics 11, 51-62. 221 Del Giudice, Alex; Shosted, Ryan; Davidson, Kathryn; Salihie, Mohammad & Arvaniti, Amalia (2007): Comparing methods for locating pitch ‘elbows’. In: Proceedings of the 15 th International Congress of Phonetic Sciences 2007, Saarbrücken, 1117-1120. De Lacy, Paul (2006): Markedness: reduction and preservation in phonology. Cambridge: Cambridge Univ. Press. De-la-Mota, Carme; Martín Butragueño, Pedro & Prieto, Pilar (2010): Mexican Spanish intonation. In: Prieto, Pilar & Roseano, Paolo (eds.): Transcription of Intonation of the Spanish Language. München: Lincom, 319-350. Delattre, Pierre (1965): Comparing the phonetic features of English, French, German and Spanish: An interim report. Heidelberg: Julius Groos. Delattre, Pierre (1966): A comparison of syllable length conditioning among languages. In: International Review of Applied Linguistics in Language Teaching 4, 183-198. Dellwo, Volker (2006): Rhythm and speech rate: A variation coefficient for deltaC. In: Karnowski, Pawel & Szigeti, Imre (eds.): Language and Language Processing: Proceedings of the 38th Linguistic Colloquium, Piliscsaba. Frankfurt: Lang, 231-241. Dellwo, Volker & Wagner, Petra (2003): Relations between language rhythm and speech rate. In: Solé, Maria José; Recasens, Daniel & Romero, Joaquim (eds.): Proceedings of the 15th International Congress of Phonetic Sciences, Barcelona: Futurgraphic, 471-474. Dogil, Grzegorz; Gvozdanovi , Jadranka & Kodzasov, Sandro (1999): Slavic languages. In: Hulst, Harry van der (ed.): Word Prosodic Systems in the Languages of Europe. Berlin: De Gruyter, 813-876. Donegan, Patricia & Stampe, David (1979): The study of Natural Phonology. In: Dinnsen, Daniel A. (ed.): Current approaches to phonological theory. Bloomington: Indiana University Press, 126-173. Dufter, Andreas (2003): Typen sprachrhythmischer Konturbildung. Tübingen: Niemeyer. Engel, Andreas K. & Singer, Wolf (2001): Neuronale Grundlagen des Bewusstseins. In: Heinz Nixdorf MuseumsForum (ed.): Computer. Gehirn. Was kann der Mensch? Was können die Computer? Schöningh, Paderborn, 62-85. Estebas-Vilaplana, Eva & Prieto, Pilar (2009): La notación prosódica en español: Una revisión del Sp_ToBI. In: Estudios de Fonética Experimental 18, 263-283. Estebas-Vilaplana, Eva & Prieto, Pilar (2010): Castilian Spanish intonation. In: Prieto, Pilar & Roseano, Paolo (eds.): Transcription of Intonation of the Spanish Language. München: Lincom, 17-48. Face, Timothy L. (2002): Intonational Marking of Contrastive Focus in Madrid Spanish. Frankfurt: Lang. Face, Timothy L. (2003): Intonation in Spanish declaratives: differences between lab speech and spontaneous speech. In: Catalan Journal of Linguistics 2, 115-131. Face, Timothy L. & Prieto, Pilar (2007): Rising Accents in Castilian Spanish: A Revision of Sp_ToBI. In: Journal of Portuguese Linguistics 6, 117-146. Face, Timothy L. (ed.) (2004): Laboratory Approaches to Spanish Phonology. Berlin: De Gruyter. Fant, Gunnar (1960): Acoustic Theory of Speech Production. The Hague: Mouton. Feldhausen, Ingo; Peåková, Andrea; Kireva, Elena & Gabriel, Christoph (2011a): Categorical perception of Porteño nuclear accents. In: Lee, Wai-Sum & Zee, Eric (eds.): Proceedings of the 17 th International Congress of Phonetic Sciences 2011, Hong Kong, China (ICPhS 17), 116-119. Feldhausen, Ingo; Benet, Ariadna & Peåková, Andrea (2011b): Prosodische Grenzen in der Spontansprache: Eine Untersuchung zum Zentralkatalanischen und Porteño-Spanischen (Arbeiten zur Mehrsprachigkeit 94). Hamburg: SFB 538 “Mehrsprachigkeit”. 222 http: / / www1.uni-hamburg.de/ romanistik/ personal/ pdf-Dateien/ Feldhausen-et-al- 2011---Prosodische-Grenzen-in-der-Spontansprache---AzM94_final.pdf Fellbaum, Klaus ( 2 2013): Sprachverarbeitung und Sprachübertragung. Berlin: Springer ( 1 1984). Féry, Caroline (2012): Die Annotation der deutschen Intonation: Wie kann GToBI die Syntax und die Semantik integrieren? In: Linguistische Berichte 229, 39-97. Fiukowski, Heinz ( 8 2010): Sprecherzieherisches Elementarbuch. Berlin: De Gruyter ( 1 1967). Fowler, Carol A. & Galantucci, Bruno (2005): The relation of speech perception and speech production. In: Pisoni, Daviv B. & Remez, Robert E. (eds.): The Handbook of Speech Perception. Malden, Mass.: Blackwell, 633-648. Fowler, Carol A. & Saltzman, Elliot (1993): Coordination and Coarticulation in Speech Production. In: Language and Speech 36: 2/ 3, 171-195. Frota, Sónia (2012): Prosodic structure, constituents, and their implementation. In: Cohn, Abigail C.; Fougeron, Cécile & Huffman, Marie (eds.): The Oxford Handbook of Laboratory Phonology. Oxford: Oxford University Press, 255-265. Frota, Sonia; D’Imperio, Mariapaola; Elordieta, Gorka; Prieto, Pilar & Vigário, Marina (2007): The phonetics and phonology of intonational phrasing in Romance. In: Prieto, Pilar; Mascaró, Joan & Solé, Maria-Josep (eds.): Segmental and Prosodic Issues in Romance Phonology. Amsterdam: Benjamins, 131-153. Gabriel, Christoph (2007): Fokus im Spannungsfeld von Phonologie und Syntax. Eine Studie zum Spanischen. Frankfurt: Vervuert. Gabriel, Christoph (2010): On Focus, Prosody, and Word Order in Argentinean Spanish. A Minimalist OT Account. In: Revista Virtual de Estudos da Linguagem, Special issue 4 “Optimality-theoretic Syntax”, 183-222. Gabriel, Christoph; Feldhausen, Ingo & Peåková, Andrea (2011): Prosodic Phrasing in Porteño Spanish. In: Gabriel, Christoph & Lleó, Conxita (eds.): Intonational Phrasing in Romance and Germanic: Cross-Linguistic and Bilingual Studies. Amsterdam: Benjamins, 153-182. Gabriel, Christoph; Feldhausen, Ingo; Peåková, Andrea; Colantoni, Laura; Lee, Su-Ar; Arana, Valeria & Labastía, Leopoldo (2010): Argentinian Spanish intonation. In: Prieto, Pilar & Roseano, Paolo (eds.): Transcription of Intonation of the Spanish Language. München: Lincom, 285-317. Gabriel, Christoph & Kireva, Elena (2012): Intonation und Rhythmus im spanischitalienischen Kontakt: Der Fall des Porteño-Spanischen. In: Schafroth, Elmar & Selig, Maria (eds.): Testo e ritmi. Zum Rhythmus in der italienischen Sprache (Studia romanica et linguistica 35). Frankfurt: Lang, 131-149. Gabriel, Christoph & Meisenburg, Trudel (2007): Romanische Sprachwissenschaft. Paderborn: Fink. Gabriel, Christoph & Müller, Natascha ( 2 2013): Grundlagen der generativen Syntax: Französisch, Italienisch, Spanisch (Romanistische Arbeitshefte 51). Tübingen / Berlin: De Gruyter ( 1 2008). Ganong, William F. (1980): Phonetic categorization in auditory word perception. In: Journal of Experimental Psychology: Human Perception and Performance 6, 110-125. Gaskell, M. Gareth (2007): Statistical and connectionist models of speech perception and word recognition. In: Gaskell, M. Gareth (ed.): The Oxford Handbook of Psycholinguistics. Oxford: Oxford University Press, 55-69. Goldman, Jean-Philippe & Schwab, Sandra (2011): EasyAlign Spanish: a (semi-)automatic segmentation tool under Praat. Erscheint in: Fonética Experimental, Espacio Europeo de Educación Superior e Investigación. Actas del V Congreso Internacional de Fonética Experi- 223 mental. Cáceres. http: / / latlcui.unige.ch/ phonetique/ easyalign/ GoldmanSchwab- EasyAlignSpanish-5thCFE-2011.pdf Goldsmith, John A. (1979): Autosegmental phonology. New York: Garland. Goldstein, E. Bruce ( 7 2008): Wahrnehmungspsychologie. Der Grundkurs. Berlin: Springer. Grabe, Esther & Low, Ee Ling (2002): Durational variability in speech and the rhythm class hypothesis. In: Gussenhoven, Carlos & Warner, Natasha (eds.): Papers in Laboratory Phonology 7. Berlin: De Gruyter, 515-546. Grice, Martine (1995): Leading tones and downstep in English. In: Phonology 12, 183-233. Grice, Martine & Baumann, Stefan (2002): Deutsche Intonation und GToBI. In: Linguistische Berichte 191, 267-298. Grice, Martine; D’Imperio, Mariapaola; Savino, Michelina & Avesani, Cinzia (2006): Strategies for intonation labelling across varieties of Italian. In: Jun, Sun-Ah (ed.): Prosodic typology. Oxford: Oxford University Press, 362-389. Gussenhoven, Carlos (2004): The phonology of tone and intonation. Cambridge: Cambridge University Press. Hall, T. Alan ( 2 2011): Phonologie. Eine Einführung. Berlin: De Gruyter ( 1 2000). Halle, Morris & Clements, George N. (1983): Problem Book in Phonology: A Workbook for Introductory Courses in Linguistics and Modern Phonology. Cambridge, Mass.: MIT Press. Hardcastle, William J. & Hewlett, Nigel (eds.) (1999): Coarticulation: Theory, Data and Techniques. Cambridge: Cambridge University Press. Harris, James W. (1969): Spanish phonology. Cambridge, Mass.: MIT Press. Harris, James W. (1983): Syllable structure and stress in Spanish. A nonlinear analysis. Cambridge, Mass.: MIT Press. Harris, James W. (1984): Theories of phonological representation and nasal consonants in Spanish. In: Philip Baldi (ed.): Papers from the 12th Linguistic Symposium on Romance Languages. Amsterdam: Benjamins, 153-168. Harris, James W. (1995): Projection and edge marking in the computation of stress in Spanish. In: Goldsmith, John A. (ed.): The Handbook of Phonological Theory. Oxford: Blackwell, 867-887. Hawkins, Sarah (2010): Phonological features, auditory objects and illusions. In: Journal of Phonetics 38, 60-89. Hayes, Bruce (1995): Metrical Stress Theory. Principles and Case Studies. Chicago: University of Chicago Press. Hidalgo Navarro, Antonio & Quilis Merin, Mercedes ( 2 2004): Fonética y fonología española. Valencia: Tirant lo Blanch ( 1 2002). Hidalgo Navarro, Antonio & Quilis Merín, Mercedes (2012): La voz del lenguaje: Fonética y fonología del español. Valencia: Tirant Humanidades. Hocket, Christopher F. (1958): A course in modern linguistics. New York: Macmillan. Hualde, José Ignacio (2002): Intonation in Spanish and the other Ibero-Romance Languages: Overview and Status Quaestionis. In: Wiltshire, Caroline R. & Camps, Joaquim (eds.): Romance Phonology and Variation. Amsterdam: Benjamins, 101-115. Hualde, José Ignacio (2003a): El modelo métrico y autosegmental. In: Prieto, Pilar (ed.): Teorías de la entonación. Barcelona: Ariel, 155-184. Hualde, José Ignacio (2003b): Remarks on the diachronic reconstruction of intonational patterns in Romance with special attention to Occitan as a bridge language. In: Catalan Journal of Linguistics 2, 181-205. Hualde, José Ignacio (2004): Romance intonation from a comparative and diachronic perspective: Possibilities and limitations. In: Auger, Julie; Clements, J.C. & Vance, Bar- 224 bara (eds.): Contemporary approaches to Romance Linguistics. Amsterdam: Benjamins, 217-237. Hualde, José Ignacio (2005): The sounds of Spanish. Cambridge: Cambridge University Press. Hualde, José Ignacio (2006): Stress removal and addition in Spanish. In: Journal of Portuguese Linguistics 5.2, 59-89. Hualde, José Ignacio (2010): Secondary stress and stress clash in Spanish. In: Ortega- Llebaria, Marta (ed.): Selected Proceedings of the 4 th Conference on Laboratory Approaches to Spanish Phonology. Somerville, MA: Cascadilla Proceedings Project, 11-19. Hulst, Harry van der (1999): Word Accent. In: Hulst, Harry van der (ed.): Word Prosodic Systems in the Languages of Europe. Berlin: De Gruyter, 3-115. Hurch, Bernhard & Rhodes, Richard A. (eds.) (1996): Natural Phonology (Trends in Linguistics. Studies and Monographs. 92). Berlin: De Gruyter. Idsardi, William & Poeppel, David (2012): Neurophysiological techniques in laboratory phonology. In: Cohn, Abigail C.; Fougeron, Cécile & Huffman, Marie (eds.): The Oxford Handbook of Laboratory Phonology. Oxford: Oxford University Press, 593-605. IPA (1999): Handbook of the International Phonetic Association. Cambridge: Cambridge University Press. Jakobson, Roman & Halle, Morris (1956): Fundamentals of language. The Hague: Mouton. Jakobson, Roman & Waugh, Linda (1979): The sound shape of language. Brighton: Harvester Press (Dt. Übersetzung: Die Lautgestalt der Sprache. Berlin: De Gruyter, 1986). Jakobson, Roman; Fant, C. Gunnar M. & Halle, Morris (1952): Preliminaries to speech analysis: the distinctive features and their correlates. Cambridge, Mass.: MIT Press. Jessen, Michael (2012): Phonetische und linguistische Prinzipien des forensischen Stimmenvergleichs. München: Lincom. Jones, Daniel (1918): An outline of English phonetics. Leipzig: Teubner. Kabatek, Johannes & Pusch, Claus D. (2009): Spanische Sprachwissenschaft. Tübingen: Narr. Kager, René (1995): The metrical theory of word stress. In: Goldsmith, John A. (ed.): The Handbook of Phonological Theory. Oxford: Blackwell, 367-402. Kager, René (2007): Feet and metrical stress. In: De Lacy, Paul (ed.): The Cambridge Handbook of Phonology. Cambridge: Cambridge University Press, 195-227. Kasper, Gabriele & Dahl, Merete (1991): Research methods in interlanguage pragmatics. In: Studies in Second Language Acquisition 13, 215-247. Kim, Miran (2011): The Phonetics of Stress Manifestation: Segmental Variation, Syllable Constituency and Rhythm. Ph. D. Diss. Stony Brook University. Kingston, John (2005): Ears to categories: New arguments for autonomy. In: Frota, Sónia; Vigário, Marina & Freitas, Maria Jo-o (eds.): Prosodics. With special reference to Iberian languages. Berlin: De Gruyter, 177-222. Koch, Peter & Oesterreicher, Wulf (1985): Sprache der Nähe - Sprache der Distanz: Mündlichkeit und Schriftlichkeit im Spannungsfeld von Sprachtheorie und Sprachgeschichte. In: Romanistisches Jahrbuch 36, 15-43. Koch, Peter & Oesterreicher, Wulf ( 2 2011): Gesprochene Sprache in der Romania. Französisch, Italienisch, Spanisch. Berlin: De Gruyter ( 1 1990). Kohler, Klaus & Niebuhr, Oliver (2007): The phonetics of emphasis. In: Proceedings of 16th International Congress of Phonetic Science, Saarbrücken, 2145-2148. Kohler, Klaus J. ( 2 1995): Einführung in die Phonetik des Deutschen. Berlin: Erich Schmidt ( 1 1977). Kornfilt, Jaklin (1997): Turkish. London: Routledge. Krämer, Martin (2009): The phonology of Italian. Oxford: Oxford University Press. 225 Krefeld, Thomas (1999): Wortgestalt und Vokalsystem in der Italoromania. Plädoyer für eine gestaltphonologische Rekonstruktion des romanischen Vokalismus. Kiel: Westensee. Krefeld, Thomas (2001): Phonologische Prozesse. In: Haspelmath, Martin; König, Ekkehard; Oesterreicher, Wulf & Raible, Wolfgang (eds.): Language Typology and Language Universals. Sprachtypologie und sprachliche Universalien. La typologie des langues et les universaux linguistiques. An International Handbook. Ein internationales Handbuch. Manuel international. Bd. 2. Berlin: De Gruyter, 1336-1347. Kubarth, Hugo (2009): Spanische Phonetik und Phonologie. Segmente - Silben - Satzmelodien. Frankfurt: Lang. Ladd, Dwight Robert ( 2 2008): Intonational phonology. Cambridge: Cambridge Univ. Press ( 1 1996). Ladefoged, Peter & Maddieson, Ian (1996): The sounds of the world’s languages. Oxford: Blackwell. Lahiri, Aditi (2012): Asymmetric phonological representations of words in the mental lexicon. In: Cohn, Abigail C.; Fougeron, Cécile & Huffman, Marie (eds.): The Oxford Handbook of Laboratory Phonology. Oxford: Oxford University Press, 134-162. Lauer, Norina & Birner-Janusch, Beate (2007): Sprechapraxie im Kindes- und Erwachsenenalter. Stuttgart: Thieme. Liberman, Alvin M.; Cooper, Franklin S.; Shankweiler, Donald & Studdert-Kennedy, Michael (1967): Perception of the speech code. In: Psychological Review 74, 431-461. Lieberman, Philipp & Blumstein, Sheila (1988): Speech physiology, speech perception, and acoustic phonetics. Cambridge: Cambridge University Press. Lloyd James, Arthur (1940): Speech signals in telephony. London: Pitman. Ludwig, Ralph (2001): Markiertheit. In: Haspelmath, Martin; König, Ekkehard; Oesterreicher, Wulf & Raible, Wolfgang (eds.): Language Typology and Language Universals. Berlin: De Gruyter, 400-419. Lutz, Luise ( 3 2004): Das Schweigen verstehen: Über Aphasie. Berlin: Springer. Maas, Utz ( 2 2006): Phonologie. Einführung in die funktionale Phonetik des Deutschen. Göttingen: Vandenhoeck & Ruprecht ( 1 1999). Mairano, Paolo & Romano, Antonio (2010): Un confronto tra diverse metriche ritmiche usando Correlatore. In: Schmid, Stephan; Schwarzenbach, Michael & Studer, Dieter (eds.): La dimensione temporale del parlato, Proceedings of the V National AISV Congress. Torriana: EDK, 79-100. Marotta, Giovanna (2012): Piedi metrici e sillabe orfane nella prosodia dell’italiano. In: Schafroth, Elmar & Selig, Maria (eds.): Testo e ritmi. Zum Rhythmus in der italienischen Sprache. Frankfurt: Lang, 89-103. Marslen-Wilson, William D. (1989): Access and Integration. Projecting sound onto meaning. In: Marslen-Wilson, William D. (ed.): Lexical representation and process. Cambridge, Mass.: MIT Press, 3-24. Martinet, André (1960): Éléments de linguistique générale. Paris: Colin ( 7 1980). Martínez Celdrán, Eugenio (1991): Sobre la naturaleza fonética de los alófonos de / b,d,/ en español y sus distintas denominaciones. In: Verba 18, 235-253. Martínez Celdrán, Eugenio ( 2 2003): El sonido en la comunicación humana. Barcelona: Octaedro ( 1 1996). Martínez Celdrán, Eugenio (2008): Some Chimeras of Traditional Spanish Phonetics. In: Colantoni, Laura & Steele, Jeffrey (eds.): Selected Proceedings of the 3 rd Conference on Laboratory Approaches to Spanish Phonology. Somerville, MA: Cascadilla Proceedings Project, 32-46. 226 Martínez Celdrán, Eugenio & Fernández Planas, Ana M. (2007): Manual de fonética española. Articulaciones y sonidos del español. Barcelona: Ariel. Martínez-Gil, Fernando & Colina, Sonia (eds.) (2006): Optimality-theoretic studies in Spanish phonology. Amsterdam: Benjamins. Mayer, Jörg (2010): Linguistische Phonetik. Universität Stuttgart. http: / / www.ims.unistuttgart.de/ ~jmayer/ resources/ Phonetik_201004.pdf Mayer, Jörg (2012): Phonetische Analysen mit Praat. Ein Handbuch für Ein- und Umsteiger. http: / / www.ims.uni-stuttgart.de/ ~jmayer/ resources/ praat_manual.pdf McCarthy, John J. (1988): Feature Geometry and Dependency: A Review. In: Phonetica 45, 85-108. McClelland, James L. & Elman, Jeffrey L. (1986): The TRACE model of speech perception. In: Cognitive Psychology 18, 1-86. McGurk, Harry & MacDonald, John (1976): Hearing lips and seeing voices. In: Nature 264, 746-748. McMahon, April (2004): Prosodic change and language contact. In: Bilingualism: Language and Cognition 7, 121-123. McMurray, Bob & Farris-Trimble, Ashley (2012): Emergent information level coupling between perception and production. In: Cohn, Abigail C.; Fougeron, Cécile & Huffman, Marie (eds.): The Oxford Handbook of Laboratory Phonology. Oxford: Oxford University Press, 369-395. McQueen, James M. (2007): Eight questions about spoken word recognition. In: Gaskell, M. Gareth (ed.): The Oxford Handbook of Psycholinguistics. Oxford: Oxford University Press, 37-53. Meisenburg, Trudel (1996): Das spanische Schriftsystem. In: Günther, Hartmut & Ludwig, Otto (eds.): Schrift und Schriftlichkeit. Writing and its Use. Ein interdisziplinäres Handbuch internationaler Forschung (HSK: Handbücher zur Sprach- und Kommunikationswissenschaft, Bd. 10,2). Berlin: De Gruyter, 1437-1441. Meisenburg, Trudel (2005): Zum Akzentwandel in den romanischen Sprachen. In: Stehl, Thomas (Ed.): Unsichtbare Hand und Sprecherwahl. Typologie und Prozesse des Sprachwandels in der Romania. Tübingen: Narr, 197-217. Meisenburg, Trudel & Selig, Maria (1998): Phonetik und Phonologie des Französischen. Stuttgart: Klett. Meisenburg, Trudel & Selig, Maria (2004): Nouveaux départs en phonologie. Introduction. In: Meisenburg, Trudel & Selig, Maria (eds.): Nouveaux départs en phonologie. Les conceptions subet suprasegmentales. Tübingen: Narr, 7-12. Menéndez Pidal, Ramón (1962): Manual de gramática histórica española. Madrid: Espasa. Mok, Peggy & Dellwo, Volker (2008): Comparing native and non-native speech rhythm using acoustic rhythmic measures: Cantonese, Beijing Mandarin and English. In: Proceedings of the 4th Speech Prosody (2008), Campinas, Brazil, 423-426. Navarro Tomás, Tomás ( 19 1977): Manual de pronunciación española. Madrid: C.S.I.C. ( 1 1918). Navarro Tomás, Tomás ( 4 1974): Manual de entonación española. Madrid: Guadarrama ( 1 1944). Neppert, Joachim & Pétursson, Magnús ( 3 2002): Elemente einer akustischen Phonetik. Hamburg: Buske ( 1 1992). Nespor, Marina (1993): Fonologia. Bologna: il Mulino. Nespor, Marina (1999): Stress domains. In: Hulst, Harry van der (ed.): Word Prosodic Systems in the Languages of Europe. Berlin: De Gruyter, 117-159. Nespor, Marina & Vogel, Irene ( 2 2007): Prosodic Phonology. Berlin: De Gruyter ( 1 1986). 227 NGRAE (2011) = Real Academia Española / Asociación de Academias de la Lengua Española: Nueva gramática de la lengua española: Fonética y fonología. Madrid: Espasa Libros. Nguyen, Noël (2012): Representation of speech sound patterns in the speaker’s brain: Insights from perception studies. In: Cohn, Abigail C.; Fougeron, Cécile & Huffman, Marie (eds.): The Oxford Handbook of Laboratory Phonology. Oxford: Oxford University Press, 359-368. O’Rourke, Erin (2004): Peak placement in two regional varieties of Peruvian Spanish intonation. In: Auger, Julie; Clements, J. Clancy & Vance, Barbara (eds.): Contemporary Approaches to Romance Linguistics. Amsterdam: John Benjamins, 321-341. O’Rourke, Erin (2008): Speech rhythm variation in dialects of Spanish: Applying the Pairwise Variability Index and Variation Coefficients to Peruvian Spanish. In: Proceedings of Speech Prosody 2008, Campinas, Brazil, 431-434. http: / / sprosig.isle.illinois.edu/ sp2008/ papers/ id173.pdf Ordóñez, Francisco (2000): The Clausal Structure of Spanish: A Comparative Study. New York: Garland. ORTE (2010) = Real Academia Española / Asociación de Academias de la Lengua Española: Ortografía de la lengua española. Madrid: Espasa Libros. Ortega-Llebaria, Marta & Prieto, Pilar (2009): Perception of word stress in Castilian Spanish. In: Vigário, Marina; Frota, Sónia & Freitas, M. Jo-o (eds.): Phonetics and phonology. Interactions and interrelations. Amsterdam: Benjamins, 35-50. Palmer, Harold E. (1922): English intonation with systematic exercises. Cambridge: Heffer. Penny, Ralph (2000): Variation and change in Spanish. Cambridge: Cambridge University Press. Peåková, Andrea; Feldhausen, Ingo & Gabriel, Christoph (2012a): Fraseo prosódico en el español porteño. Evidencia de datos leídos y semiespontáneos. In: di Tullio, Ángela & Kailuweit, Rolf (eds.): El español rioplatense. Frankfurt: Vervuert, 77-102. Peåková, Andrea; Feldhausen, Ingo; Kireva, Elena & Gabriel, Christoph (2012b): Diachronic prosody of a contact variety: Analyzing Porteño Spanish spontaneous speech. In: Braunmüller, Kurt & Gabriel, Christoph (eds.): Multilingual individuals and multilingual societies. Amsterdam: Benjamins, 365-389. Pierrehumbert, Janet B. (1980): The phonology and phonetics of English intonation. Ph. D. Diss. Cambridge, Mass.: MIT. Pierrehumbert, Janet B. (2012): The dynamic lexicon. In: Cohn, Abigail C.; Fougeron, Cécile & Huffman, Marie (eds.): The Oxford Handbook of Laboratory Phonology. Oxford: Oxford University Press, 173-183. Pike, Kenneth Lee (1945): The intonation of American English. Ann Arbor: University of Michigan Press. Pisoni, David B. & Levi, Susannah V. (2007): Representations and representational specificity in speech perception and spoken word recognition. In: Gaskell, M. Gareth (ed.): The Oxford Handbook of Psycholinguistics. Oxford: Oxford University Press, 3-18. Pompino-Marschall, Bernd ( 3 2009): Einführung in die Phonetik. Berlin: De Gruyter ( 1 1995). Prieto, Pilar (2001): Notes sobre l’entonació dialectal del català: les oracions interrogatives absolutes. In: Bover, August; Lloret, Maria-Rosa & Vidal-Tibbits, Mercè (eds.): Actes del Novè Col·loqui de la North American Catalan Society. Barcelona: Publicacions de l’Abadia de Montserrat, 347-377. Prieto, Pilar & Roseano, Paolo (eds.) (2010): Transcription of intonation of the Spanish language. München: Lincom. Prieto, Pilar; Shih, Chilin & Nibert, Holly (1996): Pitch Downtrend in Spanish. In: Journal of Phonetics, 24, 445-473. 228 Prince, Alan & Smolensky, Paul (2004): Optimality Theory. Constraint Interaction in Generative Grammar. Malden: Blackwell. Pulgram, Ernst (1970): Syllable, Word, Nexus, Cursus. The Hague: Mouton. Pulvermüller, Friedemann (2007): Brain processes of word recognition as revealed by neurophysiological imaging. In: Gaskell, M. Gareth (ed.): The Oxford Handbook of Psycholinguistics. Oxford: Oxford University Press, 119-139. Pulzován de Egger, Silvia (2002): Fremdsprache und Rhythmus: Eine Untersuchung zum Sprachrhythmus in Deutsch und Spanisch als Fremdsprache. Marburg: Tectum. Pustka, Elissa (2011): Einführung in die Phonetik und Phonologie des Französischen. Berlin: Erich Schmidt. Quilis, Antonio (1975): Las unidades de entonación. In: Revista Española de Lingüística 5, 261-279. Quilis, Antonio (1981): Fonética acústica de la lengua española. Madrid: Gredos. Quilis, Antonio (1992): Espa ñ ol. Fonética y fonemática. In: Holtus, Günter; Metzeltin, Michael & Schmitt, Christian (eds.): Lexikon der Romanistischen Linguistik VI,1: Aragonesisch/ Navarresisch, Spanisch, Asturianisch/ Leonesisch. Tübingen: Niemeyer, 55-62. Quilis, Antonio (1993): Tratado de fonología y fonética españolas. Madrid: Gredos ( 2 1999). Quilis, Antonio ( 6 2005): Principios de fonología y fonética españolas. Madrid: Arco/ Libros ( 1 1997). Quilis, Antonio & Fernández, Joseph A. (1996): Curso de fonética y fonología españolas. Décimoquinta edición. Madrid: Consejo Superior de Investigaciones Científicas. Ramus, Franck; Nespor, Marina & Mehler, Jacques (1999): Correlates of linguistic rhythm in the speech signal. In: Cognition 73, 265-292. Rao, Rajiv (2006): On intonation’s relationship with pragmatic meaning in Spanish. In: Face, Timothy L. & Klee, Carol A. (eds.): Selected Proceedings of the 8th Hispanic Linguistics Symposium. Somerville, MA: Cascadilla Proceedings Project, 103-115. Reetz, Henning (2003): Artikulatorische und akustische Phonetik. Trier: Wiss. Verl. Trier. Reetz, Henning & Jongman, Allard (2009): Phonetics: transcription, production, acoustics and perception. Malden, Mass.: Wiley-Blackwell. Roca, Iggy A. (1996): Secondary stress and metrical rhythm. In: Phonological Yearbook 3, 341-370. Roca, Iggy A. (1999): Stress in the Romance languages. In: Hulst, Harry van der (ed.): Word Prosodic Systems in the Languages of Europe. Berlin: De Gruyter, 659-811. Rosenbaum, Lawrence D. (2005): Primacy of multimodal speech perception. In: Pisoni, David B. & Remez, Robert E. (eds.): The Handbook of Speech Perception. Malden, Mass.: Blackwell, 79-98. Rothe, Wolfgang ( 2 1978): Phonologie des Französischen. Einführung in die Synchronie und Diachronie des französischen Phonemsystems. Berlin: Erich Schmidt ( 1 1972). Samuel, Arthur G. (1981): Phonemic restauration: Insights from a new methodology. In: Journal of Experimental Psychology: General 110, 474-494. Saussure, Ferdinand de (1916): Cours de linguistique générale. Publié par Charles Bally et Albert Sechehaye. Édition critique préparée par Tullio de Mauro. Paris: Payot, 1982. Schafroth, Elmar & Selig, Maria (2012): Einleitung. In: Schafroth, Elmar & Selig, Maria (eds.): Testo e ritmi. Zum Rhythmus in der italienischen Sprache (Studia romanica et linguistica 35). Frankfurt: Lang, 7-25. Schpak-Dolt, Nikolaus ( 2 2012): Einführung in die Morphologie des Spanischen. Berlin: De Gruyter ( 1 1999). Schwegler, Armin; Kempff, Juergen & Ameal-Guerra, Ana ( 4 2010): Fonética y fonología españolas. Hoboken, NJ: Wiley ( 1 1982). 229 Selkirk, Elisabeth O. (1984): Phonology and syntax: The relation between sound and structure. Cambridge, Mass.: MIT Press. Sievers, Eduard ( 5 1901): Grundzüge der Phonetik zur Einführung in das Studium der Lautlehre der indogermanischen Sprachen. Leipzig: Breitkopf & Härtel ( 1 1876). [Reprint Hildesheim: Olms 1976]. Silverman, Kim; Beckman, Mary; Pitrelli, John; Ostendorf, Mari; Wightman, Colin; Price, Patti; Pierrehumbert, Janet & Hirschberg, Julia (1992): TOBI: A Standard for Labeling English Prosody. In: Proceedings from the Second International Conference on Spoken Language Processing (ICSLP 92). Banff, Alberta (Canada), 867-870. Sosa, Juan Manuel (1991): Fonética y fonología de la entonación del español hispanoamericano. Ph. D. Diss. Amherst: University of Massachusetts. Sosa, Juan Manuel (1999): La entonación del español: Su estructura fónica, variabilidad y dialectología. Madrid: Cátedra. Sosa, Juan Manuel (2003): La notación tonal del español en el modelo SP-ToBI. In: Prieto, Pilar (ed.): Teorías de la entonación. Barcelona: Ariel, 185-208. Steele, Joshua (1775): An essay towards establishing the melody and measure of speech. London: Bowyer & Nichols. [Nachdruck Menston: The Scholar Press, 1969]. Toledo, Guillermo (2010): Métricas rítmicas en tres dialectos Amper-España. In: Estudios filológicos 45, 93-110. Trubetzkoy, Nikolaus S. ( 7 1989): Grundzüge der Phonologie. Göttingen: Vandenhoeck & Ruprecht ( 1 1939). Truckenbrodt, Hubert (2007): The syntax-phonology interface. In: De Lacy, Paul (ed.): The Cambridge Handbook of Phonology. Cambridge: Cambridge University Press, 435-456. Vennemann, Theo (1986): Neuere Entwicklungen in der Phonologie. Berlin: De Gruyter. Visch, Ellis (1999): The rhythmic organization of compound and phrases. In: Hulst, Harry van der (ed.): Word Prosodic Systems in the Languages of Europe. Berlin: De Gruyter, 161-231. Vitale, María A. & Vázquez Villanueva, Graciana (2004): Políticas estatales sobre la lengua: La legislación argentina sobre radiodifusión (1934-1999). In: Castronuovo, Estela (ed.): Nuestra lengua, un patrimonio. Buenos Aires: Comisión para la Preservación del Patrimonio Histórico Cultural, 134-138. Wells, John C. (2006): English intonation: An introduction. Cambridge: Cambridge University Press. White, Laurence & Mattys, Sven L. (2007): Calibrating rhythm: First language and second language studies. In: Journal of Phonetics 35, 501-522. Whitley, Stanley M. (2003): Rhotic representation: problems and proposals. In: Journal of the International Phonetic Association 33: 1, 81-88. Wiese, Richard (2011): Phonetik und Phonologie. Paderborn: Fink. Yip, Moira (2002): Tone. Cambridge: Cambridge University Press. Zec, Draga (2007): The syllable. In: De Lacy, Paul (ed.): The Cambridge Handbook of Phonology. Cambridge: Cambridge University Press, 161-194. Zubizarreta, María Luisa (1998): Prosody, Focus, and Word Order. Cambridge, Mass.: MIT Press. Zwicker, Eberhard (1982): Psychoakustik. Berlin: Springer. Register accent clash 164 accidental gap 93 Affrikate, 26f., 56, 63, 66f., 98, 102, 108, 115, 139-141 aguda (palabara) 154, 161 Akustik 48 akustische Phonetik 28ff. Akut 83, 147, 152, 161, 166 Akzent(uierung) 7, 123-127, 147ff. Akzentdomäne 151-153, 190 Akzentmuster154, 156f., 159f. Akzentposition 101, 128, 148ff. Akzentrealisierung 149 Akzentstruktur 127, 167 Akzentton s. Tonhöhenakzent Akzentverschiebung 127, 147, 162, 164 akzentzählend 172, 174 Alignierung 190 Alignmentconstraint 117 Allophon, allophonisch 57-59, 79, 94- 96, 100, 102, 104, 106-109, 140, 196 alveolar 24f., 33, 37, 56f., 63f., 68-75, 91f., 98, 102-105, 109, 138f., 141 Alveolen 24f., 27, 57, 63, 72f., 75 Amplitude 30, 33, 35, 37, 149 andalusisches Spanisch 13f., 65, 69f., 142 Andenspanisch 101 Anfangsrand s. Onset Angleichung s. Assimilation Anlaut s. Silbenanlaut, Wortanlaut Ansatzrohr 23-26, 29, 32f., 77, 97f., 111, 113, 150 Antepänultima 154-157, 161, 164 Apex 24, 27, 57f., 68, 72f., 75, 98, 113 apikal 20 24, 63 Approximant 25, 27, 30, 37, 56-59, 64, 66, 70-77, 81-83, 85, 91, 96-98, 100, 106-109, 115, 132, 135, 137, 140, 146f., 155, 161, 170, 179 Archiphonem 94, 100, 102-104, 142, 188 argentinisches Spanisch 12-14, 38, 66, 74, 105, 108f., 119f., 130, 140, 142, 166, 176-178, 194, 201-203, 205, 208f., 214f. Artikulationsart 21-27, 57, 66, 76, 91f., 97, 98, 105 Artikulationsgenauigkeit 124, 150 Artikulationmodus s. Artikulationsart Artikulationsort 37, 72, 103, 111, 142 Artikulator 23-26, 99, 113 aspiración 11-14, 95, 119f. Aspiration 23, 60-62, 64f., 142 Assimilation 28, 63, 68f., 96, 104, 111, 117, 126, 141 Atmung 21-23 Auslaut s. Silbenauslaut, Wortauslaut Auslautverhärtung 7, 110f. Aussagesatz s. Deklarativsatz Autosegment 115 autosegmental 113-118, 123, 125, 128f., 162, 191 Autosegmental-Metrisches (AM-)Modell 180, 187, 189ff. Aymara 13, 16, 101 bedeutungsdifferenzierend 5, 90f., 93 Beschränkung s. constraint bilabial 56, 58, 68f., 92, 111f. binäre Opposition 92, 97 binärer Fuß 126 binäres Merkmal 97, 99, 113 boundary tone s. Grenzton Breitbandsonagramm s. Breitbandspektrogramm Breitbandspektrogramm 35-38, 40 ceceo 64, 105 chilenisches Spanisch 14, 65 Coda 7, 60, 63-65, 68-76, 85, 94f., 100- 104, 117-119, 131-137, 141-144, 150, 156 constraint 35, 89, 93, 94, 97, 116, 117- 119, 134, 137, 145, 162, 212, 213 continuation rise 208, 214 Correlatore 43, 175f., 178 creaky voice 182 CV-Silbe 136f., 141, 144, 169, 174 Dauer 26, 30, 39f., 49, 53, 62, 124, 126, 146, 149f., 170-175 232 Deaffrizierung 67 Deakzentuierung 162, 209-211, 214 Deklarativsatz 17, 171, 173, 184-186, 188, 196, 200, 202f., 205, 209f., 212 Deklination s. downtrend delimitative Funktion 144, 151 dental 24f., 56-58, 63f., 68f., 70f., 98, 102, 104f., 111, 138f., 141-143 Dentes 24f. Desonorisierung 7, 60-63, 65, 110f., 127, 183 Dezibel 30, 47, 49 Diphthong 26, 74, 76f., 81-85, 106-108, 115, 133, 135, 137, 140, 143, 146, 155f., 160f. Diskursintonation 213 distanzsprachlich 11f., 123, 167 distinktive Funktion 151, 154, 188 distinktive Merkmale 5, 8f., 43, 53, 90- 94, 97, 99, 102f., 125 Distribution 57, 59, 66, 93-96, 100, 103f., 109, 134, 141, 173, 214 dorsal 24, 47, 51, 57, 96, 98, 113 Dorsum 24, 28, 57, 66, 68, 71, 98f., 109, 113 downstep 183f. downtrend 183f., 202, 204, 208, 214 Drei-Silben-Fenster 154f., 158 EasyAlign 43, 175, 178 Ebenenmodell (Intonation) 187, 190f. elbow 193f., 202 Elision s. Tilgung Emphase, emphatisch 60, 66, 72, 79, 96, 103, 128, 166, 187, 191, 215 Endrand s. Coda Entphonologisierung 100, 104-106 Entstimmung s. Desonorisierung Ergänzungsfrage s. Wh-Frage esdrújula (palabara) 147, 154, 156, 161, 167 Eurhythmie, eurhythmisch 128, 151, 162, 164 Exemplartheorie 10, 89, 119f. expressive Funktion 4f., 53 extrametrisch 155, 164 Extremadura 63, 74, 105 F 0 30, 36-38, 40f., 53f., 114f., 149f., 165, 171, 180-189, 191, 193, 197, 202, 210-212, 214 F 0 -Gipfel 165, 181, 183f., 187, 190, 193f., 196, 200-204 F 0 -Maximum s. F 0 -Gipfel F 0 -Plateau 193f., 202, 204, 208f. fakultative Variation s. freie Variation Fast Fourier Transformation 35 feature spreading 114, 116 final lowering 184, 214 Flüstern 23 Fokus 152f., 185, 196, 199f., 202, 206f., 209-212, 214 Fokus-Hintergrund-Gliederung 206f., 209f. Fokusprominenzregel 209 Formant 33, 36f., 40f., 50-52, 58f., 75- 77, 80f. Formanttransitionen 37, 50 Fourier-Analyse 30, 32, 35, 46 Fragesatz s. Interrogativsatz Französisch 3, 69, 71, 79, 96, 101, 104, 112, 126, 133, 147, 149, 151, 167, 169, 172f., 207 freie Variation 95, 102f., 196, 208, 213f. Frequenz 29f., 32, 35-40, 45-49, 54, 67, 80f. Frikativ 13, 26f., 31-34, 37, 54, 56f., 58- 60, 63-67, 69-77, 79, 91, 95f., 102, 104-106, 108-110, 119, 135, 139-144 Frikativapproximant 57-60, 66, 76, 96, 102, 111f., 140-142 Friktionsrauschen 31f., 37, 58, 61, 67 Funktionale Magnetresonanztomographie 47 funktionale Phonetik 89 Fuß 125f., 128f., 148, 151, 162-165, 190 Gaumen, harter s. Palatum Gaumen, weicher s. Velum Gaumensegel s. Velum Geminierung 74 generative Phonologie 9f., 89, 103, 109- 113, 119, 124f. generative Sprachtheorie 9f., 128, 206, 211 Geräusch 17, 23, 26f., 30f., 33, 48, 57, 60, 66, 73, 76 gerillt 63, 74, 98 gerundet 26, 78f., 98, 113 Gewichtssensitivität 161f. 233 Gleitlaut s. Approximant glottal 22, 24, 31, 56, 64f., 98, 119 Glottis 22-24, 26, 32, 61f., 98 Glottisschlag 14, 23, 80, 82, 144f. Glottisverschluss s. Glottisschlag Graphem 6, 57f., 66f., 71, 80, 161 Grenzton 189-192, 195-200, 202, 204, 208f., 211, 214f. Grundfrequenz s. F 0 Halbkonsonant s. Approximant Halbvokal s. Approximant Harmonische s. Obertöne harter Gaumen s. Palatum Hauchlaut 13, 23 Hauptakzent 148, 164-166 heterosyllabisch 72f., 82, 140 Hiat(us) 78, 81-84, 106-108, 130, 135, 137, 143, 145-147, 170f. homorgan 57, 62, 68, 112 Hören 1, 7f., 18, 42-45, 47-55, 62 Hörnerv 45-47 Implikationshierarchie 136 indexikalische Funktion 4f., 52 Informationsfokus 206, 209 Informationsstruktur 9, 124, 127, 148, 150, 180, 183, 189, 205-207, 209f. Input (Optimalitätstheorie) 116-118, 212 Intensität 30, 67, 75, 124, 126, 149f. interdental 25, 58, 60, 63, 68, 70 Intermediärphrase 128f., 148, 190, 192, 194-196, 207 International Phonetic Alphabet s. IPA Interpolation 191, 209 Intervall (Sprachrhythmus) 171-180, 208 Intonation 3f., 7f., 19, 38, 42, 54, 119, 124f., 128, 180-215 Intonationsphrase 104, 128f., 148f., 166, 167, 185, 190, 192, 194, 196f., 207, 211 Intonationssprache 180f., 183 IPA 3, 19f., 41f., 57f., 72-74, 76, 143, 148, 217f. Isochroniehypothese 169f. Italienisch 71, 79, 101, 112, 119f., 149, 169f., 172, 176-178, 181, 192, 194, 201f., 208f. Ja/ Nein-Frage 183, 188, 198, 200, 204 Jambus 126, 162 kanarisches Spanisch 13, 63, 65, 67, 69, 74, 105, 115f. karibisches Spanisch 14, 65, 69f., 74, 104, 140, 142 kastilisches Spanisch 11-13, 63f., 66, 68, 82, 104f., 108, 176-178, 187, 194f., 197f., 200, 202-205, 208-210, 214f. Katalanisch 13, 79, 82, 110, 141, 169, 172, 198, 208 kategoriales Hören 47, 50, 56, 90 Kehlkopf s. Larynx Klang 17, 22, 25, 30, 32f., 77, 80-82, 90 Klitische Gruppe 125, 127, 129, 152, 165f., 190 Knacklaut s. Glottisschlag Knarrstimme s. creaky voice Koartikulation 21, 27f., 35, 53, 56, 78, 95f., 112 Kohortenmodell 54 Kommutation 91 kompensatorische Längung 115f. Kompetenz 9, 109, 119, 124 Konfigurationsanalyse 185, 187 Konfigurationsmodell s. Konfigurationsanalyse Kontrast 3, 5f., 13, 60, 64, 73f., 93f., 97, 101f., 105, 110, 112, 114, 130, 134, 136, 139, 142, 146, 181, 183 Kontrastfokus s. Fokus Korona 24, 57, 75, 99 koronal 24, 57, 68, 98, 105, 111-113, 118 Korrelation 93, 97, 102, 170, 174 kubanisches Spanisch 67 kulminative Funktion 151f. Labia 7, 17, 23-26, 32, 57, 61f., 78, 98f., 113 labial 25, 37, 50, 57, 98, 102-105, 113, 138f., 141, 143 Laboratory Phonology 10 Lambdazismus 70, 74 Lamina 24, 63, 98, 113 laminal 24, 63 langue 1f., 9, 90, 109, 119 Längung 74, 115f., 146, 149f., 165, 167, 170, 172, 177, 181, 208 laryngal 21, 24, 97, 98, 113, 116 Larynx 17, 21-25 234 lateinamerikanisches Spanisch 11-14, 63-66, 71, 82, 104f., 140, 158, 185 Lateinisch 65, 68, 80, 124f., 133, 140, 154-157, 160 Lateral 27f., 56-59, 66-72, 74, 76, 91- 93, 96, 98, 102-106, 108f., 112, 141- 143 Lautklasse 7, 56, 76, 90, 99, 131, 134f. Lautstärke 3-5, 18, 40f., 47, 49, 149 Linksdislokation 206f. Linksversetzung s. Linksdislokation Lippen s. Labia Lippenstellung 78 Liquid 27, 33, 57f., 63, 72, 74f., 91, 93f., 96f., 99, 134f., 139, 142f. llana (palabara) 154, 161 lleísmo 71, 105f. Logatom 93, 156 Madrider Spanisch s. kastilisches Spanisch Markiertheit 99f., 102f., 106, 117, 137, 142, 144, 156f., 161, 187, 211 Markiertheitsconstraint 117f. Merkmale 5, 7-9, 11-14, 19, 37, 43, 53, 55, 64, 68, 82, 90-94, 96-99, 102- 105, 110-118, 123, 125, 171, 176, 178 Merkmalsausbreitung s. feature spreading Merkmalsgeometrie 89, 111, 113f., 123 Merkmalsinventar 97-99 Merkmalsmatrix 99, 101 Messphonetik 19 Metrische Phonologie 133, 147, 151, 155, 162-164 Metrum 123, 167 mexikanisches Spanisch 13f., 65-67, 73, 109, 120, 139, 144, 158, 180, 195, 203, 205 Minimalpaar 3, 5, 91-94, 104f., 107, 109f., 142 Monophthong 78, 82 morenzählend 169 Nachfeld 126, 132 nähesprachlich 11-13, 108, 124 Nahuatl 13f., 16, 139, 144 nasal 23-25, 98, 104 Nasal(konsonant) 27, 30, 33, 56-59, 62, 66-72, 90, 94, 96, 98f., 102-104, 108, 111f., 114, 118, 135, 138f., 142f. Nasalassimilation 103, 111f., 114, 116, 118f., 130 nasalisiert 24, 26, 52, 69, 104 Nasalvokal 26, 69, 104 Nebenakzent 147f., 162, 164-166, 188 neutraler Fokus s. Informationsfokus Neutralisierung 60, 68f., 74, 94, 100, 102f., 110, 142 Normalisierung 51 Nuklearakzent 149, 185, 190, 196-198, 200, 202-204, 209, 211f. Nuklearkonfiguration 186, 198, 200- 204, 209f. Nukleus 53, 76f., 81, 106, 126, 131-135, 137, 143f., 146f., 149-151, 155-157, 185-187 Null-Subjekt-Sprache 207 Oberklassenmerkmale 97, 99, 113 Obertöne 30, 32, 36-38 Obstruent 27, 68, 72, 76, 97-99, 110f., 135, 139 Onset 7, 14, 57f., 63-72, 76f., 83, 93f., 101-103, 108f., 117, 131-141, 144f., 168, 170, 172 Opposition 9, 13, 64, 90-94, 97, 99-109, 142 Optimalitätstheorie 9, 89, 116, 136, 145, 212 Optionalität 213 Oralvokal 26, 99 Orthographie 58, 60, 73, 110, 147, 152, 161 Ortsmerkmale 97-99, 103, 111, 113f., 118 ostandalusisches Spanisch 79f., 101, 104 Oszillogramm 29, 31f., 35f., 38-41, 61f., 75, 179f. Output (Optimalitätstheorie) 116-118 overlapping constraints-Modell 212f. oxyton 130, 154, 156, 161, 188 paarweiser Variabilitätsindex 173 palatal 24f., 56, 65-71, 73, 75f., 78, 90, 95, 102f., 105, 108f., 138, 140-142 Palatal(konsonant) 157 palatalisiert 66-68, 70 Palatum 24f., 27, 66, 68, 71, 95, 98, 109 Pänultima 154-157, 161, 164, 170 parasprachliche Funktion 183 parole 1f., 90, 106 235 paroxyton 130, 154, 161 Partialtöne 30 Perzeption 43, 48, 53-55, 130f., 148f., 151 pharyngal 23f., 99, 113 Pharynx 23, 26 Phon 18, 28, 90 Phonation 21-23, 25, 32, 77 Phonem 5-8, 11, 13, 43f., 52-57, 63-66, 72, 74, 78f., 89-97, 99-108, 110, 120, 131, 141f., 144, 150f., 179, 187, 196 Phonemsystem 90, 92, 97, 100, 102, 103, 105, 109 phonologische Phrase 196, 126-129, 140, 145, 148, 151, 162, 194 phonologische Regel 9, 97, 107-109, 147, 156f., 162 phonologischer Prozess 89, 109, 117f., 126, 135, 194 phonologisches Wort 126-129, 162, 165f., 190, 194 Phonologisierung 100, 104, 189 Phonotaktik 93, 97, 121, 131 Phrasenton 197 Phrasierungsmuster 209 pitch accent s. Tonhöhenakzent pitch range s. Tonhöhenumfang pitch s. Tonhöhe Plosiv 26f., 32, 37, 50, 53, 54, 56-62, 64-67, 69, 71, 75, 85-87, 93, 96, 98, 101-104, 108-112, 134f., 139-144, 179 Porteño- Spanisch s. Argentinisches Spanisch Praat 29, 38-43, 86, 175, 178f. Pränuklearakzent 190, 196, 200-202, 215 privativ 92, 99 proparoxyton 130, 154 prosodische Eigenschaften 19, 124f., 168, 176, 180 prosodische Einheit 124-130, 147f., 184- 186, 190, 207 prosodische Grenze 184, 190, 194, 199, 208 prosodische Hierarchie 124, 128-130, 148, 151, 163, 191, 197, 207 prosodische Phrasierung 127, 180, 184, 187, 205, 207, 209, 213 Prototyp 119f., 169 Prozessphonologie 89 Psychoakustik 48 Quechua 13f., 16, 101, 177 Rachenhöhle s. Pharynx Rachenraum s. Pharynx regulative Funktion 4f., 183f. Reim 7, 132f., 136, 138, 143, 155 Resonanzfrequenz 32, 36, 80 Resyllabierung 77, 103, 106, 117, 127, 130, 137, 144f. Rhotazismus 70, 74 rhythmische Funktion 148, 151 Rhythmus 7f., 51, 123f., 167f., 173, 176f., 208, 216 r-Laut s. Vibrant SAMPA 20 Sandhi, interner, externer 126-128, 130 Satzakzent 185, 190f., 196 Satzfokus 149, 206 Schall 4f., 28f., 32, 45f., 48f., 51, 53, 67, 89 Schlusskontur 182, 185-188, 197, 200, 202, 204 Schmalbandsonagramm s. Schmalbandspektrogramm Schmalbandspektrogramm 35-37, 40 Schwa 74, 77, 79, 169f. Segment 5-7, 18, 28, 37, 42, 53, 57, 90, 107, 109f., 113-115, 117, 123-127, 130-132, 134-137, 139f., 144, 150, 168, 171, 178f. Segmentierung 35, 43, 171, 175, 178f. eísmo 3, 12, 13, 66, 105, 108 Semispontansprache 124, 177, 198f. seseo 11, 13, 63f., 105 Sibilant 73f., 98, 105 Silbe 3, 7, 14, 19, 26, 41f., 53, 60, 64- 72, 76f., 79, 81f., 93, 94, 100-104, 107, 111, 115, 117, 121, 124-126, 128-145, 148-151, 154-172, 178, 181-190, 193-197, 200f., 208, 212, 215 Silbenanfangsrand s. Onset Silbenanlaut s. Onset Silbenauslaut s. Coda Silbencoda s. Coda Silbenendrand s. Coda 236 Silbengewicht 126, 133, 151, 155f., 160, 164 Silbengrenze 41f., 82, 107f., 110, 117, 127, 130-132, 135-137, 144-146, 170f. Silbenkern s. Nukleus Silbenkontakt 106, 130, 135f., 144, 146 Silbenkontraktion 145f. Silbenkopf s. Onsest Silbenrand s. Onset, Coda Silbenstruktur 93, 100, 117, 121, 130- 137, 141, 144f., 155, 169f., 172, 178 Silbenstrukturpräferenzen 130, 134, 136 Silbentyp 132, 136, 138, 173, 178 silbenzählend 150, 168-170, 172-174, 176f. Skelettschicht s. Zeitschicht Sonagramm 29, 35, 37, 38, 40f., 49f., 59, 61f., 67, 75, 82, 86f., 150, 179f. Sonorant 27, 36, 68, 76, 134, 143f. Sonorisierung 63 Sonoritätsgipfel s. Sonoritätsmaximum Sonoritätshierarchie 134f., 139f. Sonoritätskontrast 136, 140, 143 Sonoritätsmaximum 77, 81, 130, 134, 140, 147, 150 Sonoritätsminimum 130, 136 Speech Assessment Methods Phonetic Alphabet s. SAMPA Spektrogramm s. Sonagramm Spirantisierung 57, 111f. Spracherwerb 100, 123, 131, 136 Sprachkontakt 14, 101, 201 Sprachrhythmus s. Rhythmus Sprechgeschwindigkeit 3, 28, 52, 128, 170, 173 stimmhaft 7, 27, 37, 57, 61, 62, 64-68, 93, 96, 108, 110, 125, 142 Stimmlippen 22f., 25, 27, 29f., 32, 36, 60-62, 68, 92, 98f. stimmlos 23, 27, 57, 64, 92, 96, 108, 110f., 142 Stimmritze s. Glottis Stimmtonkorrelation 102 Stimmtonopposition 102f. Strict Layer Hypothesis 129, 197 Strukturalismus 8f., 89, 100, 109, 124, 184, 189, 205f. subglottal 21-24, 183 subsegmental 7, 114, 123 supraglottal 23f., 99 suprasegmental, 7f., 19, 114, 123, 125, 187 sustained pitch 208, 214 Syllabierung 107, 127, 136f., 139, 144f., 215 Symbolphonetik 19 Synalöphe 146 Synärese 146 Syntax-Prosodie-Schnittstelle 127, 189, 205, 209, 211 Tap 72-75, 91f., 94, 102f., 112, 142 tautosyllabisch 72, 81f. tilde 83, 147 Tilgung 14, 59f., 63-65, 69f., 72, 74f., 101f., 104, 107, 142, 147, 169 ToBI 189, 192-194 token 119 Ton 29f., 49, 115, 126, 128-130, 181- 183, 188-197, 200, 202f. Tonem 186 Tonhöhe 4, 38, 47, 124, 183f., 190 Tonhöhenakzent 181, 189-192, 194, 196f., 199f., 202f., 208f., 211, 214, 216 Tonhöhenumfang 183, 194 Toninventar s. Tonsystem Tonschicht 115, 128f., 190., 197, 208 Tonsilbe 165, 167f., 177, 181, 185, 188, 190f., 193f., 196, 202 Tonsprache 114, 115, 124, 180f., 183 Tonsystem 180, 197, 208, 215 Transfer 176f., 216 Transkription 3, 19f., 41, 58, 61, 63, 68, 77, 79, 85, 103, 107, 178, 190 Trill 72-75, 91f., 94, 102f., 142 Triphthong 78, 81f., 85, 106, 133, 137 tritonal 194, 202, 215 Trochäus 126, 162f. typologisch 100, 137, 169, 215 Ultima 154, 156f., 161, 164 upstep 184, 193 US-amerikanisches Spanisch 14, 108 Uvula 24, 27, 74 uvular 24, 56, 65, 74, 91, 95 Variabilitätskoeffizient 173 Varianz 51f. 237 Varietät 10-15, 57, 63-66, 69-71, 74, 79, 101, 103-105, 115, 117, 119, 124, 135, 140, 142, 166, 168, 174, 176- 178, 181, 183f., 189, 192, 194, 196f., 199, 201, 203-205, 208f., 212, 216 velar 25, 56, 69, 95, 102, 104f., 138f., 141, 143 Velarisierung 69f., 103, 142 Velum 24-26, 68, 69, 85, 98 vesre 130, 156 Vibrant 27, 72-76, 79, 85, 91f., 98, 102- 104, 142f. voice bar 36, 59, 62 voice onset time, 61f. Vokalisierung 74f. Vokallängung 53 Vokalreduktion 169f. Vokalsystem 79, 100f., 104 Vorfeld 132 VOT s. voice onset time weicher Gaumen s. Velum Wh-Frage 182, 187, 200f., 203f. Wortakzent 7, 82f., 101, 107f., 124f., 127, 128, 130, 133, 146-149, 152- 156, 158, 161-164, 166, 181, 190 Wortanlaut 102f., 108, 138-140, 144 Wortauslaut 65, 103, 116, 118, 142 Worterkennungsmodelle 55 Wortsilbe s. Silbe Wortstellung 123, 177, 189, 211, 216 yeísmo 66, 71, 105f., 109, 121 Zahndamm s. Alveolen Zähne s. Dentes Zäpfchen s. Uvula eísmo 3, 66, 105, 108 Zeitschicht 115f. Zirkumflexkontur 203-205 Zunge 17, 24f., 27, 32, 36, 57, 63f., 72, 73f., 78f., 86, 98 Zungenblatt s. Lamina Zungenkranz s. Korona Zungenrücken s. Dorsum Zungenspitze s. Apex Dieses Buch gibt Studierenden des Spanischen ein zugängliches und zugleich wissenschaftlich fundiertes Grundlagenwerk zur Lautlehre ihres Studienfachs an die Hand. Es verknüpft bewährtes Basiswissen mit neueren theoretischen Ansätzen (u.a. Merkmalsgeometrie, Optimalitätstheorie, Autosegmental-Metrisches Modell) und führt in den Umgang mit der Sprachanalysesoftware Praat ein. Ein besonderer Schwerpunkt liegt dabei auf prosodischen Phänomenen wie Silbe, Akzent, Rhythmus und Intonation. Spanisch wird hier nicht als homogene Sprache aufgefasst; amerikanische und europäische Varietäten erfahren vielmehr eine gleichberechtigte Darstellung. Ein vertiefter Einblick in die lautliche Struktur wird u.a. durch die Gegenüberstellung mit weiteren romanischen und nicht romanischen Sprachen sowie durch die Kontrastierung mit dem Deutschen ermöglicht.