eBooks

Genitiv im Korpus

2016
978-3-8233-9024-4
Gunter Narr Verlag 
Marek Konopka
Eric Fuß

Die Beschreibung und Modellierung grammatischer Variation, d.h. von Instanzen, in denen eine Funktion oder Bedeutung durch mehrere, miteinander konkurrierende Formtypen ausgedrückt werden kann, stellt eine Herausforderung sowohl für Grammatikografie als auch Grammatiktheorie dar. Die vorliegende Doppelstudie zur starken Genitivflexion und ihrem Wegfall entwickelt neue korpusorientierte Zugänge zu dieser Problematik. Quantitative und inferenzstatistische Methoden ermöglichen nicht nur eine detaillierte und empirisch fundierte Beschreibung der Distribution der einschlägigen Markierungsvarianten (-s, -es, -ens, -Ø, Apostroph). Sie sind auch das geeignete Rüstzeug, die Hypothesen der bisherigen Forschung zu evaluieren und die sehr zahlreichen sprachlichen und außersprachlichen Einflussfaktoren präzise zu hierarchisieren, um einem konsistenten Gesamtmodell der Variation in diesem Teilbereich der Grammatik näher zu kommen.

Marek Konopka / Eric Fuß Genitiv im Korpus Untersuchungen zur starken Flexion des Nomens im Deutschen STUDIEN ZUR DEUTSCHEN SPRACHE FORSCHUNGEN DES INSTITUTS FÜR DEUTSCHE SPRACHE STUDIEN ZUR DEUTSCHEN SPRACHE 70 006016 SDS 70 - Konopka_Fuß.qxp_006016 SDS 70 - Konopka_Fuß Titelei 01.02.16 10: 38 Seite 1 Herausgegeben von Arnulf Deppermann, Stefan Engelberg und Angelika Wöllstein Band 70 STUDIEN ZUR DEUTSCHEN SPRACHE FORSCHUNGEN DES INSTITUTS FÜR DEUTSCHE SPRACHE 006016 SDS 70 - Konopka_Fuß.qxp_006016 SDS 70 - Konopka_Fuß Titelei 01.02.16 10: 38 Seite 2 Marek Konopka / Eric Fuß Genitiv im Korpus Untersuchungen zur starken Flexion des Nomens im Deutschen 006016 SDS 70 - Konopka_Fuß.qxp_006016 SDS 70 - Konopka_Fuß Titelei 01.02.16 10: 38 Seite 3 Redaktion: Melanie Steinle Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http: / / dnb.dnb.de abrufbar. © 2016 · Narr Francke Attempto Verlag GmbH + Co. KG Dischingerweg 5 · D-72070 Tübingen Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Gedruckt auf säurefreiem und alterungsbeständigem Werkdruckpapier. Internet: www.narr.de E-Mail: info@narr.de Satz und Layout: Sonja Tröster Druck und Bindung: Laupp & Göbel, Gomaringen Printed in Germany ISSN 0949-409X ISBN 978-3-8233-8024-5 006016 SDS 70 - Konopka_Fuß.qxp_006016 SDS 70 - Konopka_Fuß Titelei 01.02.16 10: 38 Seite 4 INHALT Vorwort ......................................................................................................... 9 1. Einführung .................................................................................... 13 1.1 Untersuchungsrahmen................................................................. 13 1.2 Das Phänomen............................................................................... 14 1.3 Variationsfaktoren in der Forschung.......................................... 18 1.4 Methodik ........................................................................................ 25 1.4.1 Datenextraktion ................................................................... 25 1.4.2 Die Genitivdatenbank ......................................................... 27 1.4.3 Sonderwortschatzbereiche .................................................. 30 1.4.4 Häufigkeitsklassen, CELEX-Angaben und extralinguistische Informationen ........................................ 34 1.4.5 Recherche- und Analysemethoden, methodisch relevante Datenbereiche ...................................................... 35 1.5 Verteilung und Klassifizierung der Varianten und Aufbau der Studie ......................................................................... 38 2. Endungsvariation (von Marek Konopka) ................................. 41 2.1 Stand der Forschung zur Endungsvariation ............................. 41 2.2 Resultierende Forschungsfragen ................................................ 53 2.3 Datenüberblick, Konzeption der Variationsfaktoren und Vorgehensweise .................................................................... 55 2.4 Starke Faktoren und „invariante“ Nomina ............................... 61 2.4.1 Lexikalische Faktoren .......................................................... 61 2.4.2 Lautliche, prosodische und morphologische Faktoren .............................................................................. 64 2.4.3 Frequenz als starker Faktor ................................................. 68 2.4.4 Wirkung starker Faktoren im Vergleich .............................. 71 Inhalt 6 2.5 Schwache Faktoren und „frei“ variierende Nomina................ 76 2.5.1 Faktorenübersicht und Datenbasis ...................................... 77 2.5.2 Wirkung schwacher Faktoren im Vergleich ........................ 80 2.5.3 Abgrenzung zu starken Faktoren und adäquate Darstellung des Faktorenspektrums ................................... 83 2.5.4 Analyse von Faktorenkombinationen und Interaktionen (binäre logistische Regressionen) ........................................ 91 2.5.5 Vokallänge ........................................................................ 102 2.5.6 Vokalhöhe ......................................................................... 113 2.5.7 Sonoritätshierarchie und Kodakomplexität ...................... 116 2.5.8 Frequenz als schwacher Faktor ......................................... 129 2.6 Zusammenfassung und abschließende Bemerkungen.......... 132 3. Endungslose Genitive (von Eric Fuß) ..................................... 141 3.1 Stand der Forschung zu endungslosen Genitiven ................. 144 3.1.1 Standardsprachlich anerkannter Wegfall der Genitivendung ............................................................ 145 3.1.2 Nicht standardsprachlich anerkannter Wegfall der Genitivendung ............................................................ 154 3.1.3 Endungslose Realisierung des Genitivs: Faktoren ............ 158 3.1.4 Zur normativen Einordnung der Nullrealisierung ........... 162 3.2 Anmerkungen zur Datengrundlage und Methodik .............. 167 3.2.1 Die Erfassung endungsloser Formen: generelle Probleme ............................................................ 169 3.2.2 Befunde der Baummodellierung ....................................... 172 3.3 Normgerechte Formen der Endungslosigkeit ........................ 177 3.3.1 Invariante Fälle: obligatorische Endungslosigkeit ............ 183 3.3.1.1 Obligatorische Endungslosigkeit bei Personennamen und Fremdwörtern ............................................................ 184 3.3.1.2 Obligatorische Endungslosigkeit bei Abkürzungen und Konversionen ............................................................. 192 3.3.1.3 Kontextuell bedingte obligatorische Endungslosigkeit: Monoflexion ....................................................... 200 3.3.1.4 Fazit: Invariante Fälle ........................................................ 205 Inhalt 7 3.3.2 Variante Fälle ..................................................................... 206 3.3.2.1 Eigennamen ....................................................................... 207 3.3.2.2 Eigennamenähnliche Ausdrücke ....................................... 208 3.3.2.3 Fremdwörter ..................................................................... 218 3.3.2.4 Zeitausdrücke .................................................................... 219 3.3.2.5 Konversion ........................................................................ 220 3.3.2.6 Interaktion von Faktoren ................................................... 224 3.3.2.7 Fazit: Variante Fälle ........................................................... 230 3.4 Nicht-normgerechte Formen der Endungslosigkeit .............. 234 3.4.1 Starke Maskulina auf -en ................................................... 234 3.4.2 Neutra auf -en .................................................................... 236 3.4.3 Diminutive ........................................................................ 238 3.4.4 Verwandtschaftsbezeichnungen ........................................ 238 3.4.5 Fazit ................................................................................... 239 3.5 Zusammenfassung und abschließende Bemerkungen.......... 240 4. Gesamtbild .................................................................................. 245 4.1 Methodische Aspekte ................................................................. 245 4.2 Linguistische Generalisierungen .............................................. 250 5. Literatur........................................................................................ 265 6. Anhang ......................................................................................... 271 VORWORT Im Rahmen des Projekts „Korpusgrammatik“ wird am Institut für Deutsche Sprache (IDS) in Mannheim die Erstellung einer neuen, korpuslinguistisch fundierten Grammatik des Standarddeutschen angestrebt. Das Projekt befindet sich am Ende der Pilotphase (zu Präliminarien vgl. Bubenhofer/ Konopka/ Schneider 2014). Ein wichtiges Ziel dieser Phase ist es, anhand von detaillierten Untersuchungen beispielhafter Variationsphänomene aus verschiedenen Grammatikbereichen korpuslinguistische Fragestellungen und Herangehensweisen modellhaft herauszuarbeiten sowie einen zu diesen passenden Methodensatz zu entwickeln. Damit soll eine Art „Grundausrüstung“ entstehen, mit der sich mit guten Aussichten auf innovative Grammatikografie und linguistischen Fortschritt strukturiert in die Unternehmung der eigentlichen „Korpusgrammatik“ einsteigen lässt. Als sprachlicher Gegenstand der Pilotuntersuchungen zur Flexionsmorphologie 1 wurde die Variation der starken Markierung des Nomens im Genitiv Singular ausgewählt. In der ersten Untersuchungsphase wurde eine streng daten- und weniger hypothesengeleitete Herangehensweise getestet. Das Ergebnis war ein mit einem maschinellen Lernverfahren gewonnenes probabilistisches Modell der Markierungsvariation, das in Bubenhofer/ Hansen-Morath/ Konopka (2014) vorgestellt und interpretiert wurde. Dem vorliegenden Buch lag die zweite Untersuchungsphase zugrunde, in der die Hypothesen aus der bisherigen Forschung, die die Wirkung der Einflussfaktoren der Variation betreffen, stärker in den Mittelpunkt rückten. Ziel war es zum einen, diese Hypothesen zu prüfen, weitere Hypothesen zu generieren und somit unser Wissen über die Variation der Genitivmarkierung voranzubringen. Auf dem Weg dahin ging es zum anderen aber auch darum, verschiedene korpuslinguistische und statistische Methoden zum Testen flexionsmorphologischer Hypothesen auszuprobieren und in diesem Bereich geeignete Standards für die Unternehmung „Korpusgrammatik“ zu entwickeln. Insgesamt hoffen wir, eine Arbeit 1 Im Bereich Wortbildung wurden bereits beispielhafte Untersuchungen zur Variation der Fugenelemente durchgeführt (Donalies 2011; Bubenhofer/ Brinkmann/ Hein 2014). Im Bereich Syntax wurden u.a. die Variation der Relativsatzeinleitung und die Satzkomplementation untersucht (erste Ergebnisse in Brandt/ Fuß 2014 und Wöllstein 2015). Vorwort 10 vorzulegen, die Grammatiker und Korpuslinguisten zur Anschlussforschung anregt, die u.U. mit einer ähnlichen Methodik durchgeführt werden kann. Das vorliegende Buch geht nach einer Einführung (Kap. 1) in eine Doppelstudie (Kap. 2 und Kap. 3) über und folgt damit der Spezifik des sprachlichen Phänomens, das sich in einer Konkurrenz zwischen verschiedenen Markierungen (z.B. [des] Sackes vs. [des] Sacks) einerseits und dem Ausbleiben einer Markierung (z.B. [des] Irak vs. [des] Iraks) andererseits manifestiert. Die beiden Aspekte machen oft jeweils spezifische Untersuchungsmethoden erforderlich - nicht zuletzt, weil in einem Fall formal Greifbares zu finden und auszuwerten ist, im anderen Fall hingegen es zunächst jene Stellen zu finden gilt, wo das formal Greifbare ausbleibt. Dieser Zweiteilung folgend wurde die Thematik auf zwei Autoren verteilt. Neben der praktischen Konsequenz, dass jetzt die Aufgabe des Einzelforschers überschaubarer wurde, versprachen wir uns davon eine Stärkung der Innovation. Der explorativen Anlage der Pilotuntersuchungen entsprechend waren die beiden Autoren mit weit gehenden Freiheiten ausgestattet, was die Konzeption und Durchführung der Analysen und den Aufbau der Darstellung angeht. So sind methodische Unterschiede zwischen den Teilstudien auch in der individuellen Experimentierfreude der Autoren und deren unterschiedlichem Herangehen an das Ausloten korpusbasierter Möglichkeiten begründet. Vor allem aber sind sie der jeweils spezifischen Fragestellung geschuldet. Ein Beispiel dafür sind die Unterteilungen der Nomina in verschiedene Gruppen, die sich nach der jeweils zu untersuchenden Variation richten: In Kapitel 2 ist u.a. die Gruppe der sog. varianten Nomina zentral, in der prinzipiell eine Variation zwischen Genitivendungen möglich sein soll - ob bei bestimmten Nomina zusätzlich die Möglichkeit besteht, die Markierung des Genitivs gänzlich zu unterlassen, ist dabei unerheblich. In Kapitel 3 hingegen wird als Vergleichsgruppe zu den (potenziell) endungslosen Nomina die Gruppe der sog. regulären Appellativa angesetzt, in der extrem wenige endungslose Genitive zu erwarten sind - irrelevant ist dabei, ob die Nomina jeweils mit verschiedenen Endungen auftreten können oder nicht. Die beiden Gruppen überlappen sich weitgehend, sind aber nicht identisch. Die Gruppe der varianten Nomina ist auch etwas umfangreicher. Insbesondere der Ausschluss von Eigennamen geht hier nicht so weit wie bei den regu- Vorwort 11 lären Appellativa. Auch eigennamenähnliche Nomina wie Monatsnamen (vgl. [des] April/ Aprils/ ? Apriles) oder Stil- und Epochenbezeichnungen ([des] Barock/ Barocks/ Barockes) bleiben bei den varianten Nomina inbegriffen. Trotz der geschilderten phänomenologischen und methodischen Unterschiede, die zur Zweiteilung der Thematik führten, gibt es Übergreifendes zwischen den beiden Variationsarten, das viel weiter geht, als dass sie in Einzelfällen doch bei ein und demselben Nomen auftreten können wie im Falle von Barock. Die Endungsvariation und die Endungslosigkeit fügen sich unseres Erachtens zu einem kohärenten Bild zusammen, das von Tendenzen durchzogen wird, die auch die Wortschatzentwicklung im Allgemeinen zu strukturieren scheinen. Dieses Bild wird in Kapitel 4 gezeichnet, das von beiden Autoren gemeinsam verfasst wurde. Außer beide Studien verbindenden Generalisierungen für die linguistischen Ergebnisse enthält das Kapitel eine kritische Betrachtung der verwendeten korpuslinguistischen und statistischen Methoden aus der Perspektive ihrer Eignung für die nächsten Phasen der Unternehmung „Korpusgrammatik“. Die verwendete Methodik bedarf noch einiger Hinweise. Die wichtigsten Methoden werden in Kapitel 1.4 und 2.4.4 bzw. 3.2 geschildert. Neben diesen Methoden waren manchmal semiautomatische Workarounds und manuelle Datenkorrekturen notwendig. Sobald sie die Geringfügigkeitsgrenze überschritten und substanziell bzw. quantitativ ins Gewicht fallen, wurden sie angemerkt und - bei entsprechendem Ausmaß - als Methoden des Umgangs mit heterogenen bzw. fehlerhaft annotierten Daten thematisiert. Exemplarisch lässt sich diese Vorgehensweise an einschlägigen Strategien zur Verbesserung und Anreicherung der Datenbasis im Bereich der endungslosen Genitive illustrieren, die im Vergleich zu den overt markierten Formen eine größere Fehleranfälligkeit zeigten. So haben wir festgestellt, dass in einer Reihe von Fällen Formen (fälschlich) als nullmarkierte Genitive eingestuft werden, obwohl die im Korpus attestierte Form nicht mit dem zugrundeliegenden (automatisch zugeordneten) Lemma identisch ist. Um diese Fehlerquelle auszuschließen, haben wir bei der Untersuchung endungsloser Genitive nur solche Belege berücksichtigt, bei denen Lemma und Genitivform identisch sind, was als eine nicht gänzlich „kostenfreie“ Strategie in Kapitel 3.2 problematisiert wird. Vorwort 12 Neben Maßnahmen zur Verbesserung der Qualität der Datenbasis haben wir bei der Erkennung und Auswertung endungsloser Formen auch alternative Methoden der Datengewinnung eingesetzt. So wurden Recallschwächen der automatischen Extraktion bestimmter eigennamenähnlicher Ausdrücke wie Wochentagen und Monatsnamen durch ergänzende manuelle Recherchen im Deutschen Referenzkorpus DeReKo (mittels des webbasierten Korpusrecherche- und -analysesystems COSMAS II 2 ) ausgeglichen. Darüber hinaus haben wir mehrfach auf das Mittel manuell nachkorrigierter Stichproben zurückgegriffen, um den Einfluss von Faktoren zu untersuchen, die auf der Basis der zur Verfügung stehenden automatischen Annotation nicht erfassbar waren (wie die Zugehörigkeit zu unterschiedlichen Klassen von Nomina, z.B. Personenname vs. geografischer Name). Beides haben wir an entsprechenden Stellen dokumentiert. Wir möchten an dieser Stelle die Gelegenheit nutzen, um Noah Bubenhofer, Sandra Hansen-Morath, Sascha Wolfer, Hans-Christian Schmitz, Patrick Brandt, Anna Volodina, Angelika Wöllstein und Anja Konopka zu danken, ohne deren Rat und bisweilen tatkräftige Unterstützung die Genitive nicht ohne Weiteres dem Korpus zu entlocken gewesen wären. Peter Gallmann und Bernd Wiese lasen die Vorabversion des Manuskripts und steuerten dankenswerterweise zahlreiche hilfreiche Kommentare bei. Saskia Schmadel und Nagehan Cetin sind wir sehr verbunden für ihre unermüdliche Unterstützung bei Recherchen und Formatierungsarbeiten. Schließlich möchten wir uns bei Melanie Steinle, Sonja Tröster und Norbert Volz von der Publikationsstelle des IDS für fachkundiges Lektorat und Satzarbeiten bedanken. Die Autoren 2 Vgl. www.ids-mannheim.de/ cosmas2/ . 1. EINFÜHRUNG 1.1 Untersuchungsrahmen Die Variation der starken Markierung des Nomens im Genitiv Singular ist zwar in ihrem formalen Kern gut greifbar, wird aber heterogen behandelt. Die bisherige Forschung liefert uns meist Reihen von wenig gewichteten Parametern, die die Wahl der Genitivmarkierung oder auch deren Unterlassung steuern sollen. Da die Wirksamkeit dieser mutmaßlichen Faktoren oft unsicher erscheint und sie alle zusammen betrachtet bisher nur sehr schwer als ein konsistentes System denkbar sind, stellt sich am Anfang dieser korpusbezogenen Studie die allgemeine Frage: Welche Forschungshypothesen hinsichtlich der Faktoren lassen sich korpuslinguistisch stützen bzw. widerlegen? Ihre plausible Beantwortung setzt eine Auseinandersetzung mit folgenden Fragen voraus: - Wirkungsfrage: Welche der vermeintlichen Faktoren sind nachweisbar wirksam? - Hierarchisierungsfrage: Wie sind diese Faktoren untereinander zu gewichten? - Systemfrage: Wie kann die Fülle der Faktoren als ein konsistentes System modelliert werden? Die vorliegende Doppelstudie konzentriert sich auf das geschriebene Standardbzw. standardnahe Deutsch und basiert auf Recherchen und Analysen im Deutschen Referenzkorpus (DeReKo), 3 das in der hier benutzten Version (Institut für Deutsche Sprache 2011a) gemäß Machinese Phrase Tagger von Connexor 4 ca. 4,3 Milliarden Token 5 und 250 Millionen Sätze umfasst. 3 Zur texttypologischen Einschätzung von DeReKo-Inhalten siehe Bubenhofer/ Konopka/ Schneider (2013, S. 57ff.). 4 Eines der Tagging-Werkzeuge, mit denen DeReKo morphosyntaktisch annotiert ist (vgl. www.ids-mannheim.de/ kl/ projekte/ korpora/ annotationen.html und www. connexor.com, Stand: Januar 2015). 5 Connexor-Token sind sowohl Wörter als auch Satzzeichen. Einführung 14 1.2 Das Phänomen Die starke Markierung des Nomens im Genitiv Singular tritt im Gegenwartsdeutschen vor allem bei sog. starken Maskulina und Neutra (z.B. Vaters, Hauses 6 ) sowie bei Eigennamen (z.B. Iraks [Präsident], [des heiligen] Georgs) auf. Sie erscheint darüber hinaus bei Nomina, bei denen Mischungen aus schwacher und starker Flexion vorliegen (z.B. Gedankens, Herzens), und wird am Rande in einem normativ kritisch gesehenen Gebrauch bei Nomina beobachtet, die ansonsten der schwachen Deklination zugerechnet werden (z.B. Bärs, Bärens). Sie zeigt auch spezifisch schriftliche Ausprägungen wie in Ergebnisses, Brahms’ [Deutsches Requiem] oder Reni’s [Frischmarkt]. In der geschriebenen Sprache gibt es somit sieben Möglichkeiten, den Genitiv Singular unter Verwendung der starken Markierung zu kennzeichnen. Diese Reihe ist durch die Variante zu ergänzen, in der die Genitivmarkierung des Nomens gänzlich unterbleibt wie in [des kleinen] Peter, [des alten] Rom, [des] Barock oder - nicht normgerecht - [des] Garten, vgl.: - Haus -es - Vater -s - Gedanke -ns - Herz -ens - Ergebnis -ses - Reni -’s - Brahms -’ - [des] Barock -Ø 7 Die Markierungen -ens und -ns können als Zusammensetzungen aus einer „Nicht-Nominativ-Endung“ -en/ -n 8 und einer Genitivendung -s analysiert werden. Hier sollen sie aber als Einheiten betrachtet werden, denn bei der geplanten automatischen Suche nach einschlägigen Nomina im Genitiv Singular werden die Genitivkandidaten mit den Lemmata verglichen, die die Nominativform haben. Die Nomina im Genitiv Singular treten in Phrasen auf, die als Ganzes genitivisch markiert sind. In der Duden-Grammatik (2009, S. 968) wird 6 Die in diesem Kapitel als Beispiele herangezogenen Genitivformen sind alle, wenn nicht anders vermerkt, im DeReKo belegt. 7 Zu einer Möglichkeit, die Varianten zu gruppieren, vgl. Kapitel 1.5. 8 Vgl. Duden (2009, S. 194, 216ff.). Das Phänomen 15 von einer Sichtbarkeitsbedingung gesprochen, die verlangt, dass der Genitiv an mindestens einer deutlichen Markierung irgendwo in der Genitivphrase erkennbar ist. Dieser Bedingung genügt außer einer Markierung am Nomen auch schon eine klare Kennzeichnung eines anderen Bestandteils der Phrase. Um die Notwendigkeit der starken Markierung des Nomens kann es also unterschiedlich bestellt sein, und zwar je nach Größe und Zusammensetzung der Genitivphrase. Der basale 9 Aufbau der Genitivphrase sei durch die folgende „Schablone“ und deren Realisierungsformen illustriert: [Artikel +] [[... +] attributives Adjektiv +] Genitivnomen, z.B.: 1) Genitivnomen: Iraks; Reni's; Brahms' 2) attributives Adjektiv + Genitivnomen: letzten Jahres; erhobenen Hauptes 3) Artikel + Genitivnomen: eines Jahres; des Irak(s); dieses Kapitalismus 4) Artikel + attributives Adjektiv + Genitivnomen: des letzten Jahres; des heutigen Irak(s); jenes neuen Europa(s) 5) Artikel + ... + attributives Adjektiv + Genitivnomen: des am Wochenende beerdigten Kapitäns; des kriegsbedingt zerstörten Iraks In den beiden ersten Fällen ist die starke Markierung des Nomens notwendig. Typ 1 kommt bei Eigennamen vor, 10 die in Typ 2 gerade ausgeschlossen sind. Zu beachten ist, dass die unterspezifizierte Endung -en beim Adjektiv alleine nicht ausreicht, um den Genitiv sichtbar zu machen. In Genitivphrasen vom Typ 3-5, in denen vor allem Appellativa, aber auch maskuline und neutrale Eigennamen auftreten, erscheint der Artikel. Dieser kann den Genitiv oft deutlich genug signalisieren, um die Unterlassung der Genitivmarkierung des Nomens 9 „Basal“, weil zu den hier dargestellten Genitivphrasen noch nachgestellte Attribute (Genitivphrasen, Präpositionalphrasen, Infinitivkonstruktionen etc.) treten können, die das Bild komplexer machen. 10 Dies trifft am Rande auch auf Nomina zu, die wie Eigennamen gebraucht werden, ansonsten aber regulär appellativisch verwendet werden können, wie Gott und einige Verwandtschaftsbezeichnungen, z.B. [das Lob] Gottes, [nach] Vaters [Tod]. Nach Präpositionen können auch alleinstehende Appellativa mit starker Genitivmarkierung auftreten, z.B. [wegen] Todesfalls. Nicht allein stehen können hingegen die Genitivnomina bei Eigennamen mit festem Artikelgebrauch wie bei bestimmten geografischen Namen, z.B. des Schwarzwalds oder des Neckars (vgl. Duden 2009, S. 206ff.). Einführung 16 prinzipiell zu ermöglichen. Einige Artikelformen auf -es, nämlich des, 11 eines, keines und die Possessiva meines, deines etc., zeigen den Genitiv eindeutig an und können folglich in Genitivphrasen vom Typ 3-5 ohne Weiteres mit einem Nomen ohne Genitivmarkierung auftreten. Die restlichen Artikelformen auf -es wie dieses, jenes, solches, welches, alles, jedes treten dagegen nicht nur im Genitiv, sondern auch im Nominativ und Akkusativ Neutrum auf. Bei Neutra können sie den Genitiv phrasenintern also nur in Verbindung mit dem Adjektiv sichtbar machen - das heißt, dass sie nur in Phrasen vom Typ 4-5 das Genitivnomen ohne Markierung lizenzieren können (z.B. [das Bild] jenes neuen Europa). 12 Bei Maskulina sind sie zusätzlich in Genitivphrasen vom Typ 3 eindeutig (z.B. [das Kennzeichen] dieses Kapitalismus). 13 Mit vielen Artikelformen auf -es können in Phrasen mit markierten Genitivnomina Formen auf -en konkurrieren (z.B. dieses/ diesen Jahres; [Fahrzeuge] jenes/ jenen Typs). Solche Formen rücken in die Nähe der Adjektive und sind wie diese ungeeignet dafür, den Genitiv in einer Phrase mit einem nicht markierten Nomen sichtbar zu machen. Entsprechend konstruierte Wortgruppen gleichen Akkusativphrasen oder werden als ungrammatisch interpretiert, z.B. diesen Kapitalismus bzw. *jenen alten Europa. 14 Auch in Phrasen mit nicht deklinierbaren Artikelbildungen wie beiderlei, mancherlei wird der Genitiv nur dann sichtbar, wenn das Nomen eine Genitivmarkierung trägt (z.B. beiderlei Geschlechts). Ergänzt werden muss hier schließlich noch, dass das attributive Adjektiv auf -en, das auch die Form eines Partizips haben kann (vgl. oben beerdigten im Beispiel vom Typ 5), direkt vor dem Genitivnomen stehen muss und in dieser Position mit nicht deklinierbaren Adjektiven wie Herkunftsableitungen auf -er (z.B. des Berliner Mülls) oder Farbadjektiven (z.B. des lila Knoblauchs) variiert. 11 Auch in Kombinationen wie desjenigen und desselben. 12 Dennoch finden sich diese Artikelformen im DeReKo gelegentlich auch in Genitivphrasen vom Typ 3 mit einem nicht markierten Genitivnomen (z.B. in Der Einfluss dieses Blau auf die Kunst oder Die Bürger dieses Europa). Die Phrasen sind dann mittels des Kontexts als genitivisch identifizierbar. 13 Sie sind abgesehen von Nomina auf -ismus trotzdem sehr selten, vgl. [Die Wetterkapriolen] dieses November. 14 Dennoch finden sich im DeReKo höchst sporadisch Phrasen wie [seit Anfang] diesen Juli, denen nur aufgrund des Kontexts der Genitiv zugewiesen werden kann. Der Zusammenhang zwischen der Artikelform und der Genitivmarkierung des Nomens kann hier nicht weiter erörtert werden. Er bietet sich an als ein interessantes Objekt für die empirische Anschlussforschung. Das Phänomen 17 Betrachtet man die Genitivmarkierung wie bisher einschließlich ihrer spezifisch schriftlichen Ausprägungen, so ist die Variation zwischen den Nomina mit verschiedenen Genitivmarkierungen in allen Phrasentypen zu beobachten, wogegen die Variation zwischen Nomina mit und ohne Markierung nur in den Genitivphrasen vom Typ 3-5 stattfindet. Allerdings sorgt in Brahms’ [Requiem] die Apostrophmarkierung -’ nur für die schriftliche Sichtbarkeit des Genitivs. Bei einer phonetisch orientierten Betrachtung kann hier eine endungslose Form angesetzt werden. Entsprechend ist die Variation zwischen endungshaltigen und endungslosen Nomina nicht auf Genitivphrasen vom Typ 3-5 beschränkt, sondern auf die Einwortphrasen vom Typ 1 ausgeweitet. 15 Die Rahmenbedingungen für die Markierungsvariation können nicht nur durch die Struktur der Genitivphrase, sondern auch durch deren syntaktische Einbettung vorgegeben werden. Je nach Einbettung können Genitivphrasen klassifiziert werden als: - adnominal (Merkels Mann; Fahrzeuge jenes Typs) - präpositional regiert (wegen des Umbaus) - adjektivisch regiert (des Fahrens überdrüssig) - verbal regiert (keines Artenschutzes bedürfen) - adverbial (Sie kann erhobenen Hauptes nach Hause fahren.) Präpositional regiert etwa können Appellativa im Genitiv auch alleinstehend auftreten (z.B. [wegen] Umbaus), was bei anderer Einbettung Eigennamen vorbehalten bleibt. Alleinstehende Eigennamen im Genitiv sind dagegen gerade nach Präpositionen seltener. 16 Im Weiteren ist z.B. in adverbialen Genitivphrasen (die meist feste Wendungen sind und häufig keinen Artikel enthalten) die Unterlassung der Markierung des Nomens ungrammatisch (vgl. eines Tages, guten Willens, erhobenen Hauptes). Besonders irritierend für Sprachbenutzer kann die Tatsache sein, dass sich formal ähnliche Lexeme und sogar Realisierungen desselben Le- 15 Es stellt sich die Frage, ob in der gesprochenen Sprache die „Sichtbarkeits“-Bedingung des Genitivs bei alleinstehenden endungslosen Genitivnomina verletzt ist. Als solche Genitivnomina erscheinen Eigennamen auf Sibilant (vgl. Brahms' [Requiem]; Schulz' [ früherer Promoter]). In der Duden-Grammatik wird in solchen Fällen eine Verschmelzung der Genitivendung mit dem Auslaut des Eigennamens angenommen (Duden 2009, S. 209), und man könnte vielleicht argumentieren, dass die Funktion, den Genitiv zu signalisieren, auf den s-Laut der Verschmelzung übergeht. 16 Vgl. Duden (2009, S. 211, 972). Einführung 18 xems hinsichtlich der Genitivmarkierung unterschiedlich verhalten können, und zwar selbst unter gleichen Distributions- und Einbettungsbedingungen, vgl.: (1) a. den Inhalt des Sackes (Braunschweiger Zeitung, 15.8.2006; Polizei findet Spritzen) b. den Inhalt des Sacks (Rhein-Zeitung, 19.10.1998; LAND UND LEUTE ) (2) a. der Rest des Wrackes (Berliner Zeitung, 10.08.2001; In kleinen Schritten zur Wahrheit) b. ein Stück des Wracks (St. Galler Tagblatt, 2.7.2009, S. 8) c. die Entdeckung des Wrack (Lamoricière (Schiff), In: Wikipedia: http: / / de.wikipedia.org/ wiki/ Lamoricière_(Schiff): Wikipedia, 2011) (3) a. der Ex-Diktator des Irakes, Saddam Hussein (Diskussion: Albtraum, In: Wikipedia: http: / / de.wikipedia.org/ wiki/ Diskussion: Albtraum: Wikipedia, 2011) b. Tariq Aziz, ehemaliger Vize-Premierminister des Iraks (Assyrer (Gegenwart), In: Wikipedia: http: / / de.wikipedia.org/ wiki/ Assyrer_(Gegenwart): Wikipedia, 2011) c. Der Übergangsaußenminister des Irak, Hoschijar Sebari, [...] (Berliner Zeitung, 10.11.2003; Irak ist erneut Kriegszone [S. 8]) Formal ähnliche Lexeme können dabei Präferenzen für unterschiedliche Varianten zeigen: So sind die Genitivvarianten unter (1) ähnlich frequent, unter (2) ist die Variante b) vorherrschend und die beiden anderen randständig und unter (3) halten sich b) und c) die Waage, während a) höchst sporadisch erscheint. Jedoch sind alle drei Lexeme offensichtlich nicht auf eine Markierungsart fixiert. Die Markierungswahl scheint bis zu einem gewissen Grad frei zu sein - auf jeden Fall erschließen sich die beobachteten Präferenzen vielen Sprachbenutzern nicht auf Anhieb. 1.3 Variationsfaktoren in der Forschung Im vorliegenden Kapitel wird nur ein Überblick über die in der Forschung postulierten Variationsfaktoren gegeben 17 (dabei rücken die Variablen Struktur und Einbettung der Genitivphrase etwas in den Hintergrund, weil sie in Kapitel 1.2 bereits als Rahmenbedingungen für die Markierungsvariation behandelt wurden). Detailliertere Besprechungen relevanter Teile der sehr umfangreichen Literatur zur Va- 17 Vgl. auch Bubenhofer/ Hansen-Morath/ Konopka (2014, S. 381ff.). Variationsfaktoren in der Forschung 19 riation der starken Genitivmarkierung stehen jeweils am Anfang der beiden Teilstudien in Kapitel 2 bzw. 3. Allgemeinere Forschungsbeiträge, die sich nicht direkt mit der Genitivmarkierung befassen, und dennoch für die Markierungsvariation wichtige Zusammenhänge thematisieren, werden erst an entsprechenden Stellen in den Hauptteilen der beiden Kapitel herangezogen. Die wesentlichen der postulierten Variationsfaktoren sind in Tabelle 1 enthalten. Über viele besteht in der Fachliteratur Konsens (vgl. dritte und vierte Spalte der Tabelle), allerdings werden sie teilweise unterschiedlich benannt. In der Tabelle sind neutrale Benennungen der Faktoren intendiert. Deren Anordnung ist weitgehend unabhängig von den Quellen und strebt lediglich Übersichtlichkeit an. Mit der postulierten Wirkung (dritte Spalte) ist fast immer nur eine mehr oder weniger deutliche Tendenz zu einer bestimmten Markierungsart gemeint und nicht eine ausnahmslose Beschränkung auf diese. Eine solche Tendenz kann sich auch nur durch ein leichtes Ansteigen der Wahrscheinlichkeit einer bestimmten Markierungsart beim Vorliegen einer bestimmten Faktorausprägung artikulieren. 18 Die postulierte Wirkung wird nur dann angegeben, wenn sie sich ohne zusätzliche Erklärungen sinnvoll darstellen lässt. In den anderen Fällen erscheinen die Hinweise „kontrovers“ oder „komplex“. Der letztere Hinweis wird verwendet, wenn sich die Wirkung eines Faktors erst aus der Kombination mit einem anderen Faktor bzw. anderen Faktoren ergeben soll. Für die Tabelle wurden exemplarisch folgende umfangreiche Darstellungen der Markierungsvariation als Quellen herangezogen: Appel (1941) (A), Duden (2009) (D), Duden (2007) (ZD), Fehringer (2011) (F), Pfeffer/ Morrison (1979, 1984) (P/ M), Szczepaniak (2010) (S). Die Quellen thematisieren nicht immer alle Ausprägungen eines Faktors bzw. alle Realisierungen einer Ausprägung. 18 Z.B.: Bei standardmäßig auf -s festgelegten Nomina die auf -en enden, soll gegenüber anderen Nomina des Grundwortschatzes die Wahrscheinlichkeit für eine Nullmarkierung wie in des Rahmen ansteigen - möglicherweise durch eine Verwechslung mit der schwachen Flexion (vgl. Duden 2009, S. 203). Einführung 20 Variationsfaktoren in der Forschung 21 Einführung 22 Variationsfaktoren in der Forschung 23 Tab. 1: Faktoren der Genitivmarkierungsvariation in der Fachliteratur Einführung 24 In Tabelle 1 erscheinen rhythmische Parameter nur indirekt. Stilistische Faktoren fehlen dort gänzlich. Die beiden Faktorengruppen werden in den herangezogenen Quellen zwar erwähnt, aber kaum präzisiert, 19 geschweige denn umfassend dargestellt. In Tabelle 1 ist auch ohne diese beiden Gruppen die hohe Anzahl der Faktoren auffällig. Viele Faktoren sind dabei allgemein anerkannt, jedoch fallen die Schwerpunkte ihrer Darstellung in den verschiedenen Quellen sehr unterschiedlich aus. Ganzheitliche Beschreibungen der Markierungsvariation sind in Referenzwerken wie der Duden-Grammatik (D) und dem Zweifelsfälle-Duden (ZD) enthalten. In der Duden-Grammatik (2009, S. 195ff.) werden besonders stark lautliche Faktoren und die Zugehörigkeit des Nomens zum nativen bzw. fremden Wortschatz gewichtet. So werden lautliche Faktoren für die Endungen teilweise getrennt für Nomina des Grundwortschatzes und für Fremdwörter spezifiziert. Bei der Beschreibung der Tendenzen zur Weglassung der Endung werden im Weiteren besondere Ausdrucksklassen relevant wie Eigennamen, Nomina auf -en, Paarformeln, mehrteilige feste Verbindungen oder Farbbezeichnungen (vgl. Faktoren 20-28 in Tab. 1). Im Zweifelsfälle-Duden (2007, S. 369ff.) wird betont, dass die Variation zwischen -s und -es nur teilweise geregelt ist. Die diesbezügliche Darstellung wird nach festem und schwankendem Gebrauch der Endungen strukturiert. Diejenigen Probleme, die mit dem Ausbleiben der Endung verbunden sind, werden im Kontext spezifischer Nomenklassen behandelt wie Personennamen, geografische Namen, Monatsnamen, Fachwörter oder Fremdwörter. Bereits in diesen beiden Quellen werden die Variation verschiedener Genitivendungen einerseits und die Variation zwischen Genitivmarkierung und ihrer Unterlassung andererseits weitgehend getrennt behandelt, und so widmet sich die restliche Fachliteratur in der Regel entweder dem einen oder dem anderen Fragenkomplex. Auch in der vorliegenden Doppelstudie wird diese Aufteilung der Thematik eingehalten. Kapitel 2 und Kapitel 3 beginnen daher jeweils mit einer spezialisierten Literaturübersicht. 19 Vgl. z.B. Duden (2007, S. 371) und Pfeffer/ Morison (1979, S. 311). Methodik 25 1.4 Methodik 1.4.1 Datenextraktion Die wichtigste Datengrundlage für die Analysen der folgenden Kapitel bildete eine Datenbank, in der Satzbelege mit Genitivnomina (Maskulina, Neutra, Eigennamen) im Singular und dazugehörige Metainformationen enthalten sind (im Weiteren „Genitivdatenbank“). 20 Ergänzend wurden Recherchen im Deutschen Referenzkorpus (DeReKo) mithilfe des Korpusrecherche- und -analysesystems COSMAS II durchgeführt. Die Belege der Genitivdatenbank wurden maschinell aus dem DeReKo-Release von 2011 (Institut für Deutsche Sprache 2011a) extrahiert. Das Korpus war mit dem TreeTagger (Schmid 1994), dem Machinese Tree Tagger der Firma Connexor 21 und der Xerox FST Linguistic Suite 22 annotiert 23 und umfasste rund 4,3 Mrd. Connexor-Token. 24 Die Annotationen lieferten allerdings keine bzw. keine eindeutigen Kasus- Informationen, sodass für die Extraktion ein umfangreiches Perl-Skript entworfen wurde, in dem neben den Tagger-Informationen formale und distributionelle Eigenschaften der Genitivnomina abgefragt wurden, wie sie in Kapitel 1.2 beschrieben wurden. Für das Vorliegen von einzelnen Genitiv-indizierenden Eigenschaften wurden den Kandidaten für Genitivnomina automatisch Punkte auf der Skala von 1 bis 11 zugewiesen. So deutete eine höhere Punktzahl, die ein Kandidat erreichte, auf eine größere Wahrscheinlichkeit hin, dass es sich dabei tatsächlich um ein Genitivnomen handelte. Um die Extraktion zu optimieren, bedurfte es mehrerer Durchgänge, die jeweils mithilfe eines Goldstandards evaluiert wurden, der sich aus 1000 zufällig gezogenen und manuell annotierten Sätzen aus dem DeReKo-Teilkorpus „mk2“ 25 zusammensetzte. Manuelle Überprüfungen führten zu der Entscheidung, alle Kandidaten mit der Punktzahl Prob (intern für probability) > 1 bereits als Genitivnomina anzusehen. Auf diese über 7 Mio. Token umfassende Gruppe bezogen erreichte die Extraktion im sechsten und 20 Der öffentliche Zugang zur aktuellen Version der Genitivdatenbank (GenitivDB) ist unter www.ids-mannheim.de/ genitivdb zu finden (Stand: 16.1.2015). 21 Vgl. www.connexor.com/ nlplib/ (Stand: 16.1.2015). 22 Vgl. http: / / open.xerox.com/ Services/ fst-nlp-tools (Stand: 16.1.2015). 23 Vgl. www.ids-mannheim.de/ kl/ projekte/ korpora/ annotationen.html (Stand: 16.1.2015). 24 Durch den Connexor-Tagger identifizierte Wörter und Satzzeichen. 25 Vgl. www.ids-mannheim.de/ kl/ projekte/ korpora/ archiv/ mk.html (Stand: 16.1.2015). Einführung 26 letzten Durchgang gemessen am Goldstandard hohe Präzisions- und Ausbeuteraten mit dem kombinierten Wert 26 F = 0,97 (richtig positiv: 291; richtig negativ: 3147; falsch positiv: 10; falsch negativ: 8). 27 Anhand der Extraktionsergebnisse wurden in der explorativen Phase des Projekts mithilfe des maschinellen Lernens 28 Entscheidungsbäume modelliert, die die Daten automatisch klassifizierten und Regeln für die Wahl der Genitivmarkierung vorhersagten. Daraus gingen wichtige Impulse für die Hypothesenbildung hervor, die den Analysen der Kapitel 2 und 3 voranging. Die Datenextraktion, die Baummodellierung und die daraus resultierenden Hypothesen werden genauer in Bubenhofer/ Hansen-Morath/ Konopka (2014) beschrieben. 29 Das Ziel der Datenextraktion war es, eine Datenbasis bereitzustellen, die eine ganzheitliche Beschreibung der Markierungsvariation ermöglicht, d.h. eine Beschreibung, die einerseits auf einer nicht allzu hohen Abstraktionsstufe auf die gesamte Standardsprache projizierbar ist und andererseits alle wichtigen Ausprägungen der Variation und alle Markierungsvarianten berücksichtigt. Die allgemeinen Präzisions- und Ausbeutewerte sind diesem ganzheitlichen Anspruch entsprechend hoch (in beiden Fällen P = 0,97). Bei einem solchen Ansatz muss allerdings in Kauf genommen werden, dass die Präzisions- und Ausbeutewerte in weniger zentralen Bereichen der Datenbasis auch deutlich unter den allgemeinen Werten liegen können. Oft ist eine effektivere Behandlung solcher Bereiche mit einem nicht zu rechtfertigenden Aufwand verbunden. Außerdem kann eine optimale Behandlung von Spezialfällen zur Senkung der allgemeinen Ausbeuterate führen. So lässt die Güte der Extraktion in den nicht kanonischen Bereichen der endungslosen Genitive und der Genitive mit einem durch einen Apostroph abgetrennten s (z.B. in Reni’s Frischmarkt) nach. Spezielle manuelle Überprüfungen der Extraktionsgüte bei endungslosen Genitiven finden sich in Kapitel 3. Für den Bereich des apostrophierten s ergab eine Präzisionskontrolle in einer randomisierten Stichprobe, dass es 26 F = 2*(Precision*Recall)/ (Precision+Recall). 27 Eine erweiterte Auswertung findet sich in Schneider (2014). Dort wird nicht nur die Genitivprüfung evaluiert, sondern auch die Zuweisung von zusätzlichen Datenbank-Informationen (vgl. Tab. 2). 28 Algorithmus C4.5, vgl. Quinlan (1993), der in der Software WEKA (vgl. Witten/ Frank 2005) implementiert ist. 29 Vgl. auch Hansen/ Schneider (2013) und Schneider (2014). Methodik 27 sich in 92% ± 5% 30 der gefundenen Token tatsächlich um Genitive auf -’s handelt. 31 Machten sich im Weiteren bei Spezialanalysen, die sich auf schwächer vertretene Nomengruppen bezogen, Extraktionsfehler bemerkbar, so wurde versucht, diese mithilfe von Abfragen mit entsprechend angepassten SQL -Befehlen sowie notfalls manuell zu minimieren. Es muss dabei bedacht werden, dass die Extraktion bei der Suche nach den Genitivnomina in vielerlei Hinsicht auf Tagger- Informationen aufbaute. Als eigens zur Genitivfindung entwickeltes Verfahren konnte sie diese Informationen bei Bedarf zwar öfter korrigieren, ihre Zuverlässigkeit hing dennoch in nicht geringem Maße von der Güte der Tagger-Annotierungen ab. 32 1.4.2 Die Genitivdatenbank In der Genitivdatenbank werden 9.785.471 Token geführt, die als Kandidaten für Genitivnomina gelten und sich auf 651.048 Types verteilten. Die 7.218.605 Token mit Prob > 1, die ab jetzt als Genitivnomina bezeichnet und in Kapitel 2 und 3 (ggf. in Teilmengen) weiter analysiert werden, verteilen sich auf 516.861 Types. 33 Die Datenbank wurde 30 Konfidenzniveau 95%. 31 Extrem häufig sind es Eigennamen, bevorzugt fremdsprachige (z.B. Yvonn’s [Stand], John’s [Gitarrenlicks]). Nicht selten bringen die Genitive als Teile komplexer fremdsprachiger Eigennamen, die teils stärker, teils schwächer in den deutschen Umtext integriert sind, den Apostroph aus der Fremdsprache mit (z.B. des 33. America’s Cup, im Hotel Caesar’s Palace). Manchmal erscheinen sie ohne Bezugswort wie [bei] McDonald’s oder [Mitarbeiter von] Sotheby’s. Beide Arten von Konstruktionen wurden hier aus dem Extraktionsergebnis nicht ausgeschlossen, denn im Korpus finden sich jeweils heimische Pendants (z.B. Wissmann’s Apotheke, Landgasthaus Rudi’s Spezialitätenbeisl, [im] Ebert’s. Eine klare Trennung der fremden und der heimischen Konstruktionen war vorab aus praktischen und theoretischen Gründen nicht möglich. So spiegelt das Extraktionsergebnis die Verwendungszusammenhänge und lexikalische Domänen des im Deutschen nicht kanonischen -’s wider. In Kapitel 3.3.2.1 wird die Kategorie des durch apostrophiertes s angezeigten Genitivs enger gefasst. 32 Belica et al. (2011, S. 461ff.) diskutieren die Tauglichkeit von Annotationen für Variationsuntersuchungen und stellen fest, dass die Güte von Annotationen mit dem zunehmenden Abstand der Phänomene vom sog. Sprachkern („language core“) prinzipiell nachlässt. 33 Die Genitivdatenbank wird kontinuierlich weiterentwickelt. In der aktuellen öffentlich zugänglichen Version (GenitivDB) werden nur Nomina geführt, zu denen auch Metadaten hinzugefügt werden konnten, die die Parameter ‘Zeit’, ‘Land’, ‘Region’, Einführung 28 bewusst etwas umfangreicher als diese Kerngruppe gehalten, um sich bei punktuellen Ausbeute-Schwächen eine manuelle Genitivsuche im nächstwahrscheinlichen Kandidatenbereich (Prob = 1) offenzuhalten. Zu jedem Token wird in der Genitivdatenbank neben der Fundstelle und dem Satzkontext eine Reihe von Metadaten aufgelistet, die dabei helfen, Gruppen von Genitivnomina zu identifizieren, die bei den Hypothesen zur Genitivbildung eine Rolle spielen und sich spezifisch verhalten sollten. Bei diesen Metadaten handelt es sich neben Informationen zur Art der Markierung um über 80 Angaben morphologischer, lexikalischer, prosodischer, phonologischer und extralinguistischer Art. Sie sind unter http: / / hypermedia.ids-mannheim.de/ call/ public/ korpus.ansicht? v_id=6104 (Stand: Januar 2015) vollständig aufgelistet - Tabelle 2 stellt daher nur die wichtigsten der Zusatzinformationen zusammen, die zu jedem Beleg zur Verfügung stehen. Kategorie (Spaltenname in der GenitivDB) Information Lemma Grundform MorphGen Genitivwahrscheinlichkeit nach Xerox Mask Handelt es sich beim Genitivnomen um ein Maskulinum? Neut Handelt es sich beim Genitivnomen um ein Neutrum? Art Vorhandensein und Position eines Artikels AdjEN Steht ein Adjektiv auf -en adjazent davor? PropN Ist das Genitivnomen laut Tagger ein Eigenname? PropNmanuell Steht das Genitivnomen auf der Eigennamenliste? Fremdw Handelt es sich beim Genitivnomen um ein Fremdwort? Abk Handelt es sich beim Genitivnomen um eine Abkürzung? ‘(inhaltliche) Domäne’, ‘Medium’ und ‘Register’ betreffen. Sie umfasst damit 9.541.753 Token und 650.726 Types bzw. mit Prob > 1 7.014.158 Token und 516.592 Types (Stand: Januar 2015). Trotz der etwas geringeren Datenmenge bleiben die quantitativen Verhältnisse vergleichbar, sodass sich die linguistischen Erkenntnisse dieser Untersuchung nachvollziehen lassen. Methodik 29 Kategorie (Spaltenname in der GenitivDB) Information Neo Handelt es sich beim Genitivnomen um einen Neologismus? Stil Handelt es sich beim Genitivnomen um eine Stilbezeichnung? Konversion Handelt es sich beim Genitivnomen um eine Konversion? Zeitausdruck Handelt es sich beim Genitivnomen um einen Zeitausdruck? NNP rae Steht vor dem Genitivnomen ein anderes Nomen? Kompositum Ist das Genitivnomen ein Kompositum? Fuge Fuge des Kompositums (falls vorhanden) HK Häufigkeitsklasse des Lexems HKZG Häufigkeitsklasse des Zweitglieds beim Kompositum HKQ uot Quotient HK Kompositum/ HK Zweitglied bei Komposita CELEX Ist das Nomen oder sein Zweitglied in CELEX berücksichtigt (‘j’, ‘zg’ bzw. ‘null’)? anzsilb Anzahl der Silben ( CELEX ) Letztlaut DISC Phonetische Umschrift des letzten Lautes des Lexems im DISC -Format ( CELEX ) Letztlauttyp Ist der letzte Laut ein Vokal oder ein Konsonant? ( CELEX ) Letztlautart Artikulationsart des Auslautkonsonanten (nasal, liquid etc.) - falls vorhanden ( CELEX ) letztreim DISC Phonetische Umschrift des Reims der letzten Silbe im DISC -Format ( CELEX ) letztsilbbetont Ist die letzte Silbe des Genitivs betont? ( CELEX ) vorletztsilbbetont Ist die vorletzte Silbe des Genitivs betont? ( CELEX ) suffortho Orthografie des Suffix - falls vorhanden ( CELEX ) Year Jahresangabe zum Text, aus dem das Genitivnomen stammt Country Landesangabe zum Text, aus dem das Genitivnomen stammt Einführung 30 Kategorie (Spaltenname in der GenitivDB) Information Register Registerangabe zum Text, aus dem das Genitivnomen stammt Region Regionangabe zum Text, aus dem das Genitivnomen stammt Prob Punkte für die Genitivwahrscheinlichkeit Tab. 2: Zusatzinformationen zu den Belegen in der Genitivdatenbank (Auswahl) Die Informationen stammen aus verschiedenen Quellen. Einige wie etwa die Genusangaben Mask und Neut beruhen auf der Annotation der Tagger (Xerox und TreeTagger). Andere sind nach einem Abgleich der Genitivkandidaten mit verschiedenen im Institut für Deutsche Sprache (IDS) entstandenen Wortlisten oder mit dem deutschen Bestand der CELEX Lexical Database (Release 2, Baayen et al. 1995) hinzugefügt worden. 1.4.3 Sonderwortschatzbereiche Eine wichtige Gruppe von Informationen betrifft die Zugehörigkeit der Lexeme zu spezifischen Nomenklassen, da die bisherige Forschung klargemacht hat, dass Sonderwortschatzbereiche wie Eigennamen oder Fremdwörter Besonderheiten im Hinblick auf die Genitivbildung zeigen (vgl. Kap. 1.3, u.a. Tab. 1). Bei der Klassifikation der Nomina als Eigennamen (PropN) wurde auf die Tagger-Annotation zurückgegriffen; daneben wurde eine Liste mit über 13.000 Einträgen (Personennamen, geografischen Namen etc.) verwendet (PropNmanuell), die vor allem auf einer im IDS-Projekt elexiko kompilierten Eigennamenliste beruhte. In Kapiteln 2 und 3 spielen auch andere Sonderwortschatzbereiche eine Rolle, bei denen auf Wortlisten zurückgegriffen wurde. Im Einzelnen handelt es sich dabei um: 1) eine Liste mit 12.236 Fremdwörtern, die hauptsächlich auf einer im Projekt elexiko erstellten Liste basierte, 34 34 Für die Zurverfügungstellung von Daten, Listen und für die tatkräftige Unterstützung danken wir den Kolleginnen und Kollegen Annette Klosa, Ulrich Schnörch, Michael Hanl (alle elexiko) sowie Carolin Müller-Spitzer und Frank Michaelis (beide OWID ). Methodik 31 2) eine Liste mit 3.795 Abkürzungen, die hauptsächlich auf verschiedenen im Projekt elexiko zusammengestellten Listen basierte, 3) eine Liste mit 1.425 Neologismen (nicht nur Nomina), die im Projekt OWID / Neologismen erstellt wurde, 4) eine eigens erstellte Liste von 55 Stilbezeichnungen wie Barock, Punk oder Dada, 5) eine eigens erstellte Liste von 50 Konversionen wie [das] Nein, [das] Rot oder [das] Dasein, 6) eine eigens erstellte Liste von 27 Zeitausdrücken, die evtl. auch als Köpfe in Komposita auftreten (Monatsnamen, Wochentage und Tageszeiten) wie Mai, Mittwoch, Mittag, [Weihnachts-](A)bend. Die Genitivkandidaten wurden automatisch in den Listen „nachgeschlagen“ und dann in der Datenbank mit der entsprechenden Angabe in der Rubrik Fremdw, Abk, Neo etc. versehen. Selbstverständlich erheben solche Listen keinen Anspruch auf Vollständigkeit, denn eine genaue Erfassung der meisten (oder gar aller) genannten Wortschatzbereiche übersteigt das menschlich und maschinell Machbare. Zudem sind Einstufungen von Nomina als Fremdwörter oder Eigennamen nicht selten interpretationsfähig. Bei dem Einsatz der Listen ging es also vielmehr darum, im Korpus möglichst viele zuverlässige Vertreter der einschlägigen Wortschatzbereiche zu finden, um primär empirisch fundierte Aussagen über die Genitivbildung im jeweiligen Bereich möglich zu machen. Im Falle von Fremdwörtern wurde dabei keine diachron-etymologische, sondern eine synchron-strukturelle Klassifizierung angestrebt, die sich in verschiedenen Untersuchungen zur Wortprosodie und Flexion als relevant erwies. 35 Zumindest bei Eigennamen, Fremdwörtern und Abkürzungen konnten tatsächlich große Mengen einschlägiger Token identifiziert werden (vgl. z.B. Tab. 2 im Anhang). Bei den Listen 4, 5, 6 hingegen handelt es sich viel stärker um „Kontrolllisten“, die anhand ausgewählter Nomina die Genitivbildung in einschlägigen Wortschatzbereichen einschätzen helfen sollen. Die automatische Einstufung der Genitivkandidaten als zugehörig zu einem spezifischen Sonderwortschatzbereich konnte wie erwartet nicht gänzlich fehlerfrei verlaufen. Gemäß Stichproben, die durch mehrere Bearbeiter auf ihre Zuverlässigkeit hin untersucht wurden, 35 Vgl. Eisenberg (1992, S. 42). Einführung 32 sind in den jeweiligen Einstufungsergebnissen bei einem Konfidenzniveau von 95%: - 91,9% ± 4,0% tatsächlich Eigennamen (Einstufung PropN, vgl. Tab. 2), - 99,32% ± 1,3% 36 tatsächlich Fremdwörter, - 91,7% ± 3,6% tatsächlich Abkürzungen, - 90,9% ± 3,8% tatsächlich Neologismen, - 89,3% ± 4,9% tatsächlich Stilbezeichnungen, - 75,9% ± 2,5% tatsächlich Konversionen, - 95,5% ± 1,9% tatsächlich Zeitausdrücke. Wenn die Präzisionswerte wie vor allem bei Konversionen etwas absinken, so liegt es oft an charakteristischen Fehlern, die auf Homografie beruhen: - Eigenamen werden mit Vertretern anderer Sonderwortschatzklassen verwechselt, vgl. Braun wie in Brauns Worte (Eigenname) und in des dunklen Braun (Konversion), Navis wie in Navis (Gemeinde in Tirol, Eigenname) und in des Navis (‘Navigationsgerät’, Neologismus), Hell(s) wie in Hells Angels (Teil eines Eigennamens) und in des Hell (Konversion). - Appellativa werden mit Eigennamen-nahen Sonderwortschatzklassen verwechselt, vgl. Rock wie in die Ärmel seines Rocks und eine Ikone des Rock (Stilbezeichnung), Flyers wie in des Flyers (‘Flugblatt’) und in Philadelphia Flyers (Eigenname). Solche durch Homografie bedingten Fehler werden beim geplanten nächsten Release der Genitivdatenbank systematisch bearbeitet, konnten aber in der vorliegenden Untersuchung bei Bedarf nur noch mithilfe zusätzlicher SQL -Befehle sowie notfalls manuell ausgeschlossen werden. Die mithilfe der Listen durchgeführten Sonderwortschatz-Einstufungen wurden sekundär dazu genutzt, in der Datenbasis den Anteil von Sonderwortschatzbereichen zu reduzieren, deren Nomina sehr stark eine spezifische Endung präferieren und somit - was die Endung angeht - nur wenig variieren (vgl. Kap. 2). Dies war für uns mit den oben berichteten Präzisionsergebnissen ver- 36 Die obere Grenze des Konfidenzintervalls liegt in manchen Fällen über 100%, was der symmetrischen Berechnung geschuldet ist. In solchen Fällen ist natürlich nur die untere Grenze interpretierbar. Methodik 33 einbar, zumal es vor allem darauf ankam, möglichst viele Sonderwortschatztoken auszuschließen, und es gleichzeitig bei den großen Datenmengen, die nach den Ausschlüssen immer noch für die Analysen bereitstanden, meist vernachlässigbar erschien, wenn einige wenige Grundwortschatztoken mit ausgeschlossen wurden. 37 In den Sonderwortschatzbereichen, die naturgemäß weniger stark belegte Nomina zusammenfassen, sinkt wie erwartet die Genitivzuverlässigkeit der Extraktion (vgl. den Ausführungen weiter oben). Gemäß von mehreren Bearbeitern durchgesehenen Stichproben der jeweiligen Einstufungsergebnisse sind bei „Genitivwahrscheinlichkeit“ Prob > 1 und einem Konfidenzniveau von 95% - 89,7% ± 4,4% der eingestuften Eigennamen, - 97,3% ± 2,6% der eingestuften Fremdwörter, - 72,5% ± 5,8% der eingestuften Abkürzungen, - 55,0% ± 6,6% der eingestuften Neologismen, - 99,3% ± 1,3% der eingestuften Stilbezeichnungen, - 85,1% ± 2,0% der eingestuften Konversionen, - 27,3% ± 4,1% der eingestuften Zeitausdrücke tatsächlich Genitive. Charakteristische Fehler beruhen erneut auf Homografie und betreffen - die Verwechslung von Pluralen auf -s mit Genitiven vor allem bei fremdsprachigen Ausdrücken, z.B.: Alcopops, Links (in ‘Neologismen’), Kuhns (in ‘Eigennamen’), Fans (in ‘Fremdwörter’) sowie - die Verwechslung von Eigennamen auf -s mit Genitiven, z.B.: [Tim] Robbins, Navis (Gemeinde in Tirol), Philadelphia Flyers (Eishockeyklub). Hinzu kommt die extrem häufige Verwechslung anderer Kasus mit dem endungslosen Genitiv bei Zeitausdrücken, z.B. in des am 27. Juli [...] unterzeichneten Waffenstillstandsabkommens, die auf einen Fehler im Extraktionsskript zurückgeht, der im Rahmen dieser Untersuchung nicht mehr zu beheben war. Diese Verwechslung fällt ins Gewicht, wenn es um die Beschreibung endungsloser Genitive geht - deswegen und auch wegen des in diesem Bereich unzureichenden Recalls musste 37 Punktuell wurden manuelle Berichtigungen vorgenommen. Einführung 34 in Kapitel 3 beim Thema Zeitausdrücke manuell nachgearbeitet bzw. ersatzweise auf Recherchen in COSMAS II zurückgegriffen werden (vgl. z.B. Kap. 3.3.2.2). Bei der Betrachtung der Alternation zwischen den verschiedenen Endungen (Kap. 2) stehen hingegen diejenigen Genitivkandidaten im Fokus, bei denen während der Extraktion automatisch eine Endung erkannt wurde. In diesem Teilbereich sind in der oben benutzten Stichprobe ca. 94% (81/ 86) der als Zeitausdrücke eingestuften Kandidaten auch tatsächlich Genitivnomina. Bei Ausschlüssen von Sonderwortschatzbereichen aus der Datenbasis ist es schließlich ohnehin unschädlich, wenn es unter den Ausschlüssen Nicht-Genitive gibt. Von der Genitivrate bei Zeitausdrücken abgesehen erscheinen die Ergebnisse obiger Präzisionsprüfungen in der Spannung zwischen dem Anspruch auf ganzheitliche Beschreibung einerseits und auf Zuverlässigkeit der Genitiverfassung andererseits für den jetzigen Zeitpunkt insgesamt als akzeptierbar. In Zukunft sind Verbesserungen aber selbstverständlich möglich und anzustreben. Sie werden auch in einem geplanten zweiten Release der Genitivdatenbank verfolgt, sind jedoch im Rahmen dieser Studie nicht mehr berichtbar. 1.4.4 Häufigkeitsklassen, CELEX -Angaben und extralinguistische Informationen Da die Häufigkeit der Lexeme bzw. der Formen in den Hypothesen zur Genitivbildung eine wichtige Rolle spielt, wurden die Genitivkandidaten mit der Grundformliste von DeReWo vom Dezember 2011 (v-ww-bll-250000g-2011-12-31-0.1, vgl. www1.ids-mannheim.de/ kl/ projekte/ methoden/ derewo.html) verglichen, in der 250.000 Lemmata mit Angaben zur Häufigkeit in den Korpora des DeReKo-Archivs (Stand Mitte 2011) zusammengestellt sind. Die Häufigkeit wird darin in Form von Häufigkeitsklassen angegeben: Dabei hat eine Grundform die Häufigkeitsklasse N, wenn die häufigste Form etwa 2 N -mal häufiger vorkommt als diese Form. Für die Grundformenliste ist der Eintrag mit der höchsten Frequenz ‘der,die,das’ mit f(‘der,die,das’) = 373.738.420 [...]. (v-ww-bll-250000g-2011-12-31-0.1, Dokumentation, S. 6) Wenn also Jahr die Häufigkeitsklasse N = 5 hat, so ist der/ die/ das etwa 2 5 = 32 Mal so häufig wie Jahr (vgl. ebd.). Dabei gilt: Je höher die Häufigkeitsklasse, desto seltener das Wort. Die Spanne der Häufigkeitsklas- Methodik 35 sen in der DeReWo-Grundformliste reicht von 0 bis 28. Die Lemmata der Genitivdatenbank finden sich dort in den Häufigkeitsklassen 5 (z.B. Jahr) bis 26 (z.B. Christenlager). Die entsprechenden Häufigkeitsklassen wurden in die Genitivdatenbank übernommen und sind dort bei jedem Token aufgeführt. Allerdings konnte für viele Token der Genitivdatenbank keine Entsprechung in der DeReWo-Grundformliste ermittelt werden. Diese Token (2.108.336 bei Prob > 1) sind in der Spalte Häufigkeitsklasse ( HK ) der Genitivdatenbank mit der Zahl ‘29’ gekennzeichnet. Um effektiv Nomengruppen bilden zu können, die sich durch diffizile lautliche, prosodische und morphologische Spezifika auszeichnen, die in den Hypothesen zur Genitivbildung relevant sind, wurden die Genitivkandidaten mit dem deutschen Bestand der CELEX Lexical Database (Release 2, Baayen et al. 1995) abgeglichen, der entsprechende Informationen für rund 60.000 Grundformen (nicht nur Nomina) liefert. In CELEX konnten 12.833 Lemmata der Genitivdatenbank vollständig gefunden werden, zzgl. 58.388 komplexer Lemmata (Komposita, Präfixbildungen), deren Zweitglieder in CELEX verzeichnet sind. Die dazugehörigen CELEX -Angaben wurden in der Genitivdatenbank bei den entsprechenden 3.706.204 Token (bei Prob > 1) ergänzt. Beispiele für die berücksichtigten Informationen können dem unteren Teil der Tabelle 2 entnommen werden. Zu fast allen Genitivnomina (d.h. zu 7.014.158 Token bei Prob > 1) konnten schließlich auf der Basis semiautomatischer Auswertung bibliografischer Informationen zu den Quellentexten extralinguistische Angaben zum Erscheinungsmedium (z.B. Presse, Internet, Bücher), zum Entstehungsbzw. Erscheinungsjahr, zum Register (Textsorte) des Textes und zum Herkunftsland sowie zur Herkunftsregion des Textes/ Textautors hinzugefügt werden. 38 Der aus diesem Bereich stammende Faktor ’Zeit’ wird in Kapitel 3.3.2.6 in die Analysen einbezogen. 1.4.5 Recherche- und Analysemethoden, methodisch relevante Datenbereiche In der Genitivdatenbank konnten einerseits die Belege bzw. die Datensätze einzeln betrachtet und qualitativ untersucht werden (vgl. Abb. 1). 38 Zu solchen Angaben vgl. Bubenhofer/ Konopka/ Schneider (2014, S. 62ff.). Einführung 36 Abb. 1: Die ersten Spalten der Genitivdatenbank im SQL -Developer, der von den Autoren benutzten Arbeitsumgebung Methodik 37 Andererseits konnten darin mithilfe der SQL -Befehle (vgl. Listing 1) für die Untersuchung relevante Untergruppen der Genitivnomina isoliert und quantitativ ausgewertet werden. Listing 1 zeigt ein Beispiel- SQL -Befehl, mit dem sich pro Auslauttyp (Konsonant, Vokal) die Anzahl von Genitivtoken ermitteln lässt, die auf -es enden und nicht den Sonderwortschatzbereichen zugerechnet wurden, und deren Grundformen - im DeReWo - die Häufigkeitsklasse > 7 haben und - in CELEX - vollständig sowie als Einsilber aufgeführt sind. select letztlauttyp, count(*) from korpusschema.tb_genitiv6 where prob > 1 and es = 1 and propn = 0 and abk = 0 and neo = 0 and fremdw = 0 and konversionen = 0 and HK > 7 and celex = ’j’ and anzsilb = 1 group by letztlauttyp List. 1: Beispiel für einen SQL -Befehl zur Suche nach für die Analysen relevanten Nomengruppen Da nicht zu allen Genitivtoken alle Arten von Metaangaben vorlagen, rückten im Laufe der Untersuchung verschiedene Teile der Datenbasis in den Vordergrund, z.B.: - alle Nomina mit Prob > 1, - alle Nomina mit Prob > 1 ohne Sonderwortschatzbereiche, - alle Nomina mit Prob > 1 ohne Sonderwortschatzbereiche, deren Lemma bzw. Lemmazweitglied in CELEX erfasst ist, - alle Nomina mit Prob > 1 ohne Sonderwortschatzbereiche, deren Lemma vollständig in CELEX erfasst ist. In den jeweils relevanten Gruppen der Genitivnomina fanden die quantitativen Analysen zu mutmaßlichen Variationsfaktoren sowohl aus der allgemeinen Tokensicht als auch aus lemmabezogener Sicht statt, die sich der lexembestimmten Perspektive annäherte. Bei diesen Analysen wurde sowohl auf deskriptivals auch inferenzstatistische Verfahren zurückgegriffen wie: - Berechnungen relativer Häufigkeiten, - Berechnungen zur zentralen Tendenz und Streuung (Mittelwert, Median, Standardabweichung), - Prüfungen der Signifikanz von Häufigkeitsunterschieden (Chi- Quadrat-Test, Berechnung von standardisierten Pearson-Residuen, Visualisierung anhand von Assoziationsplots, Wilcoxon-Test), Einführung 38 - Berechnungen zur Effektstärke (Phi-Koeffizient, (logarithmierte) Odds Ratio), - binäre logistische Regression. Als Korrektiv bei Verallgemeinerungen der Ergebnisse von Datenbankanalysen wurden immer wieder „klassische“ Recherchen in COSMAS II herangezogen. Sie wurden darüber hinaus wichtig, wenn für die Beschreibung einiger spezifischer Nomenbereiche die Genitivdatenbank als Datenquelle offensichtlich unzureichend wurde (vgl. Kap. 3). Trotz aller Vorkehrungen, die getroffen wurden, um eine optimale Datenbasis bereitzustellen und die Ergebnisse abzusichern, darf hier wie bei allen solchen Untersuchungen nicht vergessen werden, dass in den folgenden Kapiteln primär die zur Verfügung stehende Datenbasis beschrieben wird und die Standardsprache nur in einer Annäherung in Augenschein genommen werden kann. 1.5 Verteilung und Klassifizierung der Varianten und Aufbau der Studie Die acht teilweise nur grafisch unterscheidbaren Varianten des Genitivnomens werden nicht alle gleich häufig gebraucht. Ihre Verteilung in unserem Material wird in Abbildung 2 illustriert (vgl. Tab. 1 im Anhang zu genaueren quantitativen Daten). Abb. 2: Relative Häufigkeit der verschiedenen Varianten des Genitivnomens (Token) Verteilung und Klassifizierung der Varianten 39 Drei Varianten ragen dabei nicht nur hinsichtlich ihrer Häufigkeit, sondern auch aus systematischer Sicht heraus: das Nomen auf -es, das Nomen auf -s und das unmarkierte Nomen. Sie werden hier als Leitvarianten betrachtet, denn die übrigen Varianten lassen sich auf sie beziehen. Die beiden ersten Leitvarianten können unter einer abstrakteren Protovariante ‘Nomen mit (phonetisch realisierter) Endung’ zusammengefasst werden, für die dritte kann entsprechend eine Protovariante ‘Nomen ohne (phonetisch realisierte) Endung’ angesetzt werden (vgl. Abb. 3). Abb. 3: Klassifizierung der verschiedenen Varianten des Genitivnomens und Aufbau der Studie Möglich wären selbstverständlich auch andere Unterteilungen. Insbesondere könnte das Nomen auf Apostroph (z.B. Grass’) dem Nomen mit Endung zugeschlagen und evtl. auch der Leitvariante ‘Nomen auf -s’ untergeordnet werden, da der Apostroph nicht nur als ein Kennzeichen notwendiger Auslassung, sondern auch als ein Hinweis auf die Fusion der Genitivendung -s mit dem Stammauslaut interpretiert werden kann (vgl. Duden 2009, S. 196f., 209). In dieser Studie haben wir uns jedoch für die Orientierung an der phonetischen Realisierung entschieden, die eine Klassifizierung wie in Abbildung 3 nahelegt. Einführung 40 Obige Unterteilung der Genitivnomina bestimmt den weiteren Aufbau der Doppelstudie: Der Variation zwischen verschiedenen Endungen widmet sich die Teilstudie in Kapitel 2, während die Teilstudie in Kapitel 3 die Endungslosigkeit fokussiert und deren Alternation mit dem Vorhandensein von Endungen erörtert. 2. ENDUNGSVARIATION Auf der Markierungsebene übernehmen die Endungen -es und -s sowie das Ausbleiben der Markierung 39 die Leitvariantenfunktion. Die übrigen Markierungsvarianten gruppieren sich um diese Leitvarianten herum, sodass in einer phonetisch orientierten Betrachtung drei Markierungstypen angesetzt werden (vgl. Abb. 3 oben), die in Kapitel 2 „ES“, „S“ und „Nullendung“ genannt werden. Dabei gehört - -ses als grafische, kombinatorische Variante von -es bei Nomen auf -nis zu Typ ES, - -'s als grafische Variante von -s (Amerikas/ Amerika’s oder Karls/ Karl’s) zu Typ S, - -ens, -ns als Kombination aus Nicht-Nominativ-Markierung und -s bei Nomen, die schwache und starke Flexion mischen wie Gedanke oder Herz, bzw. bei Eigennamen auf Sibilanten (Leibnizens) zu Typ S, - -' (der Apostroph am Nomenende) als grafische Variante, die das phonetische Ausbleiben der Markierung vor allem bei Eigennamen auf Sibilanten festhält (Alex'), zu Typ Nullendung. Im Folgenden werden die Bezeichnungen ES, S und Nullendung verwendet, wenn nicht nur die Leitvarianten, sondern alle Markierungsvarianten des jeweiligen Typs gemeint sind (bei S etwa sind es -s, -'s, -ens und -ns). 40 2.1 Stand der Forschung zur Endungsvariation Neben der Duden-Grammatik (2009) und dem Zweifelsfälle-Duden (2007) werden hier exemplarisch drei Spezialstudien zur -s/ -es-Variation herangezogen: die breit angelegten korpusbezogenen Untersuchungen Szczepaniaks (2010) und Fehringers (2011) sowie die etwas ältere Untersuchung von Pfeffer/ Morrison (1979, 1984), die auf der Analyse von Korpora zum sog. „Grunddeutsch“ (vgl. ebd.) basiert. In 39 Im Weiteren auch „Nullmarkierung“. 40 Sie werden außerdem durchgehend in Zusammensetzungen vom Typ „ES-Anteil“, „S-Tendenz“ und der Einheitlichkeit halber in allen Abbildungen und Tabellen verwendet. Endungsvariation 42 allen diesen Darstellungen werden Bereiche invarianter Genitivnomina ausgemacht, die sich weitgehend decken. 41 Dabei geht es in erster Linie um Zuordnungen, die durch phonologische und morphologische Faktoren (vgl. Faktor 2, 8, 9 in Tab. 1 aus Kap. 1.3) bestimmt sind: - Nomina des Grundwortschatzes, die auf einen s-Laut enden → -es (z.B. Hauses) - Nomina mit einem speziellen, das Schwa enthaltenden Endreim wie -en, -em, -el, -er, -end → -s (z.B. Abends) - Nomina mit einem speziellen (unbetonten) Endreim bzw. Suffix wie -ich, (-icht,) -ig, -lein, -(l)ing → -s (z.B. Kehrichts) Etwas weiter in der phonologischen bzw. prosodischen Spezifikation gehen lediglich Pfeffer und Morrison, die in ihrer gezielt präskriptiven Beschreibung die Invarianz außer in den oben genannten Fällen bei den folgenden zwei Nomengruppen postulieren: - Nomina auf -ch, -ff, -ll, -mm, -nn, -tt, -zt, -sch, -st → -es (z.B. Schiffes) - mehrsilbige Nomina auf einen unbetonten Vokal → -s (z.B. Kinos, Auges) 42 Die erste Gruppe bringt in einer graphemisch orientierten Darstellung Nomina zusammen, deren Einstufung bei anderen Autoren von leicht schwankend (Nomina auf -sch oder -st) bis deutlich variierend (Nomina auf Doppelkonsonant -ff, -ll etc.) reicht. Die zweite Gruppe bilden Nomina, die von anderen Autoren nicht speziell hervorgehoben werden - in der Duden-Grammatik (2007, S. 198) wird lediglich eine verstärkte Tendenz zu -s bei Nomina auf einen Vollvokal ohne Hauptakzent beobachtet. Darüber hinaus werden in der Duden-Grammatik und dem Zweifelsfälle-Duden spezielle Nomenklassen thematisiert (vgl. Faktor 24, 26, 27, 38-40 in Tab. 1 weiter oben), die als Endung nur -s erlauben, daneben aber auch die Weglassung der Endung zulassen, wie: 41 Szczepaniak (2010, S. 108f.) und Fehringer (2011, S. 92f.) stützen sich in diesem Punkt auf ältere Ausgaben der Duden-Grammatik. 42 Pfeffer/ Morrison (1979, S. 17) führen bei der endgültigen Regelformulierung als Beispiel nur Kinos an, was aber keine Einschränkung auf Fremdwörter bedeutet. In den diese Regelformulierung vorbereitenden Ausführungen erscheinen auch Genitive nativer Nomina wie Auge oder Gebilde (siehe ebd., S. 12, 16). Stand der Forschung zur Endungsvariation 43 - Farb- und Sprachbezeichnungen, feste Wendungen sowie (nur in der Duden-Grammatik) Gelegenheits-/ Zitatssubstantivierungen, zitierte Einzelbuchstaben und Kurzwörter → -s Die Bereiche, in denen Endungsvariation zwar vorliegt, aber nur als gering eingeschätzt wird, sind durch die Endung -s dominiert. Zu nahezu invarianten Nomina, die -s präferieren, gehören nach der Communis Opinio Nomina, die auf einen Vokal enden, sowie Sonderwortschatzbereiche wie Eigennamen und Fremdwörter; im Falle der Sonderwortschatzbereiche verschiebt sich der Schwerpunkt der Variation offensichtlich von der Wahl zwischen zwei Endungen auf die Wahl zwischen der Endung -s und der Endungslosigkeit (dazu Kap. 3). Daneben werden als nahezu invariant in der Regel die -es präferierenden nativen Nomina auf -sch, -st betrachtet, die von Pfeffer/ Morrison (1979, 1984) dem gänzlich invarianten Bereich zugeschlagen wurden (vgl. weiter oben). Deutliche Unterschiede zeigen die gesichteten Darstellungen hinsichtlich der Behandlung der varianten Nomina des Grundwortschatzes, die auf Konsonanten enden. Zwar wird die Endung -s in der Duden- Grammatik (2009, S. 195) und bei Szczepaniak (2010, S. 124) als der Normalfall im heutigen Deutsch angesehen, jedoch erweisen sich Faktoren wie 5-18 oder 29-31 aus Tabelle 1 in Kapitel 1.3 als unentbehrlich, um die Feinheiten der Endungswahl zu erklären. Die Variationsparameter sind zahlreich und werden in den Quellen meist linear abgehandelt, sodass sich dem Leser Faktorenhierarchisierungen und die möglichen Unterschiede zwischen den Darstellungen nicht auf Anhieb erschließen. Die einzelnen Beschreibungen zu varianten Nomina des Grundwortschatzes werden im Folgenden soweit möglich in (binäre) Entscheidungsbäume übersetzt, um die Darstellungen untereinander vergleichbar und angelegte Abhängigkeiten zwischen Faktoren transparenter zu machen. Die Interpretation der Entscheidungsbäume erfolgt vom Wurzelknoten an der Spitze abwärts über innere Knoten, bis ein Blatt erreicht wird, welches die Markierungswahl beschreibt. Jeder Knoten repräsentiert einen möglichen Einflussfaktor. Die Endungsangaben in den (ovalen) Blättern mit der Markierungswahl richten sich nach folgendem Muster: Endungsvariation 44 - „-es“ - sehr starke Präferenz für -es, - „-es(-s)“ - deutliche Präferenz für -es, - „-es/ -s“ - leichte Präferenz für -es. Die Präferenzen für -s werden analog beschrieben. Unter den Blättern mit der Markierungswahl erscheinen schließlich die illustrierenden Beispiele. In der Duden-Grammatik wird nur ein relativ allgemeines Bild entworfen (siehe Abb. 4) mit dem Hinweis: „Feinere Regeln lassen sich teilweise nur schwer geben“ (Duden 2009, S. 198). Abb. 4: Variierende Grundwortschatz-Nomina auf Konsonant in der Duden-Grammatik (2009) Stand der Forschung zur Endungsvariation 45 Abb. 5: Variierende Grundwortschatz-Nomina auf Konsonant bei Pfeffer/ Morrison (1979, 1984) Doch gingen Pfeffer und Morrison schon 1979 weiter, indem sie in ihrer Darstellung auch die Faktoren ‘Konsonantengruppe’ und ‘Vokallänge’ berücksichtigten (siehe Abb. 5). Im Zweifelsfälle-Duden (Duden 2007, S. 369ff.) spielt der Faktor ‘Vokallänge’ keine Rolle. Die Darstellung ist mit der der Duden-Grammatik kompatibel (vgl. die dunkelgrau gefärbten Knoten in Abb. 6 mit Abb. 4), geht aber insgesamt deutlich weiter. Angesichts der oben zitierten Bemerkung der Duden- Grammatik stellt sich die Frage, wie wirksam bzw. relevant die für den Zweifelsfälle-Duden spezifischen Faktoren sind. 43 In Letzterem selbst wird betont, dass sich für die Endungsvariation nur teilweise feste Regeln aufstellen lassen (Duden 2007, S. 369). 43 So ist etwa die Voranstellung eines (appellativischen) Genitivattributs wie in des Mannes Zögern (vgl. linken Rand von Abb. 6) im heutigen Deutsch selten und u.U. archaisch wirkend. Die in diesem Bereich beobachtete Tendenz zu -es scheint zu dieser Wirkung beizutragen und ist in der Praxis ein randständiges Phänomen. Endungsvariation 46 Abb. 6: Variierende Grundwortschatz-Nomina auf Konsonant im Zweifelsfälle-Duden (2007) Stand der Forschung zur Endungsvariation 47 Noch weit ausführlicher beschreibt die Variationsfaktoren Szczepaniak (2010). Sie behandelt zunächst die Geschichte der Genitivendung seit dem Althochdeutschen. Die festgestellte Normentwicklung von -es in Richtung auf -s sieht sie dabei als eine Tendenz zur Optimierung des phonologischen Wortes an, die als Resultat des phonologisch-typologischen Wandels des Deutschen von einer Silbensprache zu einer Wortsprache zu interpretieren sei (ebd., S. 124). Die Beschreibung der aktuellen Variation zwischen den beiden Endungen wird dann anders als bisher nicht zuerst nach ‘Silbenanzahl’ strukturiert, sondern nach einem neuen Parameter, ‘morphologische Struktur’ (siehe Abb. 7 weiter unten). Im Bereich der Simplizia ist Szczepaniaks Darstellung trotzdem mit der Darstellung des Zweifelsfälle-Dudens einigermaßen kompatibel (man vergleiche die dunkelgrau gefärbten Knoten in Abb. 7 mit Abb. 6) und wirkt teilweise wie deren Präzisierung. Auch was komplexe Wörter angeht, sind die beiden Darstellungen prinzipiell miteinander vereinbar, jedoch verschiebt sich bei Szczepaniak der Fokus vom Faktor ‘Ultima-Betonung’ zur Betrachtung der Affixbetonung und der genaueren Berücksichtigung der Wortbildung. Neu (und in Abb. 7 fett hervorgehoben) sind bei ihr vor allem der Faktor ‘phonologische Komplexität’ mit Ausprägungen ‘einfaches phonologisches Wort’ und ‘mehrere phonologische Wörter’, 44 der den Bereich der komplexen Wörter gliedert, sowie der Faktor ‘konsonantische Stärke (des Auslauts)’, der an mehreren Stellen im System wirksam werde, wenn Spezialfaktoren aus den Bereichen Silbenanzahl und Betonung keinen Ausschlag geben. Szczepaniak (2010, S. 124) versucht, morphologische und phonologische Strukturaspekte in eine Reihenfolge zu bringen, die dem Ansteigen der Tendenz zu -s entspricht. Dies wird in Abbildung 7, die die wichtigsten Variationsfaktoren Szczepaniaks zusammenfasst, durch die Anordnung der Äste von links nach rechts gespiegelt. 44 Szczepaniak (2010, S. 109) zufolge konstituieren einheimische Simplizia (z.B. Buch, Straße) und Ableitungen mit unbetonten Affixen (z.B. Lehrer, Verstand) einfache phonologische Wörter, während Ableitungen mit betonten Affixen und Komposita immer aus mindestens zwei phonologischen Wörtern bestehen (vgl. Raffelsiefen 2000). Endungsvariation 48 Abb. 7: Variierende Grundwortschatz-Nomina auf Konsonant bei Szczepaniak (2010) Stand der Forschung zur Endungsvariation 49 Fehringer (2011) geht erneut von der Betrachtung der Silbenanzahl aus (siehe Abb. 8 weiter unten). Ihre Darstellung hat auch eine merklich andere Struktur als die Szczepaniaks. Im Bereich der Einsilber bzw. Simplizia sind sich die beiden Darstellungen noch relativ ähnlich (weitgehend kompatible Bereiche sind in Abbildung 8 dunkelgrau eingefärbt), außer dass - Fehringer mit ‘Frequenz (des Genitivs)’ einen neuen, zentralen Faktor einführt (in Abb. 8 fett hervorgehoben) und - laut Fehringer (2011, S. 95f.) ein kurzer Vokal vor einem Auslautkonsonanten wie in Stoff oder Blatt zur Präferenz von -es führt (hierbei stützt sie sich auf Pfeffer/ Morrison 1979, vgl. weiter oben), während Szczepaniak (2010, S. 112, 115f.) einerseits keine Korrelation zwischen Genitivform und Vokallänge sieht, andererseits aber bei Nomina mit einem kurzen Vokal vor einem Auslautkonsonanten eine starke Tendenz zu -s feststellt. Bei Einsilbern führt Fehringer noch den Parameter ‘Sonorität (des Auslauts)’ ein, der sich umgekehrt proportional zur konsonantischen Stärke Szczepaniaks verhält (je sonorer der Auslaut, desto geringer die konsonantische Stärke). Was die postulierte Wirkung angeht, sind diese beiden Faktoren miteinander vereinbar. Eine Möglichkeit einer (satz-)prosodischen Erklärung der Endungsvariation schließt Fehringer (2011, S. 98) bei Einsilbern übrigens explizit aus. Im Bereich der Mehrsilber fokussiert Fehringer komplexe Wörter mit dem Hauptakzent auf der ersten Konstituente. Sie zieht hier nicht mehr den bei Einsilbern postulierten Faktor ‘Sonorität’ heran und lässt auch Unterschiede der Wortbildungs- und Betonungsstruktur beiseite, um allein auf ‘semantische Transparenz’ (in Abbildung 8 fett hervorgehoben) abzuheben: Diese könne den Einfluss des Grundwortes auf das komplexe Wort ermöglichen, sodass die bei Mehrsilbern allgemein wirksame Tendenz zu -s unter Umständen überschrieben wird. Der Faktor ‘semantische Transparenz’ ist als Umkehrung des Faktors ‘Lexikalisierung’ zu sehen, deren Wirkung schon Szczepaniak vermutet hat - dies allerdings nur ganz am Rande ihrer Ausführungen zu komplexen Wörtern. Endungsvariation 50 Abb. 8: Variierende Grundwortschatz-Nomina auf Konsonant bei Fehringer (2011) Stand der Forschung zur Endungsvariation 51 Die Ultima-Betonung taucht nur im Beitrag Szczepaniaks (2010) nicht direkt als selbstständiger Faktor auf. Dies mag u.U. daran liegen, dass sich die Autorin auf Unterschiede zwischen verschiedenen morphologischen Strukturen und vor allem auf den Nachweis der Relevanz des Faktors ‘phonologische Komplexität’ konzentriert. Die Daten Szczepaniaks lassen sich aber auch ohne diesen Faktor erklären, und zwar in einer mit den anderen Darstellungen gut verträglichen Weise. Hierzu haben wir den Entscheidungsbaum aus Abbildung 7, mit dem die Auffassungen Szczepaniaks modelliert wurden, in Abbildung 9 weiter unten abgewandelt. Modifiziert wurden vor allem folgende Punkte: - Der ursprünglich am Ausgangspunkt stehende Faktor ‘morphologische Struktur’ wird durch den in der Forschung in dieser Position etablierten Faktor ‘Silbenanzahl’ ersetzt. - Auf den Faktor ‘phonologische Komplexität’ und sich durch ihn ergebende Gruppierungen wird verzichtet; - dafür kommt der Faktor ‘Ultima-Betonung’ zum Einsatz, der in anderen Quellen (Pfeffer/ Morrison 1979, 1984; Duden 2007; Duden 2009) eine zentrale Rolle spielt. Das Ergebnis ist nicht nur ein Modell, das mit den anderen Darstellungen kompatibler ist. Der neue Entscheidungsbaum erklärt Szczepaniaks Daten ebenfalls lückenlos (die terminalen Knoten und die Beispielgruppen sind die gleichen wie in Abb. 7). Durch Verschiebung des Faktors ‘Silbenanzahl’ und Auftrennung des Knotens ‘ein phonologisches Wort’ ist in Abbildung 9 zusätzlich sogar eine Anordnung der Baumäste möglich, in der die Tendenz zu -s von links nach rechts ansteigt, und zwar deutlich konsistenter als in Abbildung 7. Und schließlich macht der neue Entscheidungsbaum einige Knoten überflüssig: Gepunktet umrandet sind in Abbildung 9 Faktoren, die sich in dem neuen Entscheidungsbaum eigentlich erübrigen. Endungsvariation 52 Abb. 9: Modifizierter Entscheidungsbaum zu Daten Szczepaniaks (2010) -es -s Resultierende Forschungsfragen 53 Die für variante Nomina postulierten Einflussfaktoren der Markierungsvariation sollen naturgemäß zu keinen ausnahmslosen Lösungen führen, sondern nur mehr oder weniger starke Präferenzen begründen. Die Präferenzen könnten theoretisch bei jedem Lexem zu beobachten sein, bei dem die relevanten Faktorenausprägungen vorliegen, d.h. bei jedem Nomen, das eine einschlägige lautliche, prosodische oder morphologische Gestalt aufweist. Die Faktoren sind somit lexemunabhängig konzipiert. Typische Formulierungen lauten: „Die lange Endung -es überwiegt bei Substantiven auf -sch, -tch und -st [...]“ (Duden 2009, S. 197) oder „-s occurs after unstressed syllables containing schwa [...]“ (Fehringer 2011, S. 92). Sowohl Fehringer (2011) als auch Szczepaniak (2010) nehmen dennoch explizit eine Lexemperspektive ein, d.h. sie leiten ihre Schlussfolgerungen aus der Beobachtung der Häufigkeit der Endungen bei einzelnen Lexemen bzw. aus der Betrachtung des arithmetischen Mittels aus relativen Häufigkeiten einer Endung bei einzelnen Lexemen ab. Allerdings spricht Fehringer (2011, S. 98f.) auch von „lexically conditioned preferences“. Sie meint aber nicht, dass die Präferenzen zufällig von Nomen zu Nomen variieren können. Präferenzschwankungen seien vielmehr durch die Nomenfrequenz bedingt: Bei häufigen Wörtern gebe es klare phonologisch bedingte Tendenzen wie etwa, dass Wörter auf Konsonantengruppe mit finalem Obstruenten stark -es bevorzugen; bei seltenen Wörtern sei die Variation dagegen freier. Fehringer sieht dies darin begründet, dass die Genitivvarianten im mentalen Lexikon als ganze Wortformen gespeichert seien und die Bindung zwischen Basisnomina und Genitivform bei häufigen Wörtern stärker sei als bei seltenen Wörtern. 2.2 Resultierende Forschungsfragen Aus den oben festgestellten Unterschieden zwischen den Darstellungen gehen einige relativ konkrete Fragen zu den Variationsfaktoren hervor, die die eingangs formulierten Problembereiche, die Wirkungsfrage, die Hierarchisierungsfrage und die Systemfrage, konkretisieren und ergänzen. Zunächst gibt der unterschiedliche Feinheitsgrad der postulierten Regeln Anlass zu fragen: Endungsvariation 54 - Wie wirksam sind die einzelnen Faktoren? a) Wo ist die Grenze zwischen invarianten und varianten Fällen zu ziehen? b) Entsprechen detailliertere Darstellungen wie die des Zweifelsfälle- Dudens, Szczepaniaks und Fehringers relevanten Unterschieden in den Korpusdaten oder sind vorsichtigere Modelle wie das der Duden-Grammatik adäquater? Weitere Spezialfragen resultieren vor allem aus der Betrachtung der detaillierteren Teile der Beiträge Szczepaniaks und Fehringers. Sie betreffen: - die Wirkungsrichtung eines einzelnen Faktors: c) Wie wirkt sich die Vokallänge auf die Markierungswahl aus? - den Stellenwert eines bei Szczepaniak und Fehringer neu eingeführten lautlichen Faktors: d) Wie stark ist der Faktor ‘konsonantische Stärke’ bzw. ‘Sonorität’ und welchen Stellenwert hat er in der Faktorenkonstellation? - das Problem der Einbettung eines qualitativ abseitigen Faktors, der Frequenz, in das System sprachimmanenter Faktoren im engeren Sinne: e) Welche Rolle kommt dem Faktor ‘Frequenz’ zu? Kann die Nomenfrequenz die Wirksamkeit sprachimmanenter Faktoren beeinflussen? Die Suche nach Antworten auf diese Fragen geht in dieser Untersuchung mit dem Versuch einher, möglichst viele der postulierten Faktoren auf ihre Wirkung hin zu überprüfen und die Faktoren untereinander zu gewichten. All dies soll dazu beitragen, die Markierungsvariation konsistent und adäquat darzustellen. Die vorliegende Teilstudie konzentriert sich dabei auf die in der bisherigen Forschung postulierten, sprachimmanenten Faktoren einschließlich des performanzbasierten Faktors ‘Frequenz’. Nicht behandelt werden also die qualitativ andersartigen außersprachlichen Variationsdimensionen wie Zeit, Raum oder Textsorte. 45 Nur hier und da angeschnitten schließlich wird auch ein ganzes Bündel an mutmaßlichen Faktoren, deren 45 Von diesen wird in der gesichteten Fachliteratur nur der Faktor ‘Zeit’ umfassender thematisiert, insbesondere von Szczepaniak (2010). Datenüberblick, Konzeption der Variationsfaktoren und Vorgehensweise 55 Postulierung naheliegend ist, aber bisher nicht konkretisiert wurde und zuweilen auch zurückgewiesen wird (Fehringer 2011, S. 98). Es handelt sich um - rhythmische und stilistische Parameter: f) Wie ist ihre Rolle einzuschätzen? Können hier greifbare Faktoren ermittelt und in eine ganzheitliche, systematische Darstellung der Endungsvariation integriert werden? Fragen wie die unter f) eingehend zu klären, kann hier aus Zeit- und Platzgründen nicht mehr angestrebt werden und bleibt eine spannende Aufgabe für die zukünftige Forschung. 2.3 Datenüberblick, Konzeption der Variationsfaktoren und Vorgehensweise Betrachtet man in unserem Material alle Vorkommen des Genitivnomens mit einer Endung (6.568.147 Token), überwiegt sehr deutlich 46 der Markierungstyp S. Er erscheint 2,8-mal häufiger als der Markierungstyp ES. Anders ausgedrückt: Die Token mit S machen ca. 73% aller Token mit einer Endung aus. Bei den Types fällt der S/ ES-Quotient mit 3,7 (ca. 79% S-Token) noch höher aus. Der Unterschied zwischen dem Token- und dem Type-Quotienten könnte darauf hinweisen, dass es bei den ES-Types einige gibt, die besonders häufig auftreten. Die Betrachtung der S- und ES-Types darf nicht mit der Betrachtung der Lexeme bzw. der automatisch ermittelten Lemmata 47 verwechselt werden. In unserem Material gibt es einerseits 329.539 Lemmata und andererseits 276.933 S-Types und 75.227 ES-Types, also insgesamt deutlich mehr Endungs-Types (352.160) als Lemmata. Das liegt daran, dass einem Teil der Lemmata beide Endungen zugeordnet werden können (so ist beim Lemma Landtag sowohl Landtags als auch Landtages belegt). Die Verteilung der Lemmata auf die Endungsgruppen ist Abbildung 10 zu entnehmen. In dieser wie auch in den anderen Abbildungen des gesamten Kapitels 2 ist Hellgrau dem Endungstyp S und Dunkelgrau dem Endungstyp ES zugeordnet (die Schraffur markiert die Übergangsbereiche). 46 Eine hoch signifikante Abweichung von der Gleichverteilung (50 : 50) gemäß Chi- Quadrat-Anpassungstest χ 2 = 1439842, df = 1, p < 0.001. 47 Das Ergebnis der Tagger-Lemmatisierung wurde evaluiert. Die Lemmata entsprechen fast immer den Nominativ-Singular-Formen der Lexeme. Endungsvariation 56 Abb. 10: Lemmata nach vorkommenden Endungen Nur zu 7% aller Lemmata gibt es sowohl eine Sals auch eine ES-Variante, aber dieser Gruppe gehören verhältnismäßig häufige Nomina an, wie es Abbildung 11 deutlich macht. Die Gruppe umfasst darin ca. 38% aller Token. Abb. 11: Token nach Lemmatyp Die im Durchschnitt seltensten Nomina sind interessanterweise in der Gruppe der ausschließlich auf ES beschränkten Lemmata versammelt. Hier erreicht der Quotient der Lemma-Token-Relation nämlich seinen höchsten Wert, wie aus Tabelle 3 ersichtlich wird. Datenüberblick, Konzeption der Variationsfaktoren und Vorgehensweise 57 Lemma nur mit S Lemma mit S und ES Lemma nur mit ES Gesamt Lemma/ Token- Quotient 0,070 0,009 0,118 0,050 Tab. 3: Lemma-Token-Relation nach Lemmatyp Bei den Token variierender Nomina (repräsentiert durch Lemmata, zu denen es sowohl eine Sals auch eine ES-Variante gibt) schwindet das Übergewicht von S, das im Gesamtmaterial zu beobachten war. Jetzt überwiegen sogar leicht die ES-Realisierungen, vgl. Tabelle 4. 48 mit S mit ES Gesamt Token variierender Nomina 1.187.194 1.301.746 2.488.940 Anteil 48% 52% 100% Tab. 4: Token variierender Nomina nach Endungstyp In den kommenden Kapiteln wird die relative Häufigkeit von ES bzw. der Anteil der ES-Token an der Gesamtheit der Token mit einer Endung (ES und S) vor allem dazu verwendet, um die Durchschlagskraft von Einflussfaktoren der Markierungsvariation einzuschätzen. Der Anteil der ES-Token kann aber auch dazu verwendet werden, um zwischen S und ES variierende Nomina lemmabezogen zu charakterisieren. So liegt das arithmetische Mittel aus Anteilen der ES-Token für einzelne Lemmata bei 45,6%. Der entsprechende Median liegt recht nahe, bei 50%, aber die Streuung der ES-Anteile für einzelne Lemmata ist mit einer Standardabweichung von 24,9 sehr beachtlich. Die Verteilung der Werte wird mit einem Histogramm in Abbildung 12 weiter unten illustriert. Aus dem Histogramm wird ersichtlich, dass sich ES-Anteile für einzelne Lemmata nicht normalverteilen. Dabei sind extreme Werte nicht besonders selten (z.B. 0,01% bei Konzern 49 oder 99,99% bei Kreuz 50 ). Außerdem gibt es deutlich mehr Lemmata mit einem niedrigen Anteil von ES-Token (etwa unter 25%) als mit einem hohen Anteil (etwa über 75%). 48 Eine hoch signifikante Abweichung von der Gleichverteilung (50 : 50) gemäß Chi- Quadrat- Anpassungstest χ 2 = 5272,188, df = 1, p < 0.001. 49 Sechs Belege für Konzernes. 50 Ein Beleg für [Pressesprecher des Deutschen Roten] Kreuzs. Endungsvariation 58 Abb. 12: Histogramm für Anteil der ES-Token pro Lemma So bringt die obige allgemeine und noch wenig differenzierte Charakterisierung der Genitivnomina mit Endungen bereits einige interessante Quantifizierungen zutage, die zur Hypothesenbildung bezüglich des performanzinduzierten Faktors ‘Frequenz’ (vgl. Kap. 2.4.3 und 2.5.8) anregen. Außerdem legt diese Datenübersicht nahe, dass es sehr viele Lexeme gibt, die extrem stark zu einem Endungstyp tendieren, d.h. invariant oder nahezu invariant sind. Die Gesamtkonstellation sei anhand des bekannten Verhaltens einiger relevanter Wortschatzbereiche illustriert: Während Personennamen oder in neuerer Zeit eingeführte Fremdwörter fast ausschließlich S zu sich nehmen, wählen einheimische Appellativa, die auf einen s-Laut enden, ES. Dazwischen liegen andere einheimische Appellativa, die wie die auf einen Nasal endenden Heim, Zahn oder Zwang stärker zwischen -s und -es variieren können. Der Bereich der variierenden Nomina ist so von der Domäne der S-Endung einerseits und der Domäne der ES-Endung andererseits flankiert. Im Folgenden wird es zunächst um die beiden (nahezu) invarianten Bereiche und ihre Abgrenzung zum varianten Bereich gehen. Die meisten Faktoren der Markierungsvariation werden dabei wie in der bisherigen Forschung als binäre Einflussgrößen mit einer positiven und einer negativen Ausprägung aufgefasst. Das heißt etwa, dass beim Faktor ‘Fremdwort’ die Ausprägungen Fremdwort und kein Fremdwort angesetzt werden, beim Faktor ‘Nomen auf einen s-Laut’ die Ausprägungen s-Auslaut und kein s-Auslaut und beim Faktor ‘Nomen auf einen Nasal’ die Ausprägungen Nasalauslaut und kein Nasalauslaut. Fak- Datenüberblick, Konzeption der Variationsfaktoren und Vorgehensweise 59 toren, deren positive Ausprägung eine Endung sehr stark favorisiert oder sogar alternativlos erzwingt, sind dabei als mit einer besonders starken Wirkung ausgestattet konzipiert. So wird im gesamten weiteren Verlauf von Kapitel 2 prinzipiell zwischen den sog. starken und den sog. schwachen Faktoren unterschieden, die sich zunächst dadurch definieren, dass die einen von der bisherigen Forschung für die Beschreibung der beiden (nahezu) invarianten Bereiche gebraucht werden und die anderen für die Beschreibung des varianten Bereichs. Die starken Faktoren, die einen Ausschlag zugunsten der S-Endung geben, sind lexikalischer, lautlicher, prosodischer und morphologischer Art. Besonders stark zugunsten der ES-Endung wirken wiederum spezielle lautliche Faktoren, aber auch der performanzbasierte Faktor Frequenz ist hier zu beachten. In der gesamten Faktorenkonstellation kommt lexikalischen Faktoren eine herausragende Rolle zu. Sie sollen deswegen an erster Stelle behandelt werden, wenn es in Kapitel 2.4 genauer um die Wirksamkeit starker Faktoren geht. Nach der Behandlung der einzelnen Gruppen starker Faktoren werden Nomina, die unter ihrem Einfluss stehen, nach und nach aus der Datenbasis ausgeschlossen, um zu verhindern, dass bei weiteren Datenanalysen stärkere Faktoren mit großer Reichweite die Wirkung schwächerer Faktoren verschleiern. Dies soll letztlich den Blick auf den Bereich der stärker variierenden Nomina freimachen und eine möglichst unverfälschte Analyse der dort wirksamen schwachen Faktoren ermöglichen. Die nach den Ausschlüssen verbleibenden, sog. varianten Nomina werden dann in Kapitel 2.5 genauer untersucht. Grundlegend für unsere Untersuchung wird die Tokenperspektive, d.h. die lemmaunabhängige Betrachtung der Genitivtoken, nicht zuletzt dadurch, dass die in der Forschung postulierten Einflussfaktoren der Markierungsvariation prinzipiell lexemunabhängig konzipiert sind (vgl. Kap. 2.1). Dies trifft in besonderer Weise auf die starken Faktoren zu, deren Ausprägungen tendenziell zur Ausnahmslosigkeit einer Endung führen sollen, bei denen es also vom Ansatz her keine relevanten lexemspezifischen Abweichungen von dieser Ausnahmslosigkeit geben dürfte. Bei den schwachen Faktoren wird dagegen von Schwankungen im Endungsverhalten einzelner Lexeme geradezu ausgegangen. 51 Aus der Tokenperspektive fallen in diesem Fall häufige 51 Vgl. zum einen die Beispiele am Ende von Kapitel 1.2 und zum anderen die im vorliegenden Kapitel berechnete Standardabweichung von 24,9 beim prozentuellen ES-Anteil für einzelne Lexeme. Endungsvariation 60 Lexeme stärker ins Gewicht, weil sie etwa bei der Berechnung der relativen Häufigkeit einer Endung für die Gesamtheit der unter Einfluss eines bestimmten Faktors stehenden Lexeme mit mehr Token beteiligt sind als seltene Lexeme. Die etwa von Szczepaniak (2010) benutzte Lexemperspektive ist hier keine richtige Alternative. Bei aus dieser Perspektive berechneten Mittelwerten aus relativen Häufigkeiten einer Endung für einzelne Lexeme werden zwar alle Lexeme gleich gewichtet, aber auch dies führt zu spezifischen Effekten: Bei Hapaxlegomena und u.U. auch anderen besonders seltenen Lexemen zeigen sich extreme relative Häufigkeiten für eine Endung, die durchaus zufällig sein können, die aber den Mittelwert genauso stark beeinflussen wie die weit zuverlässigeren relativen Häufigkeiten bei den häufigeren Lexemen. Da es in unserem Material nicht wenige extrem seltene Lexeme gibt, schränkt dies bereits den Wert der Mittelwertbetrachtungen bei einzelnen schwachen Faktoren ein. Es gibt aber einen noch gewichtigeren Grund, warum wir im Folgenden die Lexemperspektive nur punktuell heranziehen. Wie in Kapitel 2.5.5 illustriert wird, sind die relativen Häufigkeiten der Endungen für einzelne Lemmata bei schwachen Faktoren nicht normalverteilt und ihre Schwankungen ähnlich stark wie bei variierenden Nomina insgesamt (vgl. weiter oben, insbesondere Abb. 12). Beides führt dazu, dass Mittelwertunterschieden zwischen Nomina mit unterschiedlichen Faktorenausprägungen (z.B. kurzer Vokal in geschlossener letzter Silbe vs. kein kurzer Vokal in geschlossener letzter Silbe) nur selten Signifikanz attestiert werden kann. Dieses Problem existiert nicht bei der Tokenperspektive, da hier bei den gegebenen, hohen Tokenzahlen auch kleinere Unterschiede zwischen relativen Häufigkeiten signifikant sind. Die Tokenperspektive erlaubt somit eine eingehendere Untersuchung der schwachen Faktoren, wenn auf statistische Absicherung Wert gelegt wird. Die Unterschiede zwischen der Lexemperspektive und der Tokenperspektive haben auch weitere Implikationen, die hier zumindest angesprochen werden müssen. Die Relevanz der Faktoren wäre aus beiden Perspektiven genauso gut feststellbar, wenn die lexemunabhängig konzipierten Faktoren tatsächlich bei allen einschlägigen Lexemen die gleiche oder eine ähnliche Wirkung gehabt hätten. Dies ist aber offensichtlich nicht der Fall. Es mag hauptsächlich daran liegen, dass Kombinationen verschiedener Faktoren (z.B. ‘kurzer Vokal in geschlossener letzter Silbe’ und ‘Wortausgang auf Konsonantengruppe’) bei der Starke Faktoren und „invariante“ Nomina 61 Endungswahl besondere Interaktionen hervorbringen, oder auch daran, dass eine bisher kaum in Erwägung gezogene Bedingung das ganze Gefüge der anerkannten Faktoren durcheinander bringt. Zumindest solange wir dies nicht endgültig geklärt haben, bleibt die Lexemperspektive wegen großer Schwankungen der relativen Häufigkeiten für einzelne Lemmata heuristisch weniger ergiebig als die Tokenperspektive. Und schließlich ist es denkbar, dass eben eine verhältnismäßig hohe Tokenanzahl, die sich einer bestimmten Art der Genitivbildung in einem spezifischen lautlichen, prosodischen oder morphologischen Umfeld zuordnen lässt, in besonderer Weise auf die Sprachbenutzer einwirkt und deren weiteres Sprachverhalten beeinflusst. Diejenige Bedingung, die für die lexemabhängigen Schwankungen in der Faktorenwirkung verantwortlich ist, wird von Fehringer (2011) in der Frequenz vermutet (vgl. Kap. 2.1). So schließen wir bei der Tokenperspektive die extrem häufigen Lexeme teilweise aus, um die ansonsten geltenden Präferenzen ungehindert zum Vorschein kommen zu lassen. Die Frequenz wird im Folgenden auch selbst als Faktor der Endungsvariation analysiert, und zwar in den Kapiteln 2.4.3 und 2.5.8. Die Lexemperspektive bleibt selten und beschränkt sich auf eine mehr oder weniger illustrative Verwendung. 2.4 Starke Faktoren und „invariante“ Nomina 2.4.1 Lexikalische Faktoren Mit lexikalischen Faktoren ist die Zugehörigkeit der Nomina zu speziellen Wortklassen gemeint wie Fremdwort, Eigenname (Personenname, geografischer Name etc.), Abkürzung oder Konversion. Diese markierten Wortklassen 52 erscheinen insgesamt heterogen, haben aber eines gemeinsam: Sie sind nur partiell in das Flexionssystem integriert, das von einheimischen Appellativa konstituiert wird. Daher wollen wir einerseits vom „Sonderwortschatz“ und andererseits vom „Grundwortschatz“ 53 sprechen. Die Grenze zwischen den beiden Bereichen ist 52 Vgl. Eisenberg (2001, S. 196). 53 In Anlehnung an die Bezeichnung „Grundwortschatz“ in der Duden-Grammatik (2009, S. 196ff.). Unsere Zweiteilung des Wortschatzes ist auch im Zusammenhang mit der im flexionsmorphologischen Kontext üblichen Unterteilung in Kern(-Wortschatz) und Peripherie (vgl. Eisenberg 2001) bzw. weiter gehend in Kern, System und Peripherie (Köpcke 1982, S. 43f.) zu sehen. Wegener (2003, S. 145f.) ordnet dem Endungsvariation 62 nicht als eine klare Zäsur zu denken. Sie stellt vielmehr einen abgestuften Übergang dar, bei dem einzelne Lexeme des Sonderwortschatzes in Bewegung geraten und mit der Zeit sich dem Grundwortschatz anpassen (vgl. Kap. 3.3.2.6 für eine exemplarische Studie des Flexionsverhaltens von Iran und Irak) oder teilweise sogar zu diesem hinüberwechseln können (so geschehen bei ehemaligen Fremdwörtern wie Dom, Tempel, Fenster). So kann auch von unterschiedlichen Integrationsstufen des Sonderwortschatzes in das (durch native Appellativa geprägte) Flexionssystem des Grundwortschatzes gesprochen werden. Die Wirkungskraft lexikalischer Faktoren wird deutlich, wenn man sie anhand eines Beispiels mit der Wirkungskraft lautlicher Faktoren vergleicht. So führt bei Nomina des Grundwortschatzes der Auslaut auf einen sch-Laut überwiegend und der auf einen s-Laut ausnahmslos zu ES (vgl. Kap. 2.4.2 unten). Aber die meisten Nomina des Sonderwortschatzes sperren sich gegen ES. Die Wirkung der beiden genannten lautlichen Faktoren kann bei ihnen neutralisiert werden, und zwar indem die Endung unterbleibt (vgl. des Hauses vs. des House - Letzteres als Musikstil) oder indem nach einem sch-Laut die Endung -s erscheint (vgl. (fast ausschließlich) des Matsches vs. (oft) des Matchs). Nomina des Sonderwortschatzes tendieren also stark zu S bzw. zur Endungslosigkeit. Dies ist bereits vielfach beobachtet worden, Gallmann (1996, S. 287f.) etwa ordnet die Endungslosigkeit vor allem „den peripheren Bereichen des Wortschatzes“ zu (vgl. auch Tab. 1 in Kap. 1.3, Faktor 19-27). Abbildung 13 zeigt, wie sich Token der von uns untersuchten Sonderwortschatzbereiche (vgl. auch Kap. 1.4.3) in den Daten auf ES, S und die Nullendung verteilen (zu genaueren quantitativen Angaben vgl. Tab. 2 im Anhang). Die Nullendung muss an dieser Stelle zum Vergleich herangezogen werden, weil sie beim Sonderwortschatz eine sehr wichtige Rolle spielt. Genau untersucht wird sie aber erst in Kapitel 3. peripheren Bereich verschiedene Klassen „spezieller Nomen“ aus der Perspektive der Pluralbildung zu. Starke Faktoren und „invariante“ Nomina 63 Abb. 13: Genitivvarianten in verschiedenen Sondergruppen (Prozentangaben betreffen den Anteil der ES-Token) Mit Sondergruppen sind hier Nomina gemeint, die den jeweiligen Sonderwortschatzbereichen zugeordnet wurden. 54 Der Endungstyp ES spielt offensichtlich keine Rolle bei den Sondergruppen Konversionen, Neologismen, Fremdwörter und Abkürzungen und ist immer noch randständig bei Eigennamen, aber bei Stilbezeichnungen und Zeitausdrücken nähert sich seine relative Häufigkeit schon dem Wert für die Gesamtheit der Genitivnomina (‘alle Nomina’) an. Die Sondergruppen der Stilbezeichnungen (einschließlich Epochenbezeichnungen, z.B. Barock, Bauhaus, Punk) und Zeitausdrücke (z.B. April, Mittwoch, Vormittag) erscheinen aus dieser Perspektive als am stärksten ins Nomensystem integriert. Der Endungstyp S ist die häufigste Variante in allen untersuchten Sondergruppen mit Ausnahme von Abkürzungen und Stilbezeichnungen, wo er von der Nullendung in den Hintergrund gedrängt wird. Somit hat sich die Wirksamkeit der Faktoren 19-24 und 26-27 aus Tabelle 1 (Kap. 1.3) eindrucksvoll bestätigt. Gehören Lexeme den Sonderwortschatzbereichen Konversion, Neologismus, Fremdwort, Abkürzung oder Eigenname an, hat man es offensichtlich mit Faktoren zu tun, welche die Endung ES weitgehend verhindern: Der Anteil der ES-Fälle liegt in unserem Material bei den Nomina aller zuletzt genannten Sondergruppen unter 2%. Da lexikalische Faktoren jene lautlicher, prosodischer, morphologischer und performanzbasierter Natur dominieren können, erscheint es also als zweckmäßig, die Sondergruppen Konversionen, Neologismen, Fremdwörter, Abkürzungen und Eigennamen von der weiteren Betrachtung 54 Zum Zuordnungsverfahren vgl. Kapitel 1.4.3. Endungsvariation 64 der Variation zwischen ES und S auszuschließen, um die Wirkung anderer Faktoren nicht zu verschleiern. Nicht ausgeschlossen werden sollen allerdings die Gruppen Stilbezeichnungen und Zeitausdrücke, denn die Verteilung ESvs. S-Token ist in diesen Sondergruppen nicht mehr so weit von der entsprechenden Verteilung bei Nomina entfernt, die nach Ausschluss aller Sondergruppen verbleiben (in Abb.: ‘Nomina ohne Sondergruppen’). Nicht verschwiegen werden dürfen gewisse Opfer, die die Ausschlüsse von nicht gänzlich homogenen Sondergruppen mit sich bringen. So werden etwa mit Fremdwörtern auch einige der Mehrsilber fremden Ursprungs ausgeschlossen, die auf eine betonte geschlossene Silbe ausgehen und bei einem s-Auslaut nur ES zu sich nehmen (z.B. Kongresses, Kompromisses) und sonst zwischen -s und -es variieren (z.B. Programm(e)s, Projekt(e)s, Infarkt(e)s). Hierbei handelt sich meist um Lehnwörter, die bereits vor längerer Zeit entlehnt wurden und sich dank der Akzentplatzierung flexionsmorphologisch gut integrierten. Da der Ausschluss der Fremdwörter weitgehend automatisch vonstattenging und große Datenmengen umfasste (vgl. Kap. 1.4.3), erschien es unverhältnismäßig aufwendig, ihn an dieser Stelle manuell zu korrigieren. Nicht vergessen werden darf schließlich, dass sich der Bestand der Nomina relevanter Sonderwortschatzbereiche mithilfe der Taggerannotierung und der verwendeten Listen einschlägiger Nomina bei Weitem nicht vollständig erfassen lässt. Der stark zu S neigende Sonderwortschatz kann aus weiteren Analysen folglich nicht gänzlich ausgeschlossen werden, doch lässt sich sein Anteil in unserem Material deutlich senken, 55 was der Sichtbarkeit nicht-lexikalischer Faktoren nur zugutekommen kann. Im entsprechend reduzierten Material verbleiben 4.585.236 Token mit einer Endung, deren S/ ES-Quotient nur noch 1,7 beträgt. Der Anteil der ES-Formen an allen Formen mit einer Endung wächst somit von 27% (vgl. Kap. 2.3) auf 37% an. 2.4.2 Lautliche, prosodische und morphologische Faktoren Im von den Sondergruppen Konversionen, Neologismen, Fremdwörter, Abkürzungen und Eigennamen bereinigten Material (4.585.236 Token) sollen zunächst weitere Faktoren untersucht werden, die die 55 Von ca. 46,0% (95%-Konfidenzintervall: 41,2% und 50,9,0%) auf ca. 14,5% (95%-Konfidenzintervall: 11,3% bis 18,3%) - gemäß einer Stichprobenprüfung und bei einer „manuellen“ Zuweisung des Sonderwortschatz-Status. Starke Faktoren und „invariante“ Nomina 65 Endung ES verhindern können (vgl. Faktor 1, 8, 9 in Tab. 1 aus Kap. 1.3). Danach wird auf starke ES-fördernde Faktoren eingegangen. Laut Spezialliteratur (genauer in Kap. 2.1) neigen die Nomina sehr stark zu -s, wenn sie 1) auf eine (unbetonte) Silbe mit dem Reim -el, -em, -en, -end, -er oder 2) auf -chen, -lein, -ig und evtl. auch 56 -ich, -icht, -ing, -ling, -mal, -sal, -sam, -tum enden sowie wenn sie 3) auf einen (Voll-)Vokal ausgehen. Die Durchschlagskraft dieser Faktoren ist in unseren Korpora im Detail betrachtet unterschiedlich: Während nach Schwa-Silben (Fall 1) die -es-Endung nahezu ausgeschlossen bleibt, 57 kommt sie in den beiden übrigen Fällen doch sporadisch vor. Der Fall 2 ist komplex: Die Diminutivsuffixe -chen 58 und -lein lassen in unserem Material tatsächlich kein -es zu. Die anderen Suffixe (-ling, -mal, -sal, -sam, -tum) begegnen auch mit -es, vor allem -mal (Denkmales, Mahnmales, vereinzelt auch Schmetterlinges, Eigentumes, Schicksales, Unterbringungsgewahrsames), - aber selbst nach -mal liegt der Anteil der -es-Token nur bei 2% (bei insgesamt 4509 mal-Token). Die noch übrig gebliebenen Wortausgänge, -ig, -ich und -ing, werden in der Spezialliteratur meist nicht weiter spezifiziert, obwohl dies - da sie zumindest synchron gesehen bei Nomina nicht als (produktive) Suffixe gelten können - durchaus notwendig gewesen wäre: Zum einen führen die Wortausgänge -eig, -eich, die angesichts der üblichen graphemischen Darstellung erst einmal inbegriffen erscheinen, zu Nomina, die -es präferieren bzw. die stark variieren (z.B. Teich(e)s, Bereich(e)s, Erdreich(e)s); nicht klar ausgeschlossen sind zum anderen auch Einsilber im Allgemeinen sowie die auf ihnen aufbauenden komplexen Wörter, obwohl beide Gruppen prominente Gegenbelege zum -es-Ausschluss liefern (z.B. Striches, Dinges, Ringes, Einzeldinges, Drogenringes). Gemeint sind hier also in Wirklichkeit - ähnlich wie schon in Fall 1 - nur Silbenreime unbetonter Silben wie in König, Rettich, Fasching. Mit dieser neuen Spe- 56 Hierauf folgende Wortausgänge finden sich nicht in allen für die Tabelle 1 konsultierten Quellen. 57 Zu den extrem seltenen Ausnahmen gehören z.B. Sommerabendes und Gestotteres (vereinzelte Belege). 58 Gleichzeitig zu Fall 1 gehörig. Endungsvariation 66 zifikation sind Abweichungen vom -es-Ausschluss bei -ig, -ich und -ing tatsächlich sehr selten zu finden, und zwar nur bei den Lemmata König und Teppich (bzw. den entsprechenden Komposita, z.B. Landköniges oder Flickenteppiches). Fall 1 und 2 zusammenfassend lässt sich feststellen, dass Nomina auf eine (im Deutschen unbetonbare) Schwa-Silbe und auf -lein die silbische Endung -es im Prinzip nicht zulassen, während Nomina mit einem Suffix (oder einem suffixähnlichen Element), das einen betonbaren Vokal enthält, die silbische Endung an sich erlauben, was aber extrem selten genutzt wird. Dies entspricht einerseits den Erkenntnissen der bisherigen Forschung über die Verbindbarkeit von Derivationssuffixen und Flexionsendungen 59 und klingt andererseits nach einer starken Präferenz für die Endung -s, wenn die letzte Silbe des Nomens nicht betont ist. An dieser Präferenz kann offensichtlich auch die prinzipielle Betonbarkeit der Silbe wenig ändern. Der Fall 3 ist ebenfalls differenziert zu betrachten: Unter Ausschluss der Diphthonge begegnet -es nach Vokalen in unserem Material insgesamt gesehen bei 0,7% Token (aus 11.942), und zwar nur dann, wenn die Lemmata auf einen Vollvokal und (geschrieben) -h enden (Schuhes oder Rindviehes) - bei diesen ist -es allerdings bei 11 aus 87 Token mit Markierung zu finden. Nicht nachprüfbar ist an dieser Stelle, ob bei Lexemen, die mit -ee bzw. -ie geschrieben werden und in unserem Material nur -s zu sich nehmen (Sees, Knies), nicht zuweilen auch die Endung -es intendiert ist. 60 Nach Diphthongen sieht es generell anders aus: Hier begegnet -es schon bei 10,6% Token (aus 28.020, z.B. Baues, Eies, Heues). Die extreme Bevorzugung von -s nach Vokalen kann in erheblichem Maße auf die graphotaktische Vermeidung des Hiats (Schnee-es*) zurückgehen. Das Vorhandensein des potenziell silbeninitialen h 61 schafft in der geschrieben Sprache offensichtlich Abhilfe (Rehes). Ähnlich scheint der nicht silbische, zweite Vokal (Halbvokal/ Gleitlaut) des Diphthongs zu wirken, der die Koda der Stammsilbe bildet (Heu-es). Die silbische Endung -es ist also offensichtlich nur mit der Stütze eines (u.U. nur schriftlichen) „Hiattrenners“ möglich. Alles in allem ist festzuhalten, dass Nomina des Sonderwortschatzes und einheimische Nomina auf ein Suffix, eine unbetonte Silbe mit dem Reim -el, -em, -en, -end, -er, -ich, -ig, -ing sowie auf einen Vokal in unserem 59 Zur entsprechenden Generalisierung vgl. Eisenberg (1991, S. 55). 60 Vgl. Hinweise in der Duden-Grammatik (2009, S. 199). 61 Duden (2009, S. 75f.). Starke Faktoren und „invariante“ Nomina 67 Material eine große Gruppe von Nomina bilden, die - sofern sie im Genitiv mit einer Endung erscheinen - weit überwiegend -s zu sich nehmen. Diese (tendenziell) invarianten Nomina sollen ausgeschlossen werden, wenn es in Kapitel 2.6 um die Betrachtung derjenigen Faktoren geht, die den Bereich der prinzipiell varianten Nomina strukturieren. Prinzipiell variante Nomina werden von der anderen Seite von Nomina flankiert, die als Endung (fast) ausschließlich ES aufweisen. In der Literatur werden hier lautliche Voraussetzungen genannt, die durch Aussprachemodalitäten bedingt zu sein scheinen: vor allem der Auslaut auf einen s-Laut, daneben der Auslaut auf einen sch-Laut oder der Wortausgang auf die st-Gruppe (vgl. Faktor 2-4 in Tab. 1 aus Kap. 1.3). Beim Sonderwortschatz, wie z.B. Eigennamen, kann die Wirkung dieser Faktoren neutralisiert werden (z.B. Heiligenkreuzs Sportlicher Leiter, vgl. Kap. 2.3.1). In unserem Material mit reduziertem Sonderwortschatzanteil bilden den einen Pol Nomina auf einen s-Laut (phonologisch / s, ts/ , graphematisch <s, ß, x, z>) mit 97,3 % ES-Formen: Hier sind gemischt flektierende Nomina wie Herzens und Felsens (evtl. Felsens) die einzigen, die eine andere Endung als -es aufweisen. Schließt man solche Nomina als nicht einschlägig aus, weil zwischen den zum Wortstamm gehörenden s-Laut und das -s der für Nichtnominative schwach flektierender Nomina charakteristische Marker en tritt, greift der Faktor ohne Ausnahme. Am anderen Pol stehen Nomina auf einen sch-Laut (/ ʃ/ ), bei denen nahezu 20% (aus 1.229 Token) der sehr oft zusammengesetzten Lexeme zwischen den beiden Endungstypen variieren wie Tausch oder Frosch. Gleichwohl ist der Faktor ‘Nomen auf sch- Laut’ wegen des deutlichen Übergewichts der es-Token - 78,8% (aus 13.003 Token) - immer noch als relativ stark einzuschätzen. Zwischen den Nomina auf einen s-Laut und den Nomina auf einen sch-Laut stehen Nomina mit dem Wortausgang auf die st-Gruppe (<st> und <zt>) mit 86,4% es-Formen (aus 74.331 Token, zur Übersicht siehe Abb. 14 in Kap. 2.4.4). Dass Grundwortschatz-Nomina auf einen s-Laut die Endung -s ausschließen, ist durch eine phonotaktische Beschränkung des Standarddeutschen bedingt, die die silbeninterne Doppelkonsonanz verbietet (vgl. Zifonun et al. 1997, Bd. 1, S. 163). Die Endung -s wäre in so einem Fall phonetisch mit dem s-Auslaut des Nomens verschmolzen, und der Genitiv wäre unmarkiert geblieben (vgl. auch Gallmann 1996, S. 286f.). Der graphotaktische Ausweg, auf die „Geminatenver- Endungsvariation 68 einfachung“ mit einem Apostroph hinzuweisen, wie er bei Eigennamen üblich ist (Brahms' [Deutsches Requiem]), kann bei Grundwortschatz-Nomina nicht zum Zuge kommen. Sucht man nach Regularitäten, die für alle in diesem Kapitel untersuchten Nomengruppen gelten, so fällt auf, dass ES-Endungen in denjenigen Gruppen möglich sind, in denen sie zu Wortformen führen können, die auf einen Trochäus enden, d.h. bei Nomina mit einen betonbaren Derivationssuffix (vgl. Eigentumes mit Nebenakzent auf dem Suffix), Nomina auf einen Vollvokal/ Diphthong (vgl. Schuhes, Baues), Nomina auf einen s-Laut (vgl. Hauses), Nomina auf einen sch-Laut (vgl. Tausches) und Nomina auf die st-Gruppe (vgl. Mastes). Bei Nomina auf eine unbetonbare Silbe (Schwa-Silbe), bei der -es nicht zu einer auf Trochäus ausgehenden Wortform führen kann, tritt diese Endung im Prinzip auch nicht auf. Bei solchen Nomina ist es interessanterweise die Endung -s, die sehr häufig zu einer Wortform führt, die auf einen Trochäus endet (z.B. Segels, Lehrers, Abends oder mit Nebenakzent Hauptschullehrers, Wassereimers). Die geschilderte Konstellation passt gut zu der Auffassung, dass der Trochäus die „kanonische Struktur“ in der Flexion des Nomens darstellt (Eisenberg 1991, vgl. Wegener 2003 zur Bedeutung des Trochäus in der Pluralbildung und Kürschner 2009 zum Vergleich mit dem Niederländischen). Diejenigen Nomina, für welche die positiven Ausprägungen der im vorliegenden Kapitel behandelten starken Faktoren zutreffen, werden aus der Datenbasis ausgeschlossen, um in Kapitel 2.5 variante Nomina bzw. schwache Faktoren effizient untersuchen zu können. Hierbei erscheint eine zusätzliche Einschränkung auf die in CELEX verzeichneten Lemmata notwendig, weil die in CELEX abrufbaren lautlichen, prosodischen und morphologischen Informationen 62 einerseits das Auffinden der auszuschließenden Nomina extrem vereinfachen und andererseits dringend für die weiteren Untersuchungen in Kapitel 2.5 gebraucht werden. 2.4.3 Frequenz als starker Faktor In der wie beschrieben reduzierten Datenbasis (2.067.004 Token, 37.109 Lemmata) gibt es aber immer noch einige wenige Lexeme, die die allgemeine relative Häufigkeit der Endungen über Gebühr be- 62 Vgl. Tabelle 2 in Kapitel 1.4.2. Starke Faktoren und „invariante“ Nomina 69 einflussen: Die fünf häufigsten Nomina 63 Jahr (Häufigkeitsklasse 5), Tag, Land, Kind, Mann (alle Häufigkeitsklasse 7) zeigen die Endung -es in 99,5% der Fälle, und auf diese fünf Nomina entfallen bereits 16% (333.021 Token) aller jetzt in der Datenbasis verbliebenen Token. 64 Es erscheint daher für diese Phase der Untersuchung als sinnvoll, einen starken performanzbasierten Faktor ‘hohe Lexemfrequenz’ anzunehmen, der bei positiver Ausprägung zugunsten von ES wirkt, eine beträchtliche Reichweite aufweist und einen zusätzlichen Ausschluss hochfrequenter Lexeme aus den Analysen zu prinzipiell varianten Nomina rechtfertigt. Wie aber kann man ‘hohe Lexemfrequenz’ für unsere Zwecke operationalisieren? Zöge man den schwächsten der weiter oben vorgestellten starken ES-Faktoren, d.h. den Auslaut auf einen sch-Laut mit knapp 80% es-Endungen, als Richtwert zur Bestimmung eines Schwellenwertes heran, so könnte man ‘hohe Lexemfrequenz’ etwa als Zugehörigkeit zu den Häufigkeitsklassen 5 bis 8 definieren, denn für die so herausgeschälte Gruppe von 41 Lemmata liegt der allgemeine Anteil der es-Token an allen Token mit einer Endung 65 bei 86% 66 (vgl. Tab. 3 im Anhang). Eine solche Entscheidung wäre aber problematisch, weil das deutliche Übergewicht der es-Endung bereits in Häufigkeitsklasse 8, zu der z.B. Spiel, Teil, Erfolg gehören, einen Einbruch erfährt (siehe Abb. 14 weiter unten). Daher sollen für die Zwecke der Untersuchung varianter Nomina (Kap. 2.5) nur Lemmata der Häufigkeitsklassen 5 und 7 (im Weiteren oft abgekürzt: „HK < 8“) aus den Daten ausgeschlossen werden. 67 63 D.h. die fünf Lemmata aus der Genitivdatenbank, die am häufigsten im DeReKo erscheinen. 64 Der Anteil der Token mit ES an allen Nomina mit einer Endung liegt mit diesen Lexemen bei 50%, ohne sie nur noch bei 41%. 65 Die Gruppe umfasst 420.008 Token. 66 72% in Häufigkeitsklasse 5-9. 67 Über der Zahl „29“ sind in Abbildung 14 relative Häufigkeiten für Lemmata illustriert, die keine ermittelbare Entsprechung in der DeReWo-Grundformliste hatten. Endungsvariation 70 Abb. 14: Anteil der ES-Token in verschiedenen Häufigkeitsklassen (je niedriger die Häufigkeitsklasse, desto häufiger das Nomen) Interessanterweise wird kein spiegelbildlicher Effekt zugunsten von S bei ganz seltenen Lemmata registriert, zumindest solange man die Daten im großen Ganzen betrachtet. 68 Auf eine genaue Darstellung der Sicht aus der Lexemperspektive wird hier verzichtet (vgl. Kap. 2.3), zumal die Betrachtung der Mittelwerte der prozentuellen es-Anteile für einzelne einer Häufigkeitsklasse zugehörige Lemmata ein sehr ähnliches Gesamtbild ergibt. Es sei aber erwähnt, dass die Standardabweichung der Mittelwerte über Häufigkeitsklassen 8-25 69 hinweg konstant sehr hoch bleibt (sie bewegt sich zwischen 31,3 und 43,0). Die Lexemfrequenz erscheint an dieser Stelle also als ein Faktor, der nur im Falle von extrem hohen Werten wirksam ist und dann die Präferenz von -es fördert. 70 Wohlgemerkt, die Lexeme Jahr, Tag, Land, Kind, Mann, deren Einfluss auf die relativen Häufigkeiten der Endungen in den Gesamtdaten so groß ist, sind Erbwörter, Einsilber und weisen 68 Zu einer speziellen Betrachtung der Einsilber vgl. Kapitel 2.5.8. 69 Der Häufigkeitsklasse 26 gehört in der wie beschrieben reduzierten Datenbasis nur noch ein Lemma an: Indifferenzpunkt (6 Token), das nicht als Fremdwort erkannt wurde. 70 Somit wirkt dieser Faktor anders als der Faktor ‘Frequenz’ bei Fehringer (2011), vgl. Kapitel 2.1. Starke Faktoren und „invariante“ Nomina 71 außerdem verschiedene lautliche Eigenschaften auf, die als schwache Faktoren der Endungsvariation gelten. Somit sind Erklärungen, welche die Endungswahl bei den fünf Lexemen eher auf solche Einflüsse als auf die Frequenz zurückführen, noch nicht vom Tisch. In Kapitel 2.5.8 wird die Interaktion der Lexemfrequenz mit dem schwachen Faktor ‘Silbenanzahl’ untersucht und gegen die anderen schwachen Faktoren abgewogen. Die dortige Analyse wird durch die hier eingeführte, erst einmal praktischen Gründen geschuldete Annahme einer sich aufs Datenganze stark auswirkenden binären Variable ‘(hohe) Lexemfrequenz’ (im Weiteren ‘Frequenz HK < 8’) nicht berührt. 2.4.4 Wirkung starker Faktoren im Vergleich Um die Wirkung einzelner Faktoren einzuschätzen, benutzen wir im Folgenden je nach Bedarf drei Methoden. Sie leisten Unterschiedliches: Die erste ist die einfache, bereits oben verwendete und für den Leser voraussetzungslose Berechnung des Anteils der ES-Token an der Gesamtheit der Token mit einer Endung (ES und S), d.h. die in Prozent angegebene Wahrscheinlichkeit des Auftretens bzw. relative Häufigkeit von ES unter einer bestimmten Bedingung (vgl. Abb. 15 unten). Sie zeigt die Durchschlagskraft einer Faktorausprägung an, und bezieht sich nur auf denjenigen Datenbereich, auf den diese Ausprägung auch tatsächlich anwendbar ist. Das heißt z.B., dass beim Faktor ‘Auslaut auf einen s-Laut’ nur diejenigen Lemmata in Betracht gezogen werden, die auf einen s-Laut enden. Welchen Anteil sie an der Gesamtheit aller Genitivnomina haben, ist dann ohne Bedeutung. Die zweite Methode ist mit der ersten verwandt und in der Korpuslinguistik bestens etabliert: Die Berechnung der logarithmierten (hier: log 10 ) Odds Ratio 71 ermöglicht nicht nur die Vergleichbarkeit von Effektstärken verschiedener Faktoren, sondern macht auch die Richtung eines Effekts auf Anhieb erkennbar (vgl. Abb. 16 unten). Die dritte Methode, die Wirkung eines Faktors zu quantifizieren, ist die aus der Statistik bekannte Berechnung von Cramérs V bzw. die in unserem Fall - bei 71 Die Odds Ratio (auch Quotenverhältnis genannt) gibt an, wie viel Mal wahrscheinlicher eine Konstruktion beim Vorliegen einer Bedingung ist als beim Unterbleiben dieser Bedingung. Die Unabhängigkeit von der Bedingung führt zu Odds Ratio = 1. Durch das Logarithmieren (log 10 1 = 0) resultiert der positive bzw. negative Einfluss der Bedingung in entsprechenden positiven bzw. negativen Werten, die miteinander vergleichbar sind (vgl. Grieß 2008, S. 179). Endungsvariation 72 2x2-Kontingenztafeln - ergebnisidentische Berechnung des Korrelationskoeffizienten Phi. 72 Phi liefert zwar keine Informationen zur Effektrichtung, dafür aber standardisierte Werte zwischen 0 und 1 (vgl. Abb. 17 weiter unten), die gut interpretierbar sind. Die Chi-Quadrat-basierte Berechnung des Koeffizienten lässt sich auch praktisch mit einer Signifikanzprüfung verbinden. Die wichtigsten Ergebnisse der Berechnungen zur Auftretenswahrscheinlichkeit von ES, zur logarithmierten Odds Ratio und zum Korrelationskoeffizient Phi werden im Laufe des Kapitels 2 berichtet. Zusätzlich werden die zugrunde liegenden quantitativen Daten in Tabellen im Anhang zusammengestellt. Die logarithmierte Odds Ratio und der Korrelationskoeffizient Phi berücksichtigen über unsere erste Methode hinaus die „Reichweite“ eines Faktors: Sie zeigen mit an, wie sehr der Faktor die Gesamtheit der untersuchten Token beeinflusst, denn die Verhältnisse in demjenigen Teil der Daten, in dem die positive Faktorausprägung nicht vorliegt, werden mit einkalkuliert. Das heißt z.B., dass beim Faktor ‘Auslaut auf einen s-Laut’ für die Effektstärkeberechnung auch Lemmata herangezogen werden, die nicht auf einen s-Laut enden. Jedes der drei Maße hat seine Eigenheiten, ein übergreifender Zusammenhang kann dennoch festgehalten werden: Bei zwei Faktoren mit einem ähnlichen Anteil der ES-Endung an der Gesamtheit der Endungen (ähnlicher Durchschlagskraft der positiven Ausprägung) hat derjenige eine größere positive/ negative logarithmierte Odds Ratio und auch einen größeren Phi-Koeffizienten, dessen positive Ausprägung für einen größeren Teil der Daten zutrifft. Besonders gut lassen sich die Unterschiede in der Reichweite von Faktoren an den Werten des Phi-Koeffizienten ablesen. Alle Ergebnisse in Abbildung 15 beziehen sich auf unser Material unter Ausschluss der in Kapitel 2.4.1 bestimmten Sondergruppen 73 - mit einer Ausnahme, eben des Ergebnisses für die besagten Sondergruppen, das hier zum Vergleich mit abgebildet wurde und dessen Säule schraffiert erscheint. Die beiden anderen schraffierten bzw. gepunkteten Säulen können als Bezugspunkte für die Bestimmung der Wirkungsrichtung und die Bewertung der Durchschlagskraft von Faktoren dienen: Mit ‘variante Nomina’ sind Fälle gemeint, in denen die positiven Ausprägungen der starken Faktoren nicht vorliegen - d.h. diejenigen 1.733.983 Token, deren Lemmata weder auf Suffix -chen, -lein ausgehen, noch auf 72 Phi ergibt sich aus der Wurzel des Quotienten aus χ 2 und der Stichprobengröße. 73 Nicht ausgeschlossen sind also Stilbezeichnungen und Zeitausdrücke. Starke Faktoren und „invariante“ Nomina 73 eine Schwa-Silbe enden, noch einen s-Auslaut aufweisen etc. und die in Kapitel 2.5 der Untersuchung schwacher Faktoren zugrunde liegen. ‘Nomina ohne Sondergruppen’ (4.585.236 Token) schließen sowohl Nomina, bei denen die starken Faktoren (mit Ausnahme der Sondergruppen) vorliegen, als auch ‘variante Nomina’ ein (zu genaueren quantitativen Ergebnissen vergleiche Tab. 4 im Anhang). Abb. 15: Anteil der ES-Token: Durchschlagskraft starker Faktoren im Vergleich In einigen wenigen Fällen implizieren starke Faktoren andere starke Faktoren. So haben Nomina auf Suffix -chen gleichzeitig einen Schwa- Reim (-en) und Nomina auf Suffix -ling gleichzeitig den Wortausgang -ing. Diese Interaktionen sind aber im großen Ganzen als randständig einzustufen und verzerren hier in jedem Fall nicht das Gesamtbild. Abbildung 15 berücksichtigt alle wichtigen Faktoren, die der Spezialliteratur zufolge tendenziell zur Ausnahmslosigkeit einer Endung führen. Sowohl bei den „S-Faktoren“ als auch bei den „ES-Faktoren“ zeigen die Werte einschlägiger Nomina einen beträchtlichen Abstand zu den Werten der „neutralen“ Gruppen ‘alle Nomina ohne Sondergruppen’ und ‘variante Nomina’ - die Unterschiede innerhalb der Sbzw. ES-Gruppe sind dafür deutlich kleiner. Beides zusammen stützt zunächst die Praxis, die Faktorenausprägungen als tendenziell zu nur einer Endung führend zu behandeln. Zusammen mit den in der Forschung bereits anerkannten Faktoren wird hier auch der bisher noch nicht etablierte Faktor ‘(hohe) Lexemfrequenz’ (‘Frequenz HK < 8’, vgl. Endungsvariation 74 Kap. 2.4.3) abgebildet, 74 der seine Aufnahme in die Gruppe starker Faktoren durch die Position im Gesamtbild rechtfertigt. Abbildung 16 macht die Wirkungsrichtung der Faktoren deutlich und zeigt die Effektstärken der Faktoren mithilfe logarithmierter Odds Ratios an. 75 Abb. 16: Logarithmierte Odds Ratios (log 10 ) für die ES-Token: Richtung und Effektstärke starker Faktoren im Vergleich Demzufolge wirken die Faktoren mit den stärksten Effekten bei positiver Ausprägung zugunsten von S. Die relevanten Faktorenausprägungen liegen vor, wenn Nomina auf eine unbetonte Silbe mit einem Schwa bzw. auf die Diminutivsuffixe -chen und -lein enden. Die in Abbildung 17 (unten) zusammengefassten Phi-Werte erlauben uns die Reichweite der Faktoren genauer einzuschätzen und ihre Effektstärke auf einen untersuchungsunabhängigen Standard zu beziehen. Beim Korrelationskoeffizienten Phi, der Werte zwischen 0 und 1 74 Der entsprechende Anteil der ES-Token wird hier - anders als in Kapitel 2.4.3 - im gesamten Material ohne Sondergruppen berechnet, um die Vergleichbarkeit mit den Werten für andere Faktoren zu gewährleisten. 75 Für die positive Ausprägung des Faktors ‘Nomen auf -chen, -lein’ wurden keine Belege für -es gefunden. Unter solchen Umständen ist die Odds Ratio gleich 0 und kann nicht sinnvoll logarithmiert werden (daher die Kennzeichnung NA). Um die Position dieses Faktors in der Faktorenkonstellation dennoch vorstellbar zu machen, wurde bei den Berechnungen für Abbildung 16 und 17 von einem (fiktiven) Beleg für ES ausgegangen. Starke Faktoren und „invariante“ Nomina 75 annehmen kann, ist der Effekt umso stärker, je näher Phi an 1 liegt. In den Sozialwissenschaften gilt der Wert 0,1 als klein, 0,3 als mittelgroß und 0,5 als groß (vgl. Sheskin 2003: 535). Diese Konvention lässt sich auf unsere Analysen als Orientierung dafür übertragen, wie stark ein Faktor die Gesamtheit untersuchter Nomina „aus dem Gleichgewicht bringt“. Abb. 17: Korrelationskoeffizient Phi : Reichweite und Effektstäke starker Faktoren im Vergleich Wie Abbildung 17 zeigt, übt keiner der Faktoren einen großen Effekt in diesem Sinne aus. Vier Faktoren überschreiten aber immerhin die Marke ‘mittelgroß’ (0,3). Es sind: ‘Nomen auf unbetonte Silbe mit dem Reim -el, -em, -en, -end, -er’, ‘Nomen auf s-Laut’, ‘Nomen aus Sondergruppen’ und ‘Frequenz HK < 8’. 76 Die äußeren Ränder von Abbildung 17 sind interessanterweise von zwei Faktoren mit einer sehr ähnlichen, beinahe 100%-igen Durchschlagskraft zugunsten von S markiert: ‘Nomen auf unbetonte Silbe mit dem Reim -ich, -ig, -ing’ und ‘Nomen auf unbetonte Silbe mit dem Reim -el, -em, -en, -end, -er’ (vgl. Abb. 15). Dass die beiden hinsichtlich der Effektstärke so weit auseinanderliegen, ist dadurch zu erklären, dass Nomina auf -ich, -ig, -ing mit 6.392 Token nur etwa 0,1% der hier relevanten 4.585.236 Genitivnomina (ohne Sondergruppen) ausmachen, die Nomina auf einen Schwa-Reim dagegen mit 1.088.840 Token etwa 24%. ‘Nomen auf einen Schwa-Reim’ wie auch ‘Nomen auf s-Laut’ erreichen sogar eine größere Effektstärke als ‘Nomen aus Sondergruppen’. Allerdings ist die Effektstärke des letzte- 76 Für den Faktor ‘Nomen auf Suffix -chen, -lein’ erfolgte die Berechnung auch für die Abbildung 17 unter der Annahme eines (fiktiven) Belegs für -es; daher ist die entsprechende Säule mit NA gekennzeichnet. Endungsvariation 76 ren Faktors auf die Gesamtheit der Nomina mit einer Endung (6.568.151 Token) zu beziehen, in der Nomina der Sondergruppen ca. 30% (1.982.911 Token) ausmachen (weitere quantitative Ergebnisse liefert Tab. 4 im Anhang). Ob eine relativ hohe Effektstärke eines Faktors eine psychologische Relevanz im Sinne einer Sogwirkung haben kann, sodass sie zu Analogiebildungen bei Nomina führt, bei denen die relevante Faktorausprägung eigentlich nicht vorliegt, muss hier offenbleiben und scheint sich angesichts der differenzierten Sachlage nicht klären zu lassen. 77 Insgesamt gesehen erscheinen Faktoren, die bei positiver Ausprägung zugunsten von S wirken, durchschlagskräftiger: Sie erzwingen die unterstützte Endung konsequenter als Faktoren, die bei positiver Ausprägung zugunsten von ES wirken. Einige der durchschlagskräftigen S-Faktoren beeinflussen aber verhältnismäßig kleine Tokengruppen (z.B. ‘Nomen auf -ich, -ig, -ing’), sodass sie im Hinblick auf ihre Effektstärke (Phi) deutlich hinter den ES-Faktoren mit großen Reichweiten (‘Nomen auf s-Laut’ und ‘Frequenz HK < 8’) zurückbleiben. All dies bestätigt nicht nur die Wirksamkeit der in der Fachliteratur postulierten Faktoren (vgl. Faktor 1-4, 8, 9, 19-24, 26, 27 in Tab. 1 aus Kap. 1.3). Es erlaubt auch die vielen Einflussgrößen zu ordnen, und zwar je nachdem, wie nah sie den ausnahmslosen Regeln stehen oder auch wie stark sie das Gesamtsystem beeinflussen. 2.5 Schwache Faktoren und „frei“ variierende Nomina Zur Diskussion stehen hier Faktoren, deren Wirkungskraft der Fachliteratur zufolge deutlich schwächer sein müsste als die Wirkungskraft der in Kapitel 2.4 behandelten Faktoren. Nicht mehr durchgeführt werden muss daher die Überprüfung der „Ausnahmslosigkeit“ einzelner Faktoren. In den folgenden Analysen rücken dafür stärker der Vergleich der Wirkung verschiedener Faktoren sowie das Aufdecken von Abhängigkeiten und Interaktionen zwischen Faktoren in den Vordergrund. 77 Gemeint sind hier Hypothesen wie etwa die, dass die eventuelle allgemeine Zunahme von Fremdwörtern, Abkürzungen, Neologismen etc., die bekanntermaßen auf die S-Endung und die Nullmarkierung spezialisiert sind, zur Abnahme der ES-Endung auch im Grundwortschatz führt. Schwache Faktoren und „frei“ variierende Nomina 77 2.5.1 Faktorenübersicht und Datenbasis Zu behandeln sind Faktoren unterschiedlicher Provenienz. Sie beziehen sich alle auf Nomina, die auf Konsonanten enden. Berücksichtigt werden hier fast ausschließlich sprachimmanente Faktoren. Zusätzlich ins Spiel kommt an einigen Stellen der Faktor ‘Frequenz’. In der folgenden Übersicht werden die Faktoren(gruppen), die in die Untersuchung eingehen, unter Angabe der in der Literatur postulierten Wirkungsrichtung der positivenAusprägung (Faktor→Wirkungsrichtung) aufgelistet (vgl. Tab. 1 in Kap. 1.3): 78 - lautliche Faktoren: • Wortausgang auf Konsonantengruppe → -es • die Stellung des abschließenden Konsonanten in der Sonoritätshierarchie: Nasal → -s, [...] Plosiv → -es • kurzer Vokal in letzter Silbe: P./ M., F. → -es vs. S. > (eher) -s 79 - prosodische Faktoren: • Silbenanzahl: Einsilber → -es, Mehrsilber → (mit der Anzahl der Silben zunehmend) -s • Betonung: Ultima → -es, Pänultima → -s - Wortbildungsfaktoren: • Komposition → -s - randständige lexikalische Faktoren: • Maskulinum → -es • Neutrum → -s Über die Wirkungsrichtung der Faktoren besteht in der Fachliteratur fast immer Einigkeit. Nur für den kurzen Vokal vor Einzelkonsonant am Wortende wird sie unterschiedlich angegeben (vgl. dazu Kap. 2.1 oben sowie Kap. 2.5.5). Die obige Auswahl zeigt Faktoren unterschiedlicher Art. Die meisten können direkt als binäre Variablen behandelt werden. Die Gruppen 78 Nicht behandelt werden aus Platzgründen die Wortbildungsfaktoren ‘s-Fuge im Kompositum’ (→ -es) und ‘transparente Komposition’ (> Grundwortpräferenz), wobei Ersterer als randständig eingeschätzt wird und die Untersuchung von Letzterem methodisch sehr aufwendig erscheint. 79 P./ M. = Pfeffer/ Morrison (1979, 1984), F. = Fehringer (2011), S. = Szczepaniak (2010). Endungsvariation 78 Sonoritätshierarchie und Silbenanzahl dagegen sind mehrstufig, jedoch lassen sich die einzelnen Stufen - z.B. auf der Sonoritätsskala: Nasal, Liquid, Frikativ, Affrikate, Plosiv - auch als binäre Dummy- Variablen modellieren, was wegen der Vergleichbarkeit mit anderen Faktoren praktisch erscheint. Anders als bei starken Faktoren gibt es hier einige Abhängigkeiten bzw. Implikationsverhältnisse, die beachtet werden müssen, z.B.: Einsilber können als automatisch ultimabetont betrachtet werden, Einsilber sind immer Simplizia, Simplizia sind fast immer Einsilber, Komposita sind immer Mehrsilber etc. Es ist auch mit zahlreichen Faktoreninteraktionen zu rechnen, denn z.B. Lemmata auf Konsonantengruppe können gleichzeitig auf einen Plosiv enden sowie Maskulina und zusätzlich noch Komposita sein wie Lebensort, Arbeitsmarkt oder Vereinsvorstand. Derartige Interaktionen kann es auch zwischen einem starken und mehreren schwachen Faktoren geben, z.B. enden Nomina auf st-Gruppe (starker Faktor) gleichzeitig auf eine Konsonantengruppe und auf einen Plosiv (schwache Faktoren) und können im Weiteren Einsilber sein und einen Kurzvokal aufweisen (ebenfalls schwache Faktoren), wie Mast, Hengst oder Nest. Um wenigstens die letztgenannten Korrelationen und die folglich zu erwartenden Interaktionen einigermaßen zu kontrollieren und Verzerrungen bei der Darstellung der Wirkung schwacher Faktoren zu vermeiden, werden in den folgenden Analysen wie bereits anvisiert alle Nomina ausgeschlossen, die durch die in Kapitel 2.4 behandelten, starken Faktoren beeinflusst werden. Im Einzelnen handelt es sich dabei um Nomina, die folgenden Gruppen angehören: - Sonderwortschatz-Gruppen Konversion, Neologismus, Fremdwort, Abkürzung und Eigenname - Nomina auf eine unbetonte Silbe mit dem Reim -el, -em, -en, -end, -er sowie -ich, -ing, -ig - Nomina auf das Suffix -chen, -lein, -ling, -mal, -sal, -sam, -tum - Nomina auf einen Vokal (einschließlich Diphthong) - Nomina, die auf einen s-Laut, einen sch-Laut oder eine st-Gruppe enden - Nomina der Häufigkeitsklasse 5-7 (‘Frequenz HK < 8’) Diese Einschränkung ist nicht die einzige, die notwendig ist, um schwache Faktoren effizient zu untersuchen. Für das zu untersuchende Material müssen Nomeneigenschaften wie Anzahl und Art der Schwache Faktoren und „frei“ variierende Nomina 79 Konsonanten am Wortende, Anzahl der Silben, Betonung etc. kodiert und automatisch extrahierbar gemacht werden. Eine solche Aufarbeitung war nur für diejenigen Nomina möglich, die gleichzeitig in CELEX erfasst sind, der von uns benutzten Datenbank, die phonetische, morphologische und prosodische Eigenschaften eines Grundstocks deutscher Wörter verzeichnet (dazu genauer Kap. 1.4). Das nach Ausschluss der von starken Faktoren beeinflussten und der in CELEX nicht verzeichneten Nomina verbleibende Material umfasst 1.733.983 Genitivtoken bzw. 37.104 Lemmata, die den folgenden Analysen zu schwachen Faktoren zugrunde liegen. In diesem Teil der Daten liegt der Anteil der ES-Token an der Gesamtheit der Token mit einer Endung bei 40,7% und der Mittelwert aus den Anteilen der ES-Token für die einzelnen Lemmata bei 31,84%, wobei die Standardabweichung mit 39,54 sehr beachtlich ausfällt. Die aufkommende Vermutung, dass es besonders viele Lemmata mit einem starken Übergewicht von S gibt, bestätigt der mit 0,48% sehr niedrige Median aus den ES-Anteilen für die einzelnen Lemmata. Das Histogramm in Abbildung 18 zeigt die Verteilung der Lemmata auf einzelne Bereiche von ES-Anteil-Werten. Abb. 18: Histogramm für Anteil der ES-Token pro Lemma in den von starken Faktoren nicht beeinflussten Daten Endungsvariation 80 2.5.2 Wirkung schwacher Faktoren im Vergleich Zunächst werden hier die binär aufgefassten Faktoren hinsichtlich des Anteils der ES-Endung an der Gesamtheit aller Endungen und hinsichtlich der als Korrelationskoeffizient Phi kalkulierten Effektstärke miteinander verglichen. Dem so entstandenen groben Überblick über die Durchschlagskraft und Reichweite der Faktoren folgen in den nächsten Kapiteln Spezialanalysen, in denen einige konkrete Forschungsfragen erörtert und wichtige Faktorengruppen näher untersucht werden, wobei exemplarisch auch Abhängigkeiten und Interaktionen zwischen Faktoren herausgearbeitet werden. Als Bezugspunkt für Vergleiche und eine vorläufige Bestimmung der Wirkungsrichtung können in Abbildung 19 weiter unten ‘variante Nomina’ (hier sind alle nach den in Kap. 2.5.1 beschriebenen Einschränkungen verbliebenen 1.733.983 Token gemeint) dienen. Unter den Faktoren, die bei positiver Ausprägung zugunsten von -es wirken, zeigt ‘Silbenanzahl: 1’ die größte Durchschlagskraft. Ansonsten werden die beiden äußeren Bereiche des Diagramms durch die (auch als Ordinalvariablen darstellbaren) Komplexe Sonoritätshierarchie und - interessanterweise - Vokalhöhe gebildet. Der letztgenannte Faktorenkomplex wird in der gesichteten Fachliteratur nicht direkt genannt. Es zeichnet sich im Einzelnen folgendes Bild für durchschlagskräftige Faktoren ab: Zu -es tendieren insbesondere Einsilber, Nomina auf die Affrikate / pf/ 80 und Nomina mit tiefem Vokal (d.h. einem a-Laut) in letzter Silbe, zu S dagegen insbesondere Nomina auf Nasal oder Liquid, Nomina mit Diphthong in letzter Silbe sowie Nomina mit Pänultima-Betonung. Diese beiden „Rand-Gruppen“ sollen uns in den nächsten Kapiteln noch näher beschäftigen. Bei den durchschlagskräftigen ES-Faktoren ist der in der Fachliteratur etablierte Faktor Wortausgang auf Konsonantengruppe überraschenderweise wenn, dann nur indirekt - über Nomina auf Affrikate - vertreten. Zu Faktoren mit vergleichsweise geringer Durchschlagskraft sind erwartungsgemäß der Auslaut auf Frikativ (auf der Sonoritätsskala in der Mitte liegend), das Genus und schließlich die in der Fachliteratur strittige Länge des 80 Nomina auf / ts/ und / tʃ/ wurden in Kapitel 2.5.1 mit dem Ausschluss der Nomina auf s-Laut und auf sch-Laut bereits aus der Datenbasis eliminiert. Nomina auf / ts/ weisen (ohne Berücksichtigung gemischt flektierender Nomina, vgl. Herzens) nur ES-Token auf. Bei Nomina auf / tʃ/ (z.B. Matsch) liegt der ES-Anteil bei 92%. Schwache Faktoren und „frei“ variierende Nomina 81 Endsilbenvokals 81 zu rechnen. Im Übrigen ist die Lexemperspektive hier erneut wenig brauchbar, da die Standardabweichungen der arithmetischen Mittel aus prozentuellen ES-Anteilen der jeweils einschlägigen Lemmata konstant sehr hoch sind (z.B. 32,1 für ‘Silbenanzahl: 1’). Abb. 19: Anteil der ES-Token: Durchschlagskraft schwacher Faktoren im Vergleich Die Bereiche Silbenanzahl, Sonoritätshierarchie und Betonung sind auch im Hinblick auf die Effektstärke (Phi-Koeffizient) von Bedeutung. Die drei stärksten Einflussgrößen in Abbildung 20 unten wirken bei positiver Faktorenausprägung interessanterweise zugunsten von -es. Darunter ragt ‘Silbenanzahl: 1’ heraus. Mit einer Effektstärke von Phi = 0,38 erscheint dieser Faktor beinahe der Spitzengruppe der starken Faktoren (vgl. Abb. 17) 82 ebenbürtig. Seine verhältnismäßig große Effektstärke ist vor dem Hintergrund der hohen relativen Häufigkeit der 81 Dass hier sowohl ‘Vokallänge: kurz’ als auch ‘Vokallänge: lang’ zugunsten von ES wirken, liegt daran, dass die verhältnismäßig stark zugunsten von S wirkenden Diphthonge aufgrund dieser Spezifik aus der Gruppe ‘Vokallänge: lang’ herausgenommen wurden (vgl. Kap. 2.5.5). 82 Allerdings werden dort die Effektstärken bezogen auf die Gesamtmenge der Genitivnomina mit einer Endung (4.585.236 Token) berechnet. Endungsvariation 82 Einsilber zu sehen, die ca. 26% der hier zugrunde liegenden 1.733.983 Genitivtoken ausmachen. Hingegen fällt die Effektstärke des Faktors ‘Sonoritätshierarchie: A(ffrikate)’, der im Hinblick auf die Durchschlagskraft vergleichbar mit ‘Silbenanzahl: 1’ war, mit 0,05 sehr gering aus, was der relativen Seltenheit der Nomina auf die Affrikate / pf/ geschuldet ist (0,8%). Die niedrigsten Effektstärken zeigen im Weiteren Einflussgrößen, die schon im Hinblick auf die Durchschlagskraft die schwächsten waren, vor allem die Sonoritätshierarchie in der Ausprägung Frikativ, die Vokallänge und das Genus. Beim Frikativ passt dies zu seiner Stellung in der Sonoritätshierarchie, womit die Wirksamkeit des Faktors Sonorität an sich Unterstützung erhält. In den beiden anderen Fällen ist es aber ein deutlicher Hinweis darauf, dass die entsprechenden Faktoren zwar wirksam, aber relativ bedeutungslos sind. Abb. 20: Phi-Koeffizient: Effektstärke und Reichweite schwacher Faktoren im Vergleich Unter den stärkeren Faktoren erscheinen hier drei Einflussgrößen, die bei positiver Ausprägung jeweils diejenige Endung präferieren, die zu einer Wortform führt, die auf einen Trochäus endet: ‘Silbenanzahl: 1’ (vgl. Rat-es), ‘Betonung: Ultima’ (vgl. Rat-es, Verrat-es), ‘Betonung: Pänultima’ (vgl. Vorschlag-s). Dabei kann es bei mehr als zweisilbigen Wörtern mit beiden Endungen zu Strukturen kommen, bei denen der Trochäus am Wortende mithilfe eines Nebenakzents entstehen kann (z.B. Schweinehundes, Gegenvorschlags). All das rückt erneut (wie am Ende von Schwache Faktoren und „frei“ variierende Nomina 83 Kap. 2.4.2) die Wortprosodie, genauer gesagt den Rhythmus, in den Fokus. Die Tendenz, den Trochäus am Wortformende zu wählen, erinnert an die Beobachtungen Eisenbergs (1991, S. 50) zur Pluralbildung: Ist die „kanonische Struktur“ des Trochäus im Stamm noch nicht gegeben, so wird sie im Paradigma erreicht - liegt sie bereits im Stamm vor, so wird sie im gesamten Paradigma konserviert. Bei der sich abzeichnenden Relevanz der Trochäusstruktur für die Markierungsvariation darf allerdings nicht übersehen werden, dass in Abbildung 20 unter den stärkeren Faktoren auch drei Einflussgrößen zu finden sind, die mit der Sonoritätshierarchie zusammenhängen. Dass ‘Sonoritätshierarchie: P(losiv)’, ‘Sonoritätshierarchie: N(asal)’ und ‘Sonoritätshierarchie: L(iquid)’ dabei jeweils in die erwartete Richtung wirken, stützt die These von der Geltung der gesamten Hierarchie (dazu genauer Kap. 2.5.7). Bei Vergleichen wie denen in Abbildung 19 und 20 wird erst einmal die Tatsache ignoriert, dass schwache Faktoren zusammenwirken (z.B. im Falle von Rand liegen die positiven Ausprägungen von ‘Silberanzahl: 1’, ‘Sonoritätshierarchie: P(losiv)’, ‘Konsonantengruppe’, ‘Vokalhöhe: tief’, ‘Vokallänge: kurz’, ‘Genus: Maskulinum’ vor). Wie gleichzeitig auftretende Faktorenausprägungen interagieren, versucht eine modellhafte Analyse mithilfe der logistischen Regression in Kapitel 2.5.4. zu beleuchten. 2.5.3 Abgrenzung zu starken Faktoren und adäquate Darstellung des Faktorenspektrums Um die Grenzen zwischen invarianten Nomina und varianten Nomina zu problematisieren, müssen die schwächeren der sog. starken Faktoren mit den stärkeren der sog. schwachen Faktoren verglichen werden. Ausschlaggebend ist dabei die Durchschlagskraft von Faktoren gemessen an der relativen Häufigkeit der Endungen (dem Anteil einer Endung), da diese die Ausnahmslosigkeit der Faktorenwirkung direkt anzeigt. Die tendenzielle Ausnahmslosigkeit kann die Grundlage dafür sein, wie im Zweifelsfälle-Duden (2007, S. 370) zwischen festem und schwankendem Gebrauch der Endungen zu unterscheiden. Die Ausnahmslosigkeit ist dabei vom Ansatz her typebzw. - in unserem konkreten Fall - lexemunabhhängig, sodass hier zunächst die Tokenperspektive einschlägig ist. Bisher sind wir davon ausgegangen, dass nur der Faktor ‘Nomen aus Sondergruppen’ alle Nomina mit Endung „ungehindert“ beeinflusst, Endungsvariation 84 ferner davon, dass die anderen starken Faktoren nur im Bereich ‘Nomina ohne Sondergruppen’ und die schwachen Faktoren nur im Bereich ‘variante Nomina’ richtig wirksam werden können. Abbildung 21 zeigt den Übergang von starken zu schwachen Faktoren, die S fördern, wobei der Anteil der S-Token für die einzelnen Faktoren obigen Prämissen folgend immer nur in dem jeweils angenommenen Wirkungsbereich berechnet wird. 83 Die bisher als stark eingestuften Faktoren sind darin von den bisher als schwach eingestuften Faktoren durch die senkrechte gestrichelte Linie getrennt. Abb. 21: Übergang von tendenziell invarianten zu varianten Nomina bei Tendenz zu S: Anteil der S-Token im jeweiligen Wirkungsbereich der Faktoren 84 Das Gefälle zwischen den Anteilen der S-Endung für Nomina der Sondergruppen und Nomina auf Nasal (‘Sonoritätshierarchie: N’) ist besonders stark ausgeprägt, was als ein Übergang von einem starken zu einem schwachen Faktor interpretieret werden kann. Mitten in diesem Grenzbereich befindet sich der Wert für Nomina auf Diphthong. Diesem Befund entspricht die Einschätzung im Zweifelsfälle-Duden (2007, 83 Die Werte stimmen somit mit jenen in Tabelle 19 respektive 15 überein. 84 ‘Nomina auf Diphthong plus Konsonant’ = ‘Vokalhöhe/ -länge: Diphthong’ aus Abbildung 13. Schwache Faktoren und „frei“ variierende Nomina 85 S. 370f.), 85 wo Nomina auf Diphthong zwar dem Bereich des zwischen -es und -s schwankenden Gebrauchs zugeschlagen, aber gleichzeitig als sehr stark zu kurzer Form -s neigend eingestuft werden. Kritisch angemerkt werden kann, dass bei den Werten in Abbildung 21 die für die einzelnen Faktoren einschlägigen Nomina in verschiedenen Gesamtmengen (‘alle Nomina (mit Endung)’, ‘Nomina ohne Sondergruppen’ und ‘variante Nomina’) gesucht werden, sodass die S-Anteile untereinander nicht richtig vergleichbar seien. Für Abbildung 22 werden daher zur Kontrolle soweit möglich 86 die einschlägigen Nomina für alle dargestellten Faktoren in der Gesamtheit der Nomina mit einer Endung gesucht (also u.a. einschließlich der stark zu S neigenden Nomina der Sondergruppen). Abb. 22: Übergang von tendenziell invarianten zu varianten Nomina bei Tendenz zu S: Anteil der S-Token an der Gesamtheit der Token mit Endung 85 Ähnliche Meinungen finden sich in der Duden-Grammatik (2009, S. 198) und - die Position der -s-Endung sogar noch weiter schwächend - bei Pfeffer/ Morrison (1979, S. 310). 86 In Abbildung 22 fehlt der schwächste Faktor aus Abbildung 21 - ‘Nomina auf Diphthong plus Konsonant’. Die Ursache dafür ist, dass es unverhältnismäßig aufwendig erschien, entsprechende Nomina ohne lautliche Zusatzinformationen der CELEX - Datenbank (vgl. Tab. 2 weiter oben) zu suchen (kaum erfasst sind in CELEX die Nomina der Sondergruppen). Endungsvariation 86 Durch die Erweiterung des Suchbereichs ist der S-Anteil bei allen Faktoren (außer ‘Nomina der Sondergruppen’) mehr oder weniger stark gestiegen. Besonders deutlich fällt der Anstieg bei dem bisher als schwach eingestuften Faktor ‘Sonoritätshierarchie: N’ aus - nicht zuletzt, weil hier sehr zahlreiche Lemmata mit der Schwa-Endung -en hinzugekommen sind, die ES ausschließt (vgl. Kap. 2.4.2). Der Wert für ‘Sonoritätshierarchie: N’ liegt jetzt sehr nah an dem für ‘Nomina auf Diphthong’. Sein Abstand zu dem Wert für ‘Nomina der Sondergruppen’ hat sich ebenfalls stark verringert. Er ist zwar mit über 4% noch merklich, inzwischen aber deutlich kleiner als der Abstand zu dem Wert für ‘Sonoritätshierarchie: L’ auf der anderen Seite. Dies kann so interpretiert werden, dass der Übergang von starken zu schwachen Faktoren erst zwischen ‘Nomina der Sondergruppen’ und ‘Sonoritätshierarchie: L’ richtig spürbar wird, und dass neben ‘Nomina auf Diphthong’ auch ‘Sonoritätshierarchie: N’ im Grenzbereich liegt. Es kann nicht mit letzter Gewissheit entschieden werden, welche der beiden für den Vergleich in Abbildung 21 bzw. 22 benutzten Vorgehensweisen mehr der psychologischen Realität der Faktoren entspricht. (Werden die unterschiedlichen Wirkungsbereiche der Faktoren von Sprachbenutzern tatsächlich perzipiert? Spielen sie bei der Sprachproduktion eine Rolle? ) Daher sollen auch zur Untersuchung der Grenze zwischen invarianten und varianten Nomina, die zu ES tendieren, beide Vorgehensweisen herangezogen werden. In Abbildung 23 weiter unten wird der ES-Anteil für die einzelnen Faktoren in dem für sie jeweils angenommenen Wirkungsbereich angezeigt, 87 wobei die senkrechte gestrichelte Linie erneut die bisher als stark eingestuften Faktoren von den bisher als schwach eingestuften Faktoren trennt. Der Wert steigt von ‘Silbenanzahl: 1’ über ‘Nomina auf sch-Laut’ bis ‘Nomina auf s-Laut’ gleichmäßig stark an. Von einer tendenziellen Ausnahmslosigkeit zu sprechen ist hier nur bei Nomina auf s-Laut unproblematisch. ‘Nomina auf st-Gruppe’ befinden sich mit 86,4% ES-Fällen 88 bereits im Grenzbereich zwischen star- 87 Die Werte stimmen somit mit jenen in Tabelle 15 respektive 19 überein. Eine Ausnahme bilden ‘Nomina auf s-Laut’, bei denen gemischt flektierende Lexeme wie Fels und Herz ausgeschlossen sind. Lässt man Formen wie Felsens und Herzens zu, greift bei Nomen auf s-Laut die Endung ES zu 97,3% (vgl. Kap. 2.4.2). 88 Allerdings fallen bei Nomina auf st-Gruppe die Lexeme Protest, Test, Holocaust, Palast und Manifest stark ins Gewicht, die als Fremdwörter zu -s tendieren. Sie befan- Schwache Faktoren und „frei“ variierende Nomina 87 ken und schwachen Faktoren. Mit diesem Ergebnis weitgehend konform wird in der Duden-Grammatik (2009, S. 197) festgestellt: „Die lange Endung -es überwiegt bei Substantiven auf -sch, -tsch, -st [...], die kurze Endung ist aber standardsprachlich ebenfalls möglich [...].“ Etwas abweichend wird im Zweifelsfälle-Duden (2007, S. 370) den Nomina auf -sch und -st der feste Gebrauch von -es zugeschrieben, wobei aber Ausnahmen eingeräumt werden. Abb. 23: Übergang von varianten zu tendenziell invarianten Nomina bei Tendenz zu ES: Anteil der ES-Token im jeweiligen Wirkungsbereich der Faktoren Der etwas älteren, stark auf Generalisierung ausgerichteten Darstellung von Pfeffer/ Morrison (1979, S. 311) zufolge stehen diese Nomina wiederum immer mit -es. Unseren Ergebnissen folgend müsste man spätestens bei Nomina auf -sch darauf verzichten, einen tendenziell ausnahmslos wirkenden Faktor zu postulieren. Dieser Einschätzung entsprechend warten in unserem Material beispielsweise folgende Nomina mit einem relativ niedrigen Anteil von ES-Token auf: Tausch - ca. den sich nicht auf der verwendeten Fremdwortliste und konnten daher nicht im Voraus ausgeschlossen werden (vgl. Kap. 1.4 und 2.4.1). Im von diesen Lexemen (5.531 Token) nachträglich bereinigten Material (es verbleiben 68.800 Token auf -st in 4.585.236 Token ohne Sondergruppen gesamt) beträgt die relative Häufigkeit für ES bei Nomina auf -st 89,3% und die entsprechende Odds Ratio steigt auf 1,16 (vgl. mit Abb. 16). Ähnliche Verschiebungen konnten bei anderen Faktoren nicht beobachtet werden. Endungsvariation 88 79%, Austausch - 50%, Schlagabtausch - 49%. Wie bei diesen Beispielen lässt die Tendenz zu -es vor allem bei Mehrsilbern bzw. komplexen Nomina nach. Werden die einschlägigen Nomina für alle dargestellten Faktoren in der Gesamtheit der Nomina mit einer Endung gesucht, sinken alle ES- Anteile (vgl. Abb. 24), was sich vor allem auf die Tatsache zurückführen lässt, dass stark zu S neigende Nomina der Sondergruppen jetzt mitberücksichtigt werden. Abb. 24: Übergang von invarianten zu tendenziell varianten Nomina bei Tendenz zu ES: Anteil der ES-Token an der Gesamtheit der Token mit Endung Besonders deutlich fällt der Wert für ‘Nomina auf sch-Laut’, 89 der stark durch zahlreiche Eigennamen und Fremdwörter (z.B. Frischs, Abramowitschs, Matchs, Woszs) beeinflusst wird. Nicht nur, dass ‘Nomina auf sch-Laut’ hier mit 58% keineswegs zu starken Faktoren zu rechnen sind (ihr ES-Anteil fällt sogar deutlich unter den Wert für Nomina auf die Affrikate / pf/ ), 90 auch der Faktor ‘Nomina auf st-Gruppe’ steht jetzt eher auf der Seite der schwachen Faktoren, da er sich mit 79% -es deutlich von der ausnahmslosen Wirkung entfernt. Der Faktor ‘Silbenanzahl: 1’ konnte in Abbildung 24 übrigens nicht mehr berücksichtigt werden, da 89 Gesucht wurde an dieser Stelle nach Lemmata auf <sch>, <tch>, <sz>. 90 Der Auslaut auf die Affrikaten / ts/ und / tʃ/ wurde bereits den anderen Faktoren - Nomina auf s-Laut bzw. sch-Laut - zugeschlagen. Schwache Faktoren und „frei“ variierende Nomina 89 es für Nomina der Sondergruppen (v.a. Fremdwörter) unmöglich erschien, die Anzahl der Silben maschinell zuverlässig zu ermitteln. 91 Die Effektstärke der Faktoren ist zwar nicht direkt von der relativen Häufigkeit einer Endung (als dem Maß für die Tendenz zur Ausnahmslosigkeit) abhängig, sie kann aber bei der Entscheidung behilflich sein, welche Faktoren in einem Referenzwerk primär zu behandeln sind. Idealerweise stehen darin nämlich diejenigen Faktoren im Vordergrund, die - eine relativ große Durchschlagskraft (hohe Frequenz für eine Endung) vorausgesetzt - eine große Reichweite im Nomensystem aufweisen. Für eine so definierte Relevanz erscheint der Phi-Koeffizient als das geeignete Maß. Der Wert Phi = 0,3, der in den Sozialwissenschaften vielfach als die Schwelle zur mittelgroßen Effektstärke betrachtet wird, kann auch hier als Orientierung dienen. Abbildung 25 stellt alle Faktoren mit den Werten ab Phi = 0,2 zusammen und deckt damit auch den angrenzenden Bereich der stärksten der „schwachen“ Effekte ab. Die ursprünglich vorgenommene Arbeitsaufteilung in schwache und starke Faktoren wird beibehalten und durch die gestrichelte senkrechte Linie angezeigt. Die Linie soll auch darauf hinweisen, dass die Werte für die beiden Gruppen in unterschiedlichen Datenbereichen berechnet werden und daher nur innerhalb der jeweiligen Gruppe direkt miteinander vergleichbar sind (vgl. weiter oben). Nicht berücksichtigt wird in der Abbildung der Faktor ‘Nomen aus Sondergruppen’, dessen Phi-Wert bezogen auf die Gesamtheit der Nomina mit einer Endung berechnet wurde (vgl. Kap. 2.4.4). Die Anzahl der insgesamt untersuchten knapp 30 Faktoren wird hier auf eine überschaubare Menge von sechs mit Phi ≥ 0,2 bzw. vier mit Phi ≥ 0,3 reduziert. Sie entsprechen den in der Fachliteratur postulierten Faktoren 2, 5, 8, 10 und 11 in Tabelle 1 aus Kapitel 1.3 ergänzt um den Faktor ‘Frequenz’, der hier anders formuliert ist als bei Fehringer (2011). 92 Nicht dabei sind z.B. auf der einen Seite die in der Fachliteratur immer wieder herangezogenen Faktoren ‘Nomen auf Konsonantengruppe’ (→ -es) und ‘Kompositum’ (→ -s) sowie auf der anderen Seite die beinahe ausnahmslos wirkenden Faktoren ‘Nomen auf -ich, -ing, -ig’ und ‘Nomen auf Vokal (ohne Diphthong)’ (beide → -s). Bei den einen schlägt die geringe Durchschlagskraft, bei den anderen die mangelnde Reichweite zu Buche. 91 Hier fehlten die lautlichen Informationen der CELEX -Datenbank. 92 Vgl. Faktor 30 in Tabelle 1 aus Kapitel 1.3, genauer erläutert in Kapitel 2.1. Endungsvariation 90 starke Faktoren schwache Faktoren Abb. 25: Korrelationskoeffizient Phi : Reichweite und Effektstärke zentraler Faktoren Es fällt auf, dass es unter den in Abbildung 25 verbliebenen Faktoren nur einen gibt, dessen positive Ausprägung den Endungstyp S fördert - ‘Nomen auf unbetonte Silbe mit dem Reim -el, -em, -en, -end, -er’. Diese Faktorausprägung impliziert dabei interessanterweise die negative Ausprägung des in der Abbildung ebenfalls vertretenen Faktors ‘Betonung: Ultima’, sodass das große Gewicht des gesamten Faktorenkomplexes Prosodie unübersehbar wird. Alle in Abbildung 25 verbliebenen Faktoren bieten sich an, bei einer Beschreibung der Endungsvariation in einem Referenzwerk primär berücksichtigt zu werden - wobei wohl der lexikalische Faktor ‘Nomen aus Sondergruppen’ zu ergänzen ist, der über die Wirkungsvoraussetzungen der anderen Faktoren entscheidet. Die Beschreibung könnte sich dann an folgenden Punkten orientieren: 1) Insgesamt überwiegt der Endungstyp S. 2) Der Endungstyp ES wird (weitgehend) verhindert, wenn a) die Nomina in das appellativisch geprägte Gesamtsystem nicht integriert sind (vgl. Faktor ‘Nomen aus Sondergruppen’), b) die Nomina auf eine Schwa-Silbe enden. Schwache Faktoren und „frei“ variierende Nomina 91 3) Restliche Nomina können prinzipiell zwischen den Endungstypen S und ES schwanken, wobei a) der Auslaut auf einen s-Laut (mit wenigen Ausnahmen) den Endungstyp ES erzwingt, b) die Einsilbigkeit, die Endsilbenbetonung, der Auslaut auf einen Plosiv und die Häufigkeit des Nomens die Endung -es begünstigen. Die restlichen durchschlagskräftigen Faktoren könnte man u.U. nur erwähnen. Passend abgestuft kämen dabei „S-Faktoren“ wie ‘Nomen auf Vokal’ und ‘Nomen auf Diphthong’ sowie ‘ES-Faktoren’ wie ‘Nomen auf st-Gruppe’ und ‘Nomen auf sch-Laut’ zum Zuge. Die Gesamtkonstellation umfasste damit einen vorgeschalteten lexikalischen Faktor, eine Reihe immer schwächer werdender lautlicher und prosodischer Faktoren und die Nomenfrequenz als den Einfluss anderer Faktoren modulierende, verhältnisskalierte Variable. Nicht unerwähnt bleiben darf, dass die oben einfachheitshalber binär modellierten Faktoren ‘Silbenanzahl: 1’, ‘Sonoritätshierarchie: P’ und ‘Betonung: Ultima’ eigentlich komplexeren Variablen mit jeweils mehr als zwei Ausprägungen unterzuordnen sind. 93 Die Bereiche Silbenanzahl, Betonung und Sonoritätshierarchie müssen somit in eine detailliertere Darstellung der Endungsvariation auf jeden Fall einbezogen werden. Wie Interaktionen zwischen den Bereichen zu interpretieren sind, versucht das folgende Kapitel zu beleuchten. 2.5.4 Analyse von Faktorenkombinationen und Interaktionen (binäre logistische Regressionen) Exemplarisch untersucht werden hier die Wirkung und die Interaktionen von vier sog. schwachen Faktoren, die laut Abbildung 20 oben - die Ultima-Betonung ausgenommen - am stärksten zugunsten von -es wirken. Als fünfter Faktor wird die Vokallänge herangezogen, deren Wirkung bzw. Wirkungsrichtung in der Forschung strittig erscheint (vgl. Kap. 2.1). Auf die Behandlung der Ultima-Betonung muss in den folgenden Analysen verzichtet werden, da die Hervorhebung einer Silbe kaum effizient untersuchbar erscheint, wenn die Einsilbigkeit im 93 Vgl. Tabelle 1 in Kapitel 1.3. Endungsvariation 92 Spiel ist. Die Berücksichtigung der Einsilbigkeit wiederum erscheint unverzichtbar, da sie nach allen bisherigen Analysen als die stärkste Einflussgröße unter den schwachen Faktoren erscheint. Eine Stipulierung einer inhärenten Ultima-Betonung bei allen Einsilbern wäre mit Schwierigkeiten bei der Berechnung und Interpretation der Ergebnisse verbunden. Somit werden folgende unabhängige Variablen (Prädiktorvariablen) in die Rechnung einbezogen: a) ‘Silbenanzahl: 1’ (im Weiteren ‘Einsilber’), b) ‘Sonoritätshierarchie: Plosiv’ (im Weiteren ‘Plosiv’), c) ‘Konsonantengruppe’, d) ‘Vokalhöhe: tief’ (entspricht in positiver Ausprägung einem a-Laut, im Weiteren ‘Vokaltiefe’), 94 e) ‘Vokallänge: kurz’ (im Weiteren ‘Vokalkürze’). In allen obigen Fällen handelt es sich um binäre Variablen. Die Ausprägungen werden jeweils mit JA und NEIN kodiert. Untersucht wird deren Einfluss auf die abhängige binäre Variable (Kriteriumsvariable) ES mit den Ausprägungen ES (kodiert als JA ) für Fälle wie Randes und S (kodiert als NEIN ) für Fälle wie Monats. In Bezug auf die Prädiktorvariablen liegen für diese beiden Genitivnomina folgende Gruppen von Variablenausprägungen vor: - Randes: ‘Einsilber’: JA , ‘Plosiv’: JA , Konsonantengruppe: JA ‘Vokaltiefe’: JA , ‘Vokalkürze’: JA - Monats: ‘Einsilber’: NEIN , ‘Plosiv’: JA , Konsonantengruppe: NEIN ‘Vokaltiefe’: JA , ‘Vokalkürze’: JA Die Nullhypothese ist: Die Wahl der Genitivendung ist unabhängig von den definierten Prädiktorvariablen und ihren Interaktionen. Die Alternativhypothese lautet entsprechend: Eine oder mehrere Prädiktorvariablen (oder Kombinationen davon) haben einen signifikanten Einfluss auf die Wahl der Genitivendung. 94 D.h. bei positiver Ausprägung ein a-Laut, bei negativer Ausprägung ein e-, ö-, o-, i-, ü- oder u-Laut. Schwache Faktoren und „frei“ variierende Nomina 93 Diese übergeordnete Hypothese beinhaltet bereits eine Reihe von Teilhypothesen, die folgendes Muster haben: Die Wahl der Genitivendung ist abhängig von X. Dabei steht X für eine der Variablen a) bis e) bzw. eine Kombination aus diesen Variablen. Die Systematisierung von beobachteten Häufigkeitsdaten legte hinsichtlich der Variablen a) bis e) bereits eine Wirkung auf die Wahl der Genitivendung nahe. Dabei waren die Effektstärken, die für jede Variable ohne Rücksicht auf deren mögliche Interaktionen mit anderen Variablen gemessen wurden, unterschiedlich groß. Die Spanne reichte von kaum messbar bei ‘Vokalkürze’ mit Phi = 0,03 bis mittelgroß bei ‘Einsilber’ mit Phi = 0,38 (vgl. Abb. 20 weiter oben). Da die Variablen a) bis e) miteinander kombiniert auftreten, soll jetzt untersucht werden, wie sie zusammenwirken. Als Erstes steht eine Überprüfung der übergeordneten Hypothese in einem Modell an, in dem alle Faktoren gleichzeitig in die Rechnung eingehen. Das Modell wird mittels einer binären logistischen Regression (vgl. Jaeger 2008) berechnet, in der die Effekte der einzelnen Prädiktorvariablen entsprechend ihrem Beitrag zur Gesamtwirkung der Variablenkonstellation ermittelt werden. Unsere bisherigen Analysen erlauben uns auch schon die Formulierung von weitergehenden, spezifischen Hypothesen, die die Effektrichtung und die Effektstärke der Faktoren betreffen: 1) Die positiven Ausprägungen aller Variablen wirken zugunsten von ES. 2) ‘Einsilber’ ist die Variable mit dem stärksten Effekt. 3) ‘Vokalkürze’ ist die Variable mit dem schwächsten Effekt. Um diese spezifischen Hypothesen zu prüfen, werden in den im Folgenden beschriebenen Regressionsanalysen Faktorenwirkungen mit ihren Richtungen ermittelt, die Signifikanz der Wirkungen geprüft und deren Effektstärke kalkuliert. Die Berechnungen werden mithilfe der Funktion lrm aus dem Paket rms (regression modelling strategies, vgl. Harrell 2013, S. 72-81) der Statistiksoftware R (R Core Team 2014) durchgeführt. In die Berechnungen gehen zunächst nur die Haupteffekte ein, das heißt die Analyse widmet sich nur den Variablen a) bis e) und nicht ihren Interaktionen. Das Resultat ist die R-Ausgabe aus Listing 2. Endungsvariation 94 List. 2: Modell der logistischen Regression für ausgewählte schwache Faktoren (Haupteffekte) Es zeigt sich, dass alle unabhängigen Variablen höchst signifikant mit der Endungswahl korrelieren: Log-lilkelihood χ2 = 369.665; df = 5; p < 0,0001. Mit Nagelkerkes R 2 = 0,339 ist eine Varianzaufklärung von 33,9% gegeben, 95 der Konkordanzkoeffizient C = 0,798 zeigt eine gute Vorhersagekraft an und Somers Rangkorrelation D xy = 0,596 ist als akzeptabel einzuschätzen. 96 Insgesamt sagt das Modell 73% aller Endungsentscheidungen korrekt vorher. Die Wirkungsrichtung und -stärke wird durch den Effektkoeffizienten (Coef) 97 in der zweiten Spalte des untersten Blocks der R-Ausgabe angezeigt. Ist sein Vorzeichen positiv, heißt das, dass die positive Variablenausprägung der ersten Spalte die Häufigkeit von ES positiv beeinflusst, z.B.: Nimmt die Variable ‘Einsilber’ den Wert JA an, so steigen die Chancen auf ein Genitivnomen mit der Endung ES. Vier Variablen verhalten sich demzufolge gemäß Hypothese 1. Eine einzige Ausnahme ist mit ‘Vokalkürze’ gegeben, der Variable, zu deren Wirkung in der bisherigen Forschung ohnehin widersprüchliche Auffassungen aufgekommen waren. Der negative Koeffizient zeigt an, dass die positive Ausprägung dieser Variable die Chancen auf ein Genitivnomen mit ES senkt. 95 Wenn man bedenkt, dass in dieses Modell nur fünf der insgesamt 18 Faktoren (vgl. Kap. 2.5.2) eingehen, die die Varianz zu beeinflussen scheinen, ist das eine sehr beachtliche Aufklärungsrate. 96 Zur detaillierten Beschreibung und Interpretation in R berechneter Modelle der binären logistischen Regression vgl. Gries (2008, S. 285ff.). 97 Auch Schätzer (Estimate) genannt. Es handelt sich konkret um den natürlichen Logarithmus der Odds Ratio (ln) für die positive Ausprägung des Faktors. Schwache Faktoren und „frei“ variierende Nomina 95 Je weiter der Wert des Koeffizienten von 0 entfernt ist, desto stärker ist der Effekt. Aus dem Modell wird auf Anhieb ersichtlich, dass entsprechend Hypothese 2 der Effekt der Variable ‘Einsilber’ am stärksten ist. Der Effekt der positiven Ausprägung von ‘Vokalkürze’ aber zeigt nicht nur in die „falsche“ Richtung. Er ist auch unerwartet groß, sodass seine Effektstärke (die Effektrichtung beiseitegelassen) knapp die von ‘Konsonsonantengruppe’ übersteigt, was Hypothese 3 widerspricht. Die Größe der einzelnen Effekte wird greifbarer, wenn man die Effektkoeffizienten in die Odds Ratios (vgl. Gries 2008, S. 289) umwandelt und betrachtet, wie sich die Chancen auf ES verändern, wenn die jeweilige Variable ihre positive Ausprägung annimmt (vgl. Tab. 5). Faktor Odds Ratio Chancenzuwachs Einsilber 9,69 869% Plosiv 2,30 130% Konsonantengruppe 2,03 103% Vokaltiefe 2,64 164% Vokalkürze 0,47 -53% Tab. 5: Odds Ratio und Chancenzuwachs für ausgewählte schwache Faktoren (Einzelvariablen) im Regressionsmodell aus Listing 1 Bei ‘Einsilber’ ist ES bei der Ausprägung JA 9,69-mal wahrscheinlicher als bei der Ausprägung NEIN . Anders ausgedrückt: Die Wahrscheinlichkeit für ES erhöht sich um (9,69-1)*100 = 869%, wenn ‘Einsilber’ den Wert JA annimmt. Alle anderen Einzelvariablen folgen ‘Einsilber’ - was ihre Stärke angeht - in einem größeren Abstand, wobei das Schlusslicht, wie schon erwähnt, die Variable ‘Vokalkürze’ bildet, die bei der Ausprägung J A die Endung ES bereits weniger wahrscheinlich macht, und zwar um 53%. Die logarithmierten Odds Ratios (log 10 ), die den Vergleich der Variablen untereinander wieder erleichtern und an die Effektstärkeberechnungen aus Kapitel 2.5.2 anknüpfen, sind in Abbildung 26 zusammengestellt. Endungsvariation 96 Abb. 26: Effektrichtung und Effektstärke der schwachen Faktoren im Regressionsmodell aus Listing 1: log 10 Odds Ratio 98 Alles in allem ist in dieser Analyse des Verhaltens eines ganzen Faktorenbündels ein Bild entstanden, das sich im Wesentlichen nur an einem Punkt von dem aus Kapitel 2.5.2 unterscheidet: ‘Vokalkürze’ (‘Vokallänge: kurz’). Der Effekt der positiven Ausprägung dieser Variable erscheint jetzt zwar immer noch schwach, aber deutlich stärker als zuvor, vor allem aber wirkt er in die entgegengesetzte Richtung. Dass vor konsonantischem Auslaut kurze Vokale zur stärkeren S-Präferenz führen als lange Vokale, entspricht im Übrigen den Feststellungen Szczepaniaks (2010, S. 112) und stützt nicht die auf Pfeffer/ Morrison (1979, 1984) zurückgehenden Bemerkungen Fehringers (2011, S. 95f.). Im obigen Regressionsmodel wurde zwar berechnet, wie die Gesamtwirkung mehrerer Variablen auf die Einzelvariablen (Haupteffekte) zu verteilen ist. Die Kombinationen von Variablen wurden aber noch nicht als eigenständige Prädiktorvariablen in die Rechnung einbezogen. Existieren signifikante Interaktionen zwischen den Faktoren? Wie ist die Wirkung von Faktorenkombinationen einzuschätzen - etwa beim gleichzeitigen Vorliegen von Einsilbigkeit, Wortausgang auf Konsonantengruppe und Plosivauslaut wie in Rand, Licht, Korb, Markt? In einer weiteren Regressionsanalyse wird ein neues Modell berechnet, in dem nicht nur die Haupteffekte der einfachen Variablen, sondern auch die Interaktionen von Variablenkombinationen zur Prüfung 98 In Klammern werden Variablenbezeichnungen aus Kapitel 2.5.2 angegeben. Schwache Faktoren und „frei“ variierende Nomina 97 anstehen. Es soll zu einer feingliedrigeren Faktorenstruktur führen und den Beitrag der Interaktionen greifbar machen. Da die Interpretation von Interaktionen sehr komplex zu werden droht, konzentrieren wir uns auf die Zweierkombinationen mit dem stärksten Faktor ‘Einsilber’ und arbeiten zusätzlich die Interaktion einer Dreierkombination auf, in der ‘Einsilber’ mit den beiden übrigen, in der Forschung gut etablierten Faktoren - ‘Konsonantengruppe’ und ‘Plosiv’ - zusammenwirkt. Es spricht zunächst nichts dagegen anzunehmen, dass es bei in die gleiche Richtung wirkenden Einflussgrößen zur Effektpotenzierung kommen kann. Unsere spezifischen Hypothesen lauten also: 4) Die Effektrichtungen und die Effektstärkeverhältnisse ähneln bei Haupteffekten denen des Modells ohne Interaktionen. 5) Der ES-Effekt bei Einsilbern wird in Interaktionen gesteigert, an denen positive Ausprägungen von Faktoren beteiligt sind, deren Haupteffekt ebenfalls in Richtung ES zeigt. 6) Der ES-Effekt bei Einsilbern wird in Interaktionen geschwächt, an denen die positive Ausprägung eines Faktors beteiligt ist, dessen Haupteffekt in Richtung S zeigt. Die Berechnung in R ergibt das Modell in Listing 3. List. 3: Modell der logistischen Regression für ausgewählte schwache Faktoren und ihre Interaktionen Endungsvariation 98 Erneut korrelieren alle Variablen - einschließlich der Interaktionen - höchst signifikant mit der Endungswahl und das Modell erweist sich statistisch als belastbar (vgl. die Informationen des zweiten Blocks der Ausgabe; es werden 74% aller Endungsentscheidungen korrekt vorhergesagt). Bei den Haupteffekten ähneln die Effektrichtungen und Effektstärkeverhältnisse grob 99 denen des ersten Modells (vgl. Hypothese 4). Bei der Überprüfung der Interaktionen tauchen aber drei klare Abweichungen von unseren Hypothesen auf: Hier zeigt das Vorzeichen des Effektkoeffizienten (Coef) an, ob die Interaktion den Effekt der beteiligten Variable, die stärker zugunsten von ES wirkt, steigert oder senkt, und so ist es unvereinbar mit Hypothese 5, dass die Interaktionen ‘Einsilber=ja * Konsonantengruppe=ja’ und ‘Einsilber=ja * Vokaltiefe=ja’ zu negativen Effekten führen, und mit Hypothese 6, dass die Interaktion ‘Einsilber=ja * Vokalkürze=ja’ zu einem positiven Effekt führt. Die restlichen Interaktionen verhalten sich hypothesenkonform. Der ES-Effekt potenziert sich bei der Interaktion positiver Variablenausprägungen, die in die gleiche Richtung wirken (vgl. oben Hypothese 5), und zwar in den Kombinationen aus: a) ‘Einsilber’ und ‘Plosiv’ b) ‘Plosiv’ und ‘Konsonantengruppe’ c) ‘Einsilber’, ‘Plosiv’ und ‘Konsonantengruppe’ Dabei erscheint in Interaktion a) der Effekt der Einzelvariable ‘Plosiv’ sogar nahezu im herkömmlichen Sinne additiv verrechnet (in Listing 3 gleicht der Effektkoeffizient der Interaktion, der in dem Fall die Steigerung des Effekts von ‘Einsilber’ anzeigt, beinahe dem Effektkoeffizient der Einzelvariable ‘Plosiv’). Allerdings ist diese Zweierinteraktion wie auch die Zweierinteraktion b) in der Dreierinteraktion c) enthalten. Alle Effekte sollten daher nur im Rahmen der letzteren, ‘höherwertigen’ Interaktion interpretiert werden (siehe weiter unten). Wie dieses bisher nur zum Teil nachvollziehbare Ergebnis im Einzelnen zustande kommt, zeigt Abbildung 27. 100 99 Knapp um die Hälfte schwächer erscheint jetzt ‘Plosiv’. 100 Zur Abbildung: Abgetragen sind die vom Modell geschätzten, rohen Wahrscheinlichkeiten des Auftretens der ES-Endung (y-Achse). Die interagierenden Faktoren sind über Abschnitte auf der x-Achse und den Geradentyp dargestellt (oben). Im Schwache Faktoren und „frei“ variierende Nomina 99 Abb. 27: Interaktionseffekte im Modell der logistischen Regression aus Listing 2 Die beiden ersten Diagramme illustrieren das nicht hypothesenkonforme Zusammenwirken von Variablen in Zweierinteraktionen. Im ersten Diagramm wird die Wirkung von ‘Einsilber’ durch ‘Vokaltiefe’ moduliert, d.h. die zweitstärkste, in die gleiche Richtung wirkende Einzelvariable. Der Zuwachs des ES-Anteils beim Eintritt der positiven Ausprägung der Variable ‘Einsilber’ wird dabei kleiner, sobald in der letzten Silbe ein tiefer Vokal erscheint (die Steigung der gestrichelten Linie ist geringer als jene der durchgezogenen Linie). Dies erklärt das unerwartete, negative Vorzeichen des Effektkoeffizienten bei der Interaktion ‘Einsilber * Vokaltiefe’ in Listing 3, und ändert offensichtlich nichts an der Tatsache, dass das Erscheinen eines tiefen Vokals in der letzten Silbe grundsätzlich mit dem Anstieg des ES-Anteils einhergeht (die gestrichelte Linie befindet sich konsistent über der durchgezogenen Linie). In der Zweierinteraktion, die im zweiten Diagramm dargestellt wird, interagieren die Variablen mit entgegengesetzten Wir- Falle der Dreierinteraktion (unten) tritt zusätzlich eine Aufspaltung in Teildiagramme („Konsonantengruppe: nein“ vs. „Konsonantengruppe: ja“) hinzu. Endungsvariation 100 kungsrichtungen. Der Zuwachs des ES-Anteils beim Eintritt der positiven Ausprägung von ‘Einsilber’ ist hier geringfügig größer, wenn in der letzten Silbe ein kurzer Vokal steht (die gestrichelte Linie ist minimal steiler als die durchgezogene Linie). Unberührt bleibt dabei unsere noch frische Erkenntnis, dass der ES-Anteil grundsätzlich sinkt, sobald in der letzten Silbe ein kurzer Vokal auftritt (die gestrichelte Linie bleibt immer unter der durchgezogenen Linie). Insgesamt zeigen die beiden Zweierinteraktionen also, dass der ES-fördernde Einfluss der Einsilbigkeit vor dem Hintergrund einer in die entgegengesetzte Richtung wirkenden Einflussgröße deutlicher wird als vor dem Hintergrund einer Einflussgröße, die selbst relativ stark ES fördert. Dieses Zwischenergebnis mag nach obigen Erläuterungen zwar einleuchten, entspricht aber wie gesagt nicht unseren eingangs formulierten Hypothesen. In die durch zwei Teildiagramme illustrierte Dreierinteraktion gehen außer ‘Einsilber’ die Variablen, ‘Plosiv’ und ‘Konsonantengruppe’ ein, deren Haupteffekte bei positiver Ausprägung zugunsten von ES wirken. Der Zuwachs des ES-Anteils beim Eintritt der positiven Ausprägung von ‘Einsilber’ fällt grundsätzlich größer aus, wenn im Auslaut ein Plosiv steht (die gestrichelte Linie ist in beiden Teildiagrammen steiler als die durchgezogene Linie) - dies scheint allerdings nicht zu den gerade gezogenen Schlüssen aus der Analyse der Zweierinteraktionen zu passen. Das Erscheinen einer Konsonantengruppe am Wortende senkt wiederum den Zuwachs des ES-Anteils beim Eintritt der Einsilbigkeit (ob mit oder ohne Plosivlaut - beide Linien im rechten Teildiagramm sind weniger steil als ihre Pendants im linken Teildiagramm) - somit verhält sich die Variable ‘Konsonantengruppe’ wie der Faktor ‘Vokaltiefe’ weiter oben und die Interaktion ‘Einsilber * Konsonantengruppe’ erhält in Listing 3 einen negativen Koeffizienten. In Konsonantengruppen am Wortende hat aber das Erscheinen eines Plosivauslauts durchgehend (also auch und sogar etwas stärker bei Mehrsilbern) einen merklichen Anstieg des ES-Anteils zur Folge (im rechten Teildiagramm liegt die gestrichelte Linie immer deutlich über der durchgezogenen Linie). Diese Tatsache sichert schließlich das Ergebnis, in dem die Interaktion der positiven Ausprägungen aller drei Variablen knapp einen positiven Effekt erreicht (vgl. den extrem kleinen, aber positiven Effektkoeffizienten der Dreierkombination in Listing 3). Schwache Faktoren und „frei“ variierende Nomina 101 Auf welchen Unterschied zwischen einerseits ‘Plosiv’ und andererseits ‘Konsonantengruppe’ und ‘Vokaltiefe’ könnte es bei den unterschiedlichen Effektrichtungen der entsprechenden Zweierinteraktionen mit ‘Einsilber’ ankommen? Betrachtet man in Listing 3 die Koeffizienten der Einzelvariablen, so ist der ES-fördernde Effekt bei einem Plosivauslaut um ca. 36% kleiner als bei einer Konsonantengruppe und um ca. 61% kleiner als bei einem tiefen Vokal in der letzten Silbe. Es scheint also, dass nicht nur die in die entgegengesetzte Richtung wirkenden Einflussgrößen wie die Vokalkürze den ES-fördernden Einfluss der Einsilbigkeit deutlicher werden lassen können, sondern zusätzlich auch solche, die wie der Plosivauslaut nur schwach zugunsten von ES wirken. Die Konsonantengruppe am Wortende und der a-Vokal (‘Vokaltiefe’) in der letzten Silbe, die schon selbst den ES-Anteil stärker anheben, schwächen jedenfalls den Effekt der Einsilbigkeit etwas, ganz so, als ob der ES-Anteil nach oben limitiert wäre. Es darf hier nicht verschwiegen werden, dass unerwartete Effekte durch Interaktionen schließlich auch davon herrühren können, dass die hier an die Forschungstradition angelehnten Variablenformulierungen wie ‘Konsonantengruppe’ (vgl. Faktor 6 in Tab. 1 aus Kap. 1.3) bereits komplexe formale Phänomene umfassen. So kann die Konsonantengruppe, eine sog. komplexe Koda, im Deutschen am Nomenende bis zu vier Konsonanten umfassen (z.B. Arzt - / aːrtst/ ), die jeweils unterschiedliche Konsonantentypen (Liquid, Nasal, Frikativ, Affrikate, Plosiv) repräsentieren können und unterschiedlich (allerdings meist nach abnehmender Sonorität) angeordnet sein können (vgl. dazu Zifonun et al. 1997, Bd. 1, S. 184ff.). Dass unterschiedliche Konsonantenkombinationen eigentlich unterschiedliche Auswirkungen auf die Endungswahl haben, ist zu vermuten (dazu Kap. 2.5.7). Es ist denkbar, dass eine Vorgehensweise, in der die nominalen Variablen ‘Konsonantengruppe’ und ‘Plosiv’ in einer mehrstufigen ordinalskalierten Variable aufgehen würden, die man ‘Kodakomplexität’ oder ‘Obstruenz’ nennen könnte, dem Sprachgebrauch angemessener wäre. Und schließlich ist es bei der Fülle der in der Forschung vorgeschlagenen Faktoren der Endungsvariation sehr wahrscheinlich, dass die in diesem Kapitel untersuchten Variablen noch mit anderen Variablen in signifikanter Weise interagieren. Diese noch offenen Fragen können in unserer exemplarischen Analyse aber nicht mehr geklärt werden und bleiben Forschungsaufgaben. Endungsvariation 102 Insgesamt betrachtet legten die beiden Regressionsmodelle offen, wie komplex sich die Wirkung von Faktorengruppen in unserem Fall aufbaut. Korrigiert wurden die Erkenntnisse aus Kapitel 2.5.2, in dem Faktoren einzeln geprüft wurden, im Wesentlichen nur an einer Stelle - ein kurzer Vokal in der geschlossenen letzten Silbe zeigt jetzt einen stärkeren und anders, und zwar auf S, ausgerichteten Effekt. Vor allem aber wurde unser Wissen um das Verständnis der Interaktionen zwischen den Faktoren erweitert. Es zeigte sich, dass in unserem Material die ES-fördernde Wirkung der Einsilbigkeit, durch den kurzen Vokal, den Plosivauslaut sowie die Kombination aus Plosivauslaut und Konsonantengruppe gesteigert wird, aber durch die Konsonantengruppe alleine wie auch durch den tiefen Vokal geschwächt wird. Dies hat kaum Auswirkungen auf die isolierte Betrachtung der ohnehin am stärksten wirkenden Einsilbigkeit, muss aber bei Einschätzungen der übrigen, weit schwächeren Einflussgrößen immer bedacht werden. Interessanterweise lässt sich der ES-Effekt der Einsilbigkeit durch Kombinationen mit anderen Faktoren offensichtlich nur noch geringfügig steigern. Zu einer Potenzierung des ES-Effekts scheint es schließlich in der Interaktion des Plosivauslauts mit der Konsonantengruppe am Wortende zu kommen - und zwar sowohl bei Einals auch Mehrsilbern, wie es sich am Rande der Interpretation der Dreierinteraktion ergibt. Es bleibt festzuhalten, dass sich die Bedeutung der Einsilbigkeit für die ES-Wahl eindrucksvoll bestätigt und dass die übrigen hier untersuchten Faktoren für die Endungswahl ebenfalls relevant, aber in der Gesamtkonstellation der Variationsfaktoren nicht überzubewerten sind. 2.5.5 Vokallänge In der obigen Regressionsanalyse wurde unter anderem mittels einer nominalen Variable ‘Vokalkürze’ mit den Ausprägungen JA oder N E I N die Quantität des Vokals in der geschlossenen letzten Silbe 101 analysiert. Grund dafür war nicht zuletzt, dass der Einfluss der Vokalquantität auf die Endungswahl in der Fachliteratur kontrovers behandelt wird. 102 Das Ergebnis obiger Regressionsanalysen war, dass die Vokalkürze eine zwar höchst signifikante, aber sehr schwache Wirkung zu- 101 Nomina mit einem Schwa vor Konsonant in der letzten Silbe sind hier ausgeschlossen, weil sie in Kapitel 2.4.2 dem Bereich tendenziell invarianter Nomina zugeordnet wurden. 102 Vgl. auch Kapitel 2.1. Schwache Faktoren und „frei“ variierende Nomina 103 gunsten von -s zeigt. Dies stützt die Feststellung Szczepaniaks (2010, S. 112), dass die Endung -s bei kurzen Vokalen (z.B. des Klang(e)s) marginal häufiger als bei langen Vokalen (z.B. des Wein(e)s) erscheint. Die erwähnten unterschiedlichen Forschungsmeinungen beziehen sich in erster Linie aber speziell auf einsilbige Nomina: Während Fehringer (2011, S. 95) in Berufung auf Pfeffer/ Morrison (1979) bei Einsilbern, die einen kurzen Vokal vor Einzelkonsonant enthalten, von einer Präferenz für -es spricht (z.B. Stoffes), macht Szczepaniak (2010, S. 116) bei solchen Nomina insgesamt eine starke Tendenz zu -s aus. Interessanterweise betreffen die Feststellungen von Pfeffer/ Morrison (1979, S. 310), auf die sich Fehringer beruft, nicht nur Einsilber, sondern auch Mehrsilber und dabei nicht einfach alle Nomina mit einem kurzen Vokal, sondern - in einer graphemisch orientierten Darstellung - konkret die Nomina auf -s, -ch, -ff, -ll, -mm, -nn, -tt, -zt, -sch, -st. Ferner postulieren Pfeffer und Morrison bei solchen Nomina nicht eine Neigung zu -es, sondern letztlich einen (nahezu) ausnahmslosen Einsatz dieser Endung. Hinsichtlich der einheimischen Nomina auf -zt, -sch, -st und vor allem -s wird diese Meinung allgemein geteilt. Dementsprechend wurden die Auslauttypen s-Laut, sch-Laut und st-Gruppe (einschließlich <zt>) in dieser Studie bereits unter den starken Faktoren behandelt. 103 Das Postulat der Ausnahmslosigkeit von -es bei den restlichen Nomina findet in der Spezialliteratur aber kein großes Echo. Wohlgemerkt, Nomina auf -ch können sowohl einen kurzen Vokal als auch einen Diphthong in der letzten Silbe enthalten (z.B. Tuch respektive Teich) und nur bei den übrig gebliebenen Auslauten -ff, -ll, -mm, -nn, -tt lässt die grafische Verdopplung des Konsonanten eindeutig auf einen vorangehenden kurzen Vokal schließen wie in Stoff oder Fall. Die dazugehörigen Nomina repräsentieren dabei sehr viele, aber nicht alle Nomina auf Einzelkonsonant mit einem kurzen Vokal in der letzten Silbe (man denke etwa an Fälle wie Schmuck oder Gestrüpp). Fassen wir die Meinungen zu Nomina mit einem kurzen Vokal in der letzten Silbe zusammen: Pfeffer und Morrison schlagen die Ausnahmslosigkeit von -es für einen großen Teil der Nomina mit einem kurzen 103 Vgl. Kapitel 2.4.2. Alle drei Auslaute wurden noch einmal in Kapitel 2.5.3 im Kontext des Übergangs von starken zu schwachen Faktoren herangezogen. Dabei stellte sich vor allem für den Auslaut auf sch-Laut heraus, dass die Annahme einer (selbst tendenziellen) Invarianz sehr problematisch ist. Endungsvariation 104 Vokal vor Einzelkonsonant vor, daraufhin spricht Fehringer pauschal bei Einsilbern mit einem kurzen Vokal vor Einzelkonsonant von einer Präferenz für -es, wogegen Szczepaniak bei Einsilbern auf einen oder mehreren Konsonanten bei einem kurzen Vokal marginal häufiger die Endung -s findet als bei einem langen Vokal und schließlich bei Einsilbern auf Einzelkonsonant bei einem kurzen Vokal eine starke Tendenz zu -s feststellt. Es bleibt noch hinzuzufügen, dass ein langer Vokal vor konsonantischem Auslaut lediglich Pfeffer und Morrison näher beschäftigt: Sie attestieren den Einsilbern mit einem langen Vokal bzw. einem Diphthong vor Einzelkonsonant eine Verwendung von -es in zwei Drittel aller Fälle (z.B. Staates oder Kleides, vgl. Pfeffer/ Morrison 1979, S. 307f.). Unsere bisherigen Ergebnisse (vgl. Kap. 2.5.2 und 2.5.4) bezogen sich auf alle Nomina des Grundwortschatzes, ohne Rücksicht darauf, ob sie ein- oder mehrsilbig sind, ob sie auf einen oder auf mehrere Konsonanten ausgehen. Unterschiedliche Forschungsmeinungen liegen aber vor allem bei der spezielleren Gruppe der auf einen Einzelkonsonanten auslautenden Einsilber vor, in der kurze und lange Vokale anders als sonst gleichermaßen zulässig sind (vgl. Eisenberg 2004, S. 119; Duden 2009, S. 45). Ferner lag unseren bisherigen Feststellungen die Tokenperspektive zugrunde, d.h., dass sich die relativen Häufigkeiten der beiden Endungen auf die Token bezogen, die nicht einzelnen Lexemen/ Lemmata zugeordnet wurden. 104 Fehringer (2011) und Szczepaniak (2010) betrachten dagegen die Häufigkeiten der Endungen pro Lexem bzw. das arithmetische Mittel der relativen Häufigkeiten der Endungen pro Lexem, und auch Pfeffer/ Morrison (1979, 1984) zählen, um ihre Feststellungen zu illustrieren, ganze Reihen von konkreten, sich passend verhaltenden Nomina auf. Um die Schlussfolgerungen aus diesen Arbeiten umfassend zu evaluieren, muss für unsere Daten eine Lexembzw. Lemmaperspektive auf Einsilber auf Einzelkonsonant hergestellt werden. Tabelle 6 enthält die Mittelwerte aus relativen Häufigkeiten für -es bei den Einsilber-Lemmata mit einem kurzen Vokal, den Einsilber-Lemmata mit einem langen Vokal und bei den Einsilber-Lemmata insgesamt und vergleicht sie mit den entsprechenden relativen Häufigkeiten aus der Tokenperspektive. 104 Das machte u.a. unsere Berechnungen zur Effektstärke mittels der Odds Ratio und des Phi-Koeffizienten möglich. Schwache Faktoren und „frei“ variierende Nomina 105 Anteil ES pro Lemma (Lemmaperspektive) Einsilber mit Kurzvokal Einsilber mit Langvokal (einschließlich Diphthong) alle Einsilber auf Einzelkonsonant Arithmetisches Mittel 0,26 0,32 0,30 Median 0,00 0,12 0,00 Standardabweichung 0,34 0,36 0,35 Anteil ES total (Tokenperspektive) 0,64 0,70 0,69 Tab. 6: Anteil der ES-Token und Vokallänge bei Einsilbern auf Einzelkonsonant (in den von starken Faktoren nicht beeinflussten Daten) Die aufgeführten arithmetischen Mittel scheinen vorerst die Feststellungen Szczepaniaks (2010) zu bestätigen, weil der Wert bei kurzem Vokal niedriger ausfällt als bei langem Vokal. Entsprechend scheint der kurze Vokal in Richtung -s und der lange (Diphthong einschließlich) in Richtung -es zu wirken. Dass der Unterschied zwischen dem Wert für Einsilber mit kurzem Vokal und dem für alle Einsilber größer ist als der Unterschied zwischen dem Wert für alle Einsilber und dem für Einsilber mit langem Vokal, liegt übrigens lediglich daran, dass es mehr Lemmata mit langem Vokal gibt als mit kurzem Vokal (das Verhältnis beträgt nach manueller Bereinigung der Lemmalisten 105 181 : 100). Skeptisch stimmt uns, dass in obiger Tabelle die Standardabweichung des arithmetischen Mittels jedes Mal sehr beachtlich ausfällt. Eine Überprüfung der Validität solcher Vergleiche auf der Lexemebene ist also unbedingt notwendig. Es stellt sich dabei heraus, dass die Signifikanz der oben festgestellten Unterschiede nicht mit einem parametrischen Verfahren (z.B. t-Test) 106 überprüft werden kann. Die relativen Häufigkeiten für Lemmata, die in unserem Fall mit Lexemen gleichge- 105 Ausgeschlossen wurden dabei vor allem einige Lemmata, die nicht nur Appellativa, sondern auch Sonderwortschatzeinheiten sein können wie Rock (auch Musikstil oder Eigenname) oder Hof (auch Eigenname), weil die beiden Verwendungen nicht immer automatisch voneinander getrennt werden konnten. 106 Die Normalverteilungsannahme des t-Tests ist verletzt. Endungsvariation 106 setzt werden können, sind nämlich in keiner der drei angesetzten Nomengruppen normalverteilt. 107 Abbildung 28 zeigt dies für die Gesamtgruppe ‘alle Einsilber auf Einzelkonsonant’. Abb. 28: Anzahl der Lemmata in verschiedenen ES-Anteil-Bereichen bei Einsilbern auf Einzelkonsonant in den von starken Faktoren nicht beeinflussten Daten (Histogramm) Statt zur Mitte der x-Achse hin - was einer Normalverteilung näher kommen würde - steigt die Anzahl der Lemmata an den beiden Enden der x-Achse, wobei insbesondere die Anzahl der Lemmata auffällt, die zur Ausnahmslosigkeit von -s tendieren. Die Signifikanz der in Tabelle 6 festgestellten Unterschiede zwischen Mittelwerten kann daher nur mit einem konservativeren, nicht parametrischen Test geprüft werden. Die Ergebnisse der in R berechneten Wilcoxon-Tests für jede der drei Nomengruppen werden in Abbildung 29 nebeneinander dargestellt. Darin stehen die kleinen Kreise für die sog. Pseudo-Mediane der einzelnen Gruppen und die Fehlerbalken („Whiskers“) symbolisieren die 95%igen Konfidenzintervalle. Es zeigt sich, dass der Unterschied bezüglich des ES-Anteils zwischen Einsilbern mit kurzem Vokal und Einsilbern mit langem Vokal nicht signifikant ist, was daraus ersichtlich ist, dass sich die Werte der Pseudo-Mediane jeweils im Konfidenzbereich der anderen Gruppe befinden (so ragt etwa der Fehlerbalken der Einsilber mit Kurzvokal weit über den Wert des Pseudo-Medians für Einsilber mit Langvokal hinaus). 107 Auch Szczepaniaks relative Häufigkeiten für einzelne Einsilber-Lemmata (zu den Werten siehe Szczepaniak 2010, S. 111f.) sind nicht normalverteilt. Schwache Faktoren und „frei“ variierende Nomina 107 Abb. 29: Unterschiede zwischen den Anteilen der ES-Token pro Lemma bei Einsilbern mit Kurzvokal und Langvokal sowie bei allen Einsilbern (einzelne Wilcoxon-Tests in R) Festzuhalten bleibt: Obwohl die Mittelwerte des ES-Anteils pro Lemma für Einsilber mit kurzem Vokal prinzipiell niedriger ausfallen als für Einsilber mit langem Vokal, lässt sich in unserem Material aus der Lemmaperspektive kein signifikanter Unterschied zwischen den beiden Gruppen feststellen. Überprüft man auch in den Daten Szczepaniaks (2010) den Unterschied zwischen den beiden Einsilbergruppen mit dem Wilcoxon-Test, so erweist er sich beim 95%-igen Konfidenzniveau zwar als signifikant, aber nur beschränkt belastbar. 108 Der Wert für den ES-Anteil für Einsilber mit kurzem Vokal (31 Lemmata) beträgt 0,51499 ((Pseudo-)Median) beim Konfidenzintervall von 0,40410 bis 0,63005 - für Einsilber mit langem Vokal (75 Lemmata) 0,63006 ((Pseudo-)Median) beim Konfidenzintervall von 0,55008 bis 0,70505 (die obere Grenze des Konfidenzintervalls der ersten Gruppe bleibt nur 0,00001 unter dem (Pseudo-) Median der zweiten Gruppe, vgl. Hervorhebungen). Insgesamt geben obige Überprüfungen also noch keinen richtig befriedigenden Aufschluss über den Wirkungsunterschied zwischen Einsilbern mit Vokalen verschiedener Länge. Um ihn weiter zu validieren, 108 Szczepaniak selbst zieht ihre Schlussfolgerungen auf der Basis eines Vergleichs der arithmetischen Mittel der relativen Häufigkeiten für -s für Lexeme der beiden Gruppen. Die Signifikanz des Unterschieds wird bei ihr nicht explizit überprüft. Endungsvariation 108 wechseln wir daher zur Tokenperspektive auf unsere Daten 109 zurück. Auch aus dieser Perspektive zeigen Einsilber mit kurzem Vokal Tabelle 6 zufolge eine s-Tendenz. Die Werte für alle Nomengruppen sind übrigens viel höher als die arithmetischen Mittel der ES-Anteile pro Lemma, was darauf hinweist, dass Nomina mit einer ES-Tendenz insgesamt mehr Token aufweisen als Nomina mit einer S-Tendenz. Der ES-Anteil bei Einsilbern mit langem Vokal ist erneut nur minimal höher als bei allen Einsilbern - er stimmt in etwa mit den Schätzungen von Pfeffer/ Morrison (1979, S. 307) überein. 110 Die Frage nach der Normalverteilung der Werte stellt sich bei der Tokenperspektive nicht, weil es jetzt nur eine relative Häufigkeit pro Nomengruppe gibt und nicht die vielen relativen Häufigkeiten pro Lemma. Da wir dabei mit großen Tokenzahlen zu tun haben, ist die Signifikanz der Unterschiede auf jeden Fall gegeben. Darauf weisen in Abbildung 30 schon die extrem kleinen Fehlerbalken für Konfidenzintervalle an den Spitzen der Säulen hin. Abb. 30: Anteil der ES-Token (Tokenperspektive) bei Einsilbern mit kurzem und langem Vokal sowie bei allen Einsilbern (Test of Proportions in R - die durch Säulen dargestellten Anteile wurden anhand absoluter Häufigkeiten berechnet, vgl. Tab. 6 im Anhang) 109 Für Szczepaniaks Daten stehen uns die Tokenzahlen nicht zur Verfügung. 110 „-es is added in two out of three cases to: [...] indigenous or foreign nouns of one syllable ending in one consonant preceded by a long vowel or a diphthong [...]“ (Pfeffer/ Morrison 1979, S. 307). Schwache Faktoren und „frei“ variierende Nomina 109 Der Chi-Quadrat-Unterschiedstest zwischen den Einsilbern mit kurzem Vokal und Einsilbern mit langem Vokal ergibt entsprechend ein höchst signifikantes Ergebnis: X-squared = 662.0762, df = 1, p-value < 2.2e-16. Die Vokallänge bei Einsilbern hat demzufolge einen Einfluss auf die Endungswahl - (allerdings ist die Stärke dieses Effekts mit Phi = 0,05 minimal, vgl. Abb. 32 unten). Die Feststellungen Szczepaniaks (2010) können anhand unseres Materials somit aus der Tokenperspektive ansatzweise gestützt werden: Szczepaniak spricht von einer „starken Tendenz“ der Einsilber mit kurzem Vokal zu -s - die Stärke bleibt in unseren Daten aus. Nach dieser Evaluation der Ergebnisse bisheriger Forschung, wenden wir uns neuen Einsichten in die Einflüsse der Vokallänge auf die Endungswahl zu. Im vorliegenden Kapitel wurde der Bereich Vokalquantität bisher - in Anlehnung an die weiter oben referierten Fachbeiträge - binär aufgeteilt. In dieser binären Aufteilung werden Nomina, die auf Diphthonge vor Konsonanten enden wie Streit, Rauch, Zeug, Verein, Spielraum, Geheul, unter der Kategorie ‘Nomen mit langem Vokal’ mit behandelt, obwohl sie hinsichtlich der Endungswahl in unserem Material teilweise anders einzustufen sind als Nomina mit den restlichen langen Vokalen wie Rat, Weg, Hof, Spiel, Buch, Vorjahr, Bahnhof, Gebiet. Schon in Abbildung 19 zu Verhältnissen bei Ein- und Mehrsilbern mit einem oder mehreren Konsonanten am Wortausgang (vgl. Kapitel 2.5.2) haben wir Diphthonge daher getrennt von den sonstigen langen Vokalen aufgeführt. Auch in Bezug auf die hier fokussierten Einsilber auf Einzelkonsonant ergibt sich aus der Tokenperspektive ein deutlicher und bei den hohen Tokenzahlen höchst signifikanter Unterschied 111 zwischen Diphthongen und sonstigen langen Vokalen (vgl. Abb. 31, auf die Darstellung der extrem kleinen Konfidenzintervalle wird verzichtet). Diphthonge vor Einzelkonsonant wirken unerwartet zugunsten der Endung -s, und zwar sogar viel deutlicher als kurze Vokale. Folglich fördern jetzt sonstige lange Vokale die Endung -es stärker. Die in Abbildung 32 zusammengestellten Phi-Werte zeigen einerseits, dass Diphthonge auch unter Berücksichtigung der Reichweite der Faktoren hin- 111 Beim 95%-igen Konfidenzniveau ist bei unseren hohen Tokenzahlen die Signifikanz der aus der Tokenperspektive festgestellten Unterschiede prinzipiell, d.h. sowohl hier als auch in den vorangegangenen Kapiteln, immer gegeben. Endungsvariation 110 sichtlich der Effektstärke einen deutlichen Vorsprung vor kurzen Vokalen behalten, andererseits, dass die Effekte allesamt als klein einzustufen sind (Phi < 0,2). Abb. 31: Anteil der ES-Token (Tokenperspektive) und Vokallänge bei separater Behandlung von Einsilbern mit Diphthong (*Langvokal ohne Diphthong) Abb. 32: Effektstärke einzelner Ausprägungen der Vokallänge bei Einsilbern auf Einzelkonsonant: Korrelationskoeffizient Phi (*Langvokal ohne Diphthong) Aus der Lemmaperspektive kann in unserem Material mithilfe der Wilcoxon-Tests für einzelne Stichproben beim 95%-igen Konfidenzniveau aufgrund ähnlich großer Konfidenzintervalle wie in Abbildung 29 kein signifikanter Unterschied zwischen den Einsilbern mit Diphthong und den Einsilbern mit sonstigem langem Vokal festgestellt werden. Wendet man die Tests auf die Daten Szczepaniaks an, zeichnet sich ein solcher Unterschied interessanterweise doch ab (vgl. Abb. 33). Schwache Faktoren und „frei“ variierende Nomina 111 Abb. 33: Unterschiede zwischen den Anteilen der ES-Token pro Lemma bei Einsilbern mit Kurzvokal, Langvokal (ohne Diphthong) und Diphthong sowie bei allen Einsilbern auf Einzelkonsonant (einzelne Wilcoxon- Tests in R) in den Daten Szczepaniaks (2010) Dabei liegt der (Pseudo-)Median für Nomina mit Diphthong auch unter dem (Pseudo-)Median für Nomina mit kurzem Vokal. Der Unterschied ist aber bei Weitem nicht signifikant. Es drängt sich noch die Frage auf, warum alle ES-Anteil-Werte bei der Lemmaperspektive so viel niedriger ausfallen als entsprechende Werte bei der Tokenperspektive (z.B. für ‘alle Einsilber’ sind es in Tab. 6 weiter oben 0,30 vs. 0,69), und dies, obwohl es doch so viele Lemmata gibt, die sehr stark zu -s neigen (vgl. Abb. 28 oben). Das liegt daran, dass die vielen extrem zu -s neigenden Lemmata im Allgemeinen viel weniger Token pro Lemma aufweisen als die stark zu -es tendierenden Lemmata (die Hapaxlegomena haben in unserem Material immer ein -s, z.B. Hiebs, Tuffs). Das gewichtete Histogramm in Abbildung 34 weiter unten zeigt die Token-Verteilung auf verschiedene ES-Anteil-Bereiche für die Gesamtgruppe ‘alle Einsilber auf Einzelkonsonant’. Das Tokenübergewicht bei den Lemmata mit hohem ES-Anteil ist sehr deutlich. Das allgemeine Bild aus Abbildung 34 wird in der Untergruppe ‘Einsilber mit Diphthong’ in spezifischer Weise modifiziert. Hier weisen Lemmata mit einem niedrigen ES-Anteil verhältnismäßig viele Token auf, vgl. Abbildung 35. Dieser Tendenz folgen beispielsweise Schein (703 Token, 15% ES), Teil (3184 Token, 17% ES), Streit (4293 Endungsvariation 112 Token, 17% ES), Kauf (512 Token, 25% ES), und eben diese Tendenz wird durch den niedrigen ES-Anteil-Wert der Einsilber mit einem Diphthong gespiegelt. Abb. 34: Tokenzahl in verschiedenen ES-Anteil-Bereichen bei allen Einsilbern auf Einzelkonsonant (gewichtetes Histogramm) Abb. 35: Tokenzahl in verschiedenen ES-Anteil-Bereichen bei Einsilbern mit Diphthong (gewichtetes Histogramm) Schwache Faktoren und „frei“ variierende Nomina 113 Es bleibt noch zu vermerken, dass bei Nomina auf -ch, -ff, -ll, -mm, -nn, -tt keine Besonderheiten im Sinne der von Pfeffer/ Morrison (1979) postulierten Ausnahmslosigkeit von -es bzw. einer sehr deutlichen Tendenz zu -es zu beobachten sind: Bei den hier fokussierten Einsilbern zeigt nur der Auslaut auf -ch eine überdurchschnittliche Präferenz für -es-Fälle (ES-Anteil von 84% gegenüber 71% bei allen Einsilbern - vgl. Tabelle 6 im Anhang) - dieser Tendenz folgen z.B. Buches, Daches, Deiches (vgl. jedoch Kap. 2.5.7 zu prinzipiellen Unterschieden zwischen [x] und [ç]). Bei Mehrsilbern, die bei Pfeffer/ Morrison (1979) mitgemeint waren, zeigen die Nomina auf -ch sogar einen Effekt zugunsten von -s. Insgesamt scheint die Vokallänge nur einen geringen Einfluss auf die Markierungsvariation zu haben. Die relativen Häufigkeiten der Endungen pro Lemma sind nicht normalverteilt. Daher lassen sich aus der Lemmaperspektive kaum gesicherte Erkenntnisse gewinnen. Signifikante Unterschiede sind erst dann eminent, wenn man die Tokenperspektive einnimmt und für verschiedene Vokallängenausprägungen die relativen Häufigkeiten eines Endungstyps in der Gesamtheit der Token betrachtet. Dabei führen kurze Vokale bei Einsilbern auf Einzelkonsonant zu einem sehr kleinen S-Effekt. Dies ist ansatzweise mit den Feststellungen Szczepaniaks (2010) vereinbar, die hier eine starke Tendenz zu -s postuliert - allerdings aus der (unserer Lemmaperspektive entsprechenden) Lexemperspektive. Bei einem erneuten, genaueren Blick auf die Daten zeigt sich, dass in der Gruppe der Nomina mit einem langen Vokal prinzipiell zwischen den Nomina mit einem Diphthong und den Nomina mit den restlichen langen Vokalen unterschieden werden muss. Während lange Vokale einen ES-Effekt zeigen, wirken Diphthonge unerwarteterweise zugunsten von S, und zwar sogar deutlicher als kurze Vokale. Als Resümee aus methodischer Sicht lässt sich also feststellen, dass die Lexembzw. Lemmaperspektive für Untersuchungen wie die vorliegende nur bedingt nutzbar gemacht werden kann. 2.5.6 Vokalhöhe Auch bei der Höhe des Vokals in geschlossener letzter Silbe führt die Lemmaperspektive aufgrund der großen Streuung der relativen Häufigkeiten für -es pro Lemma zu keinen gesicherten Erkenntnissen, sodass wir uns in diesem Kapitel auf die Tokenperspektive konzentrie- Endungsvariation 114 ren (auch wenn wir als Beispiele die zu den Tendenzen passenden Lemmata angeben). In der Regressionsanalyse in Kapitel 2.5.5 wurde die Vokalhöhe als ein binärer Faktor (‘Vokaltiefe’ mit den Ausprägungen JA und N E I N ) behandelt, was eine u.U. etwas irreführende Vereinfachung war. Tiefe Vokale in geschlossener letzter Silbe erwiesen sich dort als eine Ausprägung, die relativ deutlich zugunsten von -es wirkt. Diese Ausprägung umfasst nur die a-Laute; die ihr gegenüber stehenden Laute der anderen Ausprägung wurden nicht differenziert. Normalerweise werden aber in der Forschung zumindest mittelhohe und hohe Vokale unterschieden. Zu all dem kommen noch - wie bei Vokallänge - die Diphthonge, die als eine Bewegung von einem tiefen bzw. mittleren zu einem hohen Vokal hin interpretiert werden. Während Diphthonge in geschlossener letzter Silbe - wie zuletzt in Kapitel 2.5.5 ausgeführt - einen relativ deutlichen S-Effekt zeigen (z.B. bei Kauf, Leid, Seil), wirken mittlere und hohe Vokale nur geringfügig zugunsten von S (z.B. bei Umweg, Loch einerseits und bei Schnitt, Musikstück, Beruf andererseits). Die eigentliche Opposition besteht also in dieser Konstellation zwischen den tiefen Vokalen (a-Lauten) und den Diphthongen (vgl. Abb. 36 und 37). Der Effektstärkenunterschied zwischen mittelhohen und hohen Vokalen ist minimal. Abb. 36: Anteil der ES-Endung bei verschiedenen Ausprägungen von Vokalhöhe Schwache Faktoren und „frei“ variierende Nomina 115 Abb. 37: Wirkungsrichtung und Effektstärke bei verschiedenen Ausprägungen von Vokalhöhe: log 10 Odds Ratio Sieht man von Diphthongen als im Bereich Vokalqualität schwer zuordenbar ab, zeigen nur die tiefen Vokale (a-Laute) eine nennenswerte Wirkung. Das Bild hinsichtlich der Bedeutung der Vokalqualität für die Endungswahl wird etwas modifiziert, wenn man sich die über CE- LEX definierbaren Gruppen der e-, ö-, o-, i-, ü-, u-Laute 112 einzeln anschaut. Es zeichnet sich ein signifikanter Unterschied zwischen Vorderzungenvokalen und Hinterzungenvokalen ab: Während die i-, ü-, e-, ö-Laute Effekte zugunsten von S zeigen (z.B. bei Licht, Mehl, Wohlgefühl, Nadelöhr), wirken u- und o-Laute wie schon die tiefen a-Laute zugunsten von -es (z.B. bei Flug, Brot und Sack; siehe Abb. 38 weiter unten und zu quantitativen Ergebnissen Tab. 7 im Anhang). Möglicherweise spielen in der gesprochenen Sprache Koartikulationsphänomene eine Rolle: Auf die Vorderzungenvokale (nach den Kodakonsonanten) folgend kann die kurze Endung -s ökonomischer sein, da sie ebenfalls mit der Vorderzunge (koronal-alveolar) gebildet wird, während auf die Hinterzungenvokale (nach den Kodakonsonanten) unter Umständen eher die Endung -es folgen kann, weil die Zunge auf dem Weg vom hinteren Vokal zu [s] ohnehin den Artikulationsbereich des Zentralvokals [ə] passiert. Was schließlich die auf die Reichweite der Faktoren projizierbare Effektstärke angeht, sind die e-Laute (log 10 Odds Ratio = -0,38, Phi = 0,14) und die a-Laute bei Weitem führend (log 10 Odds Ratio = 0,31, Phi = 0,17). Ihre Effektstärken sind aber 112 Die Gruppen werden hier nicht nach Gespanntheit bzw. Länge der Vokale unterteilt. Endungsvariation 116 immer noch klein und den Effektstärken der stärkeren der schwachen Faktoren wie Ultima-Betonung oder Einsilbigkeit deutlich unterlegen (vgl. Abb. 20 weiter oben). Die Effektstärken der übrigen Vokalgruppen sind als marginal einzustufen (vgl. Tab. 8 im Anhang). Abb. 38: Endungswahl und Vokalqualität in geschlossener letzter Silbe 2.5.7 Sonoritätshierarchie und Kodakomplexität Szczepaniak (2010, S. 107) behandelt die konsonantische Stärke (im Orig. „consonantal strength“) des abschließenden Konsonanten als einen wichtigen Faktor der Endungsvariation. Die konsonantische Stärke wachse in der Reihenfolge Liquid, Nasal, Frikativ, Affrikate, Plosiv an, und mit ihrem Anwachsen werde die Tendenz zu -s prinzipiell schwächer (Szczepaniak 2010, S. 107, 113ff.; vgl. Vennemann 1988). Ähnlich geht Fehringer (2011, S. 97) von der Relevanz der Sonoritätshierarchie („sonority hierarchy“, vgl. Hooper 1976) aus. Der Anstieg der Sonorität (der mit der Abnahme der konsonantischen Stärke einhergeht) korreliere prinzipiell mit der Stärkung der Tendenz zu -s. Solche Konzeptionen scheinen sich in unseren Daten zunächst nur grob zu bestätigen. Die für die artikulationsbestimmten Konsonantenarten berechneten Anteile der ES-Endungen spiegeln die für die konsonantische Stärke und mutatis mutandi Sonorität relevanten Hierarchien nämlich mit einigen Abweichungen (vgl. Abb. 39, zu genaueren quantitativen Ergebnissen vgl. Tab. 9 im Anhang): Schwache Faktoren und „frei“ variierende Nomina 117 Abb. 39: Anteil der ES-Token für verschiedene Konsonantenarten im Auslaut Die stärkste ES-Tendenz zeigen nicht Nomina auf Plosive (z.B. (Einsatz-) Zweck), sondern solche auf die Affrikate / pf/ (z.B. (Wasser-)Dampf; die Affrikate / ts/ wurde in Kapitel 2.5.1 als ausnahmslos -es induzierender Faktor aus der Betrachtung varianter Fälle ausgeschlossen, für das ebenfalls dort ausgeschlossene / tʃ/ liegt der ES-Anteil bei 92%), die damit aus der von Szczepaniak modellhaft angesetzten Rangfolge ausscheren. Man könnte hier fürs Erste argumentieren, dass Affrikaten auch Konsonantengruppen zugerechnet werden können, und abschließende Konsonantengruppen ihrerseits auch einen ES-Effekt hervorrufen, sodass die ES-Tendenz bei Nomina auf Affrikaten eine zusätzliche Unterstützung erfährt. Die andere Randposition nehmen ebenfalls von der Modellabfolge abweichend nicht Liquide, sondern Nasale ein. Dies hängt wiederum damit zusammen, dass Nomina auf / r/ die S-Tendenz nicht mitmachen (11% ES-Token bei Nomina auf / l/ gegenüber 34% ES-Token bei Nomina auf / r/ , vgl. Tab. 7 weiter unten), eine Tatsache, die bereits Szczepaniak (2010, S. 113ff.) beobachtete und damit erklärte, dass die Genitivform auf -es durch Resyllabierung eine konsonantische Realisierung des ansonsten vokalisierten r ermöglicht, z.B. Tier [ti: ɐ] > Tieres [ti: ʀes]. Abbildung 40 verdeutlicht die Wirkungsrichtung der einzelnen Auslaute und ermöglicht einen Vergleich der Effektstärke mithilfe der logarithmierten Odds Ratio. Endungsvariation 118 Abb. 40: Wirkungsrichtung und Effektstärke einzelner Konsonantenarten im Auslaut: log 10 Odds Ratio Die beobachtete Reihenfolge der Konsonantenarten, in der die ES-Tendenz in den Gesamtdaten ansteigt, lässt sich auch für die separat betrachteten Mehrsilber bestätigen, aber nicht für die separat betrachteten Einsilber. Bei Letzteren wirken Frikative nicht mehr zugunsten von S, sondern sie zeigen eine ES-fördernde Wirkung, die sogar geringfügig stärker ist als die der Plosive. Die ES-Häufigkeit steigt jetzt in folgender Reihenfolge an: Nasal (43,6%), Liquid (44,1%), alle Einsilber (71%), Plosiv (79,0%), Frikativ (82,5%), die Affrikate / pf/ (88,8%). Auch in der Gruppe der Einsilber auf Einzelkonsonant, bei der der Sonoritätsgrad des abschließenden Konsonanten bereinigt vom Einfluss anderer Konsonanten sichtbar werden müsste, neigen Nomina auf Frikativ ein wenig stärker zu -es als Nomina auf Plosiv (81,3% > 79,6%, zu genaueren quantitativen Ergebnissen vgl. Tab. 9 im Anhang). Dies verlangt nach einem genaueren Blick hinter bzw. unter die Abstraktionsebene ‘(artikulationsbestimmte) Konsonantenart’. Es zeigt sich, dass Nomina auf verschiedene Konsonanten, die ein und derselben Konsonantenart zugerechnet werden, sehr unterschiedliche ES-Häufigkeiten aufweisen können. Betrachten wir wieder alle Nomina: Die Spannweite der ES-Häufigkeiten innerhalb einer Konsonantenart ist überraschenderweise nicht bei Nomina auf Liquide am größten (23% zwischen / l/ wie in Spiel(s) und / r/ wie in Meer(es), vgl. weiter oben). Sie ist schon bei Nomina auf Frikative größer (30% zwischen [ç] wie in Pech(s) und [x] wie in Buch(es), 113 vgl. Tab. 7). Berücksichtigt man 113 Bei den unterschiedlichen Präferenzen nach [ç] und [x] kann auch die Qualität des vorangehenden Vokals eine Rolle spielen. Wie in 2.5.6 erörtert, zeigen vorde- Schwache Faktoren und „frei“ variierende Nomina 119 bei Nomina auf Plosive die Unterscheidung stimmhaft vs. stimmlos (bzw. lenis vs. fortis), die im Nominativ zwar durch Auslautverhärtung neutralisiert ist, in Formen auf -es aber zum Tragen kommt, so ist schließlich die größte Spannweite der ES-Häufigkeiten eben bei Plosiven zu finden (33% zwischen Nomina auf / t/ wie in Aufenthalt(s) und / d/ wie in Vorstand(es)). 114 Nomen auf ... Token ES Token S %ES Kons.- Art p 0 714 0% stl. P 115 l 13.007 100.236 11% L n 22.719 110.952 17% N m 14.860 64.530 19% N [ç] 3.146 13.331 19% F [ŋ] 10.921 26.049 30% N r 40.443 77.561 34% L t 192.849 348.422 36% stl. P k 35.716 60.002 37% stl. P f(v) 26.149 42.427 38% F b 16.762 22.532 43% sth. P [x] 22.824 23.475 49% F g 110.433 107.074 51% sth. P pf 9.846 4.161 70% A d 196.358 52.916 79% sth. P L N F P A Tab. 7: Anteil der ES-Token für Nomen mit verschiedenen Auslautkonsonanten re Vokale (nach denen regulär nur [ç] erscheint) einen Effekt zugunsten von -s, die hinteren Vokale (denen nur [x] folgen kann) dagegen einen Effekt zugunsten von -es. 114 Als Orientierung dient hier der Buchstabenwert des Auslauts, also z.B. <t> vs. <d>. 115 Der Auslaut / p/ erscheint hier nur vollständigkeitshalber. Er ist abgeblendet, weil er in unserem Material bei einheimischen Nomina im Vergleich zu anderen Auslauten so selten erscheint, dass er bei der weiteren Argumentation vernachlässigt werden kann. Hinter den 714 Token auf <p> in unserem Material stehen 126 Lem- Endungsvariation 120 Obwohl sich in Tabelle 7, die nach ansteigendem ES-Häufigkeitswert geordnet ist, die einzelnen Konsonantenarten stark überlappen, kann in der Zeilenanordnung die Sonoritätshierarchie doch noch erkannt werden. Zusätzlich korreliert bei Plosiven offensichtlich die Opposition stimmhaft vs. stimmlos (bzw. lenis vs. fortis) mit der Endungswahl. 116 Dabei zeigen die Nomina auf potenziell stimmhafte Plosive / b, d, g/ höhere ES-Häufigkeitswerte als die Nomina auf die stimmlosen Plosive / p, t, k/ . Das ist nicht mehr vereinbar mit den bisherigen Befunden, da stimmhafte Obstruenten sonorer sind als stimmlose und die Sonoritätszunahme ansonsten (mit Einschränkungen) mit der Abnahme der ES-Häufigkeit einhergeht. Der Grund für diese Gegenbewegung könnte darin liegen, dass der Plosiv nur bei der ES-Endung stimmhaft realisiert wird, bei der er sich nicht mehr in der Koda, sondern im Einsatz der nächsten Silbe wiederfindet. Auf diese Weise käme hier wie auch schon bei Nomina auf / r/ der Möglichkeit, die phonologische Form des Nomens zu stützen, eine Bedeutung als Einflussgröße der Variation zu. Die Lage ist bei Einsilbern prinzipiell vergleichbar, auch was die Hierarchie zwischen Frikativen und Plosiven angeht - daran ändert die höhere ES-Häufigkeit für alle Frikative zusammengenommen (vgl. weiter oben) wenig: Beim Überlappen der Häufigkeitsbereiche beider Konsonantenarten sind die höchsten ES-Werte bei Nomina auf Plosive zu finden. In Tabelle 8 werden die Werte zu der „Laborsituation“ Einsilber auf Einzelkonsonant aufgeführt. In Tabelle 7 weiter oben zeigten Nomina auf / d/ interessanterweise eine höhere ES-Präferenz als die Affrikate / pf/ . Diese kann, wie bereits bemerkt, als eine Konsonantengruppe betrachtet werden, 117 mata, die fast alle als Fremdwörter eingestuft werden können, von dem Tagger aber nicht als solche erkannt wurden, wie zahlreiche Bildungen auf -typ oder -stopp. 116 Das Prüfen der Opposition stimmhaft vs. stimmlos bei den Frikativen erübrigt sich, weil der potenziell stimmhafte Frikativ / v/ in unserem Material im Auslaut selten erscheint und nur am Ende von Wörtern, die als Fremdwörter eingestuft werden können, vom Tagger aber nicht als solche erkannt wurden, z.B. Archiv, Nerv und entsprechende Komposita. 117 Aus dieser Perspektive gesehen, hätten die Nomina auf / pf/ in Tabelle 7 mit den Nomina auf / f/ zusammengerechnet werden müssen. Die ES-Häufigkeit für Nomina auf / f/ bzw. / v/ wäre dann aber nur von 39% auf 44% gestiegen, was das in Tabelle 7 entstandene Bild der Verhältnisse unter den Konsonantenarten nicht wesentlich verändern würde. Schwache Faktoren und „frei“ variierende Nomina 121 und so stellt sich als nächstes die Frage, wie sich Konsonantengruppen prinzipiell in unsere bisherigen Überlegungen einfügen. Nomen auf ... Token ES Token S %ES Kons.- Art p 0 58 0,0% stl. P l 8.766 22.570 28,0% L [ç] 575 841 40,6% F m 6.414 8.822 42,1% N k 27.158 17.470 60,9% stl. P n 12.855 8.056 61,5% N t 75.769 34.119 69,0% stl. P [ŋ] 5.340 1.754 75,3% N f 8.975 2.833 76,0% F r 12.156 3.710 76,6% L g 40.355 6.706 85,8% sth. P [x] 15.856 2.158 88,0% F b 8.810 960 90,2% sth. P d 81.697 3.076 96,4% sth. P L N F P Tab. 8: Anteil der ES-Token für Einsilber mit verschiedenen Einzelkonsonanten im Auslaut Traditionell wird Konsonantengruppen am Wortausgang ein ES-fördernder Einfluss zugeschrieben. Dabei soll die silbische Endung entlastend wirken, weil sie den Konsonantencluster der Koda aufspaltet bzw. einen oder mehrere Konsonanten in die Endungssilbe verschiebt (Fein-des, Sum-pfes). Das Ergebnis ist in jedem Fall eine Koda, die gegenüber einer Koda mit der Endung -s präferiert erscheint, weil sie weniger Konsonanten enthält. 118 Der Preis für diese silbeninterne Entlastung ist allerdings, dass die Wortform mit -es eine zusätzliche Silbe aufweist. Der ES-fördernde Einfluss der Konsonantengruppen am 118 Zu Präferenzen für eine Silbenkoda vgl. Zifonun et al. (1997, Bd. 1, S. 181) nach Vennemann (1986, S. 38ff.). Endungsvariation 122 Wortausgang wird dennoch durch unsere bisherigen Analysen global bestätigt (vgl. z.B. Kap. 2.5.4). Solche Gruppen können bei einheimischen Nomina bis zu vier Konsonanten umfassen. Befassen wir uns zuerst mit Zweiergruppen: Bei Einsilbern sind in unserem Material folgende Konsonantenkombinationen zu finden: - Liquid vor Liquid wie in Kerl, Quirl 119 (2 Lemmata, 232 Token) - Liquid vor Nasal wie in Schirm, Qualm (35 Lemmata, 19.439 Token) - Nasal vor Frikativ wie in Hanf, Senf (2 Lemmata, 44 Token), Liquid vor Frikativ wie in Wurf (21 Lemmata, 6.936 Token); Plosiv vor Frikativ wie in Topf, Knopf (7 Lemmata, 2.236 Token) - Liquid vor Plosiv wie in Volk, Schwert (45 Lemmata, 103.356 Token); Nasal vor Plosiv wie in Feind, Zimt (70 Lemmata, 55.904 Token); Frikativ vor Plosiv wie in Hecht, Heft, Schacht (21 Lemmata, 8.853 Token); Plosiv vor Plosiv wie in Haupt, Sekt (4 Lemmata, 1.551 Token) Bei Weitem nicht alle Zweierkombinationen zeigen eine zusätzliche ES-fördernde Wirkung. Die meisten Kombinationen enden auf Plosive, und in diesem Bereich finden sich noch relativ eindeutige Fälle. Konsonant.- Gruppe Beispiel ES- Token S- Token Anteil ES Erstkonsonant: Anteil ES nach Einzelkonsonant Zweitkonsonant: Anteil ES nach Einzelkonsonant Plosiv+ Plosiv Abt 1.423 128 92% Plosiv: 80% Plosiv: 80% Nasal+ Plosiv Mund 51.192 4.712 92% Nasal: 44% Plosiv: 80% [l]+Plosiv Volk 36.617 4.224 90% [l]: 28% Plosiv: 80% Tab. 9: Anteil der ES-Token für Einsilber mit zweiteiligen Konsonantengruppen auf Plosive Tabelle 9 zeigt außer der ES-Häufigkeit für die jeweilige Konsonantenverbindung die ES-Häufigkeiten für die beteiligten Konsonantenarten, die erreicht werden, wenn Konsonanten dieser Art als Einzelkonso- 119 Gesprochen liegen in diesen Fällen bei r-Vokalisierung keine Konsonantengruppen vor. Schwache Faktoren und „frei“ variierende Nomina 123 nanten im Auslaut von Einsilbern stehen. Die ES-Häufigkeit nach der Konsonantengruppe ist bei Verbindung von zwei Plosiven, von einem Nasal und einem Plosiv sowie von / l/ und einem Plosiv deutlich höher als die ES-Häufigkeiten nach Einzelkonsonanten der jeweiligen Art. Damit ist in diesen Fällen die zusätzliche ES-fördernde Wirkung der Konsonantengruppe kaum von der Hand zu weisen. In Bezug auf alle anderen Typen von Zweier-Konsonantengruppen sind ähnlich gesicherte Urteile nicht möglich, weil entweder die Anzahl der Belege (pro Lemma) zu niedrig oder die Variation der Häufigkeitswerte für die einzelnen Lemmata mit der Konsonantengruppe gleichen Typs zu groß ist - insbesondere können einzelne extrem frequente Lexeme mit einer eindeutigen Endungstendenz die ES-Häufigkeit der ganzen Nomenklasse verzerren, zu der sie gehören. Berichtet werden können ab jetzt also nur Eindrücke, die auf Schätzungen und Abwägungen beruhen - dabei wird versucht, von Ausreißern abzusehen: Bereits bei / r/ + Plosiv ist die Verstärkung der Tendenz zu -es nicht mehr feststellbar (z.B. bei Werk). Die ES-Häufigkeit scheint sich insgesamt vielmehr auf dem Niveau des Werts für Plosive als Einzelkonsonanten zu bewegen (80%). In den restlichen Fällen kann sogar von einer prinzipiellen Wirkung zugunsten von S ausgegangen werden, die sich nur bei extrem häufigen Lexemen richtig umkehren kann. Die ES- Häufigkeit für viele andere Lemmata fällt teilweise sogar deutlich unter die ES-Häufigkeit für alle Einsilber auf Einzelkonsonant (69%, vgl. Tab. 8 im Anhang). Versucht man unverhältnismäßig häufige Lexeme mit „eigenwilligen“ Tendenzen auszusieben, zeichnet sich für die noch verbliebenen Typen von Zweier-Konsonantengruppen zunächst folgende Reihenfolge ab, in der die Wirkung zugunsten von S prinzipiell zunehmen kann (soweit sinnvoll, wird die ES-Häufigkeit angegeben; aus der Berechnung ausgeschlossene Lemmata oder andere Besonderheiten werden in Klammern genannt): - Plosiv vor Frikativ - ca. 65% (dieser leichte S-Effekt wird durch das ES-lastige Lexem Kopf, HK 10, überspielt, das häufiger ist als alle anderen Lexeme zusammen), - Frikativ vor Plosiv - ca. 40% (der S-Effekt wird durch die extrem Slastigen Lexeme Recht und Licht, beide HK 10, weiter in Richtung S verzerrt, da diese Lexeme jeweils häufiger erscheinen als alle anderen zusammen), Endungsvariation 124 - Liquid vor Frikativ - ca. 31% (hier wird der S-Effekt durch die extrem ES-lastigen und besonders häufigen Dorf, HK 10, und Wolf, HK 11, überschattet), - Nasal vor Frikativ (zwei Lemmata, Hanf und Senf, ES-zu-S-Token- Verhältnis: 6/ 38), - Liquid vor Nasal - ca. 10% (hier waren die Daten zunächst durch zahlreiche Familiennamen verfälscht, die vom Tagger nicht als solche erkannt wurden, z.B. Helmes, Harms, bzw. irrtümlicherweise als solche gekennzeichnet wurden, z.B. Zorns) - Liquid vor Liquid (zwei Lemmata, Kerl und Quirl, keine ES- Token). Da wir schon bei Generalisierungen angekommen sind, kann man an dieser Stelle von der in Kapitel 2.5.1 vorgenommenen Datenstrukturierung etwas abrücken und auch die Zweiergruppen auf st heranziehen, die bisher aus den Analysen zu varianten Nomina als stark zu -es tendierend ausgeschlossen blieben. Bei dieser Kombination aus Frikativ und Plosiv (26 Lemmata, 15.008 Token) 120 erreicht die ES-Gesamthäufigkeit bei Einsilbern zwar ca. 97%, aber der hohe Wert wird entscheidend von den beiden extrem ES-lastigen und häufigen Lexemen Geist (HK 11) und Gast (HK 8) bestimmt. Schließt man sie aus, so sinkt die ES-Häufigkeit nach -st auf 77%. Der Wert liegt zwischen dem für alle Einsilber auf Einzelkonsonant (69%) und dem für Plosive als Einzelkonsonanten im Auslaut (80%) und deutet hiermit zwar prinzipiell eine Wirkung zugunsten von ES, aber auch eine Schwächung des ES- Effekts gegenüber dem Auslaut auf den Einzelkonsonanten Plosiv an. Immerhin bessert dieser Wert die ES-Bilanz der Gesamtgruppe ‘Frikativ vor Plosiv’ deutlich auf, sodass man in Erwägung ziehen könnte, sie in der obigen Auflistung der Konsonantengruppen in Richtung ES, vor ‘Plosiv vor Frikativ’, zu verschieben. Der Vorteil einer solchen Interpretation wäre, dass alle auf Plosiv endenden Konsonantengruppen einen geschlossenen Block bilden würden und aus der Abfolge aller Konsonantengruppen sich ungestört eine Anordnung der Letztkonsonanten ergäbe, die der Sonoritätshierarchie entspricht, also Liquid, Nasal, Frikativ, Plosiv (in Richtung abnehmender Sonorität). Aber 120 Betrachtet werden an dieser Stelle parallel zu den vorangehenden Fällen nur die Zweiergruppen wie in Ast und nicht Dreiergruppen oder Vierergruppen wie in Arzt. Schwache Faktoren und „frei“ variierende Nomina 125 auch ohne diese „Anpassung“ ist der Einfluss der Sonoritätshierarchie im Bereich des letzten Konsonanten der Konsonantengruppe unverkennbar (vgl. Tab. 10). Im Bereich des vorletzten Konsonanten tritt er ebenfalls zutage, wenn auch in zwei Blöcke (bei nicht-plosivem und bei plosivem Letztkonsonanten) aufgeteilt und ebenfalls mit einer Brechung (kursive Schrift) versehen. Endungstendenz S KS vorletzter Konsonant letzter Konsonant S KS S ES Liquid Liquid Liquid Nasal Nasal Frikativ Liquid Frikativ Frikativ Plosiv Plosiv Frikativ Liquid Plosiv Nasal Plosiv Tab. 10: Endungswahl und Sonorität/ Obstruenz in zweiteiligen Konsonantengruppen am Nomenende (S = Sonoritätshierarchie, KS = konsonantische Stärke) Was Einsilber mit Wortausgang auf Zweier-Konsonantengruppen angeht, muss also festgehalten werden: Sowohl die Position des Letztkonsonanten in der Sonoritätshierarchie als auch die entsprechende Position des vorletzten Konsonanten scheinen die Endungswahl zu beeinflussen. Dabei gehen die Wirkungen der Konsonanten, die sie als Einzelkonsonant im Auslaut haben, wohl in eine Art Gesamtrechnung ein. Die Annahme, Wortausgang auf Konsonantengruppe sei prinzipiell ein ES-fördernder Faktor, ist in jedem Fall unhaltbar: Eine Wirkung der Konsonantengruppe zugunsten von -es ist nur für Nomina feststellbar, bei denen an der Konsonantengruppe Plosive beteiligt sind. Konsonantengruppen ohne Plosive wirken prinzipiell - d.h. wenn man von vereinzelten extrem häufigen Lexemen absieht - zugunsten von -s und verstärken dabei sogar die S-Wirkung, die an den Gruppen beteiligte Konsonanten als Einzelkonsonanten im Auslaut zeigen. Endungsvariation 126 Die bisherigen Ergebnisse sind auf Konsonantengruppen mit mehr als zwei Konsonanten übertragbar. In diesem Bereich begegnet man bei Einsilbern zunächst wieder den Nomina auf st, die wir in 2.4 bei den starken Faktoren als nur leicht variierend bereits behandelt haben - dazu gehören die drei Lemmata auf Vierergruppen, die in unserem Material zu finden sind - Arzt / a: rtst/ 121 , Herbst und Ernst - sowie neun Lemmata auf Dreiergruppen wie Dienst, Forst, Obst mit insgesamt 14.171 Token und einer ES-Quote von 97% (Spannweite zwischen 92% und 100%). Danach aber trifft man nur noch auf drei Konsonantenkombinationen: / mpf/ wie in Sumpf, Dampf, / rkt/ wie in Markt und / nkt/ wie in Punkt. Bei der ersten Kombination (8 Lemmata, 5.372 Token) gibt es ein extrem häufiges Lexem, Kampf (HK 9), das weit frequenter ist als alle anderen Lexeme zusammen und eine sehr eindeutige ES- Präferenz zeigt (93%). Lässt man es beiseite, beträgt die ES-Gesamtfrequenz der übrig gebliebenen Lexeme nur noch 76%. Diese Zahl und die Zahlen für die anderen Dreierkombinationen werden in Tabelle 11 nach ansteigenden ES-Werten angeordnet. Konsonantengruppe Beispiel ES- Token S- Token Anteil ES Nasal+Plosiv+Frikativ Sumpf 319 100 76% Nasal+Plosiv+Plosiv Punkt 464 122 79% Liquid+Plosiv+Plosiv Markt 8.963 973 90% Nasal/ Liquid/ Plosiv+ Frikativ+Plosiv (X+/ st/ ) Hengst Forst Papst 9.908 10.172 97% Tab. 11: Anteil der ES-Token für Einsilber auf dreiteilige Konsonantengruppen Wieder sind die Kombinationen auf Plosive hinsichtlich der ES-Tendenz führend. Gleichzeitig resultiert eine Anordnung der Konsonantengruppen, die der Reihenfolge der zunehmenden ES-Präferenz entspricht, in einer Anordnung der Erstkonsonanten, die prinzipiell mit der Sonoritätshierarchie vereinbar ist (Nasal - Nasal - Liquid - Nasal/ Liquid/ Plosiv). Letztere scheint ihre Bedeutung also auch für diesen Bereich zu behalten. 121 Hier wird von einer konsonantischen Realisierung des Phonems / r/ ausgegangen [r, R]. Allerdings kann das Phonem in solchen Positionen auch vokalisiert erscheinen. Schwache Faktoren und „frei“ variierende Nomina 127 Betrachtet man alle untersuchten Ausprägungen der Koda zusammen, so ist eine Korrelation der Endungswahl mit der Sonorität der Konsonanten und der Komplexität in der Koda erkennbar. Dabei führt eine niedrigere Einstufung der Konsonantenart in der Sonoritätshierarchie im Allgemeinen zu einer höheren ES-Häufigkeit. Bei Konsonantengruppen werden die Wirkungen der beteiligten Konsonanten, die sie als Einzelkonsonanten im Auslaut zeigen, quasi miteinander verrechnet. Eine Konsonantengruppe am Nomenende führt also keineswegs automatisch zu einer deutlichen ES-Präferenz - im Gegenteil, bei einigen Konsonantenkombinationen erzielt sie geradezu eine S-fördernde Wirkung. Dass bei undifferenzierter Betrachtung aller Konsonantengruppen am Nomenende eine Wirkung zugunsten von -es feststellbar ist, liegt letztlich daran, dass die meisten dieser Konsonantengruppen auf Plosive ausgehen, und letztere prinzipiell eine deutliche ES-Tendenz zeigen. Wir wollen dabei nicht vergessen, dass unterhalb der Abstraktionsstufe ‘(artikulationsbestimmte) Konsonantenart’ die Korrelation zwischen Endungswahl und Sonoritätshierarchie etwas verschwimmt, da in den ES-Häufigkeitsrankings (Tab. 7 und 8) einzelne Konsonanten gleicher Konsonantenart auch mitten unter Konsonanten einer anderen Konsonantenart auftauchen können (so konkurriert der Liquid / r/ als ES-Förderer mit weniger sonoren Frikativen und Plosiven, und der Frikativ [x] hält bei den ES-starken Plosiven gut mit). Die oben genannten Generalisierungen erscheinen trotz dieser Ausnahmen als zulässig, und werden zusammenfassend in Abbildung 41 visualisiert. Endungsvariation 128 Endungstendenz S ES Einzelkonsonant Liquid (L) Frikativ (F) Nasal (N) Plosiv (P) Zweiergruppen L+L L+N N+F L+F F+P/ P+F L+P N+P P+P Dreiergruppen N+P+F N+P+P L+P+P X+F+P Sonoritätshierarchie Konsonantische Stärke Abb. 41: Sonoritätshierarchie und Kodakomplexität Schwache Faktoren und „frei“ variierende Nomina 129 2.5.8 Frequenz als schwacher Faktor In Kapitel 2.4.3 wurde ‘(hohe) Lexemfrequenz’ (die Zugehörigkeit der Lemmata zu Häufigkeitsklassen 5 und 7) als ein starker Faktor ausgemacht, der bei positiver Ausprägung nahezu ausnahmslos zu -es führt. Es wäre denkbar, dass die fünf Lemmata der Häufigkeitsklassen 5 und 7 rein zufällig Merkmale aufweisen, die die es-Wahl unausweichlich machen. Jahr, Tag, Land, Kind, Mann sind Einsilber. Damit liegt bei allen schon einmal die stärkste -es fördernde Einflussgröße unter den sog. schwachen Faktoren vor, die positive Ausprägung von ‘Silbenanzahl: 1’ (vgl. Kapitel 2.5.2). Die Lemmata zeigen auch weitere es-begünstigende Merkmale: 122 - Jahr: a-Laut (‘Vokalhöhe: tief’), Langvokal (‘Vokallänge: lang’), Auslaut auf / r/ 123 - Kind: Ausgang auf Konsonantengruppe (‘Konsonantengruppe’), Auslaut auf (stimmhaften) Plosiv (‘Sonoritätshierarchie: P’) - Land: a-Laut, Ausgang auf Konsonantengruppe, Auslaut auf (stimmhaften) Plosiv - Mann: a-Laut - Tag: a-Laut, Langvokal, Auslaut auf (stimmhaften) Plosiv Der Plosivauslaut bei Kind, Land und Tag kann nur vor -es stimmhaft realisiert werden. Diese Endung stützt hier also wie bei Auslaut auf / r/ die phonologische Form des Nomens. 124 Hingegen finden sich Merkmale, die die Endung -s begünstigen, nur bei drei Lemmata: - Kind: i-Laut, 125 Kurzvokal (‘Vokallänge: kurz’) - Land: Kurzvokal - Mann: Kurzvokal, Auslaut auf Nasal (‘Sonoritätshierarchie: N’) Das Übergewicht der -es fördernden Eigenschaften ist deutlich. Dennoch kann es alleine noch nicht die Ausnahmslosigkeit der es-Endung rechtfertigen. Wie unsere Analysen mithilfe der logistischen Regres- 122 In Klammern erscheinen Faktorenbezeichnungen aus Kapitel 2.5.2. 123 Vgl. Kapitel 2.5.7. 124 Vgl. ebd. 125 Vgl. Kapitel 2.5.6. Endungsvariation 130 sion in Kapitel 2.5.4 oben zeigen, steigert eine Häufung von Ausprägungen schwacher Faktoren, die -es begünstigen (z.B. Einsilbigkeit, Konsonantengruppe und Plosivauslaut), zwar die Wahrscheinlichkeit von -es, allerdings nicht unbegrenzt, d.h. auch nicht in den Bereich der tendenziellen Ausnahmslosigkeit hinein. Somit scheint hier die extreme Häufigkeit dieser Einsilber-Lexeme wirklich eine zentrale Rolle zu spielen. Im restlichen Frequenzbereich (HK > 7) konnte in Kapitel 2.4.3 aber keine Korrelation zwischen Häufigkeit und Endungswahl beobachtet werden. Es stellt sich die Frage, ob der Grund dafür nicht darin liegt, dass in diesem restlichen Bereich Mehrsilber hinzukommen. Abbildung 42 zeigt tatsächlich, dass bei getrennt betrachteten Einsilbern 126 die Abnahme der Lexemfrequenz tendenziell mit dem Absinken des Anteils von -es einhergeht. Abb. 42: Häufigkeitsklassen und Endungsvariation bei Einsilbern (je höher die Häufigkeitsklasse desto niedriger die Lexemfrequenz) 127 So betrachtet ist nicht nur hohe Lexemfrequenz ein starker Faktor, sondern auch die Lexemfrequenz als solche scheint eine relevante Einflussgröße zu sein, die speziell bei Einsilbern mit der Endungswahl 126 Aus der Gruppe ‘variante Nomina’ zuzüglich der genannten fünf besonders häufigen Nomina. 127 Über der Zahl „29“ sind in Abbildung 42 relative Häufigkeiten für Lemmata illustriert, die keine ermittelbare Entsprechung in der DeReWo-Grundformliste hatten. Schwache Faktoren und „frei“ variierende Nomina 131 korreliert. Der Effekt wird in Ein- und Mehrsilber umfassenden Gesamtdaten nur im Bereich extrem frequenter Lexeme deutlich, in dem es keine Mehrsilber gibt. Ansonsten wird er durch die Verhältnisse bei Mehrsilbern verdeckt. Letztere zeigen keinen Zusammenhang zwischen Lexemfrequenz und Endungswahl, der dem bei Einsilbern vergleichbar wäre (vgl. Abb. 43). Abb. 43: Häufigkeitsklassen und Endungsvariation bei Mehrsilbern Warum korreliert bei Einsilbern gerade die hohe Frequenz mit der Endung -es, die niedrige Frequenz dagegen mit -s? Letzterer Zusammenhang scheint Thesen zu bestätigen, dass -s heute bei den prinzipiell varianten Nomina die Default-Endung ist (vgl. Duden 2009, S. 195; Szczepaniak 2010, S. 124): Sie wird bei selteneren Nomina bevorzugt, deren Genitivform spontan gebildet und nicht aus dem mentalen Lexikon abgerufen wird. Je frequenter die Nomina sind, desto größer werden die Chancen, dass die -es begünstigenden Merkmale bei ihrem Vorliegen tatsächlich zum Tragen kommen. So stützt der häufigere Gebrauch einerseits die faktorenkonforme Endung. Andererseits wirkt er aber konservierend, wodurch die historische Dimension der Endungsvariation ins Spiel kommt: -es ist die ältere Endung. Laut Szczepaniak (2010, S. 108; 2014, S. 34ff.) weicht die alte Norm -es schon seit dem Mittelhochdeutschen kontinuierlich vor -s zurück, und Bubenhofer/ Hansen-Morath/ Konopka (2014, S. 413) beobachten eine Gewichts- Endungsvariation 132 verschiebung zugunsten von -s auch in jüngster Zeit. 128 Paul (1917, S. 7f.) spricht von einer Doppelförmigkeit zur Zeit Luthers und davon, dass später die „vollen Formen“ (-es) bei den einsilbigen Wörtern die normalen seien, wogegen bei den mehrsilbigen Wörtern die „verkürzten Formen“ bevorzugt würden. Offensichtlich ist die Neigung zu der konservativen Endung -es bei besonders häufigen einsilbigen Nomina des Erbwortschatzes (wie etwa die fünf weiter oben diskutierten Lexeme) immer noch sehr stark ausgeprägt, sodass die formalen s-fördernden Merkmale nahezu gänzlich unwirksam gemacht werden können. 129 Die Mehrsilber sind in der Regel nicht ganz so alt und frequent wie die Einsilber, was einer der Gründe dafür sein kann, dass bei ihnen der Zusammenhang zwischen Nomenfrequenz und Endungswahl verschwimmt. Außerdem liegt bei den Mehrsilben - abgesehen von den zweisilbigen Bildungen mit einem unbetonten Präfix wie Vertrag - der Hauptakzent nicht auf der letzten Silbe des Nomens, womit ein wichtiger -es fördernder Faktor entfällt (vgl. Kap. 2.5.2). 2.6 Zusammenfassung und abschließende Bemerkungen Die Teilstudie zur Variation der starken Genitivendung begann mit einem Vergleich einiger wichtiger Darstellungen der Variationsfaktoren. Dabei wurde versucht, die Gemeinsamkeiten und die Unterschiede der Ansätze herauszuarbeiten sowie Fragestellungen abzuleiten, in denen Klärungs-, Überprüfungs- oder auch nur Präzisierungsbedarf bestand (Kap. 2.1). Es folgte die Formulierung einiger konkreter Fragen für die weitere Forschung, die zwar nicht als eine To-do-Liste für diese Teilstudie zu verstehen waren, wohl aber als deren Orientierungspunkte dienten (Kap. 2.2). Der auf die Auseinandersetzung mit der Forschungslage folgende Datenüberblick (Kap. 2.3) stützte zunächst die verbreitete Meinung, dass die kurze Endung -s im großen Ganzen betrachtet den Normalfall be- 128 Es ist eine weithin bekannte Tatsache, dass eine hohe Frequenz gegen vereinheitlichende analogische Sprachwandelprozesse immunisiert. So können sich auch starke bzw. unregelmäßige Verbformen (z.B. im Konjunktiv) insbesondere bei häufig gebrauchten Verben (v.a. Auxiliaria) halten. 129 Während z.B. bei dem extrem häufigen Nomen Mann die Endung -s kaum auftritt, beträgt ihre relative Häufigkeit bei den anderen, selteneren Einsilbern mit einem a-Laut und einem -s fördernden Nasalauslaut wie Damm, Kran, Klang insgesamt 46% (4.291 aus 9.419 bei 36 Lemmata). Zusammenfassung und abschließende Bemerkungen 133 deutet: Genitivnomina mit den Endungen vom Typ S machten fast drei Viertel aller Token mit einer Endung aus, und ausschließlich mit den S-Realisierungen erschienen über drei Viertel der Lemmata, die eine Endung zuließen. Bei denjenigen 7% der Lemmata, denen in unserem Material beide Endungen zugeordnet werden konnten, überwogen allerdings leicht die ES-Realisierungen. Nach dem Datenüberblick wurde die Untersuchung der Endungswahl zweigeteilt. Im ersten Block (Kap. 2.4) wurden die sog. starken Faktoren analysiert, die der bisherigen Forschung zufolge eine tendenziell ausnahmslose Wirkung erzielten. Da der lexikalische Faktor der Zugehörigkeit zum nur schwach ins appellativisch geprägte Nomensystem integrierten Sonderwortschatz bei positiver Ausprägung eine Endung vom Typ ES weitgehend verhinderte, dabei einen sehr großen Teil des Materials betraf und andere starke Faktoren dominierte, wurden Nomina der entsprechenden Sondergruppen 130 aus den weiteren Betrachtungen ausgeschlossen. Im verbliebenen Material konnten so „unverschleiert“ die aus der Fachliteratur bekannten lautlichen, prosodischen und morphologischen Faktoren als binäre Variablen analysiert und hierarchisiert werden. Sie wurden untersucht sowohl hinsichtlich der relativen Häufigkeit der bei positiver Ausprägung geforderten Endung (Durchschlagskraft), als auch hinsichtlich der Effektstärke (logarithmierte Odds Ratio, Phi-Koeffizient), die die Auswirkung auf die Gesamtheit der Genitivnomina (Reichweite) mit berücksichtigte. Ergänzt wurde die Reihe der starken Faktoren dabei um den performanzbasierten Faktor der extrem hohen Frequenz, die fast ausnahmslos zur Endung -es führte (vgl. Frage e) aus Kap. 2.2). Die positiven Ausprägungen der starken Faktoren, also vor allem der s-Auslaut, der Wortausgang auf eine Schwa-Silbe, die Sondergruppenzugehörigkeit oder die besagte extrem hohe Frequenz, lagen in unserem Material bei etwa 4 Mio. Token bzw. bei etwa 60% aller Token mit einer Endung vor. Im zweiten Block (Kap. 2.5) wurden die der Spezialliteratur und Voruntersuchungen zufolge von der Ausnahmslosigkeit weiter entfernten Faktoren (sog. schwache Faktoren) untersucht. Vorab wurden aus den Daten alle Nomina ausgeschlossen, bei denen die positiven Ausprägungen der starken Faktoren vorlagen. In der verbliebenen Datenbasis, die jetzt aus zumindest potenziell varianten Nomina bestand (die 130 Über Taggerannotationen bzw. umfassende (aber naturgemäß nicht vollständige) Listen identifizierte Fremdwörter, Eigennamen, Abkürzungen, Konversionen, Neologismen. Endungsvariation 134 alle auf Konsonanten endeten), hatten die Token mit den Endungen vom Typ S mit einem Anteil von ca. 59% nur noch ein leichtes Übergewicht. Nach einer Analyse der Durchschlagskraft und der Reichweite der sog. schwachen Faktoren wurde zunächst der Übergangsbereich zu den starken Faktoren modelliert. Da bei den schwachen Faktoren (anders als bei den starken) auch zahlreiche Faktorenkorrelationen vorlagen und daher mit relevanten Interaktionen zu rechnen war, wurde im Weiteren das Zusammenwirken von Silbenanzahl, Beschaffenheit des konsonantischen Auslauts sowie Länge und Höhe des Vokals in der letzten Silbe in exemplarischen Regressionsanalysen problematisiert. Zum Schluss wurden die komplexen Einflussgrößen Vokallänge, Vokalhöhe, Sonorität und Komplexität des Auslauts detailliert unter die Lupe genommen, da ihre bisherige Behandlung als binäre Faktoren (Nominalvariablen) zu pauschal erschien. Insgesamt zeigt sich, dass nur ein geringer Teil der Nomina mit einer Endung als variationsfähig gelten kann. Die meisten Nomina bringen lexikalische, lautliche oder morphologische Voraussetzungen mit, die eine der beiden Endungen mehr oder weniger erzwingen. Nichtsdestoweniger sind einige Nomengruppen, die in der Fachliteratur als tendenziell auf eine Endung beschränkt geführt werden, ziemlich weit von der Ausnahmslosigkeit entfernt (vgl. Frage a) aus Kap. 2.2): Bei den Nomina auf -sch und -st erreicht die -es-Präferenz höchstens ca. 79% bzw. 86% (wenn man die Nomina der Sondergruppen ausschließt), und bei den Nomina, die auf einen Diphthong enden, zeigen mehr als 10% die „unerwartete“ Endung -es. Die genannten Nomengruppen bilden bereits den Übergang zu den freier variierenden Nomina und die entsprechenden Faktoren sind nicht mehr zu den Faktoren zu zählen, die eine (tendenzielle) Ausnahmslosigkeit einer Endung bewirken (vgl. Frage a) aus Kap. 2.2). Bei den Nomina auf -sch und -st (Faktor 3 und 4 in Tab. 1 aus Kap. 1.3) konnte somit die in einem Teil der Fachliteratur 131 postulierte Faktorenstärke nicht bestätigt werden. Unter den Nomengruppen hingegen, für die unter Ausschluss der Sondergruppen die postulierte Ausnahmslosigkeit einer Endung bestätigt werden konnte, fallen in der ES-Domäne Nomina auf einen s- Laut (z.B. Haus) und in der S-Domäne Nomina auf eine Schwa-Silbe (z.B. Lehrer) durch eine relativ große Reichweite auf (vgl. Faktor 2 bzw. 8 in Tab. 1 aus Kap. 1.3). Die postulierte (tendenzielle) Ausnahmslosig- 131 Vgl. Duden (2007, S. 370) sowie Pfeffer/ Morrison (1979, S. 310). Zusammenfassung und abschließende Bemerkungen 135 keit von -s konnte mit kleinen Einschränkungen noch bei den nicht so tokenreichen Gruppen Nomina auf einen Vokal und Nomina auf ein Suffix o.Ä. bestätigt werden (Faktor 1 und 9 in Tab. 1 aus Kap. 1.3). Schließlich zeigte in der ES-Domäne der bisher noch nicht etablierte Faktor der extrem hohen Frequenz (z.B. bei Jahr) eine sehr beachtliche Effektstärke. Was die sog. schwachen Faktoren angeht, die im Feld der freier variierenden Nomina wirksam sein sollten, so ließ sich zwar für alle eine signifikante Wirkung nachweisen, diese fiel aber teilweise recht schwach aus. Insbesondere waren die in einigen Fachbeiträgen postulierten Einflussgrößen Länge des Vokals in der geschlossenen letzten Silbe und Genus des Nomens (Faktor 7 und 29 in Tab. 1 aus Kap. 1.3) sowohl im Hinblick auf die Durchschlagskraft als auch im Hinblick auf die Reichweite verhältnismäßig bedeutungslos (vgl. Frage b) aus Kap. 2.2). Sie wären daher bei der Vielzahl wichtigerer Faktoren in einer im Umfang limitierten Gesamtdarstellung der Variation der starken Genitivendung vernachlässigbar. Von den sog. schwachen Faktoren müssten in eine angemessen gewichtete Darstellung auf jeden Fall die bekannten Einflussgrößen Silbenanzahl und Betonung (Faktor 10 und 11 in Tab. 1 aus Kap. 1.3) Eingang finden. Es verdiente aber auch die unterschiedliche Sonorität der auslautenden Konsonanten (Faktor 5 in Tab. 1 aus Kap. 1.3), die nur in Teilen der Fachliteratur als Einflussgröße etabliert ist, eine Aufnahme (vgl. Frage d) aus Kap. 2.2). Insgesamt müsste sich eine solche Darstellung aus einer Kombination von starken und schwachen Faktoren zusammensetzen. Eine solche Kombination - allerdings etwas umfassender angelegt - wird in Abbildung 44 (unten) veranschaulicht. Binäre Faktoren mit besonderer Reichweite stehen darin in fett umrandeten Kästchen. Im oberen Teil der Abbildung (Bereich ‘(tendenziell) invariante Nomina’) sind die (nahezu) obligatorischen Regeln gruppiert und unterhalb von ‘Sonderwortschatz’ hierarchisiert, und zwar so, dass die als relevanter eingeschätzten Regeln höher erscheinen. Die Hierarchie ist aus einem Versuch entstanden, die Durchschlagskraft und die Reichweite der jeweiligen Faktoren auszubalancieren, und darf nicht überbewertet werden. Im unteren Teil der Abbildung sind die Regeln in die ES-Gruppe und S-Gruppe aufgeteilt und in diesen Gruppen ebenfalls hierarchisiert. Die Regeln sind hier fakultativ, die Faktoren können miteinander korrelieren und interagieren, sie können sich gegenseitig stützen oder Endungsvariation 136 auch im Konflikt miteinander liegen. 132 Die Darstellung suggeriert u.U., dass die Faktoren nur binär zu verstehen sind. Dies ist nicht immer der Fall, was unten noch diskutiert wird. Abb. 44: Zentrale Faktoren der Endungswahl 132 Vgl. z.B. das Beispiel Falles, das einerseits ein / a/ enthält und andererseits auf Liquid auslautet. Zusammenfassung und abschließende Bemerkungen 137 In der Abbildung erscheint separat der Faktor ‘Diphthong’ in der geschlossenen letzten Silbe, der in traditionellen Darstellungen beim Faktor Vokallänge als langer Vokal mit behandelt wird. Folgt man solchen Auffassungen, so wirkt sich die Ausprägung lang (einschließlich der Diphthonge) marginal zugunsten von -s aus (vgl. Frage c) aus Kap. 2.2). Allerdings liegt das nur daran, dass Diphthonge in der geschlossenen letzten Silbe eine verhältnismäßig starke Tendenz zu -s bedingen, und damit die anderen langen Vokale „mitziehen“, die separat betrachtet eine leichte Tendenz zu -es auslösen (vgl. Kap. 2.5.5). Daher empfiehlt es sich auf eine binäre Auffassung des Faktors Vokallänge zu verzichten bzw. den Diphthong in der geschlossenen letzten Silbe getrennt zu behandeln. In Abbildung 44 erscheint der vorher als gewichtig eingeschätzte Faktor Sonorität des Auslauts nicht direkt (vgl. Frage d) aus Kap. 2.2). Dort sind nur die Ausprägungen [l]/ Nasal und Plosiv zu finden, da sonstige Konsonantenarten als nicht auf eine Endung festgelegt gelten müssen. Modellhaft ist hier der Frikativ / f/ , der zur Mitte der konsonantischen Sonoritätshierarchie hin tendiert und keine Endung eindeutig präferiert. Interessant erscheint, dass die Sonorität der Konsonanten auch in Konsonantengruppen am Nomenende eine Rolle spielt und zwar in der Weise, dass sich die Sonoritätsbzw. Obstruenzpotenziale, die die beteiligten Konsonanten mitbringen, quasi miteinander verrechnen. Als prototypisch können hier die Verbindung von zwei Liquiden in Kerl mit der Ausnahmslosigkeit von -s einerseits und die Verbindungen unter Beteiligung von Plosiven in Punkt oder Papst mit der Tendenz zu -es andererseits dienen. Schließlich kann man den Faktor Sonoritätbzw. Obstruenz umfassender konzipieren und in diesen auch ‘Auslaut auf Vokal’ und ‘Auslaut auf Diphthong’ integrieren. Am sonoren Pol der komplexen Ordinalvariable stünde jetzt ‘Auslaut auf Vokal’, der sehr stark -s fordert, und die Variable würde sich über ‘Auslaut auf Diphthong’ und einzelne konsonantische Auslaute bis hin zu ‘Wortausgang auf komplexe Koda mit Plosiv’, der stark die Endung -es fördert, am obstruenten Pol erstrecken. Abbildung 44 fasst nur sprachsystematische Faktoren zusammen - eine Ausnahme bildet die performanzbasierte Einflussgröße Lexemfrequenz (vgl. Frage e) aus Kapitel 2.2): Im unteren Teil wird der Faktor ‘hohe Frequenz’ durch einen langen Pfeil dargestellt. Diesem Faktor kommt bei Einsilbern die Bedeutung als Verhältnisvariable zu. Dies Endungsvariation 138 heißt: Häufige Einsilber wählen bevorzugt die Endung -es, und mit abnehmender Häufigkeit der Lexeme nimmt die relative Häufigkeit der -es-Token ab, sodass die sehr seltenen Einsilber ähnlich dem nichtintegrierten Wortschatz sehr stark zur Endung -s tendieren. Bei Mehrsilbern scheint der Faktor Lexemfrequenz hingegen eher unbedeutend zu sein, sodass er sich schließlich, in der Gesamtheit der varianten Nomina nur bei extrem häufigen Wörtern (die meist Einsilber sind und fast ausschließlich -es wählen) richtig bemerkbar macht. Lediglich angeschnitten werden konnte hier die Rolle der rhythmischen Parameter (Frage f) aus Kap. 2.2), insofern als nur die Wortprosodie herangezogen wurde. Dass Einsilber und Nomina mit Ultima- Betonung zu -es tendieren, Nomina mit Pänultima-Betonung dagegen zu -s, korrespondiert mit der in der Forschung vielfach auch in anderen Zusammenhängen beobachteten Tendenz zum Trochäus am Ende flektierter Wortformen. Eine solche Tendenz scheint sogar bei den nahezu invarianten Nomina anzuklingen, wo die Endung -es nur bei Nomengruppen möglich ist, in denen sie zu auf Trochäus endenden Wortformen führen kann (vgl. Kap. 2.4.2). Es ist nicht ausgeschlossen, dass die festgestellten prosodischen Tendenzen der Wortebene als Teil der Verhältnisse auf der Satzebene erklärt werden könnten. Die Bedeutung der Satzprosodie für die Variation der Genitivmarkierung in der geschriebenen Sprache zu untersuchen war hier aber nicht mehr möglich. Dies bleibt eine interessante Aufgabe für die Anschlussforschung. Außerdem könnte der hier neu festgestellte Einfluss der Vokalqualität in der geschlossenen letzten Silbe (insbesondere die Tendenz der Nomina des Grundwortschatzes mit einem a-Laut zu der Endung -es, vgl. Kap. 2.5.6) weiter geprüft und evtl. in seinen Zusammenhängen erklärt werden. Am unteren Rand der Abbildung werden neben der Frequenz auch die Einsilbigkeit, die Ultima- und die Pänultima-Betonung mit langen Pfeilen repräsentiert. Die Wirkung aller dieser Faktoren kann so konzeptualisiert werden, dass sie den „Ausgangspunkt“ für die Bemessung der Wirkung anderer für variante Nomina relevanter Faktoren in eine bestimmte Richtung verschieben. Die Faktoren, die im unteren Teil der Abbildung durch Kästchen repräsentiert werden, behalten also ihre Relevanz sowohl für Einsilber als auch für Mehrsilber, sowohl für frequente als auch für weniger frequente Nomina (allerdings unter Ausschluss der extrem häufigen und extrem seltenen Nomina), Zusammenfassung und abschließende Bemerkungen 139 sowohl für ultimabetonte Mehrsilber als auch für andere Mehrsilber. Nur ist bei Einsilbigkeit, größerer Häufigkeit und Ultima-Betonung generell von einem höheren Anteil der ES-Token und bei Pänultima- Betonung von einem höheren Anteil der S-Token auszugehen. Im diesem Kapitel wurden die Vorgehensweise bei der Untersuchung der Endungsvariation, die Ergebnisse dieser Untersuchung sowie ihr Beitrag zur Beantwortung von in Kapitel 2.2 aufgestellten Fragen zusammengefasst. Damit ist auch der spezifische Beitrag der vorliegenden Teilstudie zur Darstellung der Markierungsvariation als konsistentes und möglichst adäquates System umrissen. Es verbleibt hier nur auf Kapitel 4 zu verweisen, in dem sich die Systemfrage noch einmal auf einer höheren Ebene stellen wird, nämlich bei der Verbindung der Ergebnisse dieser Teilstudie mit den Ergebnissen der Teilstudie zu endungslosen Genitiven. Dort werden auch die wichtigsten der benutzten Methoden sowie die Möglichkeiten und die Begrenzungen der korpuslinguistischen Herangehensweise diskutiert. 3. ENDUNGSLOSE GENITIVE Im Gegenwartsdeutschen können Genitive stark flektierender Nomina (Maskulina und Neutra sowie Eigennamen) unter bestimmten Umständen endungslos auftreten. Wie bereits in Kapitel 1.5 erwähnt, stellt der Wegfall 133 der Endung neben -s und -es die dritte Leitvariante zur Markierung des Genitivs in diesem Bereich dar. Die Nullrealisierung des Genitivs ist keine gänzlich neue Entwicklung, sondern auch für frühere Sprachstufen des Deutschen dokumentiert (vgl. z.B. Wegera 1987 und Ebert et al. 1993 zum Frühneuhochdeutschen). Trotzdem ist das Phänomen erst im 20. Jahrhundert stärker ins Interesse der germanistischen Linguistik und Grammatikschreibung gerückt - vor allem im Zusammenhang mit der Frage, ob eine endungslose Realisierung des Genitivs der Sprachnorm entspricht. Bevor wir uns näher mit dem Stand der Forschung befassen, soll zunächst der Gegenstand dieser Teilstudie näher eingegrenzt werden. Im Mittelpunkt unseres Erkenntnisinteresses stehen Fälle, in denen eindeutig eine Genitivphrase vorliegt, der Genitiv allerdings nicht sichtbar am Nomen durch eine entsprechende morphologische Markierung realisiert wird. Keine Berücksichtigung finden hingegen schwache Nomina sowie (in der Literatur häufig diskutierte) Fälle von Genitivschwund, in denen der Genitiv durch andere Kasus (insbes. Dativ) und Konstruktionstypen (insbes. präpositionale Fügungen) verdrängt wird. Nach gängiger Auffassung ist eine Nullsetzung des Genitivs an den syntaktischen Kontext gebunden. Sie kann nur erfolgen, wenn der Genitiv bereits an anderer Stelle innerhalb der Nominalphrase eindeutig markiert ist (vgl. auch die sog. „Genitivregel“, Duden 2009, § 1534): (4) a. Peters Auto b. das Auto des kleinen Peter(s) c. die Abstufungen des dunklen Grün(s) d. die Abstufungen dunklen Grün*(s) 133 Wenn hier und im weiteren Verlauf dieses Kapitels vom „Wegfall“ des Genitiv-s die Rede ist, so ist damit keine bestimmte Form der Analyse (z.B. im Sinne eines Reduktionsprozesses) impliziert. Dies gilt insbesondere für Elemente wie bestimmte Entlehnungen, Konversionen oder Abkürzungen, die nicht ins Flexionssystem integriert sind und daher generell unflektiert auftreten. Vgl. Kapitel 4 für weitere Diskussion. Endungslose Genitive 142 Die Beispiele (4a-b) zeigen, dass bei Personenamen das Genitiv-s nur dann ausfallen kann, wenn der Genitiv bereits am (sekundären) Artikel markiert ist (für viele Sprecher ist die Nullmarkierung am Namen in Kontexten wie (4b) obligatorisch). 134 Ein ähnliches Verhalten lässt sich auch bei anderen Nomina mit variabler Genitivmarkierung beobachten. Wie (4c-d) illustrieren, ist der Wegfall der Genitivendung bei Farbwörtern nur akzeptabel, wenn der Genitiv bereits eindeutig durch den Artikel signalisiert wird. Die (unterspezifizierte) adjektivische Flexionsendung -en allein ermöglicht keine Nullrealisierung des Genitivs am Nomen, vgl. (4d). 135 Bei dem Verzicht auf redundante (starke) Genitivmarkierung wie in (4b) handelt es sich also nicht um einen Verlust von Flexionsmorphologie im Sinne eines generellen Kasusschwunds (im Gegensatz beispielsweise zum vollständigen Abbau der Akkusativ-/ Dativmarkierung bei Personennamen wie Goethe-n, Schiller-n, Amalie-n, Grete-n). Vielmehr können wir beobachten, dass Nomina, die im Prinzip die s- Endung tragen können, in bestimmten syntaktischen Kontexten endungslos erscheinen - nämlich dann, wenn der Genitiv bereits an anderer Stelle innerhalb der Nominalphrase eindeutig markiert ist. Dieses Phänomen wird auch als Monoflexion bezeichnet (vgl. z.B. Admoni 1982 und Duden 2009, § 1517; mit Bezug auf Eigennamen spricht Nübling 2012 hier auch von „Deflexion“). Allerdings ist zu unterscheiden zwischen einem kontextabhängigen Ausfall der Genitivmarkierung und Formen der Endungslosigkeit, die morphophonologisch bzw. lexikalisch bedingt sind. So wird der Genitiv bei Fremdwörtern auf -(ism)us aufgrund ihrer Formeigenschaften i.d.R. nicht sichtbar markiert (vgl. aber Kap. 3.3.1.1 für einige Ausnahmen). 134 Nicht völlig geklärt ist dabei der Status von Beispielen wie Brahms’ Requiem, in denen die Markierung des Genitivs nur in der Schriftsprache erfolgt, und für die der Duden (2009, S. 209) eine Verschmelzung von Stammauslaut und Genitiv-s annimmt. Vgl. auch Kapitel 1 und Kapitel 3.1.1. 135 Man beachte, dass Akkusativ und Dativ keiner Sichtbarkeitsbedingung analog zur Genitivregel unterliegen; die Markierung des Kasus kann ohne Weiteres auch ausbleiben. Dieser Kontrast ist in (a) vs. (b) und (c) illustriert. (a) mangels frischen Wasser*(s) (Genitiv) (b) mit (frischem) Wasser (Dativ) (c) ohne (frisches) Wasser (Akkusativ) Endungslose Genitive 143 Bislang vorliegende Studien zur Nullrealisierung des Genitivs haben sich primär mit ausgewählten Aspekten dieses Phänomens auseinandergesetzt (vgl. z.B. Gallmann 1997 und Nübling 2012 zum Flexionsverhalten von Eigennamen); eine umfassende, korpuslinguistisch fundierte Beschreibung des Ausfalls der starken Endung steht bislang noch aus. 136 Die vorliegende Pilotuntersuchung stellt einen Ansatz zur Schließung dieser Forschungslücke vor. Im Mittelpunkt des Erkenntnisinteresses stehen dabei die folgenden Fragestellungen (vgl. Kap. 1.1): - Wirkungsfrage: Welche Faktoren sind nachweisbar wirksam? • Mit welchen Substantiven bzw. Klassen von Substantiven tritt die endungslose Variante der starken Genitivmarkierung auf? Inwiefern gibt es dabei Abweichungen von gängigen Darstellungen wie der Duden-Grammatik? Existieren morphosyntaktische Kontexte, die den Wegfall der Genitivendung günstig beeinflussen (vgl. Appel 1941)? - Hierarchisierungsfrage: • Wie lassen sich die Faktoren, die Endungslosigkeit auslösen, hierarchisieren und relativ zueinander gewichten? • Wie lassen sich die in der Literatur gängigen (vagen) Aussagen über die Häufigkeit endungsloser Formen („regelmäßig/ häufig/ möglich/ potenziell/ selten“) im Rahmen einer korpuslinguistisch fundierten Darstellung präzisieren? - Systemfrage: Ergeben die Faktoren ein konsistentes System, und wenn ja, wie kann man dieses modellieren? • Wie lassen sich die relevanten Faktoren im Rahmen einer systematischen Darstellung erfassen, die sich nicht auf eine Auflistung von Einzelfällen beschränkt? • Inwiefern lassen sich diese Faktoren auf (abstrakte) zugrundeliegende Ursachen zurückführen? - Weitergehende Fragestellungen: • Inwiefern kann ein korpuslinguistischer Ansatz zur Neubewertung gängiger (semi-präskriptiver) Aussagen zu Standardnähe/ Akzeptabilität endungsloser Varianten (insbesondere bei niederfrequenten Phänomenen) beitragen (vgl. auch Bubenhofer/ Konopka/ Schneider 2014)? 136 Eine Ausnahme ist die Arbeit von Paulfranz (2013), der allerdings nur ein recht kleines Korpus von Zeitungstexten zugrunde liegt (200.000 Wörter). Endungslose Genitive 144 • Lassen sich in den Daten Sprachwandeltendenzen nachweisen, die zu einer Erosion der Genitivmarkierung führen (Entwicklungen bei Namen, Fremdwörtern, starken Maskulina auf -en etc.)? Wir möchten darauf hinweisen, dass eine umfassende Bearbeitung aller offenen Forschungsfragen im Rahmen der vorliegenden Teilstudie nicht möglich und auch nicht beabsichtigt ist. Gleichwohl sollen aber Wege aufgezeigt werden, wie durch den Einsatz korpuslinguistischer Methoden die empirische Basis entsprechender Untersuchungen verbessert werden kann und neue Grundlagen und Argumente für linguistische Schlussfolgerungen geschaffen werden können. Wir werden uns dabei auf eine Auswahl von Themen (insbes. die Wirkungs- und Hierarchisierungsfrage betreffend) konzentrieren, die dazu geeignet erscheinen, etwaige methodische Probleme zu erkennen und entsprechende Lösungsstrategien zu entwickeln. Das vorliegende Kapitel ist wie folgt gegliedert. Zunächst wird in 3.1 ein Überblick über den Stand der Forschung zur endungslosen Realisierung des Genitivs gegeben. Es schließt sich in Kapitel 3.2 eine Diskussion methodischer Aspekte an, in deren Mittelpunkt spezifische Probleme stehen, die bei der Erkennung und korpusbasierten Analyse endungsloser Formen auftreten. Den inhaltlichen Kern der vorliegenden Teilstudie bildet Kapitel 3.3, das über die Ergebnisse unserer Korpusstudien zum standardsprachlich anerkannten Ausfall der Genitivmarkierung in ausgewählten Bereichen des Sonderwortschatzes berichtet. Ergänzt werden diese Befunde in Kapitel 3.4 durch einige stichprobenartige Untersuchungen, deren Gegenstand die nach gängiger Auffassung nicht normgerechte Ausbreitung endungsloser Formen auf bestimmte Bereiche des Grundwortschatzes ist. Kapitel 3.5 fasst die in der Teilstudie erzielten Ergebnisse zusammen. 3.1 Stand der Forschung zu endungslosen Genitiven Die nachfolgende Skizze des aktuellen Forschungsstands basiert primär auf den Darstellungen in der Duden-Grammatik (Duden 2009) und im Zweifelsfälle-Duden (Duden 2007). 137 Darüber hinaus wurden 137 Hierzu ist zu bemerken, dass in den einschlägigen Grammatiken (vgl. z.B. Duden 2009 und Duden 2007) die endungslose Realisierung des Genitivs i.d.R. als Katalog von Ausnahmen behandelt wird, ohne dass der Versuch einer systematischen Darstellung (und Deutung) unternommen wird. Besonders deutlich wird dies im Stand der Forschung zu endungslosen Genitiven 145 u.a. die Studie von Appel (1941) (insbesondere hinsichtlich des standardsprachlich nicht anerkannten Ausfalls der Genitivendung), eine rezente (korpusbezogene) Arbeit von Paulfranz (2013) sowie die Arbeiten von Gallmann (1997) und Nübling (2012) zum speziellen Verhalten von Eigennamen berücksichtigt. 138 Die Darstellung des Forschungsstands ist wie folgt gegliedert. Zunächst befassen wir uns in Kapitel 3.1.1 mit Fällen, in denen die Nullsetzung des Genitivs standardsprachlich anerkannt ist. In 3.1.2 betrachten wir Fälle von Endungslosigkeit, die nach allgemeiner Auffassung nicht der Sprachnorm entsprechen, aber dennoch im Sprachgebrauch auftreten. Gegenstand von Kapitel 3.1.3 sind die Faktoren, die in der Literatur für die endungslose Realisierung des Genitivs verantwortlich gemacht werden. Dabei werden wir auch die Frage behandeln, wie sich diese Faktoren in Form eines Baumdiagramms darstellen lassen. Abschließend gibt Kapitel 3.1.4 einen Überblick über unterschiedliche Auffassungen, die von gängigen Grammatiken des Deutschen in Bezug auf die Zulässigkeit endungsloser Genitive vertreten werden. 3.1.1 Standardsprachlich anerkannter Wegfall der Genitivendung Wie bereits eingangs erwähnt, gibt es eine Reihe von Kontexten, in denen die Unterlassung der Genitivmarkierung als normgerecht eingestuft wird. So weist die aktuelle Ausgabe der Duden-Grammatik (Duden 2009, S. 200) darauf hin, dass bei stark flektierenden Nomina die Genitivendung entfallen kann, wenn der Kasus bereits an anderer Stelle eindeutig markiert wird: Zweifelsfälle-Duden, in dem die Bemerkungen zum Wegfall der Genitivmarkierung an Einträge zu verschiedenen Substantivklassen gebunden sind und dadurch über den ganzen Band verteilt auftreten. 138 Ebenfalls relevant sind die Arbeiten von Admoni (1982, 1990), Olsen (1991) und Gallmann (1996), (1997) zur Monoflexion und die von Wurzel (1993), Wegener (1995), Rowley (1998), Thieroff (2000), Wiedenmann (2004), Ágel (2006), Nübling (2014) zum Genitivschwund bzw. Abbau der s-Flexion; zum Zusammenhang zwischen Genitivschwund und dem Einfluss konkurrierender Konstruktionen vgl. Winter (1966), Weier (1968), Hentschel (1993), Donhauser (1998), Dürscheid (2007), Stricker/ Bergmann/ Wich-Reif (2012) und Eichinger (2012); für eine optimalitätstheoretische Erklärung des syntaktisch determinierten Kasuswegfalls vgl. Müller (2002a). Endungslose Genitive 146 Nach Artikelwörtern mit Genitiv-s, zum Beispiel des, dieses, eines, jedes (↑ 356) wird das Genitiv-s oft weggelassen (Unterlassung der Kasusflexion). Es handelt sich um eine Erscheinung, die mit der Tendenz zur Monoflexion in der Nominalphrase zusammenhängt: Ein grammatisches Merkmal wird nur noch einmal ausgedrückt (§§ 1517, 1534). Das Weglassen der Genitivendung ist standardsprachlich erst teilweise anerkannt. Der durch den morphosyntaktischen Kontext bedingte Wegfall der Genitivendung erfolgt allerdings nicht generell, sondern ist nur bei bestimmten Teilklassen von Nomina zu beobachten (vgl. auch bereits Appel 1941 zu „Substantiven mit labilem s“). 139 Eine Nullmarkierung des Genitivs ist primär bei Substantiven zu beobachten, die aufgrund ihrer semantisch-pragmatischen/ kommunikativen Funktion, ihrer Herkunft oder ihrer morphologischen Eigenschaften gängigerweise dem Sonderwortschatz zugeordnet werden und weniger stark in das Flexionssystem integriert sind als andere Nomina (vgl. auch Appel 1941; Nübling 2012). Auffällig ist dabei, dass die Nullmarkierung in der Regel mit der kurzen Genitivmarkierung mittels -s alterniert, wäh- 139 Davon abzugrenzen sind laut Duden (2009, § 316, S. 206) Fälle, in denen die Genitivendung nur scheinbar fehlt, tatsächlich aber gar kein Genitiv, sondern ein anderer (endungsloser) Kasus vorliegt (möglicherweise aufgrund der sog. „Genitivregel“, § 1534, die verlangt, dass Appellativa nur dann im Genitiv stehen können, wenn ihnen ein entsprechend eindeutig flektiertes Element - Artikel oder Adjektiv - vorangeht). Zu nennen sind hier zum z.B. Dativ statt Genitiv bei bestimmten Präpositionen wie mittels Draht, mangels Treibstoff, wegen Unfall/ Todesfall etc. oder Fälle, in denen bei Verben, die eigentlich den Genitiv regieren, alternativ auch andere Kasus auftreten können: mehr Licht bedürfen (Akkusativ statt Genitiv). Unklar bleibt in diesem Zusammenhang allerdings zunächst, ob in Fällen wie wir gedenken Maria Magdalena ein Dativ oder ein endungsloser Personenname im Genitiv vorliegt. Zwar ist in diesen Kontexten der Dativ weit verbreitet, Belege wie (a) scheinen aber nahezulegen, dass das Auftreten endungsloser Formen in diesem Kontext nicht auf einen Wandel der Subkategorisierungseigenschaften der relevanten Verben (Dativ statt Genitiv) zurückgeführt werden kann, da das zweite Konjunkt (der anderen Frauen und nicht den anderen Frauen) eindeutig im Genitiv steht (vgl. Fuß 2011, S. 23). (a) Wir gedenken Maria Magdalena und der anderen Frauen, die Jesus folgten. (www.fundus-jugendarbeit.de/ material/ material.asp? id=607) Ein möglicher quantitativer Test könnte darin bestehen, das Verhältnis von eindeutigem Dativ vs. Genitiv bei den entsprechenden Verben zu ermitteln und auf dieser Basis zu überprüfen, ob die endungslosen Formen bei Eigennamen häufiger auftreten, als es die allgemeine Verteilung bei eindeutig markierten Formen erwarten lässt. Ist diese Frage positiv zu beantworten, dann ist anzunehmen, dass in diesem Kontext tatsächlich endungslose Genitive vorliegen. Stand der Forschung zu endungslosen Genitiven 147 rend die dritte Leitvariante (vgl. Kap. 1.5) auf -es im Sonderwortschatz selten ist (die lange Endung tritt vor allem bei integrierten Fremdwörtern und geografischen Namen mit s-Auslaut und/ oder betonter Ultima auf, vgl. z.B. des Omnibusses, des Indexes, des Kongresses, des Projekt(e)s, des Nördlinger Rieses). Zu nennen sind hier insbesondere Eigennamen, eigennamenähnliche Substantive (z.B. Wochentage oder Bezeichnungen für Produkte bzw. Stilepochen), das erste Glied sog. Paarformeln und anderer Koordinationsstrukturen (des Sturm und Drangs, Peter und Marias Wohnung), Fremdwörter (vgl. Paul 1917, S. 127), Substantivierungen (insbes. Konversionen wie z.B. des Gestern, Gegenüber, Hier und Jetzt) und Abkürzungen (vgl. Tab. 1, Kap. 1.3): Allen Substantiven dieser Gruppen ist eigen, daß sie, wenn auch aus ganz verschiedenen Gründen, nicht unter starkem Systemzwang stehen. (Appel 1941, S. 9) Nübling (2014) spricht im Zusammenhang mit Eigennamen auch von der „Schonung markierter Wortkörper“. 140 Appel (1941) vertritt die Auffassung, dass die genannten „Substantive mit labilem s“ (ebd., S. 9) weniger stark dem „Systemzwang“ unterliegen als andere Nomina, während sie die bei Eigennamen auftretende Endungslosigkeit auf ihre spezielle „Nennfunktion“, d.h. ihren individualisierenden Charakter zurückführt (vgl. auch Duden 2007). 141 Allerdings zeigen Eigen- 140 Ein alternativer Erklärungsansatz wird von Wegener (1995, S. 155ff.) verfolgt, die dafür argumentiert, dass der Wegfall des s-Genitivs durch den Ausbau bzw. die Aufrechterhaltung der Numerusopposition motiviert ist: Vor dem Hintergrund der Tatsache, dass in großen Teilen des Sonderwortschatzes der s-Plural vorherrschend ist (z.B. bei Eigennamen, Abkürzungen oder bestimmten Konversionen wie Farbwörtern), werde durch den Wegfall der Genitivmarkierung sichergestellt, dass Singular und Plural der betreffenden Lexeme distinkt sind (des EKG, die EKGs): Weil diese Nomina ihre Pluralformen mit -s bilden, gehen sie dazu über, die Genitivmarkierung ausschließlich am Determinans vorzunehmen, um somit Homonymie zwischen der Form des Genitiv Singular und der des Plural zu vermeiden. Der Kasusverfall trägt hier also zur höheren Transparenz der Numerusunterscheidung bei, er ist funktional. (Wegener 1995, S. 156) 141 „[...] die Nennfunktion des Eigennamens drängt die Ausprägung des Genitivs an die Stelle, wo diese Ausprägung die Nennfunktion am wenigsten beeinträchtigt, wo aber auch ihrerseits die Ausprägung des Genitivs sich am besten verwirklicht.“ (Appel 1941, S. 15; vgl. auch die alleinige Markierung des Genitivs am zweiten Konjunkt bei koordinierten Personennamen wie Peter und Marias Auto). Tatsächlich ist die Tendenz, Eigennamen möglichst unflektiert zu lassen, auch bereits von Grammatikern des 19. Jahrhunderts beobachtet worden (vgl. z.B. Bauer 1827, S. 281; Paul 1917, S. 157). Endungslose Genitive 148 namen in diesem Zusammenhang kein einheitliches Verhalten. Bei Personennamen ist der syntagmatisch bedingte Wegfall der Genitivendung am weitesten fortgeschritten und erfolgt im Gegenwartsdeutsch systematisch (vgl. Duden 2009, S. 201; Duden 2007, S. 698f.; Nübling 2012, S. 236): Bei Personennamen, die als postnominale Genitivattribute verwendet werden, erfolgt die Markierung des Genitivs nur noch am Artikel (bzw. am deklinierten Adjektiv). 142,143 Wenn der Personenname dem Kopfnomen vorangeht, kann u.U. auch der Name flektiert werden (vgl. Duden 2009, S. 201; Duden 2007). In einer COSMAS -Recherche 144 zum Flexionsverhalten des Namens Goethe in Syntagmen der Art des-ADJ-Goethe(s) treten nur zwei Fälle auf, in denen der Personenname das Genitiv-s trägt (vs. 65x des-ADJ-Goethe). In beiden Fällen befindet sich der genitivische Ausdruck in pränominaler Position, vgl. (5) und (6). Postnominal scheint Monoflexion obligatorisch zu sein. 145 142 Der Duden-Grammatik zufolge liegt hier eine Asymmetrie zwischen femininen und maskulinen Personennamen vor. Während nachgestellte maskuline Personennamen lediglich „überwiegend“ endungslos erscheinen (vgl. Beispiele mit multipler Genitivmarkierung wie die Odyssee des kleinen Daniels), sind feminine Personennamen in diesem Kontext obligatorisch endungslos: (a) *der Geburtstag der kleinen Annas Allerdings liegt es u.U. nahe, diese Asymmetrie auf das Vorhandensein des Genitivartikels der zurückzuführen, der in Fällen wie (a) die für Feminina charakteristische schwache Flexion am Personennamen auslöst. 143 Appel (1941, S. 15f.) weist allerdings auf Fälle hin, in denen „die Genitivischkeit scheinbar überhaupt nicht ausgeprägt wird“: der traurigen Miene Penelope, Betrachtungen zum Tode Oswald Spengler. 144 Recherche am 11.10.2012 im Tagged-T-gesamt Teilkorpus (DeReKo-2010-II). 145 Ein analoges Bild ergibt sich bei (freilich selteneren) Belegen der Art Artikel+Goethe. Pränominal dominiert Goethes (artikellos, > 3000 Belege), während postnominal auftretende Varianten mit Artikel generell endungslos sind. Die wenigen Belege der Art des Goethes gliedern sich in drei Arten. Belege wie (a) legen eine appellativartige Verwendung des EN nahe, während (b) eine Bildung in Analogie zu dem bekannten Volkslied zu sein scheint. Der einzige weitere Beleg ist (c), der aber m.E. keine standardsprachlich akzeptable Variante darstellt und womöglich als Fehler zu klassifizieren ist. (a) Eine Nacht zu Ehren des Goethes Schottlands (Rhein-Zeitung, 26.1.2012, S. 27) (b) Das Reisen war des Goethes Lust (Rhein-Zeitung, 20.8.1999; Das Reisen war des Goethes Lust) Stand der Forschung zu endungslosen Genitiven 149 (5) Wussten Sie eigentlich, dass in Berlin ein Automechaniker namens Johann Wolfgang Goethe lebt? Die „ FAZ “ hat den mal zu des alten Goethes 250. Geburtstag interviewt. Das wäre natürlich das Ding, wenn die zwei sich mal zusammentäten und eine Firma gründeten: „Faust &; Goethe - Wir reparieren Holz- und Blechschäden aller Art“. (Berliner Zeitung, 30.3.2001; War Herr Faust wieder bei Ihnen? [S. 11]) (6) Wer ein paar Schritte weitergeht in die Ausstellung „Bach und Goethe“, der wird noch einmal auf eben jenen kleinen Quälgeist großer Geister stoßen. Rektor Ernesti scheint mit den Jahren nicht versöhnlicher geworden zu sein. Er versuchte, des jungen Goethes Weltbestseller „Werthers Leiden“ wenigstens in Leipzig verbieten zu lassen. Es wäre schön, man errichtete diesem nervigen Plagegeist, der es doch nur gut meinte, ein Denkmal. Unserer eigenen Fortschrittlichkeit zur Warnung. (Berliner Zeitung, 30.10.2002; MOBBING [S. 12]) Bei anderen Typen von Namen unterliegt die Realisierung der Genitivmarkierung stärkerer Variation. 146 So stellt die Duden-Grammatik (2009, S. 200) fest, dass bei geografischen Namen (Toponymen) mit fes- (c) Damit das nicht zu monoton ist, entwickelt er um diesen ernsten Kern ein Personal zum Schreien. Allein wie Daniels liebeshungrige Mutter geschildert wird, wie er den Autor vorführt, der einen Bildungsroman über die sexuelle Beziehung des Goethes zu seiner Gönnerin Anna Amalia schrieb und für den Altherren-Schweinkram mit der „Kleistnadel“ ausgezeichnet wird, ist zum Kreischen. (Nürnberger Nachrichten, 20.2.2009, S. 8; Ein Banker in peinlichen Nöten - Bodo Kirchhoff reagiert auf die Finanzkrise: „Erinnerungen an meinen Porsche“) 146 Keine Berücksichtigung finden hier die z.T. recht komplexen Regeln der Genitivmarkierung von komplexen Personennamen, die Titel bzw. Berufsbezeichnungen enthalten. Titel wie Herzog, Graf etc. werden entweder als Namensbestandteil behandelt (Genitivmarkierung am Eigenname, vgl. (a) oder als Kopf der Konstruktion (Genitivmarkierung am Titel, Eigenname als Apposition, vgl. (b) (Beispiele aus Appel 1941, S. 14): (a) Herzog Heinrichs Getreue (b) des jungen Herzogs Heinrich Getreue (c) die Getreuen des (jungen) Herzogs Heinrich (d) die Getreuen Herzog Heinrichs Es treten allerdings vereinzelt Fälle auf, in denen der Genitiv weder am Namen noch am Titel markiert wird: Endungslose Genitive 150 tem Artikel „endungslose Formen [...] nicht mehr als falsch angesehen [werden]“. Die Tendenz zur Endungslosigkeit verstärkt sich, wenn mehrere der entsprechenden Faktoren zusammenkommen. So erscheinen laut Duden (2009) heute vor allem fremdsprachliche Toponyme wie Kongo, Mississippi usw. bevorzugt endungslos, während einheimische Namen das Genitiv-s noch häufiger tragen: des Rhein(s), des Neckar(s) usw. In diesem Zusammenhang äußert Nübling (2012, S. 241) die Hypothese, dass mit zunehmender Geläufigkeit eines Toponyms die Tendenz zur s-Endung stärker wird: „Die Bekanntheit bzw. Nativität des Namens scheint dabei eine Rolle zu spielen und das Genitiv-s eher zu fördern: [...].“ Diese Einschätzung findet Unterstützung durch eine Korpusstudie, die Nübling für ausgewählte Toponyme durchgeführt hat (ebd., S. 241; DeReKo/ COSMAS , Stand: 2010): Name im Genitiv Nullendung s-Endung Prozent abs. abs. des Himalaya- 85% 775 132 des Jemen- 83% 217 43 des Kongo- 73% 495 185 des Irak- 68% 3894 1856 des Iran- 65% 1916 1024 des Europa- 46% 36 43 des Balkan- 23% 317 1075 des Engadin- 7,6% 19 229 des (wieder)verein(ig)ten Deutschland- 52% 224 205 Tab. 12: Der Genitiv bei Gebirgs-, Landschafts- und Ländernamen mit Artikel (Nübling 2012, S. 241) (e) Heimatforscher Ulrich Tietje berichtet über das recht unstete und pralle Le- ben des Herzog Franz von Braunschweig. (Braunschweiger Zeitung, 25.3.2009; Vortrag über Herzog Franz) Stand der Forschung zu endungslosen Genitiven 151 Name im Genitiv Nullendung s-Endung abs. abs. des Rhein- 64 11.393 des Neckar- 44 935 des Nil- 94 457 des Mississippi- 365 22 des Orinoko- 62 2 des Tiber- 48 30 des Yangtse- 59 0 Tab. 13: Der Genitiv bei Flussnamen (Nübling 2012, S. 242) Tatsächlich können wir für die hier ausgewählten Eigennamen einen Kontrast zwischen nativem und entlehntem Vokabular beobachten. Es handelt sich aber lediglich um Tendenzen, die nicht immer eindeutig sind. Für gesicherte Aussagen müsste eine größere Zahl von Beispielen untersucht werden. Weitergehende Fragen betreffen u.a. die Deutung des recht vagen Begriffs der „Bekanntheit“ eines Namens. Eine etwaige Definition kann offensichtlich nicht allein auf die relative Häufigkeit im Korpus rekurrieren (hier liegen Iran und Irak deutlich vor den Namen mit überwiegend overter Markierung). Auch ist nicht ausgemacht, inwiefern Engadin - zumindest im Gegenwartsdeutschen - einen höheren Bekanntheitsgrad als Iran oder Irak für sich beanspruchen kann. In diesem Zusammenhang könnte man auch daran denken, entsprechende Streuungseffekte im Korpus zu untersuchen (lässt sich nachweisen, dass das Flexionsverhalten von Eigennamen abhängig von außersprachlichen Faktoren wie Medium, inhaltliche Domäne (Fiktion, Technik/ Wissenschaft, Politik etc.) oder Region ist? ). Zum anderen scheint die Menge der Nomina, die hier miteinander verglichen werden, nicht ganz homogen zu sein: Neben Toponymen mit festem Artikel wie Himalaya enthält die Liste Namen wie Europa, die durchaus auch ohne Artikel auftreten können, und darüber hinaus eine komplexe Nominalphrase wie des wiedervereinigten Deutschlands. Ungeachtet dieser methodischen Probleme macht Nüblings Hypothese allerdings eine interessante Prognose, die im Rahmen einer umfangreicheren Korpusstudie zu überprüfen wäre: Wenn die Tendenz zur s-Endung an die Geläufigkeit eines (fremdsprachlichen) Eigennamens gekoppelt Endungslose Genitive 152 ist und die Geläufigkeit eines Ausdrucks (zumindest ansatzweise) an seiner relativen Häufigkeit gemessen werden kann, dann würde man evtl. erwarten, dass Fluktuationen in der Häufigkeit eines Elements im Korpus auch sein Flexionsverhalten beeinflussen. Konkret wird prognostiziert, dass ein signifikanter Anstieg der Häufigkeit eines (nichtnativen) Eigennamens mit einem Anstieg des Anteils der s-Endungen verbunden ist (vgl. Kap. 3.3.2.6 für entsprechende Befunde). Für die Hypothese, dass ein kausaler Zusammenhang besteht zwischen dem Ausfall der s-Endung und dem Grad der Integration eines Wortes, spricht auch die Beobachtung, dass bestimmte Appellativa (insbesondere Entlehnungen) zur Endungslosigkeit tendieren, wenn sie als Fachwort/ Terminus Technicus oder Gattungsbegriff verwendet werden (z.B. Appel 1941; Duden 2007, S. 988f.). Auch hier liegt in gewisser Weise ein eigennamenähnlicher Gebrauch vor, bei dem die Nennfunktion im Vordergrund steht. Ein weiterer Hinweis darauf, dass der Ausfall des Genitiv-s in Verbindung steht mit einer mangelnden Integration in das nominale Flexionssystem, liefert der (normgerechte) endungslose Gebrauch von Substantivierungen wie des Gestern oder seines Gegenüber, die aus nicht-flektierbaren Wortklassen abgeleitet sind (s.u.): Resultate von Konversion sind oft nicht vollständig in die Zielwortart integriert und können deshalb ein abweichendes Flexionsverhalten zeigen. Die Tendenz zur Endungslosigkeit wird durch bestimmte lautliche Faktoren verstärkt. So fehlt Eigenamen insbesondere dann die Genitivendung, wenn sie auf eine (unbetonte) Silbe mit s-Auslaut (schriftsprachlich <s, ss, ß, z, tz, x>) enden (der Tod des Alten Fritz, die Entstehung des Nördlinger Ries). Bei Personennamen existiert in diesem Zusammenhang eine alternative Markierungsvariante durch Hinzufügung eines Apostrophs. 147 Allerdings sind laut Duden-Grammatik (2009, S. 209) entsprechende Formen „fast nur noch als vorangestellte Genitivattribute“ zu finden (also z.B. Fritz’ Hut, Iris’ Tasche), während in postnominaler Position der Apostroph entweder wegfällt, wenn ein Artikelwort gesetzt werden kann (der Tod des Perikles), oder zu alternativen Konstruktionstypen gegriffen wird, um eine Verwendung des Genitivs zu vermeiden (der Hut von Fritz statt der Hut des Fritz). Bei nativen geografischen Namen führt das Vorliegen einer finalen Silbe 147 Die Duden-Grammatik wertet dies als Hinweis darauf, dass die Genitivendung mit dem s-Auslaut des Nomens verschmilzt (2009, S. 209). Stand der Forschung zu endungslosen Genitiven 153 auf -s ebenfalls zu einer größeren Häufigkeit s-loser Formen bzw. zur Verwendung anderer syntaktischer Wendungen (vgl. Duden 2007, S. 374f.), während fremdsprachliche Namen wie des Amazonas, des Ganges obligatorisch endungslos bleiben. Eine Neigung zur endungslosen Realisierung des Genitivs findet sich auch bei bestimmten Appellativa, die aufgrund ihrer Etymologie oder ihrer kommunikativen Funktion den Eigennamen nahe stehen. Dazu zählen Monatsnamen, Wochentage, Kunst- und Stilepochen wie des Barock, des Biedermeier (laut Duden 2007, S. 135, 164 ist die endungslose Realisierung des Genitivs an die Verwendung als Fachausdruck gebunden, z.B. in der Kunstgeschichte) sowie Produktbezeichnungen (des Aspirin(s), des Duden(s), des Opel(s) Astra/ des Opel Astra(s)) und Buch-, Zeitungssowie Filmtitel. Die (Nicht-)Realisierung des Genitivs unterliegt hier nach gängigen Einschätzungen stärkeren Schwankungen als bei den Eigennamen; z.T. wird das Auslassen der Flexion in älteren Ausgaben des Duden noch als Normabweichung betrachtet (vgl. z.B. die Duden-Grammatik von 1959, S. 201 zu den Wochentagen). Wenig Klarheit herrscht dabei hinsichtlich der Frage, welche Bedingungen den Wegfall der Genitivendung bei eigennamenähnlichen Appellativa begünstigen. So findet sich in der Literatur die Behauptung, dass bei Monatsnamen und Wochentagen die Genitivendung insbesondere dann wegfällt, wenn dem eigennamenähnlichen Element ein weiteres Substantiv vorangeht, während Monatsnamen auf -er die Genitivendung häufiger bewahren (vgl. z.B. Duden 2007, S. 633). Eine korpuslinguistische Überprüfung dieser Einschätzungen steht allerdings noch aus (vgl. Kap. 3.3.2.2 für einige relevante Beobachtungen). Im Gegensatz zu den bisher genannten Nominaltypen wird der Genitiv starker Appellativa (Maskulina und Neutra) in der Regel morphologisch markiert. Standardsprachlich anerkannte Endungslosigkeit findet sich nur bei bestimmten Fremdwörtern, Zitaten, Substantivierungen, Abkürzungen (hier wird die Endung laut Duden 2009, S. 205 „meist weggelassen“) sowie sog. Paarformeln (des Sturm(s) und Drangs) und mehrteiligen festen Verbindungen, wenn „der substantivische Kern den übrigen Bestandteilen vorangeht“ (ebd., S. 204): die Herstellung des Vitamin(s) C, die Form des Partizip(s) Perfekt. Bei nicht-nativen Appellativa hängt die Nullrealisierung des Genitivs wesentlich von der Lautgestalt ab. Liegt eine unbetonte finale Silbe auf -s bzw. -us vor, dann ist ähnlich wie bei Eigennamen der Ausfall der Endung quasi Endungslose Genitive 154 obligatorisch. Die Duden-Grammatik nimmt hier an, dass bei den endungslosen Formen „eine Verschmelzung der kurzen Genitivendung -s mit dem Stammauslaut“ vorliegt (ebd., S. 196); ferner wird darauf hingewiesen, dass die Endungslosigkeit abhängig ist vom Grad der Integration des nicht-nativen Ausdrucks (vgl. auch Duden 2007, S. 329f.). So sei die Genitivmarkierung bei geläufigeren Wörtern wie des Bonus(ses)/ Index(es)/ Rhinozeros(ses) variabel, während des Omnibusses nur mit Endung verwendet wird (man beachte, dass in diesen Fällen ausnahmsweise die Nullendung mit der langen Endungsvariante -es alterniert). Als Indikator für den Grad der Integration betrachtet der Duden die Art der Pluralform: „Substantive mit fremder Pluralform sind am schwächsten, solche mit e-Plural am stärksten integriert“. (2009, S. 203). 148 Weniger eindeutig ist die Lage bei Substantivierungen. Laut der aktuellen Duden-Grammatik (2009, S. 205) können Nomina, die mittels Konversion aus nicht flektierbaren Wörtern (des Gestern, des Heute, des Hier und Jetzt, seines Gegenüber), zitierten Einzelbuchstaben (des U) oder Pronominalformen (des Ich) gebildet werden, potenziell endungslos bleiben. Tatsächlich scheint hier aber eine starke Tendenz zur Endungslosigkeit vorzuliegen (vgl. Kap. 3.3.1.2). Bei Sprachbezeichnungen treten beide Varianten auf (des Deutsch(s), des Sanskrit(s)); bei Farbwörtern fordert der Duden (2009, S. 205, 350) die overte Markierung des Genitivs (des Grüns, des Blaus etc.). Eine etwas differenziertere Betrachtung liefert der Zweifelsfälle-Duden, der endungslose Varianten bei Schwarz und Weiß akzeptiert (2007, S. 304), vgl. auch Kapitel 3.3.2.5 für die Befunde einer Korpusstudie zur Genitivmarkierung von Farbwörtern. 3.1.2 Nicht standardsprachlich anerkannter Wegfall der Genitivendung Während sich die Grammatikschreibung traditionell auf die Darstellung von normgerechter Endungslosigkeit konzentriert, ist die einschlägige Forschungsliteratur auch mit Fällen befasst, in denen - vor allem im Bereich der Mündlichkeit - die Genitivmarkierung bei starken Nomina ausfällt, ohne dass dies (bislang) standardsprachlich anerkannt ist (vgl. Appel 1941, Winter 1966, Weier 1968, Hentschel 1993, 148 „Standardsprachlich anerkannt“ (Duden 2009, S. 204) ist die Nullendung bei einigen nativen Wörtern auf -s wie des Fels (nicht normgerecht sind laut Duden hingegen Formen wie des Kompass oder des Geheimnis). Stand der Forschung zu endungslosen Genitiven 155 Wurzel 1993, Wegener 1995, Rowley 1998, Wiedenmann 2004, Ágel 2006 und Paulfranz 2013 für einen Überblick; vgl. auch Duden 2007). Im Mittelpunkt stehen dabei u.a. starke Maskulina auf -en (des Rahmen/ Garten/ Hafen usw.), 149 Substantivierungen von Infinitiven (des Rennen), Verwandtschaftsbezeichnungen, wenn sie als individualisierte Personenbezeichnungen verwendet werden und damit den Eigennamen nahe stehen (z.B. die Größe seines Vater, Appel 1941, S. 20), Diminutiva (des Pferdchen, Appel 1941, S. 23f.), bestimmte (geläufige) Fremdwörter (z.B. auf -ing: des Leasing(s), auf Sibilant: des Strauß(es), des Proporz(es), vgl. Duden 2007, S. 329f., 988ff.), Komposita mit s-Fuge (des Offizierskasino, Appel 1941, S. 31), Farbwörter (des Grün/ Blau usw., vgl. Duden 2007, S. 304) sowie Fälle, in denen der Wegfall der Genitivmarkierung durch Eigenschaften der (morpho-)syntaktischen Umgebung begünstigt bzw. ausgelöst wird. Nach Appel (1941, S. 27ff.) handelt es sich bei Letzteren vor allem um die folgenden Kontexte (vgl. auch Paulfranz 2013 für eine entsprechende Übersicht): 150 1) s-Haltigkeit des unmittelbaren morphologischen oder syntaktischen Kontexts Darunter lassen sich folgende Fälle subsumieren: a) Komposita mit s-Fuge, in denen Fugenelement und Genitivendung in Konkurrenz zueinander zu treten scheinen (des Offizierkasinos vs. des Offizierskasino, wegen Landfriedensbruch vs. wegen Landfriedenbruchs; Appel 1941, S. 31); b) (mehrere) s im Anlaut (die Sachsen sind in den Mittagsstunden des Sonnabend-∅ in Sybillenort eingetroffen, Appel 1941, S. 31) bzw. im Auslaut (des Ehrgeiz-∅/ Kreditausschuss-∅). 151 149 Der Schwund des / -s/ bei Substantiven auf -en wird oft als Analogiebildung zu den Genitivformen schwacher Maskulina betrachtet (vgl. z.B. Duden 2009, S. 203) oder in Zusammenhang gebracht mit der Bildung neuer Deklinationsschemata (vgl. z.B. Poitou 2004; Peschel 2009; Krischke 2012). Ferner ist dafür argumentiert worden, dass der Wegfall des / -s/ bei dieser Nomenklasse durch die Präsenz eines ebenfalls auf -en endenden Adjektivs begünstigt wird (vgl. Appel 1941, S. 1). 150 Appel identifiziert weitere Fälle von syntaktisch motiviertem s-Schwund, in denen ein Genitiv durch alternative Konstruktionen (wie Präpositionialphrasen bzw. Appositionen) ersetzt wird. Da diese keine endungslosen Genitive darstellen, werden sie hier nicht weiter behandelt. 151 Für den Wegfall der Genitivendung bei s-Haltigkeit im Anlaut macht Appel lautlichrhythmische Gründe verantwortlich („Ein auslautendes ‘s’ mit genitivischer Bedeutung an ‘Sonnabend’ würde den Fluss der anlautenden ‘s’ durchbrechen“, 1941, S. 31), Endungslose Genitive 156 2) Besondere Länge des genitivischen Komplexes Die Genitivendung kann ausbleiben, wenn dem genitivischen Nomen ein Artikel und eines oder mehrere Adjektive auf -en vorausgehen (Appel 1941, S. 34ff.). Appel geht hier davon aus, dass der Genitivcharakter der Phrase durch Artikel und dekliniertes Adjektiv bereits „genügend ausgeprägt erscheint“ (ebd., S. 34f.) und das Genitiv-s daher ausgelassen werden kann. 3) Koordinierte Substantive im Genitiv Appel führt hier Fälle an, in denen die koordinierten Nomina „untereinander in besonderer Zusammengehörigkeit stehen“ (1941, S. 37; vgl. auch den Wegfall der Genitivendung bei Paarformeln, s.o.). Dazu zählen insbesondere auch Aufzählungen. Der Genitiv wird hier oft nur am zweiten Glied der Koordination markiert (Ich war des Staunen und Sehens müde..., ebd., S. 38) oder ganz weggelassen (die Erziehung eines Knaben oder eines Mädchen, ebd.). 152 4) Subordinierte Substantive im Genitiv Das Genitiv-s kann aus stilistischen Gründen entfallen, wenn dem genitivischen Nomen ein weiteres „subordiniertes“ Genitivattribut nachgestellt wird (Genitivketten wie die Einsicht in dessen Pläne des beabsichtigten Ausbau-∅ des Kölner Doms, Appel 1941, S. 40). 5) Einwirkung eines größeren sprachlichen Komplexes, der den Genitiv übergreift Ein Wegfall der Genitivendung kann in Kontexten ausgelöst werden, in denen die Genitivphrase in einer Nominalphrase eingebettet ist, die eine andere (dominierende) syntaktische Funktion realisiert (Appel 1941, S. 42f.). Darunter subsumiert Appel Dative in lokativer Funktion (Sie hat ihn zum Zeichen des Anfang gesandt), Akkusativkomplexe (Wenn wir in das Innere des Gärtchen hineinblicken) und den Objektsgenitiv (Das Betreten des Gemüsegarten ist verboten). 6) Verblassen des genitivischen Gehalts in Fügungen mit Präpositionen Nach Präpositionen, die den Genitiv regieren, treten endungslose Varianten auf, bei denen der Genitiv nur noch am Artikel markiert ist: Sie muß dableiben wegen des Neubau; inmitten des großen politischen während sie im zweiten Fall ähnlich wie die Duden-Grammatik davon ausgeht, „daß das auslautende ‘s’ die Funktion des genitivischen ‘s’ mit übernimmt“ (ebd., S. 32). 152 Appel führt den Wegfall darauf zurück, dass in den vorliegenden Fällen „eine Geschlossenheit der Formen“ (1941, S. 39) vorliege, die durch eine regelhafte Setzung des Genitiv-s durchbrochen würde, vgl. auch Fälle wie Peter und Marias Auto. Stand der Forschung zu endungslosen Genitiven 157 Geschehen (Appel 1941, S. 44). Appel vermutet, dass der Ausfall der Genitivendung hier dadurch motiviert ist, dass durch die Konkurrenz des Dativs die entsprechenden Formen „keinen spezifischen genitivischen Gehalt mehr“ besitzen (ebd.). Wie eine nähere Betrachtung der Beispiele bereits nahelegt, sind vom syntaktisch bedingten Wegfall der Genitivendung insbesondere solche Nomina betroffen, die aufgrund ihrer lexikalischen Eigenschaften ohnehin zur Endungslosigkeit tendieren („Substantive mit labilem s“, vgl. Appel 1941). In einigen der von Appel diskutierten Fälle ist es allerdings nicht ganz eindeutig, welchem Faktor die größere Bedeutung zukommt. So kann in (7a) der Ausfall der Genitivendung entweder durch das Vorliegen einer Genitivkette (wie Appel behauptet) oder die Länge des Genitivkomplexes begründet werden. Analog dazu könnten für (7b) entweder das Verblassen des genitivischen Gehalts nach Präpositionen (Appel 1941, S. 44) oder wiederum das Vorliegen eines Adjektivs (oder Nomens (in 7b)) auf -en relevant sein. (7) a. die Einsicht in dessen Pläne des beabsichtigten Ausbau-∅ des Kölner Doms 153 (Appel 1941, S. 40) b. inmitten des großen politischen Geschehen-∅ (ebd., S. 44) Auch hier stellt also die Gewichtung und Hierarchisierung der unterschiedlichen von Appel postulierten Faktoren ein Forschungsdesiderat dar. Generell scheint es jedoch plausibel zu sein, anzunehmen, dass eine Häufung der Faktoren die Tendenz zur Endungslosigkeit verstärkt (vgl. Kap. 3.3.2.6 für eine weitergehende Diskussion). Auch wenn Appels Thesen zur endungslosen Realisierung des Genitivs teilweise durchaus plausibel erscheinen und durch (einzelne) relevante Belege gestützt werden, ist ihr empirischer Status vor dem Hintergrund moderner korpuslinguistischer (und psycholinguistischer bzw. experimenteller) Zugänge unklar. In Kapitel 3.4 wollen wir daher zumindest für eine Auswahl der von Appel genannten Faktoren überprüfen, inwiefern sie sich in unserer Genitivdatenbank (GenitivDB) nachweisen lassen. Dabei soll auch untersucht werden, ob sich die re- 153 Entsprechende Beispiele lassen sich auch im DeReKo finden, vgl.: Der türkische Keeper dürfte erst im Fall des Erreichen-∅ des Finales wieder mitwirken. (Hamburger Morgenpost, 24.6.2008, S. 7; Keeper Volkan bleibt gesperrt) Endungslose Genitive 158 levanten Tendenzen verstärkt haben, oder ob vielmehr ein Wandel zu weniger (stilistisch bzw. informationsstrukturell nutzbarer) Variation erfolgt ist (in vielen Fällen, bei denen Appel noch eine Tendenz zur Endungslosigkeit beobachtet hat, scheint zumindest auf den ersten Blick heute die sichtbare Genitivmarkierung obligatorisch zu sein). Eine exhaustive korpuslinguistische Prüfung aller Thesen wird nicht angestrebt, da allein die Untersuchung von Einflussgrößen, die im syntaktischen Kontext des Genitivnomens angesiedelt sind, inhaltliche Fragen und methodische Probleme aufwirft, die u.E. eine eigenständige Studie rechtfertigen. 3.1.3 Endungslose Realisierung des Genitivs: Faktoren Im Folgenden wollen wir kurz auf die Faktoren eingehen, die bei der endungslosen Realisierung des Genitivs eine Rolle spielen. Dabei werden wir auch die Frage behandeln, wie sich diese Faktoren gewichten bzw. im Rahmen eines Baumdiagramms hierarchisieren lassen. Auf der Basis der bisherigen Ausführungen lässt sich bereits erkennen, dass für die Wahl des Nullallomorphs andere Faktoren relevant sind als für die Unterscheidung zwischen langer und kurzer Genitivendung. Generell scheint zu gelten, dass lexikalischen (Fremdwortcharakter), morphosyntaktischen (z.B. Monoflexion) und semantischpragmatischen Faktoren (Nennfunktion von Eigennamen) eine entscheidende Rolle zukommt, während lautliche Faktoren nur in Kombination mit anderen Faktoren eine Nullmarkierung des Genitivs begünstigen. So führt das Vorliegen eines s-Lauts am Wortende (das den primären phonologischen Faktor darstellt) nur bei Eigennamen und (nicht-integrierten) Fremdwörtern, nicht aber bei nativen Appellativa, zum Ausfall der Genitivmarkierung wie z.B. der Kontrast zwischen des Ausschusses vs. des Tempus oder des Kleckses vs. des Sex belegt (einige Grammatiken heben in diesem Zusammenhang auch die Rolle lateinischer Endungen auf -us bzw. -ismus hervor, vgl. z.B. Paul (1917, S. 133, S. 156) zu Eigennamen auf lat. -s). Allerdings scheint der Einfluss lautlicher Faktoren insofern zu systematischeren Effekten zu führen, als bei den betroffenen Nomina i.d.R. keine morphologische Markierung des Genitivs möglich ist. Wir müssen also mindestens zwei Typen von Endungslosigkeit unterscheiden: Während bei rein morphosyntaktisch (bzw. semantisch-pragmatisch) bedingter Nullmarkierung des Genitivs (Monoflexion) meist eine Variante mit s-Markierung existiert, Stand der Forschung zu endungslosen Genitiven 159 bewirken lautliche Faktoren (in Kombination mit anderen Faktoren) i.d.R. konsistente bzw. kontextunabhängige Endungslosigkeit: (8) Wie bereits erwähnt, treten systematisch endungslose Formen primär bei Nomina auf, die ohnehin zur Endungslosigkeit tendieren, wie Fremdwörter und Eigennamen (insbesondere Personennamen, vgl. Fritz’ Tasche). In der Literatur wird die Auffassung vertreten, dass hierbei nicht nur die Form der finalen Silbe (Endung auf s-Laut), sondern auch deren prosodische Eigenschaften von Bedeutung sind. So bemerkt die Duden-Grammatik (2009, S. 196), dass „[b]ei Fremdwörtern, die auf eine unbetonte Silbe mit einem s-Laut enden“, endungslose Formen erscheinen. Neben dem lautlich bedingten Ausfall der Genitivmarkierung, der einen Großteil aller endungslosen Realisierungsformen ausmacht (vgl. insbes. die häufigen Bildungen auf -ismus), wollen wir im Rahmen der vorliegenden Studie vor allem auch solche Nomina betrachten, die Variation zwischen s-Markierung und Nullmarkierung zeigen, vgl. (8a). Dazu zählen neben primär semantischlexikalisch bedingter Endungslosigkeit (Eigennamen, Fremdwörtern, Abkürzungen etc.) auch Fälle, in denen der Wegfall der Genitivendung auf morphologische Faktoren zurückgeführt werden kann. Zu nennen sind hier neben Konversionen (s.o.) Komposita, Diminutive (Appel 1941) und endungslos auftretende (starke) Maskulina auf -en (sowie evtl. substantivierte Infinitive). Gemein ist dieser Gruppe von Nomina, dass die Unterlassung der Genitivflexion von der gegenwärtigen Grammatikschreibung (mit Ausnahme bestimmter Substantivierungen) oft als nicht normgerecht betrachtet wird. Zusammenfassend lassen sich die Faktoren, die in der Literatur für die Nullrealisierung des Genitivs verantwortlich gemacht werden, wie in Abbildung 45 gezeigt hierarchisieren und veranschaulichen. Bei der Interpretation des Baumdiagramms folgt man - ausgehend vom Wurzelknoten an der Spitze des Entscheidungsbaums - den Ästen des Endungslose Genitive 160 Baums bis zu den weiß unterlegten Blättern, die Informationen über die jeweils zu wählende Markierungsvariante enthalten. Jeder Knoten auf dem Weg von der Wurzel bis zu den Blättern repräsentiert einen möglichen Einflussfaktor. Der Pfad von der Wurzel bis zu einem Blatt beschreibt über die dabei überquerten Knoten das Zusammenwirken der einzelnen Faktoren, wobei wichtigere Faktoren tendenziell weiter oben und weniger wichtige tendenziell weiter unten im Baum angesiedelt sind. So reflektiert die Anordnung des Knotens ‘Fremdwort’ oberhalb des Knotens ‘Auslaut auf Sibilant’ (im weiteren Verlauf oft auch ‘s-Auslaut’ genannt) ein Abhängigkeitsverhältnis zwischen den beiden Einflussgrößen: Der Faktor ‘Auslaut auf Sibilant’ entfaltet seine Wirksamkeit nur, wenn gleichzeitig der Faktor ‘Fremdwort’ (oder ein anderer lexikalischer Faktor wie ‘Eigenname’) vorliegt; umgekehrt gilt dies aber nicht. Die hierarchische Darstellung repräsentiert aber nicht unmittelbar (mithilfe statistischer Methoden ermittelbare) Eigenschaften wie Durchschlagskraft und Reichweite der einzelnen Faktoren. Vielmehr wird primär eine systematisierende Darstellung der Einflüsse angestrebt, die zu einer Nullmarkierung des Genitivs im Bereich des Sonderwortschatzes führen können (der Bereich des Grundwortschatzes, der in Kapitel 2 ausführlich behandelt wird, ist durch eine gestrichelte Umfassung gekennzeichnet). Die Angaben zur Wahl der Markierungsvariante sind dabei wie folgt zu interpretieren: - -∅: eindeutige (sehr starke) Präferenz für die Nullmarkierung - -∅/ (-s): deutliche Präferenz für die Nullmarkierung - -∅/ -s: leichte Präferenz für die Nullmarkierung Im Zusammenhang mit Abbildung 45 möchten wir darauf hinweisen, dass es sich hierbei nur um einen ersten Vorschlag zur Hierarchisierung bzw. Gewichtung von interagierenden Faktoren wie ‘Fremdwort’, ‘Auslaut’ etc. handelt, der noch einer genaueren korpuslinguistischen bzw. statistischen Überprüfung unterzogen werden muss (vgl. Kap. 3.3.2 für einige relevante Überlegungen). Stand der Forschung zu endungslosen Genitiven 161 Abb. 45: Ausfall des Genitiv-s: Hierarchische Darstellung relevanter Faktoren (Sonderwortschatzbereich) Endungslose Genitive 162 3.1.4 Zur normativen Einordnung der Nullrealisierung Wie aus der vorausgehenden Darstellung deutlich wird, ist das Phänomen der grammatischen Variation im Zusammenhang mit endungslosen Genitiven bislang noch unzureichend erfasst; insbesondere fehlt es an einer systematischen Aufarbeitung und Darstellung der quantitativen Verhältnisse. Die Duden-Grammatik unterscheidet hier zwischen „obligatorischer“, „überwiegender“, „häufiger“, „standardsprachlich anerkannter“, „potenzieller“ und „nicht standardsprachlich anerkannter“ Endungslosigkeit, ohne diese Aussagen durch weitere empirischquantitative (z.B. korpusbezogene) Befunde zu stützen; ähnlich vage Angaben finden sich im Zweifelsfälle-Duden, der von „notwendigem“, „zweifelsfrei möglichem“, „möglichem“ und „nicht-korrektem“ Wegfall des Genitiv-s spricht. Darüber hinaus zeigt eine exemplarische Gegenüberstellung ausgewählter Fälle, dass die Aussagen zum Status des Wegfalls der Genitivendung in den einschlägigen Darstellungen zwar viele Übereinstimmungen aufweisen, aber trotzdem nicht immer deckungsgleich sind. So stellt Paulfranz (2013) fest, dass insbesondere die Duden-Grammatik generell oft eine konservativere Haltung vertritt und die Setzung des -s fordert (z.B. bei Gattungsbezeichnungen, die aus Personennamen hervorgegangen sind) bzw. akzeptiert (z.B. bei maskulinen Personennamen mit sekundärem Artikel), wenn andere Grammatiken davon bereits absehen. Ferner lässt sich feststellen, dass die Empfehlungen zur Realisierung der Genitivendung in den letzten 50 Jahren einigen Schwankungen unterliegen und auf diese Weise Sprachwandeltendenzen im Gegenwartsdeutschen reflektieren. So erkennt die Duden-Grammatik erst seit der Ausgabe von 2006 den endungslosen Gebrauch von Wochentagen als normgerecht an. Die folgende Tabelle (basierend auf Paulfranz 2013, S. 53ff.; hier neu geordnet, gekürzt und ergänzt durch Beispiele und die Empfehlungen des Zweifelsfälle-Dudens (ZD) von 2007) gibt einen Überblick über Aussagen zur Realisierung der Genitivmarkierung bei „Substantiven mit labilem s“ in einer Reihe einschlägiger deskriptiver Grammatiken. 154 154 Die verwendeten Kürzel schlüsseln sich wie folgt auf: D: Ausgaben der Duden- Grammatik; J: Grammatik der deutschen Sprache von Walter Jung; G: Neue deutsche Grammatik von Heinz Griesbach; S: Grammatik der deutschen Sprache von Dora Schulz und Heinz Griesbach; H: Handbuch der deutschen Grammatik von Elke Hentschel und Harald Weydt; E: Deutsche Grammatik von Johannes Erben; W: Textgrammatik der deutschen Sprache von Harald Weinrich; SSt: Einführung in die Grammatik der deutschen Gegenwartssprache von Karl-Ernst Sommerfeldt und Günther Starke; ZD: Zweifelsfälle-Duden. Stand der Forschung zu endungslosen Genitiven 163 Art des Nomens mit Endung (-s) ohne Endung Variation möglich Eigennamen mit Artikel mask. Personennamen mit sekundärem Artikel (des kleinen Peter) in pränominaler Position: ZD (2007) in postnominaler Position: ZD (2007) i.d.R./ meist endungslos (D 1959- 2009); J (1990); (S 1978) fem. Personennamen mit sekundärem Artikel (der kleinen Anna) D (2009), ZD (2007) Personennamen als Gattungsbezeichnung (des Dobermanns) D (1959- 2009) J (1990) Personennamen als Produktbezeichnung (des Diesel(s)) D (1959- 2009) geografische Namen (des Neckar(s)) D (1959- 2009); J (1990); S (1978), SSt (1998); ZD (2007) nicht-native geografische Namen (des Mississippi(s)) Variation mit Tendenz zur Endungslosigkeit (D 2009) nicht-native geogr. Namen, mehrsilbig, s-Auslaut (des Amazonas) D (2009) Endungslose Genitive 164 Art des Nomens mit Endung (-s) ohne Endung Variation möglich transparente Komposita (des Feldberg(s)) ZD (2007) D (2006, 2009) geogr. Namen nach Adjektiv und sekundärem Artikel (des alten Europa(s)) D (2006, 2009); J (1990); ZD (2007) Artikellose Eigennamen (inkl. Feminina in attributiver Funktion; Marias/ Peters Auto) D (1959- 2009); J (1990); S (1978); G (1990); H (2003); W (2005); SSt (1998); ZD (2007) Personennamen auf s-Laut (Fritz’ Auto) nur in Schriftsprache: -ens S (1978) -ens, Apostroph oder Ersatzkonstruktion D (1959- 2009), J (1990); S (1978); G 1990); W (2005); ZD (2007) geografische Namen (Deutschlands, Berlins) D (1959- 2009); J (1990) nach Attributen (S 1978, G 1990, J 1990) Stand der Forschung zu endungslosen Genitiven 165 Art des Nomens mit Endung (-s) ohne Endung Variation möglich eigennamenähnliche Appellativa Monatsnamen wenn sie dem Wort Monat folgen (D 1959- 1998; J 1990; S 1978; G 1990; ZD 2007) D (1959- 2009); J (1990); S (1978), G (1990); endungslos insbes. bei pränominalem Substantiv (ZD 2007) Wochentage D (1959, 1973, 1984, 1995, 1998); J (1990) D (2006, 2009) Kunstepochen (des Barock(s)) D (1984- 2009); ZD (2007) Produktbezeichnungen (des Aspirin(s)) S (2006, 2009) Verwandtschaftsbeziehungen (des Vaters) D (1959- 2009); S (1978); G (1990); w (2005); ZD (2007) Appellativa D (1959- 2009) starke Maskulina auf -en (des Garten(s)) D (2009) endungslose Form nicht normgerecht (D 2009) Fremdwörter auf us (des Sozialismus, des Omnibus(ses)) selten (bei stärkerer Integration) D (2006, 2009) D (1959- 2009); J (1990) Endungslose Genitive 166 Art des Nomens mit Endung (-s) ohne Endung Variation möglich Fremdwörter auf s-Laut (des Index(es), Atlas(es)) D (2009) Zitate (z.B. aus Fremdsprachen: des Entrecote(s)) D (2009) deutschsprachige Buch-, Zeitungs- und Filmtitel (des Spiegels) D (1959- 1998); J (1990) Konversion (nicht flektierbare Quellwortart: des Gegenüber(s)) D (1959- 2009); ZD (2007) Paarformeln (des eigenen Grund und Boden(s)) Markierung am zweiten Nomen (D 1959- 2009); J (1990); ZD (2007) mehrteilige feste Verbindungen (des Vitamin(s) C) D (2009) Kurzwörter (des Ufos, des Profis) D (2009) Initialkurzwörter (des EKG(s)) meist ohne: D (1959- 2009) Schreibabkürzungen (des 15. Jh.) meist ohne: D (1959- 2009) Tab. 14: Empfehlungen einschlägiger Grammatiken zum Gebrauch des Genitiv-s Anmerkungen zur Datengrundlage und Methodik 167 Grundlage der Einschätzung, ob eine bestimmte Instanz des s-Schwunds der Sprachnorm entspricht, scheint - zumindest implizit - die Geläufigkeit der Form in der Schriftsprache zu sein. Auch hier fehlt es allerdings an eindeutigen quantitativen Kriterien. Im Zusammenhang mit der normativen Einordnung der endungslosen Realisierung des Genitivs lassen sich die folgenden Forschungsdesiderate formulieren, wobei wir uns im Rahmen der vorliegenden Teilstudie auf den ersten Problemkomplex konzentrieren: 1) Eine korpuslinguistisch fundierte Überprüfung und Systematisierung quantitativer Aussagen zum Ausfall des Genitiv-s: Eine wesentliche Aufgabe einer korpusbasierten Aufarbeitung des Phänomens besteht darin, Aussagen über die relative Häufigkeit endungsloser Formen zu präzisieren. 2) Evaluierung der Standardnähe - inwiefern kann ein korpuslinguistischer Ansatz zur Neubewertung gängiger (semi-präskriptiver) Aussagen zu Standardnähe/ Akzeptabilität endungsloser Varianten (insbesondere bei niederfrequenten Phänomenen) beitragen (vgl. auch Bubenhofer/ Konopka/ Schneider 2014)? 3) Sprachwandeltendenzen in der Gegenwartssprache: Lässt sich in den Daten eine zunehmende Tendenz zum Wegfall der Genitivmarkierung nachweisen (Entwicklungen bei Namen, Fremdwörtern, starken Maskulina auf -en etc.)? 3.2 Anmerkungen zur Datengrundlage und Methodik Im vorliegenden Kapitel stellen wir die Ergebnisse unserer korpuslinguistischen Studien zur Nullrealisierung der starken Genitivendung vor. Im Mittelpunkt steht dabei die Frage, wie sich im Rahmen eines korpusbasierten Ansatzes präzisere quantitative Aussagen zur endungslosen Realisierung des Genitivs formulieren lassen. Grundlage dieser Untersuchung sind 462.619 155 endungslose starke Genitive, die mithilfe eines Perl-Scripts aus dem Deutschen Referenzkorpus (DeReKo, 155 Um die Präzision unserer Rechercheergebnisse zu verbessern, haben wir für die Untersuchung endungsloser Genitive nur solche Belege berücksichtigt, bei denen die Form des Lemmas mit der tatsächlich im Korpus auftretenden Form (Token) identisch ist. Dies führt dazu, dass die angegebene Zahl deutlich niedriger liegt als die im Anhang zu Kapitel 2 genannte Gesamtzahl aller endungslosen Formen im Korpus (642.575). Endungslose Genitive 168 www.ids-mannheim.de/ kl/ projekte/ korpora/ ) extrahiert und in einer SQL -Datenbank (GenitivDB) abgelegt worden sind (vgl. Kap. 1.4). 156 Wie bereits eingangs erwähnt, erhebt die vorliegende Arbeit keinen Anspruch auf Exhaustivität; vielmehr soll es darum gehen, neue korpusbasierte empirische Methoden zur Untersuchung grammatischer Variation zu entwickeln, deren Leistungsfähigkeit exemplarisch anhand einiger ausgewählter Phänomene evaluiert werden soll. Wir haben daher im Rahmen der vorliegenden Pilotstudie nicht die ganze Bandbreite der festgestellten Forschungsdesiderata untersucht, sondern primär die folgenden Fragestellungen bearbeitet: (9) a. Wie lassen sich quantitative Aussagen zum Ausfall der Genitiv- endung im Rahmen einer Korpusstudie präzisieren? b. Welchen Beitrag kann eine korpuslinguistische Untersuchung bei der Identifizierung, Überprüfung und Gewichtung von Faktoren liefern, die eine endungslose Realisierung des Genitivs auslösen bzw. begünstigen? Unsere Datengrundlage war dabei in erster Linie die Datenbank GenitivDB. Für die Untersuchung phonologischer Faktoren haben wir dabei nicht auf die Informationen der CELEX -Datenbank zugegriffen, da diese u.a. nur sehr wenige Eigennamen enthält. Stattdessen haben wir mithilfe eines Perl-Scripts aus GenitivDB Lemmata extrahiert, die auf die Grapheme <s, x, z> enden. Für die quantitative Analyse der auf diese Weise gewonnenen Daten wurden sowohl deskriptive statistische Methoden wie die Berechnung relativer Häufigkeiten als auch inferenzstatistische Verfahren zur Prüfung der Signifikanz von unterschiedlichen Häufigkeiten (Chi-Quadrat Test, Berechnung von Pearson Residuen) bzw. zur Ermittlung von Effektstärken (Phi-Koeffizient/ Cramérs V) herangezogen. Es hat sich allerdings herausgestellt, dass die Erkennung endungsloser Formen spezifische Probleme aufwirft, die dazu führen, dass sowohl Ertrag als auch Präzision der automatischen Extraktion hinter die Ergebnisse bei overt markierten Formen zurückfällt. Aus diesem Grund 156 Aufgrund der Tatsache, dass in dieser Teilstudie nur Belege berücksichtigt wurden, bei denen Lemma und Token identisch sind, können sich die hier zugrunde gelegten Zahlen leicht vom aktuellen Stand der online zugänglichen (und in einigen Belangen korrigierten) Fassung der Genitivdatenbank unterscheiden (www.ids-mannheim. de/ genitivdb). Anmerkungen zur Datengrundlage und Methodik 169 möchten wir der inhaltlichen Diskussion unserer Korpusbefunde (vgl. Kap. 3.3 und 3.4) einige Bemerkungen zur kritischen Einschätzung unseres methodischen Ansatzes voranstellen. Gegenstand von Kapitel 3.2.1 sind generelle Schwierigkeiten, die bei der Extraktion/ Erkennung endungsloser Formen aufgetreten sind. Kapitel 3.2.2 diskutiert Aspekte der Modellierung endungsloser Genitive im Rahmen des automatisch erzeugten Entscheidungsbaums. 3.2.1 Die Erfassung endungsloser Formen: generelle Probleme Bei vorangegangenen (Probe-)Extraktionen starker Genitive aus dem Gesamtkorpus (DeReKo) hat sich gezeigt, dass das Auffinden endungsloser Formen besonders problembehaftet ist. Bei der Auswertung der Daten bereitete insbesondere die mangelnde Präzision der Ergebnisse Schwierigkeiten: Auf der Basis einer Datengrundlage mit Trefferquoten von z.T. unter 20% ließen sich zunächst keine gesicherten quantitativen Aussagen über Eigenschaften der Grundgesamtheit machen. Im Rahmen der aktuellen (sechsten) Extraktion ist es gelungen, durch Veränderung einiger Parameter (vgl. auch Kap. 1.4.1), die Präzision zu verbessern: Eine Stichprobe von 400 zufällig gewählten Fällen, die von unserer Suchroutine als endungslose Genitive eingestuft wurden, hat eine Genauigkeit von 94,25% (377 von 400) ergeben. Mit einer Irrtumswahrscheinlichkeit von 5% liegt der tatsächliche Anteil der endungslosen Genitive in der Grundgesamtheit (d.h. der Menge aller in GenitivDB als endungslos eingestuften Genitive) zwischen 91,4% und 96,2% (95-prozentiges Konfidenzniveau). Die nachfolgenden quantitativen Befunde müssen vor dem Hintergrund dieses Konfidenzintervalls betrachtet werden. Die Verbesserung der Präzision hat allerdings zu einigen Einbußen beim Recall geführt (vgl. insbes. Kap. 3.3.2 für Details). Überdies hat sich gezeigt, dass in bestimmten (niederfrequenten) Bereichen die Daten trotzdem noch sehr unzuverlässig sind. Stellvertretend sei hier nur eine Auswahl der Probleme genannt. - Falsch erkannte Flexionsendungen: Bei Abkürzungen wird eine recht große Zahl von Pluralformen fälschlich als Genitivformen erkannt (vgl. Kap. 3.3.1.2 für Details). Dies ist insbesondere dann der Fall, wenn Abkürzungen wie DJ, Kita, NGO etc. fälschlich als Eigennamen eingestuft werden, da in diesem Kontext das Vorliegen einer s-Endung stärker gewichtet wird (vgl. Kap. 1.4 für weitere Details zur Methodik der Datenextraktion). Endungslose Genitive 170 - Falsch eingeordnete nullmarkierte Formen: Insbesondere bei komplexen Eigennamen treten Probleme auf. Ein gängiger Fehler besteht darin, dass die rechte Grenze des Namens nicht korrekt erkannt wird, sodass nicht selten das Erstglied des Namens fälschlich als nullmarkierter Genitiv eingeordnet wird. So werden in GenitivDB die folgenden durch Fettdruck markierten Formen als endungslose Genitive geführt: des Bonner Stollfuss Verlages, des neuen Jaguar X-Type, des Pariser Tribunal de Grande Instance etc. Bei ersterem Beleg handelt es sich aber tatsächlich um einen es-Genitiv (Stollfuss Verlag-es), während die letzteren beiden (endungslosen) Einträge korrekterweise Jaguar X-Type bzw. Tribunal de Grande Instance lauten müssten. Dieses Problem führt mithin dazu, dass bei komplexen Eigennamen nicht zuverlässig zwischen endungslosen und overt markierten Formen unterschieden werden kann. - Ungenauigkeiten bei der Annotation: 157 • Inkonsistenzen bei der automatischen Einordung in Teilklassen von Nomina: - Die Zuweisung der Eigenschaft ‘Fremdwort’ ist unzuverlässig. Zum einen werden Fremdwörter wie Chaos oder Kosmos nicht als solche erkannt; zum anderen sind z.B. native Wörter auf -is wie Begräbnis, Bündnis etc. als nicht-natives Material gekennzeichnet. Zudem existieren 1043 Fälle, in denen die Einordnung als Fremdwort nicht konsistent ist. So wird die endungslose Variante einer genitivischen Wortform wie des Index als Fremdwort erkannt, während des Indexes als natives Wort behandelt wird (diesen Fehler haben wir nachträglich behoben, indem wir bei den relevanten Wörtern die Zuweisung der Eigenschaft ‘Fremdwort’ vereinheitlicht haben); - Ähnliche Probleme treten bei der Eigenschaft ‘Konversion’ auf (z.B. Nichts: 375x endungslos im Korpus, davon werden aber nur 118 Fälle als Konversion eingestuft). 157 Die folgenden Probleme sind vermutlich auf Schwächen der bei der automatischen Annotation verwendeten Tagger zurückzuführen. So haben wir festgestellt, dass Elemente wie Konversionen, Farbwörter oder Fremdwörter oft nicht korrekt erkannt werden (bzw. z.T. gar nicht als Nomen klassifiziert werden). Inkonsistente Zuordnungen können vor diesem Hintergrund dadurch entstehen, dass für bestimmte Formen die Ergebnisse der Tagger nicht übereinstimmen bzw. ein Konflikt mit den bei der Extraktion verwendeten (manuell) erstellten Listen vorliegt. Anmerkungen zur Datengrundlage und Methodik 171 • Fehlende Lemmata: Eine Stichprobe hat gezeigt, dass substantivierte Farbwörter wie Grün oder Schwarz in der Lemmaliste fehlen; sie sind zwar in GenitivDB enthalten, können aber nicht gesucht werden. (Eine mögliche Erklärung für diese Lücke könnte sein, dass substantivierte Adjektive dieser Art von den verwendeten Taggern nur unzulänglich als Nomina erkannt werden.) • Fehlerhafte Zuordnung von ‘Nomen’ zu ‘Lemma’: Mitunter wird eine im Korpus attestierte Form (Spalte ‘Nomen’ in der Genitivdatenbank) als nullmarkierter Genitiv eingestuft, obwohl sie nicht mit dem zugrundeliegenden (automatisch zugeordneten) Lemma identisch ist. Dieses Problem tritt vor allem im Zusammenhang mit Komposita auf und ist z.T. das Resultat einer fehlerhaften Lemmatisierung (so werden Pluralformen wie Olymipastadien als zugrundeliegende Lemmata für Singularformen wie Olympiastadions angesehen). Besonders häufig ist dabei ein Muster, bei dem die orthografische Form des konkreten Korpusbelegs von dem angesetzten Lemma abweicht, z.B. durch Schreibung mit Bindestrich (‘Nomen’ Castor-Einsatzes vs. ‘Lemma’ Castoreinsatz). In der überwiegenden Zahl aller relevanten Fälle handelt es sich bei der vermeintlich endungslosen Form um einen mit -s markierten Genitiv. Um diese Fehlerquelle auszuschließen, haben wir bei der Untersuchung endungsloser Genitive (vgl. Kap. 3) nur solche Belege berücksichtigt, bei denen ‘Lemma’ und ‘Nomen’ identisch sind. Aufgrund dieser Einschränkung wurden 184.121 Belege aus der Datenbasis entfernt, was zu Einbußen beim Recall geführt hat (z.B. wurden 632 endungslose Belege für Dalai Lama aufgrund einer vom zugrunde gelegten Lemma Dalai Lama abweichenden Schreibweise aus dem Korpus ausgeschlossen). Eine stichprobenartige Sichtung der entfernten Beispiele hat aber gezeigt, dass diese Verluste durch die insgesamt deutlich verbesserte Präzision der Ergebnisse mehr als aufgewogen werden. • Probleme bei der Erkennung von Eigennamen: Die Zuordnung der Eigenschaft ‘Eigenname’ ist im Rahmen der vorliegenden automatischen Annotation fehlerhaft. Partiell konnte das Extraktionsergebnis durch Berücksichtigung einer manuell erstellten Liste von Eigennamen verbessert werden; allerdings enthält die aktuelle Extraktion immer noch falsch (als Eigennamen) klassifi- Endungslose Genitive 172 zierte Lemmata wie Appartment oder Shopping-Mall. Darunter fallen wie bereits erwähnt auch viele Abkürzungen. • Kontraktionen wie obs (< Konjunktion ob + Pronomen es) und ers (er + es) werden als genitivmarkierte Abkürzungen bzw. substantivierte Pronomina behandelt. Neben diesen Einzelproblemen, die Schwächen der automatischen Annotation des Korpus reflektieren, hat die Untersuchung endungsloser Formen uns zudem auf ein grundsätzliches methodisches Problem aufmerksam gemacht, das die verwendeten skriptbasierten Verfahren zur Erkennung bzw. Extraktion relevanter Formen und Phänomene aus dem Korpus betrifft: Die Schwierigkeiten hinsichtlich Precision und Recall bei endungslosen Formen sind nicht zuletzt darauf zurückzuführen, dass die Kriterien zur Erkennung von Genitiven primär auf sichtbare morphologische Markierungen ausgelegt waren. Dieser Fokus führt auch zu Problemen bei der automatischen Analyse der Faktoren/ Daten im Rahmen von Entscheidungsbäumen (vgl. Bubenhofer/ Hansen-Morath/ Konopka 2014). 158 3.2.2 Befunde der Baummodellierung Die Sichtung des auf der Basis von Extraktion 6 automatisch erzeugten Entscheidungsbaums (http: / / hypermedia.ids-mannheim.de/ call/ public/ korpus.ansicht? v_id=5032; zu Entscheidungsbäumen im Allgemeinen vgl. Bubenhofer/ Hansen-Morath/ Konopka 2014), hat ergeben, dass - im Gegensatz zur Situation bei den segmentalen Genitivallomorphen - die Baummodellierung nur bedingt zur Exploration der Faktoren herangezogen werden kann, die einen Wegfall der Genitivmarkierung auslösen bzw. begünstigen. Dies mag zum einen an der Tatsache liegen, dass es sich bei der Nullrealisierung des Genitivs starker Nomina um ein vergleichsweise niederfrequentes Phänomen handelt; zum anderen liegen die Probleme darin begründet, dass die verwendeten (automatischen) Annotations- und Extraktionsverfahren vor allem im Zusammenhang mit endungslosen Formen fehlerhafte Resultate liefern (z.B. den Status von Fremdwörtern und Eigennamen betreffend). Die dabei auftretenden konkreten Schwierigkeiten wollen wir im An- 158 Generell gilt, dass Fehler, die auf das Extraktionsskript zurückgeführt werden können, von größerem Interesse sind als Fehler, die sich aus der Qualitität der automatischen Annotierung ergeben, da wir auf letztere keinen Einfluss haben. Anmerkungen zur Datengrundlage und Methodik 173 schluss anhand der Faktorenkombinationen diskutieren, die dem Entscheidungsbaum zufolge Endungslosigkeit bewirken. Die entsprechenden Pfade der Baumstruktur sind in (10) aufgelistet (geordnet nach Faktoren), jeweils gefolgt von Beispielen und (in Klammern) Anzahl der relevanten Beispiele (für eine Aufschlüsselung und Erläuterung der relevanten Faktoren bzw. Abkürzungen vgl. http: / / hypermedia.ids-mannheim.de/ db/ liesmich.txt sowie Kap. 1.4.2). (10) a. Häufigkeitsklasse (HK) (> 7) - Silbenanzahl (>1) - KonsArt (s) - Fremdwort (1): Nationalsozialismus (4094), Sozialismus (3149), Kapitalis- mus (2058), Kommunismus (1866), ..., Mythos (598), ..., Kosmos (497) etc. b. HK (> 7) - Silbenanzahl (>1) - KonsArt (s) - Fremdwort (0) - Suffix (los; s; s; n.a.): Abseits (12), Makellos (2) c. HK (> 7) - Silbenanzahl (>1) - KonsArt (s) - Fremdwort (0) - Suffix - (n.a.) - Komplexitaet (Mono): Chaos (664), Tennis (574), Taunus (139), Ethos (69) etc. d. HK (> 7) - Silbenanzahl (>1) - KonsArt (P) - Fremdwort (0) - HK (> 9) - Letztlaut (t) - Suffix (ett): Ballett (54) e. HK (> 7) - Silbenanzahl (>1) - KonsArt (L) - HKZG (> 5) - Eigenname (1) - Vokallaenge (kurz): Kein Beleg genannt f. HK (> 7) - Silbenanzahl (>1) - KonsArt (N) - Genus (Neut) - Fremd- wort (1) - Suffix (on; ern; n.a.): Bataillon (6), Modern (6), Symposion (6) g. HK (> 7) - Silbenanzahl (≤1) - Fremdwort (0) - KonsArt (n.a.) - Eigen- name (0) - HK (>12): Mai (962), A (427), C (104), U (76), B (71), a (66), E (63), Pro (43) etc. 159 h. HK (> 7) - Silbenanzahl (≤1) - Fremdwort (0) - KonsArt (P) - HK (>15) - Letztlaut (p; b): Hab (22) i. HK (> 7) - Silbenanzahl (≤1) - Fremdwort (1) - HK (>10) - KonsArt (s; sch/ st): Jazz (1816), Mars (383), Plus (17), Bus (15), Match (4), Lunch (4) Dem Entscheidungsbaum zufolge ist eine endungslose Realisierung des Genitivs ausschließlich bei weniger häufigen Wörtern zu finden (Häufigkeitsklasse > 7). Dies ist sicherlich eine zutreffende Einschätzung. Ebenfalls im Einklang mit der herrschenden Forschungsmeinung ist der Befund, dass die Eigenschaft ‘Fremdwort’ in Kombination mit s-Auslaut eine endungslose Realisierung des Genitivs auslöst, vgl. 159 In diesem Zusammenhang werden eine ganze Reihe von Ausnahmen aufgeführt (Viehs (150), des (129), Hais (75), Wehs (54), Gaues (54), Rehs (50), Zehs (47), Heus (42), Schreis (39), Strohs (29) etc.). Endungslose Genitive 174 (10a) für Mehrsilber (auf (-ism)us und -os) und (10i) für Einsilber (s. aber unten für einige kritische Bemerkungen). In diesen Bereichen sind auch die Belegzahlen am größten, was als Hinweis darauf verstanden werden kann, dass das verwendete Verfahren eine gewisse Häufigkeit des Phänomens voraussetzt. Eine nähere Betrachtung der Faktorenkombinationen in (10b-h) offenbart jedoch eine Reihe von Problemen. Hier fallen zunächst oberflächliche Fehler auf, wobei abhängig von der Fehlerursache drei Typen unterschieden werden können: 1) Mängel bei der automatischen Annotation (parts-of-speech); 2) Fehler bei der Erkennung von Genitiven bei der Extraktion aus dem Gesamtkorpus; 3) Probleme, die auf den Algorithmus zurückgehen, der dem Entscheidungsbaum zugrunde liegt. Ungenauigkeiten, die auf Schwächen bei der automatischen Annotation zurückzuführen sind, betreffen vor allem die Erkennung von Fremdwörtern und Eigennamen. So werden in (10a) zwar Kosmos und Mythos korrekt als Fremdwörter eingestuft, nicht aber Chaos und Ethos in (10c) (gleiches gilt für Tennis und Ballett). Ähnliches gilt für die (generell problembehaftete) kategoriale Zuordnung von Eigennamen (so handelt es sich bei Makellos in (10b) nicht um ein Appellativum, sondern um den Namen des schwedischen Admiralsschiffes in Theodor Fontantes Unwiederbringlich). Fehler dieser Art führen mitunter dazu, dass Wörter unter einen Erklärungsansatz subsumiert werden, obwohl sie keine homogene bzw. natürliche Klasse bilden, wie in (10c), wo native und nicht-native Wörter zusammengefasst werden. Dadurch wird verschleiert, dass die Tendenz zum Ausfall der Genitivendung bei Chaos und Taunus vermutlich unterschiedliche Ursachen hat: Während bei Chaos die Kombination von Fremdwortcharakter und s- Auslaut relevant zu sein scheint, ist das Auftreten endungsloser Formen von Taunus wohl eher auf die Tatsache zurückzuführen, dass es sich hierbei um einen Eigennamen handelt, der auf -s endet. Der zweite Fehlertyp reflektiert Schwierigkeiten bei der automatischen Erkennung von endungslosen Genitiven durch das verwendete Perl- Skript. Exemplarisch zu nennen sind hier (10d) und (10h). Für beide Faktorenkombinationen zeigt eine Überprüfung der aufgeführten Belege, dass praktisch ausschließlich Fälle vorliegen, die entweder nicht einschlägig sind oder in denen die Endungslosigkeit das Resultat unabhängiger Faktoren ist: In 51 von 54 Fällen, die in (10d) genannt werden, ist Ballett Bestandteil eines komplexen Eigennamens wie Ballett Anmerkungen zur Datengrundlage und Methodik 175 Frankfurt oder Hamburg Ballett. Zumindest für letzteres Muster ist es charakteristisch, dass der Genitiv (wenn überhaupt) nur am Zweitglied markiert werden kann (*des Hamburgs Ballett). 160 Darüber hinaus erscheint es hier naheliegend, die Endungslosigkeit mit dem Eigennamencharakter in Verbindung zu bringen (und nicht mit lautlichen oder morphologischen Eigenschnaften, s.u.). In (10h) involvieren alle 22 Belege von Hab die Paarformel (des) Hab und Gut(e)s). Die Faktoren(kombinationen), die in (10d) und (10h) für die Endungslosigkeit der Formen verantwortlich gemacht werden ((10d): KonsArt (P) + Suffix (ett); (10h): KonstArt (P) + Letztlaut (p; b)), sind daher vermutlich nicht zutreffend. Ähnliche Probleme treten bei (10f) auf: Eine Überprüfung der Beispiele ergibt, dass von sechs Belegen für Bataillon nur ein einziger einschlägig ist. Bei drei von sechs handelt es sich um einen komplexen Eigennamen (wie des Bataillon Ponce); ein Beispiel (das zweimal auftritt) involviert einen Nominativ, der irrtümlich als endungsloser Genitiv gewertet wurde. 161 Ebenso sind alle Instanzen von Modern Bestandteile komplexer (nicht-nativer) Stilbezeichnungen wie Modern Jazz, Modern Dance oder Modern Swing. Für vier von sechs Belegen für Symposion gilt, dass sie sich auf das entsprechende Werk von Platon beziehen und es daher nahe liegt, die Endungslosigkeit auf den Eigennamencharakter zurückzuführen. Wir können also festhalten, dass ein Drittel der Faktorenkombinationen in (10) aufgrund von Problemen bei der korrekten Erkennung endungsloser Genitive als nicht relevant ausgeschlossen werden muss. 160 In DeReKo (Release 2014-II, Archiv W-gesamt) finden sich 98 Belege für des Balletts Frankfurt vs. 42 für des Ballett Frankfurt. Interessanterweise ergibt eine Google-Recherche (3.6.2015) ein völlig anderes Zahlenverhältnis (649x des Balletts Frankfurt vs. 2.510x des Ballett Frankfurt). 161 Der Beleg, der einen fälschlich als Genitiv eingestuften Nominativ enthält, stammt aus Fontanes Wanderungen durch die Mark Brandenburg und ist aus zwei (voneinander unabhängigen) Gründen interessant. Für die Belange der automatischen Erkennung endungsloser Genitive ergibt sich, dass nicht alle Nomina, denen die Form eines vorangeht, tatsächlich Genitive sind. Darüber hinaus haben wir es mit einem an sich interessanten Konstruktionstyp zu tun, in dem ein Element, das entweder als Zahlwort oder aber auch als indefiniter Artikel (vgl. die mögliche Weiterführung dessen anderes Bataillon) interpretiert werden kann, adjektivisch (stark) flektiert: (a) Während der zwanziger Jahre wurde von Arnstedt, der Vater als Hauptmann in das 12. Infanterieregiment, dessen eines Bataillon damals in Sorau stand, versetzt [...] Endungslose Genitive 176 Der letzte Problemkomplex betrifft Aspekte, die sich mit Eigenschaften des Algorithmus in Zusammenhang bringen lassen, mit dessen Hilfe der Entscheidungsbaum erzeugt wurde. Dabei treten zum einen oberflächlich-technische Mängel auf, wie das Fehlen einschlägiger Beispiele für den Pfad in (10e). Zum anderen scheint ein grundlegenderes Problem darin zu bestehen, dass für die Belange der Baummodellierung (hochfrequente) overt markierte und (niederfrequente) endungslose Varianten gemeinsam behandelt wurden. Die Anwendung eines einzigen Algorithmus auf diese qualitativ und quantitativ heterogene Menge von Markierungsvarianten führt zum einen dazu, dass bestimmte linguistische Faktoren, die für die Nullrealisierung des Genitivs von Bedeutung sind, nicht korrekt erkannt bzw. zugeordnet werden. Zum anderen werden Faktoren wie Häufigkeitsklasse und morpho-phonologische Eigenschaften, die für die Wahl zwischen langer und kurzer Genitivendung (und somit für die überwiegende Zahl aller Elemente) von Bedeutung sind, (fälschlich) zur Erklärung der Distribution der Nullendung herangezogen. So wird die Nullrealisierung des Genitivs bei Wörtern wie Abseits (Suffix (los; s; s; n.a.)), Chaos (Suffix (n.a.), Komplexitaet (Mono)) oder Ballett (Letztlaut (t), Suffix (ett)) auf arbiträre lautliche und morphologische Eigenschaften zurückgeführt, während Faktoren wie Eigennamennähe (z.B. des Hamburg Ballett), Konversion (des Abseits) oder Fremdwortcharakter (Chaos), die speziell für Endungslosigkeit (nicht aber für die Wahl overter Endungen) hochrelevant sind, kaum ins Gewicht fallen. In Kombination mit Unschärfen bei der Annotation kann dies dazu führen, dass Wörter unter ein (linguistisch wenig plausibles) Erklärungsmuster gefasst werden, obwohl sie keine natürliche Klasse bilden (vgl. auch die Bemerkungen zu (10c) oben). So umfasst die Liste der Beispiele unter (10g) zitierte Buchstaben, aber auch Abkürzungen und den Monatsnamen Mai, deren wesentliche Gemeinsamkeit darin besteht, dass sie Bestandteil der gleichen Häufigkeitsklasse(n) (>12) sind. Auf ähnliche Weise werden unter (10i) unterschiedliche Arten von nicht-nativen Nomina wie Stilbezeichnungen (Jazz), eigennamenähnliche Begriffe (Mars) und appellativische Entlehnungen (Plus, Match, Lunch) zusammengeworfen. Zwar ist hier der Ansatz, Endungslosigkeit auf die Kombination der Faktoren Fremdwort und Auslauttyp zurückzuführen, aus linguistischer Sicht sinnvoll; die Tatsache, dass sich die hier aufgeführten Nomina nicht einheitlich verhalten - Jazz und Mars treten im Gegensatz zu Match, Bus oder Lunch ausschließlich endungslos Normgerechte Formen der Endungslosigkeit 177 auf - deutet aber an, dass hier eine weitere Fallunterscheidung notwendig ist. Weiterhin ist auffällig, dass bestimmte Faktoren wie Konversions- oder Abkürzungscharakter, die nachweislich einen starken Einfluss auf eine endungslose Realisierung des Genitivs haben (vgl. Kap. 3.3.1.2), in der Baummodellierung keinen Niederschlag gefunden haben. Abschließend können wir festhalten, dass die automatische Modellierung im Rahmen eines Entscheidungsbaums, der sowohl overt markierte als auch endungslose Genitive abdeckt, zu keinen befriedigenden Ergebnissen geführt hat. Ein Erklärungsansatz für die beobachteten Schwächen ist möglicherweise, dass der Algorithmus primär Faktoren berücksichtigt, die ausschließlich für die Wahl overter Markierungsvarianten relevant sind. Eine Anwendung dieser Faktoren auf endungslose Genitive führt zu unplausiblen Analysen. Ein methodologischer Schluss, den man aus dieser Beobachtung ziehen kann, ist, dass man für entsprechend qualitativ und quantitativ heterogene Phänomene nicht nur separate Extraktionsskripte, sondern auch separate Algorithmen zur Modellierung mittels Entscheidungsbäumen entwickeln sollte. Letzteren Weg haben wir aufgrund des zusätzlichen Aufwands (und auch vor dem Hintergrund der größeren Fehleranfälligkeit der Datengrundlage bei endungslosen Formen) nicht eingeschlagen. Stattdessen haben wir ergänzend traditionelle korpuslinguistische Methoden herangezogen, die auf einer Untersuchung der bereits erwähnten Variationsliste bzw. SQL -Datenbank (GenitivDB) basieren, welche bei Bedarf durch manuell durchgeführte Suchanfragen via COSMAS bzw. KoGra ergänzt werden. 3.3 Normgerechte Formen der Endungslosigkeit In der Folge wollen wir die Distribution und relative Häufigkeit endungsloser Genitive in verschiedenen Klassen von Nomina näher betrachten. Im Mittelpunkt stehen dabei Bereiche des Sonderwortschatzes. Dabei geht es vor allem darum, die eher impressionistischen Einschätzungen der bisherigen Forschungsliteratur wie „häufig endungslos“ durch korpuslinguistisch fundierte Angaben zu ersetzen. Wir konzentrieren uns in diesem Zusammenhang auf die folgenden Problembereiche: 1) Invariante Fälle: Welche Nomina bzw. Klassen von Nomina erscheinen obligatorisch endungslos (d.h., es liegt keine Variation vor)? Endungslose Genitive 178 2) Variante Fälle: Welche Nomina bzw. Klassen von Nomina erscheinen potenziell endungslos? Mit welcher Häufigkeit treten endungslose Formen in verschiedenen Substantivklassen auf? Invariante Nomina, die obligatorisch endungslos auftreten, werden in Kapitel 3.3.1 behandelt. Anschließend befassen wir uns in Kapitel 3.3.2 mit Nomina, bei denen die Nullmarkierung des Genitivs mit einer overten Markierung (in der Regel -s) alterniert. Darüber hinaus wollen wir uns mit der Frage befassen, ob sich bestimmte Fälle von nicht-standardsprachlich anerkannter Endungslosigkeit, die in der einschlägigen Forschungsliteratur Erwähnung finden, im Korpus nachweisen lassen bzw. ob endungslose Genitive in diesen Kontexten signifikant häufiger auftreten als bei anderen Nomina. Dabei konzentrieren wir uns auf Nomina, die auf -en auslauten, Diminutive und Verwandtschaftsbezeichnungen (vgl. Kap. 3.4). Betrachten wir zunächst, wie sich die im Korpus enthaltenen endungslosen Genitive auf Teilklassen von Nomina verteilen. Abbildung 46 zeigt, dass sich die Gesamtzahl aller endungslosen Genitive im Korpus im Wesentlichen aus nur fünf Teilklassen des Sonderwortschatzes zusammensetzt. Relevant sind vor allem Eigennamen, Fremdwörter, Abkürzungen, Zeitausdrücke sowie Stil- und Epochen-bezeichnungen. 162 Im Anschluss möchten wir uns mit der Frage befassen, mit welcher (absoluten) Häufigkeit einzelne Lemmata als endungslose Genitive im Korpus auftreten. Eine relevante Anfrage in der Genitivdatenbank ergab das in Tabelle 15 dargestellte Resultat. 162 Nicht genannt sind hier andere Teilklassen, die ebenfalls zu einer Nullmarkierung neigen, aber wesentlich seltener im Korpus auftreten (z.B. Konversionen). Keine Berücksichtigung findet hier außerdem die Zahl (52.938) endungsloser Formen bei Nomina, die obligatorisch eine Flexionsendung verlangen (im weiteren Verlauf „reguläre Appellativa“ genannt, s.u. für Diskussion). Man beachte, dass die Summe der Zahlen in Abbildung 46 das zu Beginn von Kapitel 3.2 angegebene Extraktionsergebnis (462.619) übersteigt. Dies ist darauf zurückzuführen, dass die Zahlen in Abbildung 46 mehrfache Kategorienzuordnungen enthalten (Eigennamen, die gleichzeitig Fremdwörter sind, Abkürzungen, die Eigennamen darstellen, etc.). Normgerechte Formen der Endungslosigkeit 179 Abb. 46: Verteilung der Gesamtzahl endungsloser Genitive auf Teilklassen von Nomina Nomen Belegzahl 1. FC 13.951 2. VfL 8.941 3. SV 8.661 4. MTV 7.570 5. TSV 7.381 6. Euro 6.240 7. SC 4.996 8. Wolfsburg 4.654 9. Nationalsozialismus 4.094 10. HSV 3.441 11. Sozialismus 3.149 12. Terrorismus 2.920 13. Fonds 2.794 14. VfB 2.785 15. Irak 2.706 16. Islam 2.382 Endungslose Genitive 180 Nomen Belegzahl 17. Juni 2.283 18. Währungsfonds 2.202 19. TC 2.155 20. Holocaust 2.088 Tab. 15: 20 häufigste Fälle von Nullendungen, nicht bereinigt Unter den ersten 10 am häufigsten endungslos auftretenden Formen finden sich sieben Abkürzungen wie FC, VFL oder SV, die in der Regel Sportbzw. Fußballvereine bezeichnen. Eine Überprüfung der relevanten Belege zeigt jedoch, dass hier überwiegend Fälle vorliegen, in denen die erwähnten Abkürzungen Bestandteil komplexer Eigennamen wie 1. FC Köln oder Vfl Wolfsburg sind. Da in diesem Fall der Genitiv (wenn überhaupt) i.d.R. nur am Zweitglied des Namens markiert werden kann, sind die erwähnten Abkürzungen für unsere Studie nicht einschlägig. 163 Wir haben uns daher entschlossen, diese Fälle an dieser Stelle nicht weiter zu berücksichtigen. 164 Die resultierende bereinigte Liste der 20 häufigsten endungslos auftretenden Lemmata (in GenitivDB) sieht dann wie folgt aus: Nomen Belegzahl 1. Euro 6.240 2. Wolfsburg 4.654 3. Nationalsozialismus 4.094 4. HSV 3.441 163 In DeReKo (Release 2014-II, Archiv W-gesamt) findet sich nur ein einziger Beleg für des FCs Bayern gegenüber 32.669 Belegen für des FC Bayern. Eine Überprüfung der endungslosen Belege von FC hat zudem gezeigt, dass nach Abzug der Fälle, die von einem weiteren Nomen/ Eigennamen gefolgt werden, von 13.591 Belegen weniger als 500 relevante Fälle übrig bleiben. 164 Ebenfalls unberücksichtigt bleiben hier Lemmata, die ausschließlich als Erstglieder komplexer Eigennamen (bzw. eigennamenähnlicher Ausdrücke) auftreten und daher keine Genitivendung tragen können. Dazu gehören die Abkürzungen St. und Dr. sowie die Lemmata New (meist in Zusammenhang mit Ausdrücken wie New Yorks) und World (überwiegend in Ausdrücken wie des World Wide Web oder des World Trade Center). Normgerechte Formen der Endungslosigkeit 181 Nomen Belegzahl 5. Sozialismus 3.149 6. Terrorismus 2.920 7. Fonds 2.794 8. Irak 2.706 9. Islam 2.382 10. Juni 2.283 11. Währungsfonds 2.202 12. Holocaust 2.088 13. Kapitalismus 2.058 14. Kosovo 1.986 15. DFB 1.879 16. Kommunismus 1.866 17. Jazz 1.816 18. Tourismus 1.767 19. ZDF 1.714 20. Dollar 1.701 Tab. 16: 20 häufigste Fälle von Nullendungen, bereinigt Die bereinigte Liste scheint zunächst die Befunde der einschlägigen Grammatiken zu bestätigen. Unter den im Korpus am häufigsten endungslos auftretenden Substantiven befinden sich - Eigennamen (Wolfsburg, 165 Irak, Kosovo); - eigennamenähnliche Appellativa (oft fremdsprachlichen Ursprungs): Monatsnamen (Juni), Musikstile (Jazz), Währungen (Euro, Dollar), Religionen (Islam), (singuläre) historische Ereignisse (Holocaust); - Fremdwörter auf -(ismu)s (Nationalsozialismus, Sozialismus, Terrorismus, Kapitalismus, Kommunismus, Tourismus, Fonds, Währungsfonds); - Abkürzungen ( HSV , DFB , ZDF ). 165 Die absolut überwiegende Zahl aller Belege bezieht sich auf den Fußballverein Vfl Wolfsburg. Endungslose Genitive 182 Für viele der genannten Wörter gilt, dass gleich mehrere der Faktoren zutreffen, die in der Literatur für Endungslosigkeit verantwortlich gemacht werden: Irak und Kosovo sind nicht-native Eigennamen, HSV , DFB und ZDF sind Eigennamen und Abkürzungen, die eigennamenähnlichen Wörter sind gleichzeitig überwiegend nicht-nativ, Jazz ist zugleich nicht-nativ, eigennamenähnlich und endet auf Sibilant etc. Dies weist darauf hin, dass die Kombination mehrerer Faktoren, die die Wahl der Nullendung günstig beeinflussen, die Tendenz zu einer Auslassung der Genitivmarkierung verstärkt. Abb. 47: 20 häufigste Fälle von Nullendungen: Verhältnis von endungslosen und nicht-endungslosen Formen Im Zusammenhang mit der Liste in Tabelle 16 muss allerdings darauf hingewiesen werden, dass absolute Häufigkeit nicht mit Systematizität bzw. Konsistenz der Nullvariante gleichzusetzen ist. So enthält Tabelle 16 sowohl Wörter, die ohne Ausnahme endungslos auftreten (z.B. nicht-native Appellativa auf -ismus), als auch Beispiele für grammatische Variation. Dabei kann die endungslose Variante überwiegen (so treten im Korpus neben 6.240 Belegen für Euro lediglich 317 Beispiele Normgerechte Formen der Endungslosigkeit 183 für Euros auf); es tritt jedoch auch der umgekehrte Fall auf (2.706 Beispielen für Irak stehen 4.925 Fälle von Iraks gegenüber). Abbildung 47 gibt die Verhältnisse für die Substantive in Tabelle 16 wieder. Das quantitative Verhältnis von endungslosen und overt markierten Genitivformen soll in der Folge näher beleuchtet werden. Beginnen möchten wir mit Fällen, in denen (praktisch) keine Variation zu beobachten ist und ausschließlich endungslose Formen möglich sind. Im Mittelpunkt soll dabei die Frage stehen, welche Faktoren bzw. Kombinationen von Faktoren eine ausnahmslos endungslose Realisierung des Genitivs auslösen. 3.3.1 Invariante Fälle: obligatorische Endungslosigkeit In Kapitel 3.1.3 haben wir bereits die Hypothese erwähnt, dass obligatorische Endungslosigkeit typischerweise mit bestimmten lautlichen Eigenschaften korreliert (Endung auf Sibilant), wobei allerdings noch weitere Gegebenheiten vorliegen müssen; genauer gesagt, muss das Wort zu einer bestimmten Klasse von Nomina gehören, die ohnehin zu einer Nullrealisierung des Genitivs tendieren: (11) Konsistente Endungslosigkeit Konsistente Endungslosigkeit tritt ausschließlich bei Personennamen 166 und (nicht-integrierten) Fremdwörtern auf, deren (unbetonte) finale Sil- be auf einen s-Laut (Sibilant) endet. Tatsächlich erfüllt die überwiegende Zahl aller ausnahmslos endungslosen Genitive in Abbildung 47 dieses Kriterium (Nationalsozialismus, Sozialismus, Terrorismus, Kapitalismus, Kommunismus, Tourismus, Fonds, Währungsfonds sowie Jazz). Allerdings scheint auch bei den hier vertretenen Abkürzungen ( HSV , DFB , ZDF ) die Nullmarkierung des Genitivs 166 (11) abstrahiert von einigen (oberflächlichen) Unterschieden zwischen Personennamen und Fremdwörtern auf s-Laut. So kann der Genitiv bei Personennamen wie Fritz oder Hans in der Schriftsprache durch Hinzufügung eines Apostrophs angezeigt werden, während diese Option bei nicht-nativen Appellativa nicht zur Verfügung steht. Der Hypothese in (11) liegt die Annahme zugrunde, dass eine Nullmarkierung und eine Markierung per Apostroph linguistisch äquivalent sind. Bei Letzterer handelt es sich u.E. lediglich um eine auf die Schriftsprache beschränkte Option, die Auslassung der Genitivendung zu signalisieren (vgl. Kap. 1.5). Mehr Probleme bereitet in diesem Zusammenhang die Tatsache, dass bei Eigennamen auf s-Laut der Genitiv auch durch die lange Endung -ens markiert sein kann (vgl. z.B. Fritzens Auto). Vgl. Kapitel 3.3.1.3 für eine weitergehende Diskussion. Endungslose Genitive 184 ohne Alternative zu sein (der Monatsname Juni tritt 26x mit Endung auf - dies lässt sich allerdings nicht unmittelbar aus der Grafik ablesen). Diese Beobachtungen werfen zwei weiterführende Fragestellungen auf: 1) Lässt sich Hypothese (11) im Rahmen unserer Korpusstudie bestätigen? 2) Gibt es andere Nomina/ Nomenklassen, die im Korpus ausschließlich endungslos auftreten? 3.3.1.1 Obligatorische Endungslosigkeit bei Personennamen und Fremdwörtern Zur Beantwortung der ersten Frage haben wir die folgenden Merkmalskombinationen abgefragt: 1) Fremdwort auf -us; 2) Fremdwort auf s-Laut (<s, x, z>); 3) Eigenname auf s-Laut (<s, x, z>); 4) fremdsprachlicher Eigenname auf s-Laut (<s, x, z>). Die Ergebnisse sind in der folgenden Tabelle 17 wiedergegeben. Um die Signifikanz der Befunde besser einschätzen zu können, haben wir in der untersten Zeile die Verteilung der Endungsvarianten bei Nomina angegeben, die keine der Eigenschaften aufweisen, die das Auftreten einer Nullendung begünstigen und daher eigentlich obligatorisch eine overte Genitivmarkierung verlangen (vgl. Kap. 2). 167 Diese Vergleichsgruppe von Nomina, die nicht dem Sonderwortschatz zugehörig sind, wird im Folgenden als „reguläre Appellativa“ bezeichnet. Sie kann in unserer Genitivdatenbank durch die folgenden Eigenschaften identifiziert werden: ‘PropN = 0’, ‘PropNManuell = 0’, ‘Titel = 0’, ‘Zeitausdruck = 0’, ‘Abk = 0’, ‘Neo = 0’, ‘Fremdwort = 0’, ‘Konversion = 0’, ‘Kompositum = 0’. 168 Bei den dabei auftretenden 1,7% Nullendungen handelt es sich daher i.d.R. um nicht normgerechte Schreibungen oder Fehler bei der 167 Wie aus Tabelle 17 hervorgeht, finden sich in GenitivDB aber immerhin über 50.000 Belege für endungslos auftretende „reguläre Appellativa“. Der Status dieser Fälle (Performanzfehler oder Reflex eines systematischen (Sprachwandel-)Phänomens) ist auch mittels statistischer Methoden nicht eindeutig zu klären. 168 Die Klasse der „regulären Appellativa“ entspricht nicht der in Kapitel 2 definierten Klasse der „Nomina ohne Sondergruppen“. Um die Präzision unserer Recherchen zu verbessern, haben wir zusätzlich die Bereiche ‘PropNManuell’, ‘Zeitausdruck’, ‘Titel’ und ‘Kompositum’ ausgeschlossen. Diese Entscheidung hat zu Einbußen beim Recall geführt (vgl. die im Vergleich zu den „Nomina ohne Son- Normgerechte Formen der Endungslosigkeit 185 Annotation/ Extraktion. Diesen Vergleichswert werden wir auch in der Folge verwenden, um zu überprüfen, ob ein bestimmter Faktor die Wahl der Nullendung günstig beeinflusst. Nullendung Apostroph overte Markierung Token insgesamt Fremdwort auf -us 48.412 (98,8%) 0 570 (1,2%) 48.982 Fremdwort auf s-Laut (<s, x, z> exkl. -us) 15.319 (97,3%) 10 (<0,1%) 415 (2,6%) 15.744 Eigenname auf s-Laut 62.241 (73,4%) 9.361 (11%) 13.197 (15,6%) 84.799 Eigenname+Fremdw. auf s-Laut (<s, x, z>) 314 (80,5%) 10 (2,6%) 66 (16,9%) 390 reg. Appellativa 52.938 (1,7%) 34 (0,001%) 3.031.047 (98,3%) 3.084.018 Tab. 17: Konsistenter Wegfall der Genitivendung bei EN und Fremdwörtern auf s Insgesamt sind die in Tabelle 17 gezeigten Unterschiede zwischen Fremdwörtern und Eigennamen auf der einen Seite und regulären Appellativa auf der anderen Seite sehr eindeutig. Dieser Eindruck lässt sich auch durch inferenzstatistische Analysen bestätigen. Dem Chi- Quadrat-Test zufolge weicht die beobachtete Verteilung höchst signifikant (p = 0,0004998) von einer Gleichverteilung ab. Allerdings ist dieser Befund bei der hohen Zahl an Belegen nicht sehr überraschend. 169 Etwas aussagekräftiger ist die Berechnung der standardisierten Pearson-Residuen. Mit diesem Test wird geschätzt, inwieweit die beobachteten Häufigkeiten von den erwarteten Häufigkeiten in einzelnen Zellen abweichen. Ist der Betrag des entsprechenden Residuums größer als 1,96, ist von einer signifikanten Abweichung von der erwarteten Häufigkeit auszugehen. Die folgende Tabelle 18 zeigt, dass dies durchgängig für die Faktoren in Tabelle 17 zutrifft. Eine Visualisierung der dergruppen“ niedrigere Tokenzahl), die aber durch die erreichte Verbesserung der Präzision beim Ausschluss potenzieller Eigennamen gerechtfertigt erscheinen. 169 Tatsächlich liefert der Chi-Quadrat Test für alle hier diskutierten empirischen Ergebnisse einen p-Wert, der kleiner ist als 0,0005. Der Chi-Quadrat Test wird daher in der Folge nur noch sporadisch erwähnt. Endungslose Genitive 186 Ergebnisse über einen Assoziationsplot findet sich in Abbildung 48. Das Vorzeichen des jeweiligen Residuums zeigt eine Abweichung von der Erwartung nach oben bzw. unten an. Nullendung Apostroph overte Markierung Fremdwort auf -us 877,08 −11,94 −212,11 Fremdwort auf s-Laut (<s, x, z> exkl. -us) 489,07 −5,29 −118,35 Eigenname auf s-Laut 839,37 580,06 −235,88 Eigenname+Fremdw. auf s-Laut (<s, x, z>) 62,89 8,32 −15,72 reg. Appellativa −285,37 −94,4 74,48 Tab. 18: Konsistenter Wegfall der Genitivendung bei EN und Fremdwörtern auf s (Pearson-Residuen) Abb. 48: Assoziationsplot: Konsistenter Wegfall der Genitivendung bei EN und Fremdwörtern auf s Normgerechte Formen der Endungslosigkeit 187 Die Grafik visualisiert die Befunde in Tabelle 18, d.h. die standardisierten Abweichungen der beobachteten Häufigkeiten von den unter einer bestimmten Unabhängigkeitshypothese erwarteten Häufigkeiten. Jede Zelle wird durch ein Rechteck repräsentiert, dessen Höhe proportional zum Residuum der Zelle und dessen Breite proportional zur Wurzel der erwarteten Häufigkeit ist. Die Fläche des Rechtecks ist daher proportional zur Differenz von beobachteten und erwarteten Häufigkeiten. Generell gilt, dass dunkelgraue Flächen eine hochsignifikante Abweichung signalisieren, während (schwach) signifikante Abweichungen durch Mittelgrau markiert werden; nicht-signifikante Abweichungen entsprechen hellgrau eingefärbten Flächen (in Abb. 48 sind alle Abweichungen hochsignifikant). Abbildung 48 veranschaulicht die Tatsache, dass bei den untersuchten Fremdwörtern und Eigennamen eine starke Präferenz für die Nullendung (signalisiert durch Flächen oberhalb der gepunkteten Grundlinie) mit einer Abweichung zu Ungunsten der overten Markierung des Genitivs einhergeht (Flächen unterhalb der Grundlinie). Bei den regulären Appellativa verhält es sich (wie erwartet) genau umgekehrt. Zu den in Tabelle 17 zusammengefassten Ergebnissen im Einzelnen: Die Zahlenverhältnisse für Fremdwörter auf s-Laut sind besonders klar: Rund 98% aller Belege weisen eine Nullrealisierung des Genitivs auf. Bei den wenigen Ausnahmen handelt es sich primär um stark integrierte Fremdwörter wie Omnibus, Bonus, Zirkus oder Index (die den Plural z.T. auf -e bilden), von denen in der Literatur oft angenommen wird, dass sie sich z.T. eher wie native Wörter verhalten. Allerdings zeigen unsere Korpusbefunde, dass hier offenbar ein großes Maß an Variation vorliegt (vgl. Omnibus: 35x -es vs. 9x Null; Bonus: 103x Null; 170 Index: 85x -es vs. 319x Null, Rhinozeros: ausschließlich Nullendungen (13x)). Sehr selten tritt die lange Endung -es auch bei Lexemen auf -ismus auf (lediglich 5 Belege in GenitivDB: Alkoholismusses, Schließmechanismusses, Realismusses, Protestantismusses, Rassismusses). Eine Sonderrolle nehmen integrierte Fremdwörter mit s-Auslaut und betonter Ultima wie Koloss, Prozess oder Kongress ein, da sie fast ausschließlich die lange Endung -es zu sich nehmen (Prozess: 6.286x -es, 12x Null; Kongress: 3.753x -es, 14x Null; Koloss: 81x -es, 1x Null; Exzess: 30x -es, 1x Null (sowie zwei Belege, in denen sich die endungslose Form auf eine Zeit- 170 In unserer Genitivdatenbank treten ausschließlich endungslose Formen für Bonus auf. Eine COSMAS -Recherche (W-gesamt, DeR eK o-2013-I) bringt es aber auf immerhin 25 Belege für Bonusses. Endungslose Genitive 188 schrift bezieht, also Eigennamencharakter besitzt)). 171 Wir können aber dennoch feststellen, dass - mit einigen kleineren Einschränkungen - Hypothese (11) für (nicht integrierte) Fremdwörter auf -us bzw. Sibilant durch die Ergebnisse unserer Korpusrecherche bestätigt wird. Weniger eindeutig ist der Befund für Eigennamen auf -s. Ein wesentliches Problem besteht hier darin, dass wir auf der Basis der vorliegenden Annotation nicht zwischen Personennamen und anderen (geografischen) Namen unterscheiden können; 172 obligatorische Endungslosigkeit erwarten wir aber nur bei Personennamen auf -s (bei geografischen Namen wie des Nördlinger Rieses ist eine Verwendung der langen Genitivendung -es durchaus möglich). Ein etwas klareres Bild ergibt sich, wenn wir Eigennamen auf -s betrachten, denen ein Nomen nachfolgt, da auf diese Weise zumindest geografische Namen mit festem Artikel weitgehend ausgeschlossen werden können, die in pränominaler Position kaum akzeptabel sind (? ? des Rieses Fauna). In der überwiegenden Zahl der Fälle haben wir es hier mit vorangestellten Personennamen in der Funktion eines Genitivattributs (Fritz’ Tasche) zu tun: 173 Nullendung Apostroph -ens sonstige Markierungen Token insgesamt Eigenname auf s-Laut vor Nomen 7.760 (54,2%) 5.106 (35,7%) 615 (4,3%) 825 (5,8%) 14.306 Tab. 19: Konsistenter Wegfall der Genitivendung: EN auf s + Nomen 171 Die lange Genitivendung -es findet sich auch bei Fremdwörtern mit Ultimabetonung, die nicht auf -s enden, wie Projekt(e)s, Skelett(e)s, Kontrast(e)s, Diagramm(e)s etc. Allerdings ist hier die Nullmarkierung des Genitivs in der Regel keine Option. 172 Eine entsprechende semiautomatische Annotation (z.B. auf das Basis entsprechender Wörterlisten mit anschließender manueller Korrektur der Ergebnisse) wäre mit einem erheblichen Aufwand verbunden gewesen und konnte daher im Rahmen der vorliegenden Studie nicht geleistet werden. Eine bei niederfrequenten Phänomenen mangelnde Trennschärfe stellt allerdings ein generelles Problem von Ansätzen dar, die auf die Verarbeitung großer Datenmengen mittels automatisch ablaufender Suchroutinen ausgerichtet sind. 173 Allerdings sind in dieser Belegmenge auch Beispiele enthalten, die artikellose Toponyme in pränominaler Position zeigen (Berlins Bürgermeister etc.); eine klare Trennung von Personennamen und geografischen Namen ist also auch durch die hier angewandte genannte Einschränkung nicht ohne Weiteres möglich. Normgerechte Formen der Endungslosigkeit 189 Tatsächlich findet sich hier in 4,3% der Fälle noch die Endung -ens (z.B. Leibnizens Bemühungen). Außerdem können wir beobachten, dass - wie erwartet - der Anteil der Nullendungen vor allem zugunsten der Fälle mit Apostroph abnimmt, die in diesem Kontext besonders häufig auftreten. Ein Problem scheint jedoch im Zusammenhang mit der Beobachtung aufzutreten, dass es 825 Fälle gibt, in denen eine andere Endung (außer -ens) erscheint. Wenn man diese Fälle einer näheren Betrachtung unterzieht, kann man allerdings feststellen, dass hier vor allem fehlerhafte bzw. unbrauchbare Daten vorliegen. So wird beim Name der Ratingagentur Moody’s das finale <s> sowohl als Stammauslaut als auch als Genitivmarkierung per Apostroph-s gewertet, obwohl es sich um einen festen Bestandteil des Namens handelt (allein 503 von 825 Fällen). Auch bei den verbleibenden 322 Fällen scheint es sich primär um englische Eigennamen zu handeln, bei denen das Apostroph-s fester Namensbestandteil ist (z.B. St. James’s (Park) (50x, Stadtteil bzw. Park in London), Dr. Seuss’s ABC (16x)) und daher hier nicht als Genitivmarkierung gewertet wird. Wir können also festhalten, dass ca. 90% der Eigennamen auf -s ohne eine morphologische Markierung des Genitivs auftreten. Der Wert scheint jedoch unter den entsprechenden Werten für Fremdwörter auf -us bzw. <s, x, z> zu liegen. Dies wirft die Frage auf, ob Hypothese (11) tatsächlich in der vorliegenden Form aufrechterhalten werden kann. Entscheidend ist hierbei der Status der Endung -ens: Wenn man dieses Element als produktives Flexiv der Gegenwartssprache einschätzt, dann muss Hypothese (11) entsprechend modifiziert werden. Lässt sich hingegen zeigen, dass dieses Flexiv vor allem in älteren Texten auftritt, dann könnte Hypothese (11) - mit Einschränkung auf die Gegenwartssprache - weiterhin Geltung beanspruchen. 174 Eine entsprechende inferenzstatistische Untersuchung, die den Einfluss des Erstellungsjahrs eines Textes auf die Häufigkeit der -ens- Endung überprüft, hat jedoch ergeben, dass die Effektstärke (Cramér’s V) des Faktors Zeit/ Erstellungsjahr äußerst gering ausfällt (Phi < 0,1). Mit anderen Worten, wir müssen die Geltung von (11) dahingehend einschränken, dass bei Personennamen auf s-Auslaut zwar endungslose Varianten (inkl. Apostroph) stark dominieren (> 90%), die Markierung mittels -ens aber dennoch auch im Gegenwartsdeutschen weiterhin eine marginale Option darstellt, die in ca. 4% der Fälle auftritt. 175 174 So bezeichnet Gallmann (1996, S. 286) die Endung -ens als „einen durch Sprachpflege künstlich erhaltenen Anachronismus“. 175 Ferner wäre zu überprüfen, ob die Endung -ens bevorzugt in bestimmten Textsorten/ Registern auftritt. Bei positiver Beantwortung dieser Fragestellung könnte Endungslose Genitive 190 Die Betrachtung von Nomina, die eine Kombination der Merkmale Eigenname, Fremdwort und Stammauslaut auf s-Laut aufweisen (vorletzte Zeile von Tab. 17), führt auf den ersten Blick ebenfalls zu einem etwas unerwarteten Resultat. Nach allem, was wir bisher gesehen haben, würden wir erwarten, dass eine Häufung von Eigenschaften, die eine Nullendung begünstigen, den Effekt verstärken sollte. Tatsächlich scheint aber im vorliegenden Fall der Befund alles andere als eindeutig zu sein. Zwar überwiegen die Formen ohne sichtbare Genitivmarkierung deutlich (314x, 80,5%), der Anteil der Nullendungen ist aber nur geringfügig größer als bei den Eigennamen auf s-Laut (73,4%). Noch überraschender ist der deutliche Rückgang der Bildungen mit Apostroph (2,6% vs. 11%, allesamt Zacharias’) sowie die Beobachtung, dass der Anteil der Formen mit overter Endung sogar noch angestiegen ist (16,9% vs. 15,6%, freilich in erster Linie auf Kosten der Fälle mit Apostroph). Völlig unerwartet fällt schließlich der Vergleich mit Fremdwörtern auf s-Laut aus, die einen wesentlich höheren Anteil an endungslosen Varianten aufweisen (97,3%). Eine nähere Überprüfung dieses Ergebnisses hat jedoch gezeigt, dass die 66 Fälle, die in Tabelle 17 als overt markierte Genitive ausgezeichnet sind, sämtlich als Fehler einzustufen sind: 31x Pluss (Eigennamen wie Etienne Pluss, wobei fälschlich ein Lemma Plus zugrunde gelegt wird), 17x Albatross (offensichtlicher Schreibfehler bzw. englische Schreibweise bei Zitaten), 7x (Grand) Prixs (ausschließlich Pluralformen), 4x Minuss (Schreibfehler), 2x Omnibuss (Akronym für das Projekt Online-Monitoring natürlicher, inhalativallergener Bioaerosole und sonstiger Staubkomponenten, fälschlicherweise dem Lemma Omnibus zugeordnet), 1x Quizs (Plural), 1x Pessimismuss (nicht normgerechte Schreibung), 1x Coxs (falsch geschriebener Städtename Cox’s Bazar), 1x Diskuss (fälschlich dem Lemma Diskus zugeordnete Abkürzung von Diskussion), sowie 1x Luftikus Terminuss (Name einer Vorarlberger Gauklertruppe, fälschlich dem Nomen Terminus zugeordnet). Wenn man diese 66 Fälle abzieht, ergibt sich folgendes Ergebnis (die vorletzte, bereinigte Zeile ist grau schattiert): dann (11) unter der Einschränkung beibehalten werden, dass es sich bei der Endung -ens um eine stilistisch markierte Variante handelt, die nur in bestimmten hochsprachlichen Kontexten auftritt. Normgerechte Formen der Endungslosigkeit 191 Nullendung Apostroph overte Markierung Token insgesamt Fremdwort auf -us 48.412 (98,8%) 0 570 (1,2%) 48.982 Fremdwort auf s-Laut (<s, x, z>, exkl. -us) 15.319 (97,3%) 10 (<0,1%) 415 (2,6%) 15.744 Eigenname auf s-Laut 62.241 (73,4%) 9.361 (11%) 13.197 (15,6%) 84.799 EN+Fremdw. auf s-Laut (<s, x, z>) 314 (96,9%) 10 (3,1%) 0 324 reg. Appellativa 52938 (1,7%) 34 (0,001%) 3.031.047 (98,3%) 3.084.018 Tab. 20: Konsistenter Wegfall der Genitivendung bei EN und Fremdwörtern auf s, bereinigt Es zeigt sich nun das erwartete Bild: Die Kombination der Faktoren ‘Eigenname’, ‘Fremdwort’ und ‘Endung auf s-Laut’ führt im Vergleich zu der Faktorenkombination ‘Eigenname+s-Auslaut’ zu einem deutlichen Anstieg der Nullendungen. Die Tatsache, dass in diesem Zusammenhang nur wenige Fälle mit Apostroph auftreten, ist auf die geringe Zahl entsprechender (bzw. entsprechend zugeordneter) Namen im Korpus zurückzuführen (wie bereits erwähnt, tritt ausschließlich der Personenname Zacharias’ auf). Auch dieses Ergebnis ist hochsignifikant (Chi-Quadrat Test: p < 0,0005; standardisierte Pearson-Residuen noch eindeutiger als in Tab. 18). Wir können also abschließend feststellen, dass unsere Korpusstudie Hypothese (11) zumindest partiell bestätigt. Bei Fremdwörtern hat sich gezeigt, dass der letztlich schwer zu bemessende Faktor Integration, der die hauptsächliche Quelle grammatischer Variation in diesem Bereich ist, eine entscheidende Rolle spielt (vgl. hierzu bereits Paul 1917, S. 127; siehe Kap. 4 für weitere Diskussion). Es hat sich in diesem Zusammenhang auch angedeutet, dass der Grad der Integration eines Fremdworts nicht unmittelbar auf die Häufigkeit/ Geläufigkeit im Korpus zurückgeführt werden kann: Bei Omnibus überwiegen die Formen auf -ses (79,5%), das Wort kommt aber insgesamt nur 44x im Korpus vor. Im Gegensatz dazu haben wir es mit 404 Fällen von Index zu tun, Endungslose Genitive 192 von denen allerdings lediglich 85 (21%) mit Endung (-es) auftreten. Für den Grad der Integration sind also offenbar noch andere Faktoren wie Nähe zum Grundwortschatz relevant. So reflektiert die relative Häufigkeit des Wortes Index wohl weniger seine allgemeine Geläufigkeit als vielmehr die Tatsache, dass es in einer bestimmten, im Korpus prominenten Textsorte (Zeitungsnachrichten) besonders gängig ist. Dennoch haben sich im Rahmen unserer Korpusstudie auch Hinweise darauf ergeben, dass zumindest bei geografischen Namen starke Fluktuationen der Token-Häufigkeit auch die Distribution der Genitivvarianten beeinflussen (vgl. Nübling 2012; vgl. Kap. 3.3.2.6 für die entsprechenden Befunde). 3.3.1.2 Obligatorische Endungslosigkeit bei Abkürzungen und Konversionen Gegenstand dieses Teilkapitels ist die Frage (s.o.), ob es neben Eigennamen und Fremdwörtern weitere Nomina/ Nomenklassen gibt, die systematisch ohne Genitivmarkierung auftreten. Dabei möchten wir zunächst klären, ob sich das Flexionsverhalten von Beispielen wie HSV oder DFG auf alle Abkürzungen/ Initialkurzwörter übertragen lässt, oder ob es sich hierbei nur um eine starke Tendenz handelt, die lediglich bei einigen (häufig auftretenden) Abkürzungen zu ausnahmsloser Endungslosigkeit führt. Um diese Frage(n) zu beantworten, haben wir alle Abkürzungen, die in unserer Extraktion mit einer Wahrscheinlichkeit von größer als 1 (Prob>1) als Genitive klassifiziert sind, ausgezählt und nach Markierungsvarianten sortiert. Das Ergebnis ist in Tabelle 21 festgehalten (nicht berücksichtigt wurden 2318 Fälle, die zwar als Nullmarkierung gekennzeichnet waren, in denen aber Lemma und Wortform nicht identisch waren, wie ‘k.’ und ‘k.o.’). Wie aus Tabelle 21 ersichtlich, stellen endungslose Formen die mit Abstand häufigste Markierungsoption dar. Allerdings ist die vergleichsweise große Zahl von Varianten mit overter Genitivmorphologie (ca. 1/ 3 aller Belege) doch ein wenig überraschend, vor allem wenn man sich vergegenwärtigt, dass Abkürzungen wie HSV , ZDF oder DFB ausschließlich endungslos auftreten. Eine nähere Betrachtung der Beispiele, die eine Genitivmarkierung aufweisen, zeigt dann aber, dass die Daten hier sehr fehlerbehaftet sind. So scheint es sich bei der überwiegenden Mehrheit der Fälle auf -s und insbesondere auf ’s um Pluralformen zu handeln, die bei der Extraktion fälschlich als Genitive einge- Normgerechte Formen der Endungslosigkeit 193 ordnet wurden (darunter auch Kurzwörter wie Profis (672x) oder Amis (35x), die stets die s-Endung tragen, und fehlerhaft kategorisierte Formen wie die Kombination aus der Konjunktion ob + reduziertes Pronomen (e)s). Bei den 2420 Beispielen, die laut Datenbank ein Apostroph als Genitivmarkierung aufweisen, handelt es sich fast durchweg um fremdsprachliche Namensbestandteile (D’Amico, L’Equipe) oder gekürzte Artikelformen (S’Rösli, D’Tante). Ebensowenig einschlägig sind die 168 Beispiele für Abkürzungen mit langer Genitivendung (8x Asses, ansonsten ausschließlich Fehler wie d+es (Genitivartikel) oder Hau+es (eigentlich Haus-es)). Wir können also davon ausgehen, dass der Anteil der endungslosen Formen bei Abkürzungen weitaus höher als 71% ist. Eine Stichprobe von 400 zufällig aus GenitivDB ausgewählten Belegen hat ergeben, dass von den 250 „echten“ Genitiven tatsächlich annähernd 95% endungslos sind, vgl. Tabelle 22. Genitivallomorph Token Prozent -∅ 76.509 71% -es 168 0,2% -s 28.148 26,1% ’s 557 0,5% ’ 2.420 2,2% Tab. 21: Verteilung der Genitivallomorphe bei Abkürzungen Wortform Token Endungsloser Genitiv 237 (94,8% von 250) s-Genitiv 13 (5,2% von 250, darunter 2x Profis, 1x Mofas) Fehler (kein Genitiv (meist Plural), keine Abkürzung) & unbrauchbare Belege (Namenbestandteile wie FC) etc.) 150 Tab. 22: Genitivmarkierung bei Abkürzungen - Ergebnisse einer Zufallsstichprobe (400 Belege) aus GenitivDB Endungslose Genitive 194 Die Stichprobe bestätigt ferner die Einschätzung, dass der Anteil der für unsere Belange unbrauchbaren bzw. fälschlich als Genitive eingestuften Formen bei Abkürzungen mit 37,5% besonders hoch liegt. Neben tatsächlichen Fehlern wie endungslosen Formen, die keine Genitive darstellen (17/ 400, 4,3%) oder s-markierten Abkürzungen, die sich als Plurale herausgestellt haben (39/ 400 Fälle, 9,75%), befinden sich darunter auch Ausdrücke, die zwar Genitive darstellen, aber für die Untersuchung des Flexionsverhaltens von Abkürzungen keine Aufschlüsse liefern, da das relevante Element Bestandteil eines komplexen Eigennamens ist, der nicht korrekt erkannt wurde bzw. i.d.R. nur als Ganzes eine Genitivmarkierung tragen kann (des FFC Potsdam, des George W. Bush etc., 40/ 400, 10%). Wir haben auf der Basis der Befunde in Tabelle 22 ein Konfidenzintervall von 57,5%-67,2% ermittelt, d.h. für die Verhältnisse in der Grundgesamtheit lässt sich schließen, dass der Anteil tatsächlicher untersuchungsrelevanter Genitive bei Abkürzungen (in GenitivDB) mit 95%-iger Wahrscheinlichkeit in diesem Bereich liegt. Trotz dieser Probleme bei der Präzision unserer Korpusbefunde können wir festhalten, dass die Aussage der Duden-Grammatik, Initialkurzwörter seien „häufig endungslos“, dahingehend korrigiert werden muss, dass eine Nullmarkierung des Genitivs in diesem Kontext die eindeutig präferierte, vorherrschende Variante darstellt (mit einer Irrtumswahrscheinlichkeit von 5% liegt der tatsächliche Anteil von Nullendungen bei Abkürzungen zwischen 91,1% und 97,1%). Allerdings finden sich in 5,2% der Belege auch Abkürzungen mit overter Genitivmarkierung, darunter auch solche, in denen die Abkürzung offensichtlich Eigennamencharakter hat und als pränominaler Possessor fungiert (vgl. 12c): (12) a. Die neuesten Geniestreiche des Zuger DJs sind der Remix des HNO-Sommerhits „I don’t care“ und die erfolgreiche Single- auskopplung „Pumpkin Belly“. (St. Galler Tagblatt, 17.1.2001, Ressort: TT-OBE (Abk.); Neue Groove- kaiser) b. Vier Punkte beträgt der Abstand des FCs nun auf den Tabellenkeller - eine Ausgangsposition die den FC-Übungsleiter optimistisch stimmt: [...] (Rhein-Zeitung, 7.5.2005; Zum Durchmarsch in die Kreisliga A fehlt...) Normgerechte Formen der Endungslosigkeit 195 c. Die amerikanischen High-Tech-Aktien wurden durch IBMs Übernah- meangebot an Lotus nur für kurze Zeit beflügelt. ( COMPUTER ZEITUNG , 15.6.1995, S. 8; BÖRSE ) Wenn es auch zunächst unklar bleibt, wie solche Ausnahmen einzuschätzen sind (man könnte z.B. dafür argumentieren, dass Ausdrücke wie DJ nicht mehr notwendig als Abkürzung wahrgenommen werden, ähnlich wie Jeep, und daher besser in das Flexionssystem integriert sind), so erscheint es doch aufgrund der Häufigkeit der Nullmarkierung durchaus gerechtfertigt, auch bei Abkürzungen von konsistent endungsloser Realisierung des Genitivs zu sprechen (selbst bei Nomina auf -ismus ergibt eine COSMAS -Recherche (W-gesamt, DeReKo- 2013-II) immerhin noch 164 Fälle mit overter Genitivendung wie Realismusses). Dies weist darauf hin, dass Hypothese (11) in der vorliegenden Form nicht aufrechterhalten werden kann (vgl. (15) unten für eine entsprechend modifizierte Fassung). Lemma Nullendung Andere Endung 176 Nichts 374 (100%) 0 Heute 51 (100%) 0 Gestern 17 (100%) 0 Jetzt 177 11 (100%) 0 Zuviel 14 (70%) 6 (30%) Zuwenig 5 (62,5%) 3 (37,5%) Selbst 322 (59,6%) 218 (40,4%) Ja 4 (44,4%) 5 (55,6%) Nein 55 (21,2%) 204 (78,8%) Gegenüber 0 593 (100%) Tab. 23: Verteilung der Genitivallomorphe bei Konversionen aus nicht-flektierbaren Wortarten 176 Unter den overt markierten Formen befinden sich keine Varianten, in denen ein Apostroph auftritt. 177 Eine COSMAS -Suchanfrage (W-gesamt, DeReKo-2013-I) nach des Jetzt ergibt 177 Belege. Der Grund für die Diskrepanz zwischen Extraktion und COSMAS -Recherche ist noch nicht vollständig geklärt. Eine mögliche Erklärung könnte darin bestehen, dass in der Genitiv-Datenbank nur Formen enthalten sind, die vom Xerox Endungslose Genitive 196 Schließlich sind wir der Frage nachgegangen, ob konsistente Endungslosigkeit evtl. bei anderen, niederfrequenten Formen auftritt. Dabei sind wir im Rahmen der automatischen Baummodellierung auf Konversionen aus nicht-flektierbaren Wortarten gestoßen (z.T. mit Stammauslaut auf -s). 178 Eine Stichprobe entsprechender Formen in der Genitiv-Datenbank brachte die in Tabelle 23 dargestellten Ergebnisse (auch hier war es auf der Basis der existierenden Annotation nicht möglich, Konversionen als regelrelevante Teilklasse trennscharf zu isolieren). 179 Eine Berechnung der Pearson-Residuen hat ergeben, dass mit Ausnahme der Fälle Zuviel, Zuwenig und Ja (hier spielt wohl die geringe Zahl der Belege eine Rolle) die Abweichungen von den erwarteten Häufigkeiten signifikant sind. Die Befunde der inferenzstatistischen Analyse werden durch den Assoziationsplot in Abbildung 49 veranschaulicht. Besonders deutlich ist der Effekt zugunsten der Nullendung bei Nichts, wie aus der dunkelgrauen Färbung und der vergleichsweise großen Fläche des Rechtecks oberhalb der Grundlinie ersichtlich ist (wie erwartet geht hier die starke Abweichung von der erwarteten Häufigkeit zugunsten der Nullmarkierung mit einer entsprechenden negativen Tendenz einher, was die Häufigkeit einer sichtbaren Flexionsendung betrifft. Dies wird durch eine dunkelgraue Fläche unterhalb der Grundlinie gekennzeichnet). Welche Konsequenzen ergeben sich nun aus der Betrachtung des Flexionsverhaltens von Konversionen für die Bewertung unserer Hypothese zur Verteilung konsistenter Endungslosigkeit (vgl. (8) oben)? Bei einigen der relevanten Lemmata (Nichts, Heute, Gestern, Jetzt) tritt zwar tatsächlich ausschließlich die Nullendung auf. Es lässt sich aber nicht behaupten, dass Konversionen aus nicht-flektierbaren Wortarten generell stark zur Endungslosigkeit neigen oder gar obligatorisch endungslos sind. Die Betrachtung weiterer Konversionen zeigt kein einheitliches Bild: Die einzelnen Befunde weichen z.T. stark voneinander ab, und tatsächlich fällt die Distribution von endungslosen und overt markierten Formen bei einigen Lemmata vor dem Hintergrund gängi- Tagger als Nomen eingestuft werden. 178 Wir können also festhalten, dass trotz der in Kapitel 3.2.2 erwähnten Probleme die Baummodellierung auch im Bereich der endungslosen Genitive durchaus für explorative Zwecke genutzt werden kann. 179 Vgl. http: / / hypermedia.ids-mannheim.de/ db/ liesmich.txt für eine manuell erstellte Liste von Konversionen, die für die Extraktion verwendet wurde. Normgerechte Formen der Endungslosigkeit 197 ger Aussagen der Grammatikschreibung mitunter etwas überraschend aus. So ist der recht große Anteil (> 40%) von flektierten Varianten bei Selbst aufgrund des resultierenden Konsonantenclusters nicht unbedingt prognostizierbar gewesen (tatsächlich finden sich auch einige Beispiele mit der langen Endung -es, offenbar um die Bildung eines Konsonantenclusters zu vermeiden), vgl. die Beispiele in (13). Abb. 49: Assoziationsplot: Verteilung der Genitivallomorphe bei Konversionen aus nicht-flektierbaren Wortarten (13) a. Er war dabei, als Rudi Dutschke den Arbeitern Marx und Freud beibrachte, auf dass sie die Befreiung der Gesellschaft mit der des Selbsts zu verbinden lernten. (Berliner Zeitung, 13.4.2002; Der glückliche Anarchist [S.3]) b. Das Göttliche Selbst im Menschen wachsen zu lassen und da- von wirklich ein Bewusstsein zu haben auf die Stimme dieses Wahren Selbstes lauschen zu können. (Diskussion: Lectorium Rosicrucianum/ Archiv 2009, In: Wikipedia: http: / / de.wikipedia.org/ wiki/ Diskussion: Lectorium_Rosicrucianum/ Archiv_2009: Wikipedia, 2011) Endungslose Genitive 198 c. Ekstatische Überschreitung des Selbst gehört heute zum kulturellen Mainstream. Sie geschieht im Risikosport ebenso wie in Musik, Tanz und Meditation. (Die Zeit (Online-Ausgabe), 12.4.2012; Erlaubt ist, was gefällt) Ebenfalls unerwartet ist das Verhalten von Gegenüber, das im Korpus ausschließlich mit Endung auftritt, obwohl es von der Duden-Grammatik (2009, S. 205) explizit als potenziell endungslos eingestuft wird. Der Assoziationsplot in Abbildung 49 zeigt eine signifikante negative Abweichung von der erwarteten Häufigkeit für eine Nullendung. Eine ergänzende COSMAS -Recherche (W-gesamt, DeReKo-2013-I) zeigt allerdings, dass dieses Ergebnis womöglich auf einen unzulänglichen Recall zurückzuführen ist: 180 Allein für die Anfrage des Gegenüber ergeben sich 128 relevante Belege. Dennoch ist die relativ große Zahl overt markierter Formen in unserer Datenbank bemerkenswert. Eine weitere COSMAS -Anfrage für des Gegenübers bestätigt, dass diese Konversion bevorzugt mit Endung auftritt (988 Belege): (14) a. Unter Rhetorik versteht man die Rede eines Menschen, die auf Erfolg und Überzeugung des Gegenübers ausgerichtet ist. (Mannheimer Morgen, 27.8.2013, S. 4; Was ist Rhetorik? ) b. Über zehn Jahre lang soll der deutsche Autobauer überall auf der Welt kräftig geschmiert haben. Je nach lokalen Gepflogenheiten und der Stellung des Gegenüber floss dem Bericht zufolge mal Bar- geld, mal waren es Geschenke oder Einladungen. (Nürnberger Nachrichten, 25.3.2010, S. 21; Affäre um Daimler - US- Justiz klagt den Autobauer wegen Korruption an) Auf welche Faktoren das unterschiedliche Verhalten der hier untersuchten Substantivierungen zurückgeführt werden kann, lässt sich auf der Basis der in Tabelle 23 vorliegenden Stichprobe nicht abschließend klären. Auch hier scheint jedoch das Vorliegen mehrerer Faktoren, die Endungslosigkeit begünstigen, einen systematischen Ausfall der Genitivmarkierung auszulösen. So kommen bei den ausschließlich endungslos auftretenden Nomina zum Faktor Konversion (d.h. mangelnde Integration) noch weitere Faktoren wie Stammauslaut auf Sibilant (Nichts) oder Eigennamennähe aufgrund der speziellen indivi- 180 Auch hier erscheint es wahrscheinlich, dass die Diskrepanz zwischen GenitivDB und COSMAS -Recherche darauf gründet, dass nicht alle Instanzen von Gegenüber korrekt als Nomen getaggt sind. Normgerechte Formen der Endungslosigkeit 199 dualisierenden bzw. deiktischen Funktion von Zeitausdrücken (Gestern, Heute, Jetzt) hinzu. Vor dem Hintergrund unserer Korpusbefunde zur konsistent endungslosen Realisierung des Genitivs ist die eingangs aufgestellte Hypothese (11) wie folgt zu modifizieren: (15) Konsistente Endungslosigkeit Konsistente Endungslosigkeit tritt bevorzugt auf bei (Klassen von) Nomina, die mehrere Kriterien für den Ausfall der Genitivmarkie- rung erfüllen: (a) Lexikalisch: mangelnde Integration in das Flexionssystem (Eigenna- men bzw. Eigennamennähe (Individualisierung/ Nennfunktion), Fremdwörter, Abkürzungen, Konversion, Verwendung als Terminus technicus etc.); (b) Phonologisch: Stammauslaut auf Sibilant. Nach (15) ergibt sich eine systematische Verwendung der Nullmarkierung bei genitivischen Nomina also typischerweise aus einer Kombination von lexikalischen und phonologischen Faktoren (wobei marginal auch alternative Markierungsvarianten (wie -ens bei Eigennamen auf s-Laut) auftreten können). Phonologische Faktoren (d.h. Ausgang auf s-Laut) alleine können keine endungslose Realisierung des Genitivs auslösen, sondern wirken nur in Kombination mit lexikalischen Faktoren. Umgekehrt sind lexikalische Faktoren aber nicht an phonologische Eigenschaften gekoppelt. Das Verhalten von Zeitausdrücken, die per Konversion aus nicht-flektierbaren Wortarten abgeleitet wurden, legt nahe, dass der Effekt von Faktor (a) auch dadurch verstärkt werden kann, dass ein Nomen mehrere unterschiedliche Kriterien für mangelnde Integration erfüllt (wie morphologischer Status (Konversion) & individualisierende Funktion). Ähnliches gilt auch für Abkürzungen, die freilich eine Sonderrolle einnehmen: Hier scheint die fehlende Integration in das Flexionssystem so offensichtlich zu sein, dass es auch ohne Faktorenhäufung zu (lexikalisch gesteuerter) konsistenter Endungslosigkeit kommen kann. (15) sagt allerdings zunächst nichts über die Rolle morphosyntaktischer Faktoren (d.h. den Einfluss der Tendenz zur Monoflexion), die eine endungslose Realisierung des Genitivs am Nomen auslösen. Diese Fragestellung ist Gegenstand des folgenden Teilkapitels. Endungslose Genitive 200 3.3.1.3 Kontextuell bedingte obligatorische Endungslosigkeit: Monoflexion Im Gegensatz zu lexikalischen und phonologischen Eigenschaften, die inhärente Eigenschaften eines Nomens darstellen, sind morphosyntaktische Bedingungen für Endungslosigkeit kontextgebunden. Vor dem Hintergrund dieses Kontrasts ist zu erwarten, dass sich die Effekte morphosyntaktischer Faktoren auf die Realisierung der Genitivflexion grundsätzlich von den Effekten lexikalisch-phonologischer Faktoren unterscheiden: Letztere führen zu (potenziell) absoluter Endungslosigkeit, während Erstere einen systematischen Wegfall der Genitivendung nur in bestimmten syntaktischen Kontexten auslösen. Der prototypische Fall kontextuell bedingter Endungslosigkeit liegt bei Personennamen mit sekundärem Artikel vor. 181 Nach Auffassung vieler Grammatiker und Grammatiken muss hier das Genitiv-s obligatorisch wegfallen, wenn der Genitiv bereits anderweitig innerhalb der Nominalphrase (z.B. am Artikel oder an einem anderen Namensbestandteil) markiert ist. 182 In allen anderen Kontexten muss der Name die s-En- 181 Man beachte, dass sich Eigennamen mit festem Artikel (i.d.R. Toponyme) in diesem Kontext anders verhalten und stärker zur s-Markierung tendieren (des Feldbergs etc.). 182 Ein Fokus theoretischer Analysen ist dabei der Status der Genitivendung (vgl. z.B. Olsen 1991; Gallmann 1996, 1997; Demske 2001; Müller 2002a, 2002b; Fuß 2011 und unlängst Ackermann 2014). Um die speziellen morphosyntaktischen Eigenschaften des Genitivs bei Personennamen zu erfassen (Beschränkung auf -s, overte Markierung primär bei pränominaler Position, Peters Auto, ? das Auto Peters), wird zum einen die Hypothese vertreten, bei der s-Markierung pränominaler Eigennamen (Goethes Werke) handele es sich nicht um ein Genitivsuffix (-s als (klitischer) Possessivmarker: Olsen 1991; Demske 2001; Müller 2002a, 2002b; Fuß 2011; Reanalyse als eine Form der Adjektivmarkierung: Gallmann 1996). Zum anderen wird der Wegfall der s-Markierung bei Personennamen oft als das Resultat eines syntaktisch motivierten Flexionsklassenwechsels betrachtet (ähnlich wie bei der stark/ schwach Alternation bei Adjektiven), der durch die Präsenz eines (sekundären) Artikels ausgelöst wird (vgl. z.B. Gallmann 1996). Diese Annahme scheint allerdings nicht ganz unproblematisch zu sein. Während man bei Feminina (das Lächeln Annas vs. *das Lächeln der jungen Annas) evtl. noch von einem Übergang in die feminine Deklination ausgehen kann, bleibt bei Maskulina und Neutra unklar, in welche Klasse der Wechsel erfolgt, um Endungslosigkeit des Genitivs zu gewährleisten (vgl. Müller 2002a, der eine alternative optimalitätstheoretische Analyse verfolgt). Ferner ist es unerwartet, dass der postulierte Flexionsklassenwechsel von der Position der Genitivphrase relativ zum Kopfnomen abhängig ist und nur erfolgen kann, wenn der Personenname als Genitivattribut nachgestellt wird: (a) die Werke des alten Goethe-∅ (b) des alten Goethe-s/ *-∅ Werke Normgerechte Formen der Endungslosigkeit 201 dung tragen. Bei Personennamen ist das Auftreten der Nullmarkierung also nicht allein durch eine Kombination lexikalischer und phonologischer Eigenschaften motiviert, sondern zusätzlich vom morphosyntaktischen Kontext bestimmt. Wie bereits erwähnt, wird eine quantitative Analyse der relevanten Verhältnisse bei Eigennamen allerdings dadurch erschwert, dass wir keine Möglichkeit haben, zwischen Personennamen und anderen, z.B. geografischen Namen zu unterscheiden (es liegt lediglich die Information vor, ob es sich bei einem Nomen um einen Eigennamen handelt; auf eine Nachbesserung der Ergebnisse mittels einer semiautomatischen Annotation haben wir aufgrund des erheblichen Mehraufwands verzichtet, vgl. Anm. 172). Bekanntlich ist die Tendenz zur Monoflexion bei unterschiedlichen Typen von Eigennamen unterschiedlich stark ausgeprägt. Während bei Personennamen Endungslosigkeit auch im Standard fast obligatorisch zu sein scheint, ist bei geografischen Namen mehr Variation zu beobachten (eine COSMAS -Recherche (W-gesamt, DeReKo- 2012-II) zu des alten Europa vs. des alten Europas hat ein Verhältnis von 447 zu 162 zugunsten der endungslosen Variante ergeben): (16) Gewiss eine treffliche Überschrift für die poetisch-sentimentale Bühnenschau, mit der Heiner Goebbels die Gedankenwelt eines der universellsten Gelehrten des alten Europa in knappen Sentenzen und starken Bildern (Szene und Lichtregie: Klaus Grünberg) auf die Bühne des Schauspiels holt. (Mannheimer Morgen, 18.9.2004; Herr Canetti geht hinter den Fenstern umher und gießt Blumen) (17) Auf diese Weise setzt sich der Rundgang fort. Ob Jugendstil-Schmuck, klassizistische Silberdosen, Art-Deco-Juwelen von Cartier oder friderizianische Miniaturen auf Elfenbein - die ganze Weltläufigkeit des alten Europas ist hier zu bestaunen. (Berliner Zeitung, 10.11.2006, Ressort: Feuilleton; Wo Stühle Schnecken sind und Tische Krallen haben [S. 30]) Auch wenn auf der Basis des Annotationsschemas keine Unterscheidung verschiedener Namenstypen möglich ist, kann man im Rahmen unserer Korpusstudie zumindest den starken Einfluss der Monoflexion sichtbar machen, indem man die Tendenz zur Endungslosigkeit bei Eigennamen ohne modifizierendes Adjektiv mit den relevanten Befunden zur Kombination von Adjektiv auf -en + Eigenname vergleicht (hier muss ein Artikel stehen, vgl. *(des) jungen Goethe): Endungslose Genitive 202 Nullendung Apostroph overte Markierung Token insgesamt Eigenname (ohne pränominales Attribut) 265.317 (14,3%) 10.255 (0,6%) 1.575.605 (85,1%) 1.851.176 Art. + Adj. -en + Eigenname 33.711 (35,5%) 231 (0,2%) 61.009 (64,3%) 94.950 Tab. 24: Einfluss der Monoflexion bei Eigennamen Wie aus Tabelle 24 hervorgeht, hat sich der Anteil der Nullendungen bei Vorliegen eines modifizierenden Adjektivs im Vergleich zu der Situation bei Eigennamen ohne Adjektivattribut mehr als verdoppelt (ein Chi-Quadrat Test ergibt einen p-Wert kleiner als 0,0005; der Wert des Residuums für die Kombination Adjektiv+Eigenname liegt bei 158,3). Auch hier gilt natürlich, dass der große Anteil an anderen Namenstypen, die weniger stark der Monoflexion unterliegen (des alten Europa-s etc.), die Situation bei Personennamen verschleiert. Eine genauere Untersuchung ist leider auf der Basis der vorliegenden Annotation nicht möglich. Um etwaige Kontraste zwischen unterschiedlichen Typen von Namen im Zusammenhang mit dem Phänomen der Monoflexion herausarbeiten zu können, haben wir das Flexionsverhalten der zehn häufigsten 1) Personennamen und 2) geografischen Namen näher untersucht. Dabei haben wir auf der Basis einer Recherche in GenitivDB die Häufigkeiten von Nullendung und s-Endung in Kontexten mit und ohne vorangehendes attributives Adjektiv ermittelt. Die folgenden beiden Tabellen 25 und 26 geben die Ergebnisse der Untersuchung wieder. 183 Zur Veranschaulichung des Einflusses der Mo- 183 Eine Sichtung der Belege hat ergeben, dass die Ergebnisse teilweise eine sehr hohe Fehlerquote aufweisen. Dies gilt insbesondere für Fälle mit Nullendung ohne vorangehendes Adjektiv. So waren von 544 Belegen von (des) ... Berlin-∅ nur 11 einschlägig. Besonders häufig sind nicht-relevante Belege, in denen der geografische Name Bestandteil eines komplexen Eigennamens ist, bei dem der Genitiv am Zweitglied markiert ist (des Berlin Marathons). Ebenfalls problematisch sind Fälle mit s-Endung bei vorangehendem Adjektiv: Unter 190 Belegen der Art (des) ... ADJ- Österreichs fanden sich nur 23 Treffer (typische Fehler sind etwa Fälle, in denen das Adjektiv kein Attribut zum Genitivnomen darstellt: Dieser Golfplatz ist einer der schönsten Österreichs). Wir haben daher die Belege für Nullendungen und Adjektiv+s-Genitiv einzeln durchgesehen, um Fehler auszuschließen. Es hat sich zu- Normgerechte Formen der Endungslosigkeit 203 noflexion auf die beiden Namenstypen haben wir für die Kontexte mit vorangehendem Adjektiv die relativen Häufigkeiten von Nullendung und s-Endung angegeben: ohne Adjektiv mit Adjektiv Token insgesamt -∅ -s -∅ -s Schröder 60 7.762 1 (50%) 1 (50%) 7.823 Hitler 40 6.494 13 (87%) 2 (13%) 6.548 Mozart 23 5.364 55 (93%) 4 (7%) 5.445 Goethe 55 5.075 71 (97%) 2 (3%) 5.202 Bush 32 4.688 10 (83%) 2 (17%) 4.731 Clinton 13 4.678 7 (88%) 1 (12%) 4.698 Shakespeare 101 3.450 14 (70%) 6 (30%) 3.570 Beethoven 42 3.444 26 (100%) 0 3.512 Merkel 1 3.376 1 (100%) 0 3.378 Hussein 73 3.250 0 1 (100%) 3.323 Tab. 25: Einfluss der Monoflexion bei Personennamen (Stichprobe: 10 häufigste Personennamen im Korpus) Tabelle 25 und Tabelle 26 zeigen, dass sowohl bei Personennamen als auch bei geografischen Namen der Faktor Monoflexion die Verteilung der Flexionsvarianten deutlich beeinflusst. Bei Absenz eines attributiven Adjektivs (und somit eines Artikels) dominiert eindeutig die s- Markierung des Genitivs, wie aus der Spalte ‘ohne Adjektiv’ klar ersichtlich. Kommt ein Adjektiv (und somit ein Artikel) hinzu, verändert sich die Verteilung deutlich zugunsten der Nullvariante (vgl. die Spalte ‘mit Adjektiv’ und die dort angegebenen Prozentverhältnisse). Ein Vergleich des Flexionsverhaltens von Personennamen und geografischen Namen bei Vorhandensein eines Adjektivs offenbart allerdings einen deutlichen Kontrast. Berücksichtigt man lediglich die Zeilen mit dem gezeigt, dass bei Letzteren der Fehleranteil deutlich eingeschränkt werden kann, wenn man bei der Suchanfrage zusätzlich die Präsenz eines Genitivartikels verlangt, der dem Genitivnomen im Abstand von maximal zwei Wörtern vorangeht. Bei dem Muster ADJ+Europas, das besonders häufig auftritt (1034 Treffer), haben wir eine Zufallsstichprobe von 200 Belegen gezogen und das Ergebnis (132/ 200, 66% zutreffende Belege) auf die Gesamtzahl hochgerechnet. Endungslose Genitive 204 größeren Belegzahlen (bei Schröder, Merkel und Hussein sind die Ergebnisse zu gering, um einigermaßen belastbare Schlüsse zu ziehen), so zeigt sich, dass bei Personennamen eine sehr starke Tendenz zur Monoflexion vorliegt (teilweise wie bei Beethoven bis hin zur Ausnahmslosigkeit), während bei geografischen Namen der Anteil der s-Endungen im Vergleich deutlich höher liegt (z.T. über 50%). 184 ohne Adjektiv 185 mit Adjektiv Token insgesamt -∅ -s -∅ -s Deutschland 14 45.643 623 (78%) 180 (22%) 46.459 Europa 78 36.886 587 (46%) 682 (54%) 38.232 Berlin 11 27.029 233 (56%) 180 (44%) 27.452 Österreich 5 20.289 47 (67%) 23 (33%) 20.363 Frankreich 8 15.066 88 (54%) 75 (46%) 15.236 Italien 4 11.147 62 (51%) 59 (49%) 11.271 China 3 10.791 119 (72%) 47 (28%) 10.959 Hamburg 1 10.561 12 (67%) 6 (33%) 10.579 Tirol 2 8.996 36 (77%) 11 (23%) 9.044 Amerika 13 8.156 183 (62%) 111 (38%) 8.462 Tab. 26: Einfluss der Monoflexion bei Toponymen (Stichprobe: 10 häufigste geografische Namen im Korpus) 184 Eine nähere Betrachtung der Daten scheint nahezulegen, dass eine mehrfache Markierung des Genitivs durch den Abstand zwischen Artikel und Eigenname beeinflusst wird: Je größer der Abstand zwischen Artikel und Eigenname, desto größer die Wahrscheinlichkeit, dass der Eigenname s-markiert ist, vgl. die folgenden Beispiele, in denen eine Nullendung deutlich weniger präferiert erscheint: (a) Dazu kam die Angst um Mazzini , der auf seinen gefährlichen Streifzügen in der Nähe des durch den Frieden von Villafranca nur halb befreiten Italiens verweilte. (b) Der Umweltverband BUND hat Bürgermeister Ole von Beusts ( CDU ) Vision eines auf zwei oder gar 2,2 Millionen Einwohner wachsenden Hamburgs kri- tisiert. (c) Die Neubelebung des von Geschlecht und rassischer Zugehörigkeit unab- hängigen Leistungsprinzips und des radikaldemokratischen Konzepts der religions-, rasse-, geschlechts- und farbblinden Bestimmung des amerikani- schen Bürgers verspricht die Erneuerung des durch den Multikulturalismus und Feminismus in eine Sinnkrise geratenen Amerikas. Normgerechte Formen der Endungslosigkeit 205 3.3.1.4 Fazit: Invariante Fälle Im vorangegangenen Teilkapitel sind wir der Frage nachgegangen, welche Faktoren bzw. Kombinationen von Faktoren einen obligatorischen Ausfall der Genitivmarkierung bewirken. Ein wesentliches Ergebnis ist, dass eine ausnahmslos endungslose Realisierung des Genitivs in der Regel das Resultat eines Zusammenwirkens mehrerer Faktoren ist. Charakteristisch hierfür ist beispielsweise das Flexionsverhalten nicht-integrierter Fremdwörter, die auf -s auslauten. Die obligatorische Nullmarkierung des Genitivs wird in diesem (aber auch in anderen Fällen) typischerweise ausgelöst durch phonologische Faktoren, die nur in Kombination mit inhärenten lexikalisch-semantischen Eigenschaften des Nomens ihre Wirkung entfalten. Ähnliche kumulative Effekte lassen sich auch im Zusammenhang mit dem Phänomen der Monoflexion beobachten. Allerdings sind hier neben lexikalischsemantischen Eigenschaften (Eigennamencharakter (insbes. Personennamen), individualisierende bzw. deiktische Funktion etc.) syntaktische Faktoren (Markierung des Genitivs am Artikel bzw. Adjektiv) für den systematischen Wegfall der Genitivmarkierung ausschlaggebend. Es hat sich allerdings gezeigt, dass detaillierte Untersuchungen bzw. die Formulierung belastbarer quantitativer Aussagen dadurch erschwert werden, dass es auf der Basis der vorliegenden Annotation nicht möglich ist, zwischen verschiedenen Eigennamentypen zu unterscheiden. Auf der Basis einer Stichprobe konnten wir aber nachweisen, dass der Faktor Monoflexion bei Personennamen etwas stärker wirkt als bei geografischen Namen. Darüber hinaus haben wir überprüft, ob ein obligatorischer Wegfall der Genitivendung auch in anderen Kontexten nachgewiesen werden kann. Unsere Untersuchungen haben ergeben, dass hier insbesondere Abkürzungen (wie HSV , DFB ) eine Sonderrolle einnehmen. Darüber hinaus treten auch einzelne Konversionen aus nicht-flektierbaren Quellwortarten (Nichts, Heute, Gestern, Jetzt) konsistent endungslos auf. Bei Abkürzungen ist eine endungslose Realisierung des Genitivs die Regel (womöglich aufgrund ihrer mangelnden Integration ins Flexionssystem), während im Fall von Konversionen das Ausbleiben der Genitivendung lexikalisch begrenzt zu sein scheint (bzw. durch das Vorliegen eines s-Auslauts be- 185 Um nicht-einschlägige Formen wie (des) FC Tirol oder (des) Hamburg Ballett auszuschließen, wurde nur nach endungslosen Genitiven gesucht, denen weder ein nominales Element vorangeht noch eines nachfolgt (NNprae und NNpost = 0). Endungslose Genitive 206 fördert wird). Für genauere Antworten auf die Frage, unter welchen Umständen eine obligatorisch endungslose Realisierung des Genitivs ausgelöst wird, sind allerdings noch weitere empirische Untersuchungen nötig. 3.3.2 Variante Fälle Die vorangegangene Diskussion hat gezeigt, dass absolute bzw. kontextuell bedingte systematische Endungslosigkeit nur in einer sehr eingeschränkten Menge von Kontexten auftritt. In den meisten Fällen, die einen Wegfall der Genitivmarkierung zulassen, ist man daher mit dem Phänomen grammatischer Variation konfrontiert. Dabei ist zu unterscheiden zwischen Fällen, in denen eine endungslose Realisierung des Genitivs die präferierte Option darstellt (wie bei Abkürzungen und z.T. auch bei bestimmten Substantivierungen per Konversion), und solchen, in denen die overte Markierung per Flexionsendung überwiegt. Im Anschluss werden wir uns mit einer Auswahl weiterer Fälle auseinandersetzen, für die in der Literatur bereits eine mehr oder weniger starke Neigung zur Endungslosigkeit festgestellt wurde. Die Darstellung ist dabei nach Faktoren gegliedert, die nach gängiger Auffassung einen Wegfall der Genitivendung bewirken können. Behandelt werden Eigennamen, eigennamenähnliche Ausdrücke (Wochentage, Monatsnamen sowie Stil- und Epochenbezeichnungen), Fremdwörter, Zeitausdrücke und Konversionen. 186 Phonologische Faktoren wurden nicht als separater Gliederungspunkt berücksichtigt, da sie nur in Kombination mit anderen (lexikalischen) Faktoren wirksam sind (s.o.). Ferner möchten wir darauf hinweisen, dass die Auswahl der Faktoren teilweise durch die Klassifikationen bedingt ist, die uns im Rahmen unserer Genitivdatenbank zur Verfügung stehen. Nach der Diskussion von Einzelfaktoren werden wir uns dann mit einer Auswahl von Faktorenkombinationen befassen, deren Zusammenspiel offenbar einen stärkeren Einfluss auf die Wahl der Endungsvariante hat. Im Mittelpunkt steht die Frage, inwiefern es auf der Basis des vorliegenden korpusbasierten Ansatzes möglich ist, zu präziseren quantitativen Aussagen über die Häufigkeit endungsloser Varianten zu gelangen. 186 Neologismen werden an dieser Stelle nicht ausführlich als separate Einflussgröße diskutiert, da sie größtenteils Bestandteil anderer Klassen wie Fremdwörter oder Abkürzungen sind. Eine Recherche in GenitivDB hat aber ergeben, dass der Anteil der Nullendungen bei Neologismen mit 30,2% (9.132 Belege vs. 21.113 Fälle mit -s) einen recht hohen Wert erreicht. Normgerechte Formen der Endungslosigkeit 207 3.3.2.1 Eigennamen Wenn man den Anteil von Nullendungen bei Eigennamen mit dem Anteil von Nullendungen vergleicht, die bei der Vergleichsgrupppe der regulären Appellativa (vgl. Kap. 3.3.1.1 sowie Anm. 167) auftreten, dann zeigt sich, dass der Faktor ‘Eigenname’ die Verfügbarkeit einer Nullmarkierung signifikant zu beeinflussen scheint: Nullendung Apostroph overte Markierung Token insgesamt Eigennamen 299.028 (15,4%) 10.486 (0,5%) 1.636.614 (84,1%) 1.946.127 reg. Appellativa 52.938 (1,7%) 34 (0,001%) 3.031.047 (98,3%) 3.084.018 Tab. 27: Häufigkeit endungsloser Formen: Eigennamen vs. Appellativa, die nicht zur Nullendung tendieren Allerdings umfassen die Zahlen, die in Tabelle 27 angegeben sind, auch solche Eigennamen, die auf s-Laut ausgehen und daher eine wesentlich größere Tendenz zur Endungslosigkeit aufweisen (vor allem auch in Kontexten, in denen der Wegfall der Genitivmarkierung nicht auf das Phänomen der Monoflexion zurückzuführen ist; s.o., Tab. 20). Eine entsprechend bereinigte Fassung findet sich im Anschluss in Tabelle 28: Nullendung Apostroph overte Markierung Token insgesamt Eigennamen 227.426 (12,3%) 1.125 (0,1%) 1.623.417 (87,6%) 1.851.967 reg. Appellativa 52.938 (1,7%) 34 (0,001%) 3.031.047 (98,3%) 3.084.018 Tab. 28: Häufigkeit endungsloser Formen: Eigennamen (ohne Auslaut auf <s, x, z>) vs. Appellativa Auch hier ist der starke Einfluss des Faktors ‘Eigenname’ aber immer noch deutlich. Eine inferenzstatistische Analyse zeigt, dass der Wert für die Effektstärke (Cramér’s V) mit 0,22 zwischen den allgemein angenommenen Schwellenwerten für kleine (0,1) und mittlere (0,3) Zusammenhänge liegt. Noch eindeutiger sind die Resultate der Berechnung der Pearson-Residuen (Eigennamen mit Nullendung: 376,88 vs. Eigennamen Endungslose Genitive 208 mit overter Markierung: 93,01). Die folgende Grafik veranschaulicht den Befund, dass der Anteil der Nullendungen bei Eigennamen hochsignifikant von den erwarteten Häufigkeiten abweicht (vgl. die dunkelgraue Fläche bei der Kombination ‘EN’ (= Eigenname) und ‘Nullendung’): Abb. 50: Assoziationsplot: Häufigkeit endungsloser Formen: Eigennamen (ohne Auslaut auf <s, x, z>) vs. Appellativa 3.3.2.2 Eigennamenähnliche Ausdrücke In der Literatur wird wiederholt darauf hingewiesen, dass bei bestimmten Teilklassen von Nomina, die aufgrund ihrer Etymologie oder Funktion den Eigennamen nahe stehen, der Genitiv optional unmarkiert bleiben kann (vgl. z.B. Duden 2009, S. 202f., der bemerkt, dass beide Varianten „standardsprachlich zulässig“ seien). Wir haben in diesem Zusammenhang das Flexionsverhalten von Wochentagen, Monatsnamen sowie von Stil- und Epochenbezeichnungen näher untersucht. Bei Wochentagen scheint sich zunächst die Aussage der aktuellen Duden-Grammatik zu bestätigen, der zufolge endungslose und overt markierte Varianten gleichermaßen zulässig sind (vgl. Tab. 29). Es hat Normgerechte Formen der Endungslosigkeit 209 sich allerdings gezeigt, dass für Freitag und Sonntag keine endungslosen Belege im Genitivkorpus enthalten sind. Offenbar wurden die relevanten endungslosen Genitivformen nicht korrekt erkannt. Weitere Probleme treten in diesem Zusammenhang bei den overt markierten Formen auf. In GenitivDB sind nur vier Belege für Freitages mit langer Endung, aber kein einziger Beleg für die eigentlich gängigere Variante mit kurzer Endung enthalten. Ähnlich verhält es sich bei Sonntag: Hier enthält unsere Datenbank zwar 56 Belege, die aber allesamt die markierte lange Endung -es aufweisen. 187 Um die resultierenden Lücken zu ergänzen, haben wir eine COSMAS -Recherche durchgeführt (markiert durch ein hochgestelltes „†“; gesucht wurde jeweils des/ eines+Wochentag (+(e)s), W-gesamt, DeReKo-2013-I). Dabei hat sich herausgestellt, dass die Belegzahlen in COSMAS wesentlich höher ausfallen als in unserer Genitivextraktion (des/ eines Freitag: 357x endungslos, 1085x mit Endung; des/ eines Sonntag: 267x endungslos, 3.533x mit Endung). Um Vergleichbarkeit mit den Ergebnissen der Genitivextraktion zu gewährleisten, haben wir die Belege für Freitag und Sonntag auf zufällige Stichproben reduziert, deren Größe in etwa dem Durchschnittswert der Belegzahlen für Wochentage in unserer Genitivdatenbank entspricht. 188,189 Wie aus Tabelle 29 unten hervorgeht, weicht das Verhältnis zwischen endungslosen und overt markierten Genitiven bei Freitag und (vor allem) Sonntag stark von den Werten ab, die wir für die anderen Wochentage ermittelt haben. Dieser Befund ist allerdings nicht unbedingt so zu interpretieren, dass Freitag und Sonntag eine Sonderstellung einnehmen (obwohl tatsächlich der Anteil der endungslosen Formen bei Sonntag sehr gering ausfällt). Es scheint sich vielmehr um ein generelles Problem zu handeln, da ähnliche Beobachtungen auch für die an- 187 Die Tatsache, dass bei Wochentagen alle drei Leitvarianten der Genitivmarkierung im Korpus attestiert sind, ist eine weitere Ausnahme von der Regel, dass die Nullendung im Normalfall ausschließlich mit der Markierung mittels -s alterniert (vgl. Kap. 3.1.1). 188 Nicht berücksichtigt wurden Zeitangaben der Art des Freitag abends sowie Belege, die sich auf die Zeitschriften Der Freitag und Der Sonntag bzw. entsprechende Personennamen beziehen. 189 Die Tatsache, dass die anhand von COSMAS ermittelten Zahlen für Freitag und Sonntag wesentlich höher liegen als für die anderen Wochentage in unserer Genitivdatenbank, bedeutet nicht, dass diese Wochentage wesentlich häufiger im Genitiv stehen, sondern ist vielmehr als Hinweis darauf zu verstehen, dass der Recall unserer Genitivextraktion für Wochentage relativ niedrig ausfällt. Endungslose Genitive 210 deren Wochentage gemacht werden können: So weichen die Ergebnisse einer COSMAS -Anfrage für des/ eines Montag(s) (230x ∅ vs. 906x -s, W-gesamt, DeReKo-2013-I) ebenfalls stark von der Verteilung in der Genitivdatenbank ab. Eine mögliche Erklärung für diese Unterschiede könnte evtl. die Beobachtung liefern, dass in GenitivDB die (im Gesamtkorpus sehr häufige) Sequenz des Montags gegenüber der Abfolge Art.-Adj.-Montags stark unterrepräsentiert ist (8 zu 33 Belegen; eine entsprechende Recherche im Tree Tagger Teilkorpus ergab hingegen 304x des Montags vs. 75x des- ADJ -Montags). Mit anderen Worten, der Recall bei den Wochentagen ist für die mit -s markierten Genitive zu schwach, um allein auf der Basis der Genitivdatenbank gesicherte quantitative Aussagen machen zu können. Dennoch lassen zumindest die Ergebnisse für des/ eines Montag(s) und des/ eines Freitag(s) die Vermutung zu, dass der Anteil der Nullendungen deutlich über dem Niveau bei regulären Appellativa liegt (erklärungsbedürftig ist allerdings die Beobachtung, dass sich der Genitiv von Sonntag scheinbar anders verhält). 190 Nullendung Apostroph overte Markierung Token insgesamt Montag 48 (47,1%) 0 53 (52,5%) 101 Dienstag 46 (58,2%) 0 33 (41,8%) 79 Mittwoch 68 (65,4%) 0 36 (34,6%) 104 Donnerstag 51 (54,8%) 0 42 (45,2%) 93 Freitag † 17 (15,2%) 0 95 (84,8%) 112 Samstag 49 (31,4%) 0 107 (68,6%) 156 Sonntag † 4 (3,3%) 0 118 (96,7%) 122 reg. Appellativa 52.938 (1,7%) 34 (0,001%) 3.031.047 (98,3%) 3.084.018 Tab. 29: Häufigkeit endungsloser Formen: Wochentage vs. Appellativa, die nicht zur Nullendung tendieren 190 Aufgrund der heterogenen Zusammensetzung der Datenbasis, die sich aus unterschiedlichen Quellen speist, haben wir hier auf eine inferenzstatistische Analyse verzichtet. Normgerechte Formen der Endungslosigkeit 211 Nullendung Apostroph overte Markierung Token insgesamt Januar 461 (77,1%) 0 137 (22,9%) 599 Februar 364 (74%) 0 128 (26%) 492 März 723 (97,4%) 0 19 (2,6%) 742 April 527 (85,7%) 0 88 (14,3%) 615 Mai 986 (100%) 0 0 191 986 Juni 2.283 (92,3%) 0 191 (7,7%) 2.474 Juli 954 (75,8%) 0 305 (24,2%) 1.259 August 192 551 (85,7%) 0 92 (14,3%) 643 September † 169 (32,4%) 0 352 (67,6%) 521 Oktober † 218 (34,9%) 0 406 (65,1%) 624 November † 201 (31,7%) 0 434 (68,3%) 635 Dezember † 138 (31,9%) 0 294 (68,1%) 432 reg. Appellativa 52.938 (1,7%) 34 (0,001%) 3.031.047 (98,3%) 3.084.018 Tab. 30: Häufigkeit endungsloser Genitivformen: Monatsnamen vs. Appellativa, die nicht zur Nullendung tendieren Bei der Untersuchung des Flexionsverhaltens von Monatsnamen ergibt sich zunächst ein ähnliches Problem wie bei den Wochentagen, da für die Monate auf -er keine endungslosen Formen in der Datenbank registriert sind. Dies könnte zwar in Zusammenhang stehen mit der Beobachtung, dass diese Monatsnamen generell weniger zur Endungslosigkeit tendieren (Duden 2007). Eine entsprechende Recherche mittels COSMAS (W-gesamt, DeReKo-2013-I) zeigt jedoch, dass auch hier endungslose Varianten auftreten, auch wenn deren Prozentsatz unter dem Anteil endungsloser Formen bei den anderen Monatsnamen liegt. Tabelle 30 stellt die Zahlen aus unserer Genitivdatenbank mit den 191 Alle 71 Belege, die in der Datenbank enthalten sind, haben sich als Fehler herausgestellt (zumeist falsch lemmatisiert: Das Getreide Mais wird als flektierte Form von Mai gedeutet). 192 Belege, die den Personennamen August enthalten, wurden manuell aussortiert (58x ∅, 375x -s). Endungslose Genitive 212 Resultaten einer COSMAS -Recherche für des/ eines+Monatsna-me auf -er (markiert durch Schattierung und ein hochgestelltes „†“) gegenüber. 193 Auffällig ist hier nicht nur, dass die Monate auf -er insgesamt einen geringeren Anteil an Nullendungen aufweisen, sondern auch, dass dieser Anteil jeweils sehr ähnlich ausfällt. Die Tatsache, dass eine COS- MAS -Suche nach einem einzigen Muster (des/ eines+Monatsname) bereits ähnlich hohe Resultate wie in unserer Genitivdatenbank (die ja mehrere (idealerweise alle) Muster enthält) produziert, lässt überdies vermuten, dass auch bei den Monatsnamen der Recall nicht optimal ist. Eine entsprechende COSMAS -Recherche für des/ eines Januar (206x Null (37,1%), 349x -s (62,9%)) bestätigt dies zumindest für die overt markierten Genitivformen; zudem wird dabei deutlich, dass Monate, die nicht auf -er enden, ein ähnliches Verhältnis von endungslosen und overt markierten Genitiven wie September bis Dezember aufweisen. Dies wirft die Frage auf, ob - ähnlich wie bei den Wochentagen - die Asymmetrien zwischen Genitivdatenbank (größerer Anteil von Nullendungen) und COSMAS -Recherche (geringerer Anteil von Nullendungen) auf einen schwachen Recall bei den Formen mit s im Rahmen unserer Genitivextraktion zurückzuführen ist. Ein alternativer Erklärungsansatz könnte indes darin bestehen, dass der Anteil von overt markierten Genitiven in dem mittels COSMAS gesuchten Muster (des/ eines+Monatsname) höher liegt als in der Gesamtheit der Daten. Wenn sich diese Vermutung bestätigen lässt, könnte das bedeuten, dass das Ergebnis der Genitivextraktion die Verhältnisse zumindest in der Tendenz doch einigermaßen korrekt wiedergibt - trotz Schwächen beim Recall. Tatsächlich scheint die zweite Hypothese durch eine ( COSMAS -basierte) nähere Betrachtung von Datumsangaben, die ein recht häufiges Muster darstellen, Unterstützung zu finden (W-gesamt, DeReKo-2013-I) (siehe Tab. 31). 193 Die Tabellen 30 und 31 zur Genitivmarkierung von Monatsnamen enthalten keine Belegzahlen für apostrophmarkierte Formen, da in GenitivDB keine einschlägigen Beispiele verzeichnet sind. Wir möchten aber darauf hinweisen, dass eine entsprechende COSMAS -Recherche (Archiv W-gesamt, DeReKo-2014-II) immerhin 3 relevante Belege für des März’ ergeben hat. Man kann also schließen, dass zumindest bei März die Apostrophvariante potenziell auftreten kann, wenn auch mit sehr niedriger Frequenz. Normgerechte Formen der Endungslosigkeit 213 Nullendung Apostroph overte Markierung Token insgesamt Januar 2.614 (89,8%) 0 298 (10,2%) 2.912 Februar 2.297 (87,4%) 0 331 (12,6%) 2.628 März 3.860 (99,5%) 0 19 (0,5%) 3.879 April 3.222 (94,1%) 0 203 (5,9%) 3.425 Mai 5.160 (98,8%) 0 61 (1,2%) 5.221 Juni 8.824 (99%) 0 86 (1%) 8.910 Juli 5.848 (98,6%) 0 85 (1,4%) 5.933 August 3.429 (95,6%) 0 157 (4,4%) 3.586 September 9.463 (86,5%) 0 1.480 (13,5%) 10.943 Oktober 3.127 (85,1%) 0 547 (14,9%) 3.674 November 3.888 (88,1%) 0 526 (11,9%) 4.414 Dezember 3.186 (82,4%) 0 682 (17,6%) 3.868 Gesamt 54.918 (92,5%) 0 4.475 (7,5%) 59.393 Tab. 31: Häufigkeit endungsloser Genitivformen: Datumsangaben ( COSMAS -Recherche: des-Ordinalzahl-Monatsname+(s)) Es zeigt sich, dass bei Datumsangaben offenbar eine starke Tendenz zur endungslosen Realisierung des Genitivs am Monatsnamen besteht. Wenn der Monatsname zusätzlich noch auf Sibilant endet (März), führt dies praktisch zu obligatorischer Endungslosigkeit. Interessanterweise lässt sich ein ähnlicher Effekt bei Monatsnamen beobachten, die auf einen (hohen) Vokal enden (Mai, Juni, Juli). Deutlich geringer (80%+x) scheint der Anteil endungsloser Formen bei Monatsnamen zu sein, die auf -er bzw. -ar enden (und einen nicht-hohen Vokal in der letzten Silbe aufweisen). Die Tatsache, dass die Gesamtzahl der Belege bei Juni und September besonders hoch ausfällt, ist auf die Existenz besonders häufig gebrauchter Praxonyme (Datumsangaben, die Namenscharakter besitzen und auf historische Ereignisse referieren) wie des 11. September (6.599 Belege, COSMAS -Recherche in W-gesamt, DeReKo -2013-II) oder des 17. Juni (5.201 Belege, COSMAS -Recherche in W-gesamt, DeReKo-2013-II) zurückzuführen. Die Aussagekraft dieser Beobachtungen wird durch relevante inferenzstatistische Tests bestätigt. So Endungslose Genitive 214 weichen bei den ermittelten Pearson-Residuen die Werte für die Monate auf -er und -ar signifikant (negativ) von den erwarteten Häufigkeiten der Nullendung bzw. overten Markierung ab, d.h., der Betrag des standardisierten Residuums ist jeweils größer als 1,96. Die folgende Tabelle 32 (und die Visualisierung der Befunde in Abb. 51) zeigt, dass dieser Effekt bei Februar, September, Oktober, November und Dezember signifikant ist: Im Vergleich zu den anderen Monaten wird die Nullendung weniger stark favorisiert. Lediglich bei Januar ist die Abweichung für die Nullendung nicht signifikant; allerdings wird auch hier die overte Markierung signifikant häufiger gebraucht als bei den anderen Monaten: Monatsname Nullendung overte Markierung Januar -1,51 5,31 Februar -2,7 9,45 März 4,56 -15,98 April 0,98 -3,43 Mai 4,78 -16,76 Juni 6,45 -22,59 Juli 4,89 -17,12 August 1,97 -6,89 September -6,52 22,83 Oktober -4,64 16,24 November -3,03 10,61 Dezember -6,53 22,88 Tab. 32: Pearson-Residuen/ Genitivmarkierung bei Monatsnamen Welche Bedeutung haben nun die Befunde zum Flexionsverhalten von Datumsangaben für die Einschätzung der Ergebnisse unserer Korpusbefunde zur Genitivallomorphie bei Monatsnamen? Eine mögliche Interpretation der Datenlage ist es, anzunehmen, dass die Tendenz zur overten Genitivmarkierung, die wir im Rahmen einer COS- MAS -Recherche für das Muster des+Monatsname beobachtet haben (vgl. Tab. 30), in unserer Genitivdatenbank von der starken Neigung Normgerechte Formen der Endungslosigkeit 215 zur Endungslosigkeit im Zusammenhang mit (den sehr viel häufigeren) Datumsangaben mehr als ausgeglichen bzw. überdeckt wird. Eine Untersuchung der Belege für Januar in unserer Genitivdatenbank bestätigt diese Sichtweise: Unter den 461 endungslosen Belegen finden sich 397 Datumsangaben der Art Genitivartikel-Ordinalzahl-Monatsname. Die Form Januars erscheint lediglich in 48 Datumsangaben, die knapp ein Drittel aller Formen mit Endung (insgesamt 137) ausmachen. Die überwiegende Mehrheit der overt markierten Genitive (80 Belege) involviert hingegen das Muster Genitivartikel+Januars (plus 9 Belege der Art des- ADJ -Januars), das nur in 59 Fällen mit einer Nullrealisierung des Genitivs einhergeht (siehe Tab. 33). 194 Abb. 51: Assoziationsplot: Abweichungen von der erwarteten Häufigkeit der Endungsvarianten bei Monatsnamen 194 Eine Berechnung der entsprechenden Residuen (Pearson-Residuen) ergibt, dass die Verteilung der Endungsvarianten beim Muster des-Ordinalzahl-Januar(s) (Nullendung: 2,91; overte Markierung: -5,34) signifikant von der Verteilung bei des Januar(s) (Nullendung: -4,65; overte Markierung: 8,53) abweicht. Bei des ADJ Januar(s) ist lediglich die Bevorzugung der overten Markierung eindeutig signifikant (Nullendung: -1,76; overte Markierung: 3,23). Endungslose Genitive 216 Muster Nullendung overte Markierung Token insgesamt des Ord.-Zahl Januar(s) 397 (89,2%) 48 (10,8%) 445 des Januar(s) 59 (42,4%) 80 (57,6%) 139 des ADJ Januar(s) 5 (35,7%) 9 (64,3%) 14 Tab. 33: Genitivmarkierung und syntaktische Muster am Beispiel von Januar (Genitivdatenbank) Wir können also vor dem Hintergrund der durchgeführten Untersuchungen feststellen, dass die Wahl des Genitivallomorphs bei Monatsnamen offensichtlich von der jeweiligen syntaktischen Umgebung beeinflusst wird: Während Datumsangaben stark zur Endungslosigkeit neigen, dominiert in anderen Kontexten die s-Endung. Bei der Verteilung der Markierungsvarianten auf die einzelnen Muster lassen sich klare Parallelen zwischen den Befunden in unserer Genitivdatenbank und den jeweiligen Ergebnissen der COSMAS -Recherchen erkennen. Wir können also festhalten, dass trotz der erwähnten Schwächen beim Recall die Ergebnisse unserer Genitivextraktion die Verhältnisse im Gesamtkorpus einigermaßen adäquat zu reflektieren scheinen. Die in Zusammenhang mit Tabelle 30 diskutierten Asymmetrien zwischen den Ergebnissen einer COSMAS -Recherche (des/ eines+Monatsname) und den Inhalten der Genitivdatenbank können darauf zurückgeführt werden, dass letztere auch Datumsangaben enthalten, die generell stark zur Endungslosigkeit tendieren und das häufigste Muster im Zusammenhang mit Monatsnamen darstellen. Diese Beobachtung zeigt überdies, dass Empfehlungen zur Realisierung des Genitivs bei Monatsnamen in deskriptiven Grammatiken des Deutschen den syntaktischen Kontext stärker berücksichtigen sollten. 195 Im Zusammenhang mit dem Flexionsverhalten eigennamenähnlicher Nomina haben wir neben den Bezeichnungen für Wochentage und Monate auch die Genitivformen von Stil- und Epochenbezeichnungen 195 Die Wahl der Genitivmarkierung wird bei Monatsnamen möglicherweise auch von der Präsenz einer nachgestellten Jahreszahl beeinflusst. Der Effekt zugunsten einer endungslosen Realisierung scheint allerdings weit weniger stark als bei Datumsangaben zu sein. So hat eine COSMAS -Recherche (Archiv W-gesamt, DeReKo- 2014-II) für das Muster des Dezember(s) 1999 ... 2014 19 s-Genitive und 13 endungslose Formen ergeben. Von einer genaueren Untersuchung der Häufigkeitsverhältnisse haben wir aber an dieser Stelle abgesehen. Normgerechte Formen der Endungslosigkeit 217 untersucht, bei denen der aktuellen Duden-Grammatik zufolge „Genitivformen mit und ohne Endung standardsprachlich zulässig sind“ (2009, S. 202). Dabei haben wir uns auf 55 Ausdrücke (Barock, Biedermeier, Jazz, Blues etc.) konzentriert, deren Genitivvarianten wir mithilfe einer manuell erstellten Liste aus dem Korpus extrahiert haben (vgl. http: / / hypermedia.ids-mannheim.de/ db/ liesmich.txt für weitere Informationen). Die Ergebnisse sind in der folgenden Tabelle niedergelegt: 196 Nullendung Apostroph overte Markierung Token insgesamt Stil- und Epochenbezeichnungen 5.910 (43,7%) 1 (< 0,01%) 7.612 (56,3%) 13.523 reg. Appellativa 52.938 (1,7%) 34 (0,001%) 3.031.047 (98,3%) 3.084.018 Tab. 34: Häufigkeit endungsloser Formen: Stil- und Epochenbezeichnungen vs. reguläre Appellativa Wie aus Tabelle 34 hervorgeht, ist der Anteil endungsloser Formen bei Stil- und Epochenbezeichnungen mit über 40% auffällig hoch. 197 Man kann also feststellen, dass die Einschätzung der aktuellen Duden- Grammatik, beide Formvarianten seien hier gleichermaßen zulässig, zuzutreffen scheint. Bei näherer Betrachtung wird jedoch auch deutlich, dass sich die einzelnen Nomina nicht einheitlich verhalten, und dass die Tendenz zur Endungslosigkeit - wie bereits mehrfach festgestellt - offensichtlich durch weitere Faktoren beeinflusst bzw. verstärkt wird. So treten Stilbezeichnungen auf s-Auslaut wie Jazz oder Blues ausschließlich endungslos auf, während bei Barock (811x Null, 210x -s), Biedermeier (119x Null, 40x -s) oder Jugendstil (10x Null, 383x -s) mehr Variation zu beobachten ist bzw. teilweise die endungslose Variante in den Hintergrund rückt. Es zeigt sich also auch hier wieder, dass die Tendenz zur Endungslosigkeit durch das Zusammentreffen mehrerer relevanter Faktoren (bis hin zur Ausnahmslosigkeit) verstärkt wird. 196 Nicht berücksichtigt wurden fehlerhafte Zuordnungen bei vermeintlich endungslosen Belegen, denen ein weiteres Nomen direkt nachfolgt (meist Komposita oder komplexe Namen wie des Montreux Jazz Festivals, des Jazz Clubs, des Gospel Chors etc., insgesamt 239 Fälle). 197 Der relevante Wert des Pearson Residuums liegt bei 352,69, d.h., die Abweichung von der erwarteten Häufigkeit ist hochsignifikant. Endungslose Genitive 218 3.3.2.3 Fremdwörter Auch bei Fremdwörtern (nach Abzug der Lemmata, die gleichzeitig als Eigennamen eingestuft werden) besteht eine wesentlich größere Tendenz zur Nullendung als bei (nativen) Appellativa. Die folgende Tabelle enthält als Vergleichswerte zum einen alle Korpusbelege, die keine Fremdwörter sind, und zum anderen wiederum die Gruppe der sog. „regulären Appellativa“, also die Menge der (nativen) Nomina, die keine der Eigenschaften aufweisen, die nach unserer Auffassung eine Nullmarkierung des Genitivs begünstigen (vgl. Kap. 3.3.1.1): Nullendung Apostroph overte Markierung Token insgesamt Fremdwort 82.765 (20%) 0 331.365 (80%) 414.130 kein Fremdwort 198 377.415 (5,2%) 10.568 (0,1%) 6.870.398 (94,7%) 7.258.381 reg. Appellativa 52.938 (1,7%) 34 (0,001%) 3.031.047 (98,3%) 3.084.018 Tab. 35: Häufigkeit endungsloser Formen: Fremdwörter (ohne Eigennamen) vs. reguläre Appellativa Auf den ersten Blick scheint der Effekt, den der Faktor ‘Fremdwort’ auf die Wahl der Genitivmarkierung hat, sogar stärker zu sein als der Faktor ‘Eigenname’. 199 Diese erste Einschätzung relativiert sich, wenn man die Menge der Fremdwörter auf s-Laut abzieht, die, wie wir bereits wissen, obligatorisch endungslos erscheinen und darüber hinaus äußerst häufig sind (siehe Tab. 36 unten). Tabelle 36 scheint zunächst nahe zu legen, dass der Faktor ‘Endung auf s-Laut’ bei Fremdwörtern ein wesentlich größeres Gewicht hat, während der Faktor ‘Fremdwort’ für sich genommen weniger wirksam ist. Zwar liegt der Anteil an Nullendungen immer noch deutlich höher als bei den regulären (d.h. nativen) Appellativa; das Gros der endungslo- 198 D.h., die Menge von Tokens, für die gilt, dass Fremdwort = 0. Die „regulären Appellativa“ sind somit eine Teilmenge dieser Menge. 199 Eine Schätzung der (standardisierten) Abweichungen von den erwarteten Häufigkeiten ergibt für die Kombination ‘Fremdwort/ Nullendung’ (in Relation zu den Verhältnissen bei regulären Appellativa) einen sehr hohen Wert von 526,24 (Pearson Residuum). Normgerechte Formen der Endungslosigkeit 219 sen Fälle resultiert aber aus einer Kombination mit phonologischen Faktoren. 200 Bei der Interpretation dieses Befundes ist allerdings zu bedenken, dass Fremdwörter auf -us zu den Wörtern gehören, die am häufigsten endungslos auftreten. Die Nichtberücksichtigung dieser Klasse von obligatorisch endungslosen Fremdwörtern, die immerhin 77% aller endungslosen Formen bei Fremdwörtern ausmachen, beeinflusst das auf Tokenhäufigkeit basierende Ergebnis in Tabelle 36 offensichtlich sehr stark. Die Frage, wie der Faktor ‘Fremdwort’ relativ zu phonologischen Faktoren gewichtet werden muss, kann jedoch innerhalb der vorliegenden Pilotstudie nicht abschließend geklärt werden. Klar scheint jedoch zu sein, dass phonologische Faktoren wie ‘s-Auslaut’ ihre Wirkung nur dann entfalten, wenn der Faktor Fremdwort vorliegt. Dieses Abhängigkeitsverhältnis scheint für die hierarchische Gliederung zu sprechen, die in Abbildung 45 vorgenommen wurde. Nullendung Apostroph overte Markierung Token insgesamt Fremdwörter 19.034 (5,4%) 0 330.370 (94,6%) 349.404 reg. Appellativa 52.938 (1,7%) 34 (0,001%) 3.031.047 (98,3%) 3.084.018 Tab. 36: Häufigkeit endungsloser Formen: Fremdwörter (ohne Eigennamen und Auslaut auf <s, x, z>) vs. reguläre Appellativa 3.3.2.4 Zeitausdrücke Die Kodierung ‘Zeitausdruck’ deckt eine Vielzahl heterogener Fälle ab, die sich nicht ohne Weiteres auseinanderhalten lassen (u.a. Wochentage, Monatsnamen, substantivierte Temporaladverbien etc.). Da der Vergleich mit der Menge der Nicht-Zeitausdrücke sowie der „regulären“ Appellativa aber dennoch hochsignifikant (Chi-Quadrat- Test: p = 0,0004998; Pearson Residuen für die Häufigkeiten der verschiedenen Endungsvarianten bei Zeitausdrücken (gegenüber regulären Appellativa): Nullendung: 327,4; Apostroph: 96,72; overte Mar- 200 Die Berechnung der Pearson Residuen ergibt immer noch eine sehr signifikante Abweichung von den erwarteten Häufigkeiten (in Relation zu den Verhältnissen bei regulären Appellativa). So liegt der Wert für die Kombination ‘Fremdwort/ Nullendung’ nach Abzug der Fremdwörter auf s-Laut bei 136,82. Endungslose Genitive 220 kierung: -47,58) ausfällt, soll auch diese Kategorie hier Erwähnung finden. Zur genaueren Einschätzung der Einzelfälle müssten noch weiterführende Untersuchungen erfolgen, die allerdings feinkörnigere Unterscheidungen bei der Annotation des Korpus voraussetzen (bzw. auf alternative semiautomatische Methoden wie Listen etc. aufbauen könnten). Nullendung Apostroph overte Markierung Token insgesamt Zeitausdruck 9.806 (25,8%) 145 (0,4%) 28.082 (73,8%) 38.032 kein Zeitausdruck 457.915 (6,5%) 10.421 (0,1%) 6.540.068 (93,3%) 7.008.404 reg. Appellativa 52.938 (1,7%) 34 (0,001%) 3.031.047 (98,3%) 3.084.018 Tab. 37: Häufigkeit endungsloser Formen: Zeitausdrücke vs. Appellativa 3.3.2.5 Konversion Die Untersuchung des Flexionsverhaltens von Konversionen wird dadurch erschwert, dass die uns zur Verfügung stehende Annotation nur relativ grobe Schnitte zulässt. Dies ist insofern bedauerlich, als wir bereits festgestellt haben, dass sich verschiedene Typen von Substantivierungen hinsichtlich der Wahl des Genitivallomorphs z.T. stark unterscheiden (vgl. Kap. 3.3.1.2). Für die Liste von Substantivierungen, die wir manuell erstellt haben, ergibt sich folgendes Ergebnis: Nullendung Apostroph overte Markierung Token insgesamt Konversion 389 (5,3%) 0 6.949 (94,7%) 7.338 keine Konversion 467.332 (6,6%) 10.566 (0,2%) 6.561.201 (93,2%) 7.039.099 reg. Appellativa 52.938 (1,7%) 34 (0,001%) 3.031.047 (98,3%) 3.084.018 Tab. 38: Häufigkeit endungsloser Formen: Konversionen vs. Appellativa Normgerechte Formen der Endungslosigkeit 221 Auf den ersten Blick scheint der Faktor ‘Konversion’ nur einen geringen Effekt auf den Anteil der Nullendungen zu haben. Dies ist allerdings auf das bereits erwähnte Problem zurückzuführen, dass aufgrund der inkonsistenten Zuordnung des Merkmals ‘Konversion’ die Zahl der endungslosen Formen zu niedrig ausfällt: Offenbar sind bestimmte Konversionen nur z.T. als solche annotiert, wodurch das Ergebnis der Korpusrecherche beeinträchtigt wird. So tritt Nichts im Korpus 375x endungslos auf; davon werden aber nur 118 Einträge unter dem Merkmal ‘Konversion’ geführt. Nach einer manuellen Bereinigung der inkonsistent annotierten Fälle ergibt sich das folgende Bild: Nullendung Apostroph overte Markierung Token insgesamt Konversion 742 (9,6%) 2 (0,03%) 6.984 (90,4%) 7.728 keine Konversion 466.979 (6,6%) 10.564 (0,2%) 6.561.166 (93,2%) 7.038.709 reg. Appellativa 52.938 (1,7%) 34 (0,001%) 3.031.047 (98,3%) 3.084.018 Tab. 39: Häufigkeit endungsloser Formen: Konversionen vs. Appellativa Es zeigt sich, dass der Faktor ‘Konversion’ durchaus die Verwendung der Nullendung begünstigt (Pearson Residuum: 52,47). Betrachtet man lediglich die Häufigkeiten, scheint der Faktor ‘Konversion’ sogar wirksamer zu sein als der Faktor ‘Fremdwort’ (allerdings müsste diese Aussage noch genauer mithilfe inferenzstatistischer Methoden überprüft werden). Überdies steht zu erwarten, dass in bestimmten Teilmengen der relevanten Substantivierungen der Effekt noch stärker ausfällt. So haben wir bereits in Kapitel 3.3.1.2 (Tab. 23) gesehen, dass sich Konversionen bei der Wahl des Genitivallomorphs nicht einheitlich verhalten: Während z.B. bei Konversionen auf s-Auslaut (Nichts) und bestimmten Zeitausdrücken (Heute, Gestern, Jetzt) die Genitivendung stets ausfällt, halten sich bei anderen Lemmata (Selbst, Ja, Nein) endungslose und overt markierte Formen die Waage. Um das Flexionsverhalten unterschiedlicher Teilklassen von Konversionen näher untersuchen zu können, haben wir auf ein kleineres Teilkorpus zugegriffen, das zusätzliche Informationen über die Quellwortart der Konversion enthält (auf der Basis der CELEX -Datenbank). Endungslose Genitive 222 Aufgrund der deutlich geringeren Lemmaanzahl und Gesamtdatenmenge fallen die absoluten Zahlen allerdings recht klein aus, sodass Vergleiche mit anderen Korpusbefunden nur bedingt möglich sind. Für Substantive, die mittels Konversion aus nicht-flektierbaren Wortarten abgeleitet sind, ergeben sich im Rahmen der CELEX -Daten die folgenden Zahlen: Nullendung Apostroph overte Markierung Token insgesamt Konversionen 258 (20,8%) 0 983 (79,2%) 1.241 Tab. 40: Häufigkeit endungsloser Formen: Konversionen aus nicht-flektierbaren Wortarten ( CELEX Datenbank) Noch deutlicher fällt der Effekt bei Substantivierungen auf der Basis pronominaler Elemente aus (z.B. des Ich). Hier sind die endungslosen Formen sogar deutlich in der Überzahl: Nullendung Apostroph overte Markierung Token insgesamt Konversionen 137 (69,5%) 0 60 (30,5%) 197 Tab. 41: Häufigkeit endungsloser Formen: Konversionen aus pronominalen Elementen (CELEX Datenbank) Ergänzend haben wir für eine bestimmte Gruppe von Konversionen - Farbwörter -, über die in der Literatur teils sehr heterogene Aussagen gemacht werden, noch eine ergänzende Stichprobe gezogen. Dabei waren wir allerdings mit dem Problem konfrontiert, dass für eine Reihe von Farbwörtern (z.B. Schwarz, Weiß, Grün) keine relevanten Daten in der Genitivdatenbank enthalten sind, da sie offenbar vom Tagger nicht korrekt als Nomina erkannt und daher im Rahmen der maschinellen Lemmatisierung nicht erfasst wurden. Aus diesem Grund haben wir die Lücken in Tabelle 42 durch eine COSMAS -Recherche ergänzt (markiert durch ein hochgestelltes „†“; gesucht wurde jeweils des/ eines+Farbwort, W-gesamt, DeReKo-2013-I, 18.9.2013). Der Anteil endungsloser Varianten bei (durch Konversion gebildeten) Farbwörtern liegt im Durchschnitt zwischen ca. 30% und 40%. Ausreißer sind dabei zum einen die overt markierten Genitivformen von Grün (lediglich 3,2% Nullendungen), zum anderen endungslose Formen von Schwarz (100% Nullendungen) bzw. Weiß (94,1% Nullendun- Normgerechte Formen der Endungslosigkeit 223 gen). Bei Letzteren steht die Tendenz zur endungslosen Realisierung des Genitivs wohl in Verbindung mit Vorliegen eines s-Auslauts; die große Zahl von Bildungen auf -s bei Grün ist bei näherer Betrachtung darauf zurückzuführen, dass es sich bei der überwiegenden Zahl der Belege tatsächlich nicht um Farbwörter, sondern um appellativische Formen (in der Regel mit Bezug auf Pflanzen, Rasen u.ä.) handelt, vgl. (18). Nullendung Apostroph overte Markierung Token insgesamt Blau 12 (40%) 0 18 (60%) 30 Gelb 2 (28,6%) 201 0 5 (71,4%) 7 Grün † 14 (3,2%) 0 427 (96,8%) 441 Rot 12 (42,9%) 0 16 (57,1%) 28 Schwarz † 34 (100%) 0 0 34 Weiß † 32 (94,1%) 1 (2,9%) 1 (2,9%) 34 Tab. 42: Häufigkeit endungsloser Formen: Konversionen vs. Appellativa (18) Er wirkte wie eine Kopie von Weltstar Lionel Messi (25). Beide harmonierten großartig auf dem katalanischen Rasen - und verstehen sich auch abseits des Grüns bestens. Kein Wunder: Die Ur-Urgroßväter der beiden Kicker waren Brüder. (Hamburger Morgenpost, 7.5.2013, S. 30, 31, Ressort: Sport; Arnesen und Fink in Mailand Geheimtreffen mit Messis Kumpel Sportchef und Trainer werben um Bojan Krkic. Ehemaliger BarÇa Star soll beim HSV Nachfolger von Heung Min Son werden) Der Anteil an Nullendungen bei Farbwörtern steht nicht im Einklang mit der in der Duden-Grammatik vertretenen Auffassung, dass „[b]ei den substantivischen Farbbezeichnungen das Genitiv-s nach den traditionellen standardsprachlichen Normen obligatorisch [ist]“ (2009, S. 350). Bei Schwarz und Weiß räumt der Zweifelsfälle-Duden zwar ein, dass eine endungslose Realisierung des Genitivs eine Option darstellt (2007, S. 304); nach unseren Erkenntnissen ist der Wegfall der Genitiv- 201 Auch für die in Tabelle 42 aufgeführten Befunde gilt, dass die Zahl der relevanten Belege durch den eingeschränkten Recall nicht unbedingt repräsentativ ist. So hat eine COSMAS -Recherche (W-gesamt, DeReKo-2013-I) allein 14 endungslose Formen für des/ eines Gelb ergeben. Endungslose Genitive 224 endung hier allerdings bereits fast obligatorisch (eine entsprechende COSMAS -Recherche förderte lediglich eine (! ) Ausnahme zutage). 202 Interessanterweise ändert sich das Bild, wenn man (gängige) Komposita betrachtet, die als Letztglied ein Farbwort enthalten. Hier scheint wesentlich weniger Variation vorzuliegen. So tritt bei den Komposita Abendrot (53x im Korpus) und Morgenrot (33x im Korpus) ausschließlich die s-Endung auf. Eine mögliche Erklärung für diesen Kontrast könnte durch die Annahme verfügbar werden, dass gängige Komposita als fertige lexikalische Formen im mentalen Lexikon zusammen mit der Wortartinformation gespeichert werden. Dadurch wird der ursprüngliche Konversionscharakter von Rot überschrieben und „unkenntlich“ gemacht. 3.3.2.6 Interaktion von Faktoren Unsere Untersuchungen haben gezeigt, dass ein Übergewicht endungsloser Varianten in der Regel das Resultat eines Zusammentreffens mehrerer Faktoren ist, die Endungslosigkeit begünstigen. 203 Im Folgenden möchten wir entsprechende kumulative Effekte im Zusammenhang mit der Genitivmarkierung von Eigennamen näher betrachten. 204 202 Neben dem bereits erwähnten Einfluss des Stammauslauts scheint die Wahl der Genitivmarkierung auch von syntaktischen Faktoren abhängig zu sein. So lassen sich auch hier wieder Fälle finden, in denen das Vorliegen eines weiteren Genitivattributs einen Wegfall des Genitivs bewirken zu scheint (vgl. Appel 1941): (a) Die Farben der Saxonia „rot-weiß-grün“ sind eine Vereinigung der Farben des westfälischen und des rheinischen Wappens; des Rot und Weiß Westfa- lens und des Grün und Weiß des Rheinlandes. (V.K.D.St. Saxonia Münster, In: Wikipedia: http: / / de. wikipedia.org/ wiki/ V.K.D.St._Saxonia_Münster: Wikipedia, 2011) Alternativ könnte man das Ausbleiben der Flexionsendung bei Rot und Grün auf einen Symmetrieeffekt zurückführen, der bewirkt, dass beide Glieder eines Konjunkts unflektiert bleiben, wenn eines davon keine Flexionsendung tragen kann (im vorliegenden Fall Weiß). 203 Wie bereits ausführlich diskutiert, stellen Abkürzungen eine Ausnahme dar (vgl. Tab. 21 und die dazugehörige Diskussion), da sie unabhängig vom Auslaut eine sehr starke Neigung zur Endungslosigkeit aufweisen. 204 Eine Aufarbeitung der folgenden Befunde mithilfe fortgeschrittener statistischer Methoden (Effektstärkenschätzung, Regressionsanalysen etc.) steht bislang noch aus. Normgerechte Formen der Endungslosigkeit 225 Eigennamen auf Sibilant Wir haben bereits festgestellt, dass Eigennamen, die auf Sibilant enden, den Genitiv überwiegend endungslos realisieren. Allerdings wäre hier eine feinkörnigere Unterscheidung zwischen Personennamen und geografischen Namen wünschenswert, da bekannt ist, dass letztere weniger stark zur Endungslosigkeit neigen. Auf der Basis der in unserer Datenbank enthaltenen Informationen können wir evtl. einen Teil der Personennamen ausschließen, indem wir die Fälle, in denen unmittelbar ein weiteres Nomen folgt, nicht berücksichtigen, da Personennamen, nicht aber z.B. geografische Namen, als Genitivattribut bevorzugt dem Kopfnomen vorangehen (vgl. Kap. 3.3.1.1, Tab. 19). Es ergeben sich die folgenden Zahlen: Nullendung Apostroph sonstige Markierungen Token insgesamt Eigenname auf s-Laut insgesamt 62.241 (73,4%) 9.361 (11%) 13.197 (15,6%) 84.799 Eigenname auf s-Laut ohne nachfolgendes Nomen 54.481 (77,3%) 4.255 (6,1%) 11.757 (16,6%) 70.493 Tab. 43: Häufigkeit der Nullendung bei Eigennamen auf s-Laut Wie aus Tabelle 43 hervorgeht, erscheinen über 70% der Eigennamen auf s-Laut im Korpus ohne Genitivendung. Wenn man dabei ausschließlich Fälle ohne nachfolgendes Nomen betrachtet (negativer Wert für das Kriterium ‘NNPost’), so verändert dies vor allem den Anteil der Nullendungen auf Kosten der Fälle mit Apostroph, das primär bei Personennamen als Auslassungssignal Verwendung findet. Allerdings haben wir es hier immer noch mit über 4000 Belegen mit Apostroph zu tun. Dies ist z.T. auf eine fehlerhafte Erkennung des Genitivs (z.B. Namensbestandteile wie d’ oder l’) zurückzuführen. Bei der überwiegenden Zahl der Apostroph-Fälle handelt es sich aber um Personennamen auf s-Laut, denen eine Kombination von Adjektiv und Nomen nachfolgt (z.B. Hingis’ gute Laune), die nicht als Nominalphrase erkannt wird. Dies zeigt, dass ein positiver Wert für das Kriterium ‘NNPost’ zwar für die Identifikation von Personennamen herangezo- Endungslose Genitive 226 gen werden kann (vgl. Kap. 3.3.1.1, Tab. 19), umgekehrt ist es aber nicht ohne Weiteres möglich, über einen negativen Wert für ‘NNPost’ Personennamen zuverlässig herauszufiltern, um auf diese Weise Aufschlüsse über das abweichende Flexionsverhalten anderer Namenstypen zu erhalten. Ferner stellt sich die Frage, wie sich die recht große Zahl overter Markierungen (> 11.000 Fälle, 16,6%) erklären lässt. Vor dem Hintergrund unserer bisherigen Erkenntnisse würde man erwarten, dass die Kombination von lexikalischen und phonologischen Faktoren bei Eigennamen auf s-Laut zu systematischer Endungslosigkeit (inkl. Markierung durch Apostroph) führen sollte. Eine nähere Betrachtung der s-markierten Formen zeigt aber, dass es sich bei den overt markierten Formen offenbar in erster Linie um fehlerhafte Daten handelt. So wird bei Wortformen mit Doppel-s am Wortende (überwiegend Fehlschreibungen) das finale -<s> oft fälschlich als Flexionselement eingestuft. Darunter finden sich hier viele Fälle, in denen ein offensichtliches Appellativum als Eigenname behandelt wird (920x Erkenntniss, 644x Kenntniss, 408x Maass, 160x Knauss, 152x Verständniss, 119x Riess, 49x Unkenntniss etc.). Der tatsächliche Anteil der Nullendungen dürfte also tatsächlich wesentlich höher liegen. Eigennamen und Grad der Integration Wie bereits erwähnt, vertritt Nübling (2012) die Hypothese, dass es einen Zusammenhang gibt zwischen der Geläufigkeit/ Häufigkeit eines Namens und der Wahl der Genitivmarkierung. Dies prognostiziert u.a., dass Fluktuationen in der Häufigkeit des Namens einen Einfluss haben sollten auf die Distribution der Nullendung. Mit anderen Worten, wir erwarten, dass ein häufigerer Gebrauch eines Namens eine stärkere Integration in das Flexionssystem bewirken kann, was sich u.U. in einer häufigeren Verwendung der s-Endung manifestiert. Um diese Prognose zu testen, haben wir das Flexionsverhalten zweier geografischer Namen, Iran und Irak, im Zeitraum zwischen 1985 und 2009 näher untersucht, vgl. Tabelle 44. In dieser Stichprobe scheint ein z.T. massiver Anstieg der Häufigkeit von (Genitivformen von) Iran und Irak mit einer stetigen Abnahme des Anteils von endungslosen Genitiven einherzugehen. Diese Entwicklung wird durch Abbildung 52 verdeutlicht. Normgerechte Formen der Endungslosigkeit 227 Jahr Iraks Irak Irans Iran 1985-1989 42 (48,8%) 44 (51,2%) 71 (62,3%) 43 (37,7%) 1990-1994 332 (56,4%) 257 (43,6%) 73 (75,3%) 24 (24,7%) 1995-1999 438 (60,3%) 288 (39,7%) 403 (79,6%) 103 (20,4%) 2000-2004 1.682 (69,4%) 742 (30,6%) 386 (82,5%) 82 (17,5%) 2005-2009 819 (72,2%) 316 (27,8%) 1.316 (80,8%) 312 (19,2%) Tab. 44: Verhältnis Nullendung vs. s-Endung bei zunehmender Token-Häufigkeit Abb. 52: Entwicklung endungsloser und overt markierter Genitive von Iran und Irak relativ zur Gesamthäufigkeit im Korpus Abbildung 52 zeigt, dass bei zunehmender Lemma-Häufigkeit im Korpus die Anzahl der s-markierten Genitive stärker ansteigt als die Anzahl der endungslosen Formen. Während zu Beginn der Messperiode die Anteile von overt markierten und endungslosen Formen noch recht eng beieinander liegen, so klaffen sie am Ende (Jahre 2005-2009) deutlich auseinander. Diese diachrone Entwicklung könnte als Hinweis darauf verstanden werden, dass zumindest bei geografischen Namen das Verhältnis von Nullendung und s-Endung tatsächlich von der Geläufigkeit des Ausdrucks abhängig ist. Eine inferenzstatistische Endungslose Genitive 228 Analyse der Zahlen in Tabelle 44 zeigt allerdings, dass das Gesamtbild tatsächlich etwas weniger eindeutig ist, als der erste Eindruck vermuten lässt. Zwar liegt eine generelle Entwicklung vor, die in beiden Fällen dazu führt, dass die Nullendung an Boden verliert. Wie die folgende Tabelle 45 und die Assoziationsplots in Abbildung 53 und 54 zeigen, verhalten sich die beiden Lemmata aber nicht identisch. Bei der Iraks/ Irak-Alternation ist der entsprechende Effekt insgesamt stärker und führt schließlich zu einer signifikanten Abweichung (Betrag größer als 1,96) von den erwarteten Häufigkeiten zugunsten der overten Markierung. Für das Lemma Iran hingegen lässt sich lediglich konstatieren, dass ursprünglich eine signifikante Abweichung zugunsten der Nullendung vorgelegen hat, die sich nach und nach abschwächt. Für die einzelnen diachronen Schnitte kann allerdings keine statistisch signifikante Präferenz für die s-Endung festgestellt werden: Jahr Iraks Irak Irans Iran 1985-1989 −2,04 2,89 −2,11 4,21 1990-1994 −3,1 4,39 −0,52 1,03 1995-1999 −2,13 3,02 −0,08 0,15 2000-2004 1,56 −2,22 0,61 −1,22 2005-2009 2,21 −3,14 0,4 −0,8 Tab. 45: Verhältnis von Nullendung und s-Endung bei diachron zunehmender Token-Häufigkeit: Pearson-Residuen Wir können also festhalten, dass bei näherer Betrachtung der Zusammenhang zwischen Geläufigkeit und Zunahme der s-Endung weniger eindeutig ausfällt, als die Zahlen in Tabelle 44 zunächst suggerieren. Für eine zuverlässige Evaluierung der Hypothesen von Nübling (2012) müssen also offenbar noch umfangreichere Untersuchungen durchgeführt werden. Normgerechte Formen der Endungslosigkeit 229 Abb. 53: Assoziationsplot: Abweichungen von den erwarteten Häufigkeiten der Endungsvarianten bei Irak (diachrone Entwicklung) Abb. 54: Assoziationsplot: Abweichungen von den erwarteten Häufigkeiten der Endungsvarianten bei Iran (diachrone Entwicklung) Endungslose Genitive 230 3.3.2.7 Fazit: Variante Fälle Im Rahmen dieses Teilkapitels haben wir eine Reihe von Faktoren untersucht, die eine endungslose Realisierung des Genitivs günstig beeinflussen, aber i.d.R. nicht zu obligatorischer Endungslosigkeit führen. Vor dem Hintergrund der uns im Rahmen unserer Genitivdatenbank zur Verfügung stehenden Informationen haben wir dabei quantitative Daten erhoben zum Flexionsverhalten von Eigennamen, ausgewählten eigennamenähnlichen Ausdrücken (Wochentage, Monatsnamen sowie Stil- und Epochenbezeichnungen), Fremdwörtern, Zeitausdrücken und Konversionen. Es hat sich zum einen gezeigt, dass die einzelnen Faktoren (bzw. Nominaltypen) die Wahl des Genitivallomorphs in unterschiedlicher Weise beeinflussen. So tendieren Monatsnamen bereits von sich aus (vermutlich aufgrund ihrer Eigennamennähe) generell stärker zur Endungslosigkeit, während der Faktor ‘Fremdwort’ nur in Zusammenhang mit weiteren Faktoren wie Art des Auslauts oder Individualisierung/ Nennfunktion seine Wirksamkeit entfaltet. Analoge kumulative Effekte lassen sich innerhalb einzelner Teilklassen von Nomina nachweisen, deren Einzelelemente sich oft nicht einheitlich verhalten. So gilt für Farbwörter (Schwarz, Weiß) und Monatsnamen (März), dass das Vorliegen eines s-Auslauts zu obligatorischer Endungslosigkeit führt. Überdies haben wir beobachten können, dass die Wahl des Genitivallomorphs auch vom morphosyntaktischen Kontext abhängig sein kann: Bei Monatsnamen scheint die Kombination eines Genitivartikels mit einem Monatsnamen die s-Endung zu begünstigen, während in Datumsangaben fast ausschließlich die Nullmarkierung auftritt. Ferner hat die Untersuchung von diachronen Veränderungen der Genitivmarkierung von (fremdsprachlichen) geografischen Namen (Iran/ Irak) einen Hinweis darauf geliefert, dass Fluktuationen, die den Gebrauch (d.h. die Häufigkeit) eines Nomens betreffen, die Wahl des Genitivallomorphs beeinflussen können (vgl. die Hypothese von Nübling 2012, dass bei Eigennamen die Geläufigkeit/ Integration eines Nomens das Flexionsverhalten beeinflusst). Allerdings existieren auch Fälle, in denen einzelne Elemente einer Klasse ein abweichendes Verhalten aufweisen, ohne dass dafür auf den ersten Blick eine einleuchtende Erklärung gegeben werden kann. So tendieren die Monatsnamen Mai, Juni, Juli generell stärker zur Nullmarkierung des Genitivs als die Monatsnamen auf -(e/ a)r, und Sonntag erscheint wesentlich häufiger mit Genitiv-s als die anderen Wochentage. Normgerechte Formen der Endungslosigkeit 231 Aus methodischer Sicht sind vor allem zwei Aspekte hervorzuheben. Zum einen hat sich gezeigt, dass bei den hier bearbeiteten, vergleichsweise niederfrequenten Phänomenen die Datenbasis in der Genitivdatenbank teilweise zu schmal ist (fehlende Lemmata, z.T. geringe Anzahl an Belegen). 205 Darüber hinaus treten vereinzelt Schwächen bei der Präzision (fehlerhafte Zuordnung der Wortart etc.) auf, die zwar überwiegend auf Unzulänglichkeiten der vorliegenden (automatischen) Annotierung zurückzuführen sind, aber wenigstens z.T. auch - wie bei den vermeintlichen Eigennamen auf -ss, bei denen das zweite -s fälschlich als Genitivendung eingestuft wird - Eigenschaften des bei der Extraktion verwendeten Skripts zu betreffen scheinen. Wir haben versucht, diese Probleme durch ergänzende empirische Methoden wie manuell korrigierte Stichproben aus der Genitivdatenbank sowie COSMAS -Recherchen teilweise zu umgehen, um zu einigermaßen belastbaren Resultaten zu gelangen. Es gibt allerdings Gründe, die dafür sprechen, dass dieses Vorgehen kein Modell für zukünftige Untersuchungen darstellt. So sind manuelle Korpusanfragen mit einem enormen Aufwand verbunden (Auffinden geeigneter Kontexte/ Muster, Formulierung von Korpusanfragen, manuelle Nachkontrolle etc.); darüber hinaus liefern sie aufgrund der Tatsache, dass sie in der Regel auf bestimmte Muster (wie z.B. des/ eines+N) beschränkt sind, typischerweise nur einen kleinen Ausschnitt des zu untersuchenden Phänomens. Eine vollständige Extraktion aller relevanten Daten und Kontexte (wie sie z.B. in der Genitivdatenbank für starke Formen vorliegt) ist in den meisten Fällen auf diese Weise nicht möglich. Zum anderen haben wir festgestellt, dass die vorliegende Annotation hinsichtlich der Unterscheidung verschiedener Teilklassen von Nomina nicht feinkörnig genug ist, um das Flexionsverhalten bestimmter (niederfrequenter) Nominaltypen (verschiedene Arten von Eigennamen, Konversionen, eigennamenähnlichen Ausdrücke etc.) genauer untersuchen zu können. Eine präzisere Annotation, die detaillierte lexikalische und morphologische Informationen enthält, stellt also wei- 205 Die an einigen Stellen beobachteten zahlenmäßigen Diskrepanzen zwischen den Inhalten der Genitivdatenbank und den Ergebnissen relevanter COSMAS -Recherchen lassen sich womöglich zumindest teilweise darauf zurückführen, dass das Extraktionsskipt nur Formen berücksichtigt hat, die vom Tagger eindeutig als Nomen klassifiziert werden, während eine COSMAS -Recherche keinerlei Einschränkungen dieser Art unterliegt (Sandra Hansen-Morath, persönliche Kommunikation). Endungslose Genitive 232 terhin ein Desiderat dar. Dennoch möchten wir festhalten, dass die auf diese Weise gewonnenen quantitativen Befunde in ihrer Detailliertheit und empirischen Fundierung über entsprechende Angaben in der gängigen Grammatikschreibung hinausgehen. Darüber hinaus gibt es auch Bereiche, in denen unsere Ergebnisse so stark von entsprechenden traditionellen Aussagen abweichen, dass eine Reformulierung entsprechender Passagen z.B. in der Duden-Grammatik angezeigt erscheint. Um dies zu illustrieren, haben wir in der folgenden Abbildung 55 eine Auswahl unserer quantitativen Befunde in Relation gesetzt zu Aussagen, die die aktuelle Duden-Grammatik zur relativen Häufigkeit endungsloser Genitivformen macht: Abb. 55: Wegfall des Genitiv-s: Korpusbefunde und quantitative Aussagen in der Duden-Grammatik 2009 Unsere Befunde für Fremdwörter auf -us entsprechen den Aussagen der Duden-Grammatik: Hier erscheinen praktisch ausschließlich endungslose Formen. Bei Eigennamen auf s-Laut unterscheidet die Duden-Grammatik zwischen Eigennamen mit festem Artikel („in der Regel endungslose Formen“) und Personennamen, in denen die Markierung des Genitivs durch Apostroph als schriftsprachliche Standardvariante festgelegt wird. Leider ist es auf der Basis unserer Genitivdatenbank nicht möglich, diese beiden Eigennamentypen zu unterscheiden (vgl. aber die Stichprobe zur Gegenüberstellung von Personennamen und geografischen Namen in Tab. 25 und 26). Darüber hin- Normgerechte Formen der Endungslosigkeit 233 aus haben wir gesehen, dass unsere Daten - vor allem bei den overt markierten Formen - eine Reihe von Fehlern enthalten. Dennoch können wir festhalten, dass in diesem Kontext endungslose Formen dominieren. Bei Eigennamen auf s-Laut, die gleichzeitig fremdsprachlichen Ursprungs sind, ist der Wegfall der Endung obligatorisch (die einzige Ausnahme ist der Personenname Zacharias mit Genitivmarkierung durch Apostroph). Diese Befunde stimmen mit den Aussagen des Dudens weitgehend überein. Dies gilt im Prinzip auch für Abkürzungen; allerdings zeigen unsere Befunde, dass die Genitivendung nicht nur „meist weggelassen“ wird, sondern dass eine Nullrealisierung mit annähernd 95% quasi obligatorisch ist (die Zahlen gehen dabei auf die von uns gezogene Zufallsstichprobe zurück, vgl. Kap. 3.3.1.2). Größere Abweichungen von den Einschätzungen der Duden-Grammatik ergeben sich für Konversionen. Zwar scheinen unsere Befunde die Aussagen über Substantivierungen aus nicht-flektierbaren Quellwortarten zu bestätigen. Ein Blick auf Konversionen auf Pronomenbasis zeigt jedoch, dass hier feinkörnigere Unterscheidungen notwendig sind. Besonders deutlich wird dies im Zusammenhang mit Farbwörtern: Die aktuelle Duden-Grammatik verlangt hier das Genitiv-s, während in unseren Daten die Nullendung sehr robust vertreten ist (zwischen 30% und 40% für Blau, Gelb und Rot; quasi obligatorisch für Schwarz und Weiß). Ebenfalls auffällig ist, dass es Kontexte gibt, in denen die Duden-Grammatik die Zulässigkeit endungsloser Genitive ähnlich bewertet, obwohl die Verhältnisse im Korpus sich zum Teil deutlich unterscheiden. So ist laut Duden der Wegfall der Genitivendung sowohl bei Monatsnamen als auch bei Stil- und Epochenbezeichnungen „standardsprachlich zulässig“. Ein Blick auf die jeweiligen relativen Häufigkeiten zeigt aber, dass endungslose Formen von Monatsnamen im Korpus wesentlich häufiger auftreten (ca. 88%; diese Zahl beinhaltet allerdings auch die besonders häufigen und stark zur Endungslosigkeit tendierenden Datumsangaben). Ein ähnlicher Fall liegt bei unterschiedlichen Typen von Konversionen vor, für die der Duden generell bemerkt, dass sie „teilweise ohne Endung“ auftreten. Tatsächlich ist hier aber ein deutlicher Kontrast zwischen Konversionen aus nichtflektierbaren Quellwortarten und Konversionen aus Pronomina zu beobachten. Endungslose Genitive 234 Wir können also festhalten, dass eine korpusbasierte Untersuchung des aktuellen Sprachgebrauchs nicht nur eine bessere empirische Fundierung gängiger quantitativer Aussagen gewährleistet, sondern darüber hinaus auch eine Neubewertung traditioneller Annahmen zur Verteilung der Genitivallomorphe motiviert - selbst vor dem Hintergrund der Einschränkungen, denen unsere Daten unterliegen. Im Anschluss soll überprüft werden, ob dieser Ansatz auch eine neue Perspektive auf Fälle von Endungslosigkeit ermöglicht, die zwar nicht standardsprachlich anerkannt sind, aber dennoch in der einschlägigen Forschungsliteratur diskutiert werden. 3.4 Nicht-normgerechte Formen der Endungslosigkeit In der Literatur zur Realisierung der Genitivflexion im Deutschen wird wiederholt darauf hingewiesen, dass auch außerhalb des Sonderwortschatzes bei einer Reihe von Nomina/ Kontexten eine Tendenz zum Ausfall der Genitivmarkierung zu beobachten ist. Diese Ausdehnung endungsloser Genitive auf Bereiche des Grundwortschatzes (d.h., Teilklassen der sog. „regulären Appellativa“) ist gängigen Grammatiken des Deutschen zufolge nicht standardsprachlich anerkannt. Im Rahmen unserer Studie haben wir untersucht, inwiefern sich entsprechende Tendenzen im Korpus nachweisen lassen, die möglicherweise eine Überprüfung und Neueinschätzung gängiger Sprachnormen motivieren könnten. Dabei haben wir uns mit der folgenden Auswahl von Nomina befasst, die (neben anderen, standardsprachlich anerkannten Fällen) von Appel (1941) als „Substantive mit labilem -s“ klassifiziert werden: 1) Starke Maskulina auf -en 2) Neutra auf -en 3) Diminutive 4) Verwandtschaftsbezeichnungen 3.4.1 Starke Maskulina auf -en Wie bereits in Kapitel 3.1.2 erwähnt, wird in der Literatur wiederholt festgestellt, dass starke Maskulina auf -en eine Tendenz zum Wegfall der s-Endung aufweisen (vgl. z.B. Appel 1941): Nicht-normgerechte Formen der Endungslosigkeit 235 (19) An einer Ladeluke des Airbus ist ein Teil des Rahmen etwas heller als der Rest. Hier hatte ein Ladefahrzeug den Rahmen gerammt. Also wurde ein längeres Stück aus dem Rahmen herausgeschnitten, ein neues Stück mit Dutzenden von Nieten wieder eingesetzt. (VDI Nachrichten, 5.3.2010, S. 4; Nach nur knapp einem Monat so gut wie neu) (20) Die Nutzung des Boden für Familiengräber ist im Gegensatz zu Reihengräbern nicht gratis: Rund 180 Franken pro 10 Jahre kostet der Quatratmeter auf dem Land. 300 bis 1000 Franken, je nach Lage, auf städtischem Boden. (Zürcher Tagesanzeiger, 12.9.1996, S. 17, Ressort: Region; „Wer will schon einen alten Grabstein? “) Die vorhergesagte Tendenz zur Endungslosigkeit hat sich allerdings im Rahmen unserer Korpusstudie nicht nachweisen lassen. Zwar lassen sich in unseren Daten entsprechende Beispiele wie (19) und (20) finden, wie die folgende Tabelle zeigt, liegt der Anteil von Nullendungen bei den relevanten Nomina aber sogar noch unterhalb des Kontrollwerts für reguläre Appellativa: Nullendung Apostroph overte Markierung Token insgesamt Maskulina auf -en 516 (1%) 0 50.194 (98,9%) 50.710 Sonstige reg. Appellativa 52.422 (1,7%) 34 (0,001%) 2.980.853 (98,3%) 3.033.309 Tab. 46: Häufigkeit endungsloser Formen: Maskulina auf en vs. sonstige Appellativa (Kontrollwert minus der Maskulina auf en) Darüber hinaus haben wir die These (Appel 1941) überprüft, dass bei dieser Nomenklasse die Neigung zum Ausfall der Genitivmarkierung durch die Präsenz eines vorangehenden Adjektivs auf -en verstärkt wird: (21) Ein Modell des geplanten Brunnen wurde gezeigt, und die neue Farbe des Gemeindeamtes, die am ehesten mit „sandgelb“ umschrieben werden kann, wurden von der Bürgermeisterin und Vertretern der Gemeinde begutachtet. Im Juli übersiedelt das Gemeindeamt, im September ist die Eröffnung geplant. (Niederösterreichische Nachrichten, 31.1.2007, S. 39; KURZ NOTIERT ) Endungslose Genitive 236 Die folgende Tabelle 47 zeigt, dass sich auch diese Vermutung nicht bestätigt. Tatsächlich fällt der Anteil der Nullendungen bei Vorliegen eines vorangehenden Adjektivs sogar noch geringer aus als in Tabelle 46. Zudem können wir beobachten, dass offenbar andere Appellativa in diesem Kontext einen leicht höheren Anteil an Nullendungen aufweisen (allerdings sind für diese Berechnung lediglich Eigennamen nicht berücksichtigt worden, sodass der im Vergleich zum Kontrollwert geringfügig höhere Anteil an Nullendungen (3% vs. 1,7%) auch durch andere Faktoren wie z.B. Fremdwortcharakter bedingt sein kann): Nullendung Apostroph overte Markierung Token insgesamt Maskulinum auf -en (+ vorangehendes Adjektiv) 57 (0,5%) 0 11.065 (99,5%) 11.122 Sonstige Appellativa (+ vorangehendes Adjektiv) 37.325 (3%) 15 (0,001%) 1.198.991 (97%) 1.236.331 Sonstige reg. Appellativa 52.422 (1,7%) 34 (0,001%) 2.980.853 (98,3%) 3.033.309 Tab. 47: Häufigkeit endungsloser Formen: Maskulinum auf en (+ vorangehendes Adjektiv) vs. sonstige Appellativa (Kontrollwert minus der Maskulina auf en) Wir können also festhalten, dass sich in unserem Korpus bei Maskulina auf -en keine Neigung zur Endungslosigkeit nachweisen lässt, auch nicht in Kombination mit einem vorangehenden attributiven Adjektiv. 3.4.2 Neutra auf -en Ähnliche Beobachtungen lassen sich für das Flexionsverhalten von Substantivierungen auf -en machen. Auch hier wird in der Literatur zuweilen die Auffassung vertreten, dass entsprechende Neutra (insbesondere Nominalisierungen von Verben wie Schlafen, Saufen etc.) zum Wegfall der Genitivendung neigen. Tatsächlich lassen sich einschlägige Beispiele im Korpus finden: (22) Am Sonntagabend hatte er noch glaubhaft versichert, eine Fortsetzung des Rennen sei für ihn sehr unwahrscheinlich. (St. Galler Tagblatt, 22.7.1997, Ressort: TB-SPO (Abk.); Grosser Sieg des Jammerers) Nicht-normgerechte Formen der Endungslosigkeit 237 Eine Untersuchung des Flexionsverhaltens von nicht-maskulinen Nomina auf -en auf der Basis unserer Genitivdatenbank zeigt aber, dass es sich bei Beispielen wie (22) offenbar nur um Einzelfälle handelt: Nullendung Apostroph overte Markierung Token insgesamt Neutra auf -en 206 1.206 (0,3%) 0 350.924 (99,7%) 352.130 Sonstige reg. Appellativa 51.732 (1,9%) 34 (0,001%) 2.680.123 (98,1%) 2.731.889 Tab. 48: Häufigkeit endungsloser Formen: Neutra auf en vs. sonstige Appellativa (Kontrollwert minus der Neutra auf en) Erneut können wir feststellen, dass der Anteil der endungslosen Formen hier deutlich unter dem Kontrollwert für reguläre Appellativa liegt. Eine Tendenz zur Nullmarkierung lässt sich also auch für Neutra auf -en nicht nachvollziehen. Ferner zeigt sich, dass - ähnlich wie bei den Maskulina auf -en - die Präsenz eines vorangehenden modifizierenden Adjektivs die Verteilung der Endungsvarianten nicht zugunsten der Nullmarkierung beeinflusst (tatsächlich sinkt der Anteil der Nullendungen leicht): Nullendung Apostroph overte Markierung Token insgesamt Neutrum auf -en (+ vorangehendes Adjektiv) 236 (0,2%) 0 96.378 (99,8%) 96.614 Sonstige Appellativa 51.732 (1,9%) 34 (0,001%) 2.680.123 (98,1%) 2.731.889 Tab. 49: Häufigkeit endungsloser Formen: Neutrum auf -en (+ vorangehendes Adjektiv) vs. sonstige Appellativa (Kontrollwert minus der Neutra auf -en) 206 Eine COSMAS -Recherche (W-gesamt, DeReKo-2013-I) hat allerdings ergeben, dass bei einzelnen Neutra der Anteil der endungslosen Formen etwas höher liegt. So stehen bei Rennen 109 endungslose Genitive 12.102 Formen mit -s gegenüber (0,9% endungslose Varianten). Dies scheint erneut darauf hin zu deuten, dass der Recall unserer Genitivextraktion bei endungslosen Formen Schwächen aufweist (die aber auch in diesem Fall vermutlich darauf zurückzuführen sind, dass nicht alle relevanten Wortformen korrekt als Nomen getaggt worden sind). Endungslose Genitive 238 3.4.3 Diminutive Appel (1941) vertritt die Auffassung, dass Diminutive häufiger als andere Nomina vom Wegfall der Genitivendung betroffen sind. Entsprechende Beispiele lassen sich tatsächlich im Korpus finden, vgl.: (23) Handelt es sich bei der Familie des Besitzers womöglich um besonders heiratswütige Menschen, so dass sich der Hochzeitsmarsch regelrecht in das Hirn des Vögelchen brannte? (Mannheimer Morgen, 1.7.2005) Zur Überprüfung dieser Hypothese haben wir aus unserer Genitivdatenbank 3.648 Nomina auf <chen> und <lein> extrahiert und (per manueller Kontrolle) auf die Fälle reduziert, die tatsächlich Diminutive darstellen. Für die verbleibenden 2.241 Diminutive (Types) haben wir anschließend die Verteilung von Nullendung und overter Markierung des Genitivs ermittelt. Das Ergebnis ist in Tabelle 50 niedergelegt. Es zeigt sich, dass wir den Befund von Appel innerhalb unserer Korpusstudie nicht bestätigen konnten. Tatsächlich liegt die Anzahl der Nullendungen bei Diminutiven deutlich unter dem für normale Appellativa ermittelten Kontrollwert: Nullendung Apostroph overte Markierung Token insgesamt Diminutive 18 (0,09%) 0 19.135 (99,91%) 19.153 sonstige reg. Appellativa 52.920 (1,7%) 34 (0,001%) 3.011.912 (98,3%) 3.064.866 Tab. 50: Häufigkeit endungsloser Formen: Diminutive vs. Appellativa (Kontrollwert minus Diminutive) 3.4.4 Verwandtschaftsbezeichnungen Zur Überprüfung der Hypothese, dass Bezeichnungen für Verwandtschaftsbeziehungen häufiger endungslos auftreten als andere Appellativa haben wir das Flexionsverhalten von 15 maskulinen Verwandtschaftsbezeichnungen im Korpus studiert (Cousin, Enkel, Enkelsohn, Großonkel, Großvater, Onkel, Patenonkel, Schwager, Schwiegersohn, Schwiegervater, Sohn, Vater, Vetter, Urenkel, Urgroßvater). Auch hier zeigt sich - ähnlich wie bei den Diminutiven - keine Tendenz zur Nullendung. Nicht-normgerechte Formen der Endungslosigkeit 239 Zwar treten vereinzelt endungslose Formen wie im folgenden Beispiel auf: (24) In der bereits erwähnten Jubiläumsschrift ist Max Schetter mit seinem Sohn Yannik abgebildet. Sollt er eines Tages in die Fussstapfen seines Vater treten, hätten die Schetters weit mehr als 100 Jahre das Amt der Brunnenmeister in Wittenbach ausgeübt. (A98/ SEP.57990 St. Galler Tagblatt, 17.09.1998, Ressort: TB-SGR (Abk.); Brunnenmeister aus gleicher Familie) Insgesamt liegt der Anteil der Nullendungen aber sogar etwas unter dem Niveau, das uns bei normalen Appellativa begegnet, vgl. Tabelle 51. Man kann also nicht davon sprechen, dass der Faktor ‘Verwandtschaftsbezeichnung’ die Wahl der Nullmarkierung positiv beeinflusst. Nullendung Apostroph overte Markierung Token insgesamt Verwandtschaftsbezeichnungen 567 (1,3%) 0 44.192 (98,7%) 44.759 sonstige reg. Appellativa 52.371 (1,7%) 34 (0,001%) 2.986.855 (98,3%) 3.039.260 Tab. 51: Häufigkeit endungsloser Formen: Verwandtschaftsbeziehung vs. Appellativa (Kontrollwert minus Verwandtschaftsbezeichnungen) 3.4.5 Fazit In diesem Teilkapitel haben wir ausgewählte Phänomene betrachtet, für die in der Forschungsliteratur zuweilen eine Tendenz zur Nullmarkierung des Genitivs (entgegen gängiger standardsprachlicher Normen) festgestellt wird. Die Auswertung unserer Daten hat gezeigt, dass sich in den von uns verwendeten (schriftsprachlichen) Korpora entsprechende Hypothesen nicht bestätigen lassen. Maskulina und Neutra auf -en, Diminutiva und Verwandtschaftsbezeichnungen zeigen keine Tendenz zum Wegfall der Genitivendung, die über den Anteil der Nullendungen bei „regulären“ Appellativa hinausgeht. Dies scheint den Schluss nahe zu legen, dass entsprechende Tendenzen zur Nullmarkierung des Genitivs nicht in der Schriftsprache (insbes. nicht in redigierten Texten), sondern höchstens in mündlichen Varietäten auftreten (vgl. Paulfranz 2013 für ähnliche Befunde, wenn auch auf Basis eines wesentlich kleineren Korpus). Endungslose Genitive 240 3.5 Zusammenfassung und abschließende Bemerkungen Im Rahmen der vorliegenden Teilstudie zur Genitivmarkierung haben wir uns mit dem Phänomen endungsloser Genitive im schriftsprachlichen Standarddeutschen auseinandergesetzt. Im Mittelpunkt des Erkenntnisinteresses standen dabei sowohl methodische als auch linguistische Aspekte. Zum einen haben wir untersucht, inwiefern die korpuslinguistischen (und statistischen) Methoden, die wir im Rahmen unserer Projektarbeit bereits erfolgreich auf overte Genitivmarkierungen angewandt haben, auch auf endungslose Varianten übertragen werden können (vgl. Kap. 4 für eine abschließende Zusammenschau methodischer Gesichtspunkte). Zum anderen waren wir mit der Frage befasst, ob eine korpusbasierte Studie neue Aufschlüsse liefern kann über die Distribution und Häufigkeit endungsloser Genitive sowie über die Faktoren, die einen Wegfall der Genitivendung begünstigen. Dabei haben wir keine exhaustive Studie angestrebt, sondern uns auf ausgewählte Fragestellungen konzentriert, die nicht nur von linguistischem Interesse sind, sondern es auch erlauben, praktische Probleme unseres methodischen Ansatzes zu erkennen und Lösungsstrategien zu entwickeln, die speziell auf die Schwierigkeiten zugeschnitten sind, die sich bei der korpusbasierten Untersuchung von Formen ergeben, die keine overte morphologische Markierung aufweisen. Im Mittelpunkt unserer korpuslinguistischen Untersuchung stand die Frage, welche Kontexte bzw. Faktoren den Ausfall der Genitivmarkierung begünstigen, und wie sich entsprechende Aussagen zur relativen Häufigkeit endungsloser Varianten auf der Basis einer Korpusstudie überprüfen bzw. präzisieren lassen. Dabei haben wir uns auf ausgewählte Bereiche des Sonderwortschatzes konzentriert und zunächst Fälle betrachtet, in denen eine endungslose Realisierung des Genitivs die Regel darstellt. Es wurde deutlich, dass obligatorische Endungslosigkeit zumeist das Resultat kumulativer Effekte ist, d.h. eines Zusammenwirkens mehrerer Faktoren, wobei typischerweise lexikalischsemantische Eigenschaften (insbes. mangelnde Integration in das Flexionssystem z.B. aufgrund von Eigennamencharakter/ Nennfunktion oder fremdsprachlichem Ursprung) mit phonologischen (s-Auslaut) und morphosyntaktischen Faktoren (Monoflexion) interagieren. Als charakteristisches Beispiel ist das Flexionsverhalten nicht-integrierter Fremdwörter, die auf -s auslauten, zu nennen. Eine Sonderrolle neh- Zusammenfassung und abschließende Bemerkungen 241 men Abkürzungen ein. Hier bleibt der Genitiv quasi obligatorisch unmarkiert, auch ohne dass eine Faktorenhäufung vorliegt. Dies korreliert womöglich mit der fehlenden Integration ins Flexionssystem, die für Abkürzungen charakteristisch ist. In anderen Kontexten (wie Konversionen oder bestimmte Monatsnamen) treten zwar ebenfalls Fälle auf, in denen der Genitiv ausschließlich durch endungslose Varianten realisiert wird. Im Gegensatz zu den generell endungslosen Fällen (u.a. Fremdwörter auf -(u)s, Monoflexion bei Eigennamen) ist obligatorische Endungslosigkeit hier allerdings auf einzelne Lemmata beschränkt (z.B. Nichts, Heute, Gestern, Jetzt, März), während mit anderen Elementen der Wortklasse durchaus Varianten mit overter Genitivendung auftreten. Im Anschluss haben wir das Flexionsverhalten von Nomina untersucht, deren Genitivformen Variation zwischen overter und endungsloser Markierung zeigen. Dabei haben wir quantitative Daten zu Eigennamen, ausgewählten eigennamenähnlichen Ausdrücken (Wochentage, Monatsnamen sowie Stil- und Epochenbezeichnungen), Fremdwörtern, Zeitausdrücken und Konversionen erhoben. Es hat sich bestätigt, dass - bis auf wenige Ausnahmen wie des (Omni-)Busses, des Kongresses oder Personennamen wie Fritzens - die Nullendung in der Regel mit der kurzen Genitivendung -s alterniert (vgl. Kap. 4 für eine abschließende Betrachtung des Systems der Genitivmarkierung im Deutschen, die diesen Befund in Beziehung setzt zu den Ergebnissen aus Kap. 2). Bei der Wahl des Genitivallomorphs lassen sich zum einen Kontraste zwischen verschiedenen Nominaltypen beobachten: Monatsnamen zeigen aufgrund ihrer Nähe zu Eigennamen ohnehin eine Tendenz zur Endungslosigkeit, während bei Fremdwörtern die Genitivendung nur bei Vorliegen weiterer Faktoren (s-Auslaut, Eigennamencharakter) ausfällt. Zum anderen verhalten sich oft auch die Elemente ein- und derselben Teilklasse aufgrund der Interaktion verschiedener Faktoren nicht einheitlich. So führt bei Farbwörtern (Schwarz, Weiß) und Monatsnamen (März) das Vorliegen eines s-Auslauts zu obligatorischer Endungslosigkeit, während bei anderen Elementen sowohl endungslose als auch morphologisch markierte Genitivformen auftreten. 207 Ferner haben wir festgestellt, dass bei 207 Allerdings müssten diese Interaktionseffekte noch genauer mithilfe statistischer Methoden wie Effektstärkenschätzung, Regressionsanalysen etc. untersucht werden. Endungslose Genitive 242 Monatsnamen die Wahl des Genitivallomorphs auch durch morphosyntaktische Bedingungen beeinflusst wird: Die Kombination eines Genitivartikels mit einem Monatsnamen begünstigt die s-Endung, während in Datumsangaben mit Ordinalzahlen fast ausschließlich die Nullmarkierung auftritt. Die Beobachtungen zu Farbwörtern und Monatsnamen korrigieren z.T. Darstellungen in gängigen deskriptiven Grammatiken. Es steht zu hoffen, dass diese Befunde - insoweit noch nicht geschehen - bei künftigen Überarbeitungen einschlägiger grammatischer Beschreibungen Berücksichtigung finden. Phänomene im Zusammenhang mit der sog. Wortgruppenflexion (vgl. Duden 2009, § 1517-1539), d.h. der Tatsache, dass im Deutschen die grammatischen Merkmale einer Nominalphrase durch das Zusammenspiel von Markierungen an Artikel, Adjektiv und Nomen signalisiert werden, konnten leider nur gestreift werden. Wir hoffen aber, dass die von uns gewählte Methodik künftig stärker auch zur Untersuchung entsprechender (morpho)syntaktischer Fragestellungen herangezogen werden kann. Die öffentlich zugängliche GenitivDB liefert hierfür jedenfalls gute Voraussetzungen. Einschlägige Forschungsdesiderate betreffen beispielsweise das Verhalten unterschiedlicher Nomentypen (z.B. Eigennamen mit festem Artikel vs. Eigennamen mit sekundärem Artikel) hinsichtlich der Tendenz zur Monoflexion oder Ausnahmen von der im Duden (2009, § 1534) postulierten Genitivregel. So scheint in Beispielen wie (25) aufgrund der Unterspezifizierung von dieses (Nominativ/ Akkusativ Singular Neutrum, Genitiv Singular Maskulinum/ Neutrum) der Genitiv nicht eindeutig markiert zu sein. (25) Städtebau war damals Raumplanung, oft ausgeübt von raumblinden Akteuren. Das Modell sei mit viel grüner Farbe ausgestattet, die Funktion dieses Grün war als agrarischer Puffer zu sehen, der ein Zusammenwachsen der Städte verhindern sollte. (Die Südostschweiz, 16.11. 2008; Stadtplanung in vielen Facetten) Schließlich hat die Untersuchung von Interaktionseffekten bei der Genitivmarkierung fremdsprachlicher geografischer Namen (Iran/ Irak) den Schluss nahe gelegt, dass die Wahl des Genitivallomorphs auch durch Fluktuationen im Gebrauch (d.h. der Häufigkeit) eines Nomens beeinflusst werden kann: Offenbar steigt der Anteil der s-Endung proportional zur Häufigkeit des Namens im Korpus. Mit einigen Einschränkungen (s.o. für Details) scheint dies die Hypothese von Nübling (2012) zu unterstützen, dass der Faktor Geläufigkeit/ Integration Zusammenfassung und abschließende Bemerkungen 243 das Flexionsverhalten von Eigennamen beeinflusst. Sicherlich sind hier aber noch weiterführende Untersuchungen nötig, um das Verhältnis von Frequenz und Flexionsverhalten besser verstehen zu können (vgl. auch Kap. 4). Gegenstand von Kapitel 3.4 waren Fälle außerhalb des Sonderwortschatzbereichs, für die in der einschlägigen Forschungsliteratur z.T. eine Tendenz zur Nullmarkierung des Genitivs (entgegen gängiger standardsprachlicher Normen) festgestellt wird. Dabei haben wir uns mit Maskulina und Neutra auf en, Diminutiva und Verwandtschaftsbezeichnungen befasst. Die quantitative Auswertung der Belege hat gezeigt, dass in unserem Korpus für die untersuchten Nominaltypen keine Tendenz zum Wegfall der Genitivendung nachgewiesen werden kann, die über den Anteil der Nullendungen bei „regulären“ Appellativa hinausgeht. Dies bestätigt den Befund von Paulfranz (2013), dass in der geschriebenen Standardsprache entsprechende Normen zur Genitivmarkierung weitestgehend eingehalten werden und zumindest in den genannten Bereichen keine Sprachwandeltendenzen zugunsten einer Ausbreitung endungsloser Genitive zu beobachten sind. Unsere Ergebnisse lassen aber zunächst keine direkten Rückschlüsse auf die Verhältnisse in der Mündlichkeit zu. Es steht zu erwarten, dass in der gesprochenen Sprache die Ausbreitung endungsloser Formen weiter fortgeschritten ist. Daher erscheint es naheliegend, die Realisierungsformen der Genitivmarkierung in Korpora des gesprochenen Deutsch (bzw. über einschlägige Experimente) im Rahmen einer entsprechenden Anschlussstudie separat zu untersuchen. 208 208 Erste Hinweise auf einen Kontrast zwischen Mündlichkeit und Schriftlichkeit liefert bereits die Beobachtung, dass endungslose Formen in Teilkorpora des DeReKo, die der Mündlichkeit näher stehen (wie z.B. Wikipedia Diskussionen), häufiger aufzutreten scheinen (vgl. auch Szczepaniak 2015 für ähnliche Befunde). Eine eingehendere Berücksichtigung soziolinguistischer Faktoren (u.a. Stilebenen/ Register) stellt noch ein Forschungsdesiderat dar. 4. GESAMTBILD 4.1 Methodische Aspekte Bei einem zunächst so diffus wirkenden Phänomen wie Variation der starken Genitivmarkierung des Nomens erschien es uns unabdingbar, die Untersuchungen auf eine möglichst breite Datenbasis zu stellen. Naheliegend war es daher, sich auf das gesamte DeReKo (Release 2011-I) zu stützen. Allerdings waren die Kasusinformationen der Tagger, mit denen DeReKo annotiert ist, nicht ausreichend bzw. nicht eindeutig genug. So wurde mithilfe eines Perl-Skripts, in welches die Ergebnisse der Analysen zur Form und Distribution der Genitivnomina eingegangen waren, eine automatische Extraktion durchgeführt, die auf das Auffinden und Klassifizieren der Genitivnomina in allen Varianten ausgelegt war. Dabei wurden Präzisions- und Ausbeuteraten erreicht, die global mit dem kombinierten Maß F = 0,97 sehr hoch waren, aber punktuell, im Bereich weniger frequenter Formen, teilweise deutlich schwächer ausfielen. Mithilfe des Skripts wurden die gefundenen Genitivnomina auch mit zahlreichen Zusatzinformationen angereichert und ggf. als Einheiten des Sonderwortschatzes (Eigennamen, Fremdwörter, Abkürzungen etc.) klassifiziert, da in den Sonderwortschatzbereichen mit Besonderheiten der Markierungsvariation zu rechnen war. Bei dieser Klassifizierung wurden Daten automatisch mit umfangreichen Listen einschlägiger Ausdrücke abgeglichen, um die unzureichende Taggerinformation zu ergänzen. Alle gefundenen Genitivnomina wurden zusammen mit dem Satzkontext und den Zusatzinformationen in der Genitivdatenbank (GenitivDB) abgelegt. Sie diente für die weiteren Untersuchungen als die wichtigste Datenquelle, in der mit SQL -Befehlen auch sehr komplexe Recherchen und erste Auswertungen vorgenommen werden konnten. Bei den darauf folgenden Analysen kamen regelmäßig einige deskriptiv- und inferenzstatistische Verfahren zum Einsatz. Für beide Teilstudien zentral waren Berechnungen zur relativen Häufigkeit spezifischer Varianten (bzw. zu deren prozentuellem Anteil an der Gesamtheit der Varianten), Signifikanzprüfungen zu Häufigkeitsunterschieden (Chi- Quadrat-Test) und Berechnungen des Assoziationskoeffizienten Phi als Effektstärkemaß. Dabei wurde in erster Linie die Tokenperspektive Gesamtbild 246 eingenommen, bei der die Gesamtheit der jeweils einschlägigen Token ohne Rücksicht auf deren Zuordnung zu einzelnen Lemmata fokussiert wird. Aus dieser Perspektive wichen alle untersuchten Verteilungen laut Chi-Quadrat-Tests (größtenteils höchst) signifikant von der jeweils erwarteten Verteilung ab (Konfidenzniveau mindestens 95%). Die Lemmaperspektive, bei der die relativen Häufigkeiten der Varianten für einzelne Lemmata in den Mittelpunkt rücken, erwies sich dagegen aufgrund großer Schwankungen dieser Häufigkeiten meist als unbrauchbar und war ohnehin mit der herrschenden Konzeption der Variationsfaktoren nur bedingt vereinbar. In der Teilstudie zur Endungsvariation (Kap. 2) kamen einige spezifische statistische Verfahren zum Einsatz. Um die Stärke und vor allem die Richtung der binär konzipierten Faktoren zu bestimmen, fanden Berechnungen der logarithmierten Odds Ratio statt. Im Weiteren wurden begrenzt, in Verbindung mit der Diskussion der beiden obengenannten Perspektiven, Signifikanzprüfungen mithilfe von Wilcoxon- Tests durchgeführt. Schließlich wurde auf das Mittel der binären logistischen Regression zurückgegriffen, um die Interaktion der Faktoren näher zu analysieren. Im letzteren Fall konnten allerdings aufgrund der besonderen Vielzahl der Variationsfaktoren nur exemplarische Modelle berechnet werden. Die Interaktionen zwischen den Faktoren wurden ansonsten dadurch kontrolliert, dass die mutmaßlich stärksten Faktoren, die die Wirkung der schwächeren Faktoren zu überschatten drohten, als erste untersucht und danach aus der Datenbasis ausgeschlossen wurden, wobei dieser Vorgang mehrfach wiederholt wurde. In der Teilstudie zu den endungslosen Genitiven (Kap. 3) hat sich neben deskriptivstatistischen Methoden wie der Berechnung relativer Häufigkeiten und der Erstellung von Ranglisten insbesondere die Berechnung der standardisierten Pearson-Residuen sowie deren Visualisierung mithilfe von Assoziationsplots als hilfreich erwiesen, um einschätzen zu können, inwiefern bei einzelnen Wortgruppen bzw. Wortklassen eine signifikante Tendenz zur Nullmarkierung des Genitivs vorliegt. Im Hinblick auf kommende Untersuchungen von ähnlich gelagerten flexionsmorphologischen Phänomenen sind als positive Erfahrungen und mögliche Standards für die weitere Forschungsarbeit des Projekts „Korpusgrammatik“ folgende methodische Ansätze hervorzuheben: Methodische Aspekte 247 - Bei der Prüfung von Hypothesen zu einer Variation, die sich mit großen Schwankungen auf besonders viele Lemmata/ Lexeme o.Ä. verteilt, deren Faktoren aber als „flächendeckend“ wirksam konzipiert sind, ist verstärkt von der Tokenperspektive auszugehen. - Um die Durchschlagskraft von binären Faktoren möglichst verständlich zu quantifizieren, ist die nahezu voraussetzungslose Berechnung des prozentualen Anteils der Fälle mit der positiven Ausprägung bestens geeignet. - Um die Effektstärke von binären Faktoren (unter Berücksichtigung der für das jeweilige Gesamtsystem geltenden Reichweite) zu quantifizieren, ist besonders die Berechnung des Korrelationskoeffizienten Phi geeignet, 209 dessen Werte standardisiert sind und zu dem es aus den Sozialwissenschaften bekannte konsensuelle Schwellenwerte gibt. - Um besser zu verstehen, wie einige (wenige) binäre Variablen miteinander interagieren, ist die logistische Regression das Mittel der Wahl (sie hilft allerdings nur bedingt, wenn es darum geht, eine Gesamtstruktur aus sehr zahlreichen Faktoren, wie sie in unserem Fall vorlag, nachvollziehbar zu ordnen). 210 - Als Mittel zur Veranschaulichung inferenzstatistischer Befunde (nicht zuletzt bei originär intervallskalierten Variablen wie ‘Zeit’, die in ordinalskalierten Variablen wie ‘Zeitabschnitt’ reorganisiert werden) hat sich die Visualisierung mithilfe von Assoziationsplots als besonders nützlich erwiesen. Durch diese Darstellungsform muss nicht auf eine andere Visualisierungsart (z.B. ein Zeitverlaufsdiagramm) zurückgegriffen werden, die weniger gut mit der Darstellung kategorialer Variablen vergleichbar wäre. Einige der genannten Punkte lassen sich unter Umständen gut auf andere Bereiche der Grammatik übertragen, was hier aber nicht im Fokus steht und daher nicht diskutiert wird. Schließlich darf nicht unerwähnt bleiben, dass die Organisation der Daten in einer spezialisierten relati- 209 Bei Faktoren mit mehr als zwei Ausprägungen bietet sich entsprechend die hier nur punktuell verwendete Berechnung von Cramérs V an. 210 In solchen Fällen sind komplexere Verfahren wie das des maschinellen Lernens denkbar (vgl. Bubenhofer/ Hansen-Morath/ Konopka 2014). Zielführend kann sich aber auch die relativ voraussetzungslose schrittweise Reduktion der Datenbasis (vgl. weiter oben) erweisen. Gesamtbild 248 onalen Datenbank (GenitivDB) prinzipiell weit größere Recherche- und Analyse-Möglichkeiten bot einerseits als die Arbeit mithilfe von COSMAS II (dank der Möglichkeit, SQL -Abfragen zu verwenden), andererseits als die Arbeit mit dem projektinternen nicht-spezialisierten System KoGra-DB. 211 Neben den positiven Erfahrungen waren wir im Rahmen der vorliegenden Doppelstudie allerdings auch mit einigen methodischen Problemen konfrontiert, die an dieser Stelle ebenfalls benannt werden sollen. Die größten Schwierigkeiten bereiteten Untersuchungen wenig frequenter Teilphänomene, was hier an Beispielen der Untersuchungen zu den (weniger kanonischen) endungslosen Genitiven ausführlicher diskutiert wird. Die Untersuchung endungsloser Genitive hat gezeigt, dass bei der Übertragung korpuslinguistischer Verfahren, die primär für die Extraktion und Analyse overt markierter Formen zugeschnitten sind, einige Hindernisse auftreten. Dies bedeutet aber nicht, dass diese Methoden grundsätzlich nicht auf Fälle angewandt werden können, in denen die Genitivendung ausfällt. Vielmehr ist zu schließen, dass die entwickelten Verfahren an die jeweiligen Daten und Forschungsfragen angepasst werden müssen. Ein wesentliches Problem betrifft zum einen die Qualität der Daten. Es hat sich gezeigt, dass bei endungslosen Genitiven in vielen Bereichen sowohl Recall als auch Präzision der Extraktion gegenüber den Ergebnissen bei overten Formen abfällt. Die Art der Fehler basiert zum einen auf generellen Einschränkungen, denen die morphologische Annotierung des Korpus unterliegt (z.B. fehlerhafte bzw. inkonsistente Kategorienzuordnung, mangelnde Unterscheidungsmöglichkeiten hinsichtlich verschiedener Teilklassen von Nomina). Diese Schwierigkeiten, die auf die Wirkungsweise der verwendeten Tagger zurückzuführen sind, stellen ein generelles Problem bei der Arbeit mit großen, automatisch annotierten Korpora dar. Sie sind daher nicht nur spezifisch für die Untersuchung endungsloser Formen, sondern gelten für die gesamte Extraktion; allerdings treten sie bei der Untersuchung niederfrequenter Phänomene stärker zutage. Eine zweite Art von methodischen Problemen betrifft die Verfahren, die zur Erkennung bzw. Extraktion relevanter Formen und Phänome- 211 Vgl. dazu Bubenhofer/ Schneider/ Konopka (2014, S. 107ff.). Methodische Aspekte 249 ne aus dem Korpus angewandt wurden. Generell gilt, dass die korrekte Identifizierung von Formen ohne (eindeutige) morphologische Markierung im Rahmen einer korpusbasierten Untersuchung Schwierigkeiten bereitet (insbesondere, wenn keine zuverlässige morphosyntaktische Annotierung vorhanden ist). Bei der Extraktion endungsloser Genitive haben sich zusätzlich Probleme dadurch ergeben, dass die Kriterien zur Erkennung von Genitiven primär auf sichtbare morphologische Markierungen ausgelegt waren. Da die gleichen Kriterien auch der automatischen Modellierung der Befunde im Rahmen eines Entscheidungsbaums zugrunde lagen, ist es nicht überraschend, dass dieses Verfahren für endungslose Genitive zu keinen befriedigenden Ergebnissen geführt hat. Eine methodologische Erkenntnis, die sich aus unseren Erfahrungen ableiten lässt, ist, dass die Untersuchung qualitativ und quantitativ heterogener Phänomene - im vorliegenden Fall hochfrequente overt markierte Genitive vs. niederfrequente endungslose Formen - spezifisch adaptierte methodische Verfahren erfordert, die auf die individuellen Eigenschaften des jeweiligen Gegenstands abgestimmt sein sollten. 212 Diese Einsicht sollte auch bei zukünftigen Korpusuntersuchungen berücksichtigt werden: Es ist darauf zu achten, dass die für die Erkennung und Modellierung eines Phänomens herangezogenen Kriterien das Ergebnis bzw. die durchgeführten Analysen nicht verzerren. Insbesondere muss sichergestellt sein, dass durch die Kriterienauswahl nicht bereits im Vorfeld das Auffinden bestimmter (niederfrequenter) Ausprägungen eines Phänomens erschwert bzw. sogar ausgeschlossen wird, auch wenn dies unter Umständen dazu führt, dass man separate Suchroutinen und Analyseverfahren für unterschiedliche Varianten einer grammatischen Eigenschaft entwickeln muss. Im vorliegenden Fall haben wir versucht, die Lücken in der zur Verfügung stehenden Datenbank durch alternative Methoden der Datengewinnung und -analyse zu schließen, indem wir für einzelne Faktoren/ Kontexte skriptbasierte Suchroutinen bzw. SQL -Datenbankabfragen formuliert haben, die bei Bedarf durch manuell durchgeführte Stichproben via COSMAS II bzw. KoGra-DB ergänzt wurden. Letzteres Verfahren kann aus den bereits genannten Gründen (Aufwand, Einschränkung auf bestimmte Muster) aber letzt- 212 Eine Möglichkeit, die noch geprüft werden könnte, ist beispielsweise, auf der Basis maschinellen Lernens einen separaten Entscheidungsbaum zu erstellen, der nur die Faktoren berücksichtigt, die nachweislich für endungslose Genitive relevant sind. Gesamtbild 250 lich nur als Notbehelf betrachtet werden. Trotz der erwähnten Probleme hat sich aber gezeigt, dass ein korpusbasiertes Verfahren auch für die Distribution der Nullmarkierung des Genitivs linguistische Einsichten verfügbar macht, die nicht nur empirisch fundiert sind, sondern auch über den bestehenden Stand der Forschung (und Grammatikschreibung) hinausgehen, respektive diesen korrigieren (vgl. z.B. das Flexionsverhalten von Farbwörtern, die Tendenz zur Nullmarkierung von Monatsnamen in Datumsangaben, oder die unterschiedlichen Eigenschaften von Personennamen und geografischen Namen unter Monoflexion). An dieser Stelle ist noch auf zweierlei hinzuweisen: Zum einen ist die Genitivdatenbank, mit deren Hilfe die beschriebenen Untersuchungen zur Endungsvariation und zu endungslosen Genitiven durchgeführt wurden, seit einiger Zeit im Internet zugänglich. 213 Sie wird laufend optimiert und erweitert und steht damit für weitergehende Forschung zur Genitivmarkierung zur Verfügung 214 - nicht zuletzt für die Behandlung der Forschungsdesiderate, die am Ende des folgenden Abschnitts Linguistische Generalisierungen identifiziert werden. Zum anderen ist es aus unserer Sicht wünschenswert, dass auch andere grammatische Fragestellungen mit ähnlicher korpuslinguistischer Methodik untersucht werden, die die statistische Validierung empirischer Befunde ernst nimmt. Im Projekt „Korpusgrammatik“ des IDS werden bereits jetzt die hier verwendeten Methoden auf syntaktische Fragestellungen wie Komplementation oder Variation der Relativsatzeinleitung übertragen. 4.2 Linguistische Generalisierungen Die folgenden Schlussfolgerungen stellen weitergehende Generalisierungen dar. Sie bauen auf den in den Kapiteln 2.5 und 3.5 zusammengefassten Prüfungen bisheriger Hypothesen zu Variationsfaktoren auf. Auf einer höheren Ebene gerät hier noch einmal die anfangs gestellte Systemfrage in den Fokus. Unsere Ausführungen dazu, wie die gesamte Markierungsvariation als konsistentes System modelliert werden kann, bietet zum Teil nichts anderes als neue, weiterführende Hypothesen, die von der zukünftigen Forschung geprüft werden können. 213 www.ids-mannheim.de/ genitivdb (28.6.2015). 214 Die Genitivdatenbank wurde bereits für eine Untersuchung zu genitivregierenden Verben (Konopka 2015) und für eine Spezialanalyse zur regionalen Variation der Genitivmarkierung (Fürbacher 2015) benutzt. Linguistische Generalisierungen 251 Die im vorhergehenden Abschnitt geschilderten methodischen Unterschiede haben zu der Entscheidung beigetragen, die Endungsvariation und die Weglassung der Endung größtenteils getrennt zu behandeln. Diese Entscheidung war aber auch durch den frühen Eindruck beeinflusst, dass gleiche Faktoren in den beiden Bereichen unterschiedliche Auswirkungen haben können. 215 So müssen hier verkürzt noch einmal die wichtigsten der jeweiligen Spezifika festgehalten werden, bevor gezeigt wird, wie sich die beiden Bereiche zu einem Gesamtbild ergänzen. Das Gesamtspektrum der Variation der starken Markierung des Nomens im Genitiv Singular verteilt sich tendenziell auf zwei komplementäre Wortschatzbereiche: - -es (-ses) vs. -s → Grundwortschatz bzw. integrierter Wortschatz - -s (-(e)ns, -’s) vs. -Ø (-’) → Sonderwortschatz bzw. weniger integrierter Wortschatz 216 Im Bereich des Grundwortschatzes fällt die Entscheidung zwischen einer silbischen und einer nur konsonantischen Erweiterung des Nomens gegenüber der Nominativform. Die Variation wird dabei sowohl durch allgemeinere, grammatikexterne als auch durch grammatikinterne Faktoren gesteuert. Betrachtet man die wichtigsten davon, erscheinen beide Faktorengruppen zweigeteilt: 1) grammatikexterne Faktoren: a) Wortalter 217 b) Wortfrequenz 218 215 So etwa führt der s-Auslaut einerseits bei heimischen Appellativa zur Endung -es, andererseits jedoch bei Wörtern, die wie schwächer integrierte Fremdwörter die Endung -es prinzipiell nicht zulassen, zur Endungslosigkeit. 216 Das bedeutet auch, dass es in der Regel keine Dreifachoppositionen gibt. Eine wichtige Ausnahme bilden Eigennamen mit festem Artikel (typischerweise geografische Namen), die sowohl -es als auch -s als Ø zulassen können wie des Vogtlandes/ des Vogtlands/ des Vogtland, vgl. Duden (2009, S. 207). 217 Ältere Wörter im Sinne dieses Faktors sind nicht nur Erbwörter, sondern auch im Deutschen seit langem integrierte Lehnwörter (z.B. Punkt). 218 Hier wird einfachheitshalber angenommen, dass Unterschiede in der allgemeinen Lexemfrequenz zwischen verschiedenen Nomina in der Regel mit den Unterschieden in der Genitivtokenfrequenz zwischen denselben verschiedenen Nomina korrespondieren. Bei Abweichungen dürfte meist die Genitivtokenfrequenz ausschlaggebend sein. Gesamtbild 252 2) grammatikinterne Faktoren: a) Silbenstruktur b) prosodische Struktur Die in unseren Untersuchungen relevanten grammatikexternen Faktoren ‘Wortalter’ und ‘Wortfrequenz’ sind eng miteinander verzahnt. Die Endung -s ist jünger und scheint die Endung -es zurückzudrängen. Dies bedeutet einen historisch voranschreitenden Schwa-Wegfall. 219 Die wortphonologische Reduktion kann als Wortoptimierung interpretiert werden. 220 Einer solchen Entwicklung zum Trotz ist die ältere Endung -es bei einigen hochfrequenten einsilbigen Erbwörtern heute noch beinahe ausnahmslos (vgl. Mannes oder Tages). Sie wird bei diesen Wörtern durch eine konstant sehr hohe Frequenz offensichtlich in besonderer Weise konserviert. Von solchen Extremfällen abgesehen scheint die Kombination aus ‘Wortalter’ und ‘Wortfrequenz’ bei den Einsilbern, wenn beide Endungen durch grammatikinterne Faktoren erlaubt sind, mitzubeinflussen, wie das Verhältnis der Endungen zueinander ausfällt. Dabei ist -es gemäß der konservierenden Wirkung der Frequenz prinzipiell umso wahrscheinlicher, je häufiger das Nomen gebraucht wird. Die grammatikinternen Faktoren fußen in der gesprochenen Sprache, deren Einfluss auf die geschriebene Sprache bekanntlich durch graphematische Besonderheiten gebrochen erscheint. Die Grenzen für die Variation werden durch kombinatorische Regularitäten des Standarddeutschen gesetzt. Silbenstrukturell ist es auf der einen Seite der phonotaktische Ausschluss der silbeninternen Gemination (*Hauss vs. Hauses) und auf der anderen Seite die graphotaktische Vermeidung des Hiats (*Seees vs. Sees). Dazwischen, d.h. in mehr oder weniger ausgeprägten Variationsfällen, ist die Beschaffenheit des Reims der letzten Nomensilbe von Bedeutung. Hier stellt sich vor allem die Frage nach der Koda bzw. nach deren Aufbau. Die Verschiebungen in Endungspräferenzen zwischen bestimmten Nomengruppen lassen sich dann mit verschiedenen Ausprägungskombinationen der auf den Wortausgang bezogenen phonologischen Faktoren ‘Sonorität’ und ‘Konsonantenanzahl’ erklären. Dabei ist die Endung -es immer eine Entlastung 219 Schon Paul (1917, S. 7) ordnet die Endungsvariation der „ungleichmäßige[n] Ausstoßung des schwachen e“ zu. 220 So bei Szczepaniak (2010). Linguistische Generalisierungen 253 der Struktur der vorangehenden Silbe mit einem komplexen Rand, weil sie den Konsonantencluster der Koda aufspaltet bzw. einen oder mehrere Konsonanten in die Endungssilbe verschiebt. Das Ergebnis ist eine eher präferierte Koda. 221 Bei den über eine Silbe hinausgehenden prosodischen Strukturen werden der Variation durch die Beschränkung Grenzen gesetzt, die eine auf ein (Pseudo-)Suffix mit Schwa folgende silbische Endung ausschließt 222 (*Lehreres, *Eimeres). Hier hat die Endung -s zu erscheinen, was bei Zweisilbern immer und sonst häufig zu einer Wortform führt, die auf einen Trochäus endet (vgl. mit Hauptakzent: Lehrers, Eimers; mit Nebenakzent Hauptschullehrers, Wassereimers). Für die variierenden Nomina hat die Trochäusstruktur eine zentrale Bedeutung. Bei diesen werden in der geschriebenen Sprache Genitivformen, die auf einen Trochäus enden, präferiert. 223 Für ultimabetonte Nomina bedeutet dies eine Tendenz zu -es (die bei Einsilbern besonders stark ausfällt), für pänultimabetonte Nomina eine Tendenz zu -s. Bei mehr als zweisilbigen Wörtern kann es mit beiden Endungen zu Strukturen kommen, bei denen der Trochäus am Wortformenende mithilfe eines Nebenakzents realisiert werden kann (z.B. Schweinehundes, Gegenvorschlags). Wohlgemerkt ist die Tendenz zum Trochäus am Wortformenende bei Pänultima-Betonung und gleichzeitig vorliegendem komplexem Rand der letzten Nomensilbe im Konflikt mit der silbenstrukturellen Präferenz für einfachere Koda (vgl. Zustands (prosodisch präferiert) vs. Zustandes (silbenstrukturell präferiert)). Die festgestellten prosodischen Tendenzen der Wortebene könnten u.U. in Abhängigkeit von prosodischen Regularitäten interpretierbar sein, die für Einheiten höherer Ebenen (Phrasen, Sätze) gelten, denn der Trochäus spielt als ein spezifisches metrisches Element vor allem in größeren sprachlichen Einheiten eine Rolle, wo die Abfolge von Füßen einen bestimmten Rhythmus erzeugt. Die schwierige Frage, inwiefern die Prosodie solch größerer Einheiten die geschriebene Sprache auf der Wortebene beeinflusst, konnte hier nicht mehr untersucht werden. 221 Vgl. Zifonun et al. (1997, Bd. 1, S. 181), Vennemann (1986, S. 38ff.). 222 Vgl. Eisenberg (1991, S. 55). 223 Vgl. Eisenberg (1991) zum Trochäus als „kanonische Struktur“ des deutschen Substantivs, Wegener (2003) zur Bedeutung des Trochäus in der Pluralbildung, Kürschner (2009) zum Vergleich mit dem Niederländischen. Gesamtbild 254 Vergleicht man die Wirkung der beiden in 1) und 2) (weiter oben) angesetzten Faktorengruppen miteinander, fällt der Unterschied im Hinblick darauf auf, wie die beiden Endungen jeweils gewichtet sind. Während die diachrone Entwicklung in Richtung -s verläuft und nur teilweise vom ältere Formen konservierenden häufigen Gebrauch ausgebremst zu werden scheint (grammatikexterne Faktoren), kann synchron gesehen die präferierte prosodische Struktur der Wortformen mit beiden Endungen realisiert und die präferierte Struktur der letzten Nomensilbe in Variationsfällen sogar meist mithilfe der Endung -es erreicht werden (grammatikinterne Faktoren). Für eine ganzheitliche Betrachtung der Endungsvariation, die beide Faktorengruppen (1 und 2) integriert, ergeben sich also zwei idealisierte Sichtweisen. Aus der diachronen Perspektive ist von der Endung -es auszugehen, die nach und nach durch -s ersetzt wird. Dieser Prozess wird von der hohen Frequenz und bestimmten silbenstrukturellen bzw. prosodischen Konstellationen blockiert bzw. verzögert (was synchron zur Endungsvariation führt). Aus der synchronen Perspektive hingegen ist die häufigere Variante -s die Default-Endung, von der abgewichen werden kann (aber nur selten muss), wenn -es zu einer silbenstrukturell bzw. prosodisch vergleichbaren oder präferierten Lösung führt. Bei den grammatikexternen Faktoren ist u.U. auch mit Einflussgrößen zu rechnen, die anders beschaffen sind als die oben berücksichtigten. Zu denken ist hier an Parameter wie Kommunikationssituation 224 oder Sprecherintention, die mit den sonstigen Faktoren interagieren können. Solche Einflussgrößen wurden nicht untersucht, und ihre Einordnung bleibt eine Aufgabe für die zukünftige Forschung. Wie bereits in der einschlägigen Forschungsliteratur mehrfach festgestellt, ist das Ausbleiben der starken Genitivmarkierung vor allem in „peripheren Bereichen des Wortschatzes“ (Gallmann 1996) zu beobachten. Die Wahl der Nullvariante ist dabei entweder ausnahmslos (vor allem in Verbindung mit lautlichen Faktoren, z.B. bei nicht-integrierten Fremdwörter mit s-Auslaut) oder sie alterniert - bis auf wenige Ausnahmen wie Personennamen (Leibnizens) und (integrierte) Fremdwörter mit betonter Ultima (des Kongresses, des Projekt(e)s) - mit der kurzen Genitivendung auf -s. Dieser Befund wird von der vorliegenden Korpusstudie gestützt. Man kann also sagen: Während die Verfügbarkeit der beiden Leitvarianten -es und -s für die Genitivmarkie- 224 Dazu gehören auch Parameter wie Medium oder Register bzw. Textsorte. Linguistische Generalisierungen 255 rung im Bereich des Grundwortschatzes charakteristisch ist, reflektiert die Alternation zwischen -s und Nullendung einen niedrigeren Grad der Integration und somit Zugehörigkeit zum Sonderwortschatz. Freilich ist diese Verteilung nicht so zu deuten, dass die einzelnen Formvarianten neben ihrer Funktion als Kasusflexive auch direkt den Integrationsgrad von Lexemen signalisieren (i.S. eines entsprechenden lexikalischen Merkmals [±Integration]). Vielmehr handelt es sich dabei um ein Epiphänomen, das dadurch zustande kommt, dass Wörter, die neu ins Deutsche übernommen werden, zunächst unflektiert bleiben und dann nach und nach an das Flexionssystem angepasst werden. Das Antreten des Flexivs -s (zunächst im Plural, später im Genitiv) ist daher lediglich als Symptom für eine voranschreitende Integration zu werten (vgl. die Befunde zur Ausbreitung des s-Genitivs bei geografischen Namen wie Iran und Irak). Die lange Endung -es bleibt dabei in der Regel (bis auf wenige Ausnahmen wie des Busses, des Kongresses oder des Indexes) häufigen Lexemen des Grundbzw. Erbwortschatzes vorbehalten (die lexikalisch für diese Endung spezifiziert sind). Vor diesem Hintergrund erweist sich die Redeweise von einem „Wegfall der Genitivendung“ als nicht ganz zutreffend, da de facto nichts wegfällt: „Neue“ Lexeme bleiben zunächst unflektiert; später tritt ggf. das Flexiv -s hinzu. 225 Eine Ausnahme bildet jedoch der Bereich der Eigennamen: Vor dem Hintergrund des Phänomens der Monoflexion - der kontextbedingten systematischen Alternation von Nullvariante (bei Präsenz eines Genitivartikels) und s-Genitiv (in Kontexten ohne Artikel) - scheint eine Charakterisierung als „Wegfall“ der Kasusmarkierung durchaus angebracht zu sein. 226 Im Bereich des Son- 225 Man beachte, dass diese Art der Variation zwischen endungslosen und overt markierten Formen nur auftritt, wenn der Genitiv bereits am Artikelwort eindeutig markiert ist. Dies folgt auch aus den im Duden (2009, § 1518) formulierten „Grundregeln für die Wortgruppenflexion“, die fordern, dass Substantive (tendenziell) nur dann Kasusendungen tragen, wenn sie „Nebenmerkmalträger“ sind, d.h., wenn der Kasus bereits an anderer Stelle innerhalb der Nominalphrase durch einen „Hauptmerkmalträger“ markiert ist. 226 Diese Perspektive setzt voraus, dass es sich bei dem s-markierten Eigennamen in Beispielen wie Peters/ Berlins Angestellte um eine Genitivphrase handelt (und der Eigenname somit als „Hauptmerkmalträger“ im Sinne von Duden (2009, § 1518) zu betrachten ist). Dies scheint zunächst unverträglich zu sein mit der in der vorangegangenen Fußnote erwähnten Regel, dass Substantive nur als Nebenmerkmalträger Kasusendungen tragen können. Dieser Konflikt lässt sich durch die Annahme auflösen, dass s-markierte Eigennamen tatsächlich keine Genitive sind (vgl. Gesamtbild 256 derwortschatzes liegen somit zwei gegenläufige Tendenzen vor: Während einerseits bei Eigennamen die Bewahrung der Formspezifik - und somit die Neigung zur Nullrealisierung des Genitivs - ein viel größeres Gewicht erhält als bei (integrierten) Appellativa, zeigt sich andererseits diachron eine generelle Entwicklung, die bei zunehmender Integration eines Ausdrucks zum Antreten der Leitvariante -s führt. Im Einzelfall kann es dabei zu Konflikten kommen; erste einschlägige Untersuchungen zu geografischen Namen (Iran(s)/ Irak(s)) scheinen nahezulegen, dass letztere Tendenz, d.h. die Neigung zur s- Markierung bei ansteigender Frequenz/ Geläufigkeit, eine stärkere Wirkung entfaltet. Mit der Einschränkung des Formeninventars auf -s vs. -Ø geht einher, dass systemimmanente Faktoren im Bereich des Sonderwortschatzes eine andere Wirkung entfalten als bei stark integrierten Wörtern. So führt das Vorliegen eines Stammauslauts auf Sibilant im Gegensatz zum Grundwortschatz zu einer Nullrealisierung des Genitivs, weil die auf den Grundwortschatz beschränkte lange Endung -es nicht zur Verfügung steht (eine Ausnahme bilden die bereits genannten integrierten Fremdwörter mit s-Auslaut (und Ultimabetonung)). Man kann also davon sprechen, dass der lexikalische Status eines Elements hinsichtlich Integration/ Desintegration im Bereich des Sonderwortschatzes einen stärkeren Einfluss auf die Endungswahl hat (bzw. darauf, ob ein Ausdruck überhaupt flektiert wird) als Aspekte wie Ausspracheerleichterung oder morphologische Markierung des Genitivs. Marginal steht zwar bei Personennamen auf s-Laut noch das randständige Flexiv -ens (Kunzens) als alternative Möglichkeit zur Realisierung des Genitivs zur Verfügung, aufgrund seiner eingeschränkten Distribution und Produktivität (nach Gallmann 1996, S. 286 handelt es sich „um einen durch Sprachpflege künstlich erhaltenen Anachronismus“) fällt es aber synchron kaum ins Gewicht (dies bestätigen auch unsere Korpusbefunde). Abbildung 56 stellt alle bisher diskutierten Zusammenhänge überblicksartig aus diachroner Perspektive dar. Die wortphonologische Reduktion verschiebt die Orientierung für die flexionsmorphologische Anpassung des Sonderwortschatzes an den Grundwortschatz allmähz.B. Gallmann 1996). Alternativ könnte man die Hypothese vertreten, dass die im Duden formulierte Regel nur für appellativische Substantive, nicht aber für Eigennamen Geltung besitzt. Linguistische Generalisierungen 257 lich von -es in Richtung -s. Elemente verschiedener Sonderwortschatzbereiche weisen unterschiedliche Anpassungsgrade auf bzw. können nach ihrer Einführung nur einen bestimmten Anpassungsgrad erreichen. Dieser kann sich im Laufe der Zeit in die eine oder andere Richtung verschieben. Schon insofern ist die in der Abbildung vorgenommene Anordnung der Sonderwortschatzbereiche im Hinblick auf ihre Entfernung vom Grundwortschatz nur eine grobe Annäherung. Abb. 56: Diachrone Perspektive: Markierungswandel und Anpassungsgrad Abbildung 57 illustriert modellhaft die synchrone Perspektive und rückt die Abhängigkeit der Wahl der Markierungsvariante vom Integrationsgrad des Nomens in den Vordergrund. Das in fast allen Gebrauchsfällen unbewusste Wissen um den Integrationsgrad eines Nomens setzt den Bezugspunkt für die Markierungsvariation, deren Rahmen hauptsächlich durch Interaktion verschiedener grammatikinterner Faktoren bestimmt wird. Die Anordnung der Sonderwortschatzbereiche entlang der Integrationsbzw. Desintegrationslinie ist lediglich tentativ, da es in Einzelfällen (z.B.bei der relativen Position von Zeitangaben und Stilbezeichnungen) nicht immer ohne Weiteres möglich ist, eine eindeutige Hierarchisierung vorzunehmen (siehe unten für einige weiterführende Bemerkungen). Gesamtbild 258 Abb. 57: Synchrone Variation: Integrationsgrad und Markierungsvariation Es ist durchaus denkbar, dass die Tendenz zur Nullmarkierung im Bereich des Sonderwortschatzes noch durch weitere Faktoren befördert wird. An dieser Stelle möchten wir zwei einschlägige Vorschläge aus der Literatur - Homonymievermeidung und den Status der Monoflexion bei Personennamen - kurz diskutieren und relativ zu dem von uns angesetzten komplexen Faktor Integration/ Desintegration einordnen. Wie bereits in Kapitel 3.1.1 erwähnt, vertritt Wegener (1995, S. 155ff.) die Auffassung, dass der Wegfall des s-Genitivs dadurch motiviert ist, dass auf diese Weise eine Homonymie von Singular- und Pluralformen vermieden wird (des DJ-∅, die DJs), was dem Ausbau bzw. der Aufrechterhaltung der Numerusopposition im Bereich des Sonderwortschatzes dienlich ist. Betrachtet man die Distribution der Nullendung etwas näher, wirft dieser Ansatz allerdings eine Reihe von Fragen auf. So bleibt unklar, warum der Wegfall der Genitivendung auch in Bereichen des Sonderwortschatzes zu beobachten ist, die den Plural nicht auf -s bilden (z.B. Wochentage oder Fremdwörter auf s-Laut (Index, Bonus, Rhinozeros etc.)) oder nur selten bzw. gar nicht im Plural stehen (Eigennamen, eigennamenähnliche Ausdrücke, Abstrakta). Zumindest erscheint es wenig plausibel, dass die Aufrechterhaltung eines Numeruskontrasts in diesen Kontexten eine entscheidende Rolle spielt. Linguistische Generalisierungen 259 Darüber hinaus tritt kein analoger Wegfall der Genitivendung bei stark integrierten Wörtern auf, die den Plural auf -s bilden (die Autos, *des Auto), obwohl auch hier Genitiv Singular und Nominativ/ Akkusativ Plural zusammenfallen. Es zeigt sich also, dass Wegeners Erklärungsansatz den Wegfall der Genitivmarkierung in bestimmten Bereichen des Sonderwortschatzes nicht erfassen kann und gleichzeitig falsche Prognosen für integrierte Wörter mit s-Plural macht. 227 Zwar ist es denkbar, dass die Stärkung der Numerusopposition in einigen Teilbereichen des Sonderwortschatzes die Tendenz zur Nullmarkierung des Genitivs verstärkt, als alleinige Erklärung für das Ausbleiben des Genitiv-s sind Wegeners Überlegungen allerdings nicht hinreichend, da sie die zentrale Bedeutung des Faktors Integration/ Desintegration ignorieren. 228 227 In anderen Bereichen der Deklination scheint es allerdings durchaus störende Homonymie zu geben. Entsprechende Effekte lassen sich z.B. für bestimmte Determinierer und Pronomen auf -(e)s beobachten. So kann das unterspezifizierte Demonstrativ dieses, bei dem Nominativ/ Akkusativ Singular Neutrum und Genitiv Singular Maskulinum/ Neutrum zusammenfallen nicht ohne zusätzliches Nomen in Genitivkontexten auftreten: (a) wegen dieses *(Mannes) (b) Lasst uns dieses *(Mannes) gedenken. Andere Formen des Demonstrativs sind aber als Genitiv durchaus zulässig und auch im Korpus attestiert: (c) Natürlich gibt es großartige Tanzszene[n]. Eben wegen dieser kann sich das Stück so hartnäckig halten, und wegen dieser wird wohl auch Malakhovs Rechnung aufgehen und das Berliner Publikum in Scharen strömen. (Berliner Zeitung, 25.4.2005, S. 32) (d) Gestern Morgen fand am Kriegerdenkmal in Hausen die Gedenkfeier zum Volkstrauertag statt. Die Angehörigen der Gefallenen und Vermissten aus dem Ersten und Zweiten Weltkrieg fanden den Weg zur Gedenkstätte, um dieser zu gedenken. (Rhein-Zeitung, 14.11.2005 „Der Toten aus beiden Weltkriegen wurde...“) Wir belassen es an dieser Stelle bei einigen exemplarischen Beispielen. Eine umfassende korpusbasierte Aufarbeitung der Frage, wie Homonymie im Bereich der Genitivmarkierung die syntaktische Distribution von Artikelwörtern und Pronomen beeinflusst, ist eine Aufgabe künftiger Untersuchungen. 228 Überdies kann Wegeners Ansatz nicht erfassen, dass die Wahrscheinlichkeit einer Nullmarkierung des Genitivs offenbar größer wird, wenn ein Ausdruck als Fachbegriff/ Terminus Technicus verwendet wird (vgl. Kap. 3). Auch hier scheinen verschiedene Abstufungen der Integration/ Desintegration von Bedeutung zu sein. Gesamtbild 260 Ein zweiter Aspekt, der häufig in der Literatur diskutiert wird, betrifft den Status der Genitivendung im Zusammenhang mit Elementen - insbesondere Personennamen -, die der Monoflexion unterliegen. Wie in Kapitel 3.3.1.3 erwähnt, wird dabei zumindest in der theoretischen Literatur oft angenommen, dass es sich bei der s-Markierung an pränominalen Personennamen nicht um ein Genitivsuffix, sondern um ein Possessivklitikon (Olsen 1991; Müller 2002a; Fuß 2011) bzw. ein adjektivisches Bildungselement (Gallmann 1996) handelt, das in postnominaler Stellung nicht lizenziert ist (wobei hier „echte“ Genitive wie Objektsgenitive (die Zerstörung Roms) oder der Genitivus auctoris (die Werke Goethes) durchaus möglich sind). Auch wenn diese Analysen im Detail voneinander abweichen und bestimmte Aspekte nicht unproblematisch erscheinen, so können wir doch als übergreifende Gemeinsamkeit festhalten, dass pränominalen Eigennamen und insbesondere Personennamen durchweg eine Sonderstellung im Flexionssystem eingeräumt wird, welche letztlich auf die spezifischen lexikalischsemantischen Eigenschaften dieses Nomentyps zurückzuführen ist. Dieses Resultat scheint durchaus kompatibel zu sein mit der hier vertretenen Hypothese, dass die Wahl des Flexivs (bzw. das Ausbleiben der Kasusflexion) von dem Grad der Integration eines lexikalischen Elements abhängig ist. Vor diesem Hintergrund können die speziellen (semantisch-pragmatischen) Eigenschaften von Eigennamen im Allgemeinen (und Personennamen im Besonderen) als ein möglicher Auslöser einer eingeschränkten Integration betrachtet werden, die sich wiederum in einem speziellen Flexionsverhalten manifestiert (dessen formale Eigenschaften durch die o.g. theoretischen Analysen beschrieben werden). Gleichwohl ist zu konstatieren, dass bisherige Betrachtungen der Monoflexion im Bereich der Genitivmarkierung von Eigennamen noch eine Reihe von Fragen offenlassen. Diese betreffen zum einen empirische Aspekte wie die genauere Abgrenzung unterschiedlicher Typen von Eigennamen (vgl. Kap. 3.3.1.3). Zum anderen herrscht im Zusammenhang mit dem Phänomen der Monoflexion auch keine Einigkeit hinsichtlich der anzustrebenden theoretischen Analyse. Ungeklärte Aspekte betreffen neben Fragen der theoretischen Implementierung u.a. das Verhältnis zu oberflächlich ähnlichen Phänomenen wie der stark/ schwach-Alternation bei Adjektiven sowie die Frage, wie der bereits erwähnte Einfluss der Stellung des Genitivattributs (pränominal vs. postnominal) auf die Flexionseigenschaften theoretisch zu fassen Linguistische Generalisierungen 261 ist. Weitere Forschungsdesiderata, die sich aus der vorliegenden Doppelstudie unmittelbar ergeben, betreffen die morphologische Detailanalyse der hier angesetzten Leitvarianten sowie die theoretische Modellierung des Begriffs der Integration. Eine Frage, die wir in dieser Publikation nicht explizit aufgegriffen haben, betrifft die morphologische Analyse der overten Leitvarianten -s und -es: Handelt es sich dabei um zwei separate Allomorphe, oder ist -es synchron gesehen lediglich als eine Variante der kurzen Endung zu analysieren, die (in bestimmten Kontexten) durch Schwa-Epenthese gebildet wird? Ohne an dieser Stelle eine abschließende Antwort auf diese Frage geben zu wollen, scheint es aber einige Hinweise zu geben, die für die erste Option sprechen. So scheint die Tatsache, dass -es vor allem bei häufigen Wörtern bzw. im ererbten Wortbestand auftritt, gegen eine Analyse als phonologisch/ prosodisch motivierte Schwa- Epenthese zu sprechen. Instruktiv sind auch hier Minimalpaare wie die folgenden, die zeigen, dass die Wahl bzw. Option der langen Endung nicht von der Form des Nomens abhängig ist: (26) a. die Werke Peter Steins/ *-es b. die Farbe des Steins/ -es Vor diesem Hintergrund scheint eine Analyse vielversprechender zu sein, die die lange Endung als historisch ältere Form betrachtet, die sukzessive von der kürzeren Form -s verdrängt wird (vgl. auch Duden 2009, § 301). Eine detaillierte quantitative Analyse dieses diachronen Prozesses steht allerdings noch aus. 229 Eine weitere Frage betrifft die theoretische Analyse der Nullmarkierung des Genitivs. Eine Möglichkeit besteht darin, hier von der Affigierung eines phonetisch leeren Allomorphs der overten Genitivendungen auszugehen. Ein solcher Ansatz macht es allerdings erforderlich, dass die Kontexte, in denen das Nullmorphem verwendet wird, genau spezifiziert werden. Diese Aufgabe ist allerdings keineswegs trivial, da wie gesehen die Nullsetzung des Genitivs durch verschiedene, äußerst heterogene Faktoren ausgelöst wird (lexikalisch: Abkürzungen; lexikalisch + phonologisch: Fremdwörter mit s-Auslaut; syntak- 229 Vgl. aber Szczepaniak (2010, 2014) für eine Reihe relevanter Beobachtungen zur Distribution und historischen Entwicklung der -s/ -es-Alternation. Gesamtbild 262 tisch: Monoflexion bei Eigennamen 230 ). Besonders problematisch sind in diesem Zusammenhang Fälle, in denen Variation zwischen Nullendung und overter Markierung vorliegt. Eine theoretische Alternative bestünde evtl. darin, den Wegfall der Genitivendung als Tilgungsprozess zu betrachten, der in bestimmten Kontexten eine redundante Kasusmarkierung eliminiert - z.B. wenn in einer Genitivphrase, deren Kopf zur Klasse der nicht-integrierten Nomen gehört, der Genitiv bereits am Artikel markiert ist (oder wenn ein s-Auslaut als hinreichende Markierung des Genitivs betrachtet wird). Diese Analyse würde das Phänomen der Monoflexion in die Nähe von Haplologie-Prozessen rücken (vgl. z.B. Nevins 2012). Wir haben in dieser Publikation dafür argumentiert, dass die Wahl der Genitivmarkierung wesentlich vom Grad der Integration eines lexikalischen Elements abhängig ist. Eine präzise formale Charakterisierung dieser Einflussgröße steht allerdings noch aus. Dies führt dazu, dass der Grad der Integration/ Desintegration bestimmter Klassen von Nomina relativ zu anderen Nomina mitunter schwer zu bestimmen ist: Während der Kontrast zwischen den gegenüberliegenden Endpunkten der Skala (häufige Einsilber im ererbten Wortbestand vs. Abkürzungen) noch recht eindeutig ist und sich im Einzelfall auch auf der Skala benachbarte Gruppen klar voneinander abgrenzen lassen (z.B. geografische Namen vs. Personennamen), so mangelt es doch an Kriterien, um den relativen Integrationsgrad von Zeitausdrücken und Stilbezeichnungen oder - noch problematischer - einzelnen Lexemen, die der gleichen Klasse zugehörig sind, eindeutig anzugeben. Die Befunde dieser Arbeit legen nahe, dass die Einflussgröße ‘Integration’ in eine Menge zugrundeliegender (z.T. abstrakter) sprachlicher und außersprachlicher Faktoren zu dekomponieren ist, aus deren Kombination (bzw. relativer Gewichtung) sich die relative Integration eines Lexems ergibt. Aus dieser Perspektive wäre ‘Integration/ Desintegration’ kein eigenständiger Faktor, sondern vielmehr ein Epiphänomen, das sich aus dem Zusammenwirken grundlegenderer Eigenschaften eines lexikalischen Elements ergibt, wobei sich letztere symptomatisch in der Wahl der Markierungsvariante manifestieren. Relevant sind hierbei die folgenden Aspekte (ohne Anspruch auf Vollständigkeit zu erheben): 230 Das Phänomen der Monoflexion wird oft als Resultat eines syntaktisch motivierten Flexionsklassenwechsels analysiert (vgl. z.B. Gallmann 1996); vgl. Kapitel 3.3.1.3 für einige kritische Anmerkungen. Linguistische Generalisierungen 263 - lexikalisch: Zugehörigkeit zum Basisvokabular, Fremdwortcharakter - lexikalisch-semantisch: Appellativum vs. Eigenname; geografischer Name vs. Personenname etc. - phonologisch: Phonotaktik, Silbenzahl - prosodisch: trochäisches Betonungsmuster, wortübergreifende rhythmische Aspekte (u.a. Akzentverteilung in der Phrase und im Satz) - morphologisch: Komplexität des Wortes, Konversion, Verwendung nicht-integrierter (z.B. entlehnter) Bildungselemente - syntaktisch: Einbettung der Genitivphrase, Beschränkung auf bestimmte Positionen (z.B. pränominales vs. postnominales Genitivattribut), konstruktionsspezifische Eigenschaften - außersprachlich: Frequenz, Zugehörigkeit zu bestimmten diaphasischen (Stil, Register), diastratischen (Soziolekte) und diatopischen Varietäten (Regionalsprachen, dialektale Interferenz) Von den genannten Punkten haben wir nur eine Teilmenge im Rahmen der vorliegenden Doppelstudie behandeln können. Dabei haben wir uns vor allem auf Faktoren konzentriert, die auf der Wortebene greifen, während andere Aspekte unberücksichtigt bleiben mussten. Für die Anschlussforschung, die mit einer ähnlichen (in jedem Fall empirischen) Methodik arbeitet, ergeben sich daher aus unserer Sicht u.a. folgende dringende Fragestellungen: - Wortgruppenflexion: relative Häufigkeit der Genitivphrasen verschiedener Typen; Abhängigkeit der Markierungsvariation von der Struktur der Phrase, insbesondere von dem Vorhandensein und der Form des Artikels (vgl. Kap. 1.2) - Prosodie: Abhängigkeit der Markierungsvariation von rhythmischen Verhältnissen in der Phrase und im Satz - Einbettung der Genitivphrase: relative Häufigkeit der syntaktisch unterschiedlich eingebetteten Genitivphrasen (vgl. Kap. 1.2) sowie die relative Häufigkeit der Markierungsvarianten bei den verschiedenen Einbettungen Gesamtbild 264 - Diaphasie: Abhängigkeit der Markierungsvariation von der Mündlichkeitsnähe, dem Register, der Textsorte und der thematischen Domäne Wir können also abschließend festhalten, dass noch genügend Raum für zukünftige Forschungen bleibt, zu denen wir hoffen, mit der vorliegenden Arbeit einen Anstoß geliefert zu haben. 5. LITERATUR Ackermann, Tanja (2014): Probleme der (morpho)syntaktischen Kategorisierung von Eigennamen. Vortrag im Rahmen der DGfS Jahrestagung 2014 (AG7: Probleme der syntaktischen Kategorisierung; www.uni-leipzig.de/ ˜doering/ AG/ _PraesHandout/ Ackermann.pdf). Admoni, Wladimir (1982): Der deutsche Sprachbau. 4. Aufl. München: Beck. Ágel, Vilmos (2006): (Nicht)Flexion des Substantiv(s). Neue Überlegungen zum finiten Substantiv. In: Zeitschrift für Germanistische Linguistik 34, 3, S. 286-327. Appel, Elsbeth (1941): Vom Fehlen des Genitiv-s. München: Beck. Baayen, R. Harald/ Piepenbrock, Richard/ Gulikers, Leon (1995): The CELEX Lexical Database ( CD-ROM ). Philadelphia: Linguistic Data Consortium. Bauer, Heinrich (1827-1833): Vollständige Grammatik der neuhochdeutschen Sprache. Berlin: Reimer. Belica, Cyril/ Kupietz, Marc/ Witt, Andreas/ Lüngen, Harald (2011): The morphosyntactic annotation of D E R E K O : interpretation, opportunities, and pitfalls. In: Konopka, Marek/ Kubczak, Jacqueline/ Mair, Christian/ Šticha, František/ Waßner, Ulrich H. (Hg.): Grammatik und Korpora 2009. Dritte Internationale Konferenz. Mannheim, 22.-24.09.2009. (= Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache (CLIP) 1). Tübingen: Narr, S. 451-469. Brandt, Patrick/ Fuß, Eric (2014): Most questionable pronouns: Variation between dasvs. was-relatives in German. In: Linguistische Berichte 239, S. 297-329. Bubenhofer, Noah/ Brinckmann, Caren/ Hein, Katrin (2014): Maschinelles Lernen zur Vorhersage von Fugenelementen in nominalen Komposita. In: Bubenhofer/ Konopka/ Schneider et al., S. 183-227. Bubenhofer, Noah/ Hansen-Morath, Sandra/ Konopka, Marek (2014): Korpusbasierte Exploration der Variation der nominalen Genitivmarkierung. In: Zeitschrift für Germanistische Linguistik 42, 3, S. 379-419. Bubenhofer, Noah/ Konopka, Marek/ Schneider, Roman et al. (2014): Präliminarien einer Korpusgrammatik. (= CLIP 4. Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache). Tübingen: Narr. Connexor. www.connexor.eu/ technology/ machinese/ index.html. (Stand: Juli 2013). Demske, Ulrike (2001): Grammatische Merkmale und Relationen: Diachrone Studien zur Nominalphrase des Deutschen. Berlin/ New York: de Gruyter. Literatur 266 Donalies, Elke (2011): Grammatische Variation im Deutschen: Tagtraum, Tageslicht, Tagedieb. Ein korpuslinguistisches Experiment zu variierenden Wortformen und Fugenelementen in zusammengesetzten Substantiven. Mit einem Exkurs und zahlreichen Statistiken von Noah Bubenhofer. (= amades - Arbeitspapiere und Materialien zur deutschen Sprache 42). Mannheim: Institut für Deutsche Sprache. Donhauser, Karin (1998): Das Genitivproblem und (k)ein Ende? Anmerkungen zur aktuellen Diskussion um die Ursachen des Genitivschwundes im Deutschen. In: Askedal, John Ole (Hg.): Osloer Beiträge zur Germanistik 21: Historische germanische und deutsche Syntax. Akten des internationalen Symposiums anlässlich des 100. Geburtstages von Ingerid Dal, Oslo, 27.9.-1.10.1995. Frankfurt a.M.: Lang, S. 69-86. Duden (2007): Richtiges und gutes Deutsch. Wörterbuch der sprachlichen Zweifelsfälle. 6. vollst. überarb. Aufl. (= Duden 9). Mannheim u.a.: Dudenverlag. Duden (2009): Die Grammatik: Unentbehrlich für richtiges Deutsch. 8. überarb. Aufl. (= Duden 4). Mannheim u.a.: Dudenverlag. Dürscheid, Christa (2007): Quo vadis, Casus? Zur Entwicklung der Kasusmarkierung im Deutschen. In: Lenk, Hartmut E.H./ Walter, Maik (Hg.): Wahlverwandtschaften. Valenzen - Verben - Varietäten. Festschrift für Klaus Welke zum 70. Geburtstag. Hildesheim: Olms, S. 89-112. Ebert, Robert P./ Reichmann, Oskar/ Solms, Hans-Joachim/ Wegera, Klaus-Peter (Hg.) (1993): Frühneuhochdeutsche Grammatik. Tübingen: Niemeyer. Eichinger, Ludwig M. (2012): Gutes Weines, frohes Muthes, reines Herzens - Geschichten vom Genitiv. In: Konopka, Marek/ Schneider, Roman (Hg.): Grammatische Stolpersteine digital. Festschrift für Bruno Strecker zum 65. Geburtstag. Mannheim: Institut für Deutsche Sprache, S. 83-104. Eisenberg, Peter (1991): Syllabische Struktur und Wortakzent. In: Zeitschrift für Sprachwissenschaft 10, 1, S. 37-64. Eisenberg, Peter (2001): Die grammatische Integration von Fremdwörtern. Was fängt das Deutsche mit seinen Latinismen und Anglizismen an? In: Stickel, Gerhard (Hg.): Neues und Fremdes im deutschen Wortschatz. (= Jahrbuch des Instituts für Deutsche Sprache 2000). Berlin: de Gruyter, S. 183-209. Eisenberg, Peter (2004): Das Wort. Grundriß der deutschen Grammatik. 2. Aufl. Stuttgart: Metzler. Erben, Johannes (1972): Deutsche Grammatik. München: Hueber. Fehringer, Carol (2011): Allomorphy in the German genitive. A paradigmatic account. In: Zeitschrift für Germanistische Linguistik 39, 1, S. 90-112. Literatur 267 Fürbacher, Monika (2015): Spezialstudie zur regionalen Verteilung von Genitivendungen. In: Grammis 2.0. Das grammatische Informationssystem des Instituts für Deutsche Sprache. http: / / hypermedia.ids-mannheim.de/ call/ public/ korpus.ansicht? v_id=5087 (Stand: Juni 2015). Fuß, Eric (2011): Eigennamen und adnominaler Genitiv im Deutschen. In: Linguistische Berichte 225, S. 19-42. Gallmann, Peter (1996): Die Steuerung der Flexion in der DP. In: Linguistische Berichte 164, S. 283-314. Gallmann, Peter (1997): Zur Morphosyntax der Eigennamen im Deutschen. In: Löbel, Elisabeth/ Rauh, Gisa (Hg.): Lexikalische Kategorien und Merkmale. Tübingen: Niemeyer, S. 73-86. Gries, Stefan Th. (2008): Statistik für Sprachwissenschaftler. Göttingen: Vandenhoeck & Ruprecht. Griesbach, Heinz (1990): Neue deutsche Grammatik. Berlin: Langenscheidt. Hansen, Sandra/ Schneider, Roman (2013): Decision tree-based evaluation of genitive classification - an empirical study on CMC and text corpora. Language processing and knowledge in the web. (= Springer Lecture Notes in Computer Science 8105), S. 83-88. Hentschel, Elke/ Weydt, Harald (2003): Handbuch der deutschen Grammatik. Berlin/ New York: de Gruyter. Hentschel, Elke (1993): Flexionsverfall im Deutschen? Die Kasusmarkierung bei partitiven Genitiv-Attributen. In: Zeitschrift für Germanistische Linguistik 21, 3, S. 320-333. Hooper, Joan L. (1976): An Introduction to natural generative phonology. New York: Academic Press. Institut für Deutsche Sprache (2011a): Deutsches Referenzkorpus/ Archiv der Korpora geschriebener Gegenwartssprache 2011-I (Release vom 29.3.2011). Mannheim: Institut für Deutsche Sprache. www.ids-mannheim.de/ DeReKo (Stand: Juli 2013). Jaeger, T. Florian (2008): Categorical data analysis: Away from ANOVA s (transformation or not) and towards Logit Mixed Models. In: Journal of Memory and Language 59, 4, S. 434-446. www.ncbi.nlm.nih.gov/ pmc/ articles/ PMC2613284/ (Stand: Januar 2015). Jung, Walter (1990): Grammatik der deutschen Sprache. Mannheim/ Leipzig: Bibliographisches Institut. Konopka, Marek (2015): Sich der guten Zeiten und sich an die guten Zeiten erinnern oder vielleicht auch die guten Zeiten erinnern? Die Genitivverben. In: Domínguez Vázquez, María José/ Eichinger, Ludwig M. (Hg.): Valenz im Fokus. Grammatische und lexikographische Studien. Festschrift für Jacqueline Kubczak. Mannheim: Institut für Deutsche Sprache, S. 139-157. Literatur 268 Köpcke, Klaus-Michael (1982): Untersuchungen zum Genussystem der deutschen Gegenwartssprache. Tübingen: Niemeyer. Krischke, Wolfgang (2012): Des Menschens Genitive. Normabweichende Genitiv-Varianten bei schwachen Maskulina. In: Linguistik Online 53, 3, S. 55-84. Kürschner, Sebastian (2009): Morphological non-blocking in Dutch plural allomorphy: a contrastive approach. In: Sprachtypologie und Universalienforschung (STUF), 62, 4. Berlin: Akademieverlag, S. 285-306. Müller, Gereon (2002a): Syntaktisch determinierter Kasuswegfall in der deutschen NP. In: Linguistische Berichte 189, S. 89-114. Müller, Gereon (2002b): Remarks on nominal inflection in German. In: Kaufmann, Ingrid/ Stiebels, Barbara (Hg.): More than words: A Festschrift for Dieter Wunderlich. Berlin: Akademieverlag, S. 113-145. Munske, Horst Haider (1988): Ist das Deutsche eine Mischsprache? Zur Stellung der Fremdwörter im deutschen Sprachsystem. In: Munske, Horst Haider (Hg.): Deutscher Wortschatz. Lexikologische Studien. Berlin: de Gruyter, S. 46-74. Nevins, Andrew (2012): Haplological dissimilation at distinct stages of exponence. In: Trommer, Jochen (Hg.): The morphology and phonology of exponence. Oxford: Oxford University Press, S. 84-116. Nübling, Damaris (2012): Auf dem Wege zu Nicht-Flektierbaren: Die Deflexion der deutschen Eigennamen diachron und synchron. In: Rothstein, Björn (Hg.): Nicht-flektierende Wortarten. Berlin/ Boston: de Gruyter, S. 224-246. Nübling, Damaris (2014): Sprachverfall? Sprachliche Evolution am Beispiel des diachronen Funktionszuwachses des Apostrophs im Deutschen. In: Plewnia, Albrecht/ Witt, Andreas (Hg.): Sprachverfall? Dynamik - Wandel - Variation. (= Jahrbuch des Instituts für Deutsche Sprache 2013). Berlin/ Boston: de Gruyter, S. 99-123. Olsen, Susan (1991): Die deutsche Nominalphrase als Determinansphrase. In: Olsen, Susan/ Fanselow, Gisbert (Hg.): Det, Comp und Infl. Tübingen: Niemeyer, S. 35-56. Paul, Hermann (1917): Deutsche Grammatik II, III: Flexionslehre. Halle: Niemeyer. Paulfranz, Alexandra (2013): Kasusmarkierungen der Gegenwartssprache in deutschen Lokal- und Regionaltageszeitungen. Bamberg: University of Bamberg Press. Peschel, Corinna (2009): Grammatische Zweifelsfälle als Thema des Deutschunterrichts? Das Beispiel der ‘schwachen Maskulina’. In: Hennig, Mathilde/ Müller, Christoph (Hg.): Wie normal ist die Norm? Sprachliche Normen im Spannungsfeld von Sprachwissenschaft, Sprachöffentlichkeit und Sprachdidaktik. Kassel: Universitätsbibliothek, S. 39-59. Literatur 269 Pfeffer, J. Alan/ Morrison, Scott E. (1979): The genitive singular with -s and/ or -es in spoken and written German. In: Malmberg, Bertil/ Nickel, Gerhard: International Review of Applied Linguistics in Language Teaching (IRAL) 17. Heidelberg: Groos, S. 303-311. Pfeffer, J. Alan/ Morrison, Scott E. (1984): The genetive singular with -s and/ or -es in spoken and written German. In: Pfeffer, J. Alan (Hg.): Studies in descriptive German grammar. Heidelberg: Groos, S. 9-18. Poitou, Jacques (2004): Prototypentheorie und Flexionsmorphologie. Linguistik online 19, S. 72-93. Quinlan, John Ross (1993): C4.5: programs for machine learning. San Francisco: Kaufmann. R Core Team (2014). R: A language and environment for statistical computing. R Foundation for Statistical Computing. Wien. www.R-project.org/ (Stand: Oktober 2014). Raffelsiefen, Renate (2000): Evidence for word-internal phonological words in German. In: Fuhrhop, Nanna et al. (Hg.) (2000): Deutsche Grammatik in Theorie und Praxis. Tübingen: Niemeyer. S. 43-56. Rowley, Anthony (1998): Zum Genitiv des ganz besonderen Typ. In: Muttersprache 98, S. 58-68. Schmid, Helmut (1994): Probabilistic part-of-speech tagging using decision trees. Proceedings of International Conference on New Methods in Language Processing. Manchester. Schneider, Roman (2014): GenitivDB - a corpus-generated database for German genitive classification. In: Calzolari, Nicoletta et al. (Hg.): Proceedings of Language Resources and Evaluation Conference (LREC-2014). Reykjavik. www.lrec-conf.org/ proceedings/ lrec2014/ index.html (Stand: Januar 2015). Schulz, Dora/ Griesbach, Heinz (1978): Grammatik der deutschen Sprache. München: Hueber. Sheskin, David J. (2003). Handbook of parametric and nonparametric statistical procedures. 3. Aufl. Boca Raton, FL: Chapman & Hall. Sommerfeldt, Karl-Ernst/ Starke, Günther (1998): Einführung in die Grammatik der deutschen Gegenwartssprache. Tübingen: Niemeyer. Stricker, Stefanie/ Bergmann, Rolf/ Wich-Reif, Claudia (2012): Sprachhistorisches Arbeitsbuch zur deutschen Gegenwartssprache. Heidelberg: Winter. Szczepaniak, Renata (2010): Während des Flug(e)s/ des Ausflug(e)s? German short and long genitive endings between norm and variation. In: Lenz, Alexandra, N./ Plewnia, Albrecht (Hg.): Grammar between norm and variation. Frankfurt a.M.: Lang, S. 103-126. Literatur 270 Szczepaniak, Renata (2014): Sprachwandel und sprachliche Unsicherheit. Der formale und funktionale Wandel des Genitivs seit dem Frühneuhochdeutschen. In: Plewnia, Albrecht/ Witt, Andreas (Hg.): Spachverfall? Dynamik - Wandel - Variation. (= Jahrbuch des Instituts für Deutsche Sprache 2013). Berlin/ Boston: de Gruyter, S. 33-49. Szczepaniak, Renata (2015): Die grammatikographische Erfassung der formalen Genitivvariation. Vortrag im Rahmen der Tagung ars grammatica. Mannheim, 19.6.2015. Thieroff, Rolf (2000): Morphosyntax nominaler Einheiten im Deutschen. Habil. Univ. Bonn. Vennemann, Theo (1988): Preference laws for syllable structure and the explanation of sound change. Berlin/ New York: de Gruyter. Wegener, Heide (1995): Die Nominalflexion des Deutschen - verstanden als Lerngegenstand. Tübingen: Niemeyer. Wegener, Heide (2003): Normprobleme bei der Pluralbildung fremder und nativer Substantive. In: Linguistik online 16, S. 119-157. Wegera, Klaus-Peter (1987): Grammatik des Frühneuhochdeutschen III: Flexion der Substantive. Heidelberg: Winter. Weier, Winfried (1968): Der Genitiv im neuesten Deutsch. Muttersprache 78, 1, S. 222-235. Weinrich, Harald (2005): Textgrammatik der deutschen Sprache. Hildesheim: Olms. Wiedenmann, Nora (2004): Versprechen - oder der Verlust des Genitiv-s im Deutschen als einsetzender Sprachwandel? In: Estudios Filológicos Alemanes 4, S. 337-374. Winter, Werner (1966): Von Genitiv im heutigen Deutsch. In: Zeitschrift für deutsche Sprache 22, S. 21-35. Witten, Ian/ Frank, Eibe: (2005). Data mining: Practical machine learning tools and techniques. San Francisco: Kaufmann. Wöllstein, Angelika (2015): Grammatik - explorativ. Hypothesengeleitete und -generierende Exploration variierender Satzkomplementationsmuster im standardnahen Deutsch. In: Eichinger, Ludwig M. (Hg.): Sprachwissenschaft im Fokus. Positionsbestimmungen und Perspektiven. (= Jahrbuch des Instituts für Deutsche Sprache 2014). Berlin/ Boston: de Gruyter, S. 93-120. Wurzel, Wolfgang Ullrich (1993): „Genitivverwirrung“ im Deutschen - wie regulär ist morphologischer Wandel? In: Boretzky, Norbert et al. (Hg.): Sprachwandel und seine Prinzipen. Beiträge zum 8. Bochum-Essener Kolloquium über „Sprachwandel und seine Prinzipien“ vom 19.10.- 21.10.1990 an der Ruhruniversität Bochum. (= Bochum-Essener Beiträge zur Sprachwandelforschung 14). Bochum: Brockmeyer, S. 168-181. Zifonun, Gisela et al. (1997): Grammatik der deutschen Sprache. 3 Bde. Berlin/ New York: de Gruyter. 6. ANHANG Quantitative Daten zu Kapitel 1 und 2 Kapitel 1.5 Tabelle 1: Relative Häufigkeit der verschiedenen Varianten in der Genitivdatenbank (Token) Markierung Anzahl Token Token in % -es 1.716.728 23,8% -ses 29.727 0,4% -s 4.772.892 66,1% -ens 13.611 0,2% -ns 15.163 0,2% -’s 20.027 0,3% -[s]’ 7.883 0,1% -Ø 642.575 8,9% Gesamt 7.218.605 100,0% Kapitel 2.4 Tabelle 2: Häufigkeit der Varianten in Sonderwortschatz-Gruppen (Sondergruppen) Wortschatzbereich ES a) S Nullendung Gesamt Anteil ES Anteil S Anteil Nullendungen Gesamt Konversionen 0 6.949 395 7.344 0,00% 94,62% 5,38% 100,00% Neologismen 12 21.125 9.136 30.273 0,04% 69,78% 30,18% 100,00% Fremdwörter 554 340.418 92.215 433.187 0,13% 78,58% 21,29% 100,00% Abkürzungen 168 28.685 78.917 107.770 0,16% 26,62% 73,23% 100,00% Anhang 272 Wortschatzbereich ES a) S Nullendung Gesamt Anteil ES Anteil S Anteil Nullendungen Gesamt Eigennamen 36.330 1.600.282 313.399 1.950.011 1,86% 82,07% 16,07% 100,00% Stilbezeichnungen 697 1.720 6.319 8.736 7,98% 19,69% 72,33% 100,00% Zeitausdrücke 6.721 21.361 11.250 39.332 17,09% 54,31% 28,60% 100,00% alle Nomina der Sondergruppen b) 44.467 19.626.491 429.045 2.436.161 1,83% 80,56% 17,61% 100,00% Nomina ohne Sondergruppen 1.701.987 2.859.044 221.413 4.782.444 35,59% 59,78% 4,63% 100,00% alle Nomina 1.746.454 4.821.693 650.458 7.218.605 24,19% 66,80% 9,01% 100,00% a) ES zerfällt in -es und -ses, S in -s, -ens, -ns und -’s, Nullendung in - Ø und -[s]’ (vgl. Kap. 2). b) Bei ‘alle Nomina der Sondergruppen’ handelt es sich nicht einfach um die Summen der darüber liegenden Zeilen. Letztere fallen höher aus, weil es zahlreiche Fälle gibt, in denen Lemmata mehreren Sondergruppen gleichzeitig zugeordnet wurden, z.B. ist WWW als Eigenname, Abkürzung und Neologismus markiert. Tabelle 3: Häufigkeitsklassen und Endungsvariation Häufigkeitsklasse ES S Gesamt Anteil ES Anteil S Gesamt 5 156.713 881 157.594 99,4% 0,6% 100,0% 7 174.768 659 175.427 99,6% 0,4% 100,0% 8 27.665 59.322 86.987 31,8% 68,2% 100,0% Zwischensumme 359.146 60.862 420.008 85,5% 14,5% 100,0% 9-29 677.447 969.549 1.646.996 41,1% 58,9% 100,0% Gesamt 1.036.593 1.030.411 2.067.004 50,1% 49,9% 100,0% Anhang 273 In den folgenden Tabellen weichen Verteilungen aller Faktoren laut Chi-Quadrat-Tests (meist höchst) signifikant von der jeweils erwarteten Verteilung ab (Konfidenzniveau mindestens 95%). Tabelle 4: Starke Faktoren im Vergleich Faktor ES S Anteil ES Anteil S Phi Odds Ratio log 10 Odds Ratio Nomen auf das Suffix -chen, -lein 0 29.318 0,00% 100,00% n.a. 0,00 n.a. nicht auf das Suffix -chen, -lein 1.709.398 2.846.520 37,52% 62,48% Gesamt a) 4.585.236 Nomen auf eine (unbetonte) Silbe mit dem Reim -el, -em, -en, -end, -er 52 1.088.788 0,00% 100,00% 0,43 0,00 -4,30 nicht auf eine (unbetonte) Silbe mit dem Reim -el, -em, -en, -end, -er 1.709.346 1.787.050 48,89% 51,11% Gesamt: 4.585.236 Nomen auf das Suffix -ling, -mal, -sal, -sam, -tum 137 40.119 0,34% 99,66% 0,07 0,01 -2,25 nicht auf das Suffix -ling, -mal, -sal, -sam, -tum 1.709.261 2.835.719 37,61% 62,39% Gesamt: 4.585.236 Nomen auf eine (unbetonte) Silbe mit dem Reim-ich, -ing, -ig 31 6.361 0,48% 99,52% 0,03 0,01 -2,09 Anhang 274 Faktor ES S Anteil ES Anteil S Phi Odds Ratio log 10 Odds Ratio nicht auf eine (unbetonte) Silbe mit dem Reim-ich, -ing, -ig 1.709.367 2.869.477 37,33% 62,67% Gesamt: 4.585.236 Nomen auf Vokal (ohne Diphthong) 165 99.421 0,17% 99,83% 0,11 0,00 -2,57 nicht auf Vokal 1.709.233 2.776.417 37,38% 62,62% Gesamt: 4.585.236 Sondergruppen (ohne Stilbezeichnungen und Zeitausdrücke) 37.056 1.945.855 1,87% 98,13% 0,37 0,03 -1,49 alle Nomina ohne Sondergruppen 1.709.398 2.875.838 37,28% 62,72% Gesamt b) 6.568.147 Nomen auf Diphthong 2.961 25.059 10,57% 89,43% 0,04 0,20 -0,70 nicht auf Diphthong 1.706.437 2.850.779 37,44% 62,56% Gesamt: 4.585.236 variantes Nomen c) 705.112 1.028.871 40,66% 59,34% 0,05 1,26 0,10 sonstiges Nomen (ohne Sondergruppen) 1.004.286 1.846.967 35,22% 64,78% Gesamt: 4.585.236 Nomen auf sch-Laut 10.250 2.753 78,83% 21,17% 0,05 6,30 0,80 nicht auf sch-Laut 1.699.148 2.873.085 37,16% 62,84% Gesamt: 4.585.236 Anhang 275 Faktor ES S Anteil ES Anteil S Phi Odds Ratio log 10 Odds Ratio Nomen auf st-Gruppe 64.242 10.089 86,43% 13,57% 0,13 11,09 1,05 nicht auf st-Gruppe 1.645.156 2.865.749 36,47% 63,53% Gesamt: 4.585.236 Nomen auf s-Laut 422.615 11.771 97,29% 2,71% 0,40 79,91 1,90 nicht auf s-Laut 1.286.783 2.864.067 31,00% 69,00% Gesamt: 4.585.236 Frequenz HK < 8 331.481 4.150 98,76% 1,24% 0,34 166,47 2,22 Frequenz HK > 7 1.377.917 2.871.688 32,42% 67,58% Gesamt: 4.585.236 a) Alle Nomen ohne die Sondergruppen Konversionen, Neologismen, Fremdwörter, Abkürzungen und Eigennamen. b) Alle Nomina mit einer Endung. c) Berücksichtigt sind hier nur die von den positiven Ausprägungen der starken Faktoren unbeeinflussten Nomina, zu denen ein CELEX-Eintrag vorliegt (zur Begründung vgl. Kap. 2.5.1) Kapitel 2.5 Tabelle 5: Schwache Faktoren im Vergleich Faktor ES S Anteil ES Anteil S Phi Odds Ratio log 10 Odds Ratio Sonoritätshierarchie Liquid 53.450 177.797 23,11% 76,89% 0,14 0,39 -0,41 kein Liquid 651.662 851.074 43,37% 56,63% Gesamt: 1.733.983 Nasal 48.500 201.531 19,40% 80,60% 0,18 0,30 -0,52 kein Nasal 656.612 827.340 44,25% 55,75% Gesamt: 1.733.983 Anhang 276 Faktor ES S Anteil ES Anteil S Phi Odds Ratio log 10 Odds Ratio Frikativ 52.119 79.233 39,68% 60,32% 0,01 0,96 -0,02 kein Frikativ 652.993 949.638 40,75% 59,25% Gesamt: 1.733.983 Plosiv 541.197 566.130 48,87% 51,13% 0,22 2,70 0,43 kein Plosiv 163.915 462.741 26,16% 73,84% Gesamt: 1.733.983 Affrikate / pf/ 9.846 4.161 70,29% 29,71% 0,05 3,49 0,54 keine Affrikate / pf/ 695.266 1.024.710 40,42% 59,58% Gesamt: 1.733.983 Vokallänge: lang (ohne Diphthong) 290.150 369.845 43,96% 56,04% 0,05 1,25 0,10 nicht lang 414.962 659.026 38,64% 61,36% Gesamt: 1.733.983 Vokallänge: kurz 369.967 529.891 41,11% 58,89% 0,03 1,04 0,02 nicht kurz 335.145 498.980 40,18% 59,82% Gesamt: 1.733.983 Vokalhöhe: hoch 167.019 293.127 36,30% 63,70% 0,05 0,78 -0,11 nicht hoch 538.093 735.744 42,24% 56,33% Gesamt: 1.733.983 Vokalhöhe: mittel 168.517 301.836 35,83% 64,17% 0,06 0,76 -0,12 nicht mittel 536.595 727.035 42,46% 56,10% Gesamt: 1.733.983 Vokalhöhe: tief 324.581 304.773 51,57% 48,43% 0,17 2,03 0,31 nicht tief 380.531 724.098 34,45% 65,55% Gesamt: 1.733.983 Anhang 277 Faktor ES S Anteil ES Anteil S Phi Odds Ratio log 10 Odds Ratio Vokallänge/ -höhe: Diphthong 44.995 129.135 25,84% 74,16% 0,11 0,47 -0,32 kein Diphthong 660.117 899.736 42,32% 57,68% Gesamt: 1.733.983 Betonung: Ultima 543.353 597.565 47,62% 52,38% 0,20 2,42 0,38 nicht Ultima 161.759 431.306 27,28% 72,72% Gesamt: 1.733.983 Betonung: Pänultima 92.453 257.361 26,43% 73,57% 0,15 0,45 -0,34 nicht Pänultima 612.659 771.510 44,26% 55,74% Gesamt: 1.733.983 Komposition 298.791 501.406 37,34% 62,66% 0,06 0,77 -0,11 keine Komposition 406.321 527.465 43,51% 56,49% Gesamt: 1.733.983 Genus: Maskulinum 470.334 636.821 42,48% 57,52% 0,05 1,23 0,9 nicht Maskulinum 234.777 392.038 37,46% 62,54% Gesamt: 1.733.970 Genus: Neutrum 234.134 387.393 37,67% 62,33% 0,05 0,82 -0,08 nicht Neutrum 470.977 641.345 42,34% 57,66% Gesamt: 1.733.849 Konsonantengruppe 338.329 364.621 48,13% 51,87% 0,13 1,68 0,23 keine Konsonantengruppe 366.783 664.250 35,57% 64,43% Gesamt: 1.733.983 Anhang 278 Faktor ES S Anteil ES Anteil S Phi Odds Ratio log 10 Odds Ratio variantes Nomen 705.112 1.028.871 40,66% 59,34% 0,05 1,25 0,1 sonstiges Nomen (ohne Sondergruppen) 1.002.525 1.834.258 35,34% 64,66% Gesamt: 4.570.766 Silbenanzahl: 1 314.561 130.293 70,71% 27,31% 0,38 5,55 0,74 Silbenanzahl: > 1 390.551 898.578 30,30% 69,70% Gesamt: 1.733.983 Tabelle 6: Vokallänge in geschlossener letzter Silbe Nomen auf einen oder mehrere Konsonanten Faktor ES S Anteil ES Anteil S Phi Odds Ratio log 10 Odds Ratio Vokallänge: Diphthong 44.995 129.135 25,84% 74,16% 0,10 0,47 -0,32 kein Diphthong 660.117 899.736 42,32% 57,68% Gesamt: 1.733.983 Vokallänge: kurz 369.967 529.891 41,11% 58,89% 0,01 1,04 0,02 nicht kurz 335.145 498.980 40,18% 59,82% Gesamt: 1.733.983 Vokallänge: lang 290.150 369.845 43,96% 56,04% 0,05 1,25 0,10 nicht lang 414.962 659.026 38,64% 61,36% Gesamt: 1.733.983 alle Nomina 705.112 1.028.871 40,66% 59,34% - - - Gesamt: 1.733.983 Anhang 279 Einsilber auf einen oder mehrere Konsonanten ES S Anteil ES Anteil S Phi Odds Ratio log 10 Odds Ratio Vokallänge: Diphthong 24.832 15.771 61,16% 38,84% 0,07 0,62 -0,21 kein Diphthong 289.729 114.522 Gesamt: 444.854 Vokallänge: kurz 163.109 71.630 69,49% 30,51% 0,03 0,88 -0,05 nicht kurz 151.452 58.663 Gesamt: 444.854 Vokallänge: lang 126.620 42.892 74,70% 25,30% 0,07 1,37 0,14 nicht lang 187.941 87.401 Gesamt: 444.854 alle Einsilber 314.561 130.293 70,71% 29,29% - - - Gesamt: 444.854 Einsilber auf Einzelkonsonant ES S Anteil ES Anteil S Phi Odds Ratio log 10 Odds Ratio Vokallänge: Diphthong 11.786 13.178 47,21% 52,79% 0,16 0,36 -0,44 kein Diphthong 151.069 59.229 71,84% 28,16% Gesamt: 238.581 Vokallänge: kurz 25.763 14.595 63,84% 36,16% 0,05 0,74 0,13 nicht kurz 137.092 57.812 70,34% 29,66% Gesamt: 238.581 Vokallänge: lang 115.584 40.436 74,08% 25,92% 0,15 1,93 0,29 nicht lang 47.271 31.971 59,65% 40,35% Gesamt: 238.581 Anhang 280 Einsilber auf Einzelkonsonant ES S Anteil ES Anteil S Phi Odds Ratio log 10 Odds Ratio alle Einsilber auf Einzelkonsonant 163.935 74.646 68,71% 31,29% Gesamt: 238.581 Tabelle 7: Vokalhöhe in geschlossener letzter Silbe Faktor ES S Anteil ES Anteil S Phi Odds Ratio log 10 Odds Ratio Vokalhöhe: Diphthong 44.995 129.135 25,84% 76,16% 0,10 0,48 -0,32 kein Diphthong 660.117 899.736 25,84% 57,68% Gesamt: 1.733.983 Vokalhöhe: mittel 168.517 301.836 25,84% 64,17% 0,06 0,76 -0,12 nicht mittel 536.595 727.035 42,46% 57,54% Gesamt: 1.733.983 Vokalhöhe: hoch 167.019 293.127 36,30% 63,70% 0,05 0,78 -0,11 nicht hoch 538.093 735.744 42,24% 57,76% Gesamt: 1.733.983 Vokalhöhe: tief 32.4581 304.773 51,57% 48,43% 0,17 2,03 0,31 nicht tief 380.531 724.098 34,45% 65,55% Gesamt: 1.733.983 alle Nomina 705.112 1.028.871 40,66% 59,34% Gesamt: 2.762.854 Anhang 281 Tabelle 8: Vokalqualität in geschlossener letzter Silbe Faktor ES S Anteil ES Anteil S Phi Odds Ratio log 10 Odds Ratio / i/ 88.012 186.574 32,1% 67,9% 0,08 0,64 -0,19 kein / i/ 617.100 842.297 42,3% 57,7% Gesamt: 1.733.983 / u/ 78.895 105.795 42,7% 57,3% 0,01 1,10 0,04 kein / u/ 626.217 923.076 40,4% 59,6% Gesamt: 1.733.983 / o/ 105.608 103.862 50,4% 49,6% 0,07 1,57 0,20 kein / o/ 599.504 925.009 39,3% 60,7% Gesamt: 1.733.983 / e/ 62.904 193.951 24,5% 75,5% 0,14 0,42 -0,38 kein / e/ 642.208 834.920 43,5% 56,5% Gesamt: 1.733.983 / a/ 324.581 304.773 51,57% 48,43% 0,17 2,03 0,31 kein / a/ 380.531 724.098 34,45% 65,55% Gesamt: 1.733.983 Tabelle 9: Konsonantenart des Auslautkonsonanten Nomen auf einen oder mehrere Konsonanten Faktor ES S Anteil ES Anteil S Phi Odds Ratio log 10 Odds Ratio Nasal 48.500 201.531 19,40% 80,60% 0,18 0,30 -0,52 kein Nasal 656.612 827.340 44,25% 55,75% Gesamt: 1.733.983 Liquid 53.450 177.797 23,11% 76,89% 0,14 0,39 -0,41 kein Liquid 651.662 851.074 43,37% 56,63% Gesamt: 1.733.983 Anhang 282 Nomen auf einen oder mehrere Konsonanten Faktor ES S Anteil ES Anteil S Phi Odds Ratio log 10 Odds Ratio Frikativ 52.119 79.233 39,68% 60,32% 0,01 0,96 -0,02 kein Frikativ 652.993 949.638 41,91% 58,09% Gesamt: 1.733.983 Plosiv 541.197 566.130 48,87% 51,13% 0,22 2,7 0,43 kein Plosiv 163.915 462.741 29,77% 70,23% Gesamt: 1.733.983 Affrikate 9.846 4.161 70,29% 29,71% 0,05 3,5 0,54 keine Affrikate 695.266 1.024.710 41,52% 58,48% Gesamt: 1.733.983 Einsilber auf einen oder mehrere Konsonanten Faktor ES S Anteil ES Anteil S Phi Odds Ratio log 10 Odds Ratio Nasal 27.322 35.358 43,59% 56,41% 0,24 0,26 -0,59 kein Nasal 287.239 94.935 75,16% 24,84% Gesamt: 444.854 Liquid 20.922 26.512 44,11% 55,89% 0,20 0,28 -0,55 kein Liquid 293.639 103.781 73,89% 26,11% Gesamt: 444.854 Plosiv 228.449 60.928 78,95% 21,05% 0,25 3,02 0,48 kein Plosiv 86.112 69.365 55,39% 44,61% Gesamt: 444.854 Frikativ 31.481 6.693 82,47% 17,53% 0,08 2,05 0,31 kein Frikativ 283.080 123.600 69,61% 30,39% Gesamt: 444.854 Anhang 283 Einsilber auf einen oder mehrere Konsonanten Faktor ES S Anteil ES Anteil S Phi Odds Ratio log 10 Odds Ratio Affrikate 6.387 802 88,84% 11,16% 0,05 3,35 0,52 keine Affrikate 308.174 129.491 70,41% 29,59% Gesamt: 444.854 alle Einsilber 314.561 130.293 70,71% 29,29% Gesamt: 444.854 Einsilber auf Einzelkonsonant Faktor ES E Anteil ES Anteil S Phi Odds Ratio log 10 Odds Ratio Liquid 20.922 26.280 44,32% 55,68% 0,26 0,27 -0,57 kein Liquid 143.013 48.366 74,73% 25,27% Gesamt: 238.581 Nasal 24.609 18.632 56,91% 43,09% 0,12 0,53 -0,28 kein Nasal 139.326 56.014 71,32% 28,68% Gesamt: 238.581 Plosiv 92.998 23.902 79,55% 20,45% 0,23 2,78 0,44 kein Plosiv 70.937 50.744 58,30% 41,70% Gesamt: 238.581 Frikativ 25.406 5.832 81,33% 18,67% 0,11 2,16 0,33 kein Frikativ 138.529 68.814 66,81% 33,19% Gesamt: 238.581 alle Einsilber auf Einzelkonsonant 163.935 74.646 68,71% 31,29% Gesamt: 238.581 Katrin Hein Phrasenkomposita im Deutschen Empirische Untersuchung und konstruktionsgrammatische Modellierung Studien zur deutschen Sprache 67 2015, 510 Seiten € [D] 128,00 ISBN 978-3-8233-6921-9 Phrasenkomposita wie Heile-Welt-Gerede oder „Ich-kann- Golf-Ski-und-Wandern-und-bin-schöner-als-die-andern“-Franz werden im Deutschen mit steigender Tendenz verwendet. Sie sind eine Herausforderung für die linguistische Beschreibung. Der vorliegende Band präsentiert die erste umfassende Untersuchung von Phrasenkomposita. Seine besondere Leistung besteht darin, dass er sowohl eine grammatiktheoretische Modellierung als auch eine breit angelegte korpuslinguistische Untersuchung des Phänomens bietet. Den theoretischen Rahmen bildet ein konstruktionsgrammatischer Ansatz mit gebrauchsbasierter Ausrichtung. Basis für die induktive Datenerhebung ist das ‚Deutsche Referenzkorpus‘ des Instituts für Deutsche Sprache, Mannheim. Die Ergebnisse zeigen zum einen, wie sich der konstruktionsgrammatische Ansatz gewinnbringend zur Beschreibung von Wortbildungsphänomenen einsetzen lässt. Zum anderen werden innovative Methoden (Analysemodell, Suchanfrage-Strategie zur induktiven Korpusabfrage) entwickelt, die für die Anwendung der Konstruktionsgrammatik auf authentische Sprachdaten benötigt werden. Private Goes Public: Self-Narrativisation in Brian Friel’s Plays Gaby Frey S C H W E I Z E R A N G L I S T I S C H E A R B E I T E N S W I S S S T U D I E S I N E N G L I S H Katrin Hein Phrasenkomposita im Deutschen Empirische Untersuchung und konstruktionsgrammatische Modellierung STUDIEN ZUR DEUTSCHEN SPRACHE FORSCHUNGEN DES INSTITUTS FÜR DEUTSCHE SPRACHE Narr Francke Attempto Verlag GmbH+Co. KG \ Dischingerweg 5 \ 72070 Tübingen \ Germany Tel. +49 (07071) 97 97-0 \ Fax +49 (07071) 97 97-11 \ info@narr.de \ www.narr.de Stand: November 2015 · Änderungen und Irrtümer vorbehalten! JETZT BESTELLEN! Studien zur Deutschen Sprache Forschungen des Instituts für Deutsche Sprache herausgegeben von Arnulf Deppermann, Stefan Engelberg und Angelika Wöllstein Aktuelle Bände: Frühere Bände finden Sie unter: http: / / www.narr-shop.de/ reihen/ s/ studien-zurdeutschen-sprache.html 40 Heidrun Kämper / Ludwig M. Eichinger (Hrsg.) Sprach-Perspektiven Germanistische Linguistik und das Institut für Deutsche Sprache 2007, 509 Seiten €[D] 88, - ISBN 978-3-8233-6295-1 41 Christian Fandrych / Reinier Salverda (Hrsg.) Standard, Variation und Sprachwandel in germanischen Sprachen / Standard, Variatio and Language Change in Germanic Languages 2007, 304 Seiten €[D] 72, - ISBN 978-3-8233-6336-1 42 Carolin Müller-Spitzer Der lexikografische Prozess Konzeption für die Modellierung der Datenbasis 2007, 314 Seiten €[D] 78, - ISBN 978-3-8233-6357-6 43 Manfred W. Hellmann Das einigende Band? Beiträge zum sprachlichen Ost-West-Problem im geteilten und im wiedervereinigten Deutschland. Herausgegeben von Dieter Herberg 2008, 563 Seiten €[D] 98, - ISBN 978-3-8233-6385-9 44 Ludwig M. Eichinger / Meike Meliss / Maria José Dominguez Vázquez (Hrsg.) Wortbildung heute Tendenzen und Kontraste in der deutschen Gegenwartssprache 2008, 356 Seiten €[D] 72, - ISBN 978-3-8233-6386-6 45 Heidrun Kämper / Annette Klosa / Oda Vietze (Hrsg.) Aufklärer, Sprachgelehrter, Didaktiker Johann Christoph Adelung (1732-1806) 2008, 293 Seiten €[D] 72, - ISBN 978-3-8233-6401-6 46 Ludwig M. Eichinger / Albrecht Plewnia (Hrsg.) Das Deutsche und seine Nachbarn Über Identitäten und Mehrsprachigkeit 2008, 184 Seiten €[D] 72, - ISBN 978-3-8233-6437-5 47 Lorenza Mondada / Reinhold Schmitt (Hrsg.) Situationseröffnungen Zur multimodalen Herstellung fokussierter Interaktion 2010, 386 Seiten €[D] 78, - ISBN 978-3-8233-6438-2 48 Hardarik Blühdorn Negation im Deutschen Syntax, Informationsstruktur, Semantik 2012, 482 Seiten €[D] 98, - ISBN 978-3-8233-6444-3 49 Wolf-Andreas Liebert / Horst Schwinn (Hrsg.) Mit Bezug auf Sprache Festschrift für Rainer Wimmer 2009, 584 Seiten €[D] 98, - ISBN 978-3-8233-6470-2 50 Daniela Heidtmann Multimodalität der Kooperation im Lehr-Lern-Diskurs Wie Ideen für Filme entstehen 2009, 340 Seiten €[D] 78, - ISBN 978-3-8233-6471-9 51 Ibrahim Cindark Migration, Sprache und Rassismus Der kommunikative Sozialstil der Mannheimer „Unmündigen“ als Fallstudie für die „emanzipatorischen Migranten“ 2010, 283 Seiten €[D] 72, - ISBN 978-3-8233-6518-1 52 Arnulf Deppermann / Ulrich Reitemeier / Reinhold Schmitt / Thomas Spranz-Fogasy Verstehen in professionellen Handlungsfeldern 2010, 392 Seiten €[D] 88, - ISBN 978-3-8233-6519-8 53 Gisella Ferraresi Konnektoren im Deutschen und im Sprachvergleich Beschreibung und grammatische Analyse 2011, 350 Seiten €[D] 78, - ISBN 978-3-8233-6558-7 54 Anna Volodina Konditionalität und Kausalität im Deutschen Eine korpuslinguistische Studie zum Einfluss von Syntax und Prosodie auf die Interpretation komplexer Äußerungen 2011, 288 Seiten €[D] 78, - ISBN 978-3-8233-6559-4 55 Annette Klosa (Hrsg.) elexiko Erfahrungsberichte aus der lexikografischen Praxis eines Internetwörterbuchs 2011, 211 Seiten €[D] 72, - ISBN 978-3-8233-6599-0 56 Antje Töpel Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen Anspruch und Wirklichkeit 2011, 432 Seiten €[D] 98, - ISBN 978-3-8233-6631-7 57 Ludwig M. Eichinger / Albrecht Plewnia / Melanie Steinle (Hrsg.) Sprache und Integration Über Mehrsprachigkeit und Migration 2011, 253 Seiten €[D] 72, - ISBN 978-3-8233-6632-4 58 Inken Keim / Necmiye Ceylan / Sibel Ocak / Emran Sirim Heirat und Migration aus der Türkei Biografische Erzählungen junger Frauen 2012, 343 Seiten €[D] 49, - ISBN 978-3-8233-6633-1 59 Magdalena Witwicka-Iwanowska Artikelgebrauch im Deutschen Eine Analyse aus der Perspektive des Polnischen 2012, 230 Seiten 72, - ISBN 978-3-8233-6703-1 60 Kathrin Steyer (Hrsg.) Sprichwörter multilingual Theoretische, empirische und angewandte Aspekte der modernen Parömiologie 2012, 470 Seiten €[D] 98, - ISBN 978-3-8233-6704-8 61 Ludwig M. Eichinger / Albrecht Plewnia / Christiane Schoel / Dagmar Stahlberg (Hrsg.) Sprache und Einstellungen Spracheinstellungen aus sprachwissenschaftlicher und sozialpsychologischer Perspektive. Mit einer Sprachstandserhebung zum Deutschen von Gerhard Stickel 2012, 370 Seiten €[D] 88, - ISBN 978-3-8233-6705-5 62 Heiko Hausendorf / Lorenza Mondada / Reinhold Schmitt (Hrsg.) Raum als interaktive Ressource 2012, 400 Seiten €[D] 88, - ISBN 978-3-8233-6706-2 63 Annette Klosa (Hrsg.) Wortbildung im elektronischen Wörterbuch 2013, 279 Seiten €[D] 78, - ISBN 978-3-8233-6737-6 64 Reinhold Schmitt Körperlich-räumliche Aspekte der Interaktion 2013, II, 334 Seiten €[D] 88, - ISBN 978-3-8233-6738-3 65 Kathrin Steyer Usuelle Wortverbindungen Zentrale Muster des Sprachgebrauchs aus korpusanalytischer Sicht 2014, II, 390 Seiten €[D] 88, - ISBN 978-3-8233-6806-9 66 Iva Kratochvílová / Norbert Richard Wolf (Hrsg.) Grundlagen einer sprachwissenschaftlichen Quellenkunde 2013, 384 Seiten €[D] 88, - ISBN 978-3-8233-6836-6 67 Katrin Hein Phrasenkomposita im Deutschen Empirische Untersuchung und konstruktionsgrammatische Modellierung 2015, 510 Seiten €[D] 98, - ISBN 978-3-8233-6921-9 68 Stefan Engelberg / Meike Meliss / Kristel Proost / Edeltraud Winkler (Hrsg.) Argumentstruktur zwischen Valenz und Konstruktion 2015, 497 Seiten €[D] 128, - ISBN 978-3-8233-6960-8 Die Beschreibung und Modellierung grammatischer Variation, d.h. von Instanzen, in denen eine Funktion oder Bedeutung durch mehrere, miteinander konkurrierende Formtypen ausgedrückt werden kann, stellt eine Herausforderung sowohl für Grammatikographie als auch Grammatiktheorie dar. Die vorliegende Doppelstudie zur starken Genitivflexion und ihrem Wegfall entwickelt neue korpusorientierte Zugänge zu dieser Problematik. Auf große Mengen von Genitivbelegen angewandte quantitative und inferenzstatistische Methoden ermöglichen nicht nur eine detaillierte und empirisch fundierte Beschreibung der Distribution der einschlägigen Markierungsvarianten (-s, -es, -ens, -Ø, Apostroph wie in Wortes, Kerls, Herzens, [des] Barock, Brahms‘). Sie sind auch das geeignete Instrumentarium, die Hypothesen der bisherigen Forschung zu evaluieren und die zahlreichen Einflussfaktoren präzise zu hierarchisieren, um einem konsistenten Gesamtmodell der Variation näher zu kommen. In diesem sind die bisher wenig beachteten Einflussgrößen ‚Frequenz‘ und ‚Integrationsgrad‘ des Nomens an „Schaltstellen“ zu positionieren.