Das Projekt Korpus Veröffentlichungen Personen
Logo der Universität Leipzig
Logo der Deutschen Forschungsgemeinschaft

Historische Sprachwissenschaft des Deutschen

Das Projekt Korpus Veröffentlichungen Personen

Die Entwicklung der satzinternen Großschreibung im Deutschen
Eine korpuslinguistische Studie zum Zusammenspiel kognitiv-semantischer und syntaktischer Faktoren

Das von Prof. Dr. Renata Szczepaniak geleitete SiGS-Projekt wurde 2013-2019 von der Deutschen Forschungsgemeinschaft gefördert.

Inhalt und Ziele

Das Projekt wurde 2013-2019 durchgeführt, gefördert von der Deutschen Forschungsgemeinschaft: 2013-2015 unter der Leitung von Prof. Dr. Klaus-Michael Köpcke (Universität Münster) und Prof. Dr. Renata Szczepaniak (Universität Hamburg) und 2015-2019 unter der Leitung von Prof. Dr. Renata Szczepaniak (Universität Hamburg und Otto-Friedrich-Universität Bamberg).

Das Projekt untersuchte die Herausbildung einer graphematischen Besonderheit des Deutschen, nämlich der satzinternen Großschreibung. Während frühere Studien die Entwicklung der satzinternen Großschreibung vor allem auf Grundlage von Drucken untersuchten, widmete sich das vorliegende Projekt dezidiert Handschriften. Im Gegensatz zu Druckschriften, die meist kollektiv und kooperativ lektoriert worden sind, bilden sie den Schreibusus einzelner Schreiber. Sie haben darüber hinaus eine geringe Planungszeit, sind also spontaner und lassen somit bessere Rückschlüsse auf kognitive Einflussfaktoren zu. Konkret wurde ein linguistisch aufbereitetes Korpus aus 56 Hexenverhörprotokollen erstellt und annotiert, das im Blick auf die Fragestellung des Projekts mit Hilfe moderner statistischer Methoden ausgewertet wurde und wird. Die untersuchten Protokolle entstanden in der für die Entwicklung der satzinternen Großschreibung entscheidenden Phase im ausgehenden 16. und in der ersten Hälfte des 17. Jhs. Im Projekt konnte gezeigt werden, dass die Verwendung satzinterner Majuskeln in dieser Variationsphase der Großschreibung von einer Reihe interagierender Faktoren gesteuert wird: Erstens breitet sich die satzinterne Großschreibung die Belebtheitsskala entlang aus, wobei zunächst am häufigsten Bezeichnungen für Menschen (und übermenschliche Wesen wie Gott) großgeschrieben werden, dann Tiere, Konkreta und schließlich Abstrakta. Zweitens lassen sich soziopragmatische Steuerungsfaktoren festmachen: Großschreibung wird zum Ausdruck von Ehrerbietung verwendet. Dabei fällt insbesondere auf, dass Personenbezeichnungen signifikant häufiger großgeschrieben werden, wenn sie auf Männer referieren, als wenn sie Frauen bezeichnen. Drittens wurden mit semantischen Rollen und syntaktischen Funktionen weitere semantische und syntaktische Einflussfaktoren herausgearbeitet. So steigt bspw. mit dem wachsenden Agentivitätsgrad die Wahrscheinlichkeit der Großschreibung signifikant an. Viertens beeinflusst die Wortfrequenz die Großschreibung: Nicht für jedes häufige Wort ist die Großschreibung jedoch gleichermaßen wahrscheinlich. Vielmehr hängt diese nachgewiesenermaßen von der kognitiv-semantischen Kategorie der Belebtheit ab. Gleichzeitig verstärkt hohe Frequenz eines Wortes seine Groß-/Kleinschreibung und verringert damit die Variation. Fünftens ist erwartungsgemäß ein hohes Maß an individueller Variation feststellbar: Einige Schreiber sind sehr großschreibungsfreudig, während andere kaum Gebrauch von satzinternen Majuskeln machen. Zusammengenommen bestätigen die Ergebnisse einerseits, dass die für gedruckte Texte herausgearbeiteten Steuerungsfaktoren für die satzinterne Großschreibung auch bei handschriftlichen Texten greifen. Andererseits konnte das Projekt eine Reihe weiterer Einflussfaktoren zutage fördern, deren Überprüfung in gedruckten Texten vorerst noch aussteht. Mit dem annotierten Korpus aus Hexenverhörprotokollen ist darüber hinaus eine Ressource entstanden, die weit über den Projektkontext hinaus gewinnbringend genutzt werden kann.

Methode

Im Zuge des Projekts wurde ein annotiertes Textkorpus von Hexenverhörprotokollen erstellt. Das sog. SiGS-Korpus besteht aus 56 handschriftlichen Hexenverhörprotokollen, die in der Zeit zwischen 1570 und 1665 entstanden sind (ca. 62.000 Wortformen). Diese sind computergestützt tokenisiert, lemmatisiert und auf Wortart, Belebtheit, Satzgrenzen, semantische Rollen und syntaktische Funktionen hin annotiert. Das Korpus ist seit 2024 im Laudatio-Repositorium öffentlich zugänglich. Das dazugehörige Annotationshandbuch wurde ebenfalls 2024 veröffentlicht.



Kontakt