4   Sprachsynthese als Forschungsinstrument

Wenn man von "Sprachsynthese" spricht, so herrscht noch die Vorstellung einer kalten, abweisenden Stimme mit monotoner Intonation ohne Sinnzusammenhang vor. Auch wenn die synthetische Sprache immer noch ohne Weiteres von einer natürlichen, menschlichen Sprache unterschieden werden kann, so trifft diese negative Wertung je länger je weniger zu. Die Sprachsynthese hat in den letzten Jahren wesentliche Fortschritte gemacht und klingt heute schon viel realistischer als dies noch vor Kurzem der Fall war. Damit ergeben sich völlig neue Anwendungen für Geistes- und Sozialwissenschaften.

Ich möchte hier einen neuen Zugang für die Sprachwissenschaft andeuten, der sich hinwendet zur Untersuchung von Interaktionen zwischen einzelnen Bereichen. Dazu kann die Sprachsynthese neue Wege für die Forschung aufzeigen, indem nicht mehr nur isolierte Bereiche analysiert werden können, sondern indem die gesamte Sprache als Modell erstellt werden muss. Das heißt also, dass die verschiedenen Analysen zu einem Ganzen zusammengeführt werden müssen. Dies erlaubt, das bisher in einzelnen Bereichen erarbeitete Wissen aufzunehmen und die Relevanz jedes einzelnen dieser Bereiche in der Interaktion zu verifizieren.

Bisher wurde die Sprachsynthese noch nicht für solche wissenschaftlichen Experimente genutzt. In einem eingeschränkten Umfang ist es aber jetzt schon möglich, die existierenden Text-to-Speech-Synthesen für solche Versuche zu verwenden und einige Manipulationen mit diesen Systemen durchzuführen. Wie Keller und Zellner Keller (i.Dr.) gezeigt haben, lässt sich relativ einfach mit Rhythmus, mit Phrasengrenzen und Grund­frequenzverläufen experimentieren. Ich möchte einige dieser Experimente mit deutschen Beispielen hier zeigen.

Die mit LAIPTTS_D[3]. erzeugten Hörbeispiele demonstrieren, wie wichtig einzelne prosodische Aspekte sind, um Sprache zu verstehen, und wie bedeutsam die Interaktionen zwischen diesen Bereichen sind. Auch wenn diese Tondokumente nicht dialektaler sondern standardsprachlicher Natur sind (weil keine Mundartsynthesen existieren), zeigen sie klar, wo Dinge passieren, die bisher nicht beachtet wurden. Das heißt auch, dass ich auf einzelne interessante Aspekte hinweisen kann, wobei vielmehr Fragen gestellt als Antworten gegeben werden.


[3] LAIPTTS_D: Laboratoire dÍAnalyse Informatique de la Parole Text to Speech Deutsch. Die Synthese ist zu finden unter: http://www.unil.ch/imm/docs/LAIP/LAIPTTS_D_SpeechMill_dl_dt.htm