Methoden der allgemein-vergleichenden Sprachwissenschaft

Wie in jeglicher empirischer Wissenschaft werden auch in der allgemein-vergleichenden Sprachwissenschaft die induktive und die deduktive Methode miteinander kombiniert. Anhand der Unterscheidung zwischen empirischen und begrifflichen Universalien sahen wir bereits, daß allgemeine Aussagen über Sprachen entweder auf Verallgemeinerung über einer Menge untersuchter Sprachen oder auf Entwicklung des Begriffs ‘Sprache’ beruhen können. Die ersteren werden durch Induktion, die letzteren durch Deduktion gewonnen.

Die Methode, aus dem Begriff der menschlichen Sprache Struktureigenschaften von Sprachen zu deduzieren, ist noch nicht sehr weit gediehen. Tatsache ist, daß man durch empirische Forschung eine große Menge von Struktureigenschaften von Sprachen entdeckt hat, darunter z.B. zahlreiche Verfahren der nominalen Klassifikation, die aus keiner bis dahin bekannten Sprachtheorie folgten. In einigen Fällen ist es gelungen, die Theorien ex post an die Empirie anzupassen und so theoretisch für die Fakten aufzukommen. Davon, daß bestehende Theorien die tatsächlich beobachtbare Variation oder die über ihr waltenden Prinzipien hätten “vorhersagen” können,¹ kann aber allermeist keine Rede sein. Insofern hat in der allgemein-vergleichenden Sprachwissenschaft die induktive Methode die Führung, wenn damit auch die grundsätzliche Komplementarität zwischen Induktion und Deduktion in keiner Weise in Abrede gestellt ist.

Wie kann man nun überhaupt auf empirischer Basis Verallgemeinerungen über alle Sprachen wagen? Bevor wir der Frage im Detail nähertreten, sei hier folgendes vorweggenommen: Erstens, viele Sprachwissenschaft in Vergangenheit und Gegenwart ist in dieser Beziehung absolut verantwortungslos vorgegangen und hat auf völlig unzureichender empirischer Basis sorglos Universalien oder Sprachtypen postuliert, also über alle Sprachen der Welt verallgemeinert. Die Phrase “take any language, for instance English” ist zum geflügelten Wort geworden, um diese Sorte von Universalienforschung zu charakterisieren. Zweitens, moderne allgemein-vergleichende Sprachwissenschaft kommt dem Anspruch, auf empirischer Basis und in methodisch abgesicherter Weise über alle Sprachen und somit über die menschliche Sprache Aussagen zu machen, in einer ganzen Reihe vorbildlicher Studien ziemlich nahe. Solche Studien zeigen, daß das Ideal einer für alle Sprachen gültigen Sprachtheorie zwar unerreicht ist, daß aber merkliche Fortschritte auf es zu gemacht werden.

Angenommen, ein Meinungsforschungsinstitut sagt kurz nach Schluß der Wahllokale und lange vor Auszählung aller Stimmen das Wahlergebnis mit einer Abweichung von zwei Prozent bei den einzelnen Anteilen voraus. Es tut das, ohne die Gesamtpopulation untersucht zu haben. Vielmehr hat es eine repräsentative Stichprobe (engl. sample) entnommen, aus deren Eigenschaften es eine Aussage über die gesamte Population extrapoliert. Ebenso geht allgemein-vergleichende Sprachwissenschaft vor. Selbstverständlich ist es nicht möglich, alle Sprachen der Welt zu untersuchen. Das hat verschiedene Gründe, von denen einige platt-praktischer Natur sind. Von den über 6.000 derzeit gesprochenen Sprachen sind aber einige Hundert hinreichend gut beschrieben, so daß eine repräsentative Sprachenstichprobe zwischen 100 und 500 Sprachen umfaßt. Eine solche Stichprobe stellt einen Prozentsatz von der Gesamtpopulation der Sprachen dar, der in der Größenordnung ohne weiteres den Stichproben vergleichbar ist, mit denen in anderen empirischen Wissenschaften gearbeitet wird. Das Vorgehen ist insoweit methodisch völlig solide.

Die Stichprobe muß freilich nicht nur quantitativ, sondern vor allem qualitativ repräsentativ sein. Dies ist erst in der zweiten Hälfte des 20. Jh. möglich geworden. Vorher waren nur die indogermanischen Sprachen und, mit abnehmender Qualität, die semitischen und finnougrischen Sprachen sowie einige andere Sprachstämme hinreichend gut erforscht und figurierten daher stets prominent in zeitgenössischen Typologien. Eine Sprachenstichprobe konnte gar nicht in methodisch kontrollierter Weise entnommen werden. Die unausweichliche Folge war, daß ältere Typologien unausgewogen waren. Heute stehen im Prinzip beide methodologisch etablierten Verfahren zur Bildung einer Sprachenstichprobe zur Verfügung (hierzu im einzelnen Rijkhoff et al. 1993, Rijkhoff & Bakker 1998): Man kann entweder eine Zufallsstichprobe entnehmen, bei der jedes Mitglied der Population die gleiche Chance hat, in der Stichprobe vertreten zu sein; oder man kann eine klassifizierte Stichprobe entnehmen, bei der alle Klassen, aus welchen sich die Population zusammensetzt, anteilig in der Stichprobe vertreten sind. Im letzteren Falle sorgt man dafür, daß die (genetischen) Sprachfamilien des Globus proportional zu ihrem zahlenmäßigen Umfang in der Stichprobe vertreten sind. Wenn man bereits eine begründete Hypothese über die Möglichkeiten der Variation einer bestimmten Eigenschaft in den Sprachen hat, kann man auch eine Stichprobe gezielt so zusammenstellen, daß sie die Bandbreite der Variation und insbesondere die Extreme abdeckt. Solche Stichproben umfassen manchmal nur etwa ein Dutzend Sprachen und erlauben doch einigermaßen zuverlässige Verallgemeinerungen.

Hieran schließt sich oft der Einwand an: “aber es kann doch kein Linguist so viele Sprachen können.” Wissenschaftliche Methode in der Linguistik besteht jedoch nicht darin, daß man Sprachen beherrscht. Vielmehr ist es gerade wesentlicher Bestandteil des Handwerkzeugs des vergleichenden Sprachwissenschaftlers, daß er imstande ist, abgesichert über Sprachen zu verallgemeinern, die er nicht beherrscht. Dies wird im allgemeinen durch Auswertung linguistischer Beschreibungen, kurz ‘Grammatiken’ genannt, gemacht. Viele davon sind von Linguisten für Linguisten geschrieben; sie für typologische Fragen auszuwerten ist tägliche Routine des vergleichenden Sprachwissenschaftlers.

Sprachbeschreibungen bzw. Grammatiken sind jedoch von sehr verschiedener Qualität. Neben einigen in jeder Hinsicht ausgezeichneten Beschreibungen stehen zahlreiche unvollständige, unzuverlässige, unverständliche oder sonstwie benutzerunfreundliche Beschreibungen. Sie beeinflussen natürlich, soweit sie doch benutzt werden (müssen), die Datenbasis der vergleichenden Sprachwissenschaft negativ. Ein Ausweg besteht darin, die für die typologische Fragestellung erforderlichen Daten selbst zu erheben. Zahlreiche typologisch-vergleichende Untersuchungen sind mit Feldforschung oder jedenfalls Informantenbefragung verbunden. Dies ist eigentlich nicht ein intrinsisches Merkmal von allgemein-vergleichender Sprachwissenschaft, sondern eine Notlösung. Es hat aber, da es so häufig nötig ist, seit etwa 1970 zu einer ziemlich engen Verbindung von typologisch-vergleichender Sprachwissenschaft und Feldforschung über “exotische” Sprachen geführt. Die Verbindung funktioniert natürlich auch in der Gegenrichtung, d.h. so, daß Feldforscher sich die Erkenntnisse der Sprachtypologie bei ihren Fragestellungen und Analysen zunutze machen.

Die Sprachbeschreibungen werden also in bezug auf eine bestimmte Fragestellung durchgegangen, und die Werte, die die Sprachen auf dem jeweils untersuchten Parameter annehmen, werden in systematischer Weise zusammengestellt. Seit etwa 1980 arbeitet die allgemein-vergleichende Sprachwissenschaft zu diesem Zweck mit Datenbanken. Einige dieser Datenbanken umfassen Hunderte von Sprachen, von denen jede wiederum für Dutzende oder Hunderte von Eigenschaften kodiert ist. Gründlich in dieser Weise untersucht sind z.B. Wortstellungseigenschaften. Datenbanksoftware gestattet es dann, in einfacher Weise Hypothesen über Zusammenhänge, z.B. implikative Abhängigkeiten zwischen Werten verschiedener Parameter zu testen und auch statistische Berechnungen über die Verteilung von Eigenschaften anzustellen.

¹ dies ein unverzichtbares Bestandstück der Imponierrhetorik von Theoretikern und solchen, die es sein möchten