Formalisiert man einen Algorithmus der im Abschnitt über Erkennungsgrammatiken beschriebenen Art, so arbeitet man nach dem Prinzip der Unifikation (Vereinigung). Dessen Idee ist die folgende: Es liegt eine Menge von Ausdrücken vor. Diese sind, wie anderswo gesagt, aus Symbolen im Sinne der Logik oder Mathematik zusammengesetzt. In der Linguistik sind es Sätze und Syntagmen bzw. Repräsentationen von solchen, einschließlich ihrer Kategorien, Merkmale und Werte. Das Ziel ist nun, eine kondensierte Repräsentation dieser Menge zu erstellen, die von der enthaltenen Information nichts verliert, aber all diejenige Information unterdrückt, welche weniger spezifisch und insoweit redundant ist. Zur Veranschaulichung betrachte man folgende Situation: Erwin kommt nach Hause und findet Erna nicht vor. Er fragt nun unabhängig verschiedene Haushaltsmitglieder über Ernas Verbleib. Von Fritz erfährt er .a, von Frieda dagegen .b.
. | a. | Erna ist irgendwo hingegangen. |
b. | Erna ist ins Kino gegangen. |
Erwin nimmt nun die beiden Aussagen in zusammen und schließt, daß nach allem, was er gehört hat, Erna ins Kino gegangen ist. Er hat die Menge der Aussagen zu einer einzigen unifiziert (vereinigt). Angenommen nun andererseits, Erwin hört auf seine Umfrage von Frieda wiederum .b, von Fritz jedoch .a.
. | a. | Erna ist in die Kirche gegangen. |
b. | Erna ist ins Kino gegangen. |
Hier scheitert nun Erwins Versuch der Unifikation; .a und b sind nicht unifizierbar.
Bei der Unifikation der beiden Sätze von geht Erwin, grob gesprochen, folgendermaßen vor:
- Von identischen Elementen in derselben Funktion behält er nur eines übrig.
- Ist ein Element ein Hyperonym zu einem anderen (wie irgendwohin zu ins Kino), impliziert also das letztere das erstere, behält er nur das letztere übrig.
- Haben zwei Elemente, die unvereinbare Information enthalten (also nicht in Hyponymie stehen), dieselbe Funktion (wie in ), so gibt er die Unifikation auf.
Allgemeiner gesprochen: Zwei Ausdrücke werden zu einem neuen Ausdruck unifiziert, indem implizierte Teilausdrücke durch implizierende ersetzt werden. Dazu gehört auch, daß Variablen durch Konstanten und Disjunktionen durch ein einzelnes Disjunkt ersetzt werden. Eine Unifikationsgrammatik ist eine Grammatik, welche die Komponenten sprachlicher Konstruktionen zu Syntagmen unifiziert in einem Algorithmus folgender Art:
- Sie vergleicht die Wertespezifikation eines Ausdrucks
Ai
mit der Wertespezifikation eines syntagmatisch benachbarten AusdrucksAj
. - Sind die Werte im soeben definierten Sinne vereinbar, so unifiziert sie
Ai
undAj
zu einem Syntagma und ihre Wertespezifikationen zu einer einzigen, die sie eben dem Syntagma zuschreibt. - Sind die Werte unvereinbar, unifiziert sie
Ai
nicht mitAj
und versucht,Ai
stattdessen mit einem anderen benachbarten SyntagmaAk
zu unifizieren. - Dasselbe Verfahren wendet sie rekursiv auf die unifizierten Syntagmen an so lange, bis sie bei der Kategorie Satz angelangt ist.
- Scheitern für einen Ausdruck alle Versuche der Unifikation, so ist die Konstruktion nicht unifizierbar. Die Grammatik kann ihr dann keine grammatische Analyse und keine Bedeutung zuordnen.
Der dazu nötige Formalismus soll hier anhand des im Abschnitt über Erkennungsgrammatik analysierten Beispiels angedeutet werden:1
- Eine Wertespezifikation wird dargestellt als ein Paar aus einem Attribut (Kategorie oder Merkmal) und einem Wert. Folgendes Beispiel zeigt, wie es gemacht wird: [ [ Significans Studentinnen ], [ Kategorie Substantiv ], [ Numerus Plural ] ].
- Statt eines Merkmalwerts kann auch ein leeres Paar eckiger Klammern gesetzt werden; das bedeutet dann “Wert nicht spezifiziert”, z.B.
[ [ Significans Studentinnen ], [ Kasus [] ] ]. - Der Wert eines Attributs muß nicht atomar sein; Schachtelung ist erlaubt, z.B. [ [ Significans Studentinnen ], [ Kategorie Substantiv ], [ Flexion [ Genus femininum ], [ Numerus Plural ], [ Kasus [] ] ] ].
- Kategorien (“Typen”) stehen in einer Taxonomie; ein Typ “subsumiert” seine Subtypen. Jeder Typ hat sämtliche Merkmale und Werte seines Supertyps. In folgendem Beispiel spezifiziert die erste Zeile ein beliebiges Element der Wortart Substantiv, die zweite Zeile einen Subtyp davon:
- [ [ Significans [] ], [ Kategorie Substantiv ], [ Flexion [ Genus []], [ Numerus []], [ Kasus [] ] ].
- [ [ Significans Studentinnen ], [ Kategorie Substantiv ], [ Flexion [ Genus femininum ], [ Numerus Plural ], [ Kasus [] ] ].
- Auf ähnliche Weise kann man auch die Valenz eines Zeichens angeben. Hier werden Merkmale nicht des gegebenen, sondern eines syntagmatisch benachbarten Ausdrucks spezifiziert. Da man dies auseinanderhalten muß, zerfällt die Merkmalmatrix eines Ausdrucks in zwei Teile: der Teil, der sich auf den gegebenen Ausdruck selbst bezieht, wird als Kopf spezifiziert; der Teil, welcher sich auf sein Relatum bezieht, wird als Valenz spezifiziert. Die beiden Elemente werden durch Indizes unterschieden. Z.B. so:
[ [ Significans neu ],
[ Kopf [ Index i ], [ Kategorie Adjektiv ], Flexion [ Genus [] ], [ Numerus [] ], [ Kasus [] ] ],
[ Valenz [ Index j ], [ Funktion Bezugsnominal ], [ Kategorie Nominal ], [ Flexion ≘ Flexion (i) ], [ Position i < j ] ] ].3 - Ein Ausdruck
A1
, welcher Valenz hat, kann nur dann mit einem AusdruckA2
unifiziert werden, wenn die Merkmalspezifikation vonA2
von der der Valenz vonA1
subsumiert wird.
Nunmehr können wir den Beispielausdruck der neuen Studentinnen unifizieren:
- Die einzelnen Wortformen werden wie folgt repräsentiert, wobei wir auf die alternative Wortartzugehörigkeit von der verzichten:
- [ [ Significans der ],
[ Kopf [ Index i ], [ Kategorie Artikel ], [ Flexion
( [ Genus maskulinum ], [ Numerus singular ], [ Kasus Nominativ ] )
∨ ( [ Genus femininum ], [ Numerus Singular ], [ Kasus Genitiv ∨ Dativ ] )
∨ ( [ Genus [] ], [ Numerus Plural ], [ Kasus Genitiv ] ) ] ],
[ Valenz [ [ Index j ], [ Funktion Bezugsnominal ], [ Kategorie Nominal ], [ Flexion ≘ Flexion (i) ], [ Position i < j ] ],
[ Index k ], [ Funktion Attribut von j ], [ Kategorie Adjektiv ], [ Flexion [ Klasse schwach ] ] ] ] - [ [ Significans neuen ],
[ Kopf [ Index i ], [ Kategorie Adjektiv ], [ Flexion [ Klasse schwach ],
( [ Genus [] ], [ Numerus Singular ], [ Kasus Genitiv ] )
∨ ( [ Genus [] ], [ Numerus Plural ], [ Kasus [] ] ) ],
[ Valenz [ Index j ], [ Funktion Bezugsnominal ], [ Kategorie Nominal ], [ Flexion ≘ Flexion (i) ], [ Position i < j ] ] ]2 - [ [ Significans Studentinnen ],
[ Kopf [ Kategorie Substantiv ], [ Flexion [ Genus femininum ], [ Numerus Plural ], [ Kasus [] ] ] ],
[ Valenz ∅ ] ]4
- [ [ Significans der ],
- Gemäß dem Algorithmus, der im Abschnitt über Erkennungsgrammatiken vorgestellt wird, wird nun zunächst neuen mit Studentinnen unifiziert. Dabei erfüllt Studentinnen die Bedingungen, die als Beschränkungen in der Valenz von neuen festgelegt sind. Ferner gilt, daß ein Substantiv in die Kategorie Nominal fällt und daß ein Syntagma, das durch Kombination eines Attributs mit einem Nominal gebildet ist, die (unifizierten) Eigenschaften des letzteren erbt. Das Resultat ist daher:
[ [ Significans neuen Studentinnen ],
[ Kopf [ Index i ], [ Kategorie Nominal ], [ Flexion [ Genus femininum ], [ Numerus Plural ], [ Kasus [] ] ] ],
[ Valenz ∅ ] ] - Dieses Syntagma wird hinwiederum mit der unifiziert. Wiederum erfüllt neuen Studentinnen die Beschränkungen, welche in der Valenz von der gegeben sind. Ferner gilt, daß ein Syntagma, das durch Kombination eines Artikels mit einem Nominal entsteht, zur Kategorie Nominalsyntagma gehört. Am Schluß steht die Repräsentation für unser Beispielsyntagma:
[ [ Significans der neuen Studentinnen ],
[ Kopf [ Index i ], [ Kategorie Nominalsyntagma ], [ Flexion [ Genus femininum], [ Numerus Plural ], [ Kasus Genitiv ] ] ],
[ Valenz ∅ ] ]
Einerseits lehrt das Beispiel anschaulich, was es besagt, wissenschaftliche Aussagen explizit zu machen. Andererseits hat die Wissenschaft ein Interesse an Kondensierung von Information; Redundanz ist keine Tugend wissenschaftlicher Beschreibungen. Bei der obigen Darstellung wird eine Fülle grammatischer Information für die einzelne Wortform ausbuchstabiert, die gar nicht für diese spezifisch, sondern von ihrer Kategorie geerbt ist. Z.B. sind die Beschränkungen eines Attributs über Merkmale seines Bezugsnominals natürlich nicht in erster Linie Merkmale einer Wortform wie neuen, sondern der syntaktischen Funktion des Attributs. Sie vererben sich aber auf die jeweiligen Träger solcher Funktionen und werden daher oben mit aufgeführt.
Schließlich zeigt das kleine Beispiel nur, wie eine grammatische Repräsentation eines Nominalsyntagmas erstellt werden kann. Selbstverständlich fehlt hier der größte Teil der Sprachbeschreibung, darunter insbesondere auch einige grammatische Regeln, die zur Analyse unseres Beispiels benötigt werden. Der vorgestellte Algorithmus läßt sich aber implementieren, so daß ein Computer solche Ausdrücke analysieren kann.
1 Formalismen gehören zum Kurzlebigsten in der Linguistik. Es wird daher hier kein Wert darauf gelegt, den Formalismus eines bestimmten Modells in allen Verästelungen konsistent einzuführen. Einen gerafften Einblick in das Modell der Head-Driven Phrase Structure Grammar (HPSG) bietet der englische Wikipedia-Artikel, einen etwas technischeren der deutsche Artikel, beide vom Stand 09.01.09.
2 Die Spezifikation für das Subjekt des Prädikatsnomens und für die Verbalgruppe des Adverbials, die beim Lexikoneintrag von neu mitgegeben sind, sind auf der Stufe der Wortform neuen bereits getilgt, da, wie im Abschnitt Erkennungsgrammatik gesagt, diese Form diese Funktionen nicht haben kann.
3 ‘i < j’ bedeutet “i geht j voran”. ‘≘’ steht hier für “konsistent/unifizierbar mit”.
4 Wir nehmen zur Vereinfachung an, daß Studentin keine Valenz hat.