Morpheme als Constraints

Markus Walther, Universitaet Duesseldorf, 10.03.1995

Historie

Hockett(1954) hat zwischen Item-and-Process-Morphologie (Russell: 'morphemes as representations') und Item-and-Arrangement-Morphologie (Russell: 'morphemes as rules') unterschieden.

item-and-process:
base ---rules--> form1(base) ;
base ---rules--> form2(base), ...
Dabei sind die (gemeinsame) Basisform und die davon derivierten Formen oberflaechentreu.
item-and-arrangement:
underlying form 1^underlying form 2^ ... ---rules1 -- rules2 ...--> surface form
^ bedeutet Konkatenation

Hoeksema&Janda(1988) fassen diese Begriffe wie folgt zusammen:

In the Item-and-Process approach, the emphasis is on the relation between words in a language - in particular, on the ways in which sets of related words are derived from common bases by the application of certain processes (such as affixation, vowel-replacement, compounding, etc.). .... The Item-and-Arrangement model, on the other hand, is mainly concerned with the formalization and clarification of the constituency-relation - that is, with the ways in which words and phrases can be sliced up into their parts.(p.200f.)

Ein dritter, juengerer Ansatz - am ehesten wohl mit Item-and-Process verwandt - ist mit der Sichtweise von Morphemen als Constraints (MaC) gegeben, am "meisten entwickelt" (Russell p.2) im Camp der Deklarativen Phonologie(DP). Bird(1990)'s Dissertation ueber constraintbasierte, deklarative Phonologie deutet diese Sicht wie folgt an:

The lexicon is essentially a store of morphemes, where each morpheme is a [Saussurean] sign. Morpheme structure constraints can then be viewed as generalizations over the lexicon...(p.14f.)

Er gibt auch formale Representationen von Morphemen an, die klar von der gleichen Natur wie phonologische Constraints sind.

Explizit wird diese Sichtweise in Scobbie(1991)'s Dissertation:

The formal equivalence of rule and representation is a familiar aspect of Unification-Based Grammar [UBG]. In UBG lexical entries are partial descriptions of a certain specificity, while rules are just more general - they describe those parts of a representation which are predictable and can be abstracted out from lexical entries. Both types of partial description are constraints on wellformed representations.(p.10f.)

Auch der hauptsaechlich fuer Lexikon/Morphologiemodellierung eingesetzte DATR-Formalismus (Evans&Gazdar 1990) bietet in einem defaultbasierten Rahmen einheitliche formale Mittel zum Ausdruck von Generalisierungen ueber dem Lexikon wie auch individuellen Eintraegen. Ein charakteristisches Merkmal publizierter Morphologie/Lexikonfragmente (cf. etwa Gazdar 1992; Corbett & Fraser 1994) ist, dass spezifische (Morphem/Wort)-'Knoten' Vorrang vor niederrangigen haben: DATR-Knoten sind hierarchisch verknuepft.

Optimality Theory kann als Item-and-Arrangement-Theorie gesehen werden. Der wesentliche Unterschied zur regelbasierten generativen Phonologie besteht darin, dass von zugrundeliegenden Reprasentationen (UR's) auf Mengen von UR's in OT uebergegangen wurde.

Ellison(1994a) benutzt fuer die formale Modellierung von GEN exakt die gleichen Mittel (regulaere Mengen/Ausdruecke) wie fuer die Constraints. Sein arabisches Beispielwort 'alqalamu' wird in einem regulaeren Ausdruck dargestellt, der direkt das Ergebnis von GEN(UR) darstellt. Obwohl GEN(UR) in seinem Papier nicht als verletzbar dargestellt ist, wird unmittelbar ersichtlich, dass sich nichts an seinen Algorithmen zur Constraintevaluierung aendern wuerde, wenn GEN(UR) verletzbar und damit gleich einem OT-Constraint spezifiziert wuerde.

Hammond(1995) und Russell(1995) 'entdecken' den Wert von MaC fuer die OT. Russel zitiert Bird, Scobbie und Russell; Hammond zitiert keine DP-Literatur.

Wann muss man eine Theorie aendern?

Russell, p.44:

erzwungener Uebergang von Theorie T auf T' gdw.

not Theorie T ist notwendig & not Theorie T ist hinreichend & Theorie T' ist notwendig & Theorie T' ist hinreichend

Kommentare und Folgerungen:

Theorie T notwendig gdw forall Theorien T' mit T' =/= T: not Theorie T' ist hinreichend
Notwendigkeit meist sehr schwer zu zeigen wegen Allquantor. Evtl. abschwaechen mit '& Trivialitaet(T') < TMax', schwer formalisierbar.
Folgerung: um Nicht-Notwendigkeit zu zeigen, reicht die Existenz einer anderen hinreichenden Theorie
'Hinreichend' ist eine Theorie T, die den Datenbereich D abdeckt. Um das zu ermitteln, muessen die Eigenschaften(T) genuegend praezise bekannt sein.

Hier ist T die Standard-Konzeption von OT mit URs und T' die Variante ohne URs, aber mit Morphemen als Constraints. Obiges Schema gibt dann an, was man zeigen muesste, um T als nicht mehr tragbar im strengen Sinne zu erweisen.

OT aus der formalen Perspektive

Wie Ellison(1994b) im Rahmen einer modallogischen Modellierung gezeigt hat, kann die in Prince&Smolensky(1993) informell spezifizierte OT formal als Defaultformalismus aufgefasst werden - genauso wie etwa die Unterspezifikationstheorie von Archangeli&Pulleyblank(1989). Waehrend letztere die notwendige Defaultpriorisierung ueber ein 'Ranking' der Merkmale (primaer) wie auch der der Position der Defaultanwendung (sekundaer) vornimmt, wird in OT sekundaer die Defaultanwendung gemaess der Anzahl der Ausnahmen/Verletzungen zu einem Default(constraint) geordnet.

Diese Einordnung von OT legt unmittelbar einen Vergleich mit anderen (formalen) Defaultformalismen und ihren Anwendungen nahe, z.B. den verschiedenen Vorschlaegen zu Defaultunifikation (Bouma, Carpenter, Copestake, Lascarides et al.,...) oder der Defaultrepresentationssprache DATR (Gazdar & Evans). DATR wurde extensiv fuer Lexikon&Morphologiemodellierung eingesetzt; auch hier sind Repraesentationen und Generalisierungen aus dem gleichen 'formalen Holz'. Russell scheint die Anleihe bei Defaultformalismen und ihren Anwendungen ebenfalls als wertvoll zu erachten, wenn er sagt:

The phenomena of verbal ablaut seem to lend themselves naturally to an account using ranked constraints, as shown by Dunstan Brown's computer implementation of the paradigms using DATR, a specification language for default logic (Brown 1993 [No reference!]). (p.21f.)

Fazit: Die formale Brille erweist OT als vergleichbar mit anderen defaultbasierten Formalismen, von denen damit wertvolle Anregungen, Begruendungen, Grenzen, Einsatzmoeglichkeiten 'geerbt' werden koennten.

MUSS frau Morpheme als Constraints einfuehren? Nein!

Die Frage ist aequivalent zu dem erzwungenen Theoriewechsel von oben und wir untersuchen demgemaess die Praemissen, die erfuellt werden muessen.

Zunaechst bei Russell: Wie er behauptet (p.10), ist Standard-OT (p.44) nicht hinreichend fuer Koaleszenzphaenomene, und zwar wie folgt:

zwei durch eine Morphemgrenze getrennte X-Positionen, die mit einer eigenen 'Kopie' eines Merkmals [+F] autosegmental assoziiert sind, koennen nicht zu einem doppelt assoziierten [+F] per OCP werden.
Grund: *Containment, denn eines der [+F]s wurde aus dem Input entfernt.

Leider ist die Behauptung unbewiesen, weil

... es Standard-OT nicht gibt: Die Anzahl der Interpretationen von OT bzw. ihrer Subkomponenten wie GEN ist vermutlich gleich der Anzahl der OT-Anhaenger. Die Einschraenkung auf 'McCarthy und Prince's Interpretation' bei Russell (p.10) ist dabei sehr aufschlussreich, belegt sie doch a) die Individualisierung der Interpretation und b) ihre Nicht-Kommunizierbarkeit: keiner kennt die aussersprachliche Interpretation von M&P (ausser M&P gemeinsam ...)
... sie ohne Kenntnis der formalen Eigenschaften nicht zu beantworten ist.
... es mindestens eine ausgearbeitete formale Semantik autosegmentaler Diagramme gibt (Bird&Ellison 1994), in der beide Diagramme (2 einfach assoziierte benachbarte vs. 1 doppelt assoziiertes Autosegment - die typische Koaleszenzsituation) exakt das gleiche bedeuten. Da der verwendete Formalismus monoton ist, wird nie etwas 'aus dem Input entfernt', Containment gilt daher trivialerweise. Ellison (1994a) verwendet diesen Formalismus, um OT zu formalisieren.

Beide empirischen Argumente von Russell, naemlich koronale Koaleszenzphaenomene in Nisgha und Vokalkoaleszenz in Hua, bauen auf dieser unbewiesenen und - je nach Formalisierung von OT - widerlegbaren Behauptung auf. Nach der obigen Logik von Russell selbst hat er also nicht gezeigt, dass wir unbedingt MaC brauchen.

Nun zu Hammond:

Er behauptet, dass Standard-OT nicht hinreichend fuer die Behandlung von Ausnahmeakzent (im Spanischen Nominal- und Verbalbereich) sei, da - selbst wenn lexikalische Repraesentationen (URs) Ausnahmemarkierungen tragen - constraintbasierte Einschraenkungen bzgl. der Distribution solcher Ausnahmen (hier: 3-Silben-Fenster fuer Hauptakzent) keine Wirkung zeigen koennten:

Notice that this [restriction of stress placement] would NOT be possible if exceptions were represented in lexical representations. Such representations are, definitionally, outside the hierarchy, and thus not subject to it. [Footnote:] In classic derivational stress theory, this was dealt with by positing more abstract representations requiring conflation Halle & Vergnaud, 1987) or lexical diacritics (Hammond, 1989b). (p.12)

Die Fussnote von Hammond deutet schon einen Ausweg an, der seine Behauptung entkraeften kann:

Man nehme ein Diakritikum, z.B. das ganz generelle [+strict/indefeasible_information]
Ausnahmehaftige Informations'bruchstuecke' der UR wie finaler oder Antepenultima-Akzent sind [+strict...]
Es gibt ein hochrangiges Constraint a la STRICTNESS: "don't omit indefeasible information."
absolute Constraints ueber die Distribution >> STRICTNESS

Auch hier kommt die Idee aus Parallelen zu anderen Defaultformalismen, wo die Spezifikation strikter Information sich als wuenschenswert herausgestellt hat. Die Information, die in der Parametrisierung eines allgemeinen Constraints (Hammond: Align) fuer das Ausnahme-Morphem und in seinem Ranking steckt, hat - so kann man argumentieren - aehnlich diakritischen Charakter wie vorstehender Vorschlag. Zusaetzlich besagt ein Resultat von Kaplan et al. (1988), dass Diakritika in Formalismen, die die Komposition von UR-Lexikon und phonologischen Regeln erlauben, eliminierbar sind.

Damit erweisen sich also auch Hammond's Argumente nicht als zwingend fuer den Wechsel hin zu einer OT mit MaC.

SOLLTE man Morpheme als Constraints verwenden? Ja!

Fuer MaC und den Verzicht auf URs koennen nach dem vorhergehenden negativen Result trotzdem die ueblichen subjektiven Kriterien sprechen:

Einfachheit
Symmetrien
technische Vorteile
Realismus

Zu 1.

OT hat ohne URs kein GEN mehr. Bei einer Constraintsprache, die die konstruktive (insbes. auch fuer Negation) und intensionale (wg. moeglicher unendlicher Strukturen) Beschreibung wohlgeformter Strukturen zulaesst (etwa regulaere Mengen wie bei Ellison (1994a)), kann man - kontra Russell p.37 - auch auf die Aufzaehlung/Bereitstellung der Kandidatenmenge verzichten: OT = Constraints + Ranking. Oberflaechenformen sind die 'optimierte' Schnittmenge aller Constraints.

Zu 2.

Representationen und Generalisierungen/Constraints sind formal gleich - letztere sind einfach unspezifischer. Potentiell hoher Erklaerungswert fuer den L1-Erwerb sprachspezifischer Generalisierungen.

Zu 3.

Einheitlicher, einfacher Formalismus, keine Schnittstellenprobleme = einfache, generelle Implementierung

Zu 4.

OT ist mit MaC eine Mischung von sprachspezifischen und mehr oder weniger universalen Constraints. Das ist voellig analog etwa zur Standardposition in der HPSG.
Constraints muessen also gelernt werden - das macht zumindest konzeptuell den Weg frei fuer eine empirische Abgrenzung zwischen lernbaren und - relativ zu einer gegebenen Architektur - unlernbaren Constraints.

Anwendungsbeispiele fuer Morpheme als Constraints

Russell: koronale Koaleszenz in Nisgha/Britisch-Kolumbien,CA

Szenario:

VerbStem-(Comp)-3sg=(Evidentials)=(Erg)=Det#Noun
Beispiele fuer Det: =t, =l[-voi] ; Erg: =s ; 3sg: -t. VerbStem: limx 'singen', naks 'heiraten'
Koaleszenz: l[-voi] + t = l[-voi], s + t = s, t + t = t, *s + l[-voi] (Russell: l[-voi,-cont], s[+cont].
Beispiele: limx-t 'er/sie singt', naks-t > naks 'er/sie heiratet, naks-t=s=t 'heiraten-3sg=erg=det' > naks

Russell's Analyse:

Geeignete Unterspezifikation der Koronale: t <= (s, l[-voi])
Koaleszenz ist Unifikation (explizit bei Buckley (1994) fuer Vokalkoaleszenz in Tigrinya, implizit bei Russell)
Morpheme als Constraints: [+cor -son] + 3sg , nak [+cor -son +cont] + etc.
In OT nach Russell als ALIGN({3sg, 'heiraten',..)

Kommentar:

Faelle wie Koaleszenz, wo die beteiligten Akteure offenbar ueberlappende Anforderungen an die Umgebung stellen, sind die Crux des MaC-Ansatzes: ohne MaC lassen sich 'rule conspiracies' in diesen Faellen schwer vermeiden (cf. Russell p.15).
Unklar ist, ob man Constraints mit 'global power' wie ALIGN dafuer braucht, die Beispiele sind alle mit lokaler, unmittelbarer Adjazenz erfassbar.
Ueberlappung/Unifikation kann mit geeigneten Massnahmen auch kontextfreie Konkatenation simulieren (Ellison 1993), aber nicht umgekehrt. Hypothese: Voellig kontextfreie Konkatenation von Morphemen ist selten in natuerlicher Sprache.

Hammond: Ausnahmen zum Hauptakzent im Spanischen

Szenario:

Defaultakzent auf vorletzter Silbe (mon'eda, trab'ajo)
finales 3-Silben-Fenster fuer moegliche Akzentposition: keine Ausnahmen
Es gibt Nomina mit Akzent auf der letzten (sof'a, Panam'a, caf'e) und vorvorletzten (p'ajaro, est'omago, m'edico) Silbe
In manchen Verbparadigmen f"allt aus morphologischen Gruenden der Hauptakzent auf den ersten Vokal nach der Wurzel

Hammond's Analyse:

2 Typen von Ausnahmen, die beide den Defaultakzent ueberschreiben koennen und beide dem 3-Silben-Fenster unterliegen.
Die Idee: Ausnahmen-als-MaCs sind gerade ueber den Constraints geordnet, die sie verbieten wuerden.
Hammond: 3-Silben-Fenster als finale extrametrische Silbe >> rechts-'aligntem' binaeren Fuss
Es ist nicht zu sehen, wie das funktionieren kann - kontra Hammonds Begruendung p.11 und mit Kenstowicz(Tilburg 1995, nach Green (1994)! Aber ein Ansatz a la Green(1994), der als Schluesselidee FOOT-BINARITY in LAPSE: "2 unbetonte Silben haben eine Fussgrenze" dazwischen und MIN-2: "Ein Fuss besteht aus >= 2 Silben" aufteilt, loest wahrscheinlich das Problem im Rahmen konventioneller OT-Argumentation (Hausaufgabe fuer den Leser ...).

Kommentar:

Constraintranking fuer die Kodierung von Ausnahmen ist ein eher technischer Punkt und nicht weiter ueberraschend. Laesst sich dieser Einsatz von MaC ueberhaupt durch empirische Argumente stuetzen?

Weitere Gesichtspunkte

'There is no lexicon!*' -> '*There is no lexicon!' - OT wird durch MaC lexikalistischer denn je.
Unklare Mechanismen von OT wie candidate set adjustment, Allomorph-Auswahl, Interpretation von Oberflaechen-Kandidaten, kontextsensitive Auswahl einer Rangordnung, die die vorgeblich einfache Architektur von OT betraechtlich verkomplizieren (Russell p.4-9), werden durch MaC ueberfluessig.
Faithfulness constraints (PARSE, FILL, *SPEC, MSEG, *INSERT-X) sind wahrscheinlich eliminierbar.
Statt MSEG, *INSERT-X UR-unabhaengige *Struktur-Constraint-Familien und Morphem(-Familien-)Ranking.
Statt PARSE Morphemrepraesentation durch verletzbare Unmittelbare-Adjazenz-von-Seg-X-und-Y- Constraints (Russell p.41) oder Optionalitaet in Repraesentationen nach der lexikalistischen Devise "baue die geforderte Variabilitaet direkt in die Repraesentation ein" + PARSE-OPT-X/FILL-OPT-X: "realisiere/nicht optionale Elemente vom Typ X".
... und vieles mehr ...

Literatur

Hammond, Michael (1995): There is no lexicon!*, ms., draft 19.01.95, Univ. of Arizona, ftp://ruccs.rutgers.edu/pub/OT/TEXTS/papers/nolex.ps
Russell, Kevin (1995): Morphemes and candidates in Optimality Theory, ms., draft X.01.95, Univ. of Manitoba ftp://ruccs.rutgers.edu/pub/OT/TEXTS/papers/morcan.ps
...

walther@ling.uni-duesseldorf.de Maerz 1995