Morpheme als Constraints
Markus Walther, Universitaet Duesseldorf, 10.03.1995
Historie
Hockett(1954) hat zwischen Item-and-Process-Morphologie
(Russell: 'morphemes as representations') und
Item-and-Arrangement-Morphologie (Russell: 'morphemes as rules')
unterschieden.
- item-and-process:
base ---rules--> form1(base) ;
base ---rules--> form2(base), ...
Dabei sind die (gemeinsame) Basisform und die davon derivierten Formen oberflaechentreu.
- item-and-arrangement:
underlying form 1^underlying form 2^ ... ---rules1 -- rules2 ...--> surface form
^ bedeutet Konkatenation
Hoeksema&Janda(1988) fassen diese Begriffe wie folgt
zusammen:
In the Item-and-Process approach, the emphasis is on the
relation between words in a language - in particular, on the ways in
which sets of related words are derived from common bases by the
application of certain processes (such as affixation,
vowel-replacement, compounding, etc.). .... The Item-and-Arrangement
model, on the other hand, is mainly concerned with the formalization
and clarification of the constituency-relation - that is, with the
ways in which words and phrases can be sliced up into their parts.(p.200f.)
Ein dritter, juengerer Ansatz - am ehesten wohl mit Item-and-Process
verwandt - ist mit der Sichtweise von
Morphemen als Constraints (MaC) gegeben, am "meisten entwickelt" (Russell p.2) im Camp
der Deklarativen Phonologie(DP).
Bird(1990)'s Dissertation ueber constraintbasierte, deklarative
Phonologie deutet diese Sicht wie folgt an:
The lexicon is essentially a store of morphemes, where each
morpheme is a [Saussurean] sign. Morpheme structure constraints can
then be viewed as generalizations over the lexicon...(p.14f.)
Er gibt auch formale Representationen von Morphemen an, die klar von
der gleichen Natur wie phonologische Constraints sind.
Explizit wird diese Sichtweise in Scobbie(1991)'s
Dissertation:
The formal equivalence of rule and representation
is a familiar aspect of Unification-Based Grammar [UBG]. In UBG
lexical entries are partial descriptions of a certain specificity,
while rules are just more general - they describe those parts of a
representation which are predictable and can be abstracted out from
lexical entries. Both types of partial description are constraints on
wellformed representations.(p.10f.)
Auch der hauptsaechlich fuer Lexikon/Morphologiemodellierung
eingesetzte DATR-Formalismus (Evans&Gazdar 1990) bietet in
einem defaultbasierten Rahmen einheitliche formale Mittel zum Ausdruck
von Generalisierungen ueber dem Lexikon wie auch individuellen
Eintraegen. Ein charakteristisches Merkmal publizierter
Morphologie/Lexikonfragmente (cf. etwa Gazdar 1992; Corbett &
Fraser 1994) ist, dass spezifische
(Morphem/Wort)-'Knoten' Vorrang vor niederrangigen haben: DATR-Knoten
sind hierarchisch verknuepft.
Optimality Theory kann als Item-and-Arrangement-Theorie
gesehen werden. Der wesentliche Unterschied zur regelbasierten
generativen Phonologie besteht darin, dass von zugrundeliegenden
Reprasentationen (UR's) auf Mengen von UR's in OT
uebergegangen wurde.
Ellison(1994a) benutzt fuer die formale Modellierung von GEN
exakt die gleichen Mittel (regulaere Mengen/Ausdruecke) wie fuer die
Constraints. Sein arabisches Beispielwort 'alqalamu' wird in einem
regulaeren Ausdruck dargestellt, der direkt das Ergebnis von GEN(UR)
darstellt. Obwohl GEN(UR) in seinem Papier nicht als verletzbar dargestellt ist, wird
unmittelbar ersichtlich, dass sich nichts an seinen Algorithmen zur
Constraintevaluierung aendern wuerde, wenn GEN(UR) verletzbar und
damit gleich einem OT-Constraint spezifiziert wuerde.
Hammond(1995) und Russell(1995) 'entdecken' den Wert
von MaC fuer die OT. Russel zitiert Bird, Scobbie und Russell;
Hammond zitiert keine DP-Literatur.
Wann muss man eine Theorie aendern?
Russell, p.44:
erzwungener
Uebergang von Theorie T auf T' gdw.
not Theorie T ist notwendig &
not Theorie T ist hinreichend & Theorie T' ist
notwendig & Theorie T' ist hinreichend
Kommentare und Folgerungen:
- Theorie T notwendig gdw forall Theorien T' mit T'
=/= T: not Theorie T' ist hinreichend
- Notwendigkeit meist sehr schwer zu zeigen wegen Allquantor. Evtl.
abschwaechen mit '& Trivialitaet(T') < TMax', schwer formalisierbar.
- Folgerung: um Nicht-Notwendigkeit zu zeigen, reicht die Existenz
einer anderen hinreichenden Theorie
- 'Hinreichend' ist eine Theorie T, die den Datenbereich D abdeckt.
Um das zu ermitteln, muessen die Eigenschaften(T) genuegend praezise
bekannt sein.
Hier ist T die Standard-Konzeption von OT mit URs und T' die Variante
ohne URs, aber mit Morphemen als Constraints. Obiges Schema gibt dann
an, was man zeigen muesste, um T als nicht mehr tragbar im strengen
Sinne zu erweisen.
OT aus der formalen Perspektive
Wie Ellison(1994b) im Rahmen einer modallogischen
Modellierung gezeigt hat, kann die in
Prince&Smolensky(1993) informell spezifizierte OT formal
als Defaultformalismus aufgefasst werden - genauso wie etwa die
Unterspezifikationstheorie von
Archangeli&Pulleyblank(1989). Waehrend letztere die
notwendige Defaultpriorisierung ueber ein 'Ranking' der Merkmale (primaer)
wie auch der der Position der Defaultanwendung (sekundaer) vornimmt,
wird in OT sekundaer die Defaultanwendung gemaess der Anzahl der
Ausnahmen/Verletzungen zu einem Default(constraint) geordnet.
Diese Einordnung von OT legt unmittelbar einen Vergleich mit
anderen (formalen) Defaultformalismen und ihren Anwendungen nahe, z.B.
den verschiedenen Vorschlaegen zu Defaultunifikation (Bouma,
Carpenter, Copestake, Lascarides et al.,...) oder der
Defaultrepresentationssprache DATR (Gazdar & Evans).
DATR wurde extensiv fuer Lexikon&Morphologiemodellierung
eingesetzt; auch hier sind Repraesentationen und Generalisierungen aus
dem gleichen 'formalen Holz'. Russell scheint die Anleihe bei
Defaultformalismen und ihren Anwendungen ebenfalls als wertvoll zu
erachten, wenn er sagt:
The phenomena of verbal ablaut seem to lend themselves
naturally to an account using ranked constraints, as shown by Dunstan
Brown's computer implementation of the paradigms using DATR, a
specification language for default logic (Brown 1993 [No reference!]). (p.21f.)
Fazit: Die formale Brille erweist OT als vergleichbar mit
anderen defaultbasierten Formalismen, von denen damit wertvolle
Anregungen, Begruendungen, Grenzen, Einsatzmoeglichkeiten 'geerbt'
werden koennten.
MUSS frau Morpheme als Constraints einfuehren? Nein!
Die Frage ist aequivalent zu dem erzwungenen Theoriewechsel von oben
und wir untersuchen demgemaess die Praemissen, die erfuellt werden
muessen.
Zunaechst bei Russell:
Wie er behauptet (p.10), ist Standard-OT (p.44) nicht hinreichend fuer
Koaleszenzphaenomene, und zwar wie folgt:
- zwei durch eine Morphemgrenze getrennte X-Positionen, die mit
einer eigenen 'Kopie' eines Merkmals [+F] autosegmental assoziiert
sind, koennen nicht zu einem doppelt assoziierten [+F] per OCP werden.
- Grund: *Containment, denn eines der [+F]s wurde aus dem Input entfernt.
Leider ist die Behauptung unbewiesen, weil
- ... es Standard-OT nicht gibt: Die Anzahl der Interpretationen von OT
bzw. ihrer Subkomponenten wie GEN ist vermutlich gleich der Anzahl der
OT-Anhaenger. Die Einschraenkung auf 'McCarthy und Prince's
Interpretation' bei Russell (p.10) ist dabei sehr aufschlussreich,
belegt sie doch a) die Individualisierung der Interpretation und b)
ihre Nicht-Kommunizierbarkeit: keiner kennt die aussersprachliche
Interpretation von M&P (ausser M&P gemeinsam ...)
- ... sie ohne Kenntnis der formalen Eigenschaften nicht zu beantworten
ist.
- ... es mindestens eine ausgearbeitete formale Semantik autosegmentaler Diagramme
gibt (Bird&Ellison 1994), in der beide Diagramme (2 einfach
assoziierte benachbarte vs. 1 doppelt assoziiertes Autosegment - die
typische Koaleszenzsituation) exakt das gleiche bedeuten. Da der
verwendete Formalismus monoton ist, wird nie etwas 'aus dem Input
entfernt', Containment gilt daher trivialerweise.
Ellison (1994a) verwendet diesen Formalismus, um OT zu formalisieren.
Beide empirischen Argumente von Russell, naemlich koronale
Koaleszenzphaenomene in Nisgha und Vokalkoaleszenz in Hua, bauen auf dieser unbewiesenen
und - je nach Formalisierung von OT - widerlegbaren Behauptung auf.
Nach der obigen Logik von Russell selbst hat er also nicht gezeigt, dass wir
unbedingt MaC brauchen.
Nun zu Hammond:
Er behauptet, dass Standard-OT nicht hinreichend fuer die
Behandlung von Ausnahmeakzent (im Spanischen Nominal- und
Verbalbereich) sei, da - selbst wenn lexikalische Repraesentationen
(URs) Ausnahmemarkierungen tragen - constraintbasierte Einschraenkungen bzgl. der
Distribution solcher Ausnahmen (hier: 3-Silben-Fenster fuer
Hauptakzent) keine Wirkung zeigen koennten:
Notice that this [restriction of stress placement] would NOT
be possible if exceptions were represented in lexical representations.
Such representations are, definitionally, outside the hierarchy, and
thus not subject to it. [Footnote:] In classic derivational stress
theory, this was dealt with by positing more abstract representations
requiring conflation Halle & Vergnaud, 1987) or lexical diacritics
(Hammond, 1989b). (p.12)
Die Fussnote von Hammond deutet schon einen Ausweg an, der seine
Behauptung entkraeften kann:
- Man nehme ein Diakritikum, z.B. das ganz generelle
[+strict/indefeasible_information]
- Ausnahmehaftige Informations'bruchstuecke' der UR wie finaler
oder Antepenultima-Akzent sind [+strict...]
- Es gibt ein hochrangiges Constraint a la STRICTNESS: "don't omit indefeasible
information."
- absolute Constraints ueber die Distribution >> STRICTNESS
Auch hier kommt die Idee aus Parallelen zu anderen
Defaultformalismen, wo die Spezifikation strikter Information sich als
wuenschenswert herausgestellt hat.
Die Information, die in der Parametrisierung eines allgemeinen
Constraints (Hammond: Align) fuer das Ausnahme-Morphem und in seinem
Ranking steckt, hat - so kann man argumentieren - aehnlich
diakritischen Charakter wie vorstehender Vorschlag.
Zusaetzlich besagt ein Resultat von Kaplan et al. (1988), dass
Diakritika in Formalismen, die die Komposition von UR-Lexikon
und phonologischen Regeln erlauben, eliminierbar sind.
Damit erweisen sich also auch Hammond's Argumente nicht als
zwingend fuer den Wechsel hin zu einer OT mit MaC.
SOLLTE man Morpheme als Constraints verwenden? Ja!
Fuer MaC und den Verzicht auf URs koennen nach dem vorhergehenden
negativen Result trotzdem die ueblichen subjektiven Kriterien
sprechen:
- Einfachheit
- Symmetrien
- technische Vorteile
- Realismus
Zu 1.
- OT hat ohne URs kein GEN mehr. Bei einer Constraintsprache, die
die konstruktive (insbes. auch fuer Negation) und intensionale (wg. moeglicher unendlicher
Strukturen) Beschreibung wohlgeformter Strukturen zulaesst (etwa
regulaere Mengen wie bei Ellison (1994a)), kann man - kontra Russell p.37 - auch
auf die Aufzaehlung/Bereitstellung der Kandidatenmenge verzichten: OT
= Constraints + Ranking. Oberflaechenformen sind die
'optimierte' Schnittmenge aller Constraints.
Zu 2.
- Representationen und Generalisierungen/Constraints sind formal
gleich - letztere sind einfach unspezifischer. Potentiell hoher
Erklaerungswert fuer den L1-Erwerb sprachspezifischer Generalisierungen.
Zu 3.
- Einheitlicher, einfacher Formalismus, keine
Schnittstellenprobleme = einfache, generelle Implementierung
Zu 4.
- OT ist mit MaC eine Mischung von sprachspezifischen und mehr
oder weniger universalen Constraints. Das ist voellig analog etwa zur
Standardposition in der HPSG.
- Constraints muessen also gelernt werden - das macht zumindest
konzeptuell den Weg frei fuer eine empirische Abgrenzung
zwischen lernbaren und - relativ zu einer gegebenen Architektur -
unlernbaren Constraints.
Anwendungsbeispiele fuer Morpheme als Constraints
Russell: koronale Koaleszenz in Nisgha/Britisch-Kolumbien,CA
Szenario:
- VerbStem-(Comp)-3sg=(Evidentials)=(Erg)=Det#Noun
- Beispiele fuer Det: =t, =l[-voi] ; Erg: =s ; 3sg: -t. VerbStem:
limx 'singen', naks 'heiraten'
- Koaleszenz: l[-voi] + t = l[-voi], s + t = s, t + t = t, *s +
l[-voi] (Russell: l[-voi,-cont], s[+cont].
- Beispiele: limx-t 'er/sie singt', naks-t > naks 'er/sie
heiratet, naks-t=s=t 'heiraten-3sg=erg=det' > naks
Russell's Analyse:
- Geeignete Unterspezifikation der Koronale: t <= (s, l[-voi])
- Koaleszenz ist Unifikation (explizit bei Buckley (1994) fuer
Vokalkoaleszenz in Tigrinya, implizit bei Russell)
- Morpheme als Constraints: [+cor -son] + 3sg , nak [+cor -son
+cont] + etc.
- In OT nach Russell als ALIGN({3sg, 'heiraten',..)
Kommentar:
- Faelle wie Koaleszenz, wo die beteiligten Akteure offenbar
ueberlappende Anforderungen an die Umgebung stellen, sind
die Crux des MaC-Ansatzes: ohne MaC lassen sich 'rule conspiracies' in
diesen Faellen schwer vermeiden (cf. Russell p.15).
- Unklar ist, ob man Constraints mit 'global power' wie ALIGN
dafuer braucht, die Beispiele sind alle mit lokaler, unmittelbarer
Adjazenz erfassbar.
- Ueberlappung/Unifikation kann mit geeigneten Massnahmen auch
kontextfreie Konkatenation simulieren (Ellison 1993), aber nicht
umgekehrt. Hypothese: Voellig kontextfreie Konkatenation von Morphemen ist
selten in natuerlicher Sprache.
Hammond: Ausnahmen zum Hauptakzent im Spanischen
Szenario:
- Defaultakzent auf vorletzter Silbe (mon'eda, trab'ajo)
- finales 3-Silben-Fenster fuer moegliche Akzentposition: keine Ausnahmen
- Es gibt Nomina mit Akzent auf der letzten (sof'a, Panam'a,
caf'e) und vorvorletzten (p'ajaro, est'omago, m'edico) Silbe
- In manchen Verbparadigmen f"allt aus morphologischen Gruenden der
Hauptakzent auf den ersten Vokal nach der Wurzel
Hammond's Analyse:
- 2 Typen von Ausnahmen, die beide den Defaultakzent
ueberschreiben koennen und beide dem 3-Silben-Fenster
unterliegen.
- Die Idee: Ausnahmen-als-MaCs sind gerade ueber den Constraints
geordnet, die sie verbieten wuerden.
- Hammond: 3-Silben-Fenster als finale extrametrische Silbe >>
rechts-'aligntem' binaeren Fuss
- Es ist nicht zu sehen, wie das funktionieren kann - kontra
Hammonds Begruendung p.11 und mit Kenstowicz(Tilburg 1995, nach Green
(1994)! Aber ein Ansatz a la Green(1994), der als Schluesselidee
FOOT-BINARITY in LAPSE: "2 unbetonte Silben haben eine Fussgrenze"
dazwischen und MIN-2: "Ein Fuss besteht aus >= 2 Silben" aufteilt,
loest wahrscheinlich das Problem im Rahmen konventioneller OT-Argumentation
(Hausaufgabe fuer den Leser ...).
Kommentar:
- Constraintranking fuer die Kodierung von Ausnahmen ist
ein eher technischer Punkt und nicht weiter ueberraschend. Laesst sich
dieser Einsatz von MaC ueberhaupt durch empirische Argumente stuetzen?
Weitere Gesichtspunkte
- 'There is no lexicon!*' -> '*There is no lexicon!' - OT wird
durch MaC lexikalistischer denn je.
- Unklare Mechanismen von OT wie candidate set adjustment,
Allomorph-Auswahl, Interpretation von Oberflaechen-Kandidaten,
kontextsensitive Auswahl einer Rangordnung, die die vorgeblich
einfache Architektur von OT betraechtlich verkomplizieren (Russell
p.4-9), werden durch MaC ueberfluessig.
- Faithfulness constraints (PARSE, FILL, *SPEC, MSEG,
*INSERT-X) sind wahrscheinlich eliminierbar.
- Statt MSEG, *INSERT-X
UR-unabhaengige *Struktur-Constraint-Familien und
Morphem(-Familien-)Ranking.
- Statt PARSE Morphemrepraesentation durch verletzbare
Unmittelbare-Adjazenz-von-Seg-X-und-Y- Constraints (Russell p.41)
oder Optionalitaet in Repraesentationen nach der lexikalistischen Devise "baue die
geforderte Variabilitaet direkt in die Repraesentation ein" +
PARSE-OPT-X/FILL-OPT-X: "realisiere/nicht optionale Elemente vom Typ
X".
- ... und vieles mehr ...
Literatur
- Hammond, Michael (1995): There is no lexicon!*, ms., draft 19.01.95, Univ. of Arizona,
ftp://ruccs.rutgers.edu/pub/OT/TEXTS/papers/nolex.ps
- Russell, Kevin (1995): Morphemes and candidates in Optimality
Theory, ms., draft X.01.95, Univ. of Manitoba
ftp://ruccs.rutgers.edu/pub/OT/TEXTS/papers/morcan.ps
- ...
walther@ling.uni-duesseldorf.de
Maerz 1995