Dieses Projekt soll in Zusammenarbeit mit dem DFG-Projekt Grammar Formalisms beyond Context-Free Grammars and their use for Machine Learning Tasks durchgeführt werden. Es soll um datengetriebenes Parsing gehen, das heisst, aus einer vorhandenen Baumbank soll eine probabilistische Grammatik gelernt werden, die dann zum probabilistischen Parsing verwendet werden kann. Je nachdem, was die Teilnehmer an Interessen mitbringen, kann man sich verschiedene Themen für das Teamprojekt vorstellen, z.B. a) Verwendung eines vorhandenen PCFG-Parsers zum Parsen mit einer Baumbank, bei der für das Training mit verschiedenen Annotationsvarianten experimentiert wird oder b) Transformation eines Konstituentenparsbaums in eine Dependenzstruktur, um einen Vergleich von Konstituentenparsern und Dependenzparsern zu ermöglichen. Die Wahl der jeweiligen Sprache hängt von den Sprachkenntnissen der Teamprojektteilnehmer und natrürlich der Verfügbarkeit von Ressourcen ab. Ein Parsing des Deutschen unter Verwendung von NeGra, Tiger und TüBa-DZ ist eine Möglichkeit.