Data table

The following data table provides information on the lemmas (i.e. types) of the PhonD2 corpus. All data is ready for download (in .csv and .xlsx format). The columns refer to the following:

Lemma: item of the questionnaire
Class: differentiation between lexemes and grammemes according to our pilot studies (see Lameli & Werth 2017; L: substantives, verbs, adjectives, adverbs; G: pronouns, particles, prepositions, articles, connectives)
POS: broad parts of speech (POS) tagging (ADJ, ADV, ART, JUNK, KONJ, NUM, PART, PRAEP, PRON, SUBST, VERB)
POS-STTS: POS tagging according to STTS (Schiller et al. 1999)


Lameli, Alfred & Alexander Werth. 2017. Komplexität und Indexikalität – Zum funktionalen Gehalt phonotaktischer Wortstrukturen im Deutschen. In, Mathilde Hennig (ed): Linguistische Komplexität – ein Phantom? Tübingen: Stauffenburg, 73-96.

Schiller, Anne, Simone Teufel, Christine Stöckert & Christine Thielen. 1999. Guidelines für das Tagging deutscher Textcorpora mit STTS (Kleines und großes Tagset). Stuttgart, Tübingen: Institut für maschinelle Sprachverarbeitung, Seminar für Sprachwissenschaft.


PhonD2 | 2021

Licensed under a Creative Common Attribution 4.0 International (CC BY 4.0)

Provided by