The following data table provides information on the lemmas
(i.e. types) of the PhonD2 corpus. All data is ready
for download (in .csv and .xlsx format). The columns refer to the
following:
Lemma: item of the questionnaire
Class: differentiation between lexemes and grammemes
according to our pilot studies (see Lameli & Werth 2017; L:
substantives, verbs, adjectives, adverbs; G: pronouns,
particles, prepositions, articles, connectives)
POS: broad parts of speech (POS) tagging (ADJ, ADV,
ART, JUNK, KONJ, NUM, PART, PRAEP, PRON, SUBST, VERB)
POS-STTS: POS tagging according to
STTS
(Schiller et al. 1999)
Lameli, Alfred & Alexander Werth. 2017. Komplexität und Indexikalität – Zum funktionalen Gehalt phonotaktischer Wortstrukturen im Deutschen. In, Mathilde Hennig (ed): Linguistische Komplexität – ein Phantom? Tübingen: Stauffenburg, 73-96.
Schiller, Anne, Simone Teufel, Christine Stöckert & Christine Thielen. 1999. Guidelines für das Tagging deutscher Textcorpora mit STTS (Kleines und großes Tagset). Stuttgart, Tübingen: Institut für maschinelle Sprachverarbeitung, Seminar für Sprachwissenschaft.
PhonD2 | 2021
Licensed under a Creative Common Attribution 4.0 International (CC BY 4.0)
Provided by