Charles Explorer logo
🇨🇿

Seminář z korpusové lingvistiky

Předmět na Filozofická fakulta |
ADE510008

Sylabus

1. Stunde Einleitungsstunde, Organisatorisches  Theorie  Korpus, seine Struktur, seine Zweckdienlichkeit, seine Arten, Geschichte, Allgemeines usw.  Praktischer Teil  Korpusregistrierung, Basisorientierung im COSMAS II.

2. Stunde  Theorie  Zusammensetzung der Korpora, Repräsentativität, Ausgewogenheit, Bearbeitung (tagging, tokenizace, desambiguace, parsing), Normativität usw.   Praktischer Teil  Probe des Zugangs (eduroam, COSMAS II., COSMAS II – online, ČNK, InterCorp)  Suche in DeReKo, grundsätzliche Suchanfragen, ausgewählte Probleme  Sammlung eigener Ideen/Problemstellen bei Erstellung der Suchanfragen

3. Stunde  Theorie  Mannheimer Korpora – Geschichte, Umfang, Zusammensetzung, Such- und Analysemöglichkeiten (DeReKo, COSMAS II.), AGD (Archiv für Gesprochenes Deutsch)  Praktischer Teil  Anwendung: Suche in Mannheimer Korpora – kompliziertere Suchanfragen  Suchergebnisse auswerten

4. Stunde   Theorie:  Internet als Korpus? Suchmöglichkeiten, Quellen, Vorteile, Nachteile, WaC   Praktischer Teil  Suche in Mannheimer Korpora – kompliziertere Suchanfragen  Suchergebnisse auswerten  Vergleich mit den Suchmöglichkeiten in Google

5. Stunde  Theorie  Český národní korpus - Geschichte, Umfang, Zusammensetzung, Such- und Analysemöglichkeiten; Diachrone Korpora; Korpora der gesprochenen Sprache – Ausnutzung, Umfang, Zweckdienlichkeit: (ohne InterCorp)   Praktischer Teil  DeReKo-Reste  Such- und Analysemöglichkeiten in ČNK – KonText, T-Score, MI-Score

6. Stunde  Theorie  Parallelkorpus InterCorp - Geschichte, Umfang, Zusammensetzung, Such- und Analysemöglichkeiten  Praktischer Teil  Such- und Analysemöglichkeiten in ČNK  Park, KonText

7. Stunde  Theorie  Korpuslexikographie – Realität, Vision, corpus-based, -driven, elexiko, OWID, eVALBU, SYD, WordNet, DWDS, Ausnutzung der Korpora für Lexikographie – konkrete Möglichkeiten.    Praktischer Teil  Such- und Analysemöglichkeiten in DeReKo und ČNK  KonText  lexikographische Bearbeitung eines Stichwortes auf Grund der korpusbasierten und korpusanalytischen Anfragen + Vergleich mit bestehenden Wörterbüchern

8. Stunde  Theorie  Phraseologieforschung und Korpora (corpus-based/-driven; Kookkurrenzanalyse, CCDB, Kollokation, Kookkurrenz, Kolligation usw.)     Praktischer Teil  Suche der komplizierten Wortverbindungen in DeReKo und ČNK

9. Stunde  Theorie  Korpora für didaktische Zwecke   Praktischer Teil  Kookkurrenzanalyse, CCDB – Suchen, Ergebnisse auswerten und verstehen

10. Stunde  Praktischer Teil  ČNK, Filter, statistische Maße  Applikationen – SyD, Morfio, Treq

11. Stunde  Praktischer Teil  ČNK, InterCorp

12. Stunde  Praktischer Teil  DWDS  Reste

13. Stunde  kurzer schriftlicher Test zur Theorie der Korpuslinguistik (im Falle des Distanzunterrichts via MS Teams mündlich)  praktisches Überprüfen der Such- und Analysefähigkeiten und Kenntnisse (schriftlich, per E-mail)

Anotace

Kurz navazuje na prakticky zaměřený kurz Cvičení z korpusové lingvistiky v bakalářském studiu. Je zaměřený teoretičtěji.

Studenti se seznamují nejen s praktickým využitím korpusů, ale také s pozadím jejich užívání, metodologickými otázkami apod. Na konci kurzu jsou schopni využívat korpusy němčiny (DeReKo a DWDS) a češtiny (ČNK vč.

InterCorpu) vč. přidružených aplikací (Kookkurrenzanalyse, CCDB, SOM, CNS, SyD, Morfio, Treq, KWords ad.) ve svém každodenním životě i při psaní vědecky orientovaných prací, jsou seznámeni s pozadím a hlubší problematikou korpusové lingvistiky a dokážou tak vhodně patřičná data získat, jakož i vyhodnotit.