4.10.2017 Einleitungsstunde
Organisatorisches
Thema – Theorie – Věra Hejhalová
Korpus, seine Struktur, seine Zweckdienlichkeit, seine Arten, Geschichte, Allgemeines usw.
Čermák, F.: Korpusy včera, dnes a zítra, In: Korpusová lingvistika Praha 2011, sv. 2, Praha 2011, S. 10-29. www.ucnk.ff.cuni.cz – Co je korpus?
PERKUHN, Rainer, Holger KEIBEL a Marc KUPIETZ. Korpuslinguistik. Paderborn: Wilhelm Fink, 2012, 144 s. ISBN 9783825234331. – Kapitel 3.1, 3.3-3.5
LEMNITZER, Lothar a ZINSMEISTER Heike. Korpuslinguistik. Eine Einführung. Tübingen: Gunter Narr, 2006, 220 s. ISBN 3-8233-6210-0. – zur Typologie, S. 102ff.
TEUBERT, Wolfgang a Anna ČERMÁKOVÁ. Corpus linguistics: a short introduction. London: Continuum, c2007, vi, 153 s. ISBN 9780826494818.
SCHERER, Carmen. Korpuslinguistik. Heidelberg: Universitätsverlag Winter, 2006, 98 s. ISBN 9783825351649
Praktischer Teil
- Korpusregistrierung 11.10.2017 – 2. Stunde
Zusammensetzung der Korpora, Repräsentativität, Ausgewogenheit, Bearbeitung (tagging, tokenizace, desambiguace, parsing), Normativität usw.
LEMNITZER, Lothar a ZINSMEISTER Heike. Korpuslinguistik. Eine Einführung. Tübingen: Gunter Narr, 2006, 220 s. ISBN 3-8233-6210-0. – zur Typologie, S. 102ff. – S. 63ff (Annotationsebenen)
PERKUHN, Rainer, Holger KEIBEL a Marc KUPIETZ. Korpuslinguistik. Paderborn: Wilhelm Fink, 2012, 144 s. ISBN 9783825234331. – Kap. 2, 3.2, 4 – S. 22-66
Hlaváčková/Grác/Sedlářová: Budování anotovaného korpusu bez odborníků, In: Korpusová lingvistika Praha 2011, sv. 2, Praha 2011, S. 132-141
Praktischer Teil
Probe des Zugangs (eduroam, COSMAS II., COSMAS II – online, ČNK, InterCorp)
Suche in DeReKo, grundsätzliche Suchanfragen, ausgewählte Probleme
Sammlung eigener Ideen/Problemstellen bei Erstellung der Suchanfragen 18.10.2017 – 3. Stunde
Thema – Theorie: Mannheimer Korpora – Geschichte, Umfang, Zusammensetzung, Such- und Analysemöglichkeiten (DeReKo, COSMAS II.), AGD (Archiv für Gesprochenes Deutsch): http://www1.ids-mannheim.de/start/ - webové stránky Institut für deutsche Sprache in Mannheim http://www1.ids-mannheim.de/kl/projekte/korpora/ - Webseiten zum Projekt DeReKo (Das deutsche Referenzkorpus) http://agd.ids-mannheim.de/index.shtml
Archiv für gesprochenes Deutsch (IDS) - http://agd.ids-mannheim.de/index.shtml
Historisches Korpus (IDS) - http://www1.ids-mannheim.de/lexik/HistorischesKorpus/
Praktischer Teil
Anwendung: Suche in Mannheimer Korpora – kompliziertere Suchanfragen
Suchergebnisse auswerten 25.10.2017 – 4. Stunde
Thema – Theorie: Internet als Korpus? Suchmöglichkeiten, Quellen, Vorteile, Nachteile, WaC: ____ www.ucnk.ff.cuni.cz – Co je korpus?
Belica, Cyril, Keibel, Holger, Kupietz, Marc a Rainer Perkuhn.
Web as Corpus: Kooperation mit der Universität Bologna. In: Sprachreport Sonderheft/März 2007. Auslandskooperationen des Instituts für Deutsche Sprache. S. 21-25 - Mannheim: 2007. (Sprachreport X/2007)
(http://pub.ids-mannheim.de/laufend/sprachreport/pdf/sr07-sonderheft.pdf)
KILGARRIFF, Adam. Googleology is Bad Science. In: Computational linguistics [online]. 2007, Jg. 33, Nr. 1, S. 147-151. ISSN 0891-2017.
(http://www.kilgarriff.co.uk/Publications/ 2007-K-CL-Googleology.pdf)
Pala/Rychlý: Do we need very large Web Corpora, In: Korpusová lingvistika Praha 2011, sv. 2, Praha 2011, S. 30-40. deWaC, enWaC … v rámci ČNK
Praktischer Teil
Anwendung:
Suche in Mannheimer Korpora – kompliziertere Suchanfragen
Suchergebnisse auswerten
Vergleich mit den Suchmöglichkeiten in Google 1.11.2017 – 5. Stunde
Thema – Theorie: Český národní korpus - Geschichte, Umfang, Zusammensetzung, Such- und Analysemöglichkeiten; Diachrone Korpora; Korpora der gesprochenen Sprache – Ausnutzung, Umfang, Zweckdienlichkeit: (ohne InterCorp) __ www.korpus.cz – nové rozhraní KonText pro práci s korpusy ČNK www.ucnk.ff.cuni.cz – webové stránky Ústavu Českého národního korpusu
Kučera: Diachronní složka Českého národního korpusu: historie, přítomnost, budoucnost, In: Korpusová lingvistika Praha 2011, sv. 2, Praha 2011, S. 64-73.
Hoffmanová/Mikulová: Korpusy mluvené češtiny a možnosti jejich využití pro poznání rozdílných „světů“ mluvenosti a psanosti, In: Korpusová lingvistika Praha 2011, sv. 2, Praha 2011, S. 78-92.
Stluka: Diachronní složka ČNK, využití DČNK ve výzkumu, In: Korpusová lingvistika Praha 2011, sv. 2, Praha 2011, S.196-219
Praktischer Teil o DeReKo-Reste o Such- und Analysemöglichkeiten in ČNK – KonText, T-Score, MI-Score 8.11.2017 – 6. Stunde
Thema – Theorie: VH
Parallelkorpus InterCorp - Geschichte, Umfang, Zusammensetzung, Such- und Analysemöglichkeiten___ o Štourač/Křen/Rosen/Vavřín/Vondřička: Paralelní korpus InterCorp po sedmi letech, In: Korpusová lingvistika Praha 2011, sv. 2, Praha 2011, S. 105-115. o ausgewählte Artikel aus Korpusová lingvistika Praha 2011, Bd. 1 (Jirásek; Vachková/Šemelík/Marková; Káňa; Peloušková; Zaikina; Vystrčilová) o www.korpus.cz – nové rozhraní KonText, Park
Praktischer Teil o Such- und Analysemöglichkeiten in ČNK o Park, KonText 15.11.2017 – 7. Stunde
Thema - Theorie
Korpuslexikographie – Realität, Vision, corpus-based, -driven, elexiko, OWID, eVALBU, SYD, WordNet, DWDS, Ausnutzung der Korpora für Lexikographie – konkrete Möglichkeiten. _____ http://www1.ids-mannheim.de/projekte/ http://www.dwds.de/ o Vystrčilová: Tři příklady aplikace jazykového korpusu v lexikografii, In: Korpusová lingvistika Praha 2011, sv. 2, Praha 2011, S.361ff
Praktischer Teil o Such- und Analysemöglichkeiten in DeReKo und ČNK o KonText o lexikographische Bearbeitung eines Stichwortes auf Grund der korpusbasierten und korpusanalytischen Anfragen + Vergleich mit bestehenden Wörterbüchern 22.11. 2017 – 8. Stunde
Thema - Theorie
· Phraseologieforschung und Korpora (corpus-based/-driven; Kookkurrenzanalyse, CCDB, Kollokation, Kookkurrenz, Kolligation usw.)_
Ptashnyk, Stefaniya / Erla Hallsteinsdottir / Noah Bubenhofer: Korpora, Web und Datenbanken Computergestutzte Methoden in der modernen Phraseologie und Lexikographie (on-line), Hohengehren: Schneider Verlag, zugänglich unter: https://www.bubenhofer.com/publikationen/SammelbandPhraseologie20100311.pdf
PERKUHN, Rainer, Holger KEIBEL a Marc KUPIETZ. Korpuslinguistik. Paderborn: Wilhelm Fink, 2012, 144 s. ISBN 9783825234331. – Kap. 8, S. 108ff.
Kurz navazuje na prakticky zaměřený kurz Cvičení z korpusové lingvistiky v bakalářském studiu. Je zaměřený teoretičtěji.
Studenti se seznamují nejen s praktickým využitím korpusů, ale také s pozadím jejich uživání, metodologickými otázkami apod. Na konci kurzu jsou schopni využívat korpusy němčiny (DeReKo a DWDS) a češtiny (ČNK vč.
InterCorpu) ve svém každodenním životě i při psaní vědecky orientovaných prací, jsou seznámeni s pozadím a hlubší problematikou korpusové lingvistiky a dokáží tak vhodně patřičná data získat, jakož i vyhodnotit.