Charles Explorer logo
🇬🇧

Corpus Linguistics Seminar

Class at Faculty of Arts |
ADE500014E

This text is not available in the current language. Showing version "cs".Syllabus

4.10.2017 Einleitungsstunde

Organisatorisches

Thema – Theorie – Věra Hejhalová

Korpus, seine Struktur, seine Zweckdienlichkeit, seine Arten, Geschichte, Allgemeines usw.

Čermák, F.: Korpusy včera, dnes a zítra, In: Korpusová lingvistika Praha 2011, sv. 2, Praha 2011, S. 10-29. www.ucnk.ff.cuni.cz – Co je korpus?

PERKUHN, Rainer, Holger KEIBEL a Marc KUPIETZ. Korpuslinguistik. Paderborn: Wilhelm Fink, 2012, 144 s. ISBN 9783825234331. – Kapitel 3.1, 3.3-3.5

LEMNITZER, Lothar a ZINSMEISTER Heike. Korpuslinguistik. Eine Einführung. Tübingen: Gunter Narr, 2006, 220 s. ISBN 3-8233-6210-0. – zur Typologie, S. 102ff.

TEUBERT, Wolfgang a Anna ČERMÁKOVÁ. Corpus linguistics: a short introduction. London: Continuum, c2007, vi, 153 s. ISBN 9780826494818.

SCHERER, Carmen.  Korpuslinguistik. Heidelberg: Universitätsverlag Winter, 2006, 98 s. ISBN 9783825351649  

Praktischer Teil

- Korpusregistrierung   11.10.2017 – 2. Stunde

Zusammensetzung der Korpora, Repräsentativität, Ausgewogenheit, Bearbeitung (tagging, tokenizace, desambiguace, parsing), Normativität usw.

LEMNITZER, Lothar a ZINSMEISTER Heike. Korpuslinguistik. Eine Einführung. Tübingen: Gunter Narr, 2006, 220 s. ISBN 3-8233-6210-0. – zur Typologie, S. 102ff. – S. 63ff (Annotationsebenen)

PERKUHN, Rainer, Holger KEIBEL a Marc KUPIETZ. Korpuslinguistik. Paderborn: Wilhelm Fink, 2012, 144 s. ISBN 9783825234331. – Kap. 2, 3.2, 4 – S. 22-66

Hlaváčková/Grác/Sedlářová: Budování anotovaného korpusu bez odborníků, In: Korpusová lingvistika Praha 2011, sv. 2, Praha 2011, S. 132-141  

Praktischer Teil

Probe des Zugangs (eduroam, COSMAS II., COSMAS II – online, ČNK, InterCorp)

Suche in DeReKo, grundsätzliche Suchanfragen, ausgewählte Probleme

Sammlung eigener Ideen/Problemstellen bei Erstellung der Suchanfragen     18.10.2017 – 3. Stunde

Thema – Theorie: Mannheimer Korpora – Geschichte, Umfang, Zusammensetzung, Such- und Analysemöglichkeiten (DeReKo, COSMAS II.), AGD (Archiv für Gesprochenes Deutsch): http://www1.ids-mannheim.de/start/ - webové stránky Institut für deutsche Sprache in Mannheim http://www1.ids-mannheim.de/kl/projekte/korpora/ - Webseiten zum Projekt DeReKo (Das deutsche Referenzkorpus) http://agd.ids-mannheim.de/index.shtml

Archiv für gesprochenes Deutsch (IDS) - http://agd.ids-mannheim.de/index.shtml

Historisches Korpus (IDS) - http://www1.ids-mannheim.de/lexik/HistorischesKorpus/  

Praktischer Teil

Anwendung: Suche in Mannheimer Korpora – kompliziertere Suchanfragen

Suchergebnisse auswerten     25.10.2017 – 4. Stunde

Thema – Theorie: Internet als Korpus? Suchmöglichkeiten, Quellen, Vorteile, Nachteile, WaC: ____ www.ucnk.ff.cuni.cz – Co je korpus?

Belica, Cyril, Keibel, Holger, Kupietz, Marc a Rainer Perkuhn.

Web as Corpus: Kooperation mit der Universität Bologna. In: Sprachreport Sonderheft/März 2007. Auslandskooperationen des Instituts für Deutsche Sprache. S. 21-25 - Mannheim: 2007. (Sprachreport X/2007)

(http://pub.ids-mannheim.de/laufend/sprachreport/pdf/sr07-sonderheft.pdf)

KILGARRIFF, Adam. Googleology is Bad Science. In: Computational linguistics [online]. 2007, Jg. 33, Nr. 1, S. 147-151. ISSN 0891-2017.

(http://www.kilgarriff.co.uk/Publications/ 2007-K-CL-Googleology.pdf)

Pala/Rychlý: Do we need very large Web Corpora, In: Korpusová lingvistika Praha 2011, sv. 2, Praha 2011, S. 30-40. deWaC, enWaC … v rámci ČNK  

Praktischer Teil

Anwendung:

Suche in Mannheimer Korpora – kompliziertere Suchanfragen

Suchergebnisse auswerten

Vergleich mit den Suchmöglichkeiten in Google   1.11.2017 – 5. Stunde

Thema – Theorie: Český národní korpus - Geschichte, Umfang, Zusammensetzung, Such- und Analysemöglichkeiten; Diachrone Korpora; Korpora der gesprochenen Sprache – Ausnutzung, Umfang, Zweckdienlichkeit: (ohne InterCorp) __ www.korpus.cz – nové rozhraní KonText pro práci s korpusy ČNK www.ucnk.ff.cuni.cz – webové stránky Ústavu Českého národního korpusu

Kučera: Diachronní složka Českého národního korpusu: historie, přítomnost, budoucnost, In: Korpusová lingvistika Praha 2011, sv. 2, Praha 2011, S. 64-73.

Hoffmanová/Mikulová: Korpusy mluvené češtiny a možnosti jejich využití pro poznání rozdílných „světů“ mluvenosti a psanosti, In: Korpusová lingvistika Praha 2011, sv. 2, Praha 2011, S. 78-92.

Stluka: Diachronní složka ČNK, využití DČNK ve výzkumu, In: Korpusová lingvistika Praha 2011, sv. 2, Praha 2011, S.196-219  

Praktischer Teil o   DeReKo-Reste o   Such- und Analysemöglichkeiten in ČNK – KonText, T-Score, MI-Score   8.11.2017 – 6. Stunde

Thema – Theorie: VH

Parallelkorpus InterCorp - Geschichte, Umfang, Zusammensetzung, Such- und Analysemöglichkeiten___ o   Štourač/Křen/Rosen/Vavřín/Vondřička: Paralelní korpus InterCorp po sedmi letech, In: Korpusová lingvistika Praha 2011, sv. 2, Praha 2011, S. 105-115. o   ausgewählte Artikel aus Korpusová lingvistika Praha 2011, Bd. 1 (Jirásek; Vachková/Šemelík/Marková; Káňa; Peloušková; Zaikina; Vystrčilová) o   www.korpus.cz – nové rozhraní KonText, Park  

Praktischer Teil o   Such- und Analysemöglichkeiten in ČNK o   Park, KonText   15.11.2017 – 7. Stunde

Thema - Theorie

Korpuslexikographie – Realität, Vision, corpus-based, -driven, elexiko, OWID, eVALBU, SYD, WordNet, DWDS, Ausnutzung der Korpora für Lexikographie – konkrete Möglichkeiten. _____ http://www1.ids-mannheim.de/projekte/ http://www.dwds.de/ o   Vystrčilová: Tři příklady aplikace jazykového korpusu v lexikografii, In: Korpusová lingvistika Praha 2011, sv. 2, Praha 2011, S.361ff      

Praktischer Teil o   Such- und Analysemöglichkeiten in DeReKo und ČNK o   KonText o   lexikographische Bearbeitung eines Stichwortes auf Grund der korpusbasierten und korpusanalytischen Anfragen + Vergleich mit bestehenden Wörterbüchern   22.11. 2017 – 8. Stunde

Thema - Theorie

·         Phraseologieforschung und Korpora (corpus-based/-driven; Kookkurrenzanalyse, CCDB, Kollokation, Kookkurrenz, Kolligation usw.)_

Ptashnyk, Stefaniya / Erla Hallsteinsdottir / Noah Bubenhofer: Korpora, Web und Datenbanken Computergestutzte Methoden in der modernen Phraseologie und Lexikographie (on-line), Hohengehren: Schneider Verlag, zugänglich unter: https://www.bubenhofer.com/publikationen/SammelbandPhraseologie20100311.pdf

PERKUHN, Rainer, Holger KEIBEL a Marc KUPIETZ. Korpuslinguistik. Paderborn: Wilhelm Fink, 2012, 144 s. ISBN 9783825234331. – Kap. 8, S. 108ff.

This text is not available in the current language. Showing version "cs".Annotation

Kurz navazuje na prakticky zaměřený kurz Cvičení z korpusové lingvistiky v bakalářském studiu. Je zaměřený teoretičtěji.

Studenti se seznamují nejen s praktickým využitím korpusů, ale také s pozadím jejich uživání, metodologickými otázkami apod. Na konci kurzu jsou schopni využívat korpusy němčiny (DeReKo a DWDS) a češtiny (ČNK vč.

InterCorpu) ve svém každodenním životě i při psaní vědecky orientovaných prací, jsou seznámeni s pozadím a hlubší problematikou korpusové lingvistiky a dokáží tak vhodně patřičná data získat, jakož i vyhodnotit.