Celem niniejszego wykładu jest przybliżenie metodologii badań korpusowych w naukach humanistycznych, głównie w językoznawstwie. Językoznawstwo korpusowe zaczyna rozwijać się na przełomie lat siedemdziesiątych i osiemdziesiątych XX wieku i skupia swoją pracę na elektronicznie opracowanych korpusach językowych.
Korpusy to zbiór różnych typów tekstów (pisanych i mówionych) zgromadzonych w komputerowej bazie danych, która umożliwia automatyczne wyszukiwanie jednostek tekstowych w ich naturalnym kontekście. Ze względu na rodzaj badania wyróżnia się odmienne typy korpusów.
Pierwsze z nich zostały opracowane dla języka angielskiego, aczkolwiek coraz więcej innych języków posiada swoje korpusy narodowe jak np. Narodowy Korpus Języka Polskiego, Czeski Korpus Narodowy czy Narodowy Korpus Języka Rosyjskiego.