Artykuł omawia metodologię tworzenia korpusów, czyli zbiorów tekstów, pozwalających zastosować metody ilościowe i na ich podstawie wyciągnąć wnioski na temat szerszej populacji, której próbę ów korpus stanowi. W szczególności omawiane tu korpusy stanowią obraz dyskursu danego okresu i mogą znaleźć zastosowanie w analizach diachronicznych czy badaniu procesu historycznoliterackiego. Cyfrowe literaturoznawstwo potrzebuje korpusów, by wykorzystać wypracowane już metody i poszerzyć nasze rozumienie takich procesów jak ewolucja gatunków, pojęć czy stylów. Nasze rozważania rozpoczynamy od ogólnego omówienia korpusów jako zbiorów danych badawczych w różnych dyscyplinach. Następnie skupiamy się na literaturoznawstwie, przyglądając się swoistym protokorpusom, czyli antologiom, które zdawały się pełnić podobną funkcję, choć w innym kontekście metodologicznym. Te rozpoznania prowadzą nas do przeglądu i analizy wybranych korpusów w badaniach literackich. W konkluzjach prezentujemy główne wyzwania związane z pracami nad Korpusem Dyskursu Literaturoznawczego (KDL).
Słowa klucze: korpus, antologia, przetwarzanie języka naturalnego, humanistyka cyfrowa, literaturoznawstwo, cyfrowe badania literackie
Title: Text corpus as a tool for literary studies
Abstract:
The article discusses the methodology of creating corpora, or collections of texts, that allow for the application of quantitative methods and drawing conclusions about the broader population sampled by the corpus. In particular, the corpora discussed in this paper provide a snapshot of the discourse of a given period and can be used in diachronic analysis or the study of the historical-literary process. Digital literary studies needs corpora to apply its methods already and to expand our understanding of such processes as the evolution of genres, literary concepts or styles. We begin our discussion with a general overview of corpora as research datasets in various disciplines. We then focus on literary studies, looking at anthologies, pictured as protocorpora, which seemed to serve a similar function, albeit in a different methodological context. These explorations lead us to the review of selected corpora in literary studies. In conclusion, we present the main challenges of the work on the Corpus of Literary Discourse (KDL).
Keywords: Corpus, antology, natural language processing, digital humanities, literary studies, digital literary studies