University of Warsaw - Central Authentication System
Strona główna

Quantitative Approaches to Style: Literary Texts and Computer Stylometry

General data

Course ID: 3003-C4TN-JK1
Erasmus code / ISCED: (unknown) / (0232) Literature and linguistics The ISCED (International Standard Classification of Education) code has been designed by UNESCO.
Course title: Quantitative Approaches to Style: Literary Texts and Computer Stylometry
Name in Polish: O stylu ilościowo, czyli teksty literackie i stylometria komputerowa
Organizational unit: Institute of Polish Language
Course groups: (in Polish) Konwersatoria do wyboru dla filologii polskiej - stacjonarne 2go stopnia 2024/2025
(in Polish) Moduł "Nowoczesność" - filologia polska od cyklu 2019 - stacjonarne 2-go stopnia
(in Polish) Moduł "Tradycja i Nowoczesność" - filologia polska od cyklu 2024 - stacjonarne 2-go stopnia
(in Polish) Moduł "Tradycja" - filologia polska od cyklu 2019 - stacjonarne 2-go stopnia
(in Polish) Wszystkie przedmioty polonistyczne - oferta ILP (3001...) , IJP (3003...) i IPS (3007...)
ECTS credit allocation (and other scores): 7.00 Basic information on ECTS credits allocation principles:
  • the annual hourly workload of the student’s work required to achieve the expected learning outcomes for a given stage is 1500-1800h, corresponding to 60 ECTS;
  • the student’s weekly hourly workload is 45 h;
  • 1 ECTS point corresponds to 25-30 hours of student work needed to achieve the assumed learning outcomes;
  • weekly student workload necessary to achieve the assumed learning outcomes allows to obtain 1.5 ECTS;
  • work required to pass the course, which has been assigned 3 ECTS, constitutes 10% of the semester student load.

view allocation of credits
Language: Polish
Type of course:

elective courses

Prerequisites (description):

(in Polish) Wprowadzenie do stylometrii wielkoskalowej oraz metod komputerowych stylistyki. Na zaliczenie zajęć studenci stworzą w grupach własny korpus, przeprowadzą jego analizę stylistyczną i zaraportują wyniki.

Szacowany nakład pracy studenta to 30h+60h = 90h.

Ze względu na liczbę stanowisk w laboratorium liczba miejsc wynosi 10.

Podczas zajęć studenci zapoznają się z podstawami metod kwantytatywnych w językoznawstwie, podstawowymi pojęciami stylistyki i podstawowymi metodami stylometrii, a także nauczą się tworzyć korpusy do badań stylistycznych i przeprowadzać podstawowe testy stylistyczne na tych korpusach. Programem wykorzystywanym do pracy będzie RStudio, obliczenia będą przeprowadzane w języku R. Pomocniczo mogą być wykorzystywane proste skrypty w pythonie i polecenia trybu konsolowego. Zakłada się, że studenci samodzielnie potrafią zainstalować program, zainstalować w nim niezbędne pakiety i korzystać z pomocy programu oraz uruchomić okno konsoli w systemie operacyjnym Windows (lub innym, z którego korzystają) oraz zapisywać wykonane zadania i przesyłać je na platformę zajęciową. W pracowni oprogramowanie zostanie zainstalowane, jednak oprogramowanie będzie konieczne do wykonywania zadań domowych i zadania zaliczeniowego.

Mode:

Classroom

Bibliography: (in Polish)

Jadwiga Sambor (1977), Słowa i liczby, Wrocław-Warszawa-Kraków-Gdańsk.

Jadwiga Sambor i Rolf Hammerl (1990), Statystyka dla językoznawców, Warszawa: WUW.

Harald R. Baayen (2014), Analyzing linguistic data. A practical guide to statistics using R, Cambridge University Press.

Natalia Levchina,

Jan Rybicki (2013), Stylometryczna niewidzialność tłumacza, Przekładaniec 27 , s. 61-87.

Rafał L. Górski, Magdalena Król, Maciej Eder (2019), Zmiana w języku. Studia kwantytatywno-korpusowe, Kraków: IJP PAN.

Maciej Eder (2014), Metody ścisłe w literaturoznawstwie i pułapki pozornego obiektywizmu – przykład stylometrii, Teksty Drugie, nr 2.

Maciej Ede, Mike Kestemont, Jan Rybicki (2013), Stylometry with R: a suite of tools, Digital Humanities 2013: Conference Abstracts, Lincoln: University of Nebraska-Lincoln, s. 487-489.

Witold Kieraś, Łukasz Kobyliński, Maciej Ogrodniczuk (2018)

Korpusomat — a Tool for Creating Searchable Morphosyntactically Tagged Corpora Computational Methods in Science and Technology , 24/1, s. 21-27.

Adam Pawłowski, red. (2023), Od Gutenberga do Zuckerberga.

strony z pomocą statystyczną

Learning outcomes: (in Polish)

Po zakończeniu zajęć student:

— wie, czym jest korpus językowy, w szczególności korpus do badań stylistycznych.

- wie, czym korpus do badań stylistycznych różni się od korpusów do innych zastosowań.

— umie stworzyć odpowiedni korpus za pomocą dostępnych narzędzi.

— umie zinterpretować wyniki obliczeń dokonywanych za pomocą dostępnych narzędzi.

— odróżnia podstawowe typy danych i umie dobrać odpowiednie testy do ich wykorzystania.

— umie przeprowadzić podstawowe testy stylometryczne i je zinterpretować.

— umie korzystać z dokumentacji niezbędnych programów.

— zna podstawy języka R przydatne w analizie stylometrycznej.

— zna i rozumie ograniczenia stosowanych metod i wykorzystywanych typów danych.

— umie zaprojektować i przeprowadzić badanie stylometryczne oraz zaraportować jego wyniki.

— ma podstawową wiedzę o wizualizacji danych różnych typów.

Assessment methods and assessment criteria: (in Polish)

1. wykonywanie zadań i testów bieżących w sali i na platformie — 30%.

2. projekt grupowy w trakcie zajęć – 20%.

3. projekt grupowy końcowy – 50%.

Dozwolone są dwie nieusprawiedliwione nieobecności.

Classes in period "Winter semester 2024/25" (future)

Time span: 2024-10-01 - 2025-01-26
Selected timetable range:
Navigate to timetable
Type of class:
Seminar, 30 hours, 15 places more information
Coordinators: Marcin Będkowski, Iwona Burkacka, Magdalena Sykurska-Derwojed
Group instructors: Magdalena Sykurska-Derwojed
Students list: (inaccessible to you)
Examination: Course - Grading
Seminar - Grading
Course descriptions are protected by copyright.
Copyright by University of Warsaw.
Krakowskie Przedmieście 26/28
00-927 Warszawa
tel: +48 22 55 20 000 https://uw.edu.pl/
contact accessibility statement USOSweb 7.0.3.0 (2024-03-22)