Uniwersytet Warszawski - Centralny System Uwierzytelniania
Strona główna

Semantyka eksperymentalna - moduł semantyki dystrybucyjnej

Informacje ogólne

Kod przedmiotu: 3501-KOG-SE-SD
Kod Erasmus / ISCED: 08.1 Kod klasyfikacyjny przedmiotu składa się z trzech do pięciu cyfr, przy czym trzy pierwsze oznaczają klasyfikację dziedziny wg. Listy kodów dziedzin obowiązującej w programie Socrates/Erasmus, czwarta (dotąd na ogół 0) – ewentualne uszczegółowienie informacji o dyscyplinie, piąta – stopień zaawansowania przedmiotu ustalony na podstawie roku studiów, dla którego przedmiot jest przeznaczony. / (0223) Filozofia i etyka Kod ISCED - Międzynarodowa Standardowa Klasyfikacja Kształcenia (International Standard Classification of Education) została opracowana przez UNESCO.
Nazwa przedmiotu: Semantyka eksperymentalna - moduł semantyki dystrybucyjnej
Jednostka: Instytut Filozofii
Grupy:
Punkty ECTS i inne: (brak) Podstawowe informacje o zasadach przyporządkowania punktów ECTS:
  • roczny wymiar godzinowy nakładu pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się dla danego etapu studiów wynosi 1500-1800 h, co odpowiada 60 ECTS;
  • tygodniowy wymiar godzinowy nakładu pracy studenta wynosi 45 h;
  • 1 punkt ECTS odpowiada 25-30 godzinom pracy studenta potrzebnej do osiągnięcia zakładanych efektów uczenia się;
  • tygodniowy nakład pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się pozwala uzyskać 1,5 ECTS;
  • nakład pracy potrzebny do zaliczenia przedmiotu, któremu przypisano 3 ECTS, stanowi 10% semestralnego obciążenia studenta.

zobacz reguły punktacji
Język prowadzenia: polski
Rodzaj przedmiotu:

fakultatywne

Założenia (opisowo):

Umiejętność programowania w języku Python

Tryb prowadzenia:

w sali

Skrócony opis:

Kurs ma na celu zapoznanie studentów z paradygmatem semantyki dystrybucji z punktu widzenia dyscypliny przetwarzania języka naturalnego (NLP). Główny nacisk zostanie położony na poznanie metod tworzenia semantycznych modeli dystrybucyjnych (np. przy użyciu algorytmów maszynowego uczenia się) oraz na praktycznych zastosowaniach tych modeli w zadaniach NLP.

Pełny opis:

Tematem zajęć są zagadnienia dotyczące paradygmatu semantyki dystrybucyjnej. Semantyka dystrybucyjna jest teorią możliwą do zaimplementowania, stosowaną m.in. w semantycznym przetwarzaniu języka naturalnego. Cechą specyficzną semantyki dystrybucyjnej jest to, że dobrze modeluje proces określania podobieństwa/powiązania semantycznego przez ludzi, oraz określa znaczenia słów na podstawie ich użycia w języku. Znaczenie danego słowa jest szacowane na postawie dystrybucji słowa (tj. kontekstów leksykalnych i gramatycznych, w których to słowo się pojawia) i reprezentowane w postaci np. wektora dystrybucyjnego. Na zajęciach zostaną przedstawione narzędzia programistyczne, pozwalające na generowanie modeli dystrybucyjnych, a także praktyczne zastosowania tych modeli.

Zajęcia 1: Podstawy teoretyczne semantyki dystrybucyjnej

- hipoteza dystrybucyjna

- reprezentacje wektorowe słów

- miary powiązania i podobieństwa

Zajęcia 2: Modele dystrybucyjne (1)

- model frekwencyjny TF-IDF

- model syntagmatyczny LSA

Zajęcia 3: Wektorowe reprezentacje słów jako komponent sieci neuronowych

- idee perceptronu i neuronu sigmoidalnego

- koncepcja i budowa sieci neuronowej

- optymalizacja i uczenie sieci neuronowych

Zajęcia 4: Modele dystrybucyjne (2)

- idea zanurzeń słownych (ang. word embedding)

- modele językowe

- zanurzenia słowne typu word2vec i fastText

Zajęcia 5: Modele dystrybucyjne (3)

- głębokie modele językowe

- kontekstowe zanurzenia słowne typu Elmo i BERT

Zajęcia 6: Ewaluacja modeli dystrybucyjnych

- ewaluacja wewnętrzna (ang. intrinsic evaluation)

- ewaluacja in vivo (ang. extrinsic evaluation)

- praktyczne zastosowania modeli dystrybucyjnych

Zajęcia 7: Semantyka kompozycyjno-dystrybucyjna

- idee i metody kompozycji semantycznej

- praktyczne zastosowania modeli dystrybucyjnych

Literatura:

- Daniel Jurafsky i James H. Martin (2017) Speech and Language Processing (oraz draft 3 edycji https://web.stanford.edu/~jurafsky/slp3/)

- Stephen Clark (2015) Vector Space Models of Lexical Meaning. W: S. Lappin i C. Fox (red.) The Handbook of Contemporary Semantic Theory. s. 493-522. John Willey & Sons.

- Aktualne artykuły naukowe

Efekty uczenia się:

Nabyta wiedza:

- znajomość podstawowych zagadnień związanych z paradygmatem semantyki dystrybucyjnej,

- znajomość narzędzi NLP umożliwiających modelowanie dystrybucji leksykalnych i reprezentowanie znaczeń słów.

Nabyte umiejętności:

- umiejętność doboru narzędzi i zasobów (danych tekstowych) do tworzenia semantycznych modeli dystrybucyjnych,

- umiejętność weryfikacji uzyskanych wyników.

Nabyte kompetencje społeczne:

- umiejętność selekcjonowania i porządkowania informacji uzyskanych w procesie komunikacji,

- umiejętność jasnego komunikowania technicznie skomplikowanych zagadnień,

- umiejętność samodzielnego rozwiązywania problemów.

Metody i kryteria oceniania:

OD 2020/2021

Ocena końcowa na podstawie:

- wyniku realizacji samodzielnej pracy domowej polegającej na przygotowaniu danych tekstowych, które będą wykorzystane na zajęciach,

- wyników testów tzw. wejściówek.

Dopuszczalna liczba nieobecności podlegających usprawiedliwieniu: 2

DO 2019/2020

Ocena końcowa na podstawie punktacji za programistyczne prace domowe (i ewentualnie wyniku egzaminu)

Przedmiot nie jest oferowany w żadnym z aktualnych cykli dydaktycznych.
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Warszawski.
Krakowskie Przedmieście 26/28
00-927 Warszawa
tel: +48 22 55 20 000 https://uw.edu.pl/
kontakt deklaracja dostępności USOSweb 7.0.3.0 (2024-03-22)