Uniwersytet Warszawski - Centralny System Uwierzytelniania
Strona główna

Przetwarzanie języka naturalnego

Informacje ogólne

Kod przedmiotu: 1000-2M15PJN
Kod Erasmus / ISCED: 11.3 Kod klasyfikacyjny przedmiotu składa się z trzech do pięciu cyfr, przy czym trzy pierwsze oznaczają klasyfikację dziedziny wg. Listy kodów dziedzin obowiązującej w programie Socrates/Erasmus, czwarta (dotąd na ogół 0) – ewentualne uszczegółowienie informacji o dyscyplinie, piąta – stopień zaawansowania przedmiotu ustalony na podstawie roku studiów, dla którego przedmiot jest przeznaczony. / (0612) Database and network design and administration Kod ISCED - Międzynarodowa Standardowa Klasyfikacja Kształcenia (International Standard Classification of Education) została opracowana przez UNESCO.
Nazwa przedmiotu: Przetwarzanie języka naturalnego
Jednostka: Wydział Matematyki, Informatyki i Mechaniki
Grupy: Przedmioty obieralne dla informatyki
Przedmioty obieralne na studiach drugiego stopnia na kierunku bioinformatyka
Punkty ECTS i inne: (brak) Podstawowe informacje o zasadach przyporządkowania punktów ECTS:
  • roczny wymiar godzinowy nakładu pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się dla danego etapu studiów wynosi 1500-1800 h, co odpowiada 60 ECTS;
  • tygodniowy wymiar godzinowy nakładu pracy studenta wynosi 45 h;
  • 1 punkt ECTS odpowiada 25-30 godzinom pracy studenta potrzebnej do osiągnięcia zakładanych efektów uczenia się;
  • tygodniowy nakład pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się pozwala uzyskać 1,5 ECTS;
  • nakład pracy potrzebny do zaliczenia przedmiotu, któremu przypisano 3 ECTS, stanowi 10% semestralnego obciążenia studenta.

zobacz reguły punktacji
Język prowadzenia: angielski
Kierunek podstawowy MISMaP:

informatyka

Rodzaj przedmiotu:

monograficzne

Założenia (lista przedmiotów):

Języki, automaty i obliczenia 1000-214bJAO
Systemy uczące się 1000-2N09SUS

Tryb prowadzenia:

w sali

Skrócony opis:

Celem przedmiotu jest zapoznanie studentów z teorią, metodologią, zasobami i narzędziami do przetwarzania języka naturalnego. Zajęcia poruszają zagadnienia z zakresu lingwistyki obliczeniowej (analiza morfologiczna, składniowa i semantyczna), ekstrakcji informacji, klasyfikacji tekstu oraz automatycznego streszczania dokumentów. W ramach przedmiotu omawiane będą narzędzia i zagadnienia specyficzne dla języka angielskiego i polskiego. Na zajęciach przydatna będzie wiedza z zakresu teorii gramatyk formalnych oraz znajomość technik uczenia maszynowego. Od uczestników wymagana jest znajomość języka polskiego, z uwagi na to, że ramach zadań zaliczeniowych przetwarzane będą teksty w tym języku.

Pełny opis:

1. Lingwistyka Obliczeniowa:

a) wprowadzenie, korpusy, tokenizacja (1),

b) morfologia, części mowy (2),

c) składnia (3-5),

d) semantyka (6-8);

2. Klasyfikacja tekstu (9):

a) analiza wydźwięku,

b) opinion mining;

3. Ekstrakcja Informacji (10);

4. Generowanie Języka Naturalnego (11).

5. Textual Entailment (12);

6. Question Answering (13).

7. Automatyczne Streszczanie (14);

8. Tłumaczenie Maszynowe (15).

Literatura:

Speech and Language Processing (2nd Edition) Daniel Jurafsky , James H. Martin , 2008

Mining Text Data, Charu C. Aggarwal, ChengXiang Zhai, Springer, 2012

Natural Language Processing with Python, Steven Bird, Ewan Klein, Edward Loper, 2009

Efekty uczenia się:

Wiedza:

1. Zna podstawowe metodyki NLP

2. Zna podstawowe zagadnienia związane z NLP

3. Zna techniki i narzędzia służące do przetwarzania języka naturalnego

Umiejętności:

1. Potrafi zastosować w praktyce techniki NLP

2. Posługuje się narzędziami do przetwarzania języka naturalnego

Kompetencje:

1. Potrafi wyszukać odpowiednią do rozwiązywanego zadania literaturę z zakresu NLP i przyswoić zawartą w niej wiedzę.

Metody i kryteria oceniania:

Ocena końcowa na podstawie punktów z zadań (programów) zaliczeniowych, egzaminu pisemnego oraz egzaminu ustnego. Przedmiotem egzaminu ustnego jest znajomość treści przekazanych na wykładzie. Obecność na wykładzie zalicza egzamin ustny.

Przedmiot nie jest oferowany w żadnym z aktualnych cykli dydaktycznych.
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Warszawski.
Krakowskie Przedmieście 26/28
00-927 Warszawa
tel: +48 22 55 20 000 https://uw.edu.pl/
kontakt deklaracja dostępności USOSweb 7.0.3.0 (2024-03-22)