Uniwersytet Warszawski - Centralny System UwierzytelnianiaNie jesteś zalogowany | zaloguj się
katalog przedmiotów - pomoc

Machine learning

Informacje ogólne

Kod przedmiotu: 2700-M-ZBD-D2ML Kod Erasmus / ISCED: 15.1 / (0321) Dziennikarstwo
Nazwa przedmiotu: Machine learning
Jednostka: Wydział Dziennikarstwa, Informacji i Bibliologii
Grupy: BD-DZIENNE II STOPNIA - semestr 2 rok 1
Punkty ECTS i inne: 3.00
Język prowadzenia: polski
Rodzaj przedmiotu:

obowiązkowe

Skrócony opis:

Celem przedmiotu jest zapoznanie studentów z algorytmami uczenia maszynowego mającymi obecnie bardzo szerokie zastosowanie w praktycznej analizie dużych zbiorów danych. Po tym przedmiocie student będzie posiadał umiejętność praktycznej implementacji algorytmów uczenia maszynowego przy wykorzystaniu specjalistycznych bibliotek popularnego programu Python. Założeniem przedmiotu jest przygotowanie studentów do rozwiązywania praktycznych problemów przy wykorzystaniu sieci neuronowych oraz innych poznanych metod uczenia maszynowego.

Pełny opis:

Zakres tematyczny:

1. Python:

- definiowanie zmiennych;

- podstawowe typy danych;

- pętle;

- instrukcje warunkowe;

- definiowanie funkcji, klas;

- iteratory, generatory;

- operacje na plikach (w tym konteksty with)

2. Biblioteki do analizy danych w języku python: jupyter, pandas, scikit-learn .

3. Asocjacje - analiza koszyka zakupów + wykrywanie wzorców częstych (fp-tree, prefixspan).

4. Systemy rekomendacyjne, PageRank.

5. TextMining w Pythonie.

6. Podejście probablistyczne na przykładach - co to jest model probablistyczny.

7. Dimensionality Reduction/Representation learning.

8. Podstawy ekstrakcji informacji z danych tekstowych z użyciem Open Sourcowych bibliotek Pythona

9. Analiza dużych zbiorów tekstowych przy pomocy systemu subMIND.AI.

10. Podejście probablistyczne na przykładach - co to jest model probablistyczny.

11. Dimensionality Reduction/Representation learning.

12. Konstruowanie sieci neuronowych.

- wykorzystanie sieci neuronowych do klasyfikacji języków

- uwagi przygotowawcze

- projekt kodowania i testowania

- dane

- pisanie testu podstawowego dla języka

- przejście do klasy network

- dostrajanie sieci neuronowej

- precyzja i czułość w sieciach neuronowych

- podsumowanie przykładu.

Literatura:

Literatura obowiązkowa

1. M. Gągolewski, M. Bartoszuk, A. Cena, Przetwarzanie i analiza danych w języku Python, PWN, 2016

2. W. Richert, L.P. Coelho, Building Machine Learning Systems with Python, Packt Publishing, 2013

3. M. Szeliga, Data science i uczenie maszynowe, Wydawnictwo naukowe PWN, Warszawa, 2017.

4. T. Morzy, Eksploracja danych – metody i algorytmy, Wydawnictwo naukowe PWN, Warszawa, 2013.

5. Christopher M. Bishop, Pattern Recognition and Machine Learning, Springer, 2007

Literatura uzupełniająca

6. J. Koronacki, J. Ćwik: Statystyczne systemy uczące się. Wydanie drugie, EXIT, Warszawa, 2007

7. W. McKinney, Python for Data Analysis. Data Wrangling with Pandas, NumPy, and IPython, O'Reilly Media, 2012

8.D.T. Larose, Metody i modele eksploracji danych, Wydawnictwo naukowe PWN, Warszawa, 2012.

Efekty uczenia się:

Po ukończeniu przedmiotu student:

Wiedza

- student ma wiedzę na temat metod i algorytmów uczenia maszynowego;

- student rozumie potrzebę poszerzania swojej wiedzy i praktycznych umiejętności w zakresie metod uczenia maszynowego; potrafi w sposób samodzielny i kreatywny wybrać odpowiednie rozwiązanie dla określonego problemu badawczego.

Umiejętności

- student potrafi korzystać z pakietów programu Python dedykowanych algorytmom uczenia maszynowego;

- potrafi przygotować dokumentację zaimplementowanego rozwiązania ze szczegółowym omówieniem wyników, wyciągnąć wnioski oraz wyczerpująco je uzasadnić.

Metody i kryteria oceniania:

Metody dydaktyczne:

Laboratorium: rozwiązywanie problemów badawczych za pomocą algorytmów uczenia maszynowego przy wykorzystaniu specjalistycznych bibliotek programu Python. Dyskusja. Praca w zespole.

Kryteria oceniania:

Ocena z laboratorium wystawiana będzie na podstawie wyników z projektów (80%) oraz aktywności i obecności na zajęciach (20%).

Zajęcia w cyklu "Semestr letni 2019/20" (w trakcie)

Okres: 2020-02-17 - 2020-08-02
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 20 godzin więcej informacji
Koordynatorzy: Wioletta Matosek
Prowadzący grup: Wiesław Cetera, Agnieszka Heba, Wioletta Matosek
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Zaliczenie na ocenę
Laboratorium - Zaliczenie na ocenę

Zajęcia w cyklu "Semestr letni 2020/21" (jeszcze nie rozpoczęty)

Okres: 2021-02-18 - 2021-06-13
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 20 godzin więcej informacji
Koordynatorzy: Wioletta Matosek
Prowadzący grup: (brak danych)
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Zaliczenie na ocenę
Laboratorium - Zaliczenie na ocenę
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Warszawski.