Uniwersytet Warszawski - Centralny System UwierzytelnianiaNie jesteś zalogowany | zaloguj się
katalog przedmiotów - pomoc

Big Data Analytics

Informacje ogólne

Kod przedmiotu: 2400-DS2BDA Kod Erasmus / ISCED: 14.3 / (0311) Ekonomia
Nazwa przedmiotu: Big Data Analytics
Jednostka: Wydział Nauk Ekonomicznych
Grupy: Anglojęzyczna oferta zajęć WNE UW
przedmioty obowiązkowe dla II roku Data Science
Punkty ECTS i inne: (brak)
zobacz reguły punktacji
Język prowadzenia: angielski
Rodzaj przedmiotu:

obowiązkowe

Skrócony opis:

Laboratorium ma na celu zapoznanie Studentów z praktyczną stroną przetwarzania dużych zbiorów danych w środowisku Apache Hadoop. Studenci dowiedzą się jak zastosować techniki analizy danych i uczenia maszynowego poznane na wcześniejszych etapach kształcenia do dużych zbiorów danych. W szczególności kurs nie będzie uczył nowych technik. Zajęcia skupią się na rzeczywistych przykładach i zrozumieniu działania używanych narzędzi.

Pełny opis:

1. Wprowadzenie do środowiska Linux

2. Wprowadzenie do Big Data

• Środowisko Hadoop

• Paradygmat MapReduce

3. Przetwarzanie i eksploracja danych z użyciem Apache Hive i Apache Spark

• Różnice vs. RDBMs

• Optymalizacja

• Pułapki

4. Wprowadzenie do uczenia maszynowego z użyciem Apache Spark

• Przeniesienie modelu zbudowanego w R lub Python na wcześniejszych etapach kształcenia do świata dużych danych (możliwości i ograniczenia)

5. Analiza interaktywna

6. Wizualizacje w Big Data

7. Automatyzacja przetwarzania danych z użyciem Apache Ariflow

Literatura:

Literatura oraz publikacje dostępne on-line będą udostęniane w trakcie laboratorium

Efekty uczenia się:

Studenci nauczą się w jaki sposób wykorzystywać ekosystem Hadoop do przygotowania i analizy dużych zbiorów danych oraz zastosowania podstawowych metod uczenia maszynowego.

K_U02, K_U05

Metody i kryteria oceniania:

Warunkiem zaliczenia przedmiotu jest:

• Obecność na zajęciach

• Prezentacja, w której przedstawione zostaną wybrane zastosowania omówionych w trakcie zajęć metod

• projekt z użyciem dużego zbioru danych

Przedmiot nie jest oferowany w żadnym z aktualnych cykli dydaktycznych.
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Warszawski.