Uniwersytet Warszawski - Centralny System Uwierzytelniania
Strona główna

Big Data w biznesie

Informacje ogólne

Kod przedmiotu: 1100-BDB-OG
Kod Erasmus / ISCED: (brak danych) / (brak danych)
Nazwa przedmiotu: Big Data w biznesie
Jednostka: Wydział Fizyki
Grupy: Przedmioty ogólnouniwersyteckie doskonalące kompetencje cyfrowe przydatne w nauce i na rynku pracy
Przedmioty ogólnouniwersyteckie na Uniwersytecie Warszawskim
Przedmioty ogólnouniwersyteckie ścisłe
Punkty ECTS i inne: (brak) Podstawowe informacje o zasadach przyporządkowania punktów ECTS:
  • roczny wymiar godzinowy nakładu pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się dla danego etapu studiów wynosi 1500-1800 h, co odpowiada 60 ECTS;
  • tygodniowy wymiar godzinowy nakładu pracy studenta wynosi 45 h;
  • 1 punkt ECTS odpowiada 25-30 godzinom pracy studenta potrzebnej do osiągnięcia zakładanych efektów uczenia się;
  • tygodniowy nakład pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się pozwala uzyskać 1,5 ECTS;
  • nakład pracy potrzebny do zaliczenia przedmiotu, któremu przypisano 3 ECTS, stanowi 10% semestralnego obciążenia studenta.

zobacz reguły punktacji
Język prowadzenia: polski
Rodzaj przedmiotu:

ogólnouniwersyteckie

Założenia (opisowo):

Wymagania wstępne (w tym formalne) Znajomość języka Python na poziomie średnio-zaawansowanym, obsługa systemu Linux / Windows na poziomie konsoli.

Studenci powinni mieć własne komputery (jeśli to niemożliwe prosimy o kontakt) z pakietem Anaconda Python.


W zajęciach uczestniczyć mogą wyłącznie:

- studenci drugiego lub trzeciego roku studiów licencjackich,

- pierwszego lub drugiego roku studiów magisterskich,

- czwartego lub piątego roku studiów jednolitych magisterskich.


Zajęcia dofinansowane zostały ze środków Europejskiego Funduszu Społecznego w ramach PO WER, ścieżka 3.5 i z tego powodu studenci zobowiązani są do wypełnienia dokumentacji projektowej. Odmowa ich wypełnienia oznacza rezygnację z zajęć.


Warunkiem udziału w zajęciach jest zatem:

- wypełnienie najpóźniej na początku pierwszych zajęć deklaracji oraz oświadczenia uczestnika projektu finansowanego w ramach Programu ZIP

- wypełnienie pre-testu służącego ocenie przyrostu kompetencji (bilans kompetencji).


Warunkiem akceptacji grupy na etap początku zajęć jest min. 10 studentów, którzy wypełnią powyższą deklarację i pre-test.


Znajomość języka Python na poziomie średnio-zaawansowanym, obsługa systemu Linux / Windows na poziomie konsoli.

Studenci powinni mieć własne komputery (jeśli to niemożliwe prosimy o kontakt) z pakietem Anaconda Python.



Skrócony opis:

W zajęciach uczestniczyć mogą wyłącznie:

- studenci drugiego lub trzeciego roku studiów licencjackich,

- pierwszego lub drugiego roku studiów magisterskich,

- czwartego lub piątego roku studiów jednolitych magisterskich.

Zajęcia dofinansowane zostały ze środków Europejskiego Funduszu Społecznego w ramach PO WER, ścieżka 3.5 i z tego powodu studenci zobowiązani są do wypełnienia dokumentacji projektowej. Odmowa ich wypełnienia oznacza rezygnację z zajęć.

Po zajęciach studenci będą doskonale zapoznani z tematem Big Data, w szczególności z zdobywaniem, przechowywaniem, procesowaniem, podstawową analizą oraz wizualizacją oraz bezpieczeństwem danych przy użyciu obecnie stosowanych technologii takich jak SQL czy Spark.

Pełny opis:

Pełny opis przedmiotu

Tydzień 1:

1. Co to jest Big Data? Jakie są zadania, role oraz technologie do rozwiązywania tych zadań.

2. Narzędzia kontroli wersji oraz przenośności oprogramowania.

3. Technologie kontenerowania.

Technologie: Git, bash, Docker / Kubernetes.

Tygodnie 2-8 “Small data”:

1. Co można zrobić z danymi?

2. Pozyskiwanie danych z Internetu.

3. Jakie informacje można wyciągnąć z danych?

4. Jak przygotować dane do eksploracji.

5. Wizualizacja danych,

6. (Relacyjne) bazy danych.

7. Wstęp do uczenia maszynowego (regresja liniowa, regresja logistyczna, klasteryzacja).

8. Technologie: Python, pandas, podstawy SQL, Matplotlib, Plotly, BeautifulSoup, scikitlearn , Tableau.

9. Pierwszy projekt.

Tygodnie 9-13 Big data:

1. Modelowanie danych w ramach paradygmatu Big Data. Architektury Data Warehouse / Data Lake.

2. Integrowanie i Procesowanie Danych.

3. Przeniesienie rozwiązań uczenia maszynowego do Big Data.

4. Automatyzacja przetwarzania danych

5. Drugi projekt

Technologie: Handoop, (Py)-Spark, Cloudera VM

Tydzień 14-15: Technologie chmurowe i podsumowanie

1. Poznanie środowiska chmurowego i poszczególnych zastosowań pakietów.

2. Projekt końcowy

Technologie: AWS / Azure / GoogleCloud

Zajęcia umożliwiają uzyskanie kompetencji informatycznych oraz analitycznych.

Literatura:

Literatura podana przez wykładowcę

Efekty uczenia się:

Po zajęciach studenci będą doskonale zapoznani z tematem Big Data, w szczególności z zdobywaniem, przechowywaniem, procesowaniem, podstawową analizą oraz wizualizacją oraz bezpieczeństwem danych.

Metody i kryteria oceniania:

Metody i kryteria oceniania

Warunki zaliczenia zajęć:

- obecność studenta na co najmniej 80% wszystkich spotkań

- wypełnienie po zakończeniu ostatnich zajęć post-testu (gdzie uczestnik określa poziom swojej wiedzy i umiejętności po zakończeniu zajęć).

Warunkiem finalnej akceptacji grupy jest wypełnienie wszystkich w/w wymagań przez co najmniej 10 studentów.

Rozwiązanie zadań na zajęciach oraz zaliczenie projektu końcowego (być może w formie Hackatonu).

Zaliczenie na podstawie wykonywanych zadań podczas kursu (40%), grupowy projekt końcowy 60% (być może odbędzie się to w ramach weekendowego Hackatonu).

Przedmiot nie jest oferowany w żadnym z aktualnych cykli dydaktycznych.
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Warszawski.
Krakowskie Przedmieście 26/28
00-927 Warszawa
tel: +48 22 55 20 000 https://uw.edu.pl/
kontakt deklaracja dostępności USOSweb 7.0.3.0 (2024-03-22)