Uniwersytet Warszawski - Centralny System UwierzytelnianiaNie jesteś zalogowany | zaloguj się
katalog przedmiotów - pomoc

Analiza i wizualizacja danych

Informacje ogólne

Kod przedmiotu: 1000-719DAV Kod Erasmus / ISCED: (brak danych) / (brak danych)
Nazwa przedmiotu: Analiza i wizualizacja danych
Jednostka: Wydział Matematyki, Informatyki i Mechaniki
Grupy: Przedmioty kierunkowe na studiach drugiego stopnia na kierunku bioinformatyka
Przedmioty monograficzne dla IV - V roku matematyki
Punkty ECTS i inne: 6.00
zobacz reguły punktacji
Język prowadzenia: angielski
Rodzaj przedmiotu:

obowiązkowe

Skrócony opis:

Poznanie technik analizy i wizualizacji danych w formie statycznej oraz interaktywnej.

Pełny opis:

Uczestnicy kursu będą mogli poznać najpopularniejsze metody analizy i wizualizacji danych jedno-, dwu- lub wielowymiarowych.

Wiedzę teoretyczną zdobytą podczas wykładów będzie można utrwalić na zajęciach laboratoryjnych o charakterze projektowym. Przykłady oraz projekty będą wykonywane z użyciem języka Python.

Uczestnicząc w zajęciach student nauczy się za pomocą języka Python pobrać i przetworzyć dane z najpopularniejszych formatów plików (np. csv, json) i na ich podstawie dokonać interpretacji problemu oraz wizualizacji na odpowiednim wykresie.

Przedmiot składa się z dwóch części:

a) wprowadzenie do programowania w języku Python (jupyter)

b) analiza i wizualizacja danych (część oparta o pakiety takie jak numpy, pandas, scipy, matplotlib, seaborn, plotly, ImageMagick)

• w formie statycznej

• w formie interaktywnej i animowanej

Uczestnicy kursu będą mogli poznać najpopularniejsze metody analizy i wizualizacji danych jedno-, dwu- lub wielowymiarowych.

Wiedzę teoretyczną zdobytą podczas wykładów będzie można utrwalić na zajęciach laboratoryjnych o charakterze projektowym. Przykłady oraz projekty będą wykonywane z użyciem języka Python.

Kolejne wykłady będą dotyczyły następujących tematów:

1) Wprowadzenie do języka Python

2) Jupyter

3) Zbiory danych. Przykłady zbiorów (np. kwartet Anscombe, Iris, MNIST) i ich formatów (csv, json, xml, fastaq)

4) Zbiory danych. Obróbka zbiorów danych za pomocą wbudowanych bibliotek i własnych skryptów (numpy, pandas) .

5) Analiza statystyczna. Średnia arytmetyczna, wariancja, korelacja, regresja liniowa (scipy).

6) Klasyfikacja statystyczna. Drzewa decyzyjne. Metoda wektorów nośnych. Sieci neuronowe.

7) Wizualizacja danych. Przegląd bibliotek do tworzenia wykresów (matplotlib, seaborn, plotly, ImageMagick)

8) Wizualizacja danych. Elementy graficzne (kolory, linie, łuki) i ich zastosowania w prezentacji danych. Transformacje zmiennych i ich wpływ na prezentacje graficzną. Uwzględnienie skali czasu na wykresach. Uwzględnienie współrzędnych przestrzennych na wykresach. Uwzględnienie niepewności (wariancji) na wykresach.

9) Wizualizacja danych. Najczęstsze błędy utrudniające czytanie wykresów. Percepcja kolorów oraz związek z prezentacją danych. Percepcja zależności i danych oraz związek z prezentacją danych.

10) Dobór cech elementu wykresu (długość, pole, kąty, kolory) do zmiennych mierzony zgodnie z różnymi skalami (ilorazowa, różnicowa, uporządkowana, nominalna).

11) Wykresy statyczne i interaktywne

Literatura:

1. Zanurkuj w Pythonie (ebook: https://pl.wikibooks.org/wiki/Zanurkuj_w_Pythonie)

2. Python Data Analysis, Ivan Idris, 2014

3. Python for Data Analysis, Wes MacKinney, 2013

4. Zbiór esejów o sztuce pokazywania danych, P. Biecek, 2014 (http://www.biecek.pl/Eseje/).

Efekty uczenia się:

Wiedza

1. Ma wiedzę ogólną w zakresie programowania (K_W02).

2. Ma wiedzę na temat konstrukcji programistycznych i składni języka Python (przypisanie, instrukcje sterujące, wywoływanie podprogramów i przekazywanie parametrów) (K_W02).

3. Ma wiedzę na temat struktur danych oraz wykonywanych na nich operacjach (K_W05).

4. Ma wiedzę na temat zarządzania informacją, w tym dotyczącą systemów baz danych, modelowania danych, składowania i wyszukiwania informacji (K_W08).

Umiejętności

1. Potrafi zastosować wiedzę matematyczną do formułowania, analizowania i rozwiązywania związanych z informatyką zadań o średnim poziomie złożoności (K_U01).

2. Potrafi pozyskiwać informacje z literatury, baz wiedzy, Internetu oraz innych wiarygodnych źródeł, integrować je, dokonywać ich interpretacji oraz wyciągać wnioski i formułować opinie (K_U02).

3. Potrafi pisać, uruchamiać i testować programy w wybranym środowisku programistycznym (K_U05).

4. Programuje algorytmy; wykorzystuje podstawowe techniki algorytmiczne i struktury danych (K_U07).

5. Potrafi ocenić, na podstawowym poziomie, przydatność rutynowych metod i narzędzi informatycznych oraz wybrać i zastosować właściwą metodę i narzędzia (K_U22)

6. Zna co najmniej jeden język obcy na poziomie średnio zaawansowanym, oraz język angielski w stopniu umożliwiającym czytanie ze zrozumieniem dokumentacji oprogramowania, podręczników i artykułów informatycznych (K_U30).

Kompetencje

1. Rozumie konieczność systematycznej pracy nad projektami informatycznymi (K_K02).

2. Rozumie i docenia znaczenie uczciwości intelektualnej w działaniach własnych i innych osób; postępuje etycznie (K_K03).

3. Potrafi pracować indywidualnie, w tym także potrafi zarządzać swoim czasem i dotrzymywać terminów (K_K05).

Metody i kryteria oceniania:

Ocena końcowa na podstawie punktów z egzaminu, projektu i programu zaliczeniowego.

Wagi poszczególnych składników: egzamin - 50%, projekt - 25%, program - 25%.

Do egzaminu w pierwszym terminie są dopuszczone tylko te osoby, które zaliczą projekt oraz otrzymają przynajmniej 60% punktów z programu.

Projekt: obejmuje twórcze rozwiązanie problemu na podstawie otrzymanego zbioru danych i jego odpowiedniej interpretacji zakończonej wizualizacją w formie wykresów.

Program: uczestnictwo w wykładach (40% oceny programu) oraz uczestnictwo w ćwiczeniach (60% oceny programu). Każda jednostka wykładowa i ćwiczeniowa skaluje się do odpowiedniej wartości uczestnictwa (np. przy 10 wykładach każdy wykład daje 4%, przy 15 laboratoriach każde laboratorium jest warte kolejne 4%).

Zajęcia w cyklu "Semestr letni 2019/20" (w trakcie)

Okres: 2020-02-17 - 2020-08-02
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 30 godzin więcej informacji
Wykład, 30 godzin więcej informacji
Koordynatorzy: Łukasz Kozłowski
Prowadzący grup: Łukasz Kozłowski
Lista studentów: (nie masz dostępu)
Zaliczenie: Egzamin
Wymagania (lista przedmiotów):

Statystyczna analiza danych 1000-714SAD
Wstęp do informatyki 1000-711WIN

Zajęcia w cyklu "Semestr letni 2020/21" (jeszcze nie rozpoczęty)

Okres: 2021-02-18 - 2021-06-13
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 30 godzin więcej informacji
Wykład, 30 godzin więcej informacji
Koordynatorzy: Łukasz Kozłowski
Prowadzący grup: Łukasz Kozłowski
Lista studentów: (nie masz dostępu)
Zaliczenie: Egzamin
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Warszawski.