University of Warsaw - Central Authentication System
Strona główna

(in Polish) Przygotowanie danych do analiz

General data

Course ID: 2400-SP-DS-PDA
Erasmus code / ISCED: (unknown) / (0311) Economics The ISCED (International Standard Classification of Education) code has been designed by UNESCO.
Course title: (unknown)
Name in Polish: Przygotowanie danych do analiz
Organizational unit: Faculty of Economic Sciences
Course groups: (in Polish) Data Science w zastosowaniach biznesowych. Warsztaty z wykorzystaniem programu R
ECTS credit allocation (and other scores): (not available) Basic information on ECTS credits allocation principles:
  • the annual hourly workload of the student’s work required to achieve the expected learning outcomes for a given stage is 1500-1800h, corresponding to 60 ECTS;
  • the student’s weekly hourly workload is 45 h;
  • 1 ECTS point corresponds to 25-30 hours of student work needed to achieve the assumed learning outcomes;
  • weekly student workload necessary to achieve the assumed learning outcomes allows to obtain 1.5 ECTS;
  • work required to pass the course, which has been assigned 3 ECTS, constitutes 10% of the semester student load.
Language: Polish
Type of course:

obligatory courses

Full description: (in Polish)

Celem kursu jest zapoznanie słuchaczy z metodami przygotowania danych do analiz. Jakość analiz statystycznych zależy od jakości danych, na których są przeprowadzane – trudno spodziewać się wiarygodnych wyników analiz, gdy wykorzystane dane są „śmieciowe”. Właściwie przygotowane dane to co najmniej połowa sukcesu ich analizy. W pierwszej kolejności słuchacze poznają metody sprawdzania jakości danych oraz ich czyszczenia z wykorzystaniem tzw. wyrażeń regularnych, nauczą się sprawdzać czy dane zapisane w tabeli odpowiadają przyjętemu wzorcowi (np. właściwy kod pocztowy, data, adres, nr PESEL, itp.). Kolejnym ważnym zagadnieniem, które zostanie poruszone na zajęciach, będą braki danych, które eliminują cały rekord z analiz statystycznych. Słuchacze poznają najczęstsze metody imputacji braków danych – zastępowania ich w sensowny sposób wartościami niebrakującymi.

Bibliography: (in Polish)

Materiały przygotowywane przez wykładowcę i udostępniane uczestnikowi na platformie Google Drive.

Learning outcomes: (in Polish)

Test zaliczeniowy - do zaliczenia wymagana jest 50% poprawnych odpowiedzi na 10 pytań.

Classes in period "Academic year 2023/24" (in progress)

Time span: 2023-10-01 - 2024-06-16
Selected timetable range:
Navigate to timetable
Type of class:
Lab, 9 hours more information
Coordinators: Piotr Wójcik
Group instructors: Piotr Wójcik
Students list: (inaccessible to you)
Examination: Course - Pass/fail
Lab - Grading
Mode:

Classroom

Course descriptions are protected by copyright.
Copyright by University of Warsaw.
Krakowskie Przedmieście 26/28
00-927 Warszawa
tel: +48 22 55 20 000 https://uw.edu.pl/
contact accessibility statement USOSweb 7.0.3.0 (2024-03-22)