Serwisy internetowe Uniwersytetu Warszawskiego | USOSownia - uniwersyteckie forum USOSoweNie jesteś zalogowany | zaloguj się
katalog przedmiotów - pomoc

Data mining

Informacje ogólne

Kod przedmiotu: 1000-2M03DM Kod Erasmus / ISCED: 11.303 / (0612) Database and network design and administration
Nazwa przedmiotu: Data mining
Jednostka: Wydział Matematyki, Informatyki i Mechaniki
Grupy: Przedmioty monograficzne dla III - V roku informatyki
Przedmioty obieralne dla informatyki
Punkty ECTS i inne: 6.00
zobacz reguły punktacji
Język prowadzenia: angielski
Rodzaj przedmiotu:

monograficzne

Skrócony opis:

Przedstawienie głównych zagadnień w dziedzinie eksploracji danych (data mining) i metod ich rozwiązywania; omówienia podstawowych algorytmów i ich efektywnych realizacji na dużych zbiorach danych dla trudnych problemów takich, jak reguły asocjacyjne, redukty, dyskretyzacja atrybutów ciągłych, wzorce czasowe, drzewo decyzyjne; przedstawienie nowoczesnych technik obliczeń takich, jak równoległe przetwarzania, obliczenia ewolucyjne, heurystyki za pomocą standardowych baz danych lub logicznie zbudowanych struktur danych.

Pełny opis:

1. Wstęp: Przedstawienie problemów "eksploracji danych" (ang. data mining - DM) oraz "odkrywania wiedzy" (ang. Knowledge Discovery from Databases - KDD). Podstawowe pojęcia i zastosowania DM i KDD w praktyce.

2. Efektywne metody szukania reguł asocjacyjnych: algorytmy Apriori, AprioriTid, FP growth, ...

3. Problem klasyfikacji: Metody kNN, Naive Bayes, sieci Bayesowskie. Metody oceniania klasyfikatorów.

4. Miara entropii, Drzewo decyzyjne, Drzewo decyzyjne dla dużych zbiorów danych.

5. Metody grupowania danych, analiza skupień (klastrowanie). Metody grupowania w dużych zbiorach danych.

6. Teoria uczenia się.

7. Wzorce, klasyfikacja zbiorem reguł w dużych zbiorach danych.

8. Metody obróbki i przygotowywania danych.

9. Ukryty model Markowa i jego zastosowania w data mining.

10. Wzorce czasowe i sekwencyjne.

11. OLAP i Data mining.

12. Web mining i text mining.

Literatura:

1. "Data Mining: Concepts and Techniques". J. Han and M. Kamber. Morgan Kaufmann Publishers. 2001

2. "Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations". I. Witten and E. Frank. Morgan Kaufmann Publishers. 2000.

3. "Advances in Knowledge Discovery and Data Mining". Eds.: Fayyad, Piatetsky-Shapiro, Smyth, and Uthurusamy. The MIT Press, 1995.

Zajęcia w cyklu "Semestr letni 2017/18" (zakończony)

Okres: 2018-02-17 - 2018-06-10
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 30 godzin więcej informacji
Wykład, 30 godzin więcej informacji
Koordynatorzy: Hung Son Nguyen
Prowadzący grup: Andrzej Janusz, Hung Son Nguyen
Lista studentów: (nie masz dostępu)
Zaliczenie: Egzamin

Zajęcia w cyklu "Semestr letni 2018/19" (jeszcze nie rozpoczęty)

Okres: 2019-02-16 - 2019-06-08
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 30 godzin więcej informacji
Wykład, 30 godzin więcej informacji
Koordynatorzy: Hung Son Nguyen
Prowadzący grup: Andrzej Janusz, Hung Son Nguyen
Lista studentów: (nie masz dostępu)
Zaliczenie: Egzamin
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Warszawski.