Algorytmiczne i statystyczne aspekty sekwencjonowania DNA
Informacje ogólne
Kod przedmiotu: | 1000-2M12DNA |
Kod Erasmus / ISCED: |
11.3
|
Nazwa przedmiotu: | Algorytmiczne i statystyczne aspekty sekwencjonowania DNA |
Jednostka: | Wydział Matematyki, Informatyki i Mechaniki |
Grupy: |
Przedmioty obieralne dla informatyki |
Punkty ECTS i inne: |
(brak)
|
Język prowadzenia: | angielski |
Rodzaj przedmiotu: | monograficzne |
Skrócony opis: |
Wykład poświęcony jest technikom sekwencjonowania DNA oraz problemom związanym z analizą ich danych wyjściowych. Problemy te mają charakter zarówno algorytmiczny (zastosowanie znajdują tu m.in. grafy de Bruijna, transformacja Barrows'a Wheeler'a), jak i statystyczny (analiza różnic w populacji, testowanie hipotez). |
Pełny opis: |
1. Sekwencjonowanie nowej generacji: - różne technologie sekwencjonowania i ich dane wyjściowe, - zastosowania: sekwencjonowanie znanych genomów i ich wyselekcjonowanych próbek (transkryptomy, egzomy, immunoprecypitacja), sekwencjonowanie "de novo", sekwencjonowanie "metagenomów", - projektowanie eksperymentów i kontrola jakości wyników. 2. Problemy algorytmiczne i ich typowe rozwiązania: - asemblacja sekwencji na podstawie krótkich odczytów (m.in. zastosowania grafów de Bruijna), - odwzorowanie sekwencji na genomy (m.in. transformata Burrows'a-Wheeler'a i indeks Ferraginy-Manzini'ego), - wykrywanie i reprezentacja osobniczych różnic w genomach (analiza pojedynczych mutacji oraz zaburzeń liczby kopii w różnego rodzaju danych genomowych).. 3. Problemy związane z szacowaniem różnic pomiędzy eksperymentami: - różnicowa analiza ekspresji genów w RNA-seq, - wykrywanie microRNA i long-non-coding-RNA w danych z sekwencjonowania. |
Literatura: |
"Large-scale genome sequence processing", M. Kasahara, S. Morishita, Imperial College Press, 2006 "Bioinformatics for High Throughput Sequencing", N. Rodríguez-Ezpeleta, M. Hackenberg, A.M. Aransay, Springer, 2012 |
Efekty uczenia się: |
Wiedza: - znajomość typowych technik całogenomowych nowej generacji - znajomość podstawowych rozkładów statystycznych opisujących nowoczesne pomiary na skalę genomową i algorytmów do ich analizy Umiejętności: - umiejętność wyboru właściwej techniki do zastosowania w danym problemie biologicznym. - umiejętność właściwiego zaprojektowania eksperymentów z wykorzystaniem technologii wielkoskalowych genomicznych i proteomicznych oraz analiza otrzymanych danych (K_U15) - umiejętność wyboru modelu statystycznego do reprezentacji wyniku eksperymentu - umiejętność implementacji wybranych algorytmów do analizy danych z sekwencjonowania nowej generacji Kompetencje: - zna ograniczenia własnej wiedzy i rozumie potrzebę dalszego kształcenia, w tym zdobywania wiedzy pozadziedzinowej (K_K01), - rozumie konieczność systematycznej pracy nad projektami informatycznymi (K_K02), - potrafi formułować opinie na temat podstawowych zagadnień informatycznych. (K_K06), - rozumie potrzebę systematycznego zapoznawania się z czasopismami naukowymi i popularnonaukowymi w celu poszerzania i pogłębiania wiedzy (K_K08). |
Metody i kryteria oceniania: |
Podczas laboratorium, studenci będą pracować (indywidualnie lub w zespołach 2-3 osobowych) nad projektami zaliczeniowymi związanymi z analizą danych z sekwencjonowania. Ocena końcowa jest pochodną oceny z projektu i (opcjonalnego) egzaminu ustnego. Zaliczenie przedmiotu przez doktoranta wymaga wykonania projektów indywidualnie. |
Właścicielem praw autorskich jest Uniwersytet Warszawski.