(in Polish) Text-mining i analiza źródeł internetowych w języku Python
General data
Course ID: | 2400-ZEWW853 |
Erasmus code / ISCED: |
14.3
|
Course title: | (unknown) |
Name in Polish: | Text-mining i analiza źródeł internetowych w języku Python |
Organizational unit: | Faculty of Economic Sciences |
Course groups: |
(in Polish) Przedmioty kierunkowe do wyboru - studia II stopnia EM - grupa 2 (1*30h) (in Polish) Przedmioty kierunkowe do wyboru - studia II stopnia EP - grupa 4 (1*30h) (in Polish) Przedmioty kierunkowe do wyboru - studia II stopnia IE - grupa 2 (2*30h) (in Polish) Przedmioty kierunkowe do wyboru- studia I stopnia EP (in Polish) Przedmioty wyboru kierunkowego dla studiów licencjackich EM (in Polish) Przedmioty wyboru kierunkowego dla studiów licencjackich IE (in Polish) Przedmioty wyboru kierunkowego dla studiów licencjackich MSEM (in Polish) Przedmioty wyboru kierunkowego dla studiów licencjackich MSEMen |
ECTS credit allocation (and other scores): |
3.00
|
Language: | Polish |
Type of course: | optional courses |
Prerequisites (description): | (in Polish) Uczestnictwo w zajęciach “Wprowadzenie do programowania w języku Python” lub w innym kursie z zbliżonym programem |
Short description: |
(in Polish) W ramach zajęć studentki i studenci poznają metody służące pozyskaniu danych ze źródeł internetowych, w tym z mediów społecznościowych (np. Reddit,Mastodon), oraz metody przetwarzania danych tekstowych (metody przetwarzania języka naturalnego oraz text-miningu). Nabyte umiejętności umożliwią im samodzielną pracę z wykorzystaniem metod data science na studiach licencjackich/magisterskich |
Full description: |
(in Polish) Zbieranie danych z platform społecznościowych z wykorzystaniem BigQuery • Zbieranie danych z Reddit oraz Mastodon z wykorzystaniem API • Zbieranie wiadomości z portali internetowych • Przegląd metod Natural Language Processing • Wyrażenia regularne (regular expressions) • Tokenizacja słów, stemming, n-gramy, lematyzacja, tagowanie części mowy • Analiza sentymentu • Analiza semantyczna, modelowanie tematyczne (LSA, LDA, PCA) • Wykorzystanie sieci neuronowych w text- miningu • Wektory słów: Word2Vec • Klastrowanie tekstów z wykorzystaniem algorytmu t-SNE • Konsultacje wyboru tematu i metodologii do case study • Prezentacja case study wykorzystującego wybraną technikę poznaną w trakcie kursu (2 zajęcia) |
Bibliography: |
(in Polish) Hobson Lane Cole Howard, Hannes Max Hapke (2021), Przetwarzanie języka naturalnego w akcji. Rozumienie, analiza i generowanie tekstu w Pythonie na przykładzie języka angielskiego, Wydawnictwo Naukowe PWN |
Learning outcomes: |
(in Polish) WIEDZA • Student zna popularne zastosowania języka Python w różnych obszarach badawczych • Student zna podstawowe biblioteki służące do analizy tekstu w języku Python • Student zna popularne metody analizy tekstu stosowane przy użyciu języka Python • Student zna możliwości oraz ograniczenia wynikające z pracy z danymi sieciowymi UMIEJĘTNOŚCI - Student potrafi stworzyć i zarządzać bazą danych w języku Python - Student umie przeanalizować duży zbiór tekstowy przy użyciu technik text miningowych - Student umie sprawnie wizualizować dane z wykorzystaniem dobrych praktyk prezentacji KOMPETENCJE SPOŁECZNE - Student jest zaznajomiony z zasadami etycznego oraz legalnego przetwarzania danych |
Assessment methods and assessment criteria: |
(in Polish) Prezentacja końcowa |
Classes in period "Summer semester 2023/24" (in progress)
Time span: | 2024-02-19 - 2024-06-16 |
Navigate to timetable
MO TU W KON
TH FR |
Type of class: |
Seminar, 30 hours
|
|
Coordinators: | Kristóf Gyódi | |
Group instructors: | Kristóf Gyódi | |
Students list: | (inaccessible to you) | |
Examination: |
Course -
Grading
Seminar - Grading |
Copyright by University of Warsaw.