Big Data Analytics
Informacje ogólne
Kod przedmiotu: | 2400-DS2BDA | Kod Erasmus / ISCED: |
14.3
![]() ![]() |
Nazwa przedmiotu: | Big Data Analytics | ||
Jednostka: | Wydział Nauk Ekonomicznych | ||
Grupy: |
Anglojęzyczna oferta zajęć WNE UW Przedmioty kierunkowe do wyboru - studia II stopnia IE - grupa 1 (6*30h) Przedmioty kierunkowe do wyboru - studia II stopnia IE - grupa 2 (2*30h) Przedmioty obowiązkowe dla II roku Data Science and Business Analytics |
||
Punkty ECTS i inne: |
2.00 ![]() |
||
Język prowadzenia: | angielski | ||
Rodzaj przedmiotu: | obowiązkowe |
||
Skrócony opis: |
Laboratorium ma na celu zapoznanie Studentów z praktyczną stroną przetwarzania dużych zbiorów danych w środowisku Apache Hadoop. Studenci dowiedzą się jak zastosować techniki analizy danych i uczenia maszynowego poznane na wcześniejszych etapach kształcenia do dużych zbiorów danych. W szczególności kurs nie będzie uczył nowych technik. Zajęcia skupią się na rzeczywistych przykładach i zrozumieniu działania używanych narzędzi. |
||
Pełny opis: |
1. Wprowadzenie do środowiska Linux 2. Wprowadzenie do Big Data • Środowisko Hadoop • Paradygmat MapReduce 3. Przetwarzanie i eksploracja danych z użyciem Apache Hive i Apache Spark • Różnice vs. RDBMs • Optymalizacja • Pułapki 4. Wprowadzenie do uczenia maszynowego z użyciem Apache Spark • Przeniesienie modelu zbudowanego w R lub Python na wcześniejszych etapach kształcenia do świata dużych danych (możliwości i ograniczenia) 5. Analiza interaktywna 6. Wizualizacje w Big Data 7. Automatyzacja przetwarzania danych z użyciem Apache Ariflow |
||
Literatura: |
Literatura oraz publikacje dostępne on-line będą udostęniane w trakcie laboratorium |
||
Efekty uczenia się: |
Studenci nauczą się w jaki sposób wykorzystywać ekosystem Hadoop do przygotowania i analizy dużych zbiorów danych oraz zastosowania podstawowych metod uczenia maszynowego. K_U02, K_U05 |
||
Metody i kryteria oceniania: |
Warunkiem zaliczenia przedmiotu jest: • Obecność na zajęciach • Prezentacja, w której przedstawione zostaną wybrane zastosowania omówionych w trakcie zajęć metod • projekt z użyciem dużego zbioru danych |
Zajęcia w cyklu "Semestr zimowy 2021/22" (zakończony)
Okres: | 2021-10-01 - 2022-02-20 |
![]() |
Typ zajęć: |
Laboratorium, 15 godzin ![]() |
|
Koordynatorzy: | Tomasz Żukowski | |
Prowadzący grup: | Tomasz Żukowski | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: |
Przedmiot -
Zaliczenie na ocenę
Laboratorium - Zaliczenie na ocenę |
Zajęcia w cyklu "Semestr zimowy 2022/23" (jeszcze nie rozpoczęty)
Okres: | 2022-10-01 - 2023-01-29 |
![]() |
Typ zajęć: |
Laboratorium, 15 godzin ![]() |
|
Koordynatorzy: | Tomasz Żukowski | |
Prowadzący grup: | Tomasz Żukowski | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: |
Przedmiot -
Zaliczenie na ocenę
Laboratorium - Zaliczenie na ocenę |
Właścicielem praw autorskich jest Uniwersytet Warszawski.