Uniwersytet Warszawski, Wydział Nauk Ekonomicznych - Centralny System Uwierzytelniania
Strona główna

Statistics and Exploratory Data Analysis

Informacje ogólne

Kod przedmiotu: 2400-DS1ST
Kod Erasmus / ISCED: 14.3 Kod klasyfikacyjny przedmiotu składa się z trzech do pięciu cyfr, przy czym trzy pierwsze oznaczają klasyfikację dziedziny wg. Listy kodów dziedzin obowiązującej w programie Socrates/Erasmus, czwarta (dotąd na ogół 0) – ewentualne uszczegółowienie informacji o dyscyplinie, piąta – stopień zaawansowania przedmiotu ustalony na podstawie roku studiów, dla którego przedmiot jest przeznaczony. / (0311) Ekonomia Kod ISCED - Międzynarodowa Standardowa Klasyfikacja Kształcenia (International Standard Classification of Education) została opracowana przez UNESCO.
Nazwa przedmiotu: Statistics and Exploratory Data Analysis
Jednostka: Wydział Nauk Ekonomicznych
Grupy: Anglojęzyczna oferta zajęć WNE UW
Przedmioty kierunkowe do wyboru - studia II stopnia IE - grupa 1 (6*30h)
Przedmioty obowiązkowe dla I roku Data Science and Business Analytics
Punkty ECTS i inne: 5.00 Podstawowe informacje o zasadach przyporządkowania punktów ECTS:
  • roczny wymiar godzinowy nakładu pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się dla danego etapu studiów wynosi 1500-1800 h, co odpowiada 60 ECTS;
  • tygodniowy wymiar godzinowy nakładu pracy studenta wynosi 45 h;
  • 1 punkt ECTS odpowiada 25-30 godzinom pracy studenta potrzebnej do osiągnięcia zakładanych efektów uczenia się;
  • tygodniowy nakład pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się pozwala uzyskać 1,5 ECTS;
  • nakład pracy potrzebny do zaliczenia przedmiotu, któremu przypisano 3 ECTS, stanowi 10% semestralnego obciążenia studenta.
Język prowadzenia: angielski
Rodzaj przedmiotu:

obowiązkowe

Skrócony opis:

Laboratorium ma na celu zapoznanie Studentów z podstawami statystycznej analizy danych. W trakcie kursu Studenci zapoznają się zarówno z podstawowymi koncepcjami teoretycznymi, jak i z narzędziami pozwalającymi na samodzielną eksplorację danych. Każdy z tematów poruszanych w trakcie kursu, zilustrowany będzie za pomocą przykładów oraz zadań do samodzielnego rozwiązania przez Studentów. Uczestnictwo w kursie jest obligatoryjne dla Studentów kierunku Data Science.

Pełny opis:

Lista zagadnień omawianych podczas laboratorium obejmuje:

Statystyki opisowe:

1. Pojęcie zmiennej losowej, rozkład zmiennej losowej, funkcja gęstości, dystrybuanta

2. Miary położenia rozkładu: średnia, moda (dominanta), mediana, trimean, mid-mean, średnia obcięta, średnia winsorowska, kwartyle, decyle, percentyle

3. Miary rozproszenia rozkładu: rozstęp, wariancja, odchylenie standardowe, rozstęp międzykwartylowy, średnie odchylenie bezwzględne

4. Wyższe momenty rozkładu: współczynnik asymetrii, kurtoza

5. Obserwacje odstające: podejście IQR, Z-score, zmodyfikowany Z-score

6. Estymacja parametrów rozkładu zmiennej losowej (rozkład normalny, rozkład Gamma, rozkład Beta, rozkład log-normalny, rozkład Pareto, etc.)

Analiza graficzna:

1. Histogram

2. Estymacja funkcji gęstości (Kernel density)

3. Wykres punktowy

4. Wykres pudełkowy

5. Wykres QQ, wykres PP

6. Wykres przebiegu i inne

Wnioskowanie statystyczne

1. Testy jednostronne (test t, test z, test dwumianowy, test Chi-kwadrat)

2. Testy dla dwóch prób niezależnych (test t, test Wilcoxona, test Chi-kwadrat, test Fischera)

3. Testy dla więcej niż dwóch prób niezależnych (ANOVA, Kruskal-Wallis, test Chi-kwadrat)

4. Testy dla dwóch prób zależnych (test t dla prób zależnych, test Wilcoxona dla prób zależnych, test McNemara/test symetrii)

5. Testy dla więcej niż dwóch prób zależnych (ANOVA dla prób zależnych/model efektów mieszanych, test Q-Cochran’a/test Friedmana)

Miary zależności

1. Współczynniki korelacji Pearson’a, Spearman’a i Kendalla

2. Współczynnik V-Cramera

Moc testów i wielkość próby

1. Podstawowe testy

2. Procedury testowania wielu hipotez.

Literatura:

Peng R. D., Exploratory data analysis with R, 2016.

Magnificio S. S., Summary and analysis of extension education program evaluation in R, 2016.

Wagenmakers E.-J. & Gronau Q. F., A compendium of clean graphs in R, online access.

Delignette-Muller M. & Dutang C., Fitdistrplus: an R Package for fitting distributions. Journal of Statistical Software, 64(4) 2015

Blomberg S. P., Power analysis using R, 2014.

Delorme P., De Micheaux, P. L., Liquet B., and Riou, J. Type-II generalized family-wise error rate formulas with application to sample size determination. Statist. Med. 2016.

Efekty uczenia się:

Studenci nauczą się w jaki sposób obliczyć i interpretować statystyki opisowe oraz wykresy zmiennych losowych, a także przeprowadzić wstępną analizę danych wraz z testowaniem oraz weryfikacją hipotez dotyczących rozkładu zmiennych. Efektem końcowym kursu jest umiejętność przeprowadzenia analizy statystycznej wraz z interpretacją otrzymanych wyników.

K_W01, K_U01, K_U02, K_U03, K_U04, K_U05, KS_01

Metody i kryteria oceniania:

Warunkiem zaliczenia przedmiotu jest:

• Obecność na zajęciach

• Zaliczenie egzaminu pisemnego w formie „open-book”

Zajęcia w cyklu "Semestr zimowy 2022/23" (w trakcie)

Okres: 2022-10-01 - 2023-01-29
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć:
Laboratorium, 30 godzin więcej informacji
Koordynatorzy: Marcin Chlebus, Damian Zięba
Prowadzący grup: Marcin Chlebus, Damian Zięba
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Zaliczenie na ocenę
Laboratorium - Zaliczenie na ocenę
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Warszawski, Wydział Nauk Ekonomicznych.
ul. Długa 44/50
00-241 Warszawa
tel: +48 22 55 49 126 https://www.wne.uw.edu.pl/
kontakt deklaracja dostępności USOSweb 6.8.0.0-7 (2022-11-16)