Statystyczna analiza danych
Informacje ogólne
Kod przedmiotu: | 1000-714SAD |
Kod Erasmus / ISCED: |
11.303
|
Nazwa przedmiotu: | Statystyczna analiza danych |
Jednostka: | Wydział Matematyki, Informatyki i Mechaniki |
Grupy: |
Przedmioty obowiązkowe dla II roku bioinformatyki Przedmioty obowiązkowe dla III roku matematyki |
Punkty ECTS i inne: |
6.00
|
Język prowadzenia: | polski |
Rodzaj przedmiotu: | obowiązkowe |
Założenia (opisowo): | Oczekuje się dobrej znajomości zagadnień ujętych w sylabusach przedmiotów Analiza matematyczna II.1 oraz Rachunek prawdopodobieństwa I. |
Skrócony opis: |
Wprowadzenie podstawowych pojęć i narzędzi statystycznych takich jak estymacja i weryfikacja hipotez, a także statystycznej analizy danych, w tym klasyfikacji i klasteryzacji. Studenci kierunku Matematyka mogą alternatywnie wybrać 1000-116bST o nieco innym charakterze. |
Pełny opis: |
1. Podstawowe pojęcia rachunku prawdopodobieństwa i statystyki: zmienne losowe, ich rozkłady i charakterystyki liczbowe, przestrzeń probabilistyczna, 2. Podstawowe pojęcia statystyki przestrzeń statystyczna, eksperyment losowy, statystyka, model statystyczny, miary poprawności modelu 3. Estymacja. Obciążenie i efektywność estymatora, estymatory największej wiarygodności, estymacja przedziałowa 4. Podsumowywanie, wizualizacja danych. Wykres kwantyl-kwantyl, histogram, gładki estymator funkcji gęstości, wykres pudełkowy 5. Testowanie hipotez statystycznych Pojęcie hipotezy statystycznej, zasady weryfikacji hipotez, błędy I i II rodzaju, moc testu, podstawowy lemat Neymanna-Pearsona, parametryczne testy istotności, testy istotności dla wartości średniej, test istotności dla wariancji 6. Pojęcie p-wartości i pułapki testowania hipotez. P-wartość, wielkość efektu, korekcja błędów wielokrotnego testowania 7. Przydatne testy. Testy istotności dla dwóch średnich, testowanie nieparametrycznych hipotez dla median, testy zgodności, analiza wariancji. 8. Regresja liniowa, prosta, wielokrotna i z rozszerzeniami, założenia, estymacja parametrów i ocenianie dopasowania modelu liniowego. 9. Klasyfikacja. Regresja logistyczna, LDA, QDA, KNN 10. Metody re-próbkowania. Walidacja krzyżowa, bootstrap 11. Selekcja modelu i regularyzacja. Wybór podzbioru cech predykcyjnych, korzystanie z modelu walidacyjnego i walidacji krzyżowej, dane wielkowymiarowe, regularyzacja lasso i siodłowa, metoda częściowych najmniejszych kwadratów. 12. Metody drzewiaste, drzewa decyzyjne, bagging, drzewa losowe, boosting 13. Maszyny wektorów wspierających. Hiperpłaszczyzny separujące, klasyfikator największego marginesu, klasyfikatory wektorów wspierających, maszyny wektorów wspierających. 14. Metody redukcji wymiaru. PCA 15. Uczenie bez nadzoru. Klasteryzacja, algorytmy hierarchicznego klastrowania, k-średnich. 16. Modele nieliniowe. Regresja wielomianowa, splajny, uogólnione modele addytywne. |
Literatura: |
Lesław Gajek, Marek Kałuszka, Wnioskowanie statystyczne, modele i metody. John A. Rice, Mathematical Statistics and Data Analysis. Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani. Introduction to Statistical Learning in R. |
Efekty uczenia się: |
Wiedza: 1. Ma ogólna wiedzę o problemach statystycznej analizy danych. 2. Ma podstawową wiedzę w zakresie podstawowych narzędzi statystycznych stosowanych w modelowaniu i analizie danych. 3. Ma wiedzę z zakresu podstawowych metod rachunku prawdopodobieństwa i statystyki, w tym elementów teorii estymacji i testowania hipotez Umiejętności: 1. Potrafi wykonać proste analizy i testy statystyczne. 2. Potrafi stosować techniki nowoczesnej statystycznej analizy danych. 3. Potrafi konstruować modele probabilistyczne i stosować metody statystyczne do analizy danych. Kompetencje społeczne: 1. Umie wyjaśnić w zrozumiałym języku sens wnioskowania statystycznego. |
Metody i kryteria oceniania: |
Wpływ na ocenę końcową: egzamin 40%, kolokwium 20%, zadanie zaliczające 20%, aktywność na ćwiczeniach 10%, aktywność na labach 10%. |
Zajęcia w cyklu "Semestr letni 2023/24" (zakończony)
Okres: | 2024-02-19 - 2024-06-16 |
Przejdź do planu
PN WT CW
LAB
CW
LAB
ŚR LAB
LAB
CW
CW
CZ CW
WYK
LAB
PT CW
LAB
|
Typ zajęć: |
Ćwiczenia, 15 godzin
Laboratorium, 30 godzin
Wykład, 30 godzin
|
|
Koordynatorzy: | Błażej Miasojedow | |
Prowadzący grup: | Barbara Domżał, Błażej Miasojedow, Szymon Nowakowski, Piotr Pokarowski, Łukasz Rajkowski | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: | Egzamin |
Zajęcia w cyklu "Semestr letni 2024/25" (jeszcze nie rozpoczęty)
Okres: | 2025-02-17 - 2025-06-08 |
Przejdź do planu
PN WT ŚR CZ PT |
Typ zajęć: |
Ćwiczenia, 15 godzin
Laboratorium, 30 godzin
Wykład, 30 godzin
|
|
Koordynatorzy: | Błażej Miasojedow | |
Prowadzący grup: | Błażej Miasojedow, Szymon Nowakowski, Piotr Pokarowski, Łukasz Rajkowski | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: | Egzamin |
Właścicielem praw autorskich jest Uniwersytet Warszawski, Wydział Nauk Ekonomicznych.