Uniwersytet Warszawski - Centralny System UwierzytelnianiaNie jesteś zalogowany | zaloguj się
katalog przedmiotów - pomoc

Zastosowanie metod eksploracji danych (Data Mining) w badaniach ekonomicznych ( ścieżka SAS)

Informacje ogólne

Kod przedmiotu: 2400-ZEWW236 Kod Erasmus / ISCED: 14.3 / (0311) Ekonomia
Nazwa przedmiotu: Zastosowanie metod eksploracji danych (Data Mining) w badaniach ekonomicznych ( ścieżka SAS)
Jednostka: Wydział Nauk Ekonomicznych
Grupy: Przedmioty kierunkowe do wyboru - studia II stopnia IE - grupa 2 (2*30h)
Punkty ECTS i inne: 3.00
zobacz reguły punktacji
Język prowadzenia: polski
Rodzaj przedmiotu:

nieobowiązkowe

Założenia (opisowo):

Wymagania formalne

Przed rozpoczęciem nauki przedmiotu wskazane jest, aby student posiadał podstawowe umiejętności analiz danych, przeprowadzania badań statystycznych, budowy modeli ekonometrycznych i interpretacji uzyskiwanych wyników.

Założenia wstępne

Przydatna wiedza z przedmiotów umożliwiajacym studentom przeprowadzanie analiz danych, badań statystycznych i ekonometrycznych.



Skrócony opis:

Celem zajęć jest zapoznanie studentów z metodami statystycznymi i metodami sztucznej inteligencji umożliwiającymi odkrywanie nieznanych zależności (prawidłowości, wzorców, trendów) między danymi w zbiorach danych. Metody te pozwalają z danych tworzyć wiedzę. Powszechnie są określane jako Data Mining. W badaniach ekonomicznych wykorzystuje się je do prognozowania, klasyfikowania, tworzenia skupień obiektów, analiz regresji lub dyskryminacji, odkrywania asocjacji i sekwencji zdarzeń. Przykłady zastosowania to: analizy i oceny klientów bankowych, prognozy ubezpieczeniowe, prognozowanie kursów akcji i dochodowości portfela, przewidywanie bankructw firm, badania marketingowe, wykrywanie przestępstw komputerowych. Poszczególne metody zostaną omówione z przedstawieniem ich zastosowań. W części praktycznej studenci wykonają analizy za pomocą programu SAS Enterprise Miner 6.2.

Pełny opis:

Na zajęciach podejmowane będą m.in. następujące zagadnienia:

1. Wstępna analiza danych: metody analizy danych jakościowych; metody analizy danych ilościowych.

2. Regresja liniowa i logistyczna.

3. Analiza czynnikowa i analiza głównych składowych.

3. Drzewa klasyfikacyjne i regresyjne.

4. Wielowarstwowe jednokierunkowe sieci neuronowe.

5. Analiza skupień. Metoda k-średnich. Kryterium CCC. Sieci neuronowe Kohonena. Analiza skupień dla zmiennych.

6. Analiza asocjacji i sekwancji

7. Zasady posługiwania się programem SAS Enterprise Miner. Organizacja zbiorów danych wykorzystywanych w analizach Data Mining. Tworzenie projektów analizy danych i zarządzanie projektami.

8. Metodyka procesu analizy danych SEMMA. Narzędzia eksploracji danych wspierające analizy w poszczególnych krokach SEMMA. Etapy w metodyce SEMMA a budowa diagramów analizy danych. Ogólne reguły budowy diagramów.

9. Przygotowanie danych do analiz Data Mining. Wstępna analiza danych wejściowych. Przeprowadzanie transformacji zmiennych. Rozwiązywanie problemu brakujących wartości. Wybór zmiennych na potrzeby eksploracji danych.

10. Metody prognozowania - standardy modelowania i analiza wyników (porównywanie modelu predykcyjnych). Ocena poprawności prognoz. Generowanie i wykorzystywanie kodu oceny Scoring Code. Przykład generowania i wykorzystania kodu Scoring Code. Scoring w Enterprise Miner. Scoring za pomocą base SAS (poza Enterprise Miner). Generowanie raportów z projektów eksploracji danych.

Przedmiot jest częścią Data Mining Certificate Program, prowadzonego przy współpracy z SAS Institute Polska.

Literatura:

[1] Applied Analytics Using SAS Enterprise Miner 5.3. Course Notes, część I i część II, SAS Institute Inc. Cary, NC, USA, ISBN 978-1-59994-818-8, 2008.

[2] Cabena P. I in., Discovering Data Mining: From Concept to Implementation, Prentice Hall, Upper Saddle River, NJ, 1998.

[3] Chakrabarti S., Cox E., Frank E. i in., Data Mining. Know it all, Elsevier Inc. 2009.

[4] Everitt B.S., The Cambridge Dictionary of Statistics, Cambridge University Press, 1998.

[5] Han J., Kamber M., Pei J., Data Mining. Concepts and Techniques, Morgan Kaufmann - Elsevier, 2012.

[6] Hand D. I in., Principles of Data Mining, MIT Press, Cambridge University Press, 2001.

[7] Larose D.T., Metody i modele eksploracji danych, Wydawnictwo Naukowe PWN, ISBN 978-83-01-15467-7, Warszawa 2008.

[8] Larose D.T., Odkrywanie wiedzy z danych. Wprowadzenie do eksploracji danych, Wydawnictwo Naukowe PWN, ISBN-13: 978-83-01-14836-2; ISBN-10: 83-01-14836-5, Warszawa 2006.

[9] Lasek M., Metody Data Mining w analizowaniu i prognozowaniu kondycji ekonomicznej przedsiębiorstw. Zastosowania SAS Enterprise Miner, Difin, ISBN 978-83-7251-695-4, Warszawa 2007.

[10] Lasek M., Nowak E., Pęczkowski M., Association and Sequence Rules of Events in an Investment Analysis of Agrotourism Farms/ Zastosowanie reguł asocjacji i sekwencji zdarzeń do analizy działalności inwestycyjnej gospodarstw agroturystycznych (artykuły w dwóch wersjach językowych: angielskim i polskim), Turyzm, 18/2, 2008, s. 57-73.

[11] Lasek M., Od danych do wiedzy. Metody i techniki „Data Mining”, Optimum, nr 2 (22), s. 17-37, ISSN 1506-7637, 2004.

[12] Lasek M., Pęczkowski M., Analiza zróżnicowania pięciuset największych firm Rzeczpospolitej, Ekonomiczno-Informatyczny Kwartalnik Teoretyczny Wyższej Szkoły Ekonomiczno-Informatycznej w Warszawie, nr 18, październik-grudzień 2008, ISSN 1733-3156, 2008, s. 64-72.

[13] Lasek M., Pęczkowski M., Wierzba D., Zastosowanie analiz Data Mining w przewidywaniu groźby upadłości lub konieczności prowadzenia postępowania układowego przedsiębiorstwa – budowa modeli predykcyjnych, ocena ich jakości i wybór modelu, Studia i materiały Polskiego Stowarzyszenia Zarządzania Wiedzą, nr 22, 2009, ISSN 1732-324X, s. 81-95.

[14] Lasek M., Pęczkowski M., Wykresy lift charts jako narzędzia wyboru modeli eksploracji danych Data Mining, w: J. Nazarko, L. Kiełtyka, (redakcja naukowa), Narzędzia informatyczne w zarządzaniu i inżynierii produkcji, Centrum Doradztwa i Informacji Difin, s. 228-243, ISBN 978-83-7251-920-7, Warszawa 2008.

[15] Lasek M., Pęczkowski M., SAS Enterprise Miner jako przykład programu wspomagania analiz Data Mining, [w:] R, Mosdorf, N.Siemieniuk (red.) Zastosowanie technologii informacyjnych w zarządzaniu wiedzą i procesami gospodarczymi, Wydawnictwo Wyższej Szkoły Finansów i Zarządzania w Białymstoku, Białystok 2011, s. 131-145.

[16] Lasek M., Pęczkowski M., Grupowanie zmiennych w procesach eksploracji danych, Ekonomia i Zarządzanie, t. 2, nr 1, Politechnika Białostocka 2010, s. 83-94.

[17] LasekM., Peczkowski M., Metodyka procesu eksploracji danych SEMMA, Prace i Materiały Wydziału Zarządzania Uniwersytetu Gdańskiego, zeszyt: Finanse w warunkach kryzysu. Wybrane zagadnienia, nr 3, Gdańsk 2010, s 117-133.

[18] Lasek M., Peczkowski M., Graficzna ocena jakości predykcyjnych Data Mining, [w:] R. Kucęba, J.Nazarko (red), Logistyczne uwarunkowania zarządzania przedsiębiorstwem, Wydawnictwo Politechniki Cżestochowskiej, seria minografie 178, Częstochowa 2009, 184-191.

[19] Maimon O., Rokach L.(eds.), Data Mining and Knowledge Discovery Handbook, Springer Science+Business Media Inc., New York 2005.

[20] Markov Z., Larose D.T., Eksploracja zasobów internetowych. Analiza struktury, zawartości i użytkowania sieci WWW, Wydawnictwo Naukowe PWN, ISBN 978-83-01-15868-2, Warszawa 2009.

[21] Matignon R., Data Mining using SAS Enterprise Miner, John Wiley & Sons, Inc., ISBN 978-0-470-14901-0, New Jersey 2007.

[22] Pęczkowski M., Wprowadzenie do Data Mining, Studia Podyplomowe: Metody statystyczne w biznesie, WNE UW, Warszawa 2011 [materiały kursowe].

[23] Reference Help – Enterprise Miner 6.2, SAS Institute Inc., Cary, NC, USA 2009.

[24] Taniar D. (ed.), Data Mining and Knowledge Discovery Technologies, IGI Global 2008.

[25] Witten I.H., Frank E., Hall M.A., Data Mining. Practical Machine Learning. Tools and Techniques, Morgan Kaufmann - Elsevier, 2011.

[26] Ye N. (ed.), The Handbook of Data Mining, Lawrence Erlbaum AssociatesInc. Publishers, ISBN 0-8058-4081-8, New Jersey 2003.

Efekty uczenia się:

Po ukończeniu zajęć studenci powinni posiadać umiejętność przeprowadzania eksploracji danych za pomocą poznanych metod Data Mining oraz posługiwania się programem SAS Enterprise Miner.

Efekty kształcenia w ramach kategorii - wiedza, umiejętności, kompetencje społeczne:

1) Wiedza

Student posiada rozeznanie w zakresie dostępnych metod i technik Data Mining oraz wie jak je należy stosować na potrzeby badań ekonomicznych.

2) Umiejętności

Student potrafi wybrać i umie wykorzystać właściwe metody i techniki dla konkretnych zastosowań, a w razie potrzeby umie zmodyfikować (przystosować) metody i techniki, tak aby były jak najbardziej skuteczne i efektywne w przeprowadzanych w danym przypadku badaniach.

3) Kompetencje społeczne

Student jest świadomy jakie są możliwości i zalety stosowania metod i technik Data Mining w badaniach ekonomicznych oraz korzyści jakie można dzięki ich stosowaniu uzyskać, ale także zdaje sobie sprawę z wad i ograniczonej przydatności tych metod i technik.

KW01, KW02, KW03, KU01, KU02, KU03, KK01, KK02, KK03

Metody i kryteria oceniania:

Do zaliczenia zajęć wymagana jest obecność na zajęciach. W trakcie ustalania ostatecznej oceny zaliczenia przedmiotu będzie brane pod uwagę bieżące przygotowywanie do zajęć i aktywność na zajęciach.

Zaliczenie zajęć odbywa się na podstawie dwóch kolokwiów, zawierających pytania teoretyczne i praktyczne. Z każdego kolokwium należy uzyskać co najmniej połowę punktów z każdej części (praktycznej i teoretycznej).

Zajęcia w cyklu "Semestr letni 2020/21" (zakończony)

Okres: 2021-02-22 - 2021-06-13
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Konwersatorium, 30 godzin więcej informacji
Koordynatorzy: Karolina Kuligowska, Anna Lewczuk
Prowadzący grup: Karolina Kuligowska, Anna Lewczuk
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Zaliczenie na ocenę
Konwersatorium - Zaliczenie na ocenę
Tryb prowadzenia:

zdalnie

Zajęcia w cyklu "Semestr letni 2021/22" (jeszcze nie rozpoczęty)

Okres: 2022-02-21 - 2022-06-15
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Konwersatorium, 30 godzin więcej informacji
Koordynatorzy: Karolina Kuligowska, Anna Lewczuk
Prowadzący grup: Karolina Kuligowska, Anna Lewczuk
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Zaliczenie na ocenę
Konwersatorium - Zaliczenie na ocenę
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Warszawski.