Webscraping and Social Media Scraping
Informacje ogólne
Kod przedmiotu: | 2400-DS1WSMS | Kod Erasmus / ISCED: |
14.3
![]() ![]() |
Nazwa przedmiotu: | Webscraping and Social Media Scraping | ||
Jednostka: | Wydział Nauk Ekonomicznych | ||
Grupy: |
Anglojęzyczna oferta zajęć WNE UW Przedmioty kierunkowe do wyboru - studia II stopnia IE - grupa 1 (6*30h) Przedmioty kierunkowe do wyboru - studia II stopnia IE - grupa 2 (2*30h) Przedmioty obowiązkowe dla I roku Data Science and Business Analytics |
||
Punkty ECTS i inne: |
3.00 ![]() |
||
Język prowadzenia: | angielski | ||
Rodzaj przedmiotu: | obowiązkowe |
||
Skrócony opis: |
Web scraping i social media scraping są dedykowane pobieraniu danych z sieci w zautomatyzowany sposób. Dzięki kursowi, studenci zdobędą wiedzę i umiejętności do wydobywania danych z Internetu. Podczas zajęć przedstawione zostaną kluczowe techniki web scrapingu. W szczególności, uczestnicy kursu będą potrafili dobrać adekwatne narzędzia i przygotować web/social media crawler stosownie do potrzeb. W ramach zajęć omówione zostaną przede wszystkim aspekty praktyczne web scrapingu. Przedmiot jest realizowany w formie laboratorium. Forma zaliczenia: przygotowanie projektów. Przedmiot jest dedykowany studentom studiów II stopnia (Informatyka i Ekonometria, Data Science |
||
Pełny opis: |
Omawiane zagadnienia: ‒ struktura stron internetowych ‒ web/social media scraping z wybranymi bibliotekami/pakietami ‒ scrapowanie tekstu, linków, tabel i formularzy ‒ pobieranie plików (pojedyncze pliki, wiele plików, wiele stron) ‒ poświadczanie (authentication) ‒ emulatory przeglądarki ‒ studia przypadków ‒ odpowiedzialne scrapowanie & dobre praktyki |
||
Literatura: |
Artykuły naukowe przedstawione przez prowadzących zajęcia (literatura tematu) oraz: R. Lawson (2015). Web Scraping with Python. Packt Publishing. R. Mitchell (2015). Web Scraping with Python: Collecting Data from the Modern Web. O’Reilly Media. S. Munzert, Ch. Rubba, P. Meissner, D. Nyhuis (2015). Web Scraping with Python: Collecting Data from the Modern Web. Wiley S. Munzert, Ch. Rubba, P. Meissner, D. Nyhuis. (2015). Automated Data Collection with R. Wiley |
||
Efekty uczenia się: |
- Student posiada wiedzę za zakresu web scrapingu - Student jest zaznajomiony z narzędziami web scrapingu - Student potrafi wykorzystać wiedzę z zakresu web scrapingu do prowadzenia własnych badań - Student samodzielnie gromadzi i przetwarza dane - Student potrafi pracować w grupach projektowych - Student potrafi formułować i wyrażać swoje poglądy w dyskusji - Student wyraża ciekawość badawczą i otwartość w stosunku do analizy zjawisk o charakterze ekonomicznym K_W01, K_U01, K_U02, K_U03, K_U04, K_U05, KS_01, K_U06 |
||
Metody i kryteria oceniania: |
Oceniane będzie przygotowanie prac projektowych (60%), aktywność podczas zajęć (20%) oraz wyniki testów (20%). Wymagane uzyskanie co najmniej 50% punktów. |
Zajęcia w cyklu "Semestr letni 2021/22" (w trakcie)
Okres: | 2022-02-21 - 2022-06-15 |
![]() |
Typ zajęć: |
Laboratorium, 15 godzin ![]() |
|
Koordynatorzy: | Przemysław Kurek, Jacek Lewkowicz | |
Prowadzący grup: | Przemysław Kurek, Maciej Wysocki | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: |
Przedmiot -
Zaliczenie na ocenę
Laboratorium - Zaliczenie na ocenę |
Właścicielem praw autorskich jest Uniwersytet Warszawski.