Uniwersytet Warszawski - Centralny System UwierzytelnianiaNie jesteś zalogowany | zaloguj się
katalog przedmiotów - pomoc

Webscraping and Social Media Scraping

Informacje ogólne

Kod przedmiotu: 2400-DS1WSMS Kod Erasmus / ISCED: 14.3 / (0311) Ekonomia
Nazwa przedmiotu: Webscraping and Social Media Scraping
Jednostka: Wydział Nauk Ekonomicznych
Grupy: Anglojęzyczna oferta zajęć WNE UW
Przedmioty kierunkowe do wyboru - studia II stopnia IE - grupa 1 (6*30h)
Przedmioty kierunkowe do wyboru - studia II stopnia IE - grupa 2 (2*30h)
Przedmioty obowiązkowe dla I roku Data Science and Business Analytics
Punkty ECTS i inne: 3.00
Język prowadzenia: angielski
Rodzaj przedmiotu:

obowiązkowe

Skrócony opis:

Web scraping i social media scraping są dedykowane pobieraniu danych z sieci w zautomatyzowany sposób. Dzięki kursowi, studenci zdobędą wiedzę i umiejętności do wydobywania danych z Internetu. Podczas zajęć przedstawione zostaną kluczowe techniki web scrapingu. W szczególności, uczestnicy kursu będą potrafili dobrać adekwatne narzędzia i przygotować web/social media crawler stosownie do potrzeb. W ramach zajęć omówione zostaną przede wszystkim aspekty praktyczne web scrapingu. Przedmiot jest realizowany w formie laboratorium. Forma zaliczenia: przygotowanie projektów. Przedmiot jest dedykowany studentom studiów II stopnia (Informatyka i Ekonometria, Data Science

Pełny opis:

Omawiane zagadnienia:

‒ struktura stron internetowych

‒ web/social media scraping z wybranymi bibliotekami/pakietami

‒ scrapowanie tekstu, linków, tabel i formularzy

‒ pobieranie plików (pojedyncze pliki, wiele plików, wiele stron)

‒ poświadczanie (authentication)

‒ emulatory przeglądarki

‒ studia przypadków

‒ odpowiedzialne scrapowanie & dobre praktyki

Literatura:

Artykuły naukowe przedstawione przez prowadzących zajęcia (literatura tematu) oraz:

R. Lawson (2015). Web Scraping with Python. Packt Publishing.

R. Mitchell (2015). Web Scraping with Python: Collecting Data from the Modern Web. O’Reilly Media.

S. Munzert, Ch. Rubba, P. Meissner, D. Nyhuis (2015). Web Scraping with Python: Collecting Data from the Modern Web. Wiley

S. Munzert, Ch. Rubba, P. Meissner, D. Nyhuis. (2015). Automated Data Collection with R. Wiley

Efekty uczenia się:

- Student posiada wiedzę za zakresu web scrapingu

- Student jest zaznajomiony z narzędziami web scrapingu

- Student potrafi wykorzystać wiedzę z zakresu web scrapingu do prowadzenia własnych badań

- Student samodzielnie gromadzi i przetwarza dane

- Student potrafi pracować w grupach projektowych

- Student potrafi formułować i wyrażać swoje poglądy w dyskusji

- Student wyraża ciekawość badawczą i otwartość w stosunku do analizy zjawisk o charakterze ekonomicznym

K_W01, K_U01, K_U02, K_U03, K_U04, K_U05, KS_01, K_U06

Metody i kryteria oceniania:

Oceniane będzie przygotowanie prac projektowych (60%), aktywność podczas zajęć (20%) oraz wyniki testów (20%). Wymagane uzyskanie co najmniej 50% punktów.

Zajęcia w cyklu "Semestr letni 2021/22" (w trakcie)

Okres: 2022-02-21 - 2022-06-15
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 15 godzin więcej informacji
Koordynatorzy: Przemysław Kurek, Jacek Lewkowicz
Prowadzący grup: Przemysław Kurek, Maciej Wysocki
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Zaliczenie na ocenę
Laboratorium - Zaliczenie na ocenę
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Warszawski.