Uniwersytet Warszawski, Wydział Nauk Ekonomicznych - Centralny System Uwierzytelniania
Strona główna

Webscraping and Social Media Scraping

Informacje ogólne

Kod przedmiotu: 2400-DS1WSMS
Kod Erasmus / ISCED: 14.3 Kod klasyfikacyjny przedmiotu składa się z trzech do pięciu cyfr, przy czym trzy pierwsze oznaczają klasyfikację dziedziny wg. Listy kodów dziedzin obowiązującej w programie Socrates/Erasmus, czwarta (dotąd na ogół 0) – ewentualne uszczegółowienie informacji o dyscyplinie, piąta – stopień zaawansowania przedmiotu ustalony na podstawie roku studiów, dla którego przedmiot jest przeznaczony. / (0311) Ekonomia Kod ISCED - Międzynarodowa Standardowa Klasyfikacja Kształcenia (International Standard Classification of Education) została opracowana przez UNESCO.
Nazwa przedmiotu: Webscraping and Social Media Scraping
Jednostka: Wydział Nauk Ekonomicznych
Grupy: Anglojęzyczna oferta zajęć WNE UW
Przedmioty kierunkowe do wyboru - studia II stopnia IE - grupa 2 (2*30h)
Przedmioty obowiązkowe dla I roku Data Science and Business Analytics
Punkty ECTS i inne: 3.00 Podstawowe informacje o zasadach przyporządkowania punktów ECTS:
  • roczny wymiar godzinowy nakładu pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się dla danego etapu studiów wynosi 1500-1800 h, co odpowiada 60 ECTS;
  • tygodniowy wymiar godzinowy nakładu pracy studenta wynosi 45 h;
  • 1 punkt ECTS odpowiada 25-30 godzinom pracy studenta potrzebnej do osiągnięcia zakładanych efektów uczenia się;
  • tygodniowy nakład pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się pozwala uzyskać 1,5 ECTS;
  • nakład pracy potrzebny do zaliczenia przedmiotu, któremu przypisano 3 ECTS, stanowi 10% semestralnego obciążenia studenta.
Język prowadzenia: angielski
Rodzaj przedmiotu:

obowiązkowe

Skrócony opis:

Zajęcia Web Scraping są dedykowane pobieraniu danych z sieci w zautomatyzowany sposób. Dzięki kursowi, studenci zdobędą wiedzę i umiejętności do wydobywania danych z Internetu. Podczas zajęć przedstawione zostaną kluczowe techniki web scrapingu. W szczególności, uczestnicy kursu będą potrafili dobrać adekwatne narzędzia i przygotować program scrapujący stosownie do potrzeb. W ramach zajęć omówione zostaną przede wszystkim aspekty praktyczne web scrapingu. Przedmiot jest realizowany w języku programowania Python w formie laboratorium.

Pełny opis:

Omawiane zagadnienia:

‒ odpowiedzialne scrapowanie & dobre praktyki

‒ struktura stron internetowych

‒ scrapowanie statycznych stron internetowych z użyciem pakietu Beautiful Soup

‒ scrapowanie statycznych stron internetowych z użyciem pakietu Scrapy

‒ scrapowanie statycznych i dynamicznych stron internetowych z użyciem pakietu Selenium

Literatura:

R. Mitchell (2018). Web Scraping with Python: Collecting Data from the Modern Web. 2nd Edition. O’Reilly Media.

Efekty uczenia się:

- Student posiada wiedzę za zakresu web scrapingu

- Student jest zaznajomiony z narzędziami web scrapingu

- Student potrafi wykorzystać wiedzę z zakresu web scrapingu do prowadzenia własnych badań

- Student samodzielnie gromadzi i przetwarza dane

- Student potrafi pracować w grupach projektowych

- Student potrafi formułować i wyrażać swoje poglądy w dyskusji

K_W01, K_U01, K_U02, K_U03, K_U04, K_U05, KS_01, K_U06

Metody i kryteria oceniania:

Oceniane będzie uczestnictwo w zajęciach, przygotowanie prac projektowych (50%), prace domowe (30%) aktywność studentów (20%). Wymagane jest uzyskanie co najmniej 50% punktów. Prace składane są w formie wskazanej przez prowadzących.

Zajęcia w cyklu "Semestr letni 2021/22" (zakończony)

Okres: 2022-02-21 - 2022-06-15
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć:
Laboratorium, 15 godzin więcej informacji
Koordynatorzy: Przemysław Kurek, Jacek Lewkowicz
Prowadzący grup: Przemysław Kurek, Maciej Wysocki
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Zaliczenie na ocenę
Laboratorium - Zaliczenie na ocenę

Zajęcia w cyklu "Semestr letni 2022/23" (jeszcze nie rozpoczęty)

Okres: 2023-02-20 - 2023-06-18
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć:
Laboratorium, 15 godzin więcej informacji
Koordynatorzy: Przemysław Kurek, Jacek Lewkowicz
Prowadzący grup: Przemysław Kurek, Maciej Wysocki
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Zaliczenie na ocenę
Laboratorium - Zaliczenie na ocenę
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Warszawski, Wydział Nauk Ekonomicznych.
ul. Długa 44/50
00-241 Warszawa
tel: +48 22 55 49 126 https://www.wne.uw.edu.pl/
kontakt deklaracja dostępności USOSweb 6.8.0.0-7 (2022-11-16)