Text mining w języku Python
Informacje ogólne
Kod przedmiotu: | 2400-ZEWW853 |
Kod Erasmus / ISCED: |
14.3
|
Nazwa przedmiotu: | Text mining w języku Python |
Jednostka: | Wydział Nauk Ekonomicznych |
Grupy: |
Przedmioty kierunkowe do wyboru - studia II stopnia EM - grupa 2 (1*30h) Przedmioty kierunkowe do wyboru - studia II stopnia EP - grupa 4 (1*30h) Przedmioty kierunkowe do wyboru - studia II stopnia IE - grupa 2 (2*30h) Przedmioty kierunkowe do wyboru- studia I stopnia EP Przedmioty wyboru kierunkowego dla studiów licencjackich EM Przedmioty wyboru kierunkowego dla studiów licencjackich IE Przedmioty wyboru kierunkowego dla studiów licencjackich MSEM Przedmioty wyboru kierunkowego dla studiów licencjackich MSEMen |
Punkty ECTS i inne: |
3.00
|
Język prowadzenia: | polski |
Rodzaj przedmiotu: | nieobowiązkowe |
Założenia (opisowo): | Uczestnictwo w zajęciach “Wprowadzenie do programowania w języku Python” lub w innym kursie z zbliżonym programem |
Skrócony opis: |
W ramach zajęć studentki i studenci poznają podstawowe metody przetwarzania języka naturalnego oraz text-miningu. Nabyte umiejętności umożliwią im samodzielną pracę z wykorzystaniem metod data science na studiach magisterskich lub na przedmiocie „Nowe technologie i wyzwania społeczne”. |
Pełny opis: |
- Przegląd zastosowań języka Python: pozyskiwanie danych, analiza, wizualizacja - Przegląd metod Natural Language Processing - Regular expressions - Tokenizacja słów, stemming, n-gramy, lematyzacja - Tagowanie części mowy - Klasyfikacja tekstu - Analiza sentymentu - Wektory TF-IDF - Analiza Semantyczna, modelowanie tematyczne (LSA, LDA, PCA) - Wykorzystanie sieci neuronowych w text-miningu - Wektory słów: Word2Vec - Klastrowanie tekstów z wykorzystaniem algorytmu t-SNE - Konsultacje wyboru tematu i metodologii do case study - Prezentacja case study wykorzystującego wybraną technikę poznaną w trakcie kursu (2 zajęcia) |
Literatura: |
Zajęcia opierać się będą na materiałach przygotowanych przez prowadzącego lub źródłach internetowych. Literatura obowiązkowa nie jest przewidziana. |
Efekty uczenia się: |
WIEDZA - Student zna popularne zastosowania języka Python w różnych obszarach badawczych - Student zna podstawowe biblioteki służące do analizy tekstu w języku Python - Student zna popularne metody analizy tekstu stosowane przy użyciu języka Python - Student zna najważniejsze techniki wizualizacji danych UMIEJĘTNOŚCI - Student potrafi stworzyć i zarządzać bazą danych w języku Python - Student umie przeanalizować duży zbiór tekstowy przy użyciu technik text miningowych - Student umie sprawnie wizualizować dane z wykorzystaniem dobrych praktyk prezentacji KOMPETENCJE SPOŁECZNE - Student jest zaznajomiony z zasadami etycznego oraz legalnego przetwarzania danych |
Metody i kryteria oceniania: |
Prezentacja końcowa |
Zajęcia w cyklu "Semestr letni 2022/23" (w trakcie)
Okres: | 2023-02-20 - 2023-06-18 |
![]() |
Typ zajęć: |
Konwersatorium, 30 godzin
|
|
Koordynatorzy: | Katarzyna Śledziewska | |
Prowadzący grup: | Kristóf Gyódi | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: |
Przedmiot -
Zaliczenie na ocenę
Konwersatorium - Zaliczenie na ocenę |
Właścicielem praw autorskich jest Uniwersytet Warszawski, Wydział Nauk Ekonomicznych.