Uniwersytet Warszawski, Wydział Nauk Ekonomicznych - Centralny System Uwierzytelniania

NA SKRÓTY
STUDENCI, PRACOWNICY
JEDNOSTKI ORGANIZACYJNE
PRZEDMIOTY
- Natural Language Processing
STUDIA
AKADEMIKI
POMOC

Natural Language Processing

Informacje ogólne

Kod przedmiotu:	4010-NLP
Kod Erasmus / ISCED:	(brak danych) / (0619) Komputeryzacja (inne) Kod ISCED - Międzynarodowa Standardowa Klasyfikacja Kształcenia (International Standard Classification of Education) została opracowana przez UNESCO.
Nazwa przedmiotu:	Natural Language Processing
Jednostka:	Interdyscyplinarne Centrum Modelowania Matematycznego i Komputerowego
Grupy:
Punkty ECTS i inne:	6.00 Podstawowe informacje o zasadach przyporządkowania punktów ECTS: roczny wymiar godzinowy nakładu pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się dla danego etapu studiów wynosi 1500-1800 h, co odpowiada 60 ECTS; tygodniowy wymiar godzinowy nakładu pracy studenta wynosi 45 h; 1 punkt ECTS odpowiada 25-30 godzinom pracy studenta potrzebnej do osiągnięcia zakładanych efektów uczenia się; tygodniowy nakład pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się pozwala uzyskać 1,5 ECTS; nakład pracy potrzebny do zaliczenia przedmiotu, któremu przypisano 3 ECTS, stanowi 10% semestralnego obciążenia studenta.
Język prowadzenia:	angielski
Rodzaj przedmiotu:	fakultatywne
Założenia (opisowo):	Programming basics (recommended language: Python), sufficient English proficiency to understand educational materials.
Tryb prowadzenia:	mieszany: w sali i zdalnie
Skrócony opis:	Celem przedmiotu jest zapoznanie z symulacjami komputerowymi w konkretnej dziedzinie. Wykład obejmuje wprowadzenie do danej dziedziny zastosowań, przedstawienie metod symulacji komputerowych stosowanych w tej dziedzinie oraz bardziej szczegółowe zaprezentowanie wybranych metod obliczeniowych. Szczegółowe treści programowe zawarte są w opisie poszczególnych przedmiotów.
Pełny opis:	Tematyka zajęć: 1. NLP history, regular expressions, wyk. 2 godz., lab. 2 godz. 2. Elementary deep learning, wyk. 8 godz., lab. 10 godz. 3. NLP Libraries (NLTK, TextBlob, spaCy). Basic techniqes (tokenization, stopwords removal), wyk. 2 godz., lab. 2 godz. 4. Word similarity metrics, wyk. 2 godz., lab. 2 godz. 5. Text classification, wyk. 2 godz., lab. 2 godz. 6. Topic modelling, Latent Dirichlet Allocation (LDA), wyk. 2 godz., lab. 2 godz. 7. Topic modelling, other algorithms, wyk. 2 godz., lab. 2 godz. 8. Embeddings, wyk. 2 godz., lab. 2 godz. 9. Text generation, Markov chains, recurrent neural networks, other methods, wyk. 2 godz., lab. 2 godz. 10. Large language models, wyk. 2 godz., lab. 4 godz. 11. Conversational agents, wyk. 4 godz.
Literatura:	1. Zasoby Intel Academy, https://www.intel.com/content/www/us/en/developer/learn/course-natural-language-processing.html (dostęp: 22.08.2024) 2. L. Gazit, M. Ghaffari, Mastering NLP from Foundations to LLMs: Apply advanced rule-based techniques to LLMs and solve real-world business problems using Python, wyd. Packt 2024 3. A. Géron, Hands-On Machine Learning with Scikit-Lear, Keras & TensorFlow, 2nd ed., wyd O’Reilly 2019
Efekty uczenia się:	Wiedza: W1 - Posiada wiedzę umożliwiającą statystyczną analizę tekstu oraz o praktycznych zastosowaniach tej wiedzy w dostępnych narzędziach informatycznych [K_W01, K_W04, K_W05] W2 - Posiada wiedzę o technikach analizy języka naturalnego [K_W02, K_W05] W3 - Posiada wiedzę o sposobach pozyskiwania danych językowych [K_W10] Umiejętności: U1 - Potrafi pozyskiwać informacje dotyczące z przedmiotu z literatury, baz danych oraz innych właściwie dobranych źródeł w języku polskim i angielskim; potrafi integrować uzyskane informacje, dokonywać ich interpretacji i krytycznej oceny, a także wyciągać wnioski oraz formułować i wyczerpująco uzasadniać opinie [K_U01] U2 - Potrafi tworzyć opracowania o charakterze naukowym i popularnym raportujące uzyskane wyniki z zakresu NLP [K_U02, K_U03, K_U04, K_U06] U3 - Potrafi samodzielnie zdobywać wiedzę z zakresu NLP i stosować ją w praktyce [K_U07] U4 - Potrafi stosować narzędzia informatyczne - jak OLAT czy portal Intel Academy - do komunikacji z innymi i pozyskiwania wiedzy [K_U09] U5 - Potrafi ocenic przydatność i możliwość wykorzystania nowych rozwiązań programistycznych w zakresie NLP [K_U012] U6 - Potrafi dokonać analizy problemu obliczeniowego z zakresu NLP i określić przydatne do jego rozwiązania metody obliczeniowe [K_U17] U7 - Potrafi wykorzystać biblioteki stosowane w aplikacjach NLP (jak NLTK, spaCy) [K_U19] U8 - Potrafi wykorzystać istniejące rozwiązania NLP do implementacji bardziej złożonych systemów przetwarzających język naturalny [K_U20] Kompetencje społeczne: K1 - Absolwent jest gotów myśleć twórczo w celu analizy dostępnych danych - zwłaszcza o dużym wolumenie - i tworzenia nowych wykorzystujących je rozwiązań [K_K03, K_K04] K2 - Jest nastawiony na jak najlepsze wykonanie zadania; dba o szczegół; jest systematyczny, zwłaszcza w zakresie samokształcenia; jest gotów samodzielnie identyfikować i analizować źródła wiedzy [K_K05, K_K07, K_K09]
Metody i kryteria oceniania:	The final grade for the course is based on the project’s assessment (weight - 60%) and the exam (weight - 40%). Project Information: The project involves preparing a classifier model based on a dataset provided during the course. The student is required to submit the source code and the evaluation results of the model in written form. The following elements of the solution are taken into account: 1. Exploratory data analysis, 2. Selection and justification of the data representation method, 3. Analysis of the applicability of the chosen machine learning model, including a choice of hyperparameters, 4. The achieved result in terms of the f1 score, 5. Late submission of the assignment (up to one week past the deadline set at the beginning of the course) will be reflected in the final grade. The exam will be conducted in the form of a test. NOTE 1. A medical certificate does not exempt the student from knowing the material. It only entitles them to an individualized form of assessment. 2. Students that have received approval for an individual study plan are required to contact the course coordinator to determine how to achieve all the learning outcomes assigned to the course. If it is not possible to achieve the aforementioned outcomes, the coordinator may refuse to grant credit for the course. 3. Classes attendance is mandatory. In cases of justified absences, the student must promptly contact the course coordinator.

Zajęcia w cyklu "Semestr zimowy 2024/25" (zakończony)

Okres:	2024-10-01 - 2025-01-26	Wybrany podział planu: tygodniowy cykl przedmiotu Przejdź do planu PN WT ŚR CZ PT
Typ zajęć:	Laboratorium, 30 godzin więcej informacji Wykład, 30 godzin więcej informacji
Koordynatorzy:	Łukasz Górski
Prowadzący grup:	Łukasz Górski, Franciszek Rakowski
Lista studentów:	(nie masz dostępu)
Zaliczenie:	Egzamin
Rodzaj przedmiotu:	fakultatywne
Tryb prowadzenia:	mieszany: w sali i zdalnie

Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Warszawski, Wydział Nauk Ekonomicznych.