Natural Language Processing
Informacje ogólne
Kod przedmiotu: | 4010-NLP |
Kod Erasmus / ISCED: |
(brak danych)
/
(0619) Komputeryzacja (inne)
|
Nazwa przedmiotu: | Natural Language Processing |
Jednostka: | Interdyscyplinarne Centrum Modelowania Matematycznego i Komputerowego |
Grupy: | |
Punkty ECTS i inne: |
6.00
|
Język prowadzenia: | angielski |
Rodzaj przedmiotu: | fakultatywne |
Założenia (opisowo): | Programming basics (recommended language: Python), sufficient English proficiency to understand educational materials. |
Tryb prowadzenia: | mieszany: w sali i zdalnie |
Skrócony opis: |
Celem przedmiotu jest zapoznanie z symulacjami komputerowymi w konkretnej dziedzinie. Wykład obejmuje wprowadzenie do danej dziedziny zastosowań, przedstawienie metod symulacji komputerowych stosowanych w tej dziedzinie oraz bardziej szczegółowe zaprezentowanie wybranych metod obliczeniowych. Szczegółowe treści programowe zawarte są w opisie poszczególnych przedmiotów. |
Pełny opis: |
Tematyka zajęć: 1. NLP history, regular expressions, wyk. 2 godz., lab. 2 godz. 2. Elementary deep learning, wyk. 8 godz., lab. 10 godz. 3. NLP Libraries (NLTK, TextBlob, spaCy). Basic techniqes (tokenization, stopwords removal), wyk. 2 godz., lab. 2 godz. 4. Word similarity metrics, wyk. 2 godz., lab. 2 godz. 5. Text classification, wyk. 2 godz., lab. 2 godz. 6. Topic modelling, Latent Dirichlet Allocation (LDA), wyk. 2 godz., lab. 2 godz. 7. Topic modelling, other algorithms, wyk. 2 godz., lab. 2 godz. 8. Embeddings, wyk. 2 godz., lab. 2 godz. 9. Text generation, Markov chains, recurrent neural networks, other methods, wyk. 2 godz., lab. 2 godz. 10. Large language models, wyk. 2 godz., lab. 4 godz. 11. Conversational agents, wyk. 4 godz. |
Literatura: |
1. Zasoby Intel Academy, https://www.intel.com/content/www/us/en/developer/learn/course-natural-language-processing.html (dostęp: 22.08.2024) 2. L. Gazit, M. Ghaffari, Mastering NLP from Foundations to LLMs: Apply advanced rule-based techniques to LLMs and solve real-world business problems using Python, wyd. Packt 2024 3. A. Géron, Hands-On Machine Learning with Scikit-Lear, Keras & TensorFlow, 2nd ed., wyd O’Reilly 2019 |
Efekty uczenia się: |
Wiedza: W1 - Posiada wiedzę umożliwiającą statystyczną analizę tekstu oraz o praktycznych zastosowaniach tej wiedzy w dostępnych narzędziach informatycznych [K_W01, K_W04, K_W05] W2 - Posiada wiedzę o technikach analizy języka naturalnego [K_W02, K_W05] W3 - Posiada wiedzę o sposobach pozyskiwania danych językowych [K_W10] Umiejętności: U1 - Potrafi pozyskiwać informacje dotyczące z przedmiotu z literatury, baz danych oraz innych właściwie dobranych źródeł w języku polskim i angielskim; potrafi integrować uzyskane informacje, dokonywać ich interpretacji i krytycznej oceny, a także wyciągać wnioski oraz formułować i wyczerpująco uzasadniać opinie [K_U01] U2 - Potrafi tworzyć opracowania o charakterze naukowym i popularnym raportujące uzyskane wyniki z zakresu NLP [K_U02, K_U03, K_U04, K_U06] U3 - Potrafi samodzielnie zdobywać wiedzę z zakresu NLP i stosować ją w praktyce [K_U07] U4 - Potrafi stosować narzędzia informatyczne - jak OLAT czy portal Intel Academy - do komunikacji z innymi i pozyskiwania wiedzy [K_U09] U5 - Potrafi ocenic przydatność i możliwość wykorzystania nowych rozwiązań programistycznych w zakresie NLP [K_U012] U6 - Potrafi dokonać analizy problemu obliczeniowego z zakresu NLP i określić przydatne do jego rozwiązania metody obliczeniowe [K_U17] U7 - Potrafi wykorzystać biblioteki stosowane w aplikacjach NLP (jak NLTK, spaCy) [K_U19] U8 - Potrafi wykorzystać istniejące rozwiązania NLP do implementacji bardziej złożonych systemów przetwarzających język naturalny [K_U20] Kompetencje społeczne: K1 - Absolwent jest gotów myśleć twórczo w celu analizy dostępnych danych - zwłaszcza o dużym wolumenie - i tworzenia nowych wykorzystujących je rozwiązań [K_K03, K_K04] K2 - Jest nastawiony na jak najlepsze wykonanie zadania; dba o szczegół; jest systematyczny, zwłaszcza w zakresie samokształcenia; jest gotów samodzielnie identyfikować i analizować źródła wiedzy [K_K05, K_K07, K_K09] |
Metody i kryteria oceniania: |
The final grade for the course is based on the project’s assessment (weight - 60%) and the exam (weight - 40%). Project Information: The project involves preparing a classifier model based on a dataset provided during the course. The student is required to submit the source code and the evaluation results of the model in written form. The following elements of the solution are taken into account: 1. Exploratory data analysis, 2. Selection and justification of the data representation method, 3. Analysis of the applicability of the chosen machine learning model, including a choice of hyperparameters, 4. The achieved result in terms of the f1 score, 5. Late submission of the assignment (up to one week past the deadline set at the beginning of the course) will be reflected in the final grade. The exam will be conducted in the form of a test. NOTE 1. A medical certificate does not exempt the student from knowing the material. It only entitles them to an individualized form of assessment. 2. Students that have received approval for an individual study plan are required to contact the course coordinator to determine how to achieve all the learning outcomes assigned to the course. If it is not possible to achieve the aforementioned outcomes, the coordinator may refuse to grant credit for the course. 3. Classes attendance is mandatory. In cases of justified absences, the student must promptly contact the course coordinator. |
Zajęcia w cyklu "Semestr zimowy 2024/25" (zakończony)
Okres: | 2024-10-01 - 2025-01-26 |
Przejdź do planu
PN WT ŚR CZ PT |
Typ zajęć: |
Laboratorium, 30 godzin
Wykład, 30 godzin
|
|
Koordynatorzy: | Łukasz Górski | |
Prowadzący grup: | Łukasz Górski, Franciszek Rakowski | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: | Egzamin | |
Rodzaj przedmiotu: | fakultatywne |
|
Tryb prowadzenia: | mieszany: w sali i zdalnie |
Właścicielem praw autorskich jest Uniwersytet Warszawski, Wydział Nauk Ekonomicznych.