To jest strona domowa przedmiotu Zaawansowane uczenie maszynowe (ZUM) prowadzonego na Wydziale Elektroniki i Technik Informacyjnych Politechniki Warszawskiej. Można tu znaleźć informacje organizacyjne oraz materiały pomocnicze.
Komentarze na temat zawartości tej strony i inne uwagi dotyczące przedmiotu proszę kierować pocztą.
Przedmiot kierowany jest do studentów studiów magisterskich, którzy mieli już wcześniej pierwszy kontakt z elementami teorii i podstawowymi algorytmami uczenia maszynowego. Ma on na celu poszerzenie oraz pogłębienie ich wiedzy w tym zakresie. Da on także okazję do zdobycia doświadczeń praktycznych dotyczących implementacji i stosowania algorytmów uczenia maszynowego do tworzenia modeli predykcyjnych. Zakres przedmiotu obejmuje wybrane nie-neuronowe algorytmy uczenia się stosowane do danych tabelarycznych. Bardziej szczegółowe informacje zawiera oficjalny konspekt przedmiotu.
Przedmiot jest kontynuacją przedmiotu Uczenie maszynowe (UMA), który jest prowadzony na studiach inżynierskich, lecz pełna rozłączność zakresów wykładów i eliminacja "przypominania" wybranych elementów treści UMA nie jest możliwa, gdyż wcześniejsza realizacja UMA nie jest ściśle wymagana.
Przedmiot nie jest realizowany w semestrze 24Z.
Ocena z przedmiotu ustalana jest na podstawie:
Informacje o projekcie zostaną ogłoszone do końca trzeciego tygodnia semestru.
W kwestiach związanych z interpretacją tematów, zakresem wymagań oraz ewentualnych materiałów pomocniczych do projektu proszę zwracać się wyłącznie do odpowiednich prowadzących projekt.
Wykład | Temat |
1 | Informacje organizacyjne i wprowadzenie. |
2-4 | Przegląd/przypomnienie elementów teorii (PAC-uczenie, wymiar VC) i podstawowych algorytmów (drzewa decyzyjne, naiwny klasyfikator bayesowski, modele liniowe, las losowy, SVM, ocena jakości modeli). |
5 | Drugie spojrzenie na drzewa decyzyjne (przycinanie, obsługa brakujących wartości atrybutów, drzewa regresji, drzewa modeli). |
6-7 | Drugie spojrzenie na naiwny klasyfikator bayesowski (model
wielomianowy, model dopełnieniowy). Drugie spojrzenie na modele liniowe (logarytm wiarygodności, regresja logistyczna, kalibracja predykcji probabilistycznych, regularyzacja). Drugie spojrzenie na algorytm SVM (postać dualna, funkcje jądrowe, SVM do regresji). |
8 | Kolokwium 1. |
9 | Drugie spojrzenie na modele zespołowe (bagging, boosting). |
10 | Koszty pomyłek, nierównoważone klasy, drugie spojrzenie na ocenę jakości modeli (dodatkowe miary jakości, procedury oceny, kryteria informacyjne). |
11 | Drugie spojrzenie na zadanie klasyfikacji (klasyfikacja wieloetykietowa, aktywne uczenie się, półnadzorowane uczenie się). |
12 | Grupowanie (k-środków, gęstościowe, ocena jakości). |
13 | Detekcja anomalii (klasyfikacja jednoklasowa, niepodobieństwo do sąsiadów, niepodobieństwo do grup). |
14 | Selekcja i transformacja atrybutów. |
15 | Kolokwium 2. |
Po każdym wykładzie będą tu zamieszczane slajdy odpowiadające jego treści.
Udostępniam również wstępne robocze wersje slajdów do przyszłych wykładów, należy jednak brać pod uwagę, że mogą być do nich jeszcze wprowadzane zmiany (poprawki, uzupełnienia, przesunięcia materiału).
W trakcie semestru będą tu udostępniane ćwiczenia do (większości) wykładów, mające na celu ułatwienie weryfikacji zrozumienia ich treści i przygotowania się do kolokwiów.
Jako zachętę do zapoznania się z właściwościami R jako języka programowania zamieszczam tu przykładowe pliki źródłowe ilustrujące niektóre z tych właściwości.
Literatura dotycząca szczegółowych zagadnień, w tym zwłaszcza tematów projektu, rekomendowana jest indywidualnie w ramach konsultacji. Tutaj zamieszczam tylko nieliczne wybrane książki, których zakres tematyczny w znacznym stopniu jest zgodny z zakresem przedmiotu.