Zpět

Klasifikační a asociační stromy

  • Termín: 4. 6. 2018
  • Místo: Praha
Cena:
  • 5600 Kč + DPH
  • 200 € + DPH

Počet výukových dnů:
1 (8 vyučovacích hodin)

Výuka probíhá v jazyce:
čeština

Úroveň kurzu:
středně pokročilý

Metoda klasifikačních či asociačních stromů je založena na postupném členění případů do stejnorodých skupin na základě jejich vlastností. Při použití metody se volí cílová vlastnost případů, která má být ve skupinách homogenní. Nejčastěji je predikována příslušnost případu k určité kategorii -  zákazníci se například stromem rozdělí do skupin podle zájmu o konkrétní produkt. Strom nejen případy rozdělí do skupin, ale zjistí také, co příslušnost ke skupině určuje.

Cíl vzdělávacího programu:

Cílem kurzu je seznámit posluchače s principy vytváření klasifikačních stromů, s jejich aplikacemi a poskytnout znalosti potřebné k vytváření stromů. Látka bude ilustrována a procvičována na praktických příkladech. Posluchači získají dostatečné znalosti pro samostatné vytváření klasifikačních stromů.

Kurz je určen:

Kurz je vhodný pro každého, kdo pracuje s případy (např. osoby, předměty), které jsou rozčleněny do kategorií. Klasifikační stromy mu pomohou zjistit, proč případ do dané kategorie patří, a určit, do které kategorie přiřadit nový případ a předpovědět jeho chování. Kategorizované případy se vyskytují zejména:

  • v marketingu, kde kategoriemi je např. odchod nebo setrvání zákazníka, zájem nebo nezájem o produkt atd.,
  • pojišťovnictví, kde se pojistné plnění třídí například na nepochybné, podezřelé a s vysokým rizikem podvodu,
  • v bankovnictví, kde kategorie tvoří míra problému se splácením,
  • ve státní sféře, kde se kontroluje např. oprávněnost žádostí od dotace.

Předpoklady:

U účastníků kurzu se předpokládá znalost typů statistických proměnných, základních statistických pojmů a frekvenční analýzy. Vhodná, ale ne nutná, je znalost kontingenčních tabulek.

Přínos účasti na kurzu:

Účastník kurzu se seznámí s obecným principem tvorby klasifikačních stromů. Konkrétně jsou probírány široce použitelné algoritmy CHAID a CART. Účastník se dozví o teoretických základech algoritmů a budou je umět používat pro řešení konkrétních úloh ze své praxe.

Popis obsahu a postupu:

Na kurzu je nejprve představena základní myšlenka a princip klasifikačních stromů. Následuje podrobnější popis zvolených algoritmů a vysvětlení jejich parametrů. Těžištěm kurzu je pak práce s modely nad daty a seznámení se se s běžnými problémy, které v reálných datech nastávají, a jejich řešením. V této části se účastníci zapojí do aktivní práce s daty a budování modelů.

Program kurzu*:

  1. kontingenční tabulky a ANOVA
  2. obecné principy klasifikačních stromů
  3. algoritmus CHAID
  4. algoritmus CART
  5. klasifikace případů
  6. vyhodnocení modelu, tréningová a testovací množina
  7. rozšířené možnosti algoritmů (ztrátová matice, chybějící hodnoty)
  8. skórování

* Ve výjimečných případech změna programu vyhrazena dle zaměření a zkušeností dané skupiny účastníků.

Používaný software:

IBM SPSS Statistics Base, IBM SPSS Decision Trees