Zpět

Dataminingové modely: Rozhodovací stromy

  • Termín: Bude upřesněn
  • Místo:

Počet výukových dnů:
1 (8 vyučovacích hodin)

Úroveň kurzu:
středně pokročilý

Rozhodovací stromy se staly oblíbenými dataminingovými modelovacími algoritmy díky své transparentnosti a robustnosti. Rozhodovací strom je tvořen soustavou návazných hierarchických pravidel, což u nevelkých stromů umožňuje snadnou interpretaci rozhodovacího procesu. Rozhodovací stromy nejsou náročné na přípravu dat, zpravidla umí i zpracovávat vynechané hodnoty. Díky svým vlastnostem se rozhodovací stromy používají v data miningu nejen jako predikční modely, ale i jako nástroje pro nahrazování vynechaných hodnot, výběr vstupních proměnných a optimální kategorizaci.

Cíl vzdělávacího programu:

Cílem kurzu je seznámit účastníky s principy, vytvářením a používáním rozhodovacích stromů v data miningu. Během kurzu budou popsány některé algoritmy a vylepšení, kterými se rozhodovací stromy doplňují, např. penalizace chyb či prořezávání. Konkrétních algoritmů na vytváření stromů existuje velké množství, v kurzu jsou prezentovány dva: CHAID a CaRT. Kromě samostatných stromů se v data miningu používají i rozhodovací lesy. Při výuce budou prezentovány postupy kombinování stromů do rozhodovacích lesů.

Kurz je určen:

Kurz je určen analytikům, marketingovým pracovníkům a dataminerům, kteří chtějí vytvářet snadno interpretovatelné a robustní dataminingové modely.

Předpoklady:

Pro úspěšné absolvování kurzu postačí uživatelská znalost práce na počítači. Jako úvod do problematiky data miningu doporučujeme kurz Data mining – dolování znalostí z databází.

Přínos účasti na kurzu:

Účastníci budou po kurzu schopni využívat rozhodovací stromy jako dataminingové predikční modely a interpretovat je.

Popis obsahu a postupu:

Kurz probíhá za podpory softwaru IBM SPSS Modeler. Po teoretickém úvodu do metody a představení používaných algoritmů si účastníci prakticky vyzkouší budování, interpretaci, evaluaci a nasazení rozhodovacích stromů a lesů.

Program kurzu*:

  1. principy vytváření a interpretace rozhodovacích stromů
  2. záznam stromů a jejich přepis na rozhodovací pravidla
  3. predikce pomocí stromů
  4. přesnost a obecnost
  5. prořezávání stromů
  6. penalizace chyb
  7. algoritmy CHAID a CaRT
  8. evaluační statistiky a grafy
  9. rozhodovací lesy

* Ve výjimečných případech změna programu vyhrazena dle zaměření a zkušeností dané skupiny účastníků.

Používaný software:

IBM SPSS Modeler Professional