Zpět

Týdenní škola data miningu – od dat k rozhodnutí

  • Termín: Bude upřesněn
  • Místo:

Počet výukových dnů:
5 (40 výukových hodin)

Úroveň kurzu:
základní

Dataminingové postupy umožňují vytěžit z elektronických dat důležitých vzorů chování, které jsou využitelné pro cílené rozhodování o zákaznících, pacientech, strojích, úvěrech apod. Datamining není jen aplikace sofistikovaných modelovacích postupů na hledání klíčových vzorů v datech, ale zahrnuje celou řadu dílčích kroků od specifikace cílů, přes manipulace s daty až po úspěšné nasazení řešení do provozu. Výuka data miningu je proto členěna podle standardní dataminingové metodologie CRISP-DM. Kurz provede účastníky jednotlivými fázemi této metodologie a představí standardní dataminingové úlohy.

Cíl vzdělávacího programu:

Cílem kurzu je seznámit účastníky s dataminingovými postupy a předat jim zkušenosti expertů ACREA CR v této oblasti. Během výuky jsou prezentovány typické úlohy a situace. Účastníci se naučí formulovat a strukturovat vlastní úlohy a plánovat dataminingový projekt. Důraz je kladen na praktické procvičení klíčových postupů a na modelování. Procvičování bude probíhat na softwaru IBM SPSS Modeler, který se účastníci naučí během kurzu ovládat na střední úrovni.

Kurz je určen:

  • manažerům, kteří mají zájem zefektivnit firemní procesy pomocí dataminingových modelů
  • specialistům, kteří připravují modely
  • datovým analytikům
  • IT specialistům.

Předpoklady:

Základní znalosti a zkušenosti z oblasti analýzy dat. Uživatelská znalost softwaru se nepředpokládá.

Přínos účasti na kurzu:

Účastníci se naučí dovednosti potřebné k úspěšné realizaci dataminingového projektu vedeného podle metodologie CRISP-DM. Budou schopni plánovat projekt, přistoupit k datům, auditovat je a připravit si modelovací matici. Porozumí základním principům často užívaných dataminingových modelů, naučí se ohodnotit jejich přínosy a budou vědět, jakým způsobem se celé řešení zavádí do praxe. Navíc díky cvičením budou umět ovládat dataminingový software IBM SPSS Modeler.

Popis obsahu a postupu:

Kurz je vyučován za podpory softwaru IBM SPSS Modeler, který pokrývá všechny fáze dataminingového projektu. Výuka je členěna dle metodologie CRISP-DM. Všechny probírané postupy jsou procvičovány na konkrétních datech a úlohách.

Program kurzu*:

  1. role data miningu a typické úlohy
  2. metodologie CRISP DM a strukturování dataminingového projektu
    • formulace úlohy
    • analýza dat
    • datové manipulace
    • modelování
    • evaluace řešení
    • integrace do firemních procesů
  3. vizuální zadávání postupů v softwaru IBM SPSS Modeler
  4. interaktivní grafická analýza
  5. analýza kvality dat, datový audit
  6. transparentní příprava dat pro modelování
    • spojování datových souborů a konstrukce modelovací matice
    • úpravy datové matice před modelováním
  7. principy hlavních modelovacích metod v data miningu
    • neuronové sítě
    • regresní metody
    • rozhodovací stromy
    • seskupovací postupy
    • asociační pravidla
  8. zhodnocení přínosů dataminingových modelů
  9. integrace dataminingových postupů do firemních procesů

*​ Ve výjimečných případech změna programu vyhrazena dle zaměření a zkušeností dané skupiny účastníků.

Používaný software:

IBM SPSS Modeler Professional.