Zpět

IBM® SPSS® MODELER: Příprava dat pro modelování

  • Termín: Bude upřesněn
  • Místo: Praha
Cena:
  • 15400 Kč + DPH
  • 560 € + DPH

Počet výukových dnů:
3 (24 výukových hodin)

Výuka probíhá v jazyce:
čeština

Úroveň kurzu:
základní

Příprava dat je nutnou podmínkou jakékoli následné analýzy. Chybná nebo nekvalitní příprava má za následek chybné závěry či nevhodné modely. V dataminingové metodologii CRISP-DM je přípravě dat věnována jedna fáze, kterou uživatelé hodnotí jako časově nejnáročnější. V praxi neexistují data, která by nevyžadovala žádné úpravy před analýzou a modelováním. Typické operace ve fázi přípravy dat zahrnují slučování zdrojů, agregování, restrukturalizaci, prosté i sekvenční odvozování atributů, formátování, výběry, doplňování vynechaných hodnot či hledání duplicit. Ačkoli lze mnohé operace zapsat v SQL nebo nějakém programovacím jazyce, tento přístup je časově náročný, nepřehledný a odvádí pozornost dataminera od cíle projektu.

Kurz data miningu jsem zvolil, abych doplnil své znalosti z oblasti statistiky. Tempo výuky bylo naprosto odpovídající a vyhovovalo myslím všem účastníkům nehledě na odlišnou vstupní úroveň. Poznatky kurzu rozhodně využiji pro automatizovanou úpravu dat do formátu potřebného ke statistické analýze.

Ing. Michal Jirásek
Masarykova univerzita
Ekonomicko-správní fakulta

Cíl vzdělávacího programu:

Cílem kurzu je naučit účastníky připravovat si data pomocí vizuálního programování v prostředí IBM SPSS Modeler. Naučí se pracovat s procesními uzly tohoto softwaru, osvojí si i speciální manipulační funkce jazyka CLEM. Společně s přípravou dat se budeme věnovat i jejich vizualizaci, neboť interaktivní grafika IBM SPSS Modeler umožňuje generovat mnoho datových manipulací ad hoc přímo z grafů.

Kurz je určen:

Kurz je určen pro analytiky, dataminery a datové specialisty, kteří budou pro svou práci používat nebo používají software IBM SPSS Modeler.

Předpoklady:

Pro úspěšné absolvování kurzu postačí uživatelská znalost práce na počítači, ovládat software IBM SPSS Modeler se účastníci naučí na kurzu.

Přínos účasti na kurzu:

Účastníci budou umět používat uzly datových manipulací v softwaru IBM SPSS Modeler. Naučí se připojit na datové zdroje, analyzovat kvalitu dat, sloučit zdroje do modelovací matice a data upravit tak, aby poskytovala kvalitní vstup pro modelovací metody.

Popis obsahu a postupu:

Kurz probíhá v softwaru IBM SPSS Modeler. Systematicky jsou probírány datové manipulace, které tento software nabízí.

Program kurzu*:

  1. datové formáty a přístup k datům, ODBC
  2. vizuální programování
  3. uzly IBM SPSS Modeler pro práci se záznamy (Record Operations)
  4. uzly IBM SPSS Modeler pro práci s proměnnými (Field Operations)
  5. zápis manipulačních formulí v jazyce CLEM
  6. datový audit a interaktivní výstupy IBM SPSS Modeler

* Ve výjimečných případech změna programu vyhrazena dle zaměření a zkušeností dané skupiny účastníků.

Používaný software:

IBM SPSS Modeler Professional.