Zpět

Dataminingové modely: Asociační pravidla a analýza sekvencí

  • Termín: Bude upřesněn
  • Místo:

Počet výukových dnů:
1 (8 vyučovacích hodin)

Úroveň kurzu:
středně pokročilý

Asociační pravidla nabízejí velmi přehledný zápis užitečných vzorů chování nalezených v datech. Hledání a filtrování asociačních pravidel je jeden z nejstarších dataminingových postupů, proto současné implementace algoritmů nabízejí uživatelům mnoho prověřených doplňků a vylepšení. Asociační pravidla představují predikční model zapsaný formou implikací s pravděpodobnostní interpretací. Každá implikace je doplněna vhodnými statistikami, které zvyšují její informační hodnotu a umožňují implikace třídit a vybírat. Sekvenční pravidla představují speciální variantu asociačních pravidel, kdy se v předpokladech implikací objevují časově uspořádané vzory chování.

Cíl vzdělávacího programu:

Cílem kurzu je seznámit účastníky s metodami extrakce asociačních a sekvenčních pravidel z transakčních dat. Kurz provede účastníky celým procesem extrakce a využití pravidel a sekvencí, který zahrnuje restrukturalizaci dat, redukci dimenzionality, vizualizaci, extrakci a filtrování pravidel, využití modelů pro predikce.

Kurz je určen:

Kurz je určen analytikům a dataminerům, kteří chtějí přehledně zaznamenat nalezené vzory chování v datech ve formě seznamu pravidel a případně je využít jako predikční modely.

Předpoklady:

Pro úspěšné absolvování kurzu postačí uživatelská znalost práce na počítači a znalost matematiky na středoškolské úrovni. Jako úvod do problematiky data miningu doporučujeme kurz Data mining – dolování znalostí z databází.

Přínos účasti na kurzu:

Po absolvování kurzu budou účastníci schopni extrahovat, evaluovat a prakticky využít asociační a sekvenční pravidla ukrytá v transakčních datech. Naučí se pravidlům porozumět a vybrat z velkého souboru nalezených závislostí ty podstatné pro řešení dané úlohy.

Popis obsahu a postupu:

První část kurzu nabízí teoretický úvod do metod extrakce a filtrování pravidel. V druhé praktické části si účastníci vyzkouší analytický postup práce od přípravy dat až po využití nalezených pravidel. Procvičování probíhá v softwaru IBM SPSS Modeler, jehož uživatelská znalost není nezbytná.

Program kurzu*:

  1. transakční a sekvenční data
  2. restrukturalizace, redukce dimensionality
  3. záznam asociací v síťovém grafu
  4. asociační pravidla a jejich statistiky
  5. filtrování pravidel
  6. algoritmus APRIORI
  7. využití pravidel k predikci
  8. evaluace predikčního modelu
  9. sekvenční pravidla

* Ve výjimečných případech změna programu vyhrazena dle zaměření a zkušeností dané skupiny účastníků.

Používaný software:

IBM SPSS Modeler Professional.