Zpět

Data: Čištění, váhy, vynechané hodnoty

  • Termín: Bude upřesněn
  • Místo:

Počet výukových dnů:
2 dny (16 výukových hodin)

Úroveň kurzu:
pokročilý

Příprava datového souboru je nutným krokem, který předchází každé analýze dat a zásadním způsobem ovlivňuje kvalitu získaných závěrů. Program kurzu se zaměřuje na tři základní okruhy problémů:

Kurz byl profesionálně veden zkušenou lektorkou a tempo vyhovovalo všem zúčastněným.

Ing. Josef Richtr
Statistika, Databáze
Národní informační a poradenské středisko pro kulturu (NIPOS)

  • příprava datové matice a čištění dat
  • zajištění reprezentativnosti souboru a konstrukce vah
  • problém vynechaných hodnot.

Cíl vzdělávacího programu:

Kurz provede účastníky základními fázemi přípravy datového souboru.  Ukážeme Vám, jak ověřovat kvalitu a provádět čištění dat. Seznámíme Vás se způsoby monitorování struktury chybějících hodnot a získáte přehled o metodách a možnostech řešení tohoto problému. Zaměříme se na různé typy vah a zajištění reprezentativnosti souboru.

Kurz je určen:

Kurz je adresován všem, kteří se chtějí naučit správně připravit datový soubor tak, aby získali kvalitní závěry svých analýz a zároveň si usnadnili a zjednodušili další práci. Tyto zkušenosti využijí zaměstnanci marketingu, pracovníci výzkumných firem, analytici bank nebo pojišťoven i ostatní analytici a výzkumníci, kteří zpracovávají data z výběrových šetření nebo databází.

Předpoklady:

Kurz předpokládá orientaci v základních statistických metodách (popisná a konfirmační statistika, lineární regrese) na úrovni kurzu Základy statistiky pro analýzu dat. Rovněž doporučujeme určitou předchozí zkušenost s analýzou dat v IBM SPSS Statistics.

Přínos účasti na kurzu:

Účastníci získají teoretický základ k probíraným tématům a zároveň si vše vyzkouší na praktických úlohách v IBM SPSS Statistics.

Popis obsahu a postupu:

Výuka základních postupů a metod přípravy datového souboru za podpory programového systému IBM SPSS Statistics (moduly IBM SPSS Statistics Base, IBM SPSS Missing Values, IBM SPSS Data Preparation).

Program kurzu*:

  1. datový soubor a jeho popis (popis proměnných a hodnot, typy proměnných …), příprava datového souboru, zjednodušení a automatizace postupů
  2. přebírání dat z různých formátů, spojování souborů, základní transformace a datové manipulace
  3. ověřování kvality a čištění dat
  4. problém chybějících hodnot, zjišťování struktury chybějících hodnot, imputace
  5. reprezentativnost výběru
  6. vážení souboru a různé typy vah

* Ve výjimečných případech změna programu vyhrazena dle zaměření a zkušeností dané skupiny účastníků.

Používaný software:

IBM SPSS Statistics Base, IBM SPSS Missing Values, IBM SPSS Data Preparation