Kategorie: Analýza dat

Falešná korelace

Jak spolu souvisí smrt a sýr… V tomto článku si povíme o něčem, co je známo pod pojmem falešná či nepravá korelace (anglicky spurious correlation). Korelační koeficient udává míru asociace mezi dvěma číselnými proměnnými. Jedná se o číslo z intervalu <-1, 1>. Pokud se korelace...

Celý článek

Bayesovská analýza dat

Baeysovská statistika má své kořeny poměrně hluboké a dávné. Vždyť slavné pojednání reverenda Bayese (1763), které obsahuje Bayesův teorém vyšlo již před více než 250 lety. Od té doby lze datovat rozvoj statistiky, které dnes říkáme dle jejího zakladatele bayesovská či...

Celý článek

Segmentace, retence a churn v praxi

Udržení stávajících klientů je jednou z klíčových úloh prosperujícího podnikání. Zvlášť v době, kdy nelze kvůli hrozbě obrovských sankcí vyplývajících z GDPR jednoduše oslovovat zákazníky tak, jak jsme byli zvyklí. V minulosti jsme často jednoduše oslovili emailem celý zákaznický kmen a s ničím jsme si...

Celý článek

Diskriminační analýza: možnosti neprávem opomíjené techniky

Diskriminační analýza je jednou z nejstarších technik vícerozměrné analýzy dat. Díky tomu by mohla být velice rozšířená, ale opak je pravdou. Většina učebnic i výukových kurzů ji směle ignoruje, přitom jde o techniku, která velice jednoduše umožní predikovat hodnotu jedné nominální proměnné nebo,...

Celý článek

Hodnocení hollywoodských filmů v IBM SPSS Statistics

V tomto článku si představíme analýzu, která vznikla během individuálních analytických cvičení prezentovaných v semestrálním kurzu Statistická analýza dat v praxi. Máme k dispozici datový soubor charakterizující a hodnotící vybrané hollywoodské filmy za dobu čtyř let a stojíme před otázkou, co ovlivňuje divácké hodnocení těchto filmů? Má...

Celý článek