Jak spolu souvisí smrt a sýr… V tomto článku si povíme o něčem, co je známo pod pojmem falešná či nepravá korelace (anglicky spurious correlation). Korelační koeficient udává míru asociace mezi dvěma číselnými proměnnými. Jedná se o číslo z intervalu <-1, 1>. Pokud se korelace...
Celý článek
Baeysovská statistika má své kořeny poměrně hluboké a dávné. Vždyť slavné pojednání reverenda Bayese (1763), které obsahuje Bayesův teorém vyšlo již před více než 250 lety. Od té doby lze datovat rozvoj statistiky, které dnes říkáme dle jejího zakladatele bayesovská či...
Celý článek
Udržení stávajících klientů je jednou z klíčových úloh prosperujícího podnikání. Zvlášť v době, kdy nelze kvůli hrozbě obrovských sankcí vyplývajících z GDPR jednoduše oslovovat zákazníky tak, jak jsme byli zvyklí. V minulosti jsme často jednoduše oslovili emailem celý zákaznický kmen a s ničím jsme si...
Celý článek
Diskriminační analýza je jednou z nejstarších technik vícerozměrné analýzy dat. Díky tomu by mohla být velice rozšířená, ale opak je pravdou. Většina učebnic i výukových kurzů ji směle ignoruje, přitom jde o techniku, která velice jednoduše umožní predikovat hodnotu jedné nominální proměnné nebo,...
Celý článek
V tomto článku si představíme analýzu, která vznikla během individuálních analytických cvičení prezentovaných v semestrálním kurzu Statistická analýza dat v praxi. Máme k dispozici datový soubor charakterizující a hodnotící vybrané hollywoodské filmy za dobu čtyř let a stojíme před otázkou, co ovlivňuje divácké hodnocení těchto filmů? Má...
Celý článek