Autor Ing. Ondřej Brom

O autorovi

lektor, analytik a odborný konzultant ve společnosti ACREA. Ve své profesní kariéře se zaměřuji na analytickou činnost převážně v oblasti data miningu. V nemalé míře se podílím na odborné konzultantské činnosti pro oblast aplikace a využití softwarových řešení společnosti ACREA.

Hierarchické modely: Analýza dat se skupinovou strukturou či opakovaná měření

V mnoha oblastech datové analýzy se setkáváme s daty, která nejsou zcela nezávislá. Žáci jsou součástí tříd, zaměstnanci pracují ve firmách nebo jsou hodnoty měřeny opakovaně na jednom pacientovi.  Tradiční lineární modely často tyto struktury a závislosti ignorují. Pokud bychom jejich výsledky analyzovali...

Celý článek

T-testy: Klíč k odhalení rozdílů mezi skupinami

Statistika nabízí celou řadu metod, jak ověřit naše hypotézy a rozhodnout, zda rozdíly mezi skupinami či měřeními mají skutečný význam. Jednou z nejčastěji používaných metod je t-test, který se uplatňuje v přírodních vědách, medicíně, vzdělávání, průmyslu i v sociálních vědách. Tento článek se zaměřuje na vysvětlení, co t-test...

Celý článek

Diskriminační analýza a logistická regrese III.

V minulé části jsme si ukázali, jak se v diskriminační analýze provádí klasifikace do skupin. Používají se dva, co se výsledku týče, ekvivalentní způsoby, kdy jeden pracuje s diskriminačními funkcemi a druhý s funkcemi klasifikačními. Nyní přikročíme k srovnání klasifikace s další široce rozšířenou metodou pro klasifikaci, tedy s logistickou regresí.  Logistická regrese...

Celý článek

Diskriminační analýza a logistická regrese II.

Klasifikace v lineární diskriminační analýze V minulé části jsme se seznámili se vzorcem pro výpočet aposteriorní pravděpodobnosti (1) založeném na Mahalanobisovově vzdálenosti (2) a zmínili jsme, že vzorec se výrazně zjednoduší v případě lineární diskriminační analýze (dále DA). Vzorec se týká kanonických diskriminačních funkcí, které jsou...

Celý článek

Diskriminační analýza a logistická regrese I.

Jednou z velmi častých úloh statistiky i datascience je klasifikace. Úloha spočívá v odhadu skupiny (třídy), ke které případ náleží na základně jeho vlastností zachycených sadou číselných i kategorizovaných proměnných. Ty budeme nazývat vysvětlující. V úloze se například určuje diagnóza pacienta podle výsledků vyšetření nebo budoucí platební morálka...

Celý článek