Od stroskotania legendárneho zaoceánskeho parníku Titanic už uplynulo vyše 108 rokov. Stroskotal pri svojej prvej plavbe v noci zo 14. na 15. apríla roku 1912 po zrážke s ľadovcom. Pri tejto tragickej udalosti zahynulo okolo 1 500 osôb. Posledná osoba, ktorá prežila stroskotanie lode zomrela 31. mája 2009 vo veku 97 rokov. Bola ňou angličanka, ktorá v čase stroskotania mala len 9 týždňov.
Na základe dát o osobách, ktoré sa nachádzali na Titanicu si odhadneme model binárnej logistickej regresie a pomocou neho si zodpovieme na otázku, že kto mal najväčšiu pravdepodobnosť prežitia na Titanicu. Dátová matica obsahuje nasledujúce kategorické premenné:
Odhadnutý model binárnej logistickej regresie môžeme zapísať rovnicou
kde p je pravdepodobnosť prežitia, Crew, 1st, 2nd, Female a Child sú 0/1 premenné, ktoré nadobúdajú hodnotu 1 ak pre osobu je prítomná daná kategória inak sú rovné 0. Z uvedenej rovnice je zrejmé, že najväčšiu pravdepodobnosť prežitia mali deti ženského pohlavia z prvej triedy. Z rovnice je možné túto pravdepodobnosť aj vypočítať a je rovná hodnote 0,957 (95,7 % pravdepodobnosť prežitia). Najmenšiu pravdepodobnosť prežitia mali dospelí muži z tretej triedy (10,4 % pravdepodobnosť prežitia). Ak by sme porovnávali rovnaké osoby čo sa pohlavia a veku týka (dieťa alebo dospelá osoba), tak posádka mala väčšiu pravdepodobnosť prežitia ako druhá alebo tretia trieda. Táto skutočnosť je pravdepodobne daná aj rozmiestnením kajút na Titanicu (obrázok 1).
Z obrázku je vidieť kde boli aj schody. Záchranné člny, ktorých nebol dostatočný počet, sa nachádzali na vrchu lode kam mali zložitejší prístup práve cestujúci z tretej triedy. Zvykne sa aj uvádzať, že boli zablokovaní aby prenechali miesto pre prvú triedu. Celkovo bolo k dispozícii 20 záchranných člnov troch rozličných typov:
Maximálne sa tak mohlo zachrániť len 1 178 osôb. V osudnú plavbu sa na palube nachádzalo cez 2 200 osôb a prežilo len niečo cez 700 osôb.
Pre popis dát z najväčšej námornej tragédie by okrem logistickej regresie mohli byť použité aj iné metódy. Napríklad menej prehľadné viacvrstvové kontingenčné tabuľky alebo prehľadnejšie rozhodovacie stromy.
Uvedená interpretácia výsledkov binárnej logistickej regresie zďaleka nepredstavuje všetko. Máme pre Vás pripravený kurz logistickej regresie kde sa okrem iného dozviete o:
Tešíme sa na Vás.