Široká škála statistických procedur jazyka R na jedné straně a na druhé straně bohatá sada nástrojů pro přípravu dat, pokročilé výstupové rozhraní a výpočetní efektivita systému IBM SPSS Statistics vedly ke snaze propojit tyto systémy a užívat současně výhody obou. Výsledkem je integrace jazyka R do prostředí IBM SPSS Statistics.
R je programovací jazyk a prostředí pro statistickou analýzu a vizualizaci dat. Je dostupný jako volně šiřitelný software. Lze ho považovat za implementaci programovacího jazyka S pod svobodnou licencí Free Software Foundation’s GNU General Public License. Ovládá se z příkazového řádku, je však možné využít několika volně dostupných programů s grafickým rozhraním (například RStudio).
R nabízí širokou škálu procedur se statistickými a grafickými nástroji. Uživatelé si mohou rovněž vytvářet vlastní knihovny, běžnější však je stahování hotových knihoven (balíčků) z internetu.
Jazyk R je zaměřený především na statistické analýzy a méně již na přípravu dat. Výstupem procedur je nejčastěji prostý text se záznamem odhadnutých hodnot. Z těchto důvodů je R méně uživatelsky přívětivé než běžné statistické balíčky a zároveň klade poměrně vysoké nároky na znalosti a schopnosti uživatele.
Instalace R, verze 4.2.0 je realizovaná automaticky při instalaci IBM SPSS Statistics 29.
Po instalaci R a integračního pluginu je možné využívat rozšiřující procedury vytvořené pomocí R. Ty si můžete vytvářet sami nebo užívat hotové, kterých jsou aktuálně k dispozici desítky až stovky. Informace o nich naleznete pod nabídkou Extensions, Extension Hub, která je určena ke správě softwarových rozšíření a připojení k portálu pro sdílení těchto rozšíření mezi uživateli. Zde si můžete procedury zdarma stáhnout a nainstalovat. Zároveň získáte informace o tom, zda pro zprovoznění vyžadují také stažení dalších balíčků R. Procedury se následně začlení do standardních nabídek programu IBM SPSS Statistics.
Rozšiřující procedury mají obvykle formu tzv. instalačních balíčků, tj. souborů s příponou *.spe, které slouží ke zjednodušené instalaci procedury, jejího dialogu a případných dalších komponent. Nainstalované soubory se standardně ukládají do defaultně skrytých složek:
C:\Users\…\AppData\Roaming\IBM\SPSS Statistics\one\extensions a
C:\Users\…\AppData\Roaming\IBM\SPSS Statistics\one\CustomDialogs.
Pro lokální instalaci rozšiřujícího balíčku uloženého na počítači či v rámci sítě lze využít volbu Extensions, Install Local Extension Bundle. Pokud byste se naopak rozhodli nepoužívané procedury odstranit, lze to udělat v dialogovém okně nabídky Extensions,Custom Dialog Builder for Extensions, v nabídce File, Uninstall.
IIntegrační plug-in zajišťuje propojení jazyka R a programu IBM SPSS Statistics. Poskytuje řadu funkcí, které mimo jiné dovolují:
Každý příkaz má několik volitelných nebo povinných parametrů. Přehled všech příkazů, jejich podrobný popis i další informace naleznete v nápovědě IBM SPSS Statistics (Help, Topics, témata Integration Plug-in for R nebo Working with R) a v manuálu R Integration Package for IBM SPSS Statistics (Help, Documentation in PDF Format). Nápověda k samotnému jazyku R není součástí nápovědy IBM SPSS Statistics, najdete ji například na webových stránkách věnovaných R.
Jazyk R se v IBM SPSS Statistics zapisuje do syntaxového okna. Příkazy R musí být vždy uvnitř bloku ohraničeného příkazy BEGIN PROGRAM R a END PROGRAM. Přitom je možné libovolně kombinovat příkazy R ze všech nainstalovaných knihoven a příkazy syntaxového jazyka z integračního balíčku. Po spuštění syntaxe se výstupy zobrazují ve výstupovém okně IBM SPSS Statistics.
Jednoduchý syntaxový zápis, který pouze zobrazí hlavní stránku nápovědy programu R, tedy může vypadat například takto:
BEGIN PROGRAM R.
help.start()
END PROGRAM.
Jazyk R lze v syntaxi užívat dvěma způsoby. V prvním případě zapisujete veškeré příkazy přímo do syntaxového okna a kombinujete je s vlastními příkazy programu IBM SPSS Statistics. Hlavní výhodou tohoto přístupu je, že máte plnou kontrolu nad všemi prováděnými operacemi a můžete je snadno upravovat. Nevýhodami jsou především délka zápisu a menší přehlednost.
Druhou možností je integrovat příkazy R do vlastního instalačního balíčku, pro který definujete rovněž syntaxový příkaz. Výsledkem je nový syntaxový příkaz, který provádí zadané operace v R. Po nainstalování balíčku můžete příkaz užívat v syntaxi standardním způsobem jako jakékoliv jiné příkazy. Tento postup je vhodný zejména při vytváření nových procedur, které plánujete užívat opakovaně a případně je dát k dispozici i dalším uživatelům. Syntaxový zápis je výrazně jednodušší, přehlednější a hrozí menší riziko chyby. Na druhou stranu uživatel ztrácí možnost upravovat příkazy v jazyce R.
V obou případech lze navíc pro zadávání vstupů vytvořit uživatelský dialog a začlenit ho do menu programu IBM SPSS Statistics. Podrobný postup, jak vytvořit instalační balíček, vlastní syntaxový příkaz nebo uživatelský dialog naleznete v nápovědě programu IBM SPSS Statistics.
Pokud vás zaujaly možnosti spolupráce IBM SPSS Statistics a R, chcete se o jazyku R dozvědět více a začít s ním pracovat, ale uvítali byste na začátku pomoc, rádi bychom vás pozvali na kurz Základy jazyka R.
Rádi byste se o statistice a analýze dat dozvěděli více? Chcete se stát mistrem ve svém oboru nebo si jen potřebujete doplnit znalosti? V ACREA nabízíme širokou nabídku kurzů pro váš profesní růst. Máte-li jiný dotaz. Nebojte se využít naši nezávaznou konzultaci, při které vám rádi zodpovíme všechny vaše dotazy a najdeme vhodné řešení.