PS CLEMENTINE PRO

- nástroj pro data mining a automatizaci

PS Clementine PRO poskytuje komplexní a univerzální řešení pro dataminingové analýzy a jejich automatizaci. Podporuje celý dataminingový proces od přípravy dat přes modelování až po aplikaci modelů v praxi.

Dataminingová část je založena na jednom z nejrozšířenějších komerčních dataminingových nástrojů - IBM SPSS Modeler.

Příprava dat a datové manipulace

Součástí softwaru PS Clementine PRO je dataminingový nástroj IBM SPSS Modeler. Jeho funkcionalita byla navíc rozšířena o několik vstupních, procesních i terminálových uzlů, které umožňují lepší implementaci REST a SOAP webových služeb. Dalším rozšířením je i snazší propojení s prostředím IBM SPSS Collaboration & Deployment Services a zjednodušení práce s názvy proměnných po jejich agregaci.

Nastavení načítání souborů pomocí přidané funkcionality PS Files.

Hromadné přejmenovaní proměnných, typicky po použití agregačních funkcí.

Nastavení komunikace s vybranou webovou službou pomocí technologie REST.

Modelování a strojové učení

PS Clementine PRO nabízí desítky algoritmů strojového učení. Můžete mezi nimi najít běžně používané algoritmy jako je například logistická regrese nebo dát přednost moderním technikám, jako je například rozhodovací les XGBoost. Hotové modely lze snadno kombinovat do ansámblů. Samozřejmostí je snadný export celého řešení včetně predikčních modelů do provozních softwarů.

Bayesovské sítě nabízí velmi transparentní vícerozměrný statistický model založený na odhadnutých podmíněných pravděpodobnostech důležitých vztahů mezi vstupy a výstupy.

Gaussova směs představuje alternativu ke klasickým seskupovacím metodám, jako je například k-means či Kohonenovy mapy.

Rozhodovací lesy vhodně kombinují přesnost a obecnost predikčního modelu. Velmi oblíbeným algoritmem pro rozhodovací lesy je XGBoost

Reportování a vizualizace

Grafy z PS Clementine PRO lze využít jak pro prezentaci výsledků, tak pro průběžnou ad-hoc analýzu a generování potřebných datových manipulací. V editačním módu můžete měnit vzhled grafu, zatímco explorační mód nabízí nástroje pro označování zvolených objektů v grafu a generování manipulačních uzlů jako jsou výběry, kategorizace či balancování.

Populární krabicový graf nejen umožnuje identifikovat případná odlehlá pozorování, ale nabízí porovnání rozdělení číselné proměnné v podskupinách.

Pro změnu vzhledu grafů slouží editační mód. Intuitivní rozraní umožňuje měnit vlastnosti jednotlivých objektů v grafu.

Údaje o státech, městech, silnicích či jiných lokalitách je nelepší znázornit do mapového podkladu. Mapy můžeme obarvovat, měnit v nich značky nebo do nich přidat malé grafy na zvolené souřadnice.

Automatizace a deployment

Velkou přidanou hodnotou řešení PS Clementine PRO je možnost správy a automatizace analytických aktiv, IBM SPSS Modeler streamů. Streamy jsou použity v automatizovaných úlohách (jobech). Joby se spouští automatizovaně či adhoc, případně je jejich spuštění iniciováno vnější událostí – přidáním nového souboru či REST/SOAP voláním.

Ukázka definice streamů, které budou následně rozděleny do dvou automatizovaných úloh (jobů) a spouštěny postupně.

Manažerské rozhraní pro správu analytických aktiv, definici automatizovaných úloh s možností náhledu na aktuální stav jobů a historii jejich spouštění.

Obecná definice  terminálového uzlu PS REST, která zajistí odeslání REST zprávy externímu procesu. Pro automatizaci jobů lze využít i specifický uzel PS Clementine JOB.

Další možnosti softwaru

Komponenty softwarového řešení PS Clementine PRO usnadňují proces reportování, sdílení výstupů a automatizace. Jedná se o webový nástroj PS Clementine PRO (dříve Manager), pomocí kterého lze vytvářet úlohy sestavené z proudu(ů), definovat jejich spouštění a zajistit správu analytických úloh a přístup uživatelů.

Aplikace PS v jednom rozhraní

Zpřístupnění a ovládání všech aplikací (statistických, dataminingových i pro sběr dat) z jednotného rozhraní PS Desktop.

Přístup uživatelů k obsahu

V rámci PS Clementine Manager může každý přistoupit a upravit/spustit pouze takový obsah, ke kterému má příslušná práva a přiřazenou funkcionalitu.

  • PS Clementine PRO
  • (dříve Manager)

Aplikace, která zajišťuje spuštění aktivního analytického obsahu uloženého v PS Clementine Repository.

PS CLEMENTINE PRO OBSAHUJE

Software se skládá z několika komponet.

IBM SPSS Modeler

Dataminingový nástroj používaný k dolování dat a ke zpracování velkých objemů dat, poskytuje integraci s databází, komplexní sadu technik pro strojové učení, supervizované i nesupervizované statistické metody a různé formy vizualizace výsledků.

PS Desktop

Aplikace sloužící jako výchozí bod pro přístup k různé funkcionalitě PS Clementine, případně dalších produktů PS (Predictive Solutions), například pro funkcionalitu statistického nástroje PS Imago PRO či PS Quaestio pro sběr dat.

  • PS Clementine PRO
  • (dříve Manager)

Umožňuje centralizovanou správu analytických úloh, řízení přístupu uživatelům či skupinám uživatelů k různému obsahu a funkcionalitě.

PS Clementine Repository

Sofistikované úložiště analytických aktiv a definic automatizovaných dávek, tzv. jobů, které zároveň zajišťuje jejich realizaci.