Před několika měsíci mě kolegyně požádala, abych pro ni připravil data o zákaznících do emailových kampaní z našeho firemního CRM. Souhlasil jsem, ale v duchu jsem si říkal, proč si to neudělá sama. Vždyť export dat z webového rozhraní CRM nemůže být žádná věda. Bohužel se ukázalo, že to zase až tak elementární úloha není a že nejsme schopni, uživatelsky jednoduše, z našeho CRM data vyexportovat v požadovaném rozsahu a struktuře.
Začal jsem se tedy seznamovat s rozhraním CRM, které jsem až do té doby používal pouze k evidenci pracovní docházky. Pochopil jsem, že možnosti exportu jsou opravdu tristní a bude nutné data vyextrahovat z původního SQL úložiště. K tomu však je nutná jistá znalost vnitřních vazeb a datové struktury. Tu jsem však neměl a žádný datový model bohužel neexistoval. Bylo tedy třeba nejprve pochopit, jak jsou data vnitřně uspořádána a kde a jak je uloženo to, co bylo požadováno.
Uvědomil jsem si, že ačkoli se nakonec budou provádět jednoduché výběry, naštěstí podle jasně definovaných business pravidel, jedná se v podstatě o klasickou dataminingovou úlohu. A jako k takové jsem k ní přistoupil. Prošel jsem klíčové fáze porozumění úloze a porozumění datům (data byla určitě složitější), abych pak přibližně 80% času věnoval datovým úpravám. Pro řešení této úlohy jsem si vybral můj oblíbený dataminingový nástroj – IBM SPSS Modeler. Síla tohoto nástroje je právě ve fázi přípravy dat, kdy je třeba data pospojovat z různých zdrojů (tabulek a číselníků) a cestou provést celou řadu manipulací a transformací. Ukázalo se totiž, že některé transakční údaje byly vtipně uloženy v textových řetězcích, které bylo nejprve rozdělit, reklasifikovat a restrukturalizovat. Podobně jsem na tom byl s daty z externích zdrojů, které si kolegyně vedly o svých zákaznících, účastnících kurzů Centra výuky ACREA CR.
To poskytuje různé kurzy z oblasti statistiky, data miningu a marketingu. Tyto transakční záznamy z různě historicky používaných excelovských souborů, uloženy bez ladu a skladu, bylo třeba převést a agregovat na úroveň jednotlivce a připojit k nim nové záznamy o realizovaných kurzech z CRM za poslední dva roky. Potom, co se podařilo sestavit a procesně automatizovat datovou matici zákazníků jednotlivých oddělení společnosti ACREA CR, stačilo už pouze slíznout smetanu v podobě implementace jednoduchých obchodních pravidel, jako jsou například podmínky typu: vyber pouze zákazníky konkrétního oddělení, pouze z ČR, se souhlasem pro kontakt, s účastí na dvou a více kurzech apod.
Pravidla pak byla vizuálně formalizována pomocí výběrových uzlů v prostředí IBM SPSS Modeler.
Aktuálně celý proces končí vytvořením sady excelovských souborů, které se importují do nástroje pro emailové kampaně. Jak prosté. Nicméně tato zdánlivě jednoduchá úloha znovu potvrdila fakt, že:
Rádi byste se o data miningu, statistice a analýze dat dozvěděli více? Chcete se stát mistrem ve svém oboru nebo si jen potřebujete doplnit znalosti? V ACREA nabízíme širokou nabídku kurzů pro váš profesní růst. Máte-li jiný dotaz. Nebojte se využít naši nezávaznou konzultaci, při které vám rádi zodpovíme všechny vaše dotazy a najdeme vhodné řešení.