Zpět

Daňové riaditeľstvo Slovenskej republiky

Data mining v daňové správě Slovenské republiky

Výběr daní je nejdůležitějším zdrojem financí státu. Z tohoto důvodu je zkvalitňování procesu výběru daní jedním z hlavních cílů Ministerstva financí Slovenské republiky, stejně jako Daňového ředitelství slovenské republiky (DR SR). Výběr daní může být negativně ovlivněn daňovými úniky a daňovými podvody. 

Ve spolupráci se společností Asseco Slovakia byl dodán a implementován dataminingový nástroj IBM SPSS Modeler, který umožňuje efektivní modelaci vztahů a závislostí nad databází Datového skladu dodávaného společností Asseco Slovakia. 

Právě v oblasti eliminování daňových úniků se DR SR rozhodlo využít moderní IT technologie, mezi které patří i nástroje pro data mining. Cílem jejich implementace bylo: 

  • operativně identifikovat rizikové daňové subjekty,
  • zjišťovat pravděpodobnost rizika a rizikového chování u daňových subjektů na základě stanovených atributů, přičemž standardním postupem to nebylo možné zjistit, 
  • pomocí hledání skrytých závislostí v datech, odhalovat souvislosti mezi chováním daňového subjektu v minulosti a jeho tendencí vykonat daňový podvod, 
  • zlepšit efektivnost výkonu daňové kontroly, 
  • poskytnout kontrolorům takové podklady, které jsou nezávislé a zbavené subjektivních vlivů,
  • lépe využít personální zdroje při kontrolní činnosti a výkonu správy daní, 
  • získání a využití informací o chování daňového subjektu, které jsou uložené v informačních systémech. 

Řešení 

Požadované vlastnosti nejlépe splňoval SW produkt IBM SPSS – dataminingový nástroj IBM SPSS Modeler. Má výborné prostředky pro zpracování rozsáhlých a různorodých zdrojů dat od relačních databází až po soubory různých formátů. Nástroj IBM SPSS Modeler nabízí širokou škálu modelovacích technik a silných algoritmů. Jeho nespornou výhodou je intuitivní ovládání. 

Odhalování rizikového chování daňových subjektů 

Pro odhalování rizikového chování daňových subjektů (DS) byla využita především historická data z Datového skladu dodávaného společností Asseco Slovakia o daňových přiznáních, platební disciplíně a vykonaných kontrolách. Velmi důležitá byla identifikace těch subjektů, které už v minulosti vykonaly daňový podvod. Tyto údaje sloužily k odhalení souvislostí mezi chováním daňového subjektu a vykonaným daňovým podvodem. Na základě zkušeností analytických a metodických pracovníků daňové správy a ve spolupráci se společností Asseco Slovakia byly vytipovány desítky atributů, které identifikují rizikové chování daňového subjektu. 

Pro vytvoření dataminingového modelu Odhalování rizikového chování daňových subjektů byla zvolena metoda rozhodovacího stromu i s ohledem na robustnost modelu. Po zohlednění regionálních specifik chování daňových subjektů byla dále využita metoda Neuronových sítí.

Dataminingový nástroj IBM SPSS Modeler efektivně zpracoval historická data z datového skladu spolu s vytipovanými atributy rizikového chování daňového subjektu a s použitím vybraných modelů identifikoval charakteristická riziková chování u daňových subjektů. Definované postupy byly implementovány v rozhraní IBM SPSS Collaboration & Deployment Services Real Time Scoring (dříve IBM SPSS Modeler Publisher) a výsledky byly také zapracovány do dalších aplikací datového skladu. 

„Za úspěchem celého projektu stojí profesionalita a zkušenosti celého projektového týmu – pracovníků DR SR a analytiků společnosti Asseco Slovakia a v neposlední řadě i nesporné kvality SW balíku IBM SPSS Modeler, který byl k naplnění cílů použit.“ - Ing. Dana Badínová ředitelka odboru řízení rizik.

Kategorizace daňových subjektů 

Vytvoření modelu rizikového chování daňových subjektů bylo jen prvním krokem pro aktivní využívání nástroje IBM SPSS Modeler na DR SR. Dalším krokem pro bližší pochopení chování daňových subjektů byla tvorba modelu Kategorizace daňových subjektů. Model slouží na rozdělení daňových subjektů do skupin, čímž je chování daňových subjektů lépe identifikovatelné pro kontrolora a vznikají tak vzorové modely chování. Určení skupin – klastrů daňových subjektů probíhalo ve dvou krocích. V prvním kroku byly vytvořeny skupiny na základě přirozeného dělení – na skupiny fyzických a právnických subjektů. Ve druhém kroku byla na vlastní určení skupin daňových subjektů využita metoda TwoStep, hlavně s ohledem na její schopnost samostatně určit počet nových skupin. 

Úspěšný výsledek implementace nástroje IBM SPSS Modeler v prostředí daňové správy SR je kombinací:

  • silných analytických technik nástroje IBM SPSS Modeler,
  • profesionálních znalostí a zkušeností pracovníků DR SR a analytiků společnosti Asseco Slovakia, 
  • informací uložených v historických datech Datového skladu dodávaného společností Asseco Slovakia. 

Hlavním přínosem je operativní identifikace rizikových daňových subjektů, objektivní výběr daňových subjektů pro kontrolu a odhalování rizikového chování daňových subjektů spolu s jejich lepší kategorizací. Výsledkem je vyšší efektivnost daňové kontroly a tím i očekávané zvýšení příjmů do státního rozpočtu