Konec nestrukturovaným datům v Čechách

S novým modulem ACREA TEXT MINING máte na dosah všechna data, která do teď šla jen těžko uchopit. Nový modul pracuje s lingvistickými databázemi, které dokáží nestrukturovaná data převést do tabulek, které lze dále strojově využívat a exportovat již uchopitelné výstupy.

Může se jednat o emaily, přepsané telefonní hovory, reporty, názory, recenze, žádosti, zprávy, zakázky a mnoho dalších volných textů. Nový modul si poradí i s takovými texty, které nedisponují diakritikou nebo jsou psané v jiných jazycích. Je tedy vhodný do jakéhokoliv odvětví státní správy či podnikání.

Modul dokáže klasifikovat dokumenty dle sentimentu, to znamená, že jednotlivé výstupy lze ohodnotit dle postoje pisatele. Zároveň je modul schopný extrahovat klíčová slova nebo témata a dokumenty roztřídit. V zásadě tak nahrazuje lidského čtenáře. To snižuje množství času stráveného při pročítání recenzí či emailů a dává velkou výhodu oproti konkurenci, která textminingový modul nepoužívá.

„Novým textminingovým modulem Acrea Text Mining (ATM) reagujeme na potřeby analytiků zpracovávat nestrukturovaná data z textových dokumentů, jako jsou zákaznické recenze, přepisy telefonních hovorů, revizní zprávy či odpovědi na otevřené otázky. Na trhu chyběl nástroj pro transformaci volných textů psaných v českém a slovenském jazyce do strukturované podoby. Díky zasazení modulu ATM do univerzálního dataminingového nástroje IBM SPSS Modeler mohou uživatelé nejen klasifikovat, seskupovat či jinak zpracovávat textové dokumenty, ale také využít informaci ukrytou ve českém či slovenském textu na zdokonalení stávajících predikčních modelů získaných metodami strojového učení, které se doposud opíraly jen o strukturovaná databázová data.“ Popisuje senior data specialist Mgr. Ondřej Háva, Ph.D.

Rádi byste se o statistice a analýze dat dozvěděli více? Chcete se stát mistrem ve svém oboru nebo si jen potřebujete doplnit znalosti? V ACREA nabízíme širokou nabídku kurzů pro váš profesní růst. Máte-li jiný dotaz. Nebojte se využít naši nezávaznou konzultaci, při které vám rádi zodpovíme všechny vaše dotazy a najdeme vhodné řešení.

společnost ACREA
ACREA CR je českou analytickou společností s tradicí od roku 1998. Poskytuje analytické, statistické a dataminingové služby, školení a software z řady IBM SPSS a Predictive Solutions. Název firmy je zkratkou pro Analytical CREAtivity, která vyjadřuje, že každý analytický projekt je pro nás unikátní a ke každému přistupujeme individuálně.
Komentáře
  1. Zuzana Juščáková napsal:

    Dobrý deň, predpokladám, že ATM sa dá využiť v analýze otvorených dotazníkových položiek a funguje na základe kľúčových slov. Pomáha zoradiť texty v otvorených položkách do určitých kategórií tak, že sa ľahšie analyzujú? Existuje demo verzia? Môžem ju použiť, keď mám len SPSS Statistic.19?
    Ďakujem za odpovede.
    Zuzana

    • Bc. Marek Sekyra napsal:

      Dobrý den, ano, je to přesně tak, jak popisujete. Navíc lze v ATM analyzovat sentiment textu, zda je pozitivní či negativní. Demo verze v současné době není, ale je zařazena v plánu pro vývoj. Nicméně k používání ATM modulu potřebujete IBM SPSS Modeler. Pokud nevlastníte licenci na IBM SPSS Modeler, je nutné si jí pořídit nebo využít našich služeb pro zpracování. V takovém případě byste nám data musela zaslat spolu s požadavky, poté bychom připravili konkrétní nabídku, která závisí na náročnosti a časovém vytížení. S pozdravem Sekyra

Přidat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Vaše osobní údaje budou použity pouze pro účely zpracování tohoto komentáře. Zásady zpracování osobních údajů