Košík je prázdný

Klasifikace sentimentu

uzel Sentiment

Uzel Sentiment přiřadí textovému dokumentu kategorii sentimentu a volitelně kvantifikuje sentiment v dokumentu pomocí skóre. Před samotnou kategorizací lze předřadit automatické rozpoznání jazyka a diakritizaci dokumentů psaných bez diakritiky.

Kategorie sentimentu jsou very negative, negative, neutral, positive, very positive, ambivalent. Celkové skóre nabývá hodnot od -1 do +1. Kladné hodnoty indikují pozitivní sentiment, záporné negativní. Celkové skóre je součtem pozitivního a negativního skóre. Zvolíte-li automatickou detekci jazyka, jazyk dokumentu se připojí do datové matice jako nový atribut.

záložka Settings

Document text field
Textový atribut obsahující text dokumentu.
Sentiment field name extension
Předpona nebo přípona nového atributu s kategorií sentimentu.
Add extensions as
Přidané atributy se pojmenovávají jako atribut s textem dokumentu a ke jménu se přidávají předpony nebo přípony. Pro používání předpon zvolte prefix, pro používání přípon zvolte suffix.
Add sentiment scores
Vytvoření nových atributů obsahujících číselná skóre sentimentu. K datové matici se připojí atributy s celkovým skóre, s pozitivním skóre a s negativním skóre.
Total score field name extension
Předpona nebo přípona nového atributu s celkovým skóre.
Positive score field name extension
Předpona nebo přípona nového atributu s pozitivním skóre.
Negative score field name extension
Předpona nebo přípona nového atributu s negativním skóre.
Language of documents
Jazyk dokumentů. Na výběr je čeština (Czech), slovenština (Slovak) a automatická detekce jazyka (Automatic detection). Při automatické detekci jazyka se rozpoznaný jazyk zaznamená do nového atributu.
Language field name extension
Předpona nebo přípona nového atributu s automaticky rozpoznaným jazykem.
Restore diacritics
Automatická diakritizace dokumentů neobsahujících diakritiku. Diakritizace se provede před analýzou sentimentu.

záložka Optimization

Send requests in batches
Dávkové zasílání dokumentů na server.
Batch size
Počet dokumentů v dávce.
Number of paralel web requests
Počet paralelních vláken pro zpracování dokumentů. Vlákna pracují na sobě nezávisle, proto se pořadí dokumentů na výstupu může lišit od pořadí na vstupu.