fbpx

Klasifikace sentimentu

Uzel Sentiment

Uzel Sentiment přiřadí textovému dokumentu kategorii sentimentu a volitelně kvantifikuje sentiment v dokumetu pomocí skóre. Před samotnou kategorizaci lze předřadit automatické rozpoznání jazyka a diakritizaci dokumentů psaných bez diakritiky.

Kategorie sentimentu jsou very negative, negative, neutral, positive, very positive, ambivalent. Celkové skóre nabývá hodnot od -1 do +1. Kladné hodnoty indikují pozitivní sentiment, záporné negativní. Celkové skóre je součtem pozitivního a negativního skóre. Zvolíte-li automatickou detekci jazyka, jazyk dokumentu se připojí do datové matice jako nový atribut.

záložka Settings

  • Document text filed. Textový atribut obsahující text dokumentu.
  • Sentiment field name extension. Předpona nebo přípona nového atributu s kategorií sentimentu.
  • Add extensions as. Přidané atributy se pojmenovávají jako atribut s textem dokumentu a ke jménu se přidávají předpony nebo přípony. Pro používání předpon zvolte prefix, pro používání přípon zvolte suffix.
  • Add sentiment scores. Vytvoření nových atributů obsahujících číselná skóre sentimentu. K datové matici se připojí atributy s celkovým skóre, s pozitivním skóre a s negativním skóre.
  • Total score field name extension. Předpona nebo přípona nového atributu s celkovým skóre.
  • Positive score field name extension. Předpona nebo přípona nového atributu s  pozitivním skóre.
  • Negative score field name extension. Předpona nebo přípona nového atributu s negativním skóre.
  • Language of documents. Jazyk dokumentů. Na výběr je čeština (Czech), slovenština (Slovak) a automatická detekce jazyka (Automatic detection). Při automatické detekci jazyka se rozpoznaný jazyk zaznamená do nového atributu.
  • Language field name extension. Předpona nebo přípona nového atributu s  automaticky rozpoznaným jazykem.
  • Restore diacritics. Automatická dikritizace dokumentů neobsahujících diakritiku. Diakritizace se provede před analýzou sentimentu.

záložka Optimization

  • Send requests in batches. Dávkové zasílání dokumentů na server.
  • Batch size. Počet dokumentů v dávce.
  • Number of paralel web requests. Počet paralelních vláken pro zpracování dokumentů. Vlákna pracují na sobě nezávisle, proto se pořadí dokumentů na výstupu může lišit od pořadí na vstupu.

Potřebujete poradit, jak využívat vaše data? Chcete zefektivnit a urychlit vaši práci? Nevíte, jaký software je pro vaše řešení ten správný?

Využijte naši nezávaznou konzultaci, při které vám rádi zodpovíme všechny vaše dotazy a najdeme vhodné řešení.

Zůstaňte s námi v kontaktu.