Nabídka spolupráce a služeb

Nabízíme služby v oblasti výzkumu, návrhu a implementace metod pro počítačové zpracování textových dat v podobě přirozeného jazyka. Většina našich metod pracuje na flektivních jazycích (čeština, slovenština a další) a na angličtině. Metody jsou navrženy tak, že umožňují zpracovávat velké objemy dat. Základním principem metod je strojové učení, které vykazuje dobrou schopnost přizpůsobit se neznámým nebo novým jevům v textech.

Specializujeme se na zpracování těchto úloh:

  • Rozpoznávání jazyka (27 jazyků) – vhodné i pro velmi krátké texty jako jsou např. příspěvky na blozích či v internetových diskusích.
  • Rekonstrukce textu – zahrnuje doplnění diakritiky a interpunkce, opravy překlepů a nespisovných tvarů.
  • Rozpoznávání pojmenovaných entit – umožňuje v textech najít slova či slovní spojení s daným významem (např. jména osob, názvy měst a států, názvy výrobků a produktů, jména firem, datum a čas a další).
  • Rozpoznávání sentimentu – umožňuje automaticky rozpoznat sentiment věty nebo krátkého textu. Jedná se o automatické určení postoje člověka, který text vytvořil. Rozpoznáváme buď do kategorií pozitivní, negativní a neutrální sentiment anebo sentiment určujeme na stupnici od 1 – 10.
  • Sémantické vyhledávání – umožňuje vyhledávat v textech s využitím ontologie pojmenovaných entit; tj. je možné např. vyhledat všechny texty, kde je název telefonu od společnosti Nokia.
  • Analýza výsledků vyhledávání – umíme analyzovat výsledky vyhledávání, sledovat trendy a korelace jevů ve výsledcích. Umíme např. zjistit, jak se v čase vyvíjel názor na daného politika či popřípadě zjistit, o kterém politikovi se nejvíce mluví.
  • Automatická klasifikace dokumentů – umožňuje automatické určení kategorie dokumentu dle jeho obsahu (např. politika, sport, počasí, apod.). Zaměřujeme se zejména na zařazení dokumentů do více tříd současně, což je z pohledu komerčního využití žádanější úloha.