Zpracování přirozeného jazyka nebo jazyková analýza je disciplína softwarového vývoje, která se zabývá tím, jak učinit jazyk strojově čitelným.
Příklad:
Představte si, že máte fakturu ve formátu PDF. Nyní chcete extrahovat datum faktury z tohoto PDF. Bohužel PDF neobsahuje pouze datum faktury, ale také datum nabídky, datum splatnosti a datum narození. Tento úkol vyžaduje metody jazykové analýzy, protože PDF (i když je digitální) není strojově čitelné. Zpracování jazyka nebo natural Language Processing je nyní schopno extrahovat správné datum z dokumentu a poté dokument dále zpracovat.
Vyvíjíme systémy pro zpracování jazyka. Ať už chcete:
• učinit znalosti vaší firmy vyhledatelnými,
• podpořit zákaznický servis pomocí chatbotu, nebo
• aplikovat statistickou analýzu dat na velké množství jednotlivých komentářů (např. komentáře na sociálních médiích, hodnocení produktů, protokoly o chybách),
programujeme vaše softwarové řešení v Pythonu nebo C Plus Plus.
Přitom vybíráme pro vás nejefektivnější cestu. Vývoj softwaru pro zpracování jazyka může například zahrnovat:
• využití ChatGPT pro zpracování vašich dat
• provozování Large Language Model (LLM, jazykový model) v rámci Německa nebo EU
• nastavení vlastního Open Source Large Language Model (LLM, jazykový model) na vašich serverech
• vývoj řešení zcela bez Large Language Model (LLM, jazykový model) a tím bez vysokých provozních nákladů a rizika halucinací.
Zpracování jazyka může být také využito v oblasti průmyslového softwaru. Zde mohou být protokoly o chybách, výrobní zprávy nebo jiné textové sbírky zpracovány tak, aby byly prezentovány jako tabulkový datový soubor. To umožňuje analýzu dat složitého chování chyb prostřednictvím průmyslového softwaru.