A Természetes (Emberi) Nyelvek Feldolgozása (Natural Language Processing, NLP) a mesterséges intelligencia olyan ága, amely arra fókuszál, hogy a számítógépek meg tudják érteni és fel tudják dolgozni az emberi nyelv(ek)et. Az NLP támogatja az emberek és a gépek közti kommunikációs folyamatokat, és nagy jelentősége van a chatbotok és a fordítóprogramok fejlesztésében is.
Az NLP célja a természetes nyelvek kisebb egységekre bontása, majd az egységek közötti kapcsolatok, összefüggések feltárása. Minél több adat (szöveg) áll rendelkezésre, annál könnyebb megtalálni az összefüggéseket az adatok között, vagyis annál pontosabb képet kaphatunk magáról a nyelvről.
A HILANCO egy természetes nyelvi feldolgozó konzorcium Magyarországon, amelyet a Magyar Nyelvtudományi Kutatóközpont (NYTK), a Pécsi Tudományegyetem, valamint az Alkalmazott Adattudományi és Művészeti Intelligencia Központ (PTE) hozott létre. A konzorcium küldetése, hogy új NLP technológiákat és erőforrásokat biztosítson az intelligens nyelvi alkalmazások mesterséges intelligencia célokra történő létrehozásához. Minőségi megoldásokat kínálnak a kutatástól és fejlesztéstől a piacképes üzleti termékekig. Új perspektívákat nyitnak meg a kutatási területeken, és fejlesztéseik rendkívül hasznosak lehetnek az új chatbotok, virtuális asszisztensek és párbeszédügynökök létrehozásában.
A GPT-3 a Generative Pre-Training Transformer 3 angol kifejezés rövidítése. Ez egy autoregresszív nyelvi modell, amely a deep learninget (mélytanulási módszert) használja az emberi íráshoz hasonló szöveg előállításához. A GPT-3 előnye, hogy olyan jó minőségű szövegeket generál, hogy azt nehéz megkülönböztetni az ember által írtaktól. Ez az NLP (Natural Language Processing) modell képes számítógépes kódot, vagy akár költészeti alkotást is írni, létrehozni.
https://juniper.nytud.hu/demo/gpt3
A gépi fordítóprogramok reneszánszukat élik napjainkban. A fejlesztés alkalmas arra, hogy a programba illesztett szöveget lefordítsa (magyarról angolra, vagy fordítva). Emellett a „multi” funkció segítségével kiválaszthatunk más forrásnyelveket is, amelyekről a program a magyarra tud fordítani.
https://juniper.nytud.hu/demo/translation
A kivonatoló program azzal a céllal került fejlesztésre, hogy hosszabb szövegből egy-egy mondatos kivonatot készítsen, kiemelve a szöveg lényegét, illetve legjelentősebb mondatát.
https://juniper.nytud.hu/demo/summarization
A mesterséges intelligencia alapú fejlesztés képes arra, hogy a beillesztett szöveg érzelmi töltetét meghatározza. Egy ilyen program segítségével a szöveg hangulatát anélkül is meghatározhatjuk, hogy azt végig olvassuk, így nagy jelentősége van hírek, postok negatív, pozitív, illetve semleges kategorizálására.
https://juniper.nytud.hu/demo/sentana
A névfelismerő program célja a nevek felismerése, anonimizálása a megadott szövegben.
https://juniper.nytud.hu/demo/ner
Az internetes cikkek, hírek alatt találhatunk címkéket, amelyek segítenek az olvasónak a szöveg témakörének mielőbbi beazonosításában. A címkéző alkalmazás célja az, hogy a programba bemásolt szöveget elemezve olyan címkéket ajánljon a felhasználónak, amelyet fel tud használni a saját honlapján megjelentetésre szánt szöveg témájának behatárolásában.
https://juniper.nytud.hu/demo/tagger
A fejlesztés alkalmas arra, hogy a bemásolt szöveget átvizsgálva helyreállítsa az ékezeteket.
https://juniper.nytud.hu/demo/diacritic
Ez a fejlesztés a már említett GPT-3 nyelvi modell előző verziója.