A Magyar Kutatási Hálózat Nyelvtudományi Kutatóközpontjának munkatársai már egy, a ChatGPT-hez hasonló nyelvi modell életre keltésén fáradoznak – írja a Magyarnemzet.hu.
A PULI jelenleg ugyan nem képes interaktív kérdezz-felelek üzemmódra, de a korábbi nyelvi modellekhez hasonlóan megadott paraméterek alapján folytatja a megkezdett szöveget.
Ezekben a struktúrákban az algoritmusok hatalmas szövegbázisokat átfésülve alkotnak meg új írásokat, felhasználói utasítások alapján. Ilyen nyelvi modellekre épülnek a nyelvhelyesség ellenőrzők, valamint a gépi fordítók is.
A ChatGPT abban újdonság hozzájuk képest, hogy kismennyiségű szöveg megadásával nagy mennyiségű releváns anyagot képes előállítani, vagy akár fordítva.
Váradi Tamás, a Kutatóközpont főigazgató-helyettese úgy véli, a nyelvi modellek számos helyzetben jöhetnek jól, ahol szakszerű válaszokra van szükség, ráadásul különböző stílusban is képesek szövegeket írni.
Ugyanakkor a magyar PULI fejlesztői a ChatGPT tanulságai alapján látják, hogy a téves információk redukálása érdekében is jelentős lépésekre van szükség, mivel az Open AI nyelvi modellje által eredményezett szövegek sokszor valótlan, téves információkat jelenítenek meg.
A külföldi fejlesztésű AI rendszerek mellett felmerülhet a kérdés, hogy miért van szükség hazai innovációra. Váradi válasza alapján azonnal érhetővé válik a lényeg:
Az a 128 milliónyi magyar nyelvű tanítóanyag, amivel a ChatGPT-t tanították, elenyésző a 183 milliárd angol szó mellett. A PULI GPT–3SX nevű modell tanítását ezzel szemben 32 milliárd magyar szövegrésszel végeztük.
Emellett a magyar fejlesztés tökéletesebben idomul a kulturális, történelmi környezetbe, ahogyan a mindennapi szóhasználatot is megfelelőbben kezeli. Nem is beszélve arról, hogy jobban ki tudja szolgálni a hazai üzleti és társadalmi igényeket.
A nyelvi modell továbbfejlesztett verziója a háromnyelvű PULI GPTrió, amely elképesztő módon 41 milliárd magyar, 61 milliárd angol és 98 milliárd kínai szövegrészt tartalmaz. A különböző nyelvű adatok erősítik egymást, így egyik nyelvű rendszer tanul a másiktól.
Itt pedig már szintet kell lépniük a kutatóknak, olyan szuperszámítógépre van szükségük amelyet a világon is a legjobbak közé sorolnak. Természetesen idehaza is van már ilyen konstrukció, a Komondor, amely a Debreceni Egyetem eszköze.