A szöveges vízjelezés kizárólag a ChatGPT által generált szövegekre koncentrálna, nem más cégek modelljei által előállított szövegekre. A módszer úgy működne, hogy apró, láthatatlan módosításokat végezne a ChatGPT szóválasztásaiban, létrehozva egy „láthatatlan” vízjelet, amelyet egy külön eszköz később észlelhet.
Ez a megközelítés eltér a korábbi mesterséges intelligencia alapú szövegfelismerési próbálkozásoktól, amelyek általában nem voltak túl sikeresek. Az OpenAI már leállította korábbi MI-szövegdetektorát alacsony hatékonysága miatt.
Az OpenAI szóvivője megerősítette, hogy a cég valóban dolgozik egy szöveges vízjelzési módszeren– írja az It Business.
„A szöveges vízjelezési módszer, amit fejlesztünk, technikailag ígéretes, de számos kockázattal jár, amelyeket alaposan mérlegelnünk kell, miközben alternatívákat keresünk. Ilyen kockázat például, hogy a rosszindulatú felhasználók kijátszhatják, illetve hogy aránytalanul érintheti a nem angol anyanyelvű felhasználókat” – nyilatkozta a szóvivő.
Az OpenAI nemrég frissítette májusi blogbejegyzését, amely az MI által generált tartalom felismerésére irányuló kutatásokról szólt.
A frissítés szerint a szöveges vízjelezés nagyon pontosnak bizonyult a helyi szintű módosítások, például a parafrázis ellen, de kevésbé ellenálló a globális módosításokkal szemben, mint például a fordítórendszerek használata vagy a szavak közé beillesztett speciális karakterek.
Emiatt úgy látják, hogy ez a módszer „triviálisan kijátszható a rosszindulatú felhasználók által.”