Az OpenAI új GPT-4o asszisztense már énekelve mesél
Helyi idő szerint péntek este hétkor az OpenAI élőben mutatta be gépi modelljének újdonságait, a GPT-4-nek a kiadását, a GPT-4o Omnimodel nevezetű mesterséges intelligenciát, amit a következő hetekben mindenki számára elérhetővé tesz, beleértve a ingyenes felhasználókat is.
Az OpenAI bemutatja a legújabb GPT-4o modellt, mely mostantól ingyenesen is elérhető a ChatGPT felhasználók számára.
A modell a következő hetekben folyamatosan, mindenki számára elérhetővé teszi, és további fejlett eszközöket is ingyenesen biztosít a ChatGPT felhasználók számára. A négyes után az “o” nem nulla, hanem az Omnimodel elnevezés jelölése, ezzel különbözteti meg a még várhatóan készülőfélben lévő 5-ös verziótól, mely ki tudja, mekkorát fog robbanni. A bemutató alapján azt kell mondjuk, hogy a GPT-40 lényeges előretörést mutat a gyakorlati felhasználás terén.
Íme az élő bejelentés legfontosabb tanulságai
A bemutatóban egymás szavába vágva beszélgettek a géppel, nem volt szükség arra, hogy a ChatGPT értelmezze majd “homokórázva” átgondolja válaszát. Az élő videóképek értelmezése is azonnali élményt adott. A GPT-4o az OpenAI legújabb fejlesztése, amely a korábbi GPT-4 modell intelligenciáját biztosítja, de gyorsabb és hatékonyabb a szöveg-, hang- és kép feldolgozás terén.
Az új modell képes a felhasználó által megosztott képek megértésére és megvitatására is.
Például egy más nyelven írt menüt is fel tud fordítani, információt ad az ételek történetéről és jelentőségéről, valamint ajánlásokat is tehet. A jövőben tervezett fejlesztések lehetővé teszik majd a természetesebb, valós idejű hangalapú beszélgetést és a ChatGPT-vel folytatott valós idejű videós kommunikációt is. Ha arra kérjük, hogy meséljen nekünk, akkor még a mesélő stílusát is módosíttathatjuk, legyen az átlagos, drámai vagy énekelve mesélő.
Az OpenAI GPT fejlesztőknek szóló API sebességek és az árazás változása 2023. március óta
A modell nyelvi képességeit jelentősen fejlesztették mind sebesség, mind minőség szempontjából. A ChatGPT most már több mint 50 nyelven érhető el, beleértve a felhasználói beállításokat és egyéb funkciókat is. Az OpenAI az új modellt először a ChatGPT Plus és Team felhasználók számára teszi elérhetővé, a vállalati felhasználók hamarosan hozzáférhetnek majd. A GPT-4o elérhetővé válik az ingyenes felhasználói számára is, bár itt bizonyos használati korlátokkal.
A GPT-4o használatával a ChatGPT ingyenes felhasználói is hozzáférhetnek olyan funkciókhoz, mint az adatelemzés, diagramkészítés, fényképekkel való csevegés, fájlok feltöltése elemzés, összefoglalás vagy írás céljából, valamint a GPT-k és a GPT Store felfedezése és használata. Az új fejlesztések nemcsak az AI eszközök elérhetőségét célozzák, hanem azok hasznosságát is növelik. Az OpenAI küldetése részeként minden héten több mint százmillió ember használja a ChatGPT-t, és az új eszközök bevezetését a következő hetekben folytatni fogják.
Az OpenAI egy új asztali alkalmazást is piacra dob macOS-re, amely lehetővé teszi a felhasználók számára, hogy zökkenőmentesen integrálják a ChatGPT-t a számítógépen végzett munkájukba. A programot egy egyszerű billentyűparanccsal (Option + Space) lehet aktiválni, és közvetlenül a képernyőről készített képernyőképek megvitatására is használható. A Windows verzió érkezéséről egyelőre nincsen hírünk.
A bemutató során kiderül, hogy az új ChatGPT-4o
- képes az élő párbeszédre,
- képes a videókamerát élőben szemként használni,
- képes valódi segítséget adni matematika tanulásban,
- képes különféle nyelvek között élő tolmácsként működni,
- képes képernyőkép alapján programot értelmezni,
- a jelenlegi megoldásnál jobban képes egy grafikont elemezni és arról beszélgetni,
- képes különféle hangnemben, stílusban beszélni és szórakoztatni a hallgatót,
- képes élő kameraképen és mikrofonon át értelmezni a másik fél érzelmeit, hangulatát.
Abba most nem mennénk bele, hogy kik munkája került még veszélybe azátlal, hogy megjelent a GPT-40, ezt az olvasók fantáziájára bízzuk.
Az esti élő videós bemutatót az alábbi YouTube videóban lehet megtekinteni, ahol további részletek is kiderülnek az új funkciókról és a modell jövőbeni terveiről.
Az OpenAI Twitteren közzétett további demói itt érhetőek el:
Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN
Text and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx
— OpenAI (@OpenAI) May 13, 2024
Kép forrása: OpenAI