Bemutatkozik a Gemini 2.0 chatbot, amely a Google innovatív lépése a mesterséges intelligencia ügynökök új korszakának elindítására!
Megérkezett a Google Gemini chatbotjának 2.0-ás verziója, ami a cég szerint már a mesterséges intelligencia ágensek korszakára készült. Az amerikai techvállalat szerdai bejelentésében azt állítja, hogy a Gemini 2.0 előrelépéseket tesz a multimodalitás, vagyis a szöveg mellett képek, vagy hanganyagok kezelése és generálása terén, és lehetővé teszi majd olyan új AI-ágensek létrehozását, amik közelebb hozzák az univerzális digitális asszisztens álmát.
A The Verge cikkéből kiderül, hogy a 2.0-ás modellcsaládból jelenleg csak a belépő szintű verzió, a 2.0 Flash érhető el a felhasználók számára. A legújabb, 1.5 Prót váltó fejlettebb modell érkezése még várat magára. A 2.0 Flash-t a Gemini chatbot online felületén "kísérleti modell" megjelöléssel találjuk, és a Google hangsúlyozza, hogy "előfordulhat, hogy nem az elvárt módon működik".
Demis Hassabis, a Google DeepMind vezetője, így nyilatkozott a 2.0 Flashről: "Lényegében olyan kiemelkedő, mint a jelenlegi Pro modell." A szakember idén megosztott kémiai Nobel-díjat kapott az AlphaFold2 fehérjekutató algoritmusának kifejlesztéséért. Hassabis szerint a Gemini 2.0 Flash a korábbi verzióhoz képest egy szinttel tovább fejlődött, miközben az operációs sebessége és költséghatékonysága változatlan maradt (a normál felhasználók számára a modell ingyenesen hozzáférhető). A Google ambiciózus tervei között szerepel a Gemini 2.0 integrálása a keresőrendszerükbe.
Hassabis véleménye szerint a szövegek mellett képesek képeket és hangokat is feldolgozni az újmodell-család tagjai, ami megalapozza a mesterséges intelligencia következő jelentős előrelépését: az AI-ágenseket. Ezek a botok arra hivatottak, hogy a felhasználók nevében végezzenek el különféle feladatokat. Egy jó példa erre a Project Mariner, amely egy kísérleti böngésző kiegészítő. Ez a megoldás automatizálja a Chrome böngészőben végzett tevékenységeket, például segíthet abban, hogy gyorsan megtalálja egy táblázatban szereplő cégek elérhetőségeit, ha arra kérjük.
„A 2025-ös esztendőt az ágens-alapú kor valódi kezdeteként értékeljük” – nyilatkozta Hassabis. Hozzátette, hogy a modellek fejlettségén túl fontos a válaszok gyorsaságára és a hatékonyságuk növelésére is koncentrálni. Különösen most, hogy a GPT-4 tavalyi bemutatkozása óta a chatbotok fejlődése látszólag megtorpant.