Modelul de inteligenta artificiala Gemini 2.0 de la Google

5 min readDec 13, 2024

Cea mai recenta iteratie a modelului de inteligenta artificiala Gemini 2.0 de la Google aduce produse ale gigantului din domeniul cautarilor cu rezultate multimodale, utilizare nativa a instrumentelor si abilitati agentiale
Google a anuntat Gemini 2.0, cel mai recent model din linia sa de modele de limbaj de mari dimensiuni care vizeaza organizarea informatiilor din lume.

Sundar Pichai, CEO al Google si al companiei-mama Alphabet, a declarat intr-o declaratie ca Gemini 2.0 „ne va permite sa construim noi agenti AI care ne vor aduce mai aproape de viziunea noastra privind un asistent universal” si a mentionat ca modelul incorporeaza „noi progrese in materie de multimodalitate — cum ar fi imagini native si iesire audio — si utilizarea nativa a instrumentelor”.

„Daca Gemini 1.0 a fost despre organizarea si intelegerea informatiilor, Gemini 2.0 este despre a le face mult mai utile”, a spus el. „Abia astept sa vad ce aduce aceasta noua era”.

Pichai a declarat ca capabilitatile noului model sunt „sustinute de investitii de zeci de ani in abordarea noastra diferentiata full-stack pentru inovarea AI”. Acesta este construit pe hardware personalizat, cum ar fi unitatile de procesare Tensor (TPU) de a sasea generatie ale companiei, care au alimentat toate activitatile de formare si inferenta pentru Gemini 2.0.

Gemini 2.0 Flash este disponibil pentru dezvoltatori si utilizatori

Google lanseaza, de asemenea, Gemini 2.0 Flash, o versiune experimentala a modelului cu „latenta redusa si performante imbunatatite la varful tehnologiei noastre, la scara larga”, potrivit lui Demis Hassabis, CEO al DeepMind, unitatea de cercetare a inteligentei artificiale a Google, si Koray Kavukcuoglu, CTO al Google DeepMind.

https://www.youtube.com/watch?v=Fs0t6SdODd8&list=TLGGMofxrWjSuuYxMjEyMjAyNA

„Gemini 2.0 Flash se bazeaza pe succesul lui 1.5 Flash, cel mai popular model al nostru de pana acum pentru dezvoltatori, cu performante imbunatatite la timpi de raspuns la fel de rapizi”, au declarat acestia. „In mod notabil, 2.0 Flash depaseste chiar si 1.5 Pro in benchmark-uri cheie, la o viteza de doua ori mai mare”.

Modelul este disponibil acum pentru dezvoltatori prin API-urile AI ale Google si pentru utilizatorii chatbotului AI Gemini. Utilizatorii Gemini din intreaga lume pot accesa o versiune optimizata pentru chat a modelului prin selectarea acestuia in lista derulanta de modele din versiunile web pentru desktop si mobile ale aplicatiei. Modelul va fi disponibil in curand in aplicatiile mobile Gemini.

Hassabis si Kavukcuoglu au declarat ca, pe langa faptul ca accepta intrari multimodale precum imagini, video si audio, Gemini 2.0 Flash „accepta acum iesiri multimodale precum imagini generate nativ amestecate cu text si audio multilingv text-to-speech (TTS) directionabil”. De asemenea, modelul poate apela in mod nativ instrumente precum Google Search, executie de cod si functii terte definite de utilizator.

Pentru a ajuta dezvoltatorii sa creeze aplicatii cu noul model, Google lanseaza, de asemenea, un API Multimodal Live care accepta intrari de streaming audio si video in timp real, precum si posibilitatea de a utiliza mai multe instrumente combinate.

Prototipurile de cercetare prezinta abilitatile AI agentice

Google a prezentat, de asemenea, mai multe prototipuri de cercetare construite cu Gemini 2.0 care urmaresc sa demonstreze abilitatile „agentice” ale modelului de a lua masuri si de a indeplini sarcini in numele utilizatorilor.

Important

2x: Gemini 2.0 Flash depaseste modelul 1.5 Pro in principalele benchmark-uri, la o viteza dubla.
83.5%: Project Mariner, un prototip de cercetare construit cu Gemini 2.0, a obtinut un rezultat de varf de 83,5% la criteriul de referinta WebVoyager, care testeaza performanta agentului in sarcini web reale.
1 miliard de persoane: Functia Google AI Overviews din Search, care va incorpora capacitatile Gemini 2.0, ajunge acum la 1 miliard de persoane.

Project Astra, prezentat pentru prima data la conferinta dezvoltatorilor I/O a companiei, este un prototip de asistent AI universal pe care Google l-a testat cu un grup restrans de utilizatori. Cea mai recenta versiune construita cu Gemini 2.0 prezinta un „dialog mai bun” cu posibilitatea de a conversa in mai multe limbi, noi capacitati de utilizare a instrumentelor, memorie imbunatatita si latenta redusa.

„Lucram pentru a aduce aceste tipuri de capabilitati la produsele Google, cum ar fi aplicatia Gemini, asistentul nostru AI, si la alti factori de forma, cum ar fi ochelarii”, a declarat Pichai. „Si incepem sa extindem programul nostru de testare de incredere la mai multe persoane, inclusiv un grup mic care va incepe in curand testarea Project Astra pe prototipuri de ochelari.”

Un alt produs, Project Mariner, este „un prototip de cercetare timpurie construit cu Gemini 2.0 care exploreaza viitorul interactiunii om-agent, incepand cu browserul dumneavoastra”, au declarat Hassabis si Kavukcuoglu. Prin intermediul unei extensii experimentale a browserului Chrome, agentul este capabil sa „inteleaga si sa rationeze prin intermediul informatiilor din ecranul browserului” si sa indeplineasca sarcini pentru utilizatori.

Directorii DeepMind au declarat ca Project Mariner a obtinut rezultate de ultima ora in cadrul benchmark-ului WebVoyager, care testeaza performanta agentilor AI in sarcini web reale. „Este inca devreme, dar Project Mariner arata ca devine posibil din punct de vedere tehnic sa navighezi intr-un browser, chiar daca astazi nu este intotdeauna precis si lent in indeplinirea sarcinilor, ceea ce se va imbunatati rapid in timp”, au spus acestia.

In cele din urma, Jules este un agent experimental de cod AI care se integreaza cu platforma de dezvoltare software GitHub. „Acesta poate aborda o problema, dezvolta un plan si il poate executa, toate sub conducerea si supravegherea unui dezvoltator”, potrivit directorilor DeepMind. „Acest efort face parte din obiectivul nostru pe termen lung de a construi agenti AI care sunt utili in toate domeniile, inclusiv in codare.”

https://agentpromovator.ro/consultanta-in-marketing-digital/

Gemini 2.0 va fi disponibil pentru mai multe produse Google

Pichai a declarat ca Gemini 2.0 este deja testat intr-o maniera limitata in functia Google AI Overviews din Search, capacitatile avansate de rationament ale modelului fiind utilizate pentru a „aborda subiecte mai complexe si intrebari cu mai multi pasi, inclusiv ecuatii matematice avansate, interogari multimodale si codare”. Acesta a declarat ca functia va fi lansata pe scara mai larga la inceputul anului viitor.

„La inceputul anului viitor, vom extinde Gemini 2.0 la mai multe produse Google”, a spus el. „Niciun produs nu a fost transformat mai mult de AI decat Search. Privirile noastre de ansamblu AI ajung acum la un miliard de oameni, permitandu-le sa puna tipuri complet noi de intrebari — devenind rapid una dintre cele mai populare functii de cautare ale noastre.”

Cresteti rapid rezultatele in cautarile organice, cu ajutorul serviciilor de marketing online oferite de Mario Grigorescu — Consultant in Marketing certificat Google si MOZ, pana in Prima Pagina Google!

Urmariti-ma pe LinkedIn. Vizitati site-ul meu web.

Adaugati AgentPromovator.ro la feedul dvs. de Stiri Google

Modelul de inteligenta artificiala Gemini 2.0 de la Google

Gemini 2.0 Flash este disponibil pentru dezvoltatori si utilizatori

Prototipurile de cercetare prezinta abilitatile AI agentice

Important

Gemini 2.0 va fi disponibil pentru mai multe produse Google

Written by Mario Grigorescu

No responses yet