final_keyword_header.width-1200.format-webp

Gemini: Il nuovo e più capace modello di AI di Google

Ci si aspettava una notizia sulla Ai da parte di Google, ma in molti si aspettavano presentazioni con effetto WoW o qualcosa di concreto su cui poter mettere le mani, invece nulla di questo.

Perché in molti si aspettavano questo? Semplice, Google ha perso molto terreno nei confronti di OpenAi rischiando di perderlo di vista, e, a prima vista (IMHO) Gemini non sembra il prodotto che li farà recuperare, ma stando ai fatti…

In tarda serata (orario Italiano) è uscito fuori un “nuovo” progetto Google in merito alla Ai denominato Gemini, nel loro sito https://blog.google/technology/ai/google-gemini-ai/#availability hanno esplicitato quelle che saranno le sue funzionalità, le abbiamo riassunte per voi qui di seguito.

Da sempre, la missione di Google è stata quella di organizzare le informazioni del mondo per renderle universalmente accessibili e utili. Tuttavia, con l’espansione delle informazioni in termini di scala e complessità, il compito è diventato sempre più impegnativo. La risposta a questa sfida arriva con Gemini, il nuovo modello di intelligenza artificiale di Google.

Sergey Brin, uno dei fondatori di Google, ha spiegato che l’interesse per l’IA è nato dalla convinzione che questa tecnologia sia cruciale per il progresso dell’umanità. La società umana si basa sui cinque sensi, e il mondo che ci circonda è composto da diverse modalità sensoriali. Gemini rappresenta un passo importante verso un modello di IA veramente universale, in grado di comprendere e interagire con il mondo in tutte le sue sfaccettature.

La peculiarità di Gemini è la sua capacità multimodale nativa. A differenza dei modelli tradizionali, che combinano modelli separati per testo, visione e audio in modo non ottimale, Gemini è stato progettato fin dall’inizio per lavorare con tutte queste modalità in modo sinergico. Questo gli permette di gestire conversazioni e fornire risposte di alta qualità in modo naturale e fluido.

Gemini è il modello più grande e avanzato di Google, in grado di comprendere il mondo non solo attraverso il testo, ma anche tramite codice, audio, immagini e video. Ciò che lo rende straordinario è la sua eccellente performance su una vasta gamma di benchmark. In oltre 50 aree di test diverse, si è dimostrato all’altezza degli esperti umani, un risultato straordinario che apre nuove prospettive per l’utilizzo di questa tecnologia in tutti i prodotti Google.

Gemini è disponibile in tre varianti: Gemini Ultra, il modello più grande e potente per compiti altamente complessi; Gemini Pro, il miglior modello per una vasta gamma di attività; e Gemini Nano, il modello più efficiente per compiti su dispositivi mobili.

Google si impegna a fornire le migliori basi per lo sviluppo, ma sono gli sviluppatori e i clienti aziendali a dover sfruttare appieno il potenziale di Gemini. Le possibilità sono pressoché illimitate, e la missione di Google è quella di rendere l’IA accessibile e utile a tutti.

Un aspetto fondamentale di Gemini è la sua sicurezza e responsabilità. Con l’aumentare delle capacità dei sistemi di IA, sorgono nuove sfide, soprattutto quando si tratta di multimodalità, come immagini, audio e video.

Google è consapevole di questi rischi e ha sviluppato politiche proattive per affrontarli, con particolare attenzione alla sicurezza informatica e alla riduzione di eventuali bias o tossicità nei risultati.

La collaborazione con esperti esterni e l’adozione di benchmark estesi sono parte integrante dell’approccio di Google alla sicurezza. L’azienda sta lavorando a stretto contatto con organizzazioni come ML Commons e partecipando a iniziative come il “Safe AI framework” per garantire che i modelli di IA siano responsabili e sicuri.

In sintesi, Gemini rappresenta un passo avanti cruciale nell’evoluzione dell’IA di Google. Con capacità multimodali native, Gemini è in grado di comprendere il mondo in tutte le sue forme, dalla scrittura al codice, dall’audio al video. La sua implementazione aprirà nuove opportunità in molteplici settori, dalla programmazione competitiva al riconoscimento audio, rendendo l’IA di Google più accessibile e utile che mai. Tuttavia, l’azienda è consapevole della necessità di garantire la sicurezza e la responsabilità di questo potente strumento, assicurandosi che il progresso tecnologico vada di pari passo con una riflessione etica e responsabile.

Per concludere, come detto ad inizio articolo non sono molto convinto che Gemini sia il mezzo attraverso il quale riusciranno a raggiungere la distanza creata verso OpenAi, ma Google dalla sua ha un forte potere, quello di avere diversi dispositivi (vedi ad esempio Google Pixel 8) e tools proprietari e sui cui sicuramene integrerà i sistemi di Intelligenza  Artificiale e portando quindi gli utenti al loro uso.

Ai posteri l’ardua sentenza…