icona app

Blog
giorno commenti 0 visite 482

Google ha appena reso Gemini ancora più potente

Appena due mesi dopo aver distribuito il suo modello di intelligenza artificiale, il colosso ha presentato una nuova versione in grado di gestire audio, video e testi molto più grandi rispetto a GPT-4

Nonostante sia disponibile al pubblico da soli due mesi, Gemini, il modello di intelligenza artificiale di Google, ha già un aggiornamento. Ieri il colosso ha lanciato Gemini Pro 1.5, che è più potente del suo predecessore e può gestire enormi quantità di testo, video o audio.

Demis Hassabis, amministratore delegato DeepMind, la divisione di Google che ha sviluppato il nuovo modello, paragona le capacità di input di Gemini 1.5 alla memoria di lavoro di un essere umano.

Le capacità di Gemini 1.5

In una dimostrazione organizzata da DeepMind, Gemini Pro 1.5 ha analizzato un pdf di 402 pagine contenente la trascrizione delle comunicazioni dell’Apollo 11. Quando gli è stato chiesto di trovare dei passaggi divertenti nel documento, il modello ha evidenziato diverse sezioni, tra cui una in cui gli astronauti hanno attribuito un ritardo nelle comunicazioni a una pausa spuntino. In un’altra demo il sistema di Google è stato in grado di rispondere a diverse domande su scene specifiche di un film di Buster Keaton. La versione precedente di Gemini poteva rispondere a domande relative solo a testi o video molto più brevi. Google spera che le nuove funzionalità consentano agli sviluppatori di creare nuove applicazioni. “Il modo in cui il modello esegue questo tipo di ragionamento su ogni singola pagina e su ogni singola parola è davvero magico“, commenta il ricercatore di DeepMind Oriol Vinyals.

Google riporta che Gemini Pro 1.5 è in grado di processare e capire il senso di video da un’ora, file audio da 11 ore, 700mila parole o 30mila righe di codice in una sola volta, una capacità molto superiore a quella di modelli AI come GPT-4 di OpenAI, che alimenta ChatGPT. Il gigante non ha rivelato i dettagli tecnici che hanno reso possibile questo traguardo. Hassabis ha però dichiarato che una delle applicazioni testata dai ricercatori di Google DeepMind è stata l’identificazione dei punti salienti in discussioni su Discord con migliaia di messaggi.

Gemini Pro 1.5 è anche più performante, come dimostra il punteggio ottenuto dal modello in diversi benchmark. Il nuovo sistema sfrutta una tecnica ideata dai ricercatori di Google per ottimizzare le prestazioni senza aumentare la potenza di calcolo. La metodologia, ribattezzata mixture of expert, attiva in modo selettivo le parti nell’architettura di un modello che sono più adatte a risolvere un determinato compito, rendendone più efficiente l’addestramento e l’esecuzione.

Google fa sapere che Gemini Pro 1.5 è in grado di svolgere un numero di compiti pari a quello del suo prodotto più potente, Gemini Ultra, nonostante si tratti di un modello significativamente più piccolo. Hassabis ha anche detto che non c’è motivo per cui la tecnica utilizzata per migliorare Gemini Pro non possa essere applicata anche a Gemini Ultra.

La versione aggiornata di Gemini Pro sarà resa disponibile agli sviluppatori attraverso AI Studio, una sandbox progettata testare le capacità del modello, e tramite l’Api della piattaforma cloud Vertex AI di Google. Per il momento non c’è ancora una data per il lancio al pubblico.

Google sta anche introducendo nuovi strumenti per aiutare gli sviluppatori a utilizzare Gemini nelle loro applicazioni, tra cui nuovi modi per sfruttare la capacità di analisi audio e video del modello. L’azienda ha reso noto che sta aggiungendo nuove funzionalità basate su Gemini al suo strumento di programmazione web-based, Project IDX, come modalità di debugging e verifiche del codice.

Corsa a rotta di collo

La rapidità con cui Google ha aggiornato Gemini è un segno della sfrenata corsa all’oro dell’intelligenza artificiale innescata dal successo di ChatGPT. All’inizio di questa settimana, OpenAI ha annunciato di aver dotato ChatGPT della capacità di ricordare a lungo termine le informazioni utili inserite dagli utenti. La scorsa settimana Google aveva cambiato il nome al suo chatbot Bard e annunciato che Gemini Ultra sarebbe stato disponibile con un abbonamento a pagamento.

Al ritmo frenetico dei progressi dell’AI generativa fanno da contraltare i timori per i rischi che la tecnologia potrebbe comportare. Google afferma di aver sottoposto Gemini Pro 1.5 a test approfonditi e che l’accesso limitato rappresenta un modo per raccogliere feedback sui potenziali pericoli. L’azienda afferma inoltre di aver fornito l’accesso ai suoi modelli più potenti ai ricercatori dell’AI Safety Institute del Regno Unito, in modo che li possano testare.

Hassabis, nel frattempo, dice di aspettarsi ulteriori progressi nei mesi a venire: “È un ritmo diverso – racconta –. Sto cercando di portare una mentalità da startup“.

Questo articolo è comparso originariamente su Wired US.

Fonte: Wired.it

Riproduzione riservata © La riproduzione è concessa solo citando la fonte con link all'articolo.


Condividi l'articolo con i tuoi amici


Fai conoscere la tua applicazione



Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *



Potrebbe anche interessarti

Waze si aggiorna, nuovi Moods
icona app

Blog

Waze si aggiorna, ecco mappe e moods nuovi

Tra i navigatori GPS disponibili sul mercato, Waze è sicuramente uno dei più usati e apprezzati. I download raccolti finora sono infatti più di 130 milioni e il successo…

Google Assistant, salva posizione del parcheggio dell'auto
icona app

Blog

Google Assistant ti ricorda automaticamente dove hai parcheggiato

Ti capita spesso di dimenticare dove hai parcheggiato la macchina? Complici i grandi parcheggi dei centri commerciali o le strade a volte sconosciute, può succedere di non ricordare più…

Problemi Instagram, avvisi in arrivo
icona app

Blog

Problemi Instagram, l’app pronta ad avvisare gli utenti

Nelle scorse settimane Instagram è stato protagonista, insieme a WhatsApp e Facebook, di un crollo notevole per un numero enorme di ore se si considera la mole assurda di…

Iscriviti alla Newsletter