Google alza ulteriormente il ritmo nella corsa all’intelligenza artificiale e lo fa con Gemini 3 Flash, un nuovo modello pensato per essere rapido, versatile e sostenibile nei costi. Presentato come evoluzione diretta di Gemini 2.5 Flash, arriva a pochi mesi dal lancio della versione precedente e diventa subito il modello predefinito nell’app Gemini e nella modalità AI della ricerca.

Prestazioni, benchmark e velocità

Secondo i dati condivisi da Google, Gemini 3 Flash offre un salto prestazionale netto rispetto alla generazione passata, arrivando in alcuni test a competere con modelli di fascia più alta. Sul benchmark Humanity’s Last Exam, progettato per valutare competenze avanzate in domini differenti, il modello ha raggiunto il 33,7% senza uso di strumenti, contro l’11% di Gemini 2.5 Flash e valori molto vicini a Gemini 3 Pro e GPT-5.2. Ancora più significativo il risultato nel test MMMU-Pro, dedicato a ragionamento e multimodalità, dove Gemini 3 Flash ha superato tutti i concorrenti con un punteggio dell’81,2%.

L’obiettivo dichiarato è chiaro: offrire un modello “da lavoro quotidiano”, in grado di gestire flussi rapidi e ripetibili, analisi video, estrazione dati e risposte visive, mantenendo tempi di risposta ridotti. Google sottolinea anche un’efficienza superiore nei task complessi, con un utilizzo medio di token inferiore del 30% rispetto a Gemini 2.5 Pro, un dettaglio che incide direttamente sui costi operativi.

Diffusione globale e sfida a OpenAI

Gemini 3 Flash viene distribuito globalmente come impostazione standard, lasciando comunque agli utenti la possibilità di scegliere Gemini 3 Pro per attività più specialistiche come matematica e coding. Il modello è già utilizzato da aziende come JetBrains, Figma e Cursor tramite Vertex AI e Gemini Enterprise, mentre per gli sviluppatori è disponibile in anteprima via API e nel nuovo strumento Antigravity.

Sul fronte dei prezzi, Google ha fissato il costo a 0,50 dollari per milione di token in input e 3,00 dollari per milione in output, leggermente sopra Gemini 2.5 Flash ma con prestazioni superiori e velocità triplicata. «Posizioniamo Flash come il nostro modello tuttofare», ha spiegato Tulsee Doshi, responsabile dei modelli Gemini, aggiungendo che questa strategia consente alle aziende di gestire attività su larga scala in modo più efficiente.

Il lancio arriva in un contesto di forte competizione con OpenAI. Google afferma di processare oltre mille miliardi di token al giorno tramite API e osserva un settore in continua accelerazione. «Quello che sta succedendo nell’industria è che tutti questi modelli continuano a migliorare, a sfidarsi e a spingere più avanti il limite», ha dichiarato Doshi. Un messaggio che racconta bene la fase attuale dell’AI generativa