Appena un giorno dopo che OpenAI ha presentato il suo innovativo GPT-4o, in grado di comprendere e discutere ciò che accade in un video, Google ha risposto con un annuncio altrettanto interessante. Durante il keynote della conferenza Google I/O a Mountain View, in California, Demis Hassabis, CEO di Google DeepMind, ha presentato Project Astra, un prototipo di ricerca che promette capacità simili nella comprensione dei video.

Project Astra: la nuova frontiera della ricerca AI

Nel corso della dimostrazione, Project Astra ha mostrato le sue straordinarie abilità. Il modello è stato in grado di identificare oggetti che producono suoni, creare allitterazioni creative, spiegare codici su un monitor e localizzare oggetti fuori posto. Questa intelligenza artificiale ha anche rivelato il suo potenziale nei dispositivi indossabili come gli occhiali intelligenti, dove può analizzare diagrammi, suggerire miglioramenti e generare risposte spiritose a richieste visive.

Come funziona Project Astra?

Elaborando e codificando continuamente fotogrammi video e input vocali, Astra crea una linea temporale di eventi e memorizza le informazioni per un rapido richiamo. Questa capacità di tracciare e ricordare eventi in tempo reale apre nuove possibilità per l’assistenza AI, rendendo le interazioni più fluide e contestualmente pertinenti. Ad esempio, come si vede nel video, se mostrate ad Astra uno schizzo stilizzato di Albert Einstein, sarà in grado di riconoscerlo e fornirvi tutte le informazioni pertinenti, annotandole su un foglio.

Futuro di Project Astra: verso assistenti AI più avanzati

Sebbene Project Astra sia ancora in una fase iniziale senza piani di lancio specifici, Google ha suggerito che alcune delle sue capacità potrebbero essere integrate nei prodotti entro l’anno.  Il CEO di Google, Sundar Pichai, ha descritto questo sviluppo come un tentativo di creare un agente AI con una vera e propria “agenzia”, in grado di “pensare in anticipo, ragionare e pianificare per conto vostro“. Questa visione punta a trasformare l’interazione con l’intelligenza artificiale, rendendola non solo più intuitiva ma anche proattiva. Mentre OpenAI ha già impressionato con GPT-4o, Google dimostra di essere pronta a competere con innovazioni altrettanto rivoluzionarie.