Dieci anni fa Google e Apple promisero assistenti vocali capaci di fare cose concrete al posto nostro. Siri avrebbe chiamato un Uber. Google Assistant avrebbe ordinato il solito caffè da Starbucks. Entrambe le promesse si rivelarono fumo: Siri apriva l’app, Google Assistant veniva rimosso silenziosamente. Oggi, con i modelli linguistici di nuova generazione, quelle stesse promesse tornano sul tavolo, e stavolta sembrano più solide.

Lo racconta Wired, che ha avuto modo di provare in anteprima la funzione Task Automation di Gemini, presentata all’Unpacked di Samsung. La feature sarà disponibile inizialmente solo negli Stati Uniti e in Corea del Sud, a partire dall’11 marzo sui Galaxy S26, e successivamente come aggiornamento software per i Pixel 10.

Come funziona: Uber, pizza e liste della spesa gestiti da Gemini

Il funzionamento è più sofisticato di quanto ci si potrebbe aspettare. Si chiama Gemini a voce, “Chiamami un Uber per l’aeroporto“, e l’assistente apre l’app in una finestra virtuale, esegue l’operazione in background e torna dall’utente solo se ha bisogno di chiarimenti. Se non è sicuro su quale dei tre aeroporti di New York si intenda, lo chiede. A processo completato, mostra le opzioni di prenotazione: la scelta finale e il pagamento restano in mano all’utente.

La redazione di Wired ha assistito a una dimostrazione più articolata con Grubhub. Sameer Samat, presidente dell’ecosistema Android di Google, ha aperto una chat di gruppo in cui alcuni amici si accordavano per ordinare delle pizze prima di una serata a giochi da tavolo. Ha chiesto a Gemini di interpretare la conversazione e organizzare l’ordine, quindi di effettuarlo su Grubhub. Qualche minuto dopo, tutti gli articoli erano nel carrello, pronti per la conferma finale. In un altro esempio mostrato a Wired, Gemini ha letto una nota su Google Keep con l’elenco degli ospiti di un barbecue, ha calcolato quanti hot dog e panini servissero e ha aggiunto tutto al carrello Safeway su DoorDash.

Quanto è davvero intelligente?

Un aspetto tecnico rilevante, sottolineato da Samat a Wired: Gemini non memorizza una “mappa” statica dell’app, l’approccio che aveva reso fragili i primi agenti AI come il Rabbit R1. Ragiona in tempo reale, guarda lo schermo come farebbe un essere umano e si adatta ai cambiamenti dell’interfaccia. Se il ristorante limita il numero di pizze ordinabili, Gemini torna dall’utente e propone un’alternativa. Se mancano informazioni, le chiede, ma solo quando strettamente necessario.

Sul fronte privacy, Google assicura che i dati visti da Gemini non vengono usati per la pubblicità e possono essere cancellati dall’utente. Per questo motivo, la prima tornata di app supportate esclude categorie sensibili. Samat vede in tutto questo il primo passo verso un’era di intelligenza mobile che potrebbe presto estendersi oltre lo schermo dello smartphone: occhiali smart, pendant AI, persino l’abitacolo dell’auto. L’autenticazione finale, per ora, richiede ancora il telefono in mano, ma anche quello, dice Google, potrebbe cambiare. Vi fidereste ad affidare la vostra vita – fosse anche solo per ordinare una pizza – ad un’AI automatizzata?