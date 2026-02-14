Leganerd.com
Menu

Cosa succede quando dai il pieno controllo di Chrome ad un agente AI?

Ryan Whitwam di Ars Technica prova Auto Browse, l’agente AI integrato in Chrome: può navigare e lavorare online, ma errori e pause impongono ancora controllo umano.

di Umberto Stentella
Cosa succede quando dai il pieno controllo di Chrome ad un agente AI?

L’intelligenza artificiale sta entrando in una nuova fase. Dopo anni passati a confrontare chatbot sempre più bravi a rispondere alle domande, le aziende tecnologiche puntano ora agli “agenti”: sistemi capaci di usare direttamente Internet al posto nostro. Google ha iniziato a distribuire Auto Browse, una funzione integrata in Chrome che promette proprio questo. Non più suggerimenti o riepiloghi, ma operazioni concrete eseguite dall’AI.

Il giornalista Ryan Whitwam di Ars Technica ha messo alla prova la novità in diversi scenari pratici per capire quanto sia davvero pronta a sostituire l’utente nelle attività quotidiane.

Capacità sorprendenti, ma molti limiti

Il primo esperimento è stato volutamente semplice: far giocare l’agente a 2048. Auto Browse ha letto le istruzioni presenti sulla pagina, compreso il funzionamento e giocato in autonomia per circa venti minuti. Ha effettuato 149 mosse e creato una tessera da 128 punti. Il risultato è stato discreto, ma ha evidenziato un limite tipico: l’interpretazione rigidamente letterale dei comandi. Quando non poteva più unire tessere, ha concluso la partita anche se c’erano ancora mosse utili.

Quando Whitwam ha provato a usarlo per un compito più realistico, cioè ascoltare una radio online per un’ora e creare una playlist, sono emerse difficoltà più serie. L’agente non riesce a monitorare una pagina a lungo: tende a simulare il passare del tempo e poi interrompe il lavoro.

ai agentica

Modificando l’istruzione e leggendo la lista dei brani già pubblicata, l’AI ha recuperato i titoli. Tuttavia non è riuscita ad aggiungerli a YouTube Music perché non riconosceva i pulsanti dell’interfaccia. La stessa operazione su Spotify ha funzionato immediatamente.

I problemi si sono accentuati con Gmail. Auto Browse può accedere ai dati tramite strumenti interni, ma ha individuato solo due contatti e li ha inseriti in modo errato in un foglio Google Sheets, sovrascrivendo campi e colonne. Non è chiaro se la causa sia la raccolta dei dati o la gestione del foglio di calcolo.

Quando funziona davvero e cosa manca ancora

In alcune situazioni, però, l’agente si è comportato molto meglio. È riuscito a cercare un piano energetico online inserendo parametri precisi, filtrando risultati e scaricando la documentazione in pochi minuti. Anche nel PlayStation Store ha navigato tra le offerte, cambiato filtri e aggiunto giochi alla lista dei desideri, pur fermandosi prima della fine e chiedendo continuamente conferme per motivi di sicurezza.

Google accelera sull’AI: Gemini 3 Flash diventa il nuovo modello predefinito Google accelera sull’AI: Gemini 3 Flash diventa il nuovo modello predefinito

Il risultato complessivo è contrastante. Nella maggior parte dei test Whitwam ha dovuto intervenire, riformulare i comandi o riavviare l’attività. L’agente fatica con alcune interfacce, compresi servizi della stessa Google, e fallisce quando l’operazione richiede attese prolungate.

Auto Browse mostra chiaramente la direzione in cui si sta muovendo l’informatica: computer che agiscono direttamente per conto dell’utente. Ma oggi la promessa è ancora incompleta. Ad ogni modo, questo era vero anche per le prime versioni di chatbot come Gemini e ChatGPT e abbiamo visto quanto rapidamente siano riusciti a vincere le prime difficoltà arrivando agli enormi progressi dei modelli attuali. Insomma, siamo davvero solo agli inizi.

Fonte:
Ti potrebbero interessare