Leganerd.com
Menu

Cosa succede quando dai il pieno controllo di Chrome ad un agente AI?

Ryan Whitwam di Ars Technica prova Auto Browse, l’agente AI integrato in Chrome: può navigare e lavorare online, ma errori e pause impongono ancora controllo umano.

Cosa succede quando dai il pieno controllo di Chrome ad un agente AI?

L’intelligenza artificiale sta entrando in una nuova fase. Dopo anni passati a confrontare chatbot sempre più bravi a rispondere alle domande, le aziende tecnologiche puntano ora agli “agenti”: sistemi capaci di usare direttamente Internet al posto nostro. Google ha iniziato a distribuire Auto Browse, una funzione integrata in Chrome che promette proprio questo. Non più suggerimenti o riepiloghi, ma operazioni concrete eseguite dall’AI.

Il giornalista Ryan Whitwam di Ars Technica ha messo alla prova la novità in diversi scenari pratici per capire quanto sia davvero pronta a sostituire l’utente nelle attività quotidiane.

Capacità sorprendenti, ma molti limiti

Il primo esperimento è stato volutamente semplice: far giocare l’agente a 2048. Auto Browse ha letto le istruzioni presenti sulla pagina, compreso il funzionamento e giocato in autonomia per circa venti minuti. Ha effettuato 149 mosse e creato una tessera da 128 punti. Il risultato è stato discreto, ma ha evidenziato un limite tipico: l’interpretazione rigidamente letterale dei comandi. Quando non poteva più unire tessere, ha concluso la partita anche se c’erano ancora mosse utili.

Quando Whitwam ha provato a usarlo per un compito più realistico, cioè ascoltare una radio online per un’ora e creare una playlist, sono emerse difficoltà più serie. L’agente non riesce a monitorare una pagina a lungo: tende a simulare il passare del tempo e poi interrompe il lavoro.

ai agentica

Modificando l’istruzione e leggendo la lista dei brani già pubblicata, l’AI ha recuperato i titoli. Tuttavia non è riuscita ad aggiungerli a YouTube Music perché non riconosceva i pulsanti dell’interfaccia. La stessa operazione su Spotify ha funzionato immediatamente.

I problemi si sono accentuati con Gmail. Auto Browse può accedere ai dati tramite strumenti interni, ma ha individuato solo due contatti e li ha inseriti in modo errato in un foglio Google Sheets, sovrascrivendo campi e colonne. Non è chiaro se la causa sia la raccolta dei dati o la gestione del foglio di calcolo.

Quando funziona davvero e cosa manca ancora

In alcune situazioni, però, l’agente si è comportato molto meglio. È riuscito a cercare un piano energetico online inserendo parametri precisi, filtrando risultati e scaricando la documentazione in pochi minuti. Anche nel PlayStation Store ha navigato tra le offerte, cambiato filtri e aggiunto giochi alla lista dei desideri, pur fermandosi prima della fine e chiedendo continuamente conferme per motivi di sicurezza.

Google accelera sull’AI: Gemini 3 Flash diventa il nuovo modello predefinito Google accelera sull’AI: Gemini 3 Flash diventa il nuovo modello predefinito

Il risultato complessivo è contrastante. Nella maggior parte dei test Whitwam ha dovuto intervenire, riformulare i comandi o riavviare l’attività. L’agente fatica con alcune interfacce, compresi servizi della stessa Google, e fallisce quando l’operazione richiede attese prolungate.

Auto Browse mostra chiaramente la direzione in cui si sta muovendo l’informatica: computer che agiscono direttamente per conto dell’utente. Ma oggi la promessa è ancora incompleta. Ad ogni modo, questo era vero anche per le prime versioni di chatbot come Gemini e ChatGPT e abbiamo visto quanto rapidamente siano riusciti a vincere le prime difficoltà arrivando agli enormi progressi dei modelli attuali. Insomma, siamo davvero solo agli inizi.

Ti potrebbero interessare