Il New York Times vieta l'uso dei suoi articoli per addestrare le IA: "fatelo e vi facciamo causa..."

Il New York Times ha adottato misure preventive per impedire che i suoi contenuti siano utilizzati per addestrare modelli di intelligenza artificiale. Come riportato da Adweek, il 3 agosto, il NYT ha aggiornato i suoi Termini di Servizio per proibire l’utilizzo dei suoi contenuti – che includono testo, fotografie, immagini, clip audio/video, metadati o compilazioni – nello sviluppo di “qualsiasi software, incluse, a titolo esemplificativo, la formazione di un sistema di apprendimento automatico o intelligenza artificiale (AI)”.

I termini aggiornati specificano ora che strumenti automatizzati come i crawler di siti web, progettati per utilizzare, accedere o raccogliere tali contenuti, non possono essere usati senza il permesso scritto del giornale. Il NYT ha dichiarato che il mancato rispetto di queste nuove restrizioni potrebbe risultare in multe o sanzioni non specificate. Nonostante l’introduzione delle nuove regole, il giornale non sembra aver apportato modifiche al suo file robots.txt, che guida i crawler dei motori di ricerca su quali URL possono essere accessibili.

Recentemente, Google ha annunciato i suoi termini di servizio per specificare che addestrerà i suoi servizi basati su IA utilizzando tutti i dati pubblici che raccoglie dal web. Questa mossa del NYT potrebbe essere una risposta all’aggiornamento recente della politica sulla privacy di Google, che rivela come il gigante della ricerca possa raccogliere dati pubblici dal web per addestrare i suoi servizi AI, come Bard o Cloud AI.