Indagine sull'uso non autorizzato dei video di YouTube per l'addestramento dell'IA: impatti etici e normativi dei dati

Nel mondo sempre più digitale di oggi, le grandi aziende tecnologiche come Apple, Nvidia e Anthropic stanno adottando approcci controversi per alimentare i loro avanzati modelli di intelligenza artificiale. Secondo una recente indagine di Proof News, queste aziende hanno utilizzato migliaia di video di YouTube per addestrare le loro IA, spesso senza il consenso dei creatori originali.

Il set di dati in questione, noto come YouTube Subtitles, contiene trascrizioni da video educativi e di intrattenimento, incluso materiale da celebri canali come Khan Academy e show televisivi. Questo approccio solleva importanti questioni etiche e legali riguardo alla protezione dei diritti d’autore e alla privacy online.

YouTube Subtitles, pubblicato nel 2020, contiene anche i sottotitoli di oltre 12.000 video che nel frattempo sono stati cancellati da YouTube. In almeno un caso, il creatore ha cancellato la sua intera presenza online, ma quel lavoro è stato incorporato in un numero imprecisato di modelli di intelligenza artificiale.

Proof News ha cercato di contattare i proprietari dei canali citati in questa storia. Molti non hanno risposto alle richieste di commento. Tra i creators, nessuno era a conoscenza del fatto che le loro informazioni fossero state prese, tanto meno di come fossero state utilizzate.

David Pakman, noto per il David Pakman Show, ha espresso preoccupazioni sul fatto che i suoi video siano stati utilizzati senza il suo consenso. Pakman sottolinea che, mentre le grandi aziende traggono benefici dall’uso dei dati di YouTube, i creatori spesso non ricevono alcun compenso per il loro lavoro.

Al di là delle controversie, il fenomeno evidenzia anche il potenziale dei dati di YouTube nel migliorare le capacità delle IA nel riconoscimento del linguaggio e nell’analisi dei contenuti multimediali. Tuttavia, l’uso non autorizzato di tali dati solleva domande cruciali sul diritto alla proprietà intellettuale e sulla trasparenza nel trattamento dei dati online.

La comunità dei creators e gli esperti del settore chiedono maggiore regolamentazione e trasparenza per garantire che le future innovazioni nel campo dell’IA rispettino e promuovano una collaborazione etica tra tecnologia e contenuti digitali.

In sintesi, mentre l’IA continua a rivoluzionare diversi settori, è essenziale affrontare le sfide etiche e legali associate all’uso dei dati, assicurando un equilibrio tra innovazione tecnologica e rispetto dei diritti individuali nel panorama digitale moderno.

I dirigenti di OpenAI si sono ripetutamente rifiutati di rispondere pubblicamente a domande sull’utilizzo di video di YouTube per addestrare il suo prodotto di intelligenza artificiale Sora, che crea video a partire da messaggi di testo. All’inizio di quest’anno, un giornalista del Wall Street Journal ha posto la domanda a Mira Murati, Chief Technology Officer di OpenAI.

“In realtà non ne sono sicura”, ha risposto Murati.