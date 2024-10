Negli ultimi sette anni, Nathan Benaich, fondatore e partner unico della società di investimenti in AI Air Street Capital, ha pubblicato un rapporto annuale chiamato “State of AI“. Questo report, di carattere autorevole, fornisce una panoramica dettagliata delle capacità in evoluzione della tecnologia, del panorama delle aziende che la sviluppano, di come l’AI viene implementata e delle sfide che il settore deve ancora affrontare.

L’avanzata dei LLM rivali

Uno dei principali punti evidenziati nel rapporto di quest’anno, pubblicato la scorsa settimana, è che il vantaggio di OpenAI rispetto ad altri laboratori di intelligenza artificiale si è notevolmente ridotto. Modelli come Claude 3.5 Sonnet di Anthropic, Gemini 1.5 di Google, Grok 2 di X e persino Llama 3.1 405 B di Meta, hanno eguagliato o addirittura superato GPT-4o di OpenAI in alcuni benchmark. Tuttavia, OpenAI conserva ancora un vantaggio momentaneo nelle attività di ragionamento grazie al suo modello o1 “Strawberry”, che il rapporto descrive come una curiosa combinazione di capacità logiche eccezionalmente forti in alcuni ambiti, ma sorprendentemente deboli in altri.

Le AI diventano sempre più economiche

Un altro punto chiave emerso dal rapporto riguarda il rapido calo dei costi di utilizzo di un modello di AI già addestrato, un’attività nota come “inferenza”. Questo calo è dovuto a vari fattori. In primo luogo, con i modelli che mostrano prestazioni e capacità sempre più simili, le aziende sono costrette a competere sul prezzo. Inoltre, ingegneri di aziende come OpenAI e Anthropic, insieme ai loro partner come Microsoft e AWS, stanno scoprendo modi per ottimizzare l’esecuzione dei modelli più grandi su cluster di GPU avanzati. Oggi il costo per token degli output di GPT-4o è 100 volte inferiore rispetto al momento del debutto di GPT-4 nel marzo 2023. Anche Google, con il suo Gemini 1.5 Pro, ha ridotto i costi per token del 76% rispetto al lancio del modello a febbraio 2024.