SELECT

Il Cimitero Dimenticato della Statistica

.

Stalin affermava che un milione di morti sono solo una statistica. In economia non sono nemmeno quello.

Eccoci nuovamente con perché trovo questa robaccia su un sito di nerd? il quarto d’ora di economia di dubbia utilità.

Un po’ di tempo fa caxxeggiavo in aeroporto in attesa di decollare, in questi casi mi faccio sempre un giro nelle librerie per vedere qualche titolo (che comunque non comprerò ma che cercherò in biblioteca) ed ecco che sorprendo a sorridermi da uno scaffale il classico “Le caratteristiche per diventare ricchi” o un titolo simile.

Ora, posto che l’unico modo in cui un libro simile ti possa arricchire è scriverlo, mi aveva fatto venir voglia di scrivere un post sul cimitero dimenticato della statistica (una suggestiva immagine che frego cito da Taleb).

Oggi quindi si parla di statistica, economia e leggi di potenza, potete considerarlo un approfondimento del mio spoiler alla fine dell’articolo sui mercati TWTA.

Campane, code lunghe e effetto King Kong.

Iniziamo a parlare di statistica.
Il mondo fisico ci ha abituato a pensare in termini di distribuzioni normali, gaussiane e campane: fondamentalmente i fenomeni osservati tendono a collocarsi intorno a una media e a creare una campana più o meno ampia a seconda della varianza misurata del fenomeno stesso.

Una grossa mano in tal senso ci viene dal teorema centrale del limite.
Nel 1922 Lindeberg e successivamente Turing dimostrano che “se si ha una somma di variabili aleatorie X_i indipendenti e identicamente distribuite (con densità uguali) con media μ e varianza σ2, allora indipendentemente dalla forma distributiva di partenza, al tendere della dimensione campionaria a infinito la somma tende a distribuirsi come una variabile casuale normale” (e questa è la definizione nabba di wikipedia).

In altre parole qualsiasi variabile, purché indipendente, se osservata un numero molto grande di volte si approssimerà a una distribuzione normale.

Questo è molto bello e molto utile, sono infiniti i campi in cui una bella distribuzione normale ti toglie le castagne dal fuoco, talmente bello che spesso però si tende a generalizzare e a usarla anche quando non centra un tubero.

Con effetto king kong si intende, all’interno della logistica di distribuzione, un punto molto fuori scala rispetto a una serie di osservazioni, talmente fuori scala da essere in grado di falsare una prospezione.
Esempio pratico: lead time di consegna per i pezzi x, misuro il trasporto su camion e ottengo una media di 2 ore con una deviazione standard di 20 minuti (il che, statisticamente parlando, significa che tra le 1 e le 3 ore io ricevo il 99% delle spedizioni), bene adesso ipotizziamo che uno dei camion venga aggredito dai pirati spaziali e tenuto in ostaggio per 100 ore, io ho una serie di misurazioni 2, 2,2 2,4 1,7 1,3 2,1 etc. e poi ho 100, in questi casi, per prevedere correttamente i tempi si tende a tagliare via i punti king kong, si finge che quel camion non esista, la probabilità che un altro camion ci metta 100 ore è talmente bassa che viene eliminata evitando così che “sporchi” la previsione.
E vi assicuro che in logistica funziona alla grande.

Bene, la mia statistica classica (gaussiana) è in grado di prevedere un king kong? Bhe teoricamente si, in quanto una distribuzione normale ha delle code che tendono a infinito, ossia esiste sempre una probabilità (per quanto infima) che un punto sia lontanissimo dalla media e quindi abbia un valore sballato rispetto alle osservazioni.
Ovviamente utilizzando una distribuzione normale non prevederò mai a priori una cosa simile ma tutto sommato mi sta anche bene, le distribuzioni normali servono appunto ad altro.
Prendendo a prestito la fisica: se tiro la palla contro il muro certo che può succedermi che la palla attraversi il muro ma, siamo seri, non succederà mai.
L’area della distribuzione normale preposta a contemplare gli eventi incredibili è sotto le due codine, più l’evento è incredibile più la coda sarà lunga (ossia più sarò lontano dalla media).

Ecco una bella immagine della campanella di Gauss e delle sue codine (perchè la campana di Gauss è una bella ragazza con le codine, l’unica che frequenterai a ingegneria).

LEGANERD 047437

Fisica ed Economia

Bene il problema grosso della statistica è che l’economia non segue la distribuzione normale, la fisica lo fa ed è ottimo, la meccanica pure, l’elettrotecnica anche e tutto ciò va benissimo, ma l’economia no.

Facciamo questo esempio: prendiamo 100 persone e mettiamole in uno stadio poi fuciliamole misuriamone il peso, mettiamo che la media sia circa 80 kg.
Ora prendiamo la persona più pesante del mondo (diciamo 300 kg) e aggiungiamola al conteggio, quanto diventerà la media? Bhe cambierebbe di molto poco (circa 2kg) e la varianza crescerebbe un pochetto, nulla di ingestibile.

Ora facciamo la media dei guadagni di queste persone, diciamo 1000 euro (siamo in Italia) e aggiungiamo loro la persona più ricca del mondo (diciamo Bill Gates) come cambierebbe la media?
Bhe la media non avrebbe più alcun senso, risulterebbe che ogni persona guadagnerebbe in media milioni di dollari e la varianza sarebbe talmente alta da rendere impossibile ogni affermazione.

Ora che abbiamo finito fuciliamoli facciamogli fare un po’ di sport visto che siamo allo stadio, sopratutto al grassone.

Il problema è che l’economia non segue le leggi della fisica per quanto riguarda le distribuzioni, ma le cosiddette leggi di potenza, ossia i valori sono estremamente disparati e, sopratutto, certi valori sono talmente fuori scala da essere praticamente imprevedibili attraverso una distribuzione normale.

Le Leggi di potenza

E’ il 1897 quando un giovane ingegnere torinese (è nato in Francia ma ha studiato a Torino come tutti gli ingegneri seri quindi è di Torino), enuncia una sconcertante verità: “la maggior parte degli effetti è determinata dalla minor parte delle cause”.
Di qui poi empiricamente si è voluto dargli un valore numerico il famosissimo 80/20 ossia l’80% degli effetti è generato dal 20% delle cause.
Questo sistema è incredibilmente attuale in economia ossia le distribuzioni in economia seguono leggi di potenza decisamente peggiori: pochissimi catalizzano tutto (robe di 99/1 ma più spesso 99,9999999/0,0…1 insomma avete capito).
I perché sono stati esposti nell'articolo precedente.

Questo è un gran problema perché le leggi di potenza hanno il brutto difetto di essere scarsamente prevedibili e con scarsamente prevedibili intendo non prevedibili.

Alcuni esempi che abbiamo davanti agli occhi tutti i giorni sono ad esempio le app per cellulari: perché Angry Birds ha milioni di milioni di download e Space Connect no?.
Perchè Twilight ha venduto miliardi di copie e Altai no?
Non c’è un motivo, o meglio ce ne sono talmente tanti che è impossibile modellarli e quindi non sapremo quale sarà il prossimo Twilight ne il prossimo Angry Birds.

Il problema grosso è che quasi tutte le attività umane funzionano con leggi di potenza, una cosa che facciamo fatica ad accettare perché è contro intuitiva ma, soprattutto, perché nessuno visita mai il cimitero dimenticato.

Il Cimitero Dimenticato

Che cosa è il cimitero dimenticato?
Il cimitero dimenticato è dove sono sepolte le restanti 80% delle cause che ha dato origine solo al 20% degli effetti.

Li troveremo i 400 libri che settimanalmente il NY Times scarta, le app senza nome che nessuno scarica, i giochi per pc invenduti insomma tutti i tentativi che non hanno passato la soglia critica e quindi sono scomparsi.

Qui non finiscono i prodotti o le idee sbagliati o fatti male (bhe si anche quelli) ma semplicemente quelli sfortunati.

Porto due esempi per chiarire.
Tutti noi conosciamo Casanova e i suoi libri/consigli per baccagliare.
Bene, Casanova era un figo che ha baccagliato centinaia di donne, il suo metodo sarà infallibile… FALSO.

Casanova era un figo nessun dubbio ma il suo metodo è considerato valido solo perchè lui ha avuto fortuna.
Durante la storia si sono succeduti migliaia di uomini e donne che erano delle macchine da baccaglio come e anche più di Casanova semplicemente queste persone non sono diventate famosi, magari sono morte in un viaggio, o si sono sposate o, più semplicemente, nessuno ha scritto libri su di loro.
E i loro metodi erano buoni quanto e più di quelli di Casanova, ma nessuno li conoscerà mai.

Esempio più recente: chi conosce Einstein?
Tutti of course, le sue geniali battute, il suo humor e la sua intelligenza ne hanno fatto la figura epica che è! FALSO!
Einstein è stato un genio nessun dubbio ma quanti geni hanno lavorato alla meccanica quantistica? Centinaia, gente come Plank, come Heisenberg, Dirac, Bragg, Herzen, Bohr etc.
Tutte queste persone erano intelligenti come Einstein (o comunque molto intelligenti) e scommetto che molti di loro erano spiritosi e simpatici e con la battuta pronta (tranne quel nazista del cazzo Heisenberg) semplicemente hanno avuto sfortuna e ora riposano nel cimitero dimenticato.

La verità è questa: quanti libri raccontano la storia di un manager fallito? Nessuno.
Di un manager vincente? Migliaia.
Eppure queste persone hanno avuto fortuna, hanno azzeccato un evento in una coda lunga.
Ci sono milioni di persone, molto migliori di loro, che non hanno avuto fortuna e, visto che nessuno racconta le loro storie, le loro caratteristiche non contano e nessuno le conoscerà mai.
E si continuerà a credere che “studiare calligrafia” sia importante perché Jobs l’ha fatto e Jobs era un genio, non dico che non lo sia, ma dico che Paolo ha studiato ornitologia poi però la sua azienda è fallita, avesse fatto il botto ora diremmo “bisogna studiare ornitologia perché Paolo l’ha fatto e Paolo è un genio”.

La verità è che i grandi successi nell’economia si possono spiegare solo retroattivamente, ma retroattivamente non serve a nulla, non ci dà informazioni su cosa dobbiamo essere o fare per avere successo.

Questo è il cimitero dimenticato, l’economia, e le persone tendono a dimenticare chi fallisce e tutte le sue capacità/particolarità, siano essi persone, idee o progetti anche molto validi.

Conclusioni

Perché è importante il cimitero dimenticato?
Perché ci dà una misura di come funzionano le cose.
Ci dice che se 10.000 falliscono e 1 riesce non è perché quel tipo fosse il migliore tra quei 10.000 ma perchè ha avuto fortuna.
Le segretarie di Microsoft hanno avuto fortuna non “hanno creduto nel sogno di Bill” perchè le segretarie di Mariosoft hanno creduto in Mario ma sono morte povere e magari Mario aveva più capacità e idee migliori di Bill.

Questo è molto più importante di quello che normalmente si considera, bisogna capire che viviamo in un mondo fondamentalmente irrazionale e scarsamente prevedibile e predittibile, bisogna quindi essere preparati a questo sia nel bene che nel male.
Le programmazioni migliori non sono quelle che tengono conto di tutti gli scenari possibili (perché è impossibile) ma quelle che considerano anche gli eventi marginali ma potenzialmente disastrosi, così come quelli marginali ma potenzialmente spettacolari.

Noi siamo portati a considerare solo gli eventi probabili o molto probabili e a dimenticare quelli improbabili, il che va bene se questi accadimenti hanno nullo o scarso effetto, ma va male se invece, pur essendo improbabili, hanno impatti devastanti.
Questo genere di programmazione costa un po’ di più ma ripaga, il problema è che è contro-intuitiva e nessuno la mette in atto, perché preoccuparsi di un possibile terremoto in una zona che non ha sismi da 500 anni?
Perché può succedere e se succede è disastroso.

Inoltre conoscere il cimitero dimenticato può evitarci un economia basata sulla copia di chi o cosa ce l’ha fatta, perchè nel caso una cattiva idea passasse per “fortuna” rischieremmo di replicarla con effetti disastrosi (tipo bolle speculative, dottrine economiche, tecnologie etc.).

Gli economisti che si occupano di seguire questi campi hanno regole molto semplici: scommetti sull’improbabile e investi sul probabile.
Se ci sono 10 motori di ricerca investi in tutti e 10 un pochetto, potrebbe esserci il nuovo Google, ma il grosso investilo in Google, sono soldi garantiti che ti ripagheranno dei 9 (o anche 10) altri investimenti che andranno male.

Le caratteristiche personali di ciascuno sono importanti e nessuno lo vuole negare, ma in economia non contano, o meglio non contano quando le cose si fanno serie, da li in poi il nostro controllo è nullo.

E’ una lezione che tendiamo a dimenticare, mi spiace dirvelo ma nessuno di voi è speciale, nessuno di voi ha il talento che lo renderà famoso, però qualcuno può essere fortunato.
Questo significa anche che i vostri sogni non porteranno mai a nulla, o meglio, magari qualcuno si, ma per molti no, quindi abbiate un piano B abbastanza solido da sostenervi quando cadrete.

E’ saggio scommettere su ciò che possiamo controllare, anche l’economia ha i suoi campi che seguono regole più prevedibili: se sono ingegnere guadagnerò di più di 9999 scrittori di libri; poi guadagnerò un milionesimo della Rowling ma guadagnerò il doppio o il triplo degli altri 9999.
Possiamo controllare le cose finché non si fanno serie, cerchiamo di farlo, investiamo il grosso su ciò che è “sicuro”.

E ogni volta che qualcosa ci sembra incredibile facciamoci un giro nel cimitero dimenticato, a portare un fiore sulla tomba del 99% che ha fallito, ci aiuterà a considerare le cose nella giusta ottica, l’ottica che descrive il mondo in cui viviamo.

Ponti

Teorema centrale del limite
Leggi di potenza
Gaussiane
Nassin Taleb – Il Cigno Nero
Nassin Taleb – Giocati dal Caso

Mercato immobiliare: tempi di vendita in base alle città
Mercato immobiliare: tempi di vendita in base alle città
COVID-19: uno studio esamina i compromessi tra economia e salute pubblica
COVID-19: uno studio esamina i compromessi tra economia e salute pubblica
L'Homo Oeconomicus
L'Homo Oeconomicus
Ignobel 2016: Le ricerche più improbabili
Ignobel 2016: Le ricerche più improbabili
Breaking Ferrero: conviene essere onesti?
Breaking Ferrero: conviene essere onesti?
Ricchezza e povertà: l'indice di Gini
Ricchezza e povertà: l'indice di Gini
Cronaca di una Truffa su Internet
Cronaca di una Truffa su Internet