La matematica può sfatare dei luoghi comuni? Facciamo chiarezza con il Teorema di Bayes

Capita molto spesso di sentir citare i dati sulla presenza degli immigrati in carcere con ragionamenti del tipo: “il 40-50% delle persone in carcere sono immigrate quindi ogni due immigrati uno commette un crimine”. Ma anche in questo caso la matematica viene in nostro soccorso per smentire il tutto.

 

carcere

 

Limitiamoci a spiegare perché dal dato citato (carcere piene di stranieri) non deriva necessariamente il fatto che il tasso di criminalità della popolazione immigrata sia per forza enormemente più elevato rispetto a quello degli italiani. La cosa è probabilmente controintuitiva, ma ci si aspetterebbe dagli uomini politici (e dai giornalisti che li intervistano senza obiettare) maggiore approfondimento sulle cose di cui parlano e meno demagogia.

Per spiegare perché l’affermazione è almeno inesatta ci viene in aiuto il teorema di Bayes.

 

L’importanza di Bayes

Per parlare di questo noto teorema la cui idea originaria si deve al reverendo Thomas Bayes, ma che, in realtà, è stato formulato nel modo che conosciamo da Pierre-Simon Laplace, è necessario ricordare il concetto di probabilità condizionata. 

Questo concetto viene introdotto perché in alcuni casi la probabilità che accada qualcosa si modifica se, per qualunque motivo, si viene a conoscenza di una informazione aggiuntiva legata all’evento dato.

Teorema di Bayes o della probabilità delle cause

 

n modo più formale, si parla di probabilità di un evento A condizionata da un evento B e si indica con il simbolo p(A|B). Questa probabilità è data da: p(A|B) = p(A int. B)/p(B).  Non dimostreremo questa formula (anche se non è difficile) che traduce in linguaggio matematico l’idea che la probabilità di un evento può cambiare nel caso in cui  se ne verifica un altro.

Questa formula semplice e all’apparenza innocua nasconde dentro di sé un potere notevole poiché permette la cosiddetta inferenza, ovvero la possibilità di inferire (dedurre) da alcuni dati sperimentali altre informazioni.

 

Come convincere a non fumare

L’aspetto centrale, che rende Bayes utile, è che in molte applicazioni un dato è facilmente ottenibile mentre un altro no. Non possiamo non fare l’esempio istruttivo, anche se drammatico, dei tumori dovuti al fumo.

Quale è la probabilità di avere un tumore dato che si fuma? Questa informazione non è assolutamente scontata (e infatti per lungo tempo le case produttrici di sigarette hanno negato qualunque nesso).

Molto più semplice è ricavare l’informazione di essere fumatori dato che si ha un certo tipo di tumore (basta raccogliere questi dati domandando ai pazienti affetti da quella specifica tipologia di male se erano fumatori o meno). Matematicamente parlando il tutto può essere scritto nel seguente modo: p(T|F) = p(F|T)p(T)/p(F).

fumo di sigaretta

 

La differenza fondamentale, lo ripetiamo per chiarire, è che si è in grado, utilizzando Bayes, di ricavare la probabilità di avere un determinato tumore dato che si fuma a partire dalla probabilità che si fumi avendo un tumore, la probabilità di essere fumatore e la probabilità di tumore.

Per correttezza e per non generare confusione sottolineiamo che è molto più complesso dal punto di vista scientifico dimostrare il nesso di causa ed effetto (nel caso dell’esempio dei tumori dimostrare che il fumo causa tumori). Molto più semplice è invece dire che due grandezze sono fra loro collegate (in linguaggio scientifico si usa il termine correlate) fra loro. Due variabili potrebbero risultare correlate ma non essere legate da un nesso di causa ed effetto. Si potrebbe per esempio scoprire che c’è correlazione fra le persone iscritte in palestra e i possessori di un cellulare di ultima generazione. Questo non vuol dire che andare in palestre è la causa che spiega l’ acquisto di un cellulare. Molto più semplicemente, entrambe sono abitudini maggiormente diffuse nella fascia di popolazione più giovane.

Il teorema di Bayes può anche essere visto come un meccanismo per migliorare le informazioni (quindi un modo per apprendere da cui l’analogia con il nostro cervello) su un evento.

 

Il caso dell’immigrazione

Dopo aver visto il teorema di Bayes cercherò di esprimere in termini probabilistici le affermazioni del politico di turno.Indicherò con la lettera C  l’essere criminali e con la lettera I l’essere immigrati. La probabilità di essere criminali dato che si è immigrati si può, quindi, indicare come p(C|I). Mentre la probabilità di essere immigrati dato che si è criminali con p(I|C). L’errore concettuale del politico sta nell’assumere che queste siano uguali, cosa che il teorema di Bayes dice non essere a priori assolutamente vera.

 

 

La percentuali di persone in carcere immigrate è infatti nota o comunque facilmente ricavabile.

Per semplificare l’analisi, si assume (cosa non sempre vera) che chi sta in carcere sia effettivamente un criminale. Osservo che l’aver dichiarato reato lo stato di clandestinità ha contribuito ad attribuire lo status di criminale a persone che prima non lo erano. Se, per esempio, attribuiamo alla probabilità di essere immigrati p(I) ed a quella di essere criminali p(C). Diamo i seguenti ipotetici valori: p(I) = 0.2 e p(C) = 0.01.

Usando Bayes, si vede il valore 0.045 ottenuto è, in maniera assolutamente controintuitiva, molto più basso di quello che ci si aspetterebbe (non è, in altri termini pari al 90%).

Se avessi utilizzato delle stime vere per alcune combinazioni di dati avremmo addirittura ricavato che il tasso di criminalità fra gli immigrati è confrontabile con quello degli italiani o almeno è confrontabile con quello della popolazione alcune zone geografiche problematiche della stessa Italia. Non è mio compito fare stime di questo tipo che probabilmente si modificano di anno in anno.

Lascia un commento

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.