
Come può un secondo test influenzare la convinzione che sei davvero infetto?
Sto usando qui l’esempio dal canale Veritasium. In questo post voglio mostrare la logica sotto reti bayesiane. Per maggiori dettagli nel teorema di bayes suggerisco di vedere il video.
Il primo test

Dal momento che si tratta di una malattia molto rara (1 su 1000 è interessato) La probabilità di avere il virus nel vostro corpo è dato dalla tabella successiva (Chiamato una Probabilità Condizionale Tabella):

Questa tabella mostra che solo 1 su 1000 persone hanno il virus. Questo è lo stesso da dire: 999 in 1000 sono liberi dal virus.
Ora facciamo una tabella simile per fare test: Questa seconda tabella mostra la precisione del test. Questa è la capacità del test di dire il vero. Quindi, se si sono infettati con il test sarà vero, con il 99% di possibilità, e se non si è infettato il test mostrerà Falsi (99% di precisione) In entrambi i casi il tasso di errore è 1%

Il grafico seguente mostra che la presenza di virus dato il risultato del test dipende dalla prova (come nella tabella di cui sopra):

Quindi, quando fornisco la prova che il test è Vero. La rete mi mostra che la presenza del virus sul tuo corpo, dato che un test è positivo, è solo del 9%!

Perché? Questo numero deriva dal teorema di Bayes:

In questo problema:
𝑃(H|E) = 𝑃(H) × 𝑃(E|H) / 𝑃(E)
𝑃(H|E) = 𝑃(H) × P(E|H) / (𝑃(E|H) × 𝑃(H) + 𝑃(E|Hc) × 𝑃(Ce) )
𝑃(H|E) = 0,99*0,001 / (0,001*0,99 + 0,999*0,01) = 0,9 = 9%
Questo calcoli sembra complicato, ma una volta rappresentato nei grafici, si ha una maggiore intuizione su come bayesiano pensare funziona.
Per due prove:
Cosa succede se fai un secondo test? Diciamo che questa nuova prova anche il 99% di accuratezza, abbiamo la stessa tabella della prima prova:

La corrispondente rete bayesiana sarà il prossimo:

Che significa: per due test positivo la possibilità di avere la malattia aumentare al 91%. L’esperienza precedente viene caricata. Questo è coerente, la possibilità di avere la malattia salta dal 9% al 91%. Ma non è al 100%!
In un altro caso, se il secondo test è negativo, c’è il 100% di possibilità di non avere la malattia.

Per Tre test
Nel caso di tre prove, tutte con la stessa precisione, vediamo alcuni risultati interessanti. Se hai la prova che il test 3 è vero, ora è sicuro al 100% che sei stato infettato dal virus.

Ma dal momento che un test è falso, il risultato si trasforma di nuovo, ed è solo il 91% di probabilità di presenza di virus nel vostro corpo:

In conclusione, la rete bayesiana ci aiuta a rappresentare il pensiero bayesiano, può essere utilizzata nella scienza dei dati quando la quantità di dati da modellare è moderata, incompleta e/o incerta. Possono anche utilizzare il giudizio degli esperti per costruire o perfezionare la rete. Permettono di’ simulare ‘ diversi scenari. Rappresentano come i valori di input (in questo esempio la presenza del virus e l’accuratezza del test) sono collegati a un certo livello di probabilità dell’output (probabilità di avere effettivamente la malattia)
In questo post ho spiegato come costruire una rete bayesiana, partendo dal teorema di Bayes. Attualmente sto lavorando su reti bayesiane per prevedere costi e rischi dei progetti. Voglio condividere le basi della costruzione di tale potente strumento AI.
Se vuoi saperne un po ‘ di più sulle reti bayesiane:
Per quanto riguarda la divisione orizzontale tra Teoria e dati sull’asse Sorgente del modello, le reti bayesiane hanno una caratteristica speciale. Le reti bayesiane possono essere costruite dalla conoscenza umana, cioè dalla Teoria, o possono essere apprese dalla macchina dai Dati. Pertanto, possono utilizzare l’intero spettro come fonte del modello. Inoltre, grazie alla loro struttura grafica, le reti bayesiane apprese dalla macchina sono visivamente interpretabili, promuovendo quindi l’apprendimento umano e la costruzione della teoria. In questo post ho confrontato BN con algoritmi di apprendimento supervisionati e Apprendimento Renforcement.

Le reti bayesiane consentono all’apprendimento umano e all’apprendimento automatico di lavorare in tandem, cioè le reti bayesiane possono essere sviluppate da una combinazione di intelligenza umana e artificiale. Oltre a superare i confini tra Teoria e dati, le reti bayesiane hanno anche qualità speciali riguardanti la causalità.
Tuttavia, questa collaborazione non è semplice, per costruire reti Bayesan è necessario selezionare diversi iperparametri in modo appropriato.
In determinate condizioni e con specifiche ipotesi basate sulla teoria, le reti bayesiane facilitano l’inferenza causale. In effetti, i modelli di rete bayesiana possono coprire l’intero intervallo dall’Associazione/correlazione alla causalità.
In pratica, ciò significa che possiamo aggiungere ipotesi causali (ad esempio usando nodi sintetici) a una rete non causale esistente e, quindi, creare una rete bayesiana causale. Questo è di particolare importanza quando cerchiamo di simulare un intervento in un dominio, come la stima degli effetti di un trattamento. In questo contesto, è imperativo lavorare con un modello causale e le reti bayesiane ci aiutano a fare questa transizione.