
Hvordan kan en anden test påvirke troen på, at du faktisk er inficeret?
jeg bruger her eksemplet fra Veritasium-kanalen. I dette indlæg vil jeg vise logikken under bayesiske netværk. For flere detaljer i bayes sætning foreslår jeg at se videoen.
den første test

da det er en meget sjælden sygdom (1 ud af 1000 påvirkes) er sandsynligheden for at have virussen i din krop givet ved næste tabel (kaldet en betinget Sandsynlighedstabel):

denne tabel viser, at kun 1 ud af 1000 mennesker har virussen. Det er det samme at sige: 999 ud af 1000 er fri for virussen.
nu laver vi en lignende tabel til test: denne anden tabel viser testens nøjagtighed. Det er testens kapacitet til at fortælle det sande. Så hvis du er inficeret, vil testen være sand med 99% chance, og hvis du ikke er inficeret, vil testen vise falsk (99% nøjagtig også) i begge tilfælde er fejlfrekvensen 1%

den næste graf viser, at virustilstedeværelsen givet resultatet af testen afhænger af testen (som i tabellen ovenfor):

derefter, når jeg giver bevis for, at testen er sand. Netværket viser mig, at tilstedeværelsen af virussen på din krop, da en test er positiv, kun er 9% !

Hvorfor er det? Dette tal kommer fra Bayes sætning:

I dette problem:
𝑃(T|E) = 𝑃(H) × 𝑃(E|H) / 𝑃(E)
𝑃(T|E) = 𝑃(H) × P(E|H) / (𝑃(E|H) × 𝑃(H) + 𝑃(E|Hc) × 𝑃(Ef) )
𝑃(H|E) = 0,99*0,001 / (0,001*0,99 + 0,999*0,01) = 0,9 = 9%
Dette beregninger synes kompliceret, men når der er repræsenteret i grafer, at vi får en bedre intuition om, hvordan bayesiansk tankegang virker.
til to tests:
Hvad sker der, hvis du tager en anden test? Lad os sige, at denne nye test også har 99% nøjagtighed, vi har den samme tabel som den første test:

det tilsvarende bayesiske netværk vil være det næste:

det betyder: for to positive test øges chancen for at få sygdommen til 91%. Den tidligere erfaring uploades. Dette er sammenhængende, chancen for at få sygdommen jums fra 9% til 91%. Men det er ikke 100%!
i et andet tilfælde, hvis den anden test er negativ, er der 100% chance for ikke at have sygdommen.

for tre tests
i tilfælde af tre tests, alle med samme nøjagtighed, ser vi nogle interessante resultater. Hvis du har bevis for, at 3 test er sandt, er det nu 100% sikkert, at du er inficeret med virussen.

Men da en test er falsk, bliver resultatet igen, og det er kun 91% chance for virus tilstedeværelse i din krop:

afslutningsvis hjælper bayesian netværk os med at repræsentere bayesian tænkning, det kan bruges i datalogi, når mængden af data til model er moderat, ufuldstændig og/eller usikker. De kan også bruge ekspertvurdering til at opbygge eller forfine netværket. De gør det muligt at’ simulere ‘ forskellige scenarier. De repræsenterer, hvordan inputværdier (i dette eksempel virus tilstedeværelse og nøjagtighed af testen) er knyttet til et vist niveau af sandsynlighed for output (Sandsynlighed for faktisk at have sygdommen)
i dette indlæg forklarede jeg i hvordan man bygger et bayesisk netværk, startende fra Bayes sætning. Jeg arbejder i øjeblikket på bayesiske netværk for at forudsige omkostninger og risiko for projekter. Jeg ønsker at dele det grundlæggende i opbygningen af sådanne kraftfulde AI værktøj.
hvis du vil vide lidt mere om bayesian netværk:
med hensyn til den vandrette opdeling mellem teori og Data på Modelkildeaksen har bayesiske netværk en særlig egenskab. Bayesiske netværk kan bygges ud fra menneskelig viden, dvs.fra teori, eller de kan læres maskinelt af Data. Således kan de bruge hele spektret som Modelkilde. På grund af deres grafiske struktur er maskinlærte bayesiske netværk visuelt fortolkelige og fremmer derfor menneskelig læring og teoriopbygning. I dette indlæg sammenlignede jeg BN med overvågede læringsalgoritmer og Renforcement Learning.

bayesiske netværk tillader menneskelig læring og maskinlæring at arbejde sammen, dvs.bayesiske netværk kan udvikles ud fra en kombination af menneskelig og kunstig intelligens. Ud over at krydse grænserne mellem teori og Data har bayesiske netværk også særlige kvaliteter vedrørende kausalitet.
dette samarbejde er imidlertid ikke enkelt, for at opbygge Bayesan-netværk er det nødvendigt at vælge flere hyperparametre korrekt.
under visse betingelser og med specifikke teoridrevne antagelser Letter bayesiske netværk kausal slutning. Faktisk kan bayesiske netværksmodeller dække hele området fra Forening/korrelation til årsagssammenhæng.
i praksis betyder det, at vi kan tilføje kausale antagelser (for eksempel ved hjælp af syntetiske noder) til et eksisterende ikke-kausalt netværk og dermed skabe et kausalt bayesisk netværk. Dette er af særlig betydning, når vi forsøger at simulere en intervention i et domæne, såsom at estimere virkningerne af en behandling. I denne sammenhæng er det bydende nødvendigt at arbejde med en kausal model, og bayesiske netværk hjælper os med at foretage denne overgang.