
hogyan befolyásolhatja egy második teszt azt a hitet, hogy valóban fertőzött?
itt a Veritasium csatorna példáját használom. Ebben a bejegyzésben a Bayes-hálózatok logikáját szeretném bemutatni. További részletek a bayes tétel azt javaslom, hogy a videót.
az első teszt

mivel ez egy nagyon ritka betegség (1 Az 1000-ben érintett), a vírus testében való valószínűségét a következő táblázat adja meg (feltételes valószínűségi táblázatnak nevezik):

ez a táblázat azt mutatja, hogy csak 1 1000 ember rendelkezik a vírussal. Ugyanez mondható el: 999 1000-ben mentes a vírustól.
most hasonló táblázatot készítünk a teszt készítéséhez: ez a második táblázat mutatja a teszt pontosságát. Ez a teszt azon képessége, hogy elmondja az igazat. Tehát, ha fertőzött, a teszt 99% – os eséllyel igaz lesz, ha pedig nem fertőzött, akkor a teszt hamis (99% – os pontosságú is) mindkét esetben a hibaarány 1%

a következő grafikon azt mutatja, hogy a teszt eredménye alapján a vírus jelenléte a teszttől függ (mint a fenti táblázatban):

akkor, amikor bizonyítékot adok arra, hogy a teszt igaz. A hálózat azt mutatja, hogy a vírus jelenléte a testén, mivel egy teszt pozitív, csak 9% !

miért van ez? Ez a szám a Bayes-tételből származik:

ez A probléma:
𝑃(H|E) = 𝑃(H) × 𝑃(E|H) / 𝑃(E)
𝑃(H|E) = 𝑃(H) × P(E|H) / (𝑃(E|H) × 𝑃(H) + 𝑃(E|Hc) × 𝑃(Ek) )
𝑃(H|E) = 0,99*0,001 / (0,001*0,99 + 0,999*0,01) = 0,9 = 9%
Ez a számítások bonyolultnak tűnik, de ha egyszer képviselt grafikonok, egy jobb, intuíció, hogyan bayes gondolkodás működik.
két vizsgálat esetében:
mi történik, ha második tesztet végez? Tegyük fel, hogy ez az új teszt 99% – os pontossággal is rendelkezik, ugyanaz a táblázat van, mint az első teszt:

a megfelelő Bayes-hálózat lesz a következő:

ez azt jelenti: két pozitív teszt esetén a betegség esélye 91% – ra nő. A korábbi tapasztalatok feltöltésre kerülnek. Ez koherens, annak esélye, hogy a betegség 9% – ról 91% – ra csökken. De ez nem 100%!
egy másik esetben, ha a második teszt negatív, 100% esély van arra, hogy nem szenved a betegség.

három teszthez
három teszt esetében, mindegyik azonos pontossággal, érdekes eredményeket látunk. Ha bizonyítéka van arra, hogy a 3 teszt igaz, most 100% – ban biztos, hogy fertőzött a vírussal.

de mivel egy teszt hamis, az eredmény újra megfordul, és csak 91% esélye van a vírus jelenlétének a szervezetben:

összefoglalva, a Bayes-hálózat segít a Bayes-I gondolkodás ábrázolásában, akkor használható az adattudományban, ha a modellezni kívánt adatok mennyisége mérsékelt, hiányos és/vagy bizonytalan. Szakértői megítélést is felhasználhatnak a hálózat kiépítéséhez vagy finomításához. Lehetővé teszik a különböző forgatókönyvek szimulálását. Ezek azt mutatják, hogy a bemeneti értékek (ebben a példában a vírus jelenléte és a teszt pontossága) hogyan kapcsolódnak a kimenet bizonyos valószínűségi szintjéhez (a betegség tényleges valószínűsége)
ebben a bejegyzésben elmagyaráztam hogyan építsünk Bayes-hálózatot, a Bayes-tételből kiindulva. Jelenleg a Bayes-I hálózatokon dolgozom, hogy megjósoljam a projektek költségeit és kockázatát. Szeretném megosztani az ilyen erőteljes AI eszköz építésének alapjait.
ha egy kicsit többet szeretne tudni a bayesi hálózatokról:
ami az elmélet és az adatok horizontális megosztását illeti a modell forrás tengelyén, a bayesi hálózatoknak különleges jellemzőjük van. A Bayes-hálózatok építhetők emberi tudásból, azaz elméletből, vagy gépi tanulhatók adatokból. Így a teljes spektrumot Modellforrásként használhatják. Grafikus felépítésüknek köszönhetően a gépi Bayes-hálózatok vizuálisan értelmezhetők, így elősegítik az emberi tanulást és az elméletépítést. Ebben a bejegyzésben összehasonlítottam a BN-t a felügyelt tanulási algoritmusokkal és a Renforcement tanulással.

a Bayes-I hálózatok lehetővé teszik az emberi tanulás és a gépi tanulás párhuzamos működését, azaz a Bayes-I hálózatok az emberi és a mesterséges intelligencia kombinációjából fejleszthetők ki. Az elmélet és az adatok közötti határok átlépésén túl a Bayes-I hálózatoknak különleges tulajdonságaik vannak az okság tekintetében is.
ez az együttműködés azonban nem egyszerű, a Bayesan hálózatok kiépítéséhez több hiperparamétert kell megfelelően kiválasztani.
bizonyos feltételek mellett és konkrét elméletvezérelt feltételezésekkel a bayesi hálózatok megkönnyítik az oksági következtetést. Valójában a bayesi hálózati modellek az Asszociációtól/Korrelációtól az ok-okozati Összefüggésig terjedhetnek.
a gyakorlatban ez azt jelenti, hogy oksági feltételezéseket adhatunk (például szintetikus csomópontok használatával) egy meglévő nem oksági hálózathoz, és így létrehozhatunk egy oksági bayesi hálózatot. Ez különösen fontos, ha megpróbálunk szimulálni egy beavatkozást egy tartományban, például megbecsüljük a kezelés hatásait. Ebben az összefüggésben elengedhetetlen az ok-okozati modell kidolgozása, és a Bayes-hálózatok segítenek ebben az átmenetben.