
Wie kann ein zweiter Test den Glauben beeinflussen, dass Sie tatsächlich infiziert sind?
Ich verwende hier das Beispiel aus dem Veritasium-Kanal. In diesem Beitrag möchte ich die Logik unter Bayes-Netzwerken zeigen. Für weitere Details in Bayes Theorem schlage ich vor, das Video zu sehen.
Der erste Test

Da es sich um eine sehr seltene Krankheit handelt (1 von 1000 ist betroffen), wird die Wahrscheinlichkeit, dass sich das Virus in Ihrem Körper befindet, in der nächsten Tabelle (bedingte Wahrscheinlichkeitstabelle genannt) angegeben):

Diese Tabelle zeigt, dass nur 1 von 1000 Menschen das Virus hat. Das ist das gleiche zu sagen: 999 in 1000 sind frei von dem Virus.
Jetzt machen wir eine ähnliche Tabelle für den Test: Diese zweite Tabelle zeigt die Genauigkeit des Tests. Das ist die Fähigkeit des Tests, das Wahre zu sagen. Also, wenn Sie infiziert sind, wird der Test mit 99% Chance wahr sein, und wenn Sie nicht infiziert sind, wird der Test Falsch zeigen (99% genau zu) In beiden Fällen ist die Fehlerrate 1%

Die nächste Grafik zeigt, dass die Viruspräsenz angesichts des Testergebnisses vom Test abhängt (wie in der obigen Tabelle):

Dann, Wenn ich den Beweis gebe, dass der Test wahr ist. Das Netzwerk zeigt mir, dass das Vorhandensein des Virus in Ihrem Körper, da ein Test positiv ist, nur 9% beträgt !

Warum ist das so? Diese Zahl stammt aus dem Bayes-Theorem:

In diesem problem:
𝑃(H|E) = 𝑃(H) × 𝑃(E|H) / 𝑃(E)
𝑃(H|E) = 𝑃(H) × P(E|H) / (𝑃(E|H) × 𝑃(H) + 𝑃(E|Hc) × 𝑃(EG) )
𝑃(H|E) = 0,99*0,001 / (0,001*0,99 + 0,999*0,01) = 0,9 = 9%
Diese Berechnungen scheint kompliziert, aber einmal dargestellt in Grafiken, bekommen wir eine bessere intuition, wie die Bayes-denken funktioniert.
Für zwei Tests:
Was passiert, wenn Sie einen zweiten Test machen? Nehmen wir an, dass dieser neue Test auch 99% Genauigkeit hat, wir haben die gleiche Tabelle wie der erste Test:

Das entsprechende bayessche Netzwerk wird das nächste sein:

Das bedeutet: Bei zwei positiven Tests steigt die Wahrscheinlichkeit, an der Krankheit zu erkranken, auf 91%. Die vorherige Erfahrung wird hochgeladen. Aus diesem Grund sinkt die Wahrscheinlichkeit, an der Krankheit zu erkranken, von 9% auf 91%. Aber es ist nicht 100%!
In einem anderen Fall, wenn der zweite Test negativ ist, besteht eine 100% ige Chance, die Krankheit nicht zu haben.

Für drei Tests
Bei drei Tests, alle mit der gleichen Genauigkeit, sehen wir einige interessante Ergebnisse. Wenn Sie Beweise dafür haben, dass 3 Test wahr sind, jetzt ist es 100% sicher, dass Sie mit dem Virus infiziert sind.

Aber da ein Test falsch ist, dreht sich das Ergebnis wieder, und es ist nur 91% Chance auf Viruspräsenz in Ihrem Körper:

Es kann in der Datenwissenschaft verwendet werden, wenn die zu modellierende Datenmenge moderat, unvollständig und / oder unsicher ist. Sie können auch Expertenurteile verwenden, um das Netzwerk aufzubauen oder zu verfeinern. Sie ermöglichen es, verschiedene Szenarien zu ’simulieren‘. Sie stellen dar, wie Eingabewerte (in diesem Beispiel Viruspräsenz und Genauigkeit des Tests) mit einer bestimmten Wahrscheinlichkeit der Ausgabe (Wahrscheinlichkeit, tatsächlich die Krankheit zu haben) verknüpft sind
In diesem Beitrag habe ich erklärt, wie man ein Bayessches Netzwerk aufbaut, ausgehend vom Bayes-Theorem. Ich arbeite derzeit an Bayes’schen Netzwerken, um Kosten und Risiken von Projekten vorherzusagen. Ich möchte die Grundlagen des Aufbaus eines solchen leistungsstarken KI-Tools teilen.
Wenn Sie mehr über Bayes’sche Netze erfahren möchten:
Bezüglich der horizontalen Trennung zwischen Theorie und Daten auf der Modellquellenachse weisen Bayes’sche Netze eine besondere Eigenschaft auf. Bayes’sche Netzwerke können aus menschlichem Wissen, also aus der Theorie, aufgebaut oder aus Daten maschinell erlernt werden. So können sie das gesamte Spektrum als Modellquelle nutzen. Aufgrund ihrer grafischen Struktur sind maschinell erlernte Bayessche Netzwerke auch visuell interpretierbar und fördern so das menschliche Lernen und die Theoriebildung. In diesem Beitrag habe ich BN mit überwachten Lernalgorithmen und Renforcement Learning verglichen.

Bayes’sche Netzwerke ermöglichen das Tandem von menschlichem Lernen und maschinellem Lernen, d.h. Bayes’sche Netzwerke können aus einer Kombination von menschlicher und künstlicher Intelligenz entwickelt werden. Über das Überschreiten der Grenzen zwischen Theorie und Daten hinaus haben Bayessche Netzwerke auch besondere Eigenschaften in Bezug auf die Kausalität.
Diese Zusammenarbeit ist jedoch nicht einfach, um Bayesan-Netzwerke aufzubauen, müssen mehrere Hyperparameter entsprechend ausgewählt werden.
Unter bestimmten Bedingungen und mit spezifischen theoriegetriebenen Annahmen ermöglichen Bayes’sche Netzwerke kausale Inferenz. Tatsächlich können Bayessche Netzwerkmodelle den gesamten Bereich von Assoziation / Korrelation bis Kausalität abdecken.
In der Praxis bedeutet dies, dass wir einem bestehenden nicht-kausalen Netzwerk kausale Annahmen hinzufügen (z. B. mithilfe synthetischer Knoten) und somit ein kausales Bayessches Netzwerk erstellen können. Dies ist von besonderer Bedeutung, wenn wir versuchen, einen Eingriff in einer Domäne zu simulieren, z. B. die Abschätzung der Auswirkungen einer Behandlung. In diesem Zusammenhang ist es unerlässlich, mit einem Kausalmodell zu arbeiten, und Bayessche Netzwerke helfen uns bei diesem Übergang.