Bedingte Wahrscheinlichkeiten

Titelblatt einer Tageszeitung "Schule macht kriminell"
[quote]Das Bundeskriminalamt hat festgestellt, dass fast alle Personen, die Schwerverbrecher geworden sind, zuvor in der Schule waren. Schicken Sie Ihr Kind nicht auf die Schule folgert der Reporter, denn Schule macht kriminell[/quote][br]Kann man diese Behauptung so stehen lassen? Natürlich nicht. Was hier passiert ist, ist ein beliebter Fehler, der von Persönlichkeiten des öffentlichen Lebens, wie Politiker:innen oder Reporter:innen immer wieder gemacht wird. Manchmal aus Dummheit und manchmal auch mit Absicht, um manipulative Aussagen zu treffen:[br][color=#980000][b]Hier wurden zwei bedingte Wahrscheinlichkeiten vertauscht![/b][/color][br]Nehmen Sie die gesamte deutsche Bevölkerung. Nun suchen Sie sich nur diejenigen heraus, die Schwerverbrecher:innen geworden sind. Und dann stellen Sie fest, mit welcher Wahrscheinlichkeit diese früher zur Schule gegangen sind. Das heißt [color=#980000][i]die Wahrscheinlichkeit dafür, dass jemand zur Schule gegangen ist, [b]unter der Bedingung[/b], dass es ein:e Schwerverbrecher:in ist[/i][/color].[br]Betrachten wir den Fall nun anders herum: Sie suchen sich aus der deutschen Bevölkerung all diejenigen heraus, die zur Schule gegangen sind. Dann stellen Sie fest, mit welcher Wahrscheinlichkeit von diesen jemand ein:e Schwerverbrecher:in geworden ist. Dies ist [color=#980000]die Wahrscheinlichkeit, dass jemand Schwerverbrecher:in geworden ist, [b]unter der Bedingung[/b], dass diese Person vorher zur Schule gegangen ist[/color].[br][br]Wenn man sich die beiden Situationen genau ansieht, dann sieht man leicht, dass diese beiden Wahrscheinlichkeiten zwar einen ähnlichen Namen habe, aber etwas völlig unterschiedliches sind.[br][br]Mathematisch schreibt man das folgendermaßen auf: Definieren wir die Ereignisse[br][list][*] [math]\mathbf{V}[/math]: jemand ist Verbrecher:in geworden[/*][*] [math]\mathbf{S}[/math]: jemand ist zur Schule gegangen[/*][/list]Dann ist[br][list][*][math]\text{\Large{$P_V(S)$}}[/math] oder [math]\text{\Large{$P(S\vert V)$}}[/math] [color=#980000][i]die Wahrscheinlichkeit dafür, dass jemand zur Schule gegangen ist, [b]unter der Bedingung[/b], dass es ein:e Schwerverbrecher:in ist[/i][/color][/*][*][math]\text{\Large{$P_S(V)$}}[/math] oder [math]\text{\Large{$P(V\vert S)$}}[/math] [color=#980000]die Wahrscheinlichkeit, dass jemand Schwerverbrecher:in geworden ist, [b]unter der Bedingung[/b], dass diese Person vorher zur Schule gegangen ist[/color][/*][/list]Beide Schreibweisen für solche bedingten Wahrscheinlichkeiten sind in Lehrbüchern zu finden
Befragen einer ausgewählten Teilgruppe
Es ist in Sachzusammenhängen oft schwer, zwischen den Wahrscheinlichkeiten [math]P(A\cap B)[/math] und [math]P_A(B)[/math] bzw. [math]P_B(A)[/math] zu unterscheiden. Sehen wir uns das im oben stehenden Beispiel an: Das Ereignis [math]V[/math] steht für "Person ist ein Schwerverbrecher" und das Ereignis [math]S[/math] steht für "Person ist zur Schule gegangen". Dann gilt:[br][list][*][math]P(S\cap V)[/math] ist die Wahrscheinlichkeit dafür, dass eine Person sowohl ein Schwerverbrecher ist, als auch zur Schule gegangen ist. Mit anderen Worten: [b]Mit welcher Wahrscheinlichkeit war eine Person in seiner Jugend in der Schule [i][color=#980000]und[/color][/i] ist später zum Schwerverbrecher geworden?[/b][/*][*][math]P_V(S)[/math] ist die Wahrscheinlichkeit dafür, dass jemand zur Schule gegangen ist, unter der Bedingung, dass diese Person eine "Karriere" als Schwerverbrecher gemacht hat. Mit anderen Worten: [b]Unter welcher Wahrscheinlichkeit ist ein Schwerverbrecher in seiner Jugend in der Schule gewesen?[/b][/*][*][math]P_S(V)[/math] ist die Wahrscheinlichkeit dafür, dass jemand ein Schwerverbrecher wird, unter der Bedingung, dass diese Person vorher die Schule besucht hat. Mit anderen Worten: [b]Unter welcher Wahrscheinlichkeit wird eine Person, die in der Schule war, später zum Schwerverbrecher?[/b][/*][/list]Um diese Wahrscheinlichkeiten unterscheiden zu können, lohnt es sich die Menge aller befragten Personen anzusehen:[br][list][*]Im Falle von [math]P(S\cap V)[/math] wurden [b]alle Personen[/b] befragt und es wurde festgestellt, wer [i][color=#980000]beiden[/color][/i] Ereignissen zugeordnet werden kann.[/*][*]Im Falle von [math]P_V(S)[/math] wurden [b]nur die Schwerverbrecher:innen[/b] befragt und es wurde festgestellt, ob sie zur Schule gegangen sind.[/*][*]Im Falle von [math]P_S(V)[/math] wurden [b]nur die ehemaligen Schülerinnen und Schüler[/b] befragt, und es wurde festgestellt, ob sie Schwerverbrecher:innen geworden sind.[/*][/list][b][color=#980000]Das heißt bei bedingten Wahrscheinlichkeiten ist der Kreis der befragten Personen eingeschränkt. Es werden [i]nur die Personen[/i] befragt, denen eine bestimmtes Ereignis zugeordnet werden kann. Und genau dieses Ereignis ist dann auch die Bedingung.[/color][/b]
Gesundheitstests
Eine häufige Anwendung von bedingten Wahrscheinlichkeiten sind Gesundheitstests. Wir definieren dazu vier Ereignisse:[br][list][*][math]\mathbf K[/math] eine Person hat die untersuchte Krankheit[/*][*][math]\mathbf {\overline K}[/math] eine Person hat die untersuchte Krankheit nicht[/*][*][math]\mathbf {T}[/math] der Test auf die untersuchte Krankheit ist positiv[/*][*][math]\mathbf {\overline T}[/math] der Test auf die untersuchte Krankheit ist negativ[/*][/list]Dazu sind drei Wahrscheinlichkeiten besonders wichtig:[br][list][*]die [color=#980000][b]Prävalenz[/b][/color]: [math]P(K)[/math] ist die Wahrscheinlichkeit, mit der die Krankheit in der betrachteten Bevölkerung auftritt[/*][*]die [color=#980000][b]Sensitivität[/b][/color]: [math]P_K(\mathbf{T})[/math] ist die Wahrscheinlichkeit dafür, dass der Test eine kranke Person auch ls krank erkennt[/*][*]die [color=#980000][b]Spezifität[/b][/color]: [math]P_{\overline{K}}(\mathbf{\overline{T}})[/math] ist die Wahrscheinlichkeit dafür, dass der Test [b][i]richtig[/i][/b] erkennt, dass die Person die Krankheit [i][b]nicht[/b][/i] hat (also Testergebnis negativ)[/*][/list][br]
Beispiel: Corona-Schnelltests
Als erstes definieren wir die Ereignisse:[br][list][*][math]\mathbf{C}[/math] eine Person hat Corona[/*][*][math]\mathbf{\overline C}[/math] eine Person hat kein Corona[/*][*][math]\mathbf{T}[/math] der Schnelltest war positiv[/*][*][math]\mathbf{\overline T}[/math] der Schnelltest war negativ[/*][/list][br]Die Berliner Universitätsklinik Charité hat im Mai 2021 die Sensitivität von Corona-Schnelltests als [math]P_C(T)=80\%[/math] bestimmt und die Spezifität war [math]P_{\overline{C}}(\overline{T})=99,5\%[/math]. Laut RKI gab es in Deutschland am 26.11.2022 [math]566\,000[/math] aktive Coronafälle, das heißt die Prävalenz ist bei einer Einwohnerzahl von 83 Millionen [math]P(C)=\frac{566\,000}{83\,000\,000}\approx 0,7\%[/math]. Damit lässt sich folgendes Baumdiagramm aufstellen:
Die Vierfeldertafel
[math][br]\begin{array}{c | c | c | c }[br]& C & \overline{C} & \\[br]\hline[br]T & P(C\cap T)=0,0056&P(\overline C\cap T)=0,004965 & P(T)=0,010565\\[br]\hline[br]\overline T & P(C\cap\overline T)=0,0014& P(\overline C \cap\overline T)=0,988035 & P( \overline T)=0,989435\\[br]\hline[br]& P(C)=0,007 & P( \overline C)=0,993 & 1[br]\end{array}[/math]
Ihr Test ist positiv: Mit welcher Wahrscheinlichkeit sind Sie tatsächlich krank?
Gefragt ist hier: Mit welcher Wahrscheinlichkeit sind Sie krank, unter der Bedingung, dass ihr Test vorher positiv war? Also [math]P_T(C)[/math][br][br]Mit Hilfe der Vierfeldertafel lässt sich diese Wahrscheinlichkeit bestimmen:[br][math]P_T(C)=\frac{P(T\cap C)}{P(T)}=\frac{0,0056}{0,010565}\approx0,53=\underline{\underline{53\%}}[/math][br][br]Dieses Ergebnis scheint doch überraschend: Ob wohl die Sensitivität des Tests mit 80% und die Spezifität mit 99,5% sehr hoch scheinen, ist die Wahrscheinlichkeit, dass Sie krank sind, nur etwas mehr als 50%.[br][br][b]Dies ist ein typisches Ergebnis für einen Test, bei dem die Prävalenz sehr klein ist.[br][br][color=#980000]Trauen Sie bei einer kleinen Prävalenz erstmal keinem Testergebnis![/color][/b]

Information: Bedingte Wahrscheinlichkeiten