Der Boxplot

Wie sieht ein Boxplot aus?
[img][/img][br][math]x_{min}[/math] ist der kleinste Wert eines Datensatzes[br][math]x_{max}[/math] ist der größte Wert eines Datensatzes[br][math]x_{Med}[/math] ist der Median, also der mittlere Wert einer der Größe nach geordneten Datenreihe[br][math]Q_1[/math] ist das erste Quartil. Es ist der mittlere Wert der unteren Hälfte einer der Größe nach geordneten Datenreihe, also der Median dieser unteren Hälfte[br][math]Q_3[/math] ist das dritte Quartil. Es ist der mittlere Wert der oberen Hälfte einer der Größe nach geordneten Datenreihe, also der Median dieser oberen Hälfte[br]Die Spannweite ist die Differenz von [math]x_{max}[/math] und [math]x_{min}[/math]: [math]Spannweite=x_{max}-x_{min}[/math]
Einige Bemerkungen zu den Parametern des Boxplots
[list=1][*]Wenn es eine [b]gerade Anzahl von Daten[/b] gibt, dann sind zwei Daten in der Mitte einer geordneten Datenreihe. In diesem Fall ist der Median das arithmetische Mittel der beiden mittleren Werte.[/*][*]Wenn es eine [b]ungerade Anzahl von Daten[/b] gibt, dann ist der Median einfach die mittlere Zahl. Die untere Hälfte der Daten sind dann alle Zahlen, die links vom Median stehen. Die obere Hälfte sind alle Zahlen, die rechts vom Median stehen. Das heißt der Median gehört jeweils nicht dazu. Dies ist wichtig, um das erste und das Dritte Quartil zu bestimmen.[/*][*]Man kann sich überlegen, dass zwischen [math]x_{Min}[/math] und [math]Q_1[/math], zwischen [math]Q_1[/math] und den Median, zwichen dem Median und [math]Q_3[/math] sowie zwischen [math]Q_3[/math] und [math]x_{max}[/math][br] jeweils ein Viertel aller Datensätze liegen.[/*][/list]
Daten mit Häufigkeiten
Wenn Daten mit Häufigkeiten vorliegen, so wie zum Beispiel bei den Ergebnissen einer Klassenarbeit, dann müssen erst alle Daten aufgeschrieben werden, also mit allen Wiederholungen, bevor die Parameter bestimmt werden:[br][b]Beispiel[/b] [br]Eine Klassenarbeit ist folgendermaßen ausgefallen:[br][table][tr][td]Zensur[/td][td]1[/td][td]2[/td][td]3[/td][td]4[/td][td]5[/td][td]6[/td][/tr][tr][td]Häufigkeit[/td][td]2[/td][td]3[/td][td]6[/td][td]7[/td][td]3[/td][td]0[/td][/tr][/table]Dann ist die geordnete Reihe:[br]112223333334444444555[br]Das sind 21 Zahlen. Die mittlere Zahl und damit der [b]Median[/b] ist die 11te Zahl: Eine 3[br]Dann ist die untere Hälfte der Daten: 1122233333[br]Das sind 10 Zahlen. das [b]erste Quartil[/b] ist also das arithmetische Mittel aus der 5ten und der 6ten Zahl:[br][math]Q_1=\frac{1}{2}\cdot(2+3)=2,5[/math][br]Die obere Hälfte der Daten ist 4444444555[br]Das sind natürlich auch 10 Zahlen. Da die 5te und die 6te Zahl dieser Reihe beides Vieren sind, braucht man für das [b]dritte Quartil[/b] keinen Mittelwert zu bilden: [math]Q_3=4[/math][br]Die [b]Spannweite[/b] ist 5-1=4, weil ja keine 6 vorkommt.[br][br]

Information: Der Boxplot