Boxplot was sind ausreißer?

Gefragt von: Leo Martens B.Sc.  |  Letzte Aktualisierung: 23. Januar 2022
sternezahl: 4.4/5 (60 sternebewertungen)

Häufig werden Ausreißer, die zwischen 1,5×IQR und 3×IQR liegen, als „milde“ Ausreißer bezeichnet und Werte, die über 3×IQR liegen, als „extreme“ Ausreißer. Diese werden dann auch meist unterschiedlich im Diagramm gekennzeichnet.

Was ist der Whisker beim Boxplot?

Das Box-Whisker-Plot (auch Boxplot oder zu deutsch Kastengrafik genannt) ist ein gebräuchlicher Diagrammtyp, der fünf Kennwerte (Minimum, Maximum, 1. Quartil, Median und 3. Quartil) umfasst. Der Name stammt aus dem Englischen und bezieht sich auf das Aussehen des Diagramms.

Was zeigt der Boxplot?

Der Boxplot, auch Box-Whisker-Plot oder im Deutschen Kastengrafik genannt, ist ein Diagramm, welches die übersichtliche Darstellung der wichtigsten robusten Lage- und Streuungsmaße ermöglicht. Es werden das Minimum, das untere Quartil, der Median, das obere Quartil und das Maximum abgebildet.

Welche Streuungsmaße besitzt ein Boxplot?

Am Boxplot kann man auch zwei Streuungsmaße ablesen: Die Spannweite ist nämlich der Abstand zwischen den beiden Whiskers (bzw. zwischen den äußersten Ausreißern). Der Interquartilsabstand, der ja als x_{0.75} – x_{0.25} definiert wurde, ist genau die Breite der Box.

Wie beschreibe ich einen Boxplot?

Die Box für den Interquartilbereich stellt die mittleren 50 % der Daten dar. Sie gibt den Abstand zwischen dem ersten und dem dritten Quartil (Q3–Q1) an. Die Whisker gehen von beiden Seiten der Box aus. Sie stellen die Bereiche für die unteren 25 % und die oberen 25 % der Datenwerte ausschließlich der Ausreißer dar.

Boxplots - Zeichnen, Interpretieren, Ausreißer - einfach erklärt

32 verwandte Fragen gefunden

Wie wertet man ein Boxplot aus?

  1. Sollte man einen Boxplot interpretieren müssen, geht es immer mit der Box bzw. dem Kasten los. Sie spannt den Interquartilsabstand auf. ...
  2. Ausreißer sind in der Regel so definiert, dass sie mindestens die anderthalbfache Boxlänge (der Interquartilsabstand) von jener Box entfernt sind:

Wie liest man ein Boxplot?

Die Box, die der Name Boxplot beinhaltet, zeigt an, in welchem Bereich sich die mittleren 50% aller Werte befinden. Das untere Ende der Box ist derjenige Punkt in den Daten, an dem sich die unteren 25% angesammelt haben (25%-Perzentil).

Was sind Ausreißer in der Statistik?

Bezeichnung in der Statistik für einen Beobachtungswert, der scheinbar nicht zu den übrigen Beobachtungswerten in der Stichprobe (Urliste) passt. I. Allg. handelt es sich dabei um einen besonders großen oder kleinen Merkmalswert in einer Gesamtheit.

Wann Boxplot?

Boxplots sollten nur benutzt werden, wenn die zu verdichtenden Daten aus Meßwerten einer Variablen bestehen, oder wenn die zu vergleichenden Gruppen von Daten Beobachtungen derselben Variablen sind.

Wann darf ich Ausreißer eliminieren?

Erst wenn dadurch sichergestellt ist, dass es sich bei dem oder den identifizierten Ausreißern tatsächlich um Werte einer anderen Population handelt, dürfen diese aus der Analyse ausgeschlossen werden.

Welche Daten für boxplot?

Die fünf Kenngrößen eines Boxplots
  • Min (Minimum): Der kleinste bei allen Daten vorkommende Wert (das Minimum), Startpunkt der linken Antenne.
  • qu: Untere Quartilsgrenze Median der unteren Hälfte der Daten, linker Startpunkt der Box.
  • Median: Wert genau in der Mitte aller Daten, Endpunkt des 2.

Was sagt der Interquartilsabstand aus?

Interquartilsabstand (IQR)

Der Interquartilsabstand (nachfolgend als IQR – Inter Quartile Range – abgekürzt) ist als die Differenz zwischen dem oberen und dem unteren Quartil definiert, die wir bereits im Rahmen der statistischen Lagemaße betrachtet haben.

Wie rechnet man das untere und obere Quartil aus?

Die untere Quartile (0.25-Quartile) teilt eine der Größe nach geordnete Stichprobenliste so in zwei Teile, dass 25% der Werte unterhalb dieser Quartil liegen und der Rest darüber. Bei der oberen Quartile (0.75-Quartile) wird die Liste so geteilt, dass 75% der Werte unterhalb dieses Grenzwertes liegen.

Wann ist ein Boxplot symmetrisch?

Aus der Lage des Medians innerhalb der Box lässt sich übrigens eine Aussage über die Form der Verteilung herauslesen: Liegt der Median (ungefähr) in der Mitte, handelt es sich um eine symmetrische Verteilung, liegt der Median dagegen nahe der unteren Grenze der Box, so ist die Verteilung rechtsschief und linkssteil.

Wann ist Boxplot symmetrisch?

[1] „Ist der Boxplot symmetrisch – liegt der Median also in der Mitte der Box und sind die Whiskers vergleichsweise gleich lang – liegt eine symmetrische Verteilung vor. “

Wie berechnet man das 1 Quartil?

Um die Quartile zu bestimmen, sortierst du die Beobachtungswerte der Größe nach mit dem kleinsten Wert beginnend. Ist der Umfang N der Datenreihe gerade, so teilt der Median die Datenreihe in zwei gleich große Datenhälften . Die Quartile sind jeweils die Mediane der Datenhälften.

Wie mit Ausreißern umgehen Statistik?

Wie mit Ausreißern umgehen?
  1. Tippfehler und offensichtliche Messfehler löschen.
  2. Ungewöhnliche Werte (z.B. Patient, der nicht in das Kollektiv passt) ausschließen.
  3. Verteilung prüfen, eventuell transformieren.
  4. Nach Möglichkeit nicht-parametrische Methode oder Bootstrapping verwenden.

Wann ist es ein Ausreißer?

In der Statistik spricht man von einem Ausreißer, wenn ein Messwert oder Befund nicht in eine erwartete Messreihe passt oder allgemein nicht den Erwartungen entspricht. Die „Erwartung“ wird meistens als Streuungsbereich um den Erwartungswert herum definiert, in dem die meisten aller Messwerte zu liegen kommen, z.

Was sind Ausreißer in Mathe?

einzelne extrem hohe oder niedrige Werte innerhalb einer Reihe von sich ansonsten mäßig unterscheidenden Stichprobendaten, von denen man vermutet, daß sie in irgendeiner Weise verfälscht sind. Zu Ausreißern kann es durch Meßfehler, Rundungsfehler, Beurteilungsfehler usw. kommen.

Warum kann man das arithmetische Mittel nicht aus dem boxplot ablesen?

Da es sich nicht um den Durchschnitt handelt, muss er nicht in der Mitte des Kastens liegen; vielmehr spiegeln Kasten und Medianmarkierung wider, wie sich die mittleren 50 Prozent der Werte um den Zentralwert verteilen. Die 25 Prozent der kleinsten Werte liegen zwischen dem Minimum und dem unteren Quartil.

Wie berechnet man das untere obere Quartil aus?

Setze alle Werte in die Formel für das obere Quartil ein.

Die Formel sieht folgendermaßen aus: Q3 = (¾(n + 1))-ter DatenpunktIn der Formel ist Q3 das obere Quartil und n der Stichprobenumfang. In obigem Beispiel sieht die Berechnung aus wie im Bild gezeigt.

Was gibt das untere Quartil an?

Das untere Quartil einer Verteilung gibt Dir den Wert an, unterhalb dem ein Viertel der Beobachtungswerte liegen, das obere Quartil dagegen den Wert, oberhalb dem die obersten 25 Prozent der Werte angesiedelt sind.

Was ist das 1 Quartil?

1. Quartil / Unteres Quartil. Das untere Quartil (Viertel) ist definiert als der kleinste Wert der Datenreihe, für den gilt: mindestens 25 % der Daten sind <= dem unteren Quartil und höchstens 75 % der Daten sind > dem unteren Quartil.

Wann Interquartilsabstand?

Interpretation des Interquartilsabstandes

Ein geringer Interquartilsabstand bedeutet, dass die Daten nahe beieinander liegen bzw. näher am Median liegen. Ein größerer Interquartilsabstand hingegen bedeutet, dass die Daten weit auseinander liegen, also nicht konsistent sind.

Welche quantile umfasst der Interquartilsabstand?

Der Interquartilsabstand liegt zwischen dem 25% Quantil (Q1)und dem 75% Quantil (Q3). Damit umfasst er circa 50% der Werte, die in der Mitte einer Verteilung liegen. Ein Quartil wird definiert als Schnittpunkt zwischen Vierteln.