Kennisbank

Interquartile Range (IQR)

Wat is de Interquartile Range (IQR)?

De Interquartile Range (IQR) is een statistische maatstaf die de spreiding van de middelste 50% van de gegevens in een dataset aangeeft, wat het een waardevolle tool maakt voor het meten van concentratie rond het midden van de verdeling. Dit is vooral nuttig in situaties waarin uitschieters de gemiddelde waarde kunnen vertekenen.

Kernaspecten van de IQR:

  • Kwartielen: De IQR maakt gebruik van kwartielen om de dataset op te delen in vier gelijke delen:
    • Het eerste kwartiel (Q1): De mediaan van de onderste helft van de gegevens.
    • Het derde kwartiel (Q3): De mediaan van de bovenste helft van de gegevens.
    • De mediaan (Q2) verdeelt de dataset in twee helften.
  • Berekening:
    • De IQR wordt berekend door het derde kwartiel (Q3) te verminderen met het eerste kwartiel (Q1): IQR = Q3 – Q1.
    • Deze waarde representeert de spreiding van de middelste 50% van de gegevens.
  • Gebruik in Boxplots:
    • In boxplots vertegenwoordigt de ‘box’ zelf de IQR, waarbij de onderkant Q1 is en de bovenkant Q3.
    • De ‘whiskers’ van een boxplot kunnen zich uitstrekken tot 1,5 keer de IQR boven Q3 en onder Q1, om de range van de meeste gegevens weer te geven.
  • Robuustheid:
    • De IQR is minder gevoelig voor uitschieters dan andere spreidingsmaten zoals het bereik of de standaardafwijking, waardoor het een robuuste maatstaf is voor het meten van spreiding.
  • Analyse van Gegevensspreiding:
    • De IQR helpt bij het begrijpen van hoe de gegevens zijn geconcentreerd of verspreid rond het midden van de distributie.
    • Het biedt inzicht in de variabiliteit van gegevens, wat essentieel is voor besluitvorming en verdere statistische analyse.

Toepassingen:

De IQR is een fundamenteel instrument in de beschrijvende statistiek en wordt gebruikt in een breed scala aan toepassingen over sectoren zoals economie, engineering, en sociale wetenschappen. Het helpt bij het identificeren van de spreiding en concentratie van gegevens rondom het midden van een dataset en is cruciaal voor het nemen van geïnformeerde beslissingen, vooral in gegevenssets waar uitschieters een rol spelen.

Online Lean training:
100% Lean, helemaal op jouw tempo

Veel gelezen in onze kennisbank