Comprendre la boîte à moustaches (Boxplot)
La boîte à moustaches est une représentation graphique qui résume la distribution d'un ensemble de données en cinq statistiques principales : le minimum, le premier quartile (Q1), la médiane (Q2), le troisième quartile (Q3) et le maximum. Elle permet également d'identifier les valeurs aberrantes.
- Minimum: La valeur la plus basse de l'ensemble de données.
- Premier quartile (Q1): La valeur en dessous de laquelle se trouvent 25% des données.
- Médiane (Q2): La valeur centrale de l'ensemble de données. La moitié des données est inférieure à la médiane, et l'autre moitié est supérieure.
- Troisième quartile (Q3): La valeur en dessous de laquelle se trouvent 75% des données.
- Maximum: La valeur la plus élevée de l'ensemble de données.
- Valeurs aberrantes: Les valeurs qui se situent en dehors des "moustaches" de la boîte. Elles sont souvent considérées comme des valeurs exceptionnellement basses ou élevées.
Pourquoi utiliser une boîte à moustaches dans Excel ?
Les boîtes à moustaches offrent plusieurs avantages pour l'analyse des données :
- Visualisation rapide de la distribution: Elles permettent de comprendre rapidement la forme de la distribution (symétrique, asymétrique, etc.).
- Identification des valeurs aberrantes: Elles mettent en évidence les valeurs qui s'écartent significativement du reste des données.
- Comparaison de distributions: Elles facilitent la comparaison de plusieurs ensembles de données.
- Résumé des données: Elles fournissent un résumé concis des statistiques clés.
Création d'une boîte à moustaches avec Excel (versions récentes – 2016 et ultérieures)
À partir d'Excel 2016, la création de boîtes à moustaches est simplifiée grâce à l'ajout d'un type de graphique dédié.
Étape 1 : Préparer vos données
Organisez vos données dans une feuille de calcul Excel. Chaque colonne représente un ensemble de données que vous souhaitez comparer. Par exemple, vous pouvez avoir une colonne pour les ventes du mois de janvier, une autre pour février, et ainsi de suite.
Étape 2 : Insérer le graphique Boxplot
- Sélectionnez les données que vous souhaitez inclure dans votre boîte à moustaches.
- Allez dans l'onglet "Insertion" du ruban Excel.
- Dans le groupe "Graphiques", cliquez sur l'icône "Insérer un graphique statistique".
- Choisissez le type de graphique "Boîte et moustaches".
Étape 3 : Personnaliser votre graphique
Excel créera automatiquement une boîte à moustaches basée sur vos données. Vous pouvez ensuite personnaliser le graphique pour l'adapter à vos besoins.
- Modifier le titre du graphique: Cliquez sur le titre et tapez le nouveau titre.
- Modifier les étiquettes des axes: Double-cliquez sur un axe pour ouvrir le volet de mise en forme. Vous pouvez modifier le format des nombres, l'échelle, etc.
- Modifier l'apparence de la boîte à moustaches: Cliquez sur une boîte à moustaches pour sélectionner toutes les boîtes. Vous pouvez ensuite modifier la couleur, la bordure, etc.
- Afficher ou masquer les valeurs aberrantes: Dans le volet de mise en forme, vous pouvez choisir d'afficher ou de masquer les valeurs aberrantes.
- Modifier le calcul des quartiles: Excel propose différentes méthodes pour calculer les quartiles. Vous pouvez choisir la méthode qui convient le mieux à vos données.
Exemple concret
Supposons que vous ayez les données suivantes dans votre feuille Excel :
| Mois | Ventes |
|---|---|
| Janvier | 100 |
| Janvier | 120 |
| Janvier | 110 |
| Janvier | 130 |
| Janvier | 115 |
| Février | 125 |
| Février | 140 |
| Février | 135 |
| Février | 150 |
| Février | 130 |
Sélectionnez les colonnes "Janvier" et "Février", puis suivez les étapes décrites ci-dessus pour créer une boîte à moustaches comparant les ventes des deux mois. Vous pourrez ainsi visualiser rapidement la médiane, les quartiles et les valeurs aberrantes pour chaque mois.
Création d'une boîte à moustaches avec Excel (versions antérieures à 2016)
Si vous utilisez une version d'Excel antérieure à 2016, vous devrez utiliser une méthode alternative pour créer une boîte à moustaches. Cette méthode consiste à calculer les statistiques nécessaires (minimum, Q1, médiane, Q3, maximum) à l'aide de formules Excel, puis à créer un graphique en barres empilées pour représenter la boîte à moustaches.
Étape 1 : Calculer les statistiques
Utilisez les formules Excel suivantes pour calculer les statistiques nécessaires pour chaque ensemble de données :
- Minimum:
=MIN(plage_de_données) - Premier quartile (Q1):
=QUARTILE.INC(plage_de_données, 1)ou=QUARTILE.EXC(plage_de_données, 1)(selon la méthode de calcul des quartiles souhaitée) - Médiane (Q2):
=MEDIANE(plage_de_données)ou=QUARTILE.INC(plage_de_données, 2) - Troisième quartile (Q3):
=QUARTILE.INC(plage_de_données, 3)ou=QUARTILE.EXC(plage_de_données, 3) - Maximum:
=MAX(plage_de_données)
Remplacez plage_de_données par la plage de cellules contenant vos données. Par exemple, si vos données sont dans les cellules A1:A10, la formule pour calculer le minimum serait =MIN(A1:A10).
Étape 2 : Préparer les données pour le graphique
Créez un tableau avec les statistiques calculées, ainsi que les différences nécessaires pour créer les barres empilées :
| Statistique | Valeur | Calcul pour le graphique |
|---|---|---|
| Minimum | Minimum | |
| Q1 | Q1 - Minimum | |
| Médiane | Médiane - Q1 | |
| Q3 | Q3 - Médiane | |
| Maximum | Maximum - Q3 |
Remplissez la colonne "Valeur" avec les résultats des formules calculées à l'étape 1. Remplissez ensuite la colonne "Calcul pour le graphique" avec les formules indiquées. Ces formules calculent les hauteurs des différentes sections des barres empilées.
Étape 3 : Créer le graphique en barres empilées
- Sélectionnez les données de la colonne "Calcul pour le graphique".
- Allez dans l'onglet "Insertion" du ruban Excel.
- Dans le groupe "Graphiques", cliquez sur l'icône "Insérer un graphique en barres ou en colonnes".
- Choisissez le type de graphique "Barres empilées".
Étape 4 : Personnaliser le graphique
Excel créera un graphique en barres empilées. Vous devrez ensuite le personnaliser pour qu'il ressemble à une boîte à moustaches.
- Supprimer les espaces entre les barres: Double-cliquez sur une barre pour ouvrir le volet de mise en forme. Dans les options de la série, réduisez la largeur de l'intervalle à 0%.
- Modifier les couleurs des barres: Cliquez sur chaque barre pour la sélectionner, puis modifiez sa couleur dans le volet de mise en forme. Généralement, la barre représentant Q1-Minimum et la barre représentant Maximum-Q3 sont transparentes ou de la même couleur que l'arrière-plan.
- Ajouter les moustaches: Ajoutez des barres d'erreur pour représenter les moustaches. Pour cela, sélectionnez la série de données représentant le minimum, puis allez dans l'onglet "Mise en forme" du ruban. Cliquez sur "Barres d'erreur" et choisissez "Plus d'options". Personnalisez les barres d'erreur pour qu'elles s'étendent jusqu'aux valeurs minimum et maximum. Faites de même pour la série représentant le maximum.
- Ajouter le titre et les étiquettes des axes: Ajoutez un titre pertinent et des étiquettes claires pour les axes.
Exemple concret
Reprenons l'exemple des ventes de janvier et février. Après avoir calculé les statistiques et préparé les données pour le graphique, vous obtiendrez un tableau similaire à celui-ci (les valeurs sont données à titre d'exemple) :
| Statistique | Janvier | Calcul pour le graphique (Janvier) | Février | Calcul pour le graphique (Février) |
|---|---|---|---|---|
| Minimum | 100 | 100 | 125 | 125 |
| Q1 | 110 | 10 | 130 | 5 |
| Médiane | 115 | 5 | 135 | 5 |
| Q3 | 125 | 10 | 140 | 5 |
| Maximum | 130 | 5 | 150 | 10 |
Sélectionnez les colonnes "Calcul pour le graphique (Janvier)" et "Calcul pour le graphique (Février)", puis suivez les étapes décrites ci-dessus pour créer un graphique en barres empilées. Personnalisez ensuite le graphique pour qu'il ressemble à une boîte à moustaches.
Conseils et astuces pour créer des boxplots efficaces
- Choisissez la méthode de calcul des quartiles appropriée: Excel propose différentes méthodes pour calculer les quartiles (QUARTILE.INC et QUARTILE.EXC). Comprenez les différences entre ces méthodes et choisissez celle qui convient le mieux à vos données.
- Utilisez des couleurs claires et contrastées: Facilitez la lecture du graphique en utilisant des couleurs claires et contrastées pour les différentes parties de la boîte à moustaches.
- Ajoutez des étiquettes claires: Assurez-vous que le titre du graphique et les étiquettes des axes sont clairs et informatifs.
- Soyez cohérent avec l'échelle des axes: Si vous comparez plusieurs boîtes à moustaches, utilisez la même échelle pour tous les graphiques afin de faciliter la comparaison.
- Interprétez les valeurs aberrantes avec prudence: Les valeurs aberrantes peuvent indiquer des erreurs de saisie de données, mais elles peuvent aussi représenter des observations intéressantes. Analysez-les attentivement avant de les supprimer.
Erreurs à éviter
- Utiliser une plage de données incorrecte: Vérifiez que la plage de données utilisée pour calculer les statistiques et créer le graphique est correcte.
- Choisir le mauvais type de graphique: Si vous utilisez une version d'Excel antérieure à 2016, assurez-vous de choisir le type de graphique "Barres empilées" et de le personnaliser correctement.
- Ne pas personnaliser le graphique: La personnalisation du graphique est essentielle pour qu'il ressemble à une boîte à moustaches et soit facile à lire.
- Interpréter incorrectement les résultats: Comprenez la signification des différentes parties de la boîte à moustaches (médiane, quartiles, valeurs aberrantes) pour interpréter correctement les résultats.