=PEARSON
Statistiques Intermédiaire Excel

PEARSON Excel : Calcul du coefficient de corrélation

Maîtrisez la fonction PEARSON d'Excel pour calculer le coefficient de corrélation. Découvrez sa syntaxe, ses utilisations et des exemples concrets.

Syntaxe

=PEARSON(matrice1, matrice2)

La fonction PEARSON prend deux arguments :

  • matrice1 : La première matrice de nombres.
  • matrice2 : La seconde matrice de nombres. Les matrices doivent être de même taille.

Explication détaillée

Fonction PEARSON dans Excel : Guide Complet

Introduction

La fonction PEARSON d'Excel est un outil statistique puissant qui permet de calculer le coefficient de corrélation de Pearson, une mesure de la relation linéaire entre deux ensembles de données. Ce coefficient varie de -1 à +1, où -1 indique une corrélation négative parfaite, +1 une corrélation positive parfaite, et 0 l'absence de corrélation linéaire.

Syntaxe

La syntaxe de la fonction PEARSON est la suivante :

=PEARSON(matrice1, matrice2)

Où :

  • matrice1 : La première plage de cellules contenant des nombres.
  • matrice2 : La seconde plage de cellules contenant des nombres. Les deux plages doivent avoir la même taille.

Fonctionnement

La fonction PEARSON calcule le coefficient de corrélation de Pearson en utilisant la formule suivante :

r = Σ[(xi - x̄)(yi - ȳ)] / √[Σ(xi - x̄)² * Σ(yi - ȳ)²]

Où :

  • xi et yi sont les valeurs individuelles des deux ensembles de données.
  • et ȳ sont les moyennes des deux ensembles de données.

En pratique, Excel effectue ce calcul automatiquement lorsque vous utilisez la fonction PEARSON.

Cas d'utilisation

Voici quelques exemples concrets d'utilisation de la fonction PEARSON :

  • Finance : Déterminer la corrélation entre le rendement de deux actions différentes. Une corrélation positive suggère que les actions ont tendance à évoluer dans la même direction, tandis qu'une corrélation négative suggère qu'elles évoluent dans des directions opposées.
  • Marketing : Analyser la relation entre les dépenses publicitaires et les ventes. Une corrélation positive forte indiquerait que l'augmentation des dépenses publicitaires est associée à une augmentation des ventes.
  • Ressources Humaines : Évaluer la corrélation entre les scores de tests d'aptitude et la performance au travail. Cela peut aider à déterminer si les tests sont de bons prédicteurs de la réussite professionnelle.
  • Sciences : Étudier la corrélation entre deux variables, comme la température et la pression.

Bonnes pratiques

  • Vérifiez la taille des matrices : Assurez-vous que les deux matrices ont la même taille, sinon la fonction renverra une erreur #N/A.
  • Interprétation prudente : La corrélation n'implique pas la causalité. Une forte corrélation entre deux variables ne signifie pas nécessairement que l'une cause l'autre.
  • Valeurs manquantes : La fonction PEARSON ignore les cellules vides ou contenant du texte. Assurez-vous que vos données sont propres et ne contiennent que des valeurs numériques.

Combinaisons

La fonction PEARSON peut être combinée avec d'autres fonctions Excel pour des analyses plus complexes :

  • INDEX et MATCH : Pour extraire dynamiquement les données à partir de tableaux.
  • AVERAGE : Pour calculer la moyenne des données avant d'appliquer la fonction PEARSON.
  • IF : Pour appliquer la fonction PEARSON uniquement à certaines conditions.
  • STDEV.P : Pour calculer l'écart type de la population, utile pour normaliser les données avant de calculer la corrélation.

Cas d'utilisation

Analyse financière : corrélation entre actifs.

Analyse marketing : corrélation entre campagnes et ventes.

Analyse scientifique : corrélation entre variables expérimentales.

Exemples pratiques

Corrélation entre dépenses publicitaires et ventes

Données : Colonne B : Dépenses publicitaires (en milliers d'euros) Colonne C : Ventes (en milliers d'euros) Plage de données : B2:C11 contenant 10 observations.

=PEARSON(B2:B11, C2:C11)

Calcule le coefficient de corrélation entre les dépenses publicitaires et les ventes. Une valeur proche de 1 indiquerait une forte corrélation positive.

Résultat : 0.95 (par exemple)
Corrélation entre les scores d'aptitude et la performance

Données : Colonne D : Scores d'aptitude Colonne E : Performance au travail (sur une échelle de 1 à 10) Plage de données : D2:E21 contenant 20 observations.

=PEARSON(D2:D21, E2:E21)

Calcule le coefficient de corrélation entre les scores d'aptitude et la performance au travail. Cela peut aider à évaluer la validité d'un test d'aptitude.

Résultat : 0.78 (par exemple)
Corrélation entre le prix d'une action et le volume d'échange

Données : Colonne F : Prix de l'action Colonne G : Volume d'échange Plage de données : F2:G101 contenant 100 observations.

=PEARSON(F2:F101, G2:G101)

Calcule le coefficient de corrélation entre le prix d'une action et son volume d'échange. Ceci pourrait aider à comprendre la dynamique du marché.

Résultat : -0.25 (par exemple)

Conseils et astuces

Utilisez des graphiques de dispersion pour visualiser la relation entre les deux ensembles de données avant de calculer le coefficient de corrélation.

N'oubliez pas que la corrélation ne signifie pas la causalité.

Soyez conscient des valeurs aberrantes, car elles peuvent avoir un impact important sur le coefficient de corrélation.

Utilisez la fonction COVARIANCE.P ou COVARIANCE.S pour calculer la covariance entre deux ensembles de données.

Erreurs courantes

#N/A

Les matrices matrice1 et matrice2 n'ont pas la même taille.

Assurez-vous que les deux plages de cellules ont le même nombre de lignes et de colonnes.

#DIV/0!

L'écart type d'une des matrices est égal à zéro, ce qui signifie que toutes les valeurs dans cette matrice sont identiques.

Vérifiez les données d'entrée et assurez-vous qu'il y a une variance dans les valeurs des deux matrices.

Formules associées