Comment trouver le coefficient de corrélation avec Excel

Comment trouver le coefficient de corrélation avec Excel / Productivité

Un des calculs statistiques Excel les plus simples et les plus courants Comment calculer des statistiques de base dans Excel: Guide du débutant Comment calculer des statistiques de base dans Excel: Guide du débutant Microsoft Excel peut effectuer des statistiques! Vous pouvez calculer des pourcentages, des moyennes, des écarts types, des erreurs types et des tests t de Student. Lisez plus que vous pourriez faire est la corrélation. C'est une statistique simple, mais elle peut être très informative lorsque vous voulez voir si deux variables sont liées. Si vous connaissez les bonnes commandes, trouver le coefficient de corrélation dans Excel est extrêmement facile.

Nous examinerons la corrélation pour vous donner une idée des informations qu’elle vous fournit. Nous passerons ensuite à la recherche du coefficient de corrélation dans Excel à l'aide de deux méthodes et d'un bon graphique permettant d'examiner les corrélations. Enfin, je vais vous donner une très rapide introduction à la régression linéaire, une autre fonction statistique qui pourrait s'avérer utile lorsque vous examinez les corrélations..

Quelle est la corrélation?

Avant de commencer, discutons de la définition de la corrélation. C'est une simple mesure de la façon dont les choses sont liées. Jetons un coup d'oeil à deux variables qui n'ont aucune corrélation.

Ces deux variables (l’une sur l’axe X, l’autre sur Y) sont totalement aléatoires et ne sont pas étroitement liées.

Les deux variables ci-dessous, cependant, sont corrélées:

En général, quand une variable augmente, l'autre augmente. C'est la corrélation. (Notez que cela peut aussi être l'inverse. Si l'une monte et l'autre descend, c'est une corrélation négative.)

Comprendre le coefficient de corrélation

Le coefficient de corrélation vous indique la corrélation entre deux variables. Le coefficient est compris entre -1 et 1. Un coefficient de corrélation de 0 signifie qu'il n'y a absolument aucune corrélation entre deux variables. Voici ce que vous devriez obtenir lorsque vous avez deux séries de nombres aléatoires.

Un coefficient de -1 signifie que vous avez une corrélation négative parfaite: lorsqu'une variable augmente, l'autre diminue proportionnellement. Un coefficient de 1 est une corrélation positive parfaite: lorsqu'une variable augmente, l'autre augmente également proportionnellement..

Tout nombre entre ceux-ci représente une échelle. Une corrélation de 0,5, par exemple, est une corrélation positive modérée.

Comme vous pouvez le voir dans le graphique ci-dessous, la corrélation ne recherche qu'une relation linéaire. Deux variables peuvent être fortement liées d'une autre manière et ont toujours un coefficient de corrélation de zéro:

Crédit d'image: DenisBoigelot / Wikimedia Commons

Comment trouver un coefficient de corrélation dans Excel avec CORREL

Il existe une fonction intégrée pour la corrélation dans Excel. La fonction CORREL a une syntaxe très simple:

= CORREL (tableau1, tableau2)

array1 est votre premier groupe de nombres et array2 est le deuxième groupe. Excel va cracher un nombre, et c'est votre coefficient de corrélation. Regardons un exemple.

Dans ce tableur, nous avons une liste de voitures, avec modèle et année, et leurs valeurs. J'ai utilisé la fonction CORREL pour voir si l'année du modèle et la valeur étaient liées:

Il existe une très faible corrélation positive. de même que l'année monte, la valeur du véhicule fait de même. Mais pas de beaucoup.

Corrélations graphiques

Lorsque vous exécutez des corrélations, il est judicieux d'utiliser un nuage de points pour comprendre visuellement la relation entre vos jeux de données. Aller à Graphiques> Scatter pour voir à quoi ressemblent vos données:

Vous pouvez voir que dans ces données, l'année de la voiture n'influe pas beaucoup sur la valeur. Il y a un légère tendance positive, mais c'est faible. C'est ce que nous avons trouvé avec notre fonction CORREL.

Un autre élément utile dans un diagramme de dispersion est une ligne de tendance, qui ressemble à ceci:

La courbe de tendance peut être utile lorsque vous souhaitez clarifier une corrélation dans votre diagramme de dispersion. Sous Windows, cliquez sur Outils de graphique> Conception> Ajouter un élément de graphique et sélectionnez ligne de tendance. Sur un Mac, vous devrez aller à Mise en page graphique ou Conception graphique, en fonction de l'édition d'Excel.

Et n'oubliez pas de consulter notre guide pour créer de superbes graphiques dans Excel Comment créer des graphiques et des graphiques puissants dans Microsoft Excel Comment créer des graphiques et des graphiques puissants dans Microsoft Excel Un bon graphique peut faire la différence entre obtenir votre point de vue ou laisser tout le monde assoupi. Nous vous montrons comment créer des graphiques puissants dans Microsoft Excel qui engageront et informeront votre public. Lire plus avant de présenter des résultats!

Corrélation de plusieurs variables avec l'outil d'analyse des données

Si vous avez plusieurs ensembles de nombres différents et que vous souhaitez trouver des corrélations entre eux, vous devez exécuter la fonction CORREL sur chaque combinaison. Cependant, à l'aide de l'outil d'analyse des données, vous pouvez sélectionner un certain nombre de jeux de données et voir où se trouvent les corrélations..

Vous ne savez pas si vous avez l'outil d'analyse des données? Consultez notre aperçu des bases Comment effectuer une analyse de base des données dans Excel Comment effectuer une analyse de base des données dans Excel Excel n'est pas destiné à l'analyse de données, mais il peut néanmoins gérer des statistiques. Nous allons vous montrer comment utiliser le complément Data Analysis Toolpak pour générer des statistiques Excel. Lire la suite pour télécharger et comprendre.

Pour lancer le Toolpak, allez à Données> Analyse de données. Vous verrez une liste de choix:

Sélectionner Corrélation et frapper D'accord.

Dans la fenêtre résultante, sélectionnez tous vos jeux de données dans Plage d'entrée et dites à Excel où vous voulez que vos résultats soient placés:

Voici ce que vous obtiendrez lorsque vous frapperez D'accord:

Dans l'image ci-dessus, nous avons effectué des corrélations sur quatre jeux de données différents: l'année, la population mondiale et deux ensembles de nombres aléatoires..

La corrélation de chaque ensemble de données avec lui-même est de 1. L'année et la population mondiale ont une corrélation extrêmement forte, alors qu'il existe de très faibles corrélations ailleurs, comme on pouvait s'y attendre avec des nombres aléatoires..

Corrélation vs régression linéaire dans Excel

La corrélation est une mesure simple: à quel point deux variables sont-elles liées? Cette mesure, cependant, n'a aucune valeur prédictive ou causative. Ce n’est pas parce que deux variables sont corrélées que l’une provoque des changements dans l’autre. C'est une chose cruciale à comprendre à propos de la corrélation.

Si vous souhaitez faire une réclamation concernant la causalité, vous devez utiliser la régression linéaire. Vous pouvez également y accéder via l'outil d'analyse des données. (Cet article ne couvre pas les détails du fonctionnement de la régression linéaire, mais il existe de nombreuses ressources de statistiques gratuites. Apprendre des statistiques gratuitement avec ces 6 ressources Apprendre des statistiques gratuitement avec ces 6 ressources Les statistiques ont une réputation difficile à comprendre. Mais apprendre de la bonne ressource vous aidera à comprendre les résultats de l’enquête, les rapports d’élection et vos travaux de statistique en un rien de temps. Lisez-en plus pour en apprendre plus sur les bases.)

Ouvrez l’outil d’analyse de données, sélectionnez Régression, et cliquez D'accord.

Remplissez les plages X et Y (la valeur X est la variable explicative et la valeur Y est la valeur que vous essayez de prédire). Ensuite, sélectionnez où vous voulez que votre sortie aille, et cliquez sur D'accord encore.

Le chiffre sur lequel vous souhaitez vous concentrer est la valeur p de votre variable explicative:

Si elle est inférieure à 0,05, vous avez un argument de poids qui veut que les changements dans votre variable X entraînent des changements dans votre variable Y. Dans l'image ci-dessus, nous avons montré que l'année est un prédicteur significatif de la population mondiale.

La régression linéaire est également utile dans la mesure où elle peut examiner plusieurs valeurs. Ici, nous avons utilisé la régression pour voir si l'année et la population sont des prédicteurs significatifs du prix du pétrole brut:

Les deux valeurs de p étant inférieures à 0,05, nous pouvons donc en conclure que l’année et la population mondiale sont des prédicteurs significatifs du prix du pétrole brut. (Bien que de fortes corrélations entre les variables X puissent causer leurs propres problèmes.)

Encore une fois, ceci est une explication très simpliste de la régression linéaire, et si la causalité vous intéresse, vous devriez lire quelques tutoriels sur les statistiques..

Mais maintenant vous avez une idée sur la façon d'aller au-delà de la simple corrélation si vous recherchez plus d'informations statistiques.!

Obtenez de meilleures données sur Excel

Comprendre les fonctions statistiques de base dans Excel peut vous aider à obtenir beaucoup plus d’informations utiles à partir de vos données. La corrélation est une mesure simple, mais elle peut être d'une grande aide lorsque vous essayez de faire des affirmations sur les chiffres dans votre feuille de calcul..

Bien sûr, vous pouvez utiliser de nombreuses autres mesures plus complexes. Mais, à moins que vous ne maîtrisiez bien les statistiques, vous souhaiterez commencer par les notions de base. 8 Conseils pour apprendre Excel rapidement 8 Conseils pour apprendre Excel rapidement Pas aussi à l'aise avec Excel que vous le souhaiteriez? Commencez par des astuces simples pour ajouter des formules et gérer les données. Suivez ce guide et vous serez au courant en un rien de temps. Lire la suite .

Utilisez-vous régulièrement la fonctionnalité de corrélation d'Excel? Quelles autres fonctions statistiques souhaiteriez-vous connaître??

En savoir plus sur: Microsoft Excel.