Comment faire l'analyse de base des données dans Excel

Comment faire l'analyse de base des données dans Excel / Productivité

La plupart du temps, lorsque vous exécutez des statistiques, vous souhaitez utiliser un logiciel de statistiques. Ces outils sont construits pour faire des calculs comme t-tests, tests Khi-deux, corrélations, etc. Excel n'est pas destiné à l'analyse de données. Mais cela ne signifie pas que vous ne pouvez pas le faire.

Malheureusement, les fonctions statistiques d'Excel ne sont pas toujours intuitives. Et ils vous donnent généralement des résultats ésotériques. Ainsi, au lieu d’utiliser des fonctions de statistiques, nous allons utiliser le complément statistique Excel: le Data Analysis Toolpak..

Le Toolpak, malgré son orthographe plutôt malheureuse, inclut un large éventail de fonctionnalités de statistiques utiles. Voyons ce que nous pouvons faire avec les statistiques Excel.

Ajout de l'outil d'analyse de données Excel

Pendant que tu pouvez faire des statistiques sans l'outil d'analyse de données, c'est beaucoup plus facile avec. Pour installer le Toolpak dans Excel 2016, allez à Fichier> Options> Compléments.

Cliquez sur Aller à côté de “Gérer: Compléments Excel.”

Dans la fenêtre résultante, cochez la case en regard de Outil d'analyse puis cliquez sur D'accord.

Si vous avez correctement ajouté l’outil d’analyse des données à Excel, un message L'analyse des données bouton dans le Les données onglet, regroupé dans le Une analyse section:

Si vous voulez encore plus de puissance, assurez-vous de consulter les autres compléments d'Excel. Optimisez Excel avec 10 compléments pour traiter, analyser et visualiser des données comme un pro Optimisez Excel avec 10 compléments pour traiter, analyser et visualiser des données Comme un Pro Vanilla Excel, c’est incroyable, mais vous pouvez le rendre encore plus puissant avec des compléments. Quelles que soient les données que vous devez traiter, il est probable que quelqu'un a créé une application Excel pour cela. Voici une sélection. Lire la suite .

Statistiques descriptives dans Excel

Quel que soit le test statistique que vous effectuez, vous souhaiterez probablement obtenir en premier les statistiques descriptives d'Excel. Cela vous donnera des informations sur les moyennes, les médianes, la variance, l'écart type et l'erreur, le kurtosis, l'asymétrie et une variété d'autres chiffres..

Exécuter des statistiques descriptives dans Excel est facile. Cliquez sur L'analyse des données dans l'onglet Données, sélectionnez Statistiques descriptives, et sélectionnez votre plage d'entrée. Cliquez sur la flèche en regard du champ de la plage de saisie, cliquez et faites glisser pour sélectionner vos données, puis appuyez sur Entrer (ou cliquez sur la flèche vers le bas correspondante), comme dans le GIF ci-dessous.

Après cela, assurez-vous d'indiquer à Excel si vos données comportent des étiquettes, si vous voulez que la sortie apparaisse dans une nouvelle feuille ou sur la même, et si vous voulez des statistiques résumées et d'autres options..

Après cela, appuyez sur D'accord, et vous obtiendrez vos statistiques descriptives:

Test de l'étudiant dans Excel

le t-Le test est l’un des tests statistiques les plus élémentaires, et il est facile de calculer Excel avec le Toolpak. Clique le L'analyse des données bouton et faites défiler jusqu'à ce que vous voyez la t-options de test.

Vous avez trois choix:

  • Test t: deux échantillons appariés pour les moyens doit être utilisé lorsque vos mesures ou observations ont été appariées. Utilisez-le lorsque vous prenez deux mesures sur les mêmes sujets, telles que la mesure de la pression artérielle avant et après une intervention..
  • Test t: deux échantillons en supposant des variances égales doit être utilisé lorsque vos mesures sont indépendantes (ce qui signifie généralement qu'elles ont été effectuées sur deux groupes de sujets différents). Nous allons discuter de la “variances égales” prendre part à un moment.
  • Test t: Deux échantillons en supposant des variances inégales est également utilisé pour des mesures indépendantes, mais est utilisé lorsque vos variances sont inégales.

Pour vérifier si les variances de vos deux échantillons sont égales, vous devez exécuter un test F. Trouver Test F à deux échantillons pour les écarts dans la liste Outils d'analyse, sélectionnez-le, puis cliquez sur D'accord.

Entrez vos deux jeux de données dans les zones de saisie. Laissez la valeur alpha à 0,05, sauf si vous avez une raison de la modifier. Si vous ne savez pas ce que cela signifie, partez. Enfin, cliquez sur D'accord.

Excel vous donnera les résultats dans une nouvelle feuille (sauf si vous avez sélectionné Plage de sortie et une cellule dans votre feuille actuelle):

Vous regardez la valeur P ici. Si c'est moins de 0,05, vous avez variances inégales. Donc, pour exécuter le t-test, vous devez utiliser l'option des variances inégales.

Exécuter un t-test, sélectionnez le test approprié dans la fenêtre Outils d'analyse, puis sélectionnez les deux ensembles de données de la même manière que vous l'avez fait pour le test F. Laissez la valeur alpha à 0,05 et appuyez sur D'accord.

Les résultats incluent tout ce que vous devez signaler pour une t-test: les moyennes, les degrés de liberté (df), la statistique t et les valeurs de p pour les tests unilatéraux et bilatéraux. Si la valeur P est inférieure à 0,05, les deux échantillons sont significativement différents.

Si vous ne savez pas s'il faut utiliser un unilatéral ou bilatéral t-test, consultez cet explicatif de UCLA.

ANOVA dans Excel

Excel Data Analysis Toolpak propose trois types d’analyse de variance (ANOVA). Malheureusement, cela ne vous donne pas la possibilité d'exécuter les tests de suivi nécessaires tels que Tukey ou Bonferroni. Mais vous pouvez voir s’il existe une relation entre quelques variables différentes.

Voici les trois tests ANOVA dans Excel:

  • ANOVA: facteur unique analyse la variance avec une variable dépendante et une variable indépendante. Il est préférable d'utiliser plusieurs t-des tests lorsque vous avez plus de deux groupes.
  • ANOVA: Deux facteurs avec réplication est similaire à la paire t-tester; il implique plusieurs mesures sur un seul sujet. le “à deux facteurs” une partie de ce test indique qu'il existe deux variables indépendantes.
  • ANOVA: Deux facteurs sans réplication implique deux variables indépendantes, mais pas de réplication dans la mesure.

Nous allons passer en revue l'analyse à facteur unique ici. Dans notre exemple, nous examinerons trois séries de chiffres, intitulés “Intervention 1,” “Intervention 2,” et “Intervention 3.” Pour exécuter une ANOVA, cliquez sur L'analyse des données, puis sélectionnez ANOVA: facteur unique.

Sélectionnez la plage de saisie et assurez-vous d'indiquer à Excel si vos groupes sont en colonnes ou en lignes. J'ai aussi sélectionné “Étiquettes au premier rang” ici pour que les noms de groupe soient affichés dans les résultats.

Après avoir frappé D'accord, nous obtenons les résultats suivants:

Notez que la valeur P est inférieure à 0,05, nous avons donc un résultat significatif. Cela signifie qu'il y a une différence significative entre au moins deux des groupes du test. Mais comme Excel ne fournit pas de tests pour déterminer lequel Comme les groupes diffèrent, le mieux que vous puissiez faire est de regarder les moyennes affichées dans le résumé. Dans notre exemple, l’intervention 3 ressemble à Probablement celui qui diffère.

Ce n'est pas statistiquement valable. Mais si vous voulez juste voir s'il y a une différence et voir quel groupe est probablement la cause, ça va marcher.

L'ANOVA à deux facteurs est plus compliquée. Si vous souhaitez en savoir plus sur l'utilisation de la méthode à deux facteurs, consultez cette vidéo de Sophia.org et le “sans réplication” et “avec réplication” exemples de Real Statistics.

Corrélation dans Excel

Le calcul de la corrélation dans Excel est beaucoup plus simple que le t-test ou une ANOVA. Utilisez le L'analyse des données bouton pour ouvrir la fenêtre Outils d'analyse et sélectionner Corrélation.

Sélectionnez votre plage de saisie, identifiez vos groupes sous forme de colonnes ou de lignes et indiquez à Excel si vous avez des étiquettes. Après cela, appuyez sur D'accord.

Vous n'obtiendrez aucune mesure d'importance, mais vous pouvez voir comment chaque groupe est en corrélation avec les autres. Une valeur de un est une corrélation absolue, indiquant que les valeurs sont exactement les mêmes. Plus la valeur de corrélation est proche d'une, plus la corrélation est forte.

Régression dans Excel

La régression est l’un des tests statistiques les plus couramment utilisés dans l’industrie et Excel offre une puissance surprenante pour ce calcul. Nous allons exécuter une régression multiple rapide dans Excel ici. Si vous n'êtes pas familier avec la régression, consultez le guide de HBR sur l'utilisation de la régression pour les entreprises..

Supposons que notre variable dépendante est la pression artérielle et que nos deux variables indépendantes sont le poids et la consommation de sel. Nous voulons voir quel est le meilleur prédicteur de la pression artérielle (ou s’ils sont bons tous les deux).

Cliquez sur L'analyse des données et sélectionnez Régression. Vous devez faire attention lorsque vous remplissez les cases de la plage de saisie cette fois-ci. le Gamme Y d'entrée La case doit contenir votre seule variable dépendante. le Plage d'entrée X box peut inclure plusieurs variables indépendantes. Pour une régression simple, ne vous inquiétez pas du reste (n'oubliez pas de dire à Excel si vous avez sélectionné des étiquettes).

Voici à quoi ressemble notre calcul:

Après avoir frappé D'accord, vous obtiendrez une grande liste de résultats. J'ai souligné la valeur P ici pour le poids et la consommation de sel:

Comme vous pouvez le constater, la valeur de p pour le poids est supérieure à 0,05, il n’ya donc pas de relation significative. La valeur de p pour le sel, cependant, est inférieure à 0,05, ce qui indique que c'est un bon prédicteur de la pression artérielle..

Si vous prévoyez de présenter vos données de régression, n'oubliez pas que vous pouvez ajouter une ligne de régression à un diagramme de dispersion dans Excel. C’est un formidable outil visuel. Comment visualiser l’analyse de vos données avec les outils puissants d’Excel? Comment visualiser votre analyse des données avec les outils puissants d’Excel - Excel est en train de le tuer avec ses fonctionnalités avancées de gestion des données. Une fois que vous aurez utilisé l’un des nouveaux outils, vous les voudrez tous. Devenez un maître de l'analyse de vos données avec des outils électriques! Lire plus pour cette analyse.

Statistiques Excel: étonnamment capables

Bien qu'Excel ne soit pas reconnu pour sa puissance statistique, il contient en réalité des fonctionnalités très utiles. Surtout une fois que vous avez téléchargé le complément de statistiques Data Analysis Toolpak. J'espère que vous avez appris à utiliser Toolpak et que vous pouvez maintenant jouer seul pour comprendre comment utiliser davantage ses fonctions..

Maintenant que vous avez ce qu'il vous faut, améliorez vos compétences Excel avec nos articles sur l'utilisation de la fonctionnalité de recherche d'objectif d'Excel pour davantage de traitement des données, la maîtrise des instructions IF dans Excel et l'ajout de listes déroulantes sous forme de cellules dans Excel..

J'ai également fait un lien vers d'autres sites qui proposent de bons didacticiels statistiques, dans lesquels nous devions éviter les concepts confus. N'oubliez pas de consulter notre guide des ressources de statistiques gratuites. Apprendre des statistiques gratuitement avec ces 6 ressources Apprendre des statistiques gratuitement avec ces 6 ressources Les statistiques ont une réputation difficile à comprendre. Mais apprendre de la bonne ressource vous aidera à comprendre les résultats de l’enquête, les rapports d’élection et vos travaux de statistiques en un rien de temps. Lire plus aussi.

Explorer plus sur: Microsoft Excel, Spreadsheet.