Comment supprimer les valeurs éloignées dans SPSS

Les valeurs aberrantes sont des valeurs extrêmes qui peuvent biaiser les résultats d'une analyse statistique et aboutir à des conclusions inexactes.

Analyse de données exploratoire

Étape 1

Cliquez sur "Analyser". Sélectionnez "Statistiques descriptives", puis "Explorer".

Étape 2

Glissez-déposez les colonnes contenant les données de la variable dépendante dans la case "Liste des personnes à charge". Cliquez sur "OK".

Étape 3

Supprimez tous les points aberrants identifiés par SPSS dans les diagrammes de flux de trésorerie en supprimant les points de données individuels. Vous pouvez également configurer un filtre pour exclure ces points de données.

Étape 4

Sélectionnez "Données" puis "Sélectionner les observations", puis cliquez sur une condition contenant les valeurs extrêmes que vous souhaitez exclure. Détermine une valeur pour cette condition qui exclut uniquement les valeurs éloignées et aucun des points de données non distants.

Étape 5

Sélectionnez l'option "Si la condition est remplie" dans la case "Sélectionner" puis cliquez sur le bouton "Oui" juste en dessous. Entrez la règle d'exclusion des valeurs extrêmes qui ont été déterminées à l'étape précédente dans la zone située en haut à droite. Par exemple, si vous excluez les mesures supérieures à 74, 5 pouces de la condition "hauteur", vous devez entrer "hauteur <= 74, 5". Cliquez sur "Continuer" et "OK" pour activer le filtre.

Analyse de régression

Étape 1

Dans le menu "Analyser", sélectionnez "Régression" puis "Linéaire". Sélectionnez les variables dépendantes et indépendantes que vous souhaitez analyser.

Étape 2

Cliquez sur "Enregistrer" puis sélectionnez "Distance de cuisson". Les valeurs calculées pour la distance de cuisson seront enregistrées dans le fichier de données sous forme de variables intitulées "COO-1".

Étape 3

Exécutez un diagramme de flux de trésorerie en utilisant l’option "Graphes" suivie de "Diagramme de flux de trésorerie". Cliquez sur "Simple" et sélectionnez "Résumé de variables indépendantes". Écrivez «COO-1» dans la case «Les boîtes représentent», puis entrez l'ID ou le nom permettant d'identifier les cas dans la case «Marquer les cas par».

Étape 4

Augmentez le diagramme de boîte dans le fichier de sortie en double-cliquant dessus. Prenez note des cas qui sont au-delà des lignes noires, ce sont leurs valeurs extrêmes. Vous pouvez choisir de supprimer toutes les valeurs aberrantes ou uniquement les valeurs aberrantes marquées d'un astérisque (*).

Étape 5

Retournez au fichier de données et localisez les cas à supprimer. Travaillez du bas vers le haut, sélectionnez le nombre situé à l'extrême gauche, dans la colonne grise, de manière à sélectionner toute la ligne. Cliquez sur "Modifier" et sélectionnez "Supprimer". Répétez cette étape pour chaque valeur aberrante définie dans le diagramme à boîtes.