Supprimer les doublons sur Excel : Guide complet
Excel offre plusieurs façons de supprimer les doublons, adaptées à différents besoins et niveaux de complexité. Nous allons explorer les méthodes les plus courantes et les plus efficaces.
1. Utiliser la fonctionnalité "Supprimer les doublons" intégrée à Excel
C'est la méthode la plus simple et la plus rapide pour supprimer les doublons dans une plage de données.
Étapes à suivre :
- Sélectionnez la plage de données contenant les doublons que vous souhaitez supprimer. Assurez-vous d'inclure les en-têtes de colonnes si votre tableau en comporte.
- Cliquez sur l'onglet "Données" dans le ruban Excel.
- Dans le groupe "Outils de données", cliquez sur le bouton "Supprimer les doublons". Une boîte de dialogue s'ouvrira.
- Dans la boîte de dialogue "Supprimer les doublons", Excel essaiera de détecter automatiquement les colonnes à analyser. Vous pouvez cocher ou décocher les colonnes pour spécifier celles qui doivent être prises en compte pour identifier les doublons. Si toutes les colonnes sont cochées, une ligne sera considérée comme un doublon uniquement si toutes les valeurs de toutes les colonnes sont identiques à celles d'une autre ligne.
- Cochez la case "Mes données ont des en-têtes" si votre plage de données inclut des en-têtes de colonnes. Cela évitera qu'Excel ne les considère comme des données à supprimer.
- Cliquez sur "OK". Excel supprimera automatiquement les lignes en double et affichera un message indiquant le nombre de doublons supprimés et le nombre de valeurs uniques restantes.
Exemple :
Imaginez que vous avez une liste de noms et d'adresses e-mail dans une feuille Excel. Certaines personnes peuvent apparaître plusieurs fois dans la liste. Pour supprimer les doublons en fonction de l'adresse e-mail, sélectionnez la plage de données, cliquez sur "Supprimer les doublons", puis assurez-vous que seule la colonne "Adresse e-mail" est cochée. Excel supprimera toutes les lignes avec des adresses e-mail en double.
Avantages :
- Méthode simple et rapide.
- Ne nécessite aucune connaissance en formules Excel.
- Idéale pour les listes simples avec peu de colonnes.
Inconvénients :
- Moins flexible que les autres méthodes.
- Supprime directement les doublons de la feuille de calcul (peut être problématique si vous souhaitez conserver une copie des doublons).
- Ne permet pas de mettre en évidence les doublons avant de les supprimer.
2. Utiliser les filtres avancés pour identifier et supprimer les doublons
Les filtres avancés offrent une plus grande flexibilité que la fonctionnalité "Supprimer les doublons". Vous pouvez les utiliser pour identifier les doublons, les copier vers un autre emplacement ou les supprimer directement.
Étapes à suivre :
- Sélectionnez la plage de données contenant les doublons que vous souhaitez supprimer. Incluez les en-têtes de colonnes.
- Cliquez sur l'onglet "Données" dans le ruban Excel.
- Dans le groupe "Trier et filtrer", cliquez sur le bouton "Avancé". La boîte de dialogue "Filtre avancé" s'ouvrira.
- Dans la boîte de dialogue "Filtre avancé", assurez-vous que l'option "Filtrer la liste sur place" est sélectionnée si vous souhaitez filtrer la liste directement. Si vous souhaitez copier les valeurs uniques vers un autre emplacement, sélectionnez l'option "Copier vers un autre emplacement".
- Dans le champ "Plage de la liste", vérifiez que la plage de données sélectionnée est correcte.
- Laissez le champ "Plage de critères" vide si vous souhaitez filtrer en fonction de toutes les colonnes.
- Cochez la case "Extraction sans doublons".
- Si vous avez sélectionné l'option "Copier vers un autre emplacement", spécifiez la cellule où vous souhaitez copier les valeurs uniques dans le champ "Copier vers".
- Cliquez sur "OK". Excel filtrera ou copiera les valeurs uniques, en supprimant les doublons.
Exemple :
Vous avez une liste de produits avec leurs noms, leurs prix et leurs quantités en stock. Vous souhaitez identifier les produits en double (même nom, même prix) et les copier vers une autre feuille. Utilisez le filtre avancé, sélectionnez la plage de données, cochez "Extraction sans doublons" et spécifiez une autre feuille pour copier les résultats. Excel copiera uniquement les produits uniques dans la nouvelle feuille.
Avantages :
- Plus flexible que la fonctionnalité "Supprimer les doublons".
- Permet de copier les valeurs uniques vers un autre emplacement.
- Permet de filtrer la liste sur place.
Inconvénients :
- Un peu plus complexe que la fonctionnalité "Supprimer les doublons".
- Nécessite une bonne compréhension des filtres Excel.
3. Utiliser des formules Excel pour identifier les doublons
Les formules Excel offrent une approche plus personnalisée pour identifier les doublons. Vous pouvez utiliser des formules comme COUNTIF ou COUNTIFS pour compter le nombre d'occurrences de chaque valeur et identifier celles qui apparaissent plus d'une fois.
Exemple avec la formule COUNTIF :
- Ajoutez une nouvelle colonne à votre tableau, par exemple, "Nombre d'occurrences".
- Dans la première cellule de cette nouvelle colonne (par exemple,
C2), entrez la formule suivante :=COUNTIF($A$2:$A$100, A2)(oùA2:A100est la plage de données contenant les valeurs à vérifier). - Copiez la formule vers le bas pour l'appliquer à toutes les lignes de votre tableau.
- La colonne "Nombre d'occurrences" affichera le nombre de fois que chaque valeur apparaît dans la plage de données. Les valeurs qui apparaissent plus d'une fois sont des doublons.
- Vous pouvez ensuite utiliser un filtre sur cette colonne pour afficher uniquement les lignes où le nombre d'occurrences est supérieur à 1.
Exemple avec la formule COUNTIFS (pour plusieurs critères) :
Si vous souhaitez identifier les doublons en fonction de plusieurs colonnes (par exemple, Nom et Prénom), vous pouvez utiliser la formule COUNTIFS. Dans une nouvelle colonne, entrez la formule suivante : =COUNTIFS($A$2:$A$100, A2, $B$2:$B$100, B2) (où A2:A100 est la plage des Noms et B2:B100 est la plage des Prénoms).
Avantages :
- Très flexible et personnalisable.
- Permet d'identifier les doublons en fonction de critères complexes.
- Ne supprime pas directement les données, ce qui vous permet de les examiner avant de les supprimer.
Inconvénients :
- Nécessite une bonne connaissance des formules Excel.
- Plus complexe que les autres méthodes.
- Nécessite des étapes supplémentaires pour supprimer réellement les doublons (par exemple, en utilisant un filtre).
4. Utiliser Power Query (Get & Transform Data) pour supprimer les doublons
Power Query est un outil puissant intégré à Excel qui permet d'importer, de transformer et de nettoyer des données provenant de diverses sources. Il offre une fonctionnalité dédiée à la suppression des doublons.
Étapes à suivre :
- Sélectionnez la plage de données contenant les doublons.
- Cliquez sur l'onglet "Données" dans le ruban Excel.
- Dans le groupe "Obtenir et transformer des données", cliquez sur "À partir d'une plage/d'un tableau". Power Query Editor s'ouvrira.
- Dans Power Query Editor, sélectionnez la ou les colonnes que vous souhaitez utiliser pour identifier les doublons.
- Cliquez sur l'onglet "Accueil" dans le ruban Power Query Editor.
- Dans le groupe "Réduire les lignes", cliquez sur "Supprimer les lignes", puis sélectionnez "Supprimer les doublons".
- Power Query supprimera les doublons en fonction des colonnes sélectionnées.
- Cliquez sur "Fermer et charger" ou "Fermer et charger dans..." pour charger les données transformées dans une nouvelle feuille de calcul ou dans une table existante.
Avantages :
- Puissant et flexible.
- Permet de supprimer les doublons lors de l'importation de données.
- Conserve un historique des transformations appliquées.
Inconvénients :
- Nécessite une certaine familiarité avec Power Query.
- Peut être plus complexe pour les utilisateurs débutants.
Conseils et astuces pour supprimer les doublons sur Excel
- Sauvegardez toujours votre feuille de calcul avant de supprimer les doublons. Cela vous permettra de revenir en arrière si vous faites une erreur.
- Vérifiez attentivement les colonnes que vous sélectionnez pour identifier les doublons. Une mauvaise sélection peut entraîner la suppression de données importantes.
- Utilisez des filtres pour examiner les doublons potentiels avant de les supprimer définitivement.
- Utilisez la mise en forme conditionnelle pour mettre en évidence les doublons avant de les supprimer. Cela peut vous aider à identifier visuellement les doublons et à les vérifier.
- Combinez différentes méthodes pour obtenir les meilleurs résultats. Par exemple, vous pouvez utiliser la formule
COUNTIFpour identifier les doublons, puis utiliser la fonctionnalité "Supprimer les doublons" pour les supprimer rapidement.
Erreurs courantes à éviter lors de la suppression des doublons
- Supprimer les doublons sans sauvegarde préalable. C'est une erreur courante qui peut entraîner la perte de données importantes.
- Sélectionner les mauvaises colonnes. Assurez-vous de sélectionner les colonnes correctes pour identifier les doublons. Une mauvaise sélection peut entraîner la suppression de données valides.
- Ne pas vérifier les doublons avant de les supprimer. Prenez le temps d'examiner les doublons potentiels avant de les supprimer définitivement. Cela vous permettra d'éviter de supprimer des données importantes par erreur.
- Oublier les espaces ou les caractères invisibles. Les espaces ou les caractères invisibles peuvent empêcher Excel d'identifier correctement les doublons. Utilisez la fonction
SUPPRESPACEpour supprimer les espaces superflus avant de supprimer les doublons.
Conclusion
Supprimer les doublons sur Excel est une tâche essentielle pour garantir la qualité et la précision de vos données. En utilisant les méthodes décrites dans cet article, vous pouvez facilement identifier et supprimer les doublons, optimiser vos feuilles de calcul et gagner en efficacité. N'oubliez pas de toujours sauvegarder votre feuille de calcul avant de supprimer les doublons et de vérifier attentivement les données avant de les supprimer définitivement.