Identifier les doublons dans Excel sans les supprimer : Méthodes et Astuces
Les doublons dans Excel peuvent être une source de frustration et d'erreurs. Au lieu de les supprimer directement, il est souvent préférable de les identifier d'abord afin de les examiner et de prendre des décisions éclairées. Voici différentes méthodes pour y parvenir.
1. La mise en forme conditionnelle pour identifier visuellement les doublons
La mise en forme conditionnelle est un outil puissant d'Excel qui permet d'appliquer un format spécifique (couleur, police, etc.) aux cellules qui remplissent une certaine condition. Dans notre cas, nous allons l'utiliser pour mettre en évidence les cellules contenant des doublons.
Étapes :
- Sélectionnez la plage de cellules dans laquelle vous souhaitez identifier les doublons. Par exemple, sélectionnez la colonne A si vous voulez vérifier les doublons dans cette colonne.
- Cliquez sur l'onglet "Accueil" dans le ruban Excel.
- Dans le groupe "Styles", cliquez sur "Mise en forme conditionnelle".
- Dans le menu déroulant, sélectionnez "Règles de mise en surbrillance des cellules", puis "Valeurs en double...".
- Une boîte de dialogue s'ouvre. Vous pouvez choisir le format d'affichage des doublons (par exemple, remplissage rouge clair avec texte rouge foncé). Choisissez le format qui vous convient et cliquez sur "OK".
Exemple :
Imaginez une colonne A contenant une liste de noms de clients. Après avoir appliqué la mise en forme conditionnelle, tous les noms qui apparaissent plus d'une fois seront mis en évidence avec la couleur choisie. Cela vous permet de visualiser rapidement les doublons.
Avantages :
- Simple et rapide à mettre en place.
- Permet une identification visuelle claire des doublons.
Inconvénients :
- Ne fournit pas d'informations quantitatives (nombre d'occurrences de chaque doublon).
- Peut devenir moins lisible si vous avez beaucoup de données et de doublons.
2. Utiliser la fonction NB.SI pour compter les occurrences
La fonction NB.SI (COUNTIF en anglais) est une fonction Excel qui permet de compter le nombre de cellules dans une plage qui répondent à un critère donné. Nous pouvons l'utiliser pour compter le nombre d'occurrences de chaque valeur dans notre liste et ainsi identifier les doublons.
Syntaxe :
=NB.SI(plage, critère)
plage: La plage de cellules dans laquelle vous voulez compter les occurrences.critère: Le critère que vous voulez rechercher.
Étapes :
- Supposons que vos données se trouvent dans la colonne A, à partir de la cellule A1. Dans la cellule B1, entrez la formule suivante :
=NB.SI(A:A, A1) - Cette formule compte le nombre de fois que la valeur de la cellule A1 apparaît dans toute la colonne A.
- Tirez la formule vers le bas pour l'appliquer à toutes les cellules de la colonne A. Vous pouvez le faire en cliquant sur le petit carré en bas à droite de la cellule B1 et en le faisant glisser vers le bas.
- Maintenant, la colonne B affiche le nombre d'occurrences de chaque valeur correspondante dans la colonne A.
Exemple :
Si la cellule A1 contient le nom "Jean", et que "Jean" apparaît 3 fois dans la colonne A, la cellule B1 affichera la valeur 3.
Identifier les doublons :
Les cellules de la colonne A dont la valeur correspondante dans la colonne B est supérieure à 1 sont des doublons.
Avantages :
- Fournit des informations quantitatives sur le nombre d'occurrences.
- Permet de filtrer facilement les doublons en utilisant les filtres Excel.
Inconvénients :
- Nécessite l'ajout d'une colonne supplémentaire.
- Peut être moins visuel que la mise en forme conditionnelle.
3. Combiner NB.SI et la mise en forme conditionnelle
Pour une identification encore plus efficace des doublons, vous pouvez combiner la fonction NB.SI et la mise en forme conditionnelle.
Étapes :
- Suivez les étapes décrites dans la section précédente pour calculer le nombre d'occurrences de chaque valeur en utilisant la fonction
NB.SI(colonne B). - Sélectionnez la colonne A (ou la plage de cellules contenant les données).
- Cliquez sur l'onglet "Accueil" dans le ruban Excel.
- Dans le groupe "Styles", cliquez sur "Mise en forme conditionnelle".
- Dans le menu déroulant, sélectionnez "Nouvelle règle...".
- Dans la boîte de dialogue "Nouvelle règle de mise en forme", sélectionnez "Utiliser une formule pour déterminer pour quelles cellules le format sera appliqué".
- Dans le champ "Appliquer une mise en forme aux valeurs pour lesquelles cette formule est vraie :", entrez la formule suivante :
=B1>1(en supposant que la colonne B contient les résultats de la fonctionNB.SI). - Cliquez sur le bouton "Format..." pour choisir le format d'affichage des doublons (par exemple, remplissage rouge clair). Cliquez sur "OK" pour fermer les boîtes de dialogue.
Exemple :
Maintenant, les cellules de la colonne A dont la valeur apparaît plus d'une fois seront mises en évidence, et la colonne B affichera le nombre d'occurrences.
Avantages :
- Combine les avantages des deux méthodes précédentes : identification visuelle et informations quantitatives.
Inconvénients :
- Un peu plus complexe à mettre en place que les méthodes individuelles.
4. Utiliser les filtres avancés pour extraire les doublons vers un autre emplacement
Les filtres avancés d'Excel offrent une méthode puissante pour extraire les doublons vers un autre emplacement sans les supprimer de la source originale.
Étapes :
- Sélectionnez la plage de données contenant les doublons potentiels, incluant les en-têtes de colonnes.
- Allez dans l'onglet "Données" du ruban Excel.
- Cliquez sur "Avancé" dans le groupe "Trier et filtrer". La boîte de dialogue "Filtre avancé" s'ouvre.
- Plage de la liste : Cette zone devrait déjà être remplie avec la plage que vous avez sélectionnée. Vérifiez qu'elle est correcte.
- Plage de critères : Laissez cette zone vide. Nous n'utiliserons pas de critères spécifiques pour filtrer, mais simplement l'option "Valeurs uniques seulement".
- Action : Choisissez "Copier vers un autre emplacement".
- Copier vers : Spécifiez la cellule où vous voulez que la liste des doublons (ou plutôt, la liste sans doublons) commence à être copiée. Assurez-vous qu'il y a suffisamment d'espace vide en dessous et à droite de cette cellule pour accueillir toutes les données.
- Cochez la case "Valeurs uniques seulement".
- Cliquez sur "OK".
Comment identifier les doublons à partir du résultat :
Cette méthode ne vous donne pas directement la liste des doublons. Elle vous donne la liste des valeurs uniques. Pour identifier les doublons, vous devez comparer la liste originale à la liste des valeurs uniques. Les valeurs qui sont présentes dans la liste originale mais absentes de la liste des valeurs uniques sont (ou font partie de) des doublons.
Exemple :
Si votre liste originale contient les noms "Alice", "Bob", "Alice", "Charlie", et que vous utilisez le filtre avancé pour copier les valeurs uniques vers un autre emplacement, vous obtiendrez la liste "Alice", "Bob", "Charlie". En comparant les deux listes, vous pouvez voir qu'il y a un doublon de "Alice" dans la liste originale.
Avantages :
- Ne modifie pas la liste originale.
- Permet de créer une liste propre sans doublons pour d'autres analyses.
Inconvénients :
- Nécessite une comparaison manuelle (ou l'utilisation d'autres formules) pour identifier exactement les doublons.
- Plus complexe que la mise en forme conditionnelle ou l'utilisation de
NB.SI.
5. Utiliser Power Query (Get & Transform Data) pour identifier et extraire les doublons
Power Query, intégré à Excel (sous "Données" > "Obtenir et Transformer les données"), est un outil puissant pour importer, transformer et nettoyer des données. Il peut également être utilisé pour identifier et extraire les doublons.
Étapes :
- Sélectionnez votre plage de données.
- Allez dans l'onglet "Données" et cliquez sur "À partir d'une table/plage". Cela ouvre l'éditeur Power Query.
- Dans l'éditeur Power Query, sélectionnez la colonne contenant les valeurs que vous voulez vérifier pour les doublons.
- Allez dans l'onglet "Accueil" et cliquez sur "Conserver les lignes" > "Conserver les doublons". Cela ne gardera que les lignes qui ont des doublons dans la colonne sélectionnée.
- (Optionnel) Si vous voulez identifier combien de fois chaque doublon apparaît, vous pouvez ajouter une colonne d'index. Allez dans l'onglet "Ajouter une colonne" et cliquez sur "Colonne d'index".
- Fermez et chargez la requête dans une nouvelle feuille de calcul en cliquant sur "Fermer et charger" > "Fermer et charger dans...".
Exemple :
Si votre colonne contient les valeurs "A", "B", "A", "C", après avoir utilisé Power Query pour conserver les doublons, vous obtiendrez une table contenant uniquement les lignes avec la valeur "A" (les deux occurrences).
Avantages :
- Méthode robuste et flexible pour traiter les doublons.
- Permet de combiner différentes sources de données.
- L'historique des étapes de transformation est enregistré, ce qui facilite la répétition de l'opération.
Inconvénients :
- Peut être plus complexe à apprendre que les méthodes basées sur les formules.
- Nécessite une certaine familiarité avec l'interface Power Query.
Bonnes pratiques pour gérer les doublons dans Excel
- Comprendre la source des doublons : Avant de supprimer ou de modifier les doublons, essayez de comprendre pourquoi ils existent. Cela peut vous aider à prévenir leur apparition future.
- Sauvegarder vos données : Avant d'effectuer des modifications importantes, sauvegardez toujours votre feuille de calcul. Cela vous permettra de revenir en arrière en cas d'erreur.
- Documenter vos actions : Gardez une trace des étapes que vous avez suivies pour identifier et gérer les doublons. Cela facilitera la compréhension et la reproduction de votre travail.
- Choisir la méthode appropriée : Sélectionnez la méthode d'identification des doublons qui convient le mieux à vos besoins et à la complexité de vos données.
Erreurs à éviter lors de l'identification des doublons
- Supprimer les doublons sans les examiner : Ne supprimez jamais les doublons sans avoir vérifié qu'ils sont réellement indésirables. Il peut arriver que des valeurs en apparence identiques soient en réalité différentes (par exemple, des noms avec des espaces différents).
- Utiliser des formules incorrectes : Assurez-vous d'utiliser les formules Excel correctement. Une erreur de syntaxe peut conduire à des résultats incorrects.
- Ignorer la casse : Par défaut, Excel ne fait pas la distinction entre majuscules et minuscules lors de la recherche de doublons. Si la casse est importante pour vous, vous devrez utiliser des formules plus complexes (par exemple, en combinant
EXACTavecNB.SI). - Ne pas tenir compte des espaces : Les espaces avant ou après une valeur peuvent faire en sorte qu'Excel considère deux valeurs comme différentes. Utilisez la fonction
SUPPRESPACEpour supprimer les espaces inutiles.
En conclusion, identifier les doublons dans Excel sans les supprimer est une étape cruciale pour garantir la qualité de vos données. En utilisant les méthodes et les conseils présentés dans cet article, vous serez en mesure de gérer efficacement les doublons et d'optimiser vos analyses.