Afficher les doublons Excel : Les méthodes incontournables
Excel regorge de fonctionnalités conçues pour simplifier la gestion de vos données. L'identification des doublons en fait partie. Voici les méthodes les plus couramment utilisées :
1. La mise en forme conditionnelle : La méthode la plus simple
La mise en forme conditionnelle est sans doute la méthode la plus rapide et la plus visuelle pour afficher les doublons dans Excel. Elle permet de mettre en évidence les cellules contenant des valeurs en double grâce à un formatage spécifique (couleur de fond, police, etc.).
Étapes à suivre :
- Sélectionnez la plage de cellules dans laquelle vous souhaitez rechercher les doublons. Il peut s'agir d'une colonne entière, d'une ligne, ou d'une sélection spécifique.
- Dans l'onglet "Accueil", cliquez sur "Mise en forme conditionnelle".
- Sélectionnez "Règles de mise en surbrillance des cellules", puis "Valeurs en double...".
- Une fenêtre s'ouvre. Vous pouvez choisir le formatage à appliquer aux doublons (par exemple, remplissage rouge clair avec texte rouge foncé). Choisissez le format qui vous convient le mieux.
- Cliquez sur "OK". Les cellules contenant des doublons seront automatiquement mises en évidence.
Exemple pratique :
Imaginez une liste de noms de clients dans la colonne A. Pour identifier les clients inscrits deux fois, sélectionnez la colonne A, puis suivez les étapes ci-dessus. Excel mettra en surbrillance les noms qui apparaissent plus d'une fois.
Avantages :
- Très simple et rapide à mettre en œuvre.
- Visuel : permet d'identifier rapidement les doublons.
Inconvénients :
- Ne supprime pas les doublons, se contente de les afficher.
- Peut être moins efficace sur de très grandes bases de données.
2. Le filtre : Une méthode pour isoler les doublons
Le filtre avancé d'Excel permet d'extraire une liste unique de valeurs, ce qui, par déduction, permet d'identifier les doublons. Cette méthode est utile si vous souhaitez isoler les doublons dans une nouvelle plage de cellules.
Étapes à suivre :
- Sélectionnez votre plage de données (y compris les en-têtes de colonnes).
- Allez dans l'onglet "Données", puis cliquez sur "Avancé" (dans le groupe "Trier et filtrer").
- Dans la fenêtre "Filtre avancé", assurez-vous que l'option "Filtrer la liste sur place" est décochée. Sélectionnez plutôt "Copier vers un autre emplacement".
- Dans le champ "Plage de la liste", vérifiez que la plage de données sélectionnée est correcte.
- Dans le champ "Plage de critères", laissez-le vide (nous ne filtrons pas sur des critères spécifiques, mais sur la présence de doublons).
- Dans le champ "Copier vers", indiquez une cellule vide où vous souhaitez que la liste unique soit copiée.
- Cochez la case "Extraction unique des enregistrements".
- Cliquez sur "OK".
Excel copiera une liste unique des valeurs de votre plage de données vers l'emplacement spécifié. Les valeurs qui n'apparaissent pas dans cette nouvelle liste sont les doublons.
Exemple pratique :
Vous avez une liste de numéros de téléphone dans la colonne B. En utilisant le filtre avancé avec l'option "Extraction unique des enregistrements", vous obtenez une liste des numéros de téléphone uniques. En comparant cette liste avec la liste originale, vous pouvez identifier les numéros de téléphone qui apparaissent plusieurs fois (les doublons).
Avantages :
- Permet d'isoler les doublons et de les copier dans une autre feuille.
- Utile pour créer une liste de valeurs uniques.
Inconvénients :
- Un peu plus complexe à mettre en œuvre que la mise en forme conditionnelle.
- Nécessite de comparer la liste originale avec la liste unique pour identifier les doublons.
3. La fonction NB.SI : Une méthode pour compter les occurrences
La fonction NB.SI (ou COUNTIF en anglais) est une fonction Excel très puissante qui permet de compter le nombre de cellules dans une plage qui répondent à un critère donné. Dans notre cas, le critère sera la valeur de chaque cellule. En comptant le nombre d'occurrences de chaque valeur, nous pouvons identifier les doublons (les valeurs qui apparaissent plus d'une fois).
Étapes à suivre :
- Dans une colonne adjacente à votre plage de données, entrez la formule
=NB.SI(plage; cellule)où :plageest la plage de cellules dans laquelle vous recherchez les doublons (par exemple,A1:A100). Assurez-vous de figer la plage avec des$:$A$1:$A$100pour éviter qu'elle ne change lorsque vous recopiez la formule.celluleest la cellule dont vous voulez compter les occurrences (par exemple,A1).
- Recopiez la formule vers le bas pour toutes les cellules de votre plage de données.
- Les cellules de la colonne adjacente afficheront le nombre d'occurrences de chaque valeur. Les valeurs qui apparaissent plus d'une fois sont les doublons.
- Vous pouvez ensuite filtrer cette colonne pour afficher uniquement les valeurs supérieures à 1.
Exemple pratique :
Vous avez une liste d'adresses e-mail dans la colonne C. Dans la colonne D, entrez la formule =NB.SI($C$1:$C$100;C1) (en adaptant la plage à votre situation). Recopiez la formule vers le bas. Les adresses e-mail qui apparaissent plus d'une fois auront une valeur supérieure à 1 dans la colonne D. Filtrez la colonne D pour afficher uniquement les valeurs supérieures à 1 pour identifier les doublons.
Avantages :
- Permet de compter le nombre d'occurrences de chaque valeur.
- Flexible : peut être utilisée avec des critères plus complexes.
Inconvénients :
- Nécessite l'utilisation d'une formule.
- Peut être un peu plus lent sur de très grandes bases de données.
4. Supprimer les doublons : L'action radicale
Si votre objectif est de supprimer définitivement les doublons de votre feuille de calcul, Excel propose une fonctionnalité dédiée. Attention : cette action est irréversible, assurez-vous d'avoir une sauvegarde de vos données avant de procéder.
Étapes à suivre :
- Sélectionnez la plage de données contenant les doublons que vous souhaitez supprimer.
- Allez dans l'onglet "Données", puis cliquez sur "Supprimer les doublons" (dans le groupe "Outils de données").
- Une fenêtre s'ouvre. Sélectionnez les colonnes à prendre en compte pour identifier les doublons. Par exemple, si vous avez des données sur des clients (nom, prénom, adresse e-mail), vous pouvez choisir de considérer uniquement l'adresse e-mail comme critère de doublon.
- Cochez la case "Mes données ont des en-têtes" si votre plage de données inclut une ligne d'en-têtes.
- Cliquez sur "OK". Excel supprimera les doublons et affichera un message indiquant le nombre de doublons supprimés et le nombre de valeurs uniques restantes.
Exemple pratique :
Vous avez une liste de produits avec leur code-barres. Certains produits ont été enregistrés plusieurs fois avec le même code-barres. Sélectionnez la colonne contenant les codes-barres, puis utilisez la fonctionnalité "Supprimer les doublons". Excel supprimera les lignes correspondant aux codes-barres en double.
Avantages :
- Supprime définitivement les doublons.
- Simple et rapide à utiliser.
Inconvénients :
- Action irréversible : assurez-vous d'avoir une sauvegarde de vos données.
- Peut entraîner une perte d'informations si les doublons contiennent des données différentes dans d'autres colonnes.
Choisir la bonne méthode pour afficher les doublons Excel
Le choix de la méthode dépend de vos besoins et de la taille de votre feuille de calcul :
- Pour une identification rapide et visuelle : Utilisez la mise en forme conditionnelle.
- Pour isoler les doublons dans une nouvelle plage : Utilisez le filtre avancé.
- Pour compter le nombre d'occurrences : Utilisez la fonction
NB.SI. - Pour supprimer définitivement les doublons : Utilisez la fonctionnalité "Supprimer les doublons" (avec précaution !).
Erreurs à éviter lors de la recherche de doublons dans Excel
Voici quelques erreurs courantes à éviter lors de la recherche de doublons dans Excel :
- Ne pas sélectionner la plage de données appropriée : Assurez-vous de sélectionner la plage de cellules correcte avant d'appliquer une méthode de recherche de doublons. Une sélection incorrecte peut entraîner des résultats erronés.
- Oublier les en-têtes de colonnes : Si votre plage de données inclut une ligne d'en-têtes, assurez-vous de cocher la case correspondante lors de l'utilisation du filtre avancé ou de la fonctionnalité "Supprimer les doublons".
- Ne pas sauvegarder vos données avant de supprimer les doublons : La suppression des doublons est une action irréversible. Assurez-vous d'avoir une sauvegarde de vos données avant de procéder.
- Ignorer les espaces et la casse : Excel est sensible à la casse et aux espaces. "Texte" et "texte " sont considérés comme des valeurs différentes. Utilisez les fonctions
SUPPRESPACEetMAJUSCULE(ouMINUSCULE) pour normaliser vos données avant de rechercher les doublons.
Optimiser votre feuille de calcul pour éviter les doublons
La meilleure façon de gérer les doublons est de les éviter dès le départ. Voici quelques conseils pour optimiser votre feuille de calcul et réduire le risque de doublons :
- Utilisez la validation des données : La validation des données permet de définir des règles pour les données qui peuvent être saisies dans une cellule. Vous pouvez, par exemple, empêcher la saisie de valeurs en double dans une colonne.
- Utilisez des formulaires de saisie : Les formulaires de saisie permettent de standardiser la saisie des données et de réduire le risque d'erreurs et de doublons.
- Nettoyez régulièrement vos données : Effectuez régulièrement un nettoyage de vos données pour identifier et supprimer les doublons. Cela permet de maintenir la qualité de vos données et d'éviter les erreurs.
En suivant ces conseils et en utilisant les méthodes décrites dans cet article, vous serez en mesure d'afficher et de gérer efficacement les doublons dans Excel, améliorant ainsi la qualité de vos données et la fiabilité de vos analyses.