Identifier les doublons Excel : les méthodes incontournables
La présence de doublons Excel peut être problématique, que ce soit pour des listes de clients, des inventaires ou des analyses de données. Heureusement, Excel offre plusieurs méthodes pour repérer et gérer ces doublons.
1. La mise en forme conditionnelle pour repérer visuellement les doublons
La mise en forme conditionnelle est une excellente façon de visualiser rapidement les doublons dans une colonne ou une plage de cellules. Elle permet de mettre en évidence les cellules contenant des valeurs identiques, facilitant ainsi leur identification.
Étapes :
- Sélectionnez la plage de cellules dans laquelle vous souhaitez rechercher les doublons.
- Dans l'onglet "Accueil", cliquez sur "Mise en forme conditionnelle".
- Choisissez "Règles de mise en surbrillance des cellules", puis "Valeurs en double…".
- Dans la fenêtre qui s'ouvre, vous pouvez choisir le format de mise en forme (couleur de remplissage, couleur de police, etc.) pour les doublons. Par défaut, Excel propose un remplissage rouge clair avec du texte rouge foncé.
- Cliquez sur "OK".
Vos doublons seront désormais mis en évidence visuellement. Cependant, cette méthode ne supprime pas les doublons ; elle les met simplement en évidence. Elle est idéale pour une inspection visuelle et une suppression manuelle si nécessaire.
Exemple pratique : Imaginez une liste de noms de clients. En utilisant la mise en forme conditionnelle, vous pouvez rapidement repérer les noms qui apparaissent plusieurs fois.
2. La fonction NB.SI pour compter les occurrences
La fonction NB.SI (COUNTIF en anglais) permet de compter le nombre de fois qu'une valeur apparaît dans une plage de cellules. Elle est particulièrement utile pour identifier les valeurs qui se répètent et déterminer leur fréquence.
Syntaxe :
=NB.SI(plage; critère)
plage: la plage de cellules dans laquelle vous souhaitez compter.critère: la valeur que vous souhaitez compter.
Étapes :
- Insérez une nouvelle colonne à côté de la colonne contenant les données que vous souhaitez analyser.
- Dans la première cellule de cette nouvelle colonne, entrez la formule
NB.SI. Par exemple, si vos données sont dans la colonne A, à partir de la cellule A2, la formule sera=NB.SI(A:A;A2). - Appuyez sur Entrée. La cellule affichera le nombre de fois que la valeur de A2 apparaît dans la colonne A.
- Faites glisser la poignée de recopie (le petit carré en bas à droite de la cellule) vers le bas pour appliquer la formule à toutes les lignes de votre tableau.
Les cellules de la nouvelle colonne afficheront le nombre d'occurrences de chaque valeur. Les valeurs supérieures à 1 indiquent des doublons Excel.
Exemple pratique : Si vous avez une liste d'adresses e-mail, vous pouvez utiliser NB.SI pour vérifier si certaines adresses apparaissent plusieurs fois, ce qui pourrait indiquer une erreur de saisie ou une inscription multiple.
3. L'outil "Supprimer les doublons" : la méthode la plus rapide
L'outil "Supprimer les doublons" est la méthode la plus directe et efficace pour supprimer les doublons Excel. Il permet de supprimer automatiquement les lignes entières qui contiennent des valeurs en double dans une ou plusieurs colonnes sélectionnées.
Étapes :
- Sélectionnez la plage de cellules contenant les données que vous souhaitez nettoyer. Il est recommandé de sélectionner l'ensemble du tableau, y compris les en-têtes de colonnes.
- Dans l'onglet "Données", cliquez sur "Supprimer les doublons".
- Une fenêtre s'ouvre. Cochez les colonnes que vous souhaitez prendre en compte pour identifier les doublons. Par exemple, si vous voulez supprimer les lignes qui ont les mêmes valeurs dans les colonnes "Nom" et "Prénom", cochez ces deux colonnes.
- Assurez-vous que la case "Mes données ont des en-têtes" est cochée si votre sélection inclut les en-têtes de colonnes.
- Cliquez sur "OK".
Excel supprimera automatiquement les lignes en double et affichera un message indiquant le nombre de doublons supprimés et le nombre de valeurs uniques restantes.
Exemple pratique : Vous avez une liste de prospects avec des informations telles que le nom, l'adresse e-mail et le numéro de téléphone. Vous pouvez utiliser l'outil "Supprimer les doublons" en cochant les colonnes "Nom" et "Adresse e-mail" pour supprimer les prospects qui ont le même nom et la même adresse e-mail.
Supprimer les doublons Excel : techniques avancées
Au-delà des méthodes de base, il existe des techniques plus avancées pour gérer les doublons Excel, notamment en combinant plusieurs fonctions et en utilisant des formules complexes.
1. Combiner NB.SI et la mise en forme conditionnelle pour une identification dynamique
Vous pouvez combiner la fonction NB.SI avec la mise en forme conditionnelle pour mettre en évidence les doublons de manière dynamique. Cela signifie que la mise en forme se mettra à jour automatiquement si vous modifiez les données.
Étapes :
- Comme précédemment, utilisez la fonction
NB.SIpour compter les occurrences de chaque valeur dans une colonne. - Sélectionnez la colonne contenant les données que vous souhaitez analyser.
- Dans l'onglet "Accueil", cliquez sur "Mise en forme conditionnelle".
- Choisissez "Nouvelle règle…".
- Sélectionnez "Utiliser une formule pour déterminer pour quelles cellules le format doit être appliqué".
- Dans le champ "Appliquer une mise en forme aux valeurs pour lesquelles cette formule est vraie :", entrez une formule qui vérifie si le nombre d'occurrences est supérieur à 1. Par exemple, si la colonne
NB.SIest en colonne B, la formule sera=B2>1(en supposant que la première cellule de données est en B2). - Cliquez sur "Format…" et choisissez le format de mise en forme que vous souhaitez appliquer aux doublons.
- Cliquez sur "OK" deux fois.
Les cellules contenant des doublons seront désormais mises en évidence dynamiquement. Si vous modifiez les données, la mise en forme se mettra à jour automatiquement.
2. Utiliser les tableaux croisés dynamiques pour identifier et synthétiser les doublons
Les tableaux croisés dynamiques sont un outil puissant pour analyser et synthétiser les données. Ils peuvent également être utilisés pour identifier les doublons Excel en regroupant les données et en comptant les occurrences.
Étapes :
- Sélectionnez la plage de cellules contenant les données que vous souhaitez analyser.
- Dans l'onglet "Insertion", cliquez sur "Tableau croisé dynamique".
- Dans la fenêtre qui s'ouvre, choisissez où vous souhaitez placer le tableau croisé dynamique (nouvelle feuille de calcul ou feuille de calcul existante).
- Cliquez sur "OK".
- Dans le volet "Champs du tableau croisé dynamique", faites glisser le champ que vous souhaitez analyser (par exemple, "Nom") vers la zone "Lignes".
- Faites glisser le même champ ("Nom") vers la zone "Valeurs". Par défaut, Excel affichera la somme des valeurs. Cliquez sur la flèche vers le bas à côté du nom du champ dans la zone "Valeurs", choisissez "Paramètres des champs de valeurs…", puis sélectionnez "Nombre" dans la liste "Calcul".
Le tableau croisé dynamique affichera une liste des valeurs uniques dans le champ "Nom" et le nombre de fois que chaque valeur apparaît. Les valeurs qui apparaissent plus d'une fois sont des doublons.
3. Éviter les doublons lors de la saisie de données avec la validation des données
La validation des données est une fonctionnalité Excel qui permet de définir des règles pour les données qui peuvent être entrées dans une cellule. Vous pouvez utiliser la validation des données pour empêcher la saisie de doublons Excel.
Étapes :
- Sélectionnez la plage de cellules dans laquelle vous souhaitez empêcher la saisie de doublons.
- Dans l'onglet "Données", cliquez sur "Validation des données".
- Dans la fenêtre qui s'ouvre, dans l'onglet "Options", sélectionnez "Personnalisé" dans la liste "Autoriser".
- Dans le champ "Formule", entrez une formule qui vérifie si la valeur entrée existe déjà dans la plage de cellules. Par exemple, si vos données sont dans la colonne A, à partir de la cellule A2, la formule sera
=NB.SI(A:A;A2)=1. - Dans l'onglet "Alerte d'erreur", vous pouvez personnaliser le message d'erreur qui s'affichera si un utilisateur tente de saisir une valeur en double.
- Cliquez sur "OK".
Excel empêchera désormais la saisie de valeurs en double dans la plage de cellules sélectionnée.
Bonnes pratiques pour éviter les doublons Excel
- Normalisez vos données : Assurez-vous que vos données sont saisies de manière cohérente. Par exemple, utilisez le même format pour les dates, les numéros de téléphone et les adresses. Cela facilitera l'identification des doublons.
- Utilisez des listes déroulantes : Les listes déroulantes permettent de limiter les valeurs qui peuvent être entrées dans une cellule, ce qui réduit le risque d'erreurs de saisie et de doublons.
- Vérifiez régulièrement vos données : Planifiez des vérifications régulières de vos données pour identifier et supprimer les doublons avant qu'ils ne causent des problèmes.
- Sauvegardez vos données : Avant de supprimer des doublons, faites une sauvegarde de vos données au cas où vous auriez besoin de les restaurer.
En suivant ces conseils et en utilisant les méthodes décrites dans ce guide, vous pouvez facilement identifier et supprimer les doublons Excel, garantissant ainsi la qualité et la fiabilité de vos données.