Formules Excel

Excel : Comment trouver et supprimer les doublons en un clin d'œil ?

15 janvier 2026 1 vues

Les doublons dans vos feuilles de calcul Excel peuvent rapidement devenir un cauchemar. Non seulement ils faussent vos analyses, mais ils rendent également vos données difficiles à gérer. Heureusement, Excel offre plusieurs outils puissants pour identifier, marquer et supprimer ces doublons, vous permettant ainsi de maintenir une base de données propre et précise. Cet article vous guide à travers les différentes techniques, des plus simples aux plus avancées, pour maîtriser l'art de la détection et suppression des doublons dans Excel.

Détecter les doublons dans Excel : Méthodes et outils

Excel propose plusieurs méthodes pour identifier les doublons, chacune adaptée à des situations spécifiques. Nous allons explorer les plus courantes et efficaces.

Utiliser la mise en forme conditionnelle pour surligner les doublons

La mise en forme conditionnelle est un moyen rapide et visuel d'identifier les doublons dans une colonne ou une plage de cellules.

Étapes :

  1. Sélectionnez la plage de cellules où vous souhaitez rechercher les doublons.
  2. Dans l'onglet Accueil, cliquez sur Mise en forme conditionnelle.
  3. Sélectionnez Règles de mise en surbrillance des cellules puis Valeurs en double….
  4. Dans la boîte de dialogue, choisissez le format souhaité pour surligner les doublons (par exemple, remplissage rouge clair avec texte rouge foncé). Vous pouvez aussi personnaliser le format en cliquant sur "Format personnalisé…".
  5. Cliquez sur OK.

Exemple : Imaginez une colonne contenant une liste d'adresses e-mail. En appliquant la mise en forme conditionnelle, vous pouvez immédiatement repérer les adresses qui apparaissent plus d'une fois.

Avantages :

  • Facile à mettre en place.
  • Permet une identification visuelle rapide des doublons.
  • Non destructif : les données ne sont pas modifiées.

Inconvénients :

  • Ne supprime pas les doublons, seulement les met en évidence.
  • Peut être moins efficace pour les grandes bases de données.

Utiliser la fonction « Supprimer les doublons »

La fonction « Supprimer les doublons » est un outil dédié qui permet de supprimer directement les lignes contenant des doublons, en se basant sur une ou plusieurs colonnes.

Étapes :

  1. Sélectionnez la plage de données contenant les doublons potentiels.
  2. Dans l'onglet Données, cliquez sur Supprimer les doublons.
  3. Une boîte de dialogue s'ouvre. Sélectionnez les colonnes à prendre en compte pour identifier les doublons. Par exemple, si vous avez une liste de clients avec des colonnes pour le nom, prénom et adresse e-mail, vous pouvez choisir de considérer uniquement l'adresse e-mail pour identifier les doublons.
  4. Cochez la case « Mes données ont des en-têtes » si votre plage de données inclut une ligne d'en-tête.
  5. Cliquez sur OK.

Excel affiche alors un message indiquant le nombre de doublons supprimés et le nombre de valeurs uniques restantes.

Exemple : Vous avez une liste de prospects importée de différentes sources. Certains prospects peuvent être présents plusieurs fois. En utilisant la fonction « Supprimer les doublons » sur la colonne des adresses e-mail, vous éliminez rapidement les entrées en double.

Avantages :

  • Supprime directement les doublons.
  • Simple à utiliser.
  • Permet de choisir les colonnes pertinentes pour l'identification des doublons.

Inconvénients :

  • Modifie les données de manière irréversible (il est recommandé de faire une copie de vos données avant).
  • Supprime la ligne entière même si une seule colonne est en double.

Utiliser les formules Excel pour identifier les doublons

Les formules Excel offrent une plus grande flexibilité pour identifier les doublons, en particulier lorsque les critères de duplication sont complexes.

Exemple 1 : Utiliser la fonction NB.SI

La fonction NB.SI compte le nombre de cellules dans une plage qui répondent à un critère donné. On peut l'utiliser pour compter le nombre d'occurrences d'une valeur dans une colonne.

Formule : =NB.SI(A:A;A1)

  • A:A représente la colonne entière où se trouvent les valeurs à vérifier.
  • A1 représente la première cellule de la colonne. La formule est ensuite recopiée vers le bas.

Si le résultat est supérieur à 1, cela signifie que la valeur est présente plusieurs fois dans la colonne.

Étapes :

  1. Insérez une nouvelle colonne à côté de la colonne contenant les valeurs à vérifier.
  2. Dans la première cellule de la nouvelle colonne (par exemple, B1), entrez la formule =NB.SI(A:A;A1).
  3. Recopiez la formule vers le bas pour toutes les cellules de la colonne B, en faisant glisser le coin inférieur droit de la cellule B1.
  4. Vous pouvez ensuite utiliser un filtre sur la colonne B pour afficher uniquement les lignes où la valeur est supérieure à 1.

Exemple 2 : Utiliser la fonction FREQUENCE

La fonction FREQUENCE calcule la fréquence à laquelle des valeurs se produisent dans une plage de données. Elle est plus complexe que NB.SI mais peut être utile dans certains cas.

Formule : =FREQUENCE(A1:A10;A1:A10) (cette formule est un exemple, l'utilisation de FREQUENCE pour trouver des doublons est complexe et nécessite une manipulation avancée des tableaux matriciels).

Avantages :

  • Offre une grande flexibilité grâce à la possibilité de combiner différentes fonctions.
  • Permet de gérer des critères de duplication complexes.

Inconvénients :

  • Nécessite une bonne connaissance des formules Excel.
  • Peut être plus complexe à mettre en place que les autres méthodes.

Supprimer les doublons : Techniques et précautions

Une fois les doublons identifiés, il est crucial de les supprimer correctement pour éviter toute perte de données ou erreur.

Supprimer manuellement les doublons

La suppression manuelle consiste à supprimer les lignes contenant les doublons une par une. Cette méthode est adaptée aux petites bases de données où le nombre de doublons est limité.

Étapes :

  1. Identifiez visuellement les doublons (par exemple, grâce à la mise en forme conditionnelle).
  2. Sélectionnez la ligne contenant le doublon.
  3. Faites un clic droit et sélectionnez Supprimer.

Avantages :

  • Permet un contrôle total sur les données supprimées.

Inconvénients :

  • Très chronophage et fastidieux pour les grandes bases de données.
  • Risque d'erreur humaine.

Utiliser la fonction « Supprimer les doublons » (suite)

Comme mentionné précédemment, la fonction « Supprimer les doublons » permet de supprimer rapidement les doublons. Assurez-vous de bien sélectionner les colonnes pertinentes pour l'identification des doublons afin d'éviter toute suppression involontaire.

Précaution importante : Avant d'utiliser cette fonction, il est fortement recommandé de faire une copie de votre feuille de calcul. Ainsi, si vous commettez une erreur, vous pourrez toujours revenir à la version originale.

Filtrer et supprimer les doublons

Vous pouvez combiner l'utilisation des filtres Excel avec les formules pour identifier et supprimer les doublons de manière plus ciblée.

Étapes :

  1. Utilisez une formule comme NB.SI pour identifier les doublons (voir l'exemple précédent).
  2. Activez le filtre sur la colonne contenant le résultat de la formule NB.SI.
  3. Filtrez pour afficher uniquement les lignes où la valeur est supérieure à 1.
  4. Sélectionnez toutes les lignes filtrées (les doublons).
  5. Faites un clic droit et sélectionnez Supprimer la ligne.

Avantages :

  • Permet une suppression ciblée des doublons.
  • Offre plus de contrôle que la fonction « Supprimer les doublons » seule.

Inconvénients :

  • Nécessite une combinaison de compétences (formules et filtres).

Bonnes pratiques et erreurs à éviter

  • Faites une copie de vos données avant toute manipulation. C'est la règle d'or pour éviter toute perte de données irréversible.
  • Définissez clairement les critères de duplication. Quelles colonnes doivent être identiques pour considérer une ligne comme un doublon ?
  • Vérifiez les données après la suppression des doublons. Assurez-vous que les données restantes sont correctes et complètes.
  • Soyez prudent avec la fonction « Supprimer les doublons ». Une mauvaise configuration peut entraîner la suppression de données importantes.
  • Utilisez la mise en forme conditionnelle pour visualiser rapidement les doublons avant de les supprimer.
  • Pour les bases de données complexes, envisagez d'utiliser des outils plus avancés comme Power Query. Power Query offre des fonctionnalités de nettoyage et de transformation de données plus puissantes.

Cas pratiques : Exemples concrets d'utilisation

Nettoyage d'une liste de clients

Vous avez une liste de clients provenant de différentes sources (CRM, formulaires web, etc.). Il est fort probable qu'il y ait des doublons, en particulier si les clients se sont inscrits plusieurs fois ou ont été saisis manuellement.

  • Objectif : Obtenir une liste de clients unique et à jour.
  • Méthode : Utilisez la fonction « Supprimer les doublons » en sélectionnant les colonnes clés (nom, prénom, adresse e-mail, numéro de téléphone). Avant de supprimer, utilisez la mise en forme conditionnelle pour visualiser les doublons et vérifier si ce sont bien des doublons légitimes (par exemple, une personne a changé d'adresse e-mail).

Gestion d'une liste de produits

Vous gérez une liste de produits avec des informations telles que le code produit, le nom, la description, le prix, etc. Des doublons peuvent apparaître si vous importez des données de différents fournisseurs ou si vous mettez à jour la liste manuellement.

  • Objectif : Éviter les erreurs de prix et les confusions lors de la commande.
  • Méthode : Utilisez la fonction NB.SI pour compter le nombre d'occurrences de chaque code produit. Si un code produit apparaît plus d'une fois, vérifiez les informations associées (nom, description, prix) et corrigez ou supprimez les doublons.

Préparation d'un mailing

Vous préparez un mailing et vous voulez éviter d'envoyer plusieurs fois le même e-mail à la même personne.

  • Objectif : Optimiser votre budget et éviter le spam.
  • Méthode : Utilisez la fonction « Supprimer les doublons » sur la colonne des adresses e-mail. Avant de supprimer, exportez la liste des doublons pour vérifier si certaines personnes se sont désabonnées et doivent être retirées de votre liste de diffusion.

En maîtrisant ces techniques et en suivant les bonnes pratiques, vous serez en mesure de gérer efficacement les doublons dans vos feuilles de calcul Excel et d'assurer l'intégrité de vos données.

Questions fréquentes

Quelle est la meilleure méthode pour trouver les doublons dans Excel ?

La meilleure méthode dépend de la taille de votre base de données et de vos besoins. Pour une identification rapide et visuelle, la mise en forme conditionnelle est idéale. Pour une suppression directe des doublons, la fonction « Supprimer les doublons » est plus appropriée. Les formules offrent une plus grande flexibilité pour les critères complexes.

Comment éviter de supprimer des données importantes par erreur ?

La précaution la plus importante est de toujours faire une copie de votre feuille de calcul avant de supprimer les doublons. Définissez également clairement les colonnes à prendre en compte pour l'identification des doublons et vérifiez les données après la suppression.

La fonction « Supprimer les doublons » supprime-t-elle la première occurrence ou la dernière ?

La fonction « Supprimer les doublons » conserve la première occurrence de chaque valeur unique et supprime toutes les occurrences suivantes considérées comme des doublons. C'est pourquoi il est important de vérifier l'ordre de vos données avant d'utiliser cette fonction.

Mots-clés associés :

excel doublons condition excel supprimer doublons colonne excel trouver valeurs identiques excel détecter similarités excel power query doublons

Partager cet article :