Comment supprimer des doublons dans Excel sans rien oublier ?

On reçoit un export CRM de plusieurs milliers de lignes, on lance un tableau croisé dynamique, et les totaux ne collent pas. Le réflexe : chercher les doublons dans Excel. Le piège : cliquer trop vite sur « Supprimer les doublons » et perdre des lignes qui n’étaient pas vraiment des doublons. Espaces invisibles, formats de date incohérents, casse différente entre « DUPONT » et « Dupont » – autant de faux positifs qu’Excel ne distingue pas seul.

Avant de supprimer quoi que ce soit, il faut comprendre ce qu’Excel considère comme un doublon, puis choisir la méthode adaptée à la taille et à la sensibilité du fichier.

A lire en complément : Créer un tableau statistique sur excel : étapes simples et astuces pour débutants

Nettoyer les données avant de chercher les doublons dans Excel

Le bouton « Supprimer les doublons » compare la valeur brute stockée dans chaque cellule. Si une ligne contient « Jean Dupont » avec un espace en fin de chaîne et une autre « Jean Dupont » sans cet espace, Excel les considère comme deux valeurs distinctes. Le doublon passe inaperçu.

Même logique pour les dates : une cellule affichant « 08/12/2024 » et une autre « 8 décembre 2024 » peuvent avoir des valeurs internes différentes selon le formatage appliqué. On se retrouve avec des « faux uniques » qui faussent les comptages.

A lire aussi : Excel trouver les doublons : méthodes simples pour débutants pressés

Avant toute opération de dédoublonnage, on passe par une étape de normalisation :

  • Appliquer la formule SUPPRESPACE (ou TRIM) sur les colonnes texte pour retirer les espaces invisibles en début, milieu et fin de chaîne.
  • Uniformiser la casse avec MAJUSCULE ou MINUSCULE sur les colonnes noms, villes ou références produit.
  • Vérifier que toutes les dates utilisent le même format interne en les recollant via DATEVALUE si nécessaire.
  • Contrôler les colonnes numériques : un chiffre stocké comme texte (petit triangle vert dans la cellule) n’est pas égal au même chiffre stocké comme nombre.

Cette étape prend quelques minutes sur un fichier moyen. Elle évite de supprimer des lignes à tort ou de garder des doublons invisibles.

Homme en télétravail supprimant des doublons dans un fichier Excel sur laptop

Supprimer les doublons Excel avec l’outil intégré : ce qu’il fait vraiment

Dans l’onglet Données, le bouton « Supprimer les doublons » ouvre une fenêtre qui liste toutes les colonnes de la plage sélectionnée. On coche celles qui doivent être identiques pour qu’une ligne soit considérée comme doublon.

Si on ne coche qu’une seule colonne (par exemple l’adresse e-mail), Excel supprime toute ligne dont l’e-mail apparaît déjà plus haut dans le tableau, même si les autres colonnes diffèrent. C’est le cas d’usage classique pour dédoublonner une liste de contacts.

Si on coche plusieurs colonnes, Excel exige que toutes les valeurs cochées soient identiques pour considérer la ligne comme doublon. C’est plus prudent quand deux personnes distinctes partagent le même nom de famille.

La limite principale de cet outil

La suppression est définitive et immédiate. Excel conserve systématiquement la première occurrence (la ligne la plus haute) et supprime les suivantes. On ne choisit pas quelle version garder. Si la ligne la plus récente contenait des données mises à jour, c’est la version obsolète qui reste.

Pour cette raison, on travaille toujours sur une copie du fichier ou on utilise Ctrl+Z immédiatement après si le résultat ne correspond pas à ce qu’on attendait.

Fonction UNIQUE et Power Query : dédoublonner sans toucher aux données source

Depuis Excel 365 et Excel 2021, la fonction UNIQUE change la donne. Placée dans une cellule vide, la formule =UNIQUE(A2:D500) génère automatiquement une liste dédoublonnée dans une plage adjacente. Les données source restent intactes.

Le résultat se met à jour dynamiquement : chaque ajout ou suppression dans la plage d’origine se répercute sans intervention. Pour les fichiers vivants (suivi de commandes, base d’abonnés, reporting mensuel), c’est la méthode la plus fiable pour ne rien oublier.

Power Query pour les gros volumes

Sur des fichiers de plusieurs dizaines de milliers de lignes ou des bases consolidées depuis plusieurs sources, Power Query offre un contrôle plus fin. On charge la plage dans l’éditeur, on sélectionne les colonnes de référence, puis on clique sur « Supprimer les doublons ». Le résultat est rechargé dans une nouvelle feuille, sans modifier la source d’un seul octet.

Power Query permet aussi de choisir quelle occurrence conserver (première ou dernière) en triant les données avant la suppression, ce que l’outil natif ne propose pas.

Deux collègues collaborant pour identifier et supprimer des doublons Excel en open space

Bloquer les doublons dès la saisie avec la validation des données

Plutôt que de nettoyer après coup, on peut empêcher l’entrée d’un doublon au moment de la saisie. La méthode repose sur la validation des données combinée à la formule NB.SI.

On sélectionne la colonne concernée (par exemple B2:B1000), puis dans Données > Validation des données, on choisit « Personnalisé » et on entre la formule :

=NB.SI(B:B;B2)=1

Si un utilisateur tape une valeur déjà présente dans la colonne, Excel affiche un message d’erreur et bloque la saisie. On peut personnaliser ce message pour indiquer « Cette référence existe déjà en ligne X ».

Quand cette méthode atteint ses limites

La validation fonctionne bien sur une colonne unique. Pour un contrôle multi-colonnes (même nom + même prénom + même date de naissance), il faut combiner NB.SI.ENS, ce qui alourdit la formule. Sur des fichiers partagés en réseau ou dans SharePoint, les retours varient sur la fiabilité de la validation en temps réel avec plusieurs utilisateurs simultanés.

Choisir la bonne méthode selon le contexte du fichier

Situation Méthode recommandée Précaution
Liste simple, nettoyage ponctuel Bouton « Supprimer les doublons » Travailler sur une copie
Base vivante mise à jour régulièrement Fonction UNIQUE (Excel 365/2021) Vérifier la normalisation des données source
Consolidation multi-sources, gros volume Power Query Trier avant suppression pour choisir l’occurrence conservée
Prévention à la saisie Validation des données + NB.SI Limité à un contrôle mono ou bi-colonne en pratique

Le choix dépend du volume, de la fréquence de mise à jour et du nombre de personnes qui interviennent sur le fichier. Un export ponctuel de quelques centaines de lignes ne justifie pas de monter une requête Power Query. À l’inverse, un reporting mensuel consolidé mérite une approche non destructive qui préserve la traçabilité.

Dans tous les cas, la première étape reste la normalisation. Sans elle, aucune méthode de suppression des doublons dans Excel ne donne un résultat fiable.