Correspond aux lignes dupliquées dans Excel dans une plage

Nous avons un grand file excel avec 120000 lignes de données où nous devons find des loggings en double.

Les premiers loggings sont l'logging principal correspondant à la list des loggings dupliqués. Nous devons confirmer si le double est vrai et les mettre en évidence.

Chaque logging comporte plusieurs lignes en fonction du nombre d'adresses e-mail dans le file et des adresses physiques.

Les résultats souhaités sont les suivants: 1. Si le nom dans l'logging principal correspond au nom dans l'logging dupliqué, searchz toutes les adresses de l'logging maître avec l'une des adresses dans les loggings dupliqués ou correspondant aux adresses e-mail de l'logging maître avec dupliqué adresses e-mail dans les loggings dupliqués. Ensuite, posez un YES dans la colonne des duplicates pour les deux matches.

  1. Sélectionnez les adresses correspondantes dans une couleur, mettez en surbrillance les noms correspondants avec une autre couleur, mettez en surbrillance les adresses e-mail correspondantes avec une autre couleur.

Il peut y avoir plus d'un logging dupliqué trouvé et ceci est montré dans la colonne A

Si les noms ne correspondent pas, mais tout le rest correspond, nous voulons toujours mettre un NO afin que nous puissions effectuer une vérification manuelle en passant par le document excel.

C'est la formule qui est utilisée dans la colonne E. Cela ne fonctionne que si la première adresse de l'logging maître a une correspondance dans les loggings dupliqués. Si c'est la 2ème adresse dans l'logging principal qui correspond, alors cela ne fonctionne pas.

= IF (OR (C2 et B2 = B2, C2 et B2 = C2, D2 et C2 = D2, D2 et C2 = C2, B2 = "Adresses", C2 = "Nom"), "", IF (SUM (- (C2 & B2 & D2 = C: C & B: B & D: D))> 1, "OUI", "NON"))

Pouvez-vous aider à réparer la formule et vous aider à mettre en évidence les duplicates?

ABCDE Master Addresses Name Email address Duplicate 255812 1 test rd Sydney John Doe [email protected] YES 1 test rd Sydney [email protected] PO BOX 2 Sydney Addresses Name Email address 421504 1 test rd Sydney John Doe [email protected] YES Duplicate records found: 1 Master Addresses Name Email address 455444 1111 House rd Sydney Steven Jacks [email protected] NO 134 Smart St Sydney Addresses Name Email address 53421 134 Smart St Sydney Steven Jacks [email protected] NO 1111 House rd Sydney [email protected] Level 5, Kings St Syd 134 Smart St Sydney Addresses Name Email address 13232 Level 5, Kings St Syd Steven R Jacks [email protected] NO Duplicate records found: 2 

En élaborant mon commentaire sur votre question, voici une façon de "normaliser votre file un peu avant de find des duplicates:

Enregistrer l'ordre de sorting d'origine du file (colonne F – pas de formule)

En supposant qu'aucun Master n'a plus de 999 adresses jointes, calculez une key pour tous les loggings de données réels et économisez en tant que valeur

G2 et vers le bas: =IF(ISNUMBER(A2);A2;IF(AND(A2="";AND(B2<>"";B2<>"Addresses");ISNUMBER(G1));G1+0,001;""))

H2 et bas: =G2 , puis copyr / coller en tant que valeur

entrez la description de l'image ici

maintenant sortinger selon vos critères de duplication (par nom, adresse)

puis ajoutez une formule de search dup comme "si cette key de ligne = touche de ligne précédente, puis ce countur = countur précédent + 1 autre ce countur = 1", par exemple

I2 et vers le bas: =IF(ISNUMBER(H2);IF(AND(C2<>"";C2=C1;B2=B1);I1+1;1);"")

entrez la description de l'image ici

maintenant vous pouvez

  • filter la colonne I pour toutes les valeurs> 1 pour identifier les duplicates. vous findez John Doe à 1 test Sydney …
  • reportez le résultat via VLOOKUP sur la colonne KeyValue à votre table d'origine
  • etc …

    et nous ne prenons pas en count les différentes orthographes comme les abréviations et les caractères en majuscule, les espaces blancs ou les interpunctations (Rd vs Rd. vs Road, Road, 1 vs 1. vs 1.) – les initiales du milieu dans les noms, etc. etc. . Ceux-ci sont la peine réelle pour le nettoyage des files d'adresse

vous pouvez répéter ce qui précède pour un ordre de sorting différent (p. ex. adresse + nom)

Rappelez-vous avant tout sorting, vous devez convertir les formules en valeurs!

maintenant … tout cela peut sembler plutôt compliqué … donc … si ce n'est pas un exercice unique, mais un exercice récurrent, je pense à VBA …