Tri de liste de contact

Bonjour,
J’ai réussi à obtenir une très grande liste de contacts (1200 personnes) avec : Prénom, nom, entreprise, email, etc…
Cependant ces données sont brutes, alors voilà ce que je voudrais faire :

  • j’ai des listes d’entreprises qui correspondant à certains critères de sélection, ces listes sont grosses aussi (300 entreprises par listes)
  • Je veux extraire les contacts de la première liste si leur entreprise est répertoriée dans la seconde liste
    Cela paraît simple sur le papier, je ne peux pas le faire à la main « trop long » j’ai donc codé un programme python qui fait ça CEPENDANT les noms d’entreprise ne sont pas tous au mêmes format par exemple je vais avoir « accenture » dans une liste et « accenture france » dans l’autre… ce qui fait que sur les 1200 personnes seulement 60 matchs.
    J’ai déjà fait le test à double inclusion des chaines de caractères mais j’en gagne seulement 12 de plus.
    Alors voilà, si l’un d’entre vous à déjà eu le même problème et connait une solution, vous ferrez de moi un homme heureux.
    Luldrim

Il te faut le n° SIren si tu veux matcher; c le seul identifiant unique pour une entreprise

Dans mon cas cela reviendrait à déplacer le problèmes mais en effet pour mes prochains scrapping je prendrais les siret, merci simple et efficace!
Et du coup tu ne vois pas d’autre solution pour mes listes sans siret ? :sob:

Si tu peux faire une recherche sur la base de données siren qui est en open data et récupérer le siren, codes NAF, effectifs… etc