Détection de pattern de mails à partir d'une liste de mails

Bonjour à tous,

Je récupère actuellement, à partir d’un code NAF, la liste des noms de domaines et mandataires légaux de sociétés dans notre cible.

Je passe ensuite nom + prénom + domaine à plusieurs outils comme Hunter, Snov, Dropcontact, VoilaNorbert…

Lorsque je n’ai pas de résultats, je cherche sur google les adresses mails de l’ensemble de la société qui traînent. J’aimerais, à partir d’une liste de quelques emails :

  • Déterminer si l’adresse mail du mandataire est parmi celles trouvées (ne devrait pas être trop compliqué en cherchant le nom/prénom dans l’adresse mail).
  • Si je ne l’ai pas trouvé, déterminer le pattern des mails sur ce nom de domaine, pour l’appliquer ensuite au mandataire.

Par exemple, à partir de la liste d’emails suivants : [email protected], [email protected], [email protected]

Déterminer automatiquement que le pattern est {f}{last}@domaine.fr

Edit : si vous connaissez des services qui peuvent le faire via API ce serait tout aussi bien ! J’ai essayé une fonctionnalité de Snov (email to profile) mais le taux de réussite est extrêmement bas.

Quelqu’un a déjà travaillé sur la question ? Avez-vous des pistes ?

Merci d’avance :v:

1 « J'aime »

Ma première piste est celle-ci, en notant les mails base@extension

  • On cherche le nombre d’apparitions de . - _ pour déterminer s’il y a un délimiteur dans la base
  • Si c’est le cas, on regarde le nombre de caractères avant/après le délimiteur (pour déterminer si c’est du type {f}.{last} ou {first}.{last} par exemple.
  • Envoyer les chaînes avant/après à GenderAPI pour détecter où se situe le prénom

Mais cela ne fonctionnera pas avec tous les pattern type {f}{last} comme dans l’exemple du post …

1 « J'aime »

J’ai peut-être mal compris ta problématique, alors je vais peut-être te répondre des banalités.

Mais l’idée c’est de générer une liste de pattern à partir du prénom, nom, url :

Puis de faire un check smtp, pour voir si réponse ou non (impossible si catchall).

Hunter utilise cette méthode de check smtp pour son email finder, donc tu ne pourras pas avoir de meilleurs résultats en le fessant toi même. : Email Finder: Camille Besse at growthhacking.fr • Hunter (via l’api ils te retournent aussi le format du pattern)

Le seul cas, ou tu n’auras pas de réponse d’hunter c’est si catchall + 0 trouvé sur le domain search (si email traine sur GG, hunter l’auras dans sa base).

Tu peux aussi tenter https://name2email.com/, qui va utiliser gmail, pour détecter si c’est un email utilisé ou non.

Sinon tu as des techniques alternatives du type Linkedin salesnav, clearbit, fullcontact pour voir si un des emails générés par l’outil de pattern est lié à un profile RS (fastidieux).

1 « J'aime »

Hello @Camille, merci d’avoir pris le temps de me répondre !

En effet tu as plus ou moins compris ma problématique, je vais clarifier (et expliquer comment je procède car cela fonctionne maintenant).

Mon but est de générer des listes d’emails de mandataires (Président, CEO…) de sociétés. Je récupère avec societeinfo les noms des mandataires et le domaine de mail.

Grâce à ces infos, j’essaye de trouver avec plusieurs outils (Hunter, Snov, Dropcontact…) le mail du mandataire. Si aucune API ne me donne de mails, je teste en force brut différents patterns (merci pour ton gdoc dessus d’ailleurs !) avec prénom+nom du mandataire et j’essaye de le bounce avec Neverbounce.

La problématique de mon post arrive quand le premier pattern testé renvoi un « catchall » : impossible de savoir s’il est bon où non. Dans ce cas, et pour éviter au maximum les bounces, je récupère sur internet un maximum de mails se trouvant sur le domaine (imaginons une dizaine de mails trouvés). Le but est dans ce cas de « deviner automatiquement » quel est le pattern des mails sur ce nom de domaine pour l’appliquer au mandataire.

Je le détecte grâce à la méthode décrite ci-dessus (détection de délimiteur + genderAPI pour localiser le prénom/nom) et j’ai plutôt de bons résultats.

Si ça intéresse quelqu’un n’hésitez pas à me solliciter :wink:

2 « J'aime »

Tu pourrais gagner du temps si tu utilisais L’email finder de hunter plutôt que le domain search.
Car l’email finder va tester de lui même plusieurs pattern et faire un check smtp, mais aussi va regarder dans sa base domain search si catchall.

2 « J'aime »

Hello Clément,

J’ai ça si jamais ça peut t’aider à améliorer tes résultats :

Hello,
Si tu utilises Dropcontact, comme tu l’indiques, pour l’adresse email tu n’as plus besoin de faire tout cela :wink:
Et d’ici 15 jours, avec juste le nom de l’entreprise nous traiterons le représentant légal (email, tel…)
Pour ne pas polluer ce thread, tu peux passer sur notre support en ligne :wink:

5 « J'aime »

@Denis_Cohen C’est une excellente nouvelle que tu nous annonces là !

1 « J'aime »

Salut Clément
Merci d’utiliser societeinfo !
Peut-être es-tu passé à côté de nos évolutions mi-décembre sur la partie contact
Depuis quelques mois, on teste/debounce tous nos patterns/emails à partir des mandataires/linkedin et ca fait mal :wink: 2,5M d’emails persos B2B déjà…
On peut échanger en MP pour ré-exécuter ton export avec les données de contact et avoir ton feedback ? Ca sera cadeau !

Merci à tous pour vos réponse !

@Camille j’utilise déjà l’email Finder de Hunter (je n’utilise pas la recherche sur domaine) mais parfois le mail n’est pas trouvé alors qu’en testant les patterns les plus courants sur neverbounce ça fonctionne parfaitement !

@Antoine_Deschamps merci, mais j’utilise GenderAPI, le coût est dérisoire et ça fonctionnera aussi à l’étranger :slight_smile:

@Denis_Cohen Merci pour le retour mais ma problématique de détection de pattern apparaît lorsqu’aucun outil de recherche de mail n’en a trouvé (y compris Dropcontact). Mais je suis curieux de voir ce que donne la nouvelle release !

@AOnnen Hello Antoine, oui il faut qu’on en parle ! Je t’envoie un mail dans la semaine, merci :slight_smile: