Retour d'XP : taux d'enrichissement email selon le nombre de providers

Salut,

Je partage un truc qu’on a mesuré en interne sur Captely (on bosse sur l’enrichissement B2B) parce que ça peut servir à ceux qui galèrent avec des taux d’enrichissement email à 30-40%.

On a testé sur un fichier de 5000 contacts B2B français (mix PME/ETI/grands groupes) en faisant varier le nombre de providers :

→ 1 provider seul : 32-38% d’emails trouvés

→ 2 providers : 48-55%

→ 5 providers en cascade : 72-78%

→ Au-delà de 10 : quasi plus de gain marginal

Le principe de la cascade (waterfall) c’est d’interroger le provider A, s’il trouve pas on passe au B, puis C etc. Chaque provider a ses propres sources de données donc ils se complètent bien.

Un truc qu’on n’avait pas anticipé c’est que le taux de vérification baisse un peu avec le nombre de providers (85% vérifié avec 1 provider, ~78% avec 10+). Normal vu que les derniers providers interrogés ont des données moins fraîches.

Le sweet spot pour nous c’est 5-7 providers. Au-delà le gain marginal vaut pas le coût.

Par contre les TPE/PME non-digitalisées (BTP, artisanat, commerce local) restent à 30-40% même en cascade. Y a juste pas d’email pro indexé nulle part pour ces profils.

Le marché français est particulièrement dur comparé aux US/UK — les outils américains (Apollo, ZoomInfo) donnent des taux très bas sur du B2B français parce que leurs sources sont US-centric.

Vous observez les mêmes ordres de grandeur de votre côté ?

Parce que toute la boîte est sur la même adresse Outlook référencée sur Google Maps et PagesJaunes, y a pas vraiment de sujet de ce côté-là.

Par contre ce qui m’intéresse c’est ton taux de bounce lié à des erreurs SMTP d’adresses non existantes suite à ces enrichissements. J’ai fait un benchmark interne quasi-exhaustif de 17 solutions de vérification d’email avec 5 types d’adresse en input :

Type
Custom infrastructure (OVH mail servers)
Google Workspace set to catch-all
Managed Microsoft 365
Federated Microsoft 365
Google Workspace set to catch-all

Seules 3 solutions arrivent à confirmer à 100% les emails sans déperdition inutile (ex. dire catch-all alors que l’adresse existe ou timeout), et 2 dans les 17 mentent carrément (disent qu’une adresse est invalide ou valide alors que l’inverse est vrai).

Les 3 seules solutions valables:

Only vendors I’d work with:
1. emailable.com
2. usebouncer.com
3. bounceban.com

Les solutions nocives (mentent) :

Intéressant. Je n’observe pas la même chose sur mes propres mesures. Tu serais OK pour partager tes données en MP ?

Exactement pour les taux sur le 5+.

Sur l’ensemble de nos clients, en faisant la cascade Dropcontact et FullEnrich en relais, on est légèrement en dessous de 80% sur Pharow.

Carrément, on voit les mêmes galères en France, surtout sur les TPE/PME non-digitalisées, c’est un enfer pour trouver des emails. Perso, pour le scrape LinkedIn et l’enrichissement, j’utilise souvent Scrupp avec un coup d’Apollo derrière pour la vérif, ça me donne des taux corrects. C’est clair que le waterfall est la clé, 5-7 providers c’est le bon équilibre pour pas péter le budget.