Bonjour à tout le monde,
Cela fait plusieurs fois que je vois remonter ce fil de discussion et que je reporte ce partage…
Juste en intro, je dois dire que je préfère le forum de growthhacking.fr quand il permet d’échanger des astuces, des pratiques et des bons plans plutôt que quand il se transforme en marketplace de la data ! Surtout que ces sujets de bases de données, c’est vite la Loi de Pareto inversée : tu te retrouves facilement à consommer 80% de ton temps et de tes ressources pour seulement 20% du taf. L’essentiel est ailleurs non ? Comment va-t-o approcher ces braves gens pour leur proposer une expérience qui envoie, quel message, quel tempo ? … tout ça tout ça.
Nous avons dû traiter la question des données des professionnels de l’immobilier il n’y a pas très longtemps pour une action. Voilà comment nous nous y sommes pris :
- l’immobilier est une profession réglementée en France. C’est la CCi qui est chargée de compiler les demandes de cartes professionnelles. 1 carte pro = 1 siret. Chaque entreprise doit déclarer ses collaborateur.trice.s (attestations de compétences pro). 1 carte = x attestations. Avec ces informations, il y a déjà beaucoup d’infos quali pour affiner une stratégie.
- la CCi met à disposition l’annuaire des pro de l’immobilier sur ce lien : Fichier des professionnels de l'immobilier | CCI - Chambre de commerce et d'industrie. C’est public mais protégé par du Cloudflare bien tatillon…
- Nous avons utilisé un proxy pour faire tourner notre process pendant des heures, tous les jours pendant une bonne période. Le plugin chrome Nopecha a très bien marché pour passer les Captcha. Une surcouche old school avec un auto-clicker (GT Auto Clicker) a fait le job quand Cloudflare nous balançait aléatoirement du « Vérifiez que vous êtes bien un humain »
- Nous avons lancé un Web Scraper avec pagination région par région (seul échelle de recherche adéquate sur l’annuaire), et même commune par commune pour l’Île-de-France qui buguait à l’époque sur la recherche par région (trop de liens). Résultat : des dizaines de milliers de liens vers toutes les cartes pro et les attestations.
- Nous avons lancé un Web Scraper sur les liens des cartes pro isolées pour récupérer les infos essentielles : dénomination, activités, adresse, noms des représentants légaux, siren, etc. Un exemple ici : https://www.cci.fr/agent-immobilier/documents/1-PRO-IMMO/cartes/CPI38012017000021402?company_name=&brand_name=&siren=&numero_carte=&code_region=84&city=&code_postal=&person_name=&state_recherche=1&name_region=AUVERGNE-RHONE-ALPES&page=1&nombre_elements=32&nombre_pages=5
- Pour chaque carte, nous avons lancé un Phantombuster pour trouver les noms de domaine correspondant à la requête dénomination + nom de la ville de domicile.
- Avec la dénomination, le nom de domaine et les nom et prénom des représentants légaux, nous avons enrichi avec Dropcontact pour obtenir l’email pro et basculé tout ça dans la suite de notre tuyauterie en campagne cold emailing avec champs personnalisés à l’aide des infos glanées sur la carte pro.
Tout cela a été piloté et automatisé depuis Airtable qui nous permettait de lier les entreprises avec une table des représentants légaux et une table des collaborateur.trice.s (nécesssaire pour nous CQFD le process décrit ci-dessus a été dupliqué sur les liens d’attestations professionnelles, en se servant du numéro de carte pro comme id liant entreprise / RP et collab.)
Il y a sans aucun doute d’autres et parfois plus performantes manières de procéder mais nous avons été assez content du résultat et travaillons depuis plusieurs mois avec ces données !
Bon courage à vous et n’oubliez pas, ̶P̶a̶r̶t̶a̶g̶e̶z̶,̶ ̶c̶’̶e̶s̶t̶ ̶s̶y̶m̶p̶a̶ (d’accord, je sors…).