Hello les growth hackers,
Je partage une ressource qui pourrait intéresser ceux qui bossent dans la Lead Gen Solaire / PAC.
Pour un projet perso, j’ai mis en place un workflow de scraping pour nettoyer la base officielle RGE (qui est souvent inexploitable brute).
La méthode : J’ai croisé le fichier officiel de l’État avec la base Sirene et des annuaires inversés.
Le résultat (Clean Data) :
-
5 120 Installateurs actifs vérifiés.
-
Enrichissement : Ajout du Mobile (06/07) du gérant pour chaque ligne.
-
Filtrage des doublons et des sociétés fermées.
Comme je suis dev et pas commercial, je n’ai pas l’usage du fichier final. Je le mets à dispo pour une petite participation (100€) histoire de rentabiliser le temps machine/proxy.
Si certains veulent tester la qualité, envoyez-moi un MP, je vous file un échantillon (5-10 lignes).