Liste agence immobilière France

Salut @Colin,
Je me permets de revenir vers toi car j’ai quelques difficultés avec le process :

  1. quand je scrap les fiches pro de la CCI, il n’y a pas l’information de SIREN, j’ai juste la dénomination de la societe et lorsque je fais l’enrichissement via phantom buster, les domaines trouvés ne sont pas très quali (beaucoup de perte: bcp de lignes où le domaine est « pappers »,« societe.com »,« kompass » etc.
  2. Sur le peu de domaines que je trouve, lorsque je passe le fichier pour enrichissement (tests effectués sur dropcontact et enrow), il ne trouve qu’une petite partie des mails.

je me retrouve avec un taux d’enrichissement super faibe.

es-tu passé également par ces étapes ?

Merci d’avance !

Bonjour @chiquitos . Bon, désolé, peut-être que 20 jours plus tard, tu as trouvé ton bonheur ! Sinon :

Et donc ne lancer l’enrichissement que lorsque les domaine ssont validés pour augmenter le taux.
Bon courage !

1 « J'aime »

Attention avec la cci, on est entrain de le scraper comme des cochons actuellement pour récupérer les dates de renouvellement des cartes pro… on a fait down le site ce matin . on envoie 200.000 siren dans les requêtes.

le site est protégé par cloudflare mais facile a passer.

Mais ne soyez pas trop gourmand style 10 requetes toutes les 30 secondes

ca fait un département par jour grossierement, le script ce fait en 2 étapes

1 « J'aime »

@Colin Au top, merci pour la précision, tu gères ! Je
Effectivement, j’ai trouvé une solution alternative (je suis allé scrap les infos des annuaires de la FNAIM et de l’UNIS) que j’ai enrichis ensuite.
Mais pour le prochain listing, je retente avec les exclusions dans PhantomBuster, et les SIREN, merci pour le partage.

@Sonic Effectivement j’ai eu le meme souci avec la CCI (a mon echelle biensur lol) mais j’ai du mettre un temps de delay un peu plus long que d’hab.
Je profite que tu sois la pour te remercier ! Je suis client rocketlead et on m’a fait un geste pour que j’utilise siretinfo, c’est bien sympa ! Je suis en train de test l’outil, ca m’a l’air bien pratique ! Au plaisir d’échanger avec toi

Je suis interessé. Merciiiiii (L) :slight_smile:

Il a tout compris, c’est absolument comme ça qu’il faut réfléchir.

Hello, j’ai créé un outil qui fait exactement ce tu veux il me semble ! J’ai créé un scrapper en python qui fusionne les données de SIRENE (donc societe.com, verif etc.) avec celles de Pages Jaunes et Google Maps. Ca te permet d’avoir une vraie liste de toutes les agences immo déclarées en France.

Si tu es toujours intéressé, contacte moi. Je suis encore en phase de test et je cherche des uses case intéressants pour améliorer le code :slight_smile:

Très chaud d’essayer par ici <=