Hello @VinceHood ,
Je ne suis pas le 1er en scraping, mais j’en fais de plus en plus avec l’IA.
Y a une API pour la data quand tu inspecte la console une fois sur le site :
https://api.artisans-du-batiment-by-capeb.com/elastic-search?q=plombier&limit=24&page=1&lat=46.5&lon=2.5&distance=1000
Je ne sais pas si tu utilise Claude Code ou des outils du style.
Sinon installe ça (et tu choisis le modèle Gemini 3 pro), t’as du crédit gratuit :
Et ensuite, en lui donnant ces instructions il devrait te faire le script (dis-lui d’essayer “manuellement” avant) :
Scrape l'API CAPEB artisans du bâtiment.
URL type :
https://api.artisans-du-batiment-by-capeb.com/elastic-search?q={METIER}&limit=24&page={PAGE}&lat=46.5&lon=2.5&distance=1000
Contraintes :
limit=24 max (hard-codé)
page max = 416 (limite Elasticsearch 10k)
lat/lon obligatoire (46.5, 2.5 + distance=1000 couvre toute la France)
SSL verify=False
Métiers à itérer :
electricien, plombier, macon, chauffagiste, couvreur, menuisier, peintre, carreleur, charpentier, serrurier, plaquiste, terrassier, facades, vitrier, climatisation, isolation
Algo :
Pour chaque métier, paginer de 1 à 416
Stocker dans un set d'IDs pour dédupliquer
Sauvegarder en JSON
Délai 1s entre requêtes
Réponse : {"items": [...]} — les artisans sont dans items
PS : Je sais pas si c’est autorisé, donc je te laisse vérifier tout ça. Je ne sais pas aussi si ça rencontrera des limites, good luck ![]()
PS 2 : Dis-lui de te faire aussi le CSV plutôt que Json si tu veux l’ouvrir facile, commence par une petite quantité pour voir si c’est ok