Scrapping CAPEB

Bonjour à tous.
Je suis en train de developper un scapper pour collecter les donnees du site de la capeb (https://artisans-du-batiment-by-capeb.com).
Leur api me limite a 10 000 donnees.
Connaissez vous le moyen d’en consulter plus?
Merci d’avance pour vos retours

Quel appel API fais-tu ?

J’utilise les api du site.

Difficile de t’aider à dépasser la limite d’une API sans la connaitre…
Surtout qu’il n’y a pas d’API officielle proposé sur leur site.
Mais si tu parles des requête elastic-search, encore une fois tout dépend de la requête que tu fais…

Vite fait comme çà, je dirais que l’API est simple à utiliser mais complexe quand il faut récupérer tous les artisans, les paramètres de l’API sont :

params = {
    'q': 'plombier',
    'limit': '24',
    'page': '1',
    'distance': '40',
    'lat': '43.874987',
    'lon': '-0.51446',
    'withLogo': 'false',
    'includes': 'labelsForCompanies,labelsForCompanies.label,mainActivities,secondaryActivities,users',
}

on peut se passer du métier, ainsi l’API renvoie tous les métiers autour du point de coordonnées fourni, ensuite il faut un peu « bidouiller » pour faire des recherches géographiques, gérer la pagination, et se déplacer pour couvrir toute la france, tu as essayé çà ? et çà te limite à 10 000 items ?

Bonjour,
Chaque requête ne peux pas donner plus de 10 000 reponses.
Comme DJouso l’a fait remarquer je cible chaque metier sur chaque departement.
Grace a cette methode, j’ai deja pu recuperer près de 30 000 adresses avec téléphone et email.
Ca prend tu temps mais ca ce fait.
Merci a vous deux pour vous 2 pour votre aide

ok, c’est un début mais je pense qu’il y a en bien plus que çà, j’avais déjà scrapé ce site il y a quelque temps, mais il a été mis à jour récemment, je ne l’ai donc pas fait avec la nouvelle API, amuses toi bien, et si besoin j’ai des bases de données d’artisans, et je peux aussi scraper cet annuaire

idem, et j’étais autour de 62 000 pages artisan