et j’ai essayé d’utiliser Octoparse pour le scraper(Mais je l’utilise habituellement pour scraper Google map, c’est la première fois que je fais openstreetmap.) et je peux avoir une liste de camping et obtenir le contenu dans l’image ci-dessous et les exporter vers un file Excel.
Si ce sont les données dont vous avez besoin, vous pouvez essayer. ou vous pouvez aussi consulter les outils recommandés sur le page [toolbox] (La toolbox du growth hacker 💎)
La piste que j’ai proposé se base sur l’API donc il faut savoir coder un peu pour automatiser la récupération.
En me basant sur la requête API que tu as partagée :
Bonjour,
Je pense que ce sujet peut intéresser pas mal de GH non développeurs (comme moi). Alors si vous avez une astuce ou un conseil, je pense que plusieurs d’entre nous seront intéressés.
Les données OSM sont ouvertes. Pour les récupérer, il faut quand même un minimum de technique. Perso, je ne suis pas fan de scrapping sur du Open Street Maps alors que c’est de la donnée libre et ouverte gratuitement.
Maintenant les options de récupération :
Option 1 donc c’est l’API (n’est ce pas @ophelie )
Overpass reste (un peu) technique et il faut creuser la documentation notamment pour préciser les champs à récupérer. Il y a un Wizard qui permet de faciliter le process.
Prenons l’exemple des campings en France avec le wizard, on saisit : tourism=camp_site in France
Ensuite on précise le format de sortie. Pour l’exemple, j’ai mis des infos sur la position géo, le contact (mail, téléphone, adresse). Il y a plusieurs options possible.
Ensuite on lance et on attend… Pour les campings France, ça a pris 3 minutes, le navigateur a chouiné un peu, mais résultat des courses : 130 000 Points of Interest récupérés (il doit y avoir du déchet dans le tas…).
/*
This has been generated by the overpass-turbo wizard.
The original search was:
“tourism=camp_site in France”
*/
[out:csv(::"id", ::lat, ::lon, name, operator, opening_hours, "contact:website", "contact:phone", "contact:email", brand, dispensing, lastcheck;
true;";")];
// fetch area “France” to search in
{{geocodeArea:France}}->.searchArea;
// gather results
(
// query part for: “tourism=camp_site”
node["tourism"="camp_site"](area.searchArea);
way["tourism"="camp_site"](area.searchArea);
relation["tourism"="camp_site"](area.searchArea);
);
// print results
out body;
>;
out skel qt;
Merci @MehdiZ pour ces explications + pour le code associé.
Si le csv est toujours disponible je suis intéressé de mon côté.
Encore merci et bonne journée.
Sur data.gouv.fr tu as la possibilité de télécharger un fichier SIREN ou SIRET avec toutes les sociétés à jour, il te suffit de le télécharger, de filtrer avec le bon code NAF, et tu devrais avoir ce que tu recherches
…au pire si il n’y a pas de numéro, tu complète cela avec un scrap d’un annuaire
sur google my business (gmaps) tu va récupérer les sites web, ensuite plusieurs solutions, soit chercher des emails sur les sites, soit utiliser des outils « nom de domaine » → « email »