Scraping sur zone géographique

Salut à tous,

Je cherche à scraper toutes les entreprises présente sur une zone géographique précise.
J’ai la zone sous le nom des communes, mais aussi sous forme d’un rayon autour d’une ville centrale.
En fait, il s’agit de développer une agence de nettoyage pour bureau.

Si certains ont des idées sur le processus je suis preneur :slight_smile:

PS : j’ai évidement penser à Scrap.io, mais est ce que c’est assez précis sachant que les données ne viennent « que » de Google Map ?

hello, j’ai fait ça récemment, j’ai pris societeinfo

Hello :wave:

SI tu as quelques moyens, je pense à societe.info qui peut être hyper utile selon ta cible. Sinon Pharrow aussi est pas mal.
Et si tu as un sales Nav, ça pourrait aussi être pas mal.

Avec phantombuster tu peux scrap Google map, mais comme tu as dis sur scrap.io, c’est de la donnée qui vient que de là et certaines entreprises ne crée pas de de google my business.

Je sais que tu as des bases de données open data du gouvernement qui te permettent d’avoir ce genre d’info, j’ai plus le nom en tête. J’avais testé une API qui était libre d’utilisation et qui allait chercher ces données. Si je la retrouve je te la noterais ici ^^

Voila voila, j’éspère que ça a pu t’aider

Effectivement les deux solutions sont intéressantes, mais couteuse pour mon client, surtout société info, la qualité est là, mais le coût élevé…

Je cherchais plutôt un service moins cher, même s’il faut mettre des billes, ou alors si certains ont un processus via python ou autre.

J’avais l’idée de prendre la liste des entreprises sur le secteur via data gouv
Automatiser la recherche Google via python avec Nom + adresse
Et choper les premiers liens de recherches Google
Faire une comparaison des noms de domaine avec les noms d’entreprise
Et extraire les mails de chaque page extraite

Ça fait beaucoup d’étape, avec de la perte à chaque fois /:

Merci en tout cas !

Hey :wave:

De rien, désolé de pas avoir plus aidé.
J’ai retrouvé les API pour les sociétés, je te mets les liens juste en dessous ^^

et

Voila voila, bonne journée à toi :wink:

2 « J'aime »

Oui il y a 2 api pour requêter la base des entreprises françaises :

et pour la recherche géographique :
https://recherche-entreprises.api.gouv.fr/docs/#tag/Recherche-geographique

cdt

1 « J'aime »

Merci beaucoup, vous savez s’il est possible d’avoir accès au mail via les API ? C’est en fait ma recherche principale pour du cold mailing par la suite

Via ces API non il nest aps possible d’avoir le mail. Mais si tu fais une automatisation avec make, zapier, n8n… Tu peux très bien avoir un flow qui va récupérer les infos via l’API du gouv et avec ces infos, enrichir avec un outil (societe info serait le plsu performant je pense)

1 « J'aime »

Petite MAJ pour tout le monde.
Mon client à pas beaucoup à mettre dans cette stratégie, et on essaie de bricoler un peu quelque chose de sympa tout de même, du coup j’ai fait une méthode qui pourrait peut-être servir à d’autre :smiley:

En quelques étapes :

  1. Extraire le nom de toutes les entreprises dans le secteur géographique : via la base sirene et les Codes Postaux des villes dans le secteur défini
  2. Sélection du nom des entreprises + le département
  3. Automatisation des recherches via python (sélénium) dans Google avec NOM D’ENTREPRISE + DÉPARTEMENT
  4. On demande au script de sélectionner la première URL de la liste
  5. Visite de chaque URL sélection pour trouver le mail sur la page d’accueil et le(s) page(s) de contacte

Avec cette méthode qui prend un peu de temps à faire tourner, on arrive à 80 % de mail depuis la base des noms d’entreprise. Donc ça commence à être pas mal intéressant !

1 « J'aime »