Scrapping GMB

Hello à tous,

Avez vous un bon process / outils pour scrapper facilement des entreprises à qui je pourrais vendre une préstation d’optimisation / création de GMB ?

Pour récupérer mail et téléphone d’entreprise qui ont ou n’ont pas de GMB !

Merci d’avance

Bonjour Lucho perso j’utilise https://scrap.io/ qui donne vraiment d’excellent résultats

je n’ai peut être pas bien saisi mais il me semble que l’idée c’est de chercher les professionnels qui n’ont pas GMB et donc ne sont potentiellement pas sur scrap.io, (ou alors ont une fiche créée automatiquement sur laquelle il y a marqué « revendiquer cet établissement »), je ne sais pas si on peut déduire çà de scrap.io.
Pour des petits volumes et un besoin similaire j’avais fait çà avec un script maison : python + selenium, je récupère les infos google maps, et je compare à une base de données d’entreprises pour voir s’il y a un delta, tout ceci n’est pas toujours facile car comparer des bases de données avec des adresses qui n’ont pas toujours la même forme nécessite un peu de travail.

Yes, c’est dispo sur scrap.io, je ne sais pas si c’est sur tous les plans.

Voici un screen du fichier exemple que j’ai partagé sur notre article de blog scrap.io sur Les Zoutils

2 « J'aime »

Intéressant !! Merci !! çà réponds en partie au besoin initial, reste à trouver les pros qui ne sont pas sur GMB, mais c’est peut être assez rare puisque google génère les fiches par je ne sais quel processus automatisé

1 « J'aime »

Je me suis aussi toujours demandé.
Je suis bien curieux de savoir comment fait Google.

Y a aussi peut-être la possibilité de récupérer le différentiel entre scrap.io et les entreprises immatriculées (qui « se doivent » d’avoir un GMB) afin de faire un listing de ceux qui n’en ont pas du tout, mais ça devient compliqué :sweat_smile:

Je pense que pour vendre de l’opti’ GMB, le plus simple est de s’adresser à ceux qui n’ont pas revendiqué la fiche et que ça représente déjà une très belle quantité, surtout qu’il y aura plus certainement la possibilité de les contacter (tel ou mail)

1 « J'aime »

@Lucho1, merci pour ton message

le plus simple est de s’adresser à ceux qui n’ont pas revendiqué la fiche et que ça représente déjà une très belle quantité

Yes, super idée — je ne sais pas si scrap.io le propose, mais notre scraper Google Maps permet de trier en utilisant la variable has_owner

  • true — l’entreprise est vérifiée
  • false — l’entreprise ne l’est pas

Et le lien du scraper juste là:

peut-être la possibilité de récupérer le différentiel entre scrap.io et les entreprises immatriculées (qui « se doivent » d’avoir un GMB)

Une autre idée, peut-être aller chercher le différentiel entre PagesJaunes et GoogleMaps?

  • scraper les données depuis GoogleMaps :red_circle:
  • scraper les données depuis PagesJaunes :yellow_circle:
  • proposer à ceux qui ont Pages Jaune mais pas Google Maps

?

cf. par exemple cette fiche là

https://www.pagesjaunes.fr/pros/59214286

  • présente sur PagesJaunes
  • absente sur Google Maps

Et le lien vers notre joli scraper PagesJaunes si besoin

NB: attention, le matching entre deux bases de données peut être galère, peut-être utiliser un outil de matching de chaîne de caractères? — python - Find the similarity metric between two strings - Stack Overflow

:sparkles:

Oups je viens de voir le topic :zipper_mouth_face:

Oui la donnée est renvoyée par Scrap.io (à partir du plan professionnel). C’est dans la colonne « is claimed » (en anglais) ou « est revendiqué » (en francais)

Mieux, avec les filtres avancés tu peux choisir de n’exporter QUE les fiches non revendiquées pour éviter de consommer des crédits pour rien. Et c’est à partir du plan agence.

Une remarque: Tu auras moins d’emails sur les fiches non revendiquées, car elles sont moins souvent associée à un site internet (forcément…). Et on trouve l’email sur le site internet.

1 « J'aime »