Equivalent scrap.Io

Bonjour

Je cherche une solution alternative à https://scrap.io/ .
J’ai besoin de scraper des restaurants, hotels, Camping avec les informations comme Nom, adresse et email.

Avez-vous un bon tool ?

Hello @Olivier_Niel,

J’ai fait un article là-dessus où j’en mentionne plusieurs (j’en parle d’ailleurs sur le topic dédié à Scrap.io)

C’est le prix qui te freine ?
Honnêtement, j’ai essayé d’autres solutions et elles n’arrivaient pas à la cheville de Scrap.io

Je pense notamment à Uplead, GMEE (Google Maps Email Extractor), Texau, Phantombuster.

:point_right: Lien de l’article si tu veux un peu plus de détails

2 « J'aime »

non c’est plus la qualité des emails … Sur le mode gratuit…il y avait des erreurs sur les emails…

Je vais lire ton article

Hello Olivier. Pas mal d’outils peuvent le faire. Scrapio peut le faire, TexAu ou Phantombuster et une pléthore d’autres outils le font.

La différence c’est que scrapio propose une jolie interface et ça rescrape (sorry @julienarcin - rectifié). Si on est pas trop technique ça fait bien le job.

Maintenant si tu veux une data actualisée et précise TexAu ou Phantombuster font l’affaire.
De plus ils prennent en charge les URLs de recherche GMB.

Phantombuster par contre ne te permets pas d’enchaîner les étapes de scraping tu dois tout faire à la mano CSV par CSV.

Par contre avec TexAu tu peux cabler ton flow et c’est bien plus puissant mais plus technique. Pas d’interface sexy ou en 3 coups de clics tu as ta data. Mais on reste dans du no-code, la démarche est différente.

J’ai écrit un article (en anglais par contre) qui montre en détail comment ça marche:

PS: je bosse chez TexAu.

1 « J'aime »

Hello Olivier, est-ce que tu peux me remonter les erreurs d’emails ?

Nous renvoyons tous les emails publics présents sur le site sur 1 niveau de profondeur, donc il est peu probable que d’autres outils puissent en renvoyer plus en utilisant la même méthode. C’est ce qui permet d’être certain à 100% qu’un email est associé à un site et à une fiche google maps.

On va travailler sur des filtres plus poussés pour éviter les « faux » emails génériques que notre scrapper récupère sur les sites (du type: email@example.com, john.doe@email.com, etc.) mais tu risques de tomber sur les mêmes problèmes avec d’autres outils de scraping de site.

Il y a deux autres méthodes, un peu plus hasardeuses, mais que tu peux essayer pour récupérer plus d’emails à partir d’une liste de sites :

  • Les passer sur hunter.io pour récupérer les emails avec ce domaine présents sur le web entier.
  • Rééssayer / regénérer des emails du type « contact@domaine.com » et les vérifier.

Hello amz

Merci pour ton commentaire sur la jolie interface de Scrap.io :slight_smile:

Maintenant, je me permets de te reprendre sur le concept de « base de donnée pré-scrapée ».

Attention à ne pas induire les gens en erreur. Lorsqu’un utilisateur fait un export, les data sont mises à jour et rescrapées depuis Google. Ce qui permet, chez nous aussi, de proposer une data actualisée et précise.

Nous avons un moteur derrière qui remet en permanence toutes les données à jour, à chaque fois qu’il y a une recherche d’un utilisateur, un export, etc.

La différence avec TexAu et Phantombuster, c’est que nous sommes un outil dédié à Google Maps.

Et nous avons l’ambition de proposer une solution à la fois beaucoup plus intuitive, et techniquement supérieure à ce qui ce fait ailleurs pour cet usage très précis.

3 « J'aime »

Sorry, rectifié. Scrapio me fait penser aussi à des outils comme https://freshleadfinder.com/
Mais clairement je te l’accorde vous êtes beaucoup plus intuitif, set and forget.

3 « J'aime »

je vais regarder cela

Je n’ai plus le nom de l’entreprise mais c’etait beaucoup de salon de coiffure : on avait des adresses hello@wavy.fr

c’est pas mal Freshleadfinder

Salut Olivier,

J’avais scrapé la liste de tous les restaurants de France l’été dernier sur TripAdvisor (avec tél et email quand dispo).
Si tu veux je pourrais te la revendre pour pas trop chère :slight_smile:

merci… Mais J’ai trouvé une bonne solution avec un outil assez complet.

Il arrive à trouver les prospects par secteur avec les emails et tel… je vends aussi des listings :smile:

je suis intéressé pour connaitre la solution que tu as trouvé Olivier svp .

Salut @amz ,

J’ai lu avec intérêt ton article sur les différentes manières de récupérer les emails.

Est-ce que j’ai bien compris qu’avec TexAu, il y aurait moyen d’avoir le flow suivant :

  1. Scrape Gmaps
  2. Scrape website for email & tel
  3. Scrape website for social media link (ici facebook page)
  4. Scrape facebook page for contact info (email) → surtout dans le cas où le site scrapé en 2 n’a qu’un formulaire et pas d’email de contact.
  5. Check all emails with Emailable

Autre questions :

  • d’après ton expérience (pour des business locaux ex. maçons, électriciens, etc.), est-ce que tu as vu un impact intéressant d’ajouter mes steps 3 & 4 ?
  • est-ce un flow réaliste par rapport au temps d’exécution

Un grand merci pour tes éclaircissements !