[TUTO] Scraper les emails de Tripadvisor avec Scrapebox ✉

Merci @Xavier_Loup

A quand pole-emploi :smile:? C’est une super source de lead B2B !
Top sinon tes tutos :+1:

Scrapebox 4EVER :innocent: :innocent: :innocent: :innocent:

Le pays n’est pas dans l’url. Il faudrait faire région par région. De toute façon, scraper la France entière sans proxy etc…je ne te conseille pas.

  • Tu load l’ensemble des urls > « remove urls not containing » (ex : « Ile_de_France ») > tu gardes de côté
  • Tu load l’ensemble des urls > « remove urls not containing » (ex : « Hauts_de_France ») > tu gardes de côté
  • etc…

Merci @Camille C’est cool :slight_smile:

Salut @Camille , hâte que tu sortes un tuto sur le custom Grabber :wink:

1 « J'aime »

Salut,
Je viens de jeter un oeil à Scrapebox, ça correspond parfaitement à l’un de mes besoins, mais vu que c’est 100€ , est ce qu’il y en a qui seraient intéressé par partager le coût de l’outil ?

Tu ne pourras pas partager, ils ont un système de licence par machine, impossible de l’activer sur deux différente. Même toi si tu changes de machine, tu es obligé d’envoyer un mail.

Bonjour,
Scrapebox est en promo à 67$ : http://www.scrapebox.com/BHW

1 « J'aime »

Ha j’avais oublié ce lien, merci @chardy !

Arf ok !

Merci à vous deux ! @Camille @chardy

67$ ça devient plus raisonnable

Merci @Camille pour ce tuto, Scrapebox fonctionne très bien sur ce use case :slight_smile: J’aurai voulu savoir si il était possible de récupérer le nom du restaurant à coté de l’email également via scrapebox, si tu passes par le custom data grabber pourrais tu nous en dire plus sur ta config ?
Merci d’avance

PS: Je suis assez nouveau sur Scrapebox mais serais ravi de faire de tenter un tuto car j’ai déjà fait pas mal de scrapping sympas :slight_smile: A ta dispo en PM pour en parler

Oui possible, mais faudrait que je refasse un tuto video, car pas message ça va être galère.

2 « J'aime »

Awesome pour les besoins simples ! Merci !
Pour le reste, j’ai tendance à dev des petits scripts puppeteer spécifiques à chaque besoin (surtout quand pages/informations dynamiques) utilisables sur des lambda AWS :heart_eyes:.

1 « J'aime »

Hello @Camille !

Merci pour ton super tuto :slight_smile:

Petite question concernant les 66 liens XML. J’ai de mon coté fais l’extract et je souhaite récupérer toute la BDD.

Que me recommandes-tu en termes de configuration scrapebox afin de parvenir à mes fins s’il te plait ?

Bien à toi,
Vivien

Je ne conaissais pas Scrapebox
Belle découverte, merci :slight_smile:

1 « J'aime »

Idem de mon côté je vais rafraîchir mes données historiques qui datent de 2019 et les choses ont bien changé depuis lors…

Hello,
Merci pour le Tuto ! Tout fonctionne de mon côte ! En revanche je serai très intéressé d’en savoir plus concernant la récupération du num de tel, email et nom de restaurant… Tout en un… Si il y a une explication je suis preneur ! :slight_smile:

Même intérêt de mon côté pour extraire et trier un peu mieux les infos récupérées par scrapebox!

Salut,
Merci pour le tuto, néanmoins j’ai un problème lors de l’extraction des url en .gz l’addons scrapebox utilisé crash à chaque fois si tu as des infos je suis preneur