Trouver des adresses emails de restaurateurs / restaurants

Bonjour,
Sinon, un petit script qui va chercher nom de l’établissement, tel, émail, adresse,… Direct sur TripAdvisor sur tout un département. Ça se fait tout seul :blush:

le voici: https://docs.google.com/spreadsheets/d/1WD1Ex4gqwheB6FQXd0lkH6JTbfrUe-BFkvGtInBZDYw/

file > make a copy

2 « J'aime »

Si besoin, j’ai toute la data France en base MongoDB

5 « J'aime »

Merci Brice, copie faite :slight_smile:

Data France sur quel thème ?

Restaurants

1 « J'aime »

Très intéresser !!
On peut échanger par MP ? J’ai une autre requête :slight_smile:
Merci !!

1 « J'aime »

Hello à tous, Excellent script ! Merci au concepteur. Juste petit soucis, l’adresse mail est toujours en N/A pour chaque page. C’est pareil pour vous ?

J’avais le même soucis. je viens de modif le Xpath et ca marche pour moi !
Je te laisse recup ici !: https://docs.google.com/spreadsheets/d/1xC4VkFKlY_g-1_UeWZ9LntA6QX2l5at1ihKQ0Gi0zUM/edit?usp=sharing

1 « J'aime »

Bizzare, ça ne fonctionne toujours pas lorsque j’y rentre mon lien. Tu te sers directement de ce doc, ou tu l’utilises le xpath de ce doc pour modifier le google doc plus haut ?

je me sert direct de ce doc ! je viens de le faire pour moi ce matin :slight_smile:
Quel est ton lien ??

Salut, je n’arrive pas à modifier le contenu de ses plages peut-tu me donné l’accès?

@Benjamin_Brochard tu doit créer une copie du spreadsheet. En haut à gauche « fichier » puis « créer une copie »

1 « J'aime »

Bonjour à tous,
J’ai réussi à exécuter correctement la recherche sur metz en utilisant une copie du doc sous googledocs (même si j’ai eu ce type de message d’erreur (Function REGEXEXTRACT parameter 2 value « ^(.*?)? » does not match text of Function REGEXEXTRACT parameter 1 value «  ».)
J’ai essayé de substituer aux liens html de la colonne A des liens tripadvisor de restaurants en ile de france, soit quelques milliers de lignes. La colonne B affiche alors l’info loading mais rien ne charge malheureusement. Je ne comprends pas ce qui cloche si quelqu’un a une idée je suis preneur!
Egalement est il possible de récupérer avec la même méthodologie nom, adresse et numéro de téléphone des établissements?
Merci par avance!

Edit: en fait cela fonctionne (mis à part un paquet de N/A mais j’imagine que cela signifie que l’information n’est pas disponible) mais c’est TERRIBLEMENT lent a quoi est ce du?

Je pense que c’est google sheets qui limite automatiquement le nombre de requête possible (par feuille, par seconde, j’en sais rien) pour eviter trop de scrapping

Très bon point merci, ca ne m’était pas venu à l’esprit. j’en suis à peu près à 5000 URL passées en revue en 48h , avec pas mal de déchet. Il va malheureusement me falloir recroiser ces données avec d’autres bases style la fourchette ou autre pour compléter.
A ton avis y a t-il un moyen pour accélérer la collecte sous google sheets ou il n’y a aucun paramètre modifiable qui puisse aider?

1 « J'aime »

Tu peux scrapper Google Maps aussi avec des extensions Chrome comme GoPinLeads - Chrome Web Store

1 « J'aime »

Merci bien !

Scrap le site michelin.fr avec du gmail.com et en mot clef la ville de ton choix, tu en auras déjà assez pour lancer une petite campagne, 5% des établissements (même de grand renommés) utilisent une boite gmail

@Benjamin_Brochard , @aureglisse, les meilleures sources de données restent à ce jour Tripadvisor, et LeFooding :slight_smile:

3 « J'aime »