Google Sheets, les regex et le xpath

1 « J'aime »

Après 5 ans de devs, les regex me font encore mal à la tête, bon courage à ceux qui vont découvrir ce que c’est dans cet article ahaha

2 « J'aime »

Ce qui me fait mal au crâne perso c’est le double « p » qu’ils mettent dans le verbe « scraper » dans l’article :sweat_smile:

3 « J'aime »

Excellent post. C’est sur le web français qu’on trouve les meilleures ressources sur le sujet! et là c’est vraiment bien traité

@Camille, un peu d’auto-promo, j’espère que tu m’en voudras pas mais je pense que c’est spécialement adapté à ce sujet:
La fonction ImportFromWeb joint les XPaths, sélecteurs CSS et Regexps dans la même fonction… en plus de passer les portes de 95% des sites web

Un petit tutoriel pour scraper Google (chose impossible avec les fonctions de l’article)

Au contraire, je t’avais même devancé en tweetant la fonction importjson à l’auteur de l’article :

Car dans son article :

Importer un Json ?

La fonction n’est malheureusement pas native sur googlesheet. Ca aurait été tellement plus simple pour aller piocher dans des API….mais non. Soit il faut un module complémentaire (comme nous l’avions vu dans le précédent article), soit il faut créer une fonction personnalisée.
Et finalement, cela fera l’objet d’un 3e article.

Du coup, je pense qu’elle va parler de toi dans la suite.

Ta fonction ImportFromWeb est super utile, je l’ai utilisée pour créer un Google Sheet d’analyse SEO on page (disponible ici si ça intéresse quelqu’un), à part quelques problèmes pour utiliser l’extension quand on copie une feuille de calcul existante, tout est nickel !
Comment comptes-tu faire évoluer ton outil ?

Merci @MonicaB.
Je serais intéressé par connaître les problèmes que tu as rencontré!
Les prochaines étapes pour ImportFromWeb:

  • Actualiser les data périodiquement avec fréquence custom
  • Garder un historique à chaque actualisation pour créer des tendances. (Exemple super utile, Quel instagramer à la plus grosse croissance de followers)

Mais surtout je souhaite diffuser des modèles de feuilles prêt-à-porter sur plein de thèmes (Google Search, Google Trends, Amazon, Le bon coin, Instagram, Trip advisor et j’en passe)
Si ça t’intéresse d’en savoir plus, n’hésite pas à me contacter en MP

(Par contre je ne vois pas ImportFromweb dans ton modèle)

Perso, le seul problème que j’ai rencontré est que quand on fait une copie du document ou qu’on le partage, c’est parfois compliqué de réactiver l’extension…

PS: j’utilise ImportWeb dans l’onglet « Recherche Google », dans la cellule B5

Vu des articles parlant du plugin ImportFromWeb de NoDataNoBusiness sur LinkedIn: pour ceux l’ayant déjà testé, est-ce que cela marche aussi bien qu’annoncé ?

J’ai quelques Sales à équiper d’une solution leur permettant de scraper GMaps à l’échelle. merci d’avance !

Hello @Wyatt,

Je crois que la solution fonctionne plutôt bien. L’un des membres de NDNB est d’ailleurs sur ce présent forum.

Par contre j’aurais plus tendance à utiliser scrap.io de @julienarcin pour faire ce que tu veux, car c’est une solution de scraping no-code dédiée à Google Maps.

Si tu veux plus d’informations, voici un article que j’ai écrit il y a plus de 2 ans maintenant :
https://leszoutils.com/blog/scrap-io-la-brutasse-du-scrap-no-code-google-maps/

Je jetterai aussi un œil à Rocketlead de @Sonic pour voir si ça répond à ton besoin.

1 « J'aime »

@Wyatt
Effectivement, scrap.io est plutôt une bonne solution.
Mais je précise qu’ImportFromWeb est totalement nocode aussi et a l’avantage d’être intégrée dans Google sheets, donc les données scrapées sont récupérées en direct sur des spreadsheets!