Google Sheets, les regex et le xpath

1 J'aime

Après 5 ans de devs, les regex me font encore mal à la tête, bon courage à ceux qui vont découvrir ce que c’est dans cet article ahaha

1 J'aime

Ce qui me fait mal au crâne perso c’est le double « p » qu’ils mettent dans le verbe « scraper » dans l’article :sweat_smile:

2 J'aimes

Excellent post. C’est sur le web français qu’on trouve les meilleures ressources sur le sujet! et là c’est vraiment bien traité

@camillebesse, un peu d’auto-promo, j’espère que tu m’en voudras pas mais je pense que c’est spécialement adapté à ce sujet:
La fonction ImportFromWeb joint les XPaths, sélecteurs CSS et Regexps dans la même fonction… en plus de passer les portes de 95% des sites web

Un petit tutoriel pour scraper Google (chose impossible avec les fonctions de l’article)

Au contraire, je t’avais même devancé en tweetant la fonction importjson à l’auteur de l’article :

Car dans son article :

Importer un Json ?

La fonction n’est malheureusement pas native sur googlesheet. Ca aurait été tellement plus simple pour aller piocher dans des API….mais non. Soit il faut un module complémentaire (comme nous l’avions vu dans le précédent article), soit il faut créer une fonction personnalisée.
Et finalement, cela fera l’objet d’un 3e article.

Du coup, je pense qu’elle va parler de toi dans la suite.

Ta fonction ImportFromWeb est super utile, je l’ai utilisée pour créer un Google Sheet d’analyse SEO on page (disponible ici si ça intéresse quelqu’un), à part quelques problèmes pour utiliser l’extension quand on copie une feuille de calcul existante, tout est nickel !
Comment comptes-tu faire évoluer ton outil ?

Merci @MonicaB.
Je serais intéressé par connaître les problèmes que tu as rencontré!
Les prochaines étapes pour ImportFromWeb:

  • Actualiser les data périodiquement avec fréquence custom
  • Garder un historique à chaque actualisation pour créer des tendances. (Exemple super utile, Quel instagramer à la plus grosse croissance de followers)

Mais surtout je souhaite diffuser des modèles de feuilles prêt-à-porter sur plein de thèmes (Google Search, Google Trends, Amazon, Le bon coin, Instagram, Trip advisor et j’en passe)
Si ça t’intéresse d’en savoir plus, n’hésite pas à me contacter en MP

(Par contre je ne vois pas ImportFromweb dans ton modèle)

Perso, le seul problème que j’ai rencontré est que quand on fait une copie du document ou qu’on le partage, c’est parfois compliqué de réactiver l’extension…

PS: j’utilise ImportWeb dans l’onglet « Recherche Google », dans la cellule B5