Je cherche une solution pour scraper avec les fonctions importxml, importhtml etc… de spreadsheet, mais avec la possibilité d’éditer le header en y ajoutant mon propre cookie.
@cebri, tu as peut-être la solution avec un google App Script ?
Hello Lorent, comment tu les utilises? J’essaye de comprendre, mais que viennent faire des fonctions Microsoft .NET dans cette histoire?
Si il s’agit d’une doc de la référence standard XML, alors on ne peut pas utiliser ces méthodes, qui sont uniquement exploitables dans un contexte DOM, afin d’évaluer des expressions XPath. Google-app script en l’état ne permet pas de le faire…
L’apprentissage du XPath …? Merci, je ne connaissais pas du tout
Plus sérieusement, pour en revenir au vrai sujet, il n’y a pas de fonctionnalités de requêtage par XPath aujourd’hui qui aille de paire avec la méthode UrlFetchApp.fetch, et c’est là tout le problème.
D’autre part, IMPORTXML avec XPath c’est souvent très foireux. Donnes lui de belles expressions de type //p[contains(@class, ‹ phone ›)]/following-sibling::span[not(preceding-sibling::*[1][name()=‹ br ›])], il sera incapable de l’interpréter correctement…
Hello la team
gsheet n’est pas vraiment efficace sur ce genre de requetes. Je pense que tu gagnerais tu temps a créer ca directement avec apify, phantombuster, un script maison ou simplement postman…Tu peux essayer avec un google script, mais pour avoir tester dans le passé, ca va planter / etre lent / etre bloqué par google si tu fais du volume