Scrapping difficile avec googlesheet


#1

Bonjour à tous, grâce à la fonction importxml de googlesheet, je souhaite scraper les résultats
de cette page : https://www.monfinancier.com/recherche/?q=scpi

Or, j’ai essayé de différentes façons comme avec IMPORTXML(“https://www.monfinancier.com/recherche/?q=scpi";"//[@class=‘gsc-result-info’]/@href”)

rien n’y fait, j’ai toujours un bug…

Avez-vous une solution :slight_smile: ?

MERCI, bien à vous.


#2

Effectivement il est bien relou celui là…
Mais je vois qu’il y’a de la pagination à mort.
Je pense pas que Gsheets soit le meilleur outil si tu veux tout scrapper.
Tu peux tester Importhtml avec la fonction table sinon ?

Source : http://deux.io/importxml-importhtml-importfeed-tutorial/


#3

site:monfinancier.com "scpi"

  • scrapebox

https://goo.gl/1VTZ8o


#4

Les données retournées sont des données issues d’un google custom search engine, donc appelées en ajax, et non récupérables par google spreadsheet importxml.

Le principe même d’un Google CSE est de faire une recherche google avec un site:mondomain.com pour "externaliser la recherche. Du coup, la requête de @camillebesse est exactement celle que tu trouveras sur le site.

PS: tu peux, toi aussi, te créer un google cse sur ce même domaine, et choper les résultats de recherche


Team : CamilleBriceJulienVivianBorisXavierSteven.
Follow @growthhackingfr