Scraper canva.com

Hello guys,

Je cherche à scraper toutes les images de chaque « carte » d’une page de ce type sur Canva.

Je ne suis pas un expert scraping donc pour l’instant j’ai seulement essayé via GoogleSheet IMPORTXML et via Parsehub sans succès, je sors une centaine d’url duppliquées = 10 uniques.

Le soucis c’est que Canva utilise cette fameuse technique de class CSS complexe pour chaque div de « carte ».

Une idée de comment contourner ce genre de protection?

Merci :slight_smile:

Hello Alexandre !

Tu cherches à récolter quelles informations dans ce scraping ?
Je vois que tu as sélectionné la balise img, tu cherches à obtenir l’attribut src ?

Hello Bastien, yes la « src » et idéalement la balise « alt » aussi :slight_smile:

Top !
Je n’ai pas trouvé comment sortir les infos directement sur un google sheet, à la limite si tu codes un peu tu pourrais créer une fonction dans google sheet et ça te permettrait d’extraire rapidement les infos.

Sinon tu peux run cette fonction dans la console de ton chrome et copier coller le résultat : document.querySelectorAll(".w3KZWA").forEach(el=> console.log(el.alt, " ", el.src)), ça te sortira la liste ce que tu veux.

Pour info toutes les balises img que tu souhaites scraper ont comme classe « w3KZWA ».

J’espère que cela t’aidera, si tu as d’autres questions n’hésite pas !

1 J'aime

Merci Bastien pour le petit bout de code et pour ton aide! Ça marche nickel après avoir scrollé la page :slight_smile:

Jette un oeil à webscraper.io, un très bon outil qui peut t’automatiser le scroll sur la page + l’extraction de l’image :wink:

1 J'aime

Je vais checker ça! Merci Clément :slight_smile:

1 J'aime