Scraper canva.com

Hello guys,

Je cherche à scraper toutes les images de chaque « carte » d’une page de ce type sur Canva.

Je ne suis pas un expert scraping donc pour l’instant j’ai seulement essayé via GoogleSheet IMPORTXML et via Parsehub sans succès, je sors une centaine d’url duppliquées = 10 uniques.

Le soucis c’est que Canva utilise cette fameuse technique de class CSS complexe pour chaque div de « carte ».

Une idée de comment contourner ce genre de protection?

Merci :slight_smile:

Hello Alexandre !

Tu cherches à récolter quelles informations dans ce scraping ?
Je vois que tu as sélectionné la balise img, tu cherches à obtenir l’attribut src ?

Hello Bastien, yes la « src » et idéalement la balise « alt » aussi :slight_smile:

Top !
Je n’ai pas trouvé comment sortir les infos directement sur un google sheet, à la limite si tu codes un peu tu pourrais créer une fonction dans google sheet et ça te permettrait d’extraire rapidement les infos.

Sinon tu peux run cette fonction dans la console de ton chrome et copier coller le résultat : document.querySelectorAll(".w3KZWA").forEach(el=> console.log(el.alt, " ", el.src)), ça te sortira la liste ce que tu veux.

Pour info toutes les balises img que tu souhaites scraper ont comme classe « w3KZWA ».

J’espère que cela t’aidera, si tu as d’autres questions n’hésite pas !

2 « J'aime »

Merci Bastien pour le petit bout de code et pour ton aide! Ça marche nickel après avoir scrollé la page :slight_smile:

Jette un oeil à webscraper.io, un très bon outil qui peut t’automatiser le scroll sur la page + l’extraction de l’image :wink:

1 « J'aime »

Je vais checker ça! Merci Clément :slight_smile:

1 « J'aime »

J’ai un projet de scraper des images sur un autre site.

Je n’ai jamais essayé de le faire auparavant, mais cela ne semble pas trop difficile d’après cet article comment créer un web scraper d’images sans coder? Donc Je vais essayer mon vieil ami :joy: Octoparse et le webscraper mentionné dans les réponses :ok_hand: Merci!!