Scraper canva.com

anon27008269 · Février 9, 2021, 11:02

Hello guys,

Je cherche à scraper toutes les images de chaque « carte » d’une page de ce type sur Canva.

Je ne suis pas un expert scraping donc pour l’instant j’ai seulement essayé via GoogleSheet IMPORTXML et via Parsehub sans succès, je sors une centaine d’url duppliquées = 10 uniques.

Le soucis c’est que Canva utilise cette fameuse technique de class CSS complexe pour chaque div de « carte ».

Une idée de comment contourner ce genre de protection?

Merci

BastienP · Février 9, 2021, 11:51

Hello Alexandre !

Tu cherches à récolter quelles informations dans ce scraping ?
Je vois que tu as sélectionné la balise img, tu cherches à obtenir l’attribut src ?

anon27008269 · Février 9, 2021, 12:09

Hello Bastien, yes la « src » et idéalement la balise « alt » aussi

BastienP · Février 9, 2021, 12:52

Top !
Je n’ai pas trouvé comment sortir les infos directement sur un google sheet, à la limite si tu codes un peu tu pourrais créer une fonction dans google sheet et ça te permettrait d’extraire rapidement les infos.

Sinon tu peux run cette fonction dans la console de ton chrome et copier coller le résultat : document.querySelectorAll(".w3KZWA").forEach(el=> console.log(el.alt, " ", el.src)), ça te sortira la liste ce que tu veux.

Pour info toutes les balises img que tu souhaites scraper ont comme classe « w3KZWA ».

J’espère que cela t’aidera, si tu as d’autres questions n’hésite pas !

anon27008269 · Février 9, 2021, 1:20

Merci Bastien pour le petit bout de code et pour ton aide! Ça marche nickel après avoir scrollé la page

ClementAubry · Février 9, 2021, 6:11

Jette un oeil à webscraper.io, un très bon outil qui peut t’automatiser le scroll sur la page + l’extraction de l’image

anon27008269 · Février 10, 2021, 8:21

Je vais checker ça! Merci Clément

sept · Octobre 9, 2021, 10:12

J’ai un projet de scraper des images sur un autre site.

Je n’ai jamais essayé de le faire auparavant, mais cela ne semble pas trop difficile d’après cet article comment créer un web scraper d’images sans coder? Donc Je vais essayer mon vieil ami Octoparse et le webscraper mentionné dans les réponses Merci!!