Scraping par technos utilisé

Hello à la communauté GH !

Sauriez-vous scraper tous les sites qui utilisent une ou plusieurs technologies ? Ou connaissez-vous un outil pour le faire ?
Exemple : je veux connaître tous les sites qui utilisent Criteo ou des plateformes d’affiliations, etc…

Merci pour vos retours.
p1xL

1 « J'aime »

Version gratuite :

  1. tu identifies un élément en rapport avec la plateforme que tu souhaites analyser (pour criteo, par example, des fichiers qui contient //static.criteo.net/
  2. tu crées un robot qui scrappe la homepage du top 1 Milllion des sites d’alexarank/majestic/moz, et tu vois dans le code source si tu arrives à trouver cet élément

Version payante : lager.io, buildwith…(fait une recherche sur le forum pour en trouver d’autres)

Good luck

1 « J'aime »

https://trends.builtwith.com/ads/Criteo

2 « J'aime »

Voir la catégorie « Technology lookup » dans la toolbox :

1 « J'aime »

Hello Camille. Tu peux également rajouter https://index.woorank.com.

2 « J'aime »

https://wappalyzer.com/ gratos et open