[OUTIL GRATUIT] Ton sitemap (ou celui de tes concurrents) en 1 clic sur google sheet.

Hello,
Je m’amuse bien avec mes petits outils seo, celui la est plus simpliste que les précédents mais c’est toujours cadeau :

Sitemap Extractor sur Google Sheet

A+

2 « J'aime »

Thx pour le partage, tu aurais pas la même chose pour ouvrir des sitemaps comme tripadvisor où c’est stocké en .gz

Scrapebox y arrive plus :sob:

Vous voulez une API c’est ça…?

1 « J'aime »

Super !
J’étais aussi en train d’en faire un, j’utilise l’extension unlimited sheets

Il est aussi possible de scraper par regex, j’ai récupérer les balises d’update et d’ajout de la page pour avoir une idée de la fréquence des contenus publié, un peu archaïque, c’est long à charger, mais ça marche

J’ai pas ca pour le moment ! mais @josselin si tu es chaud on se fait ca a 2 :wink:

Les fichiers .gz contiennent généralement min 50k liens chacun, et ils sont subdivisés en plusieurs fichiers distincts. Par exemple, sur Product Hunt, vous pouvez trouver des liens comme :

  • https://www.producthunt.com/sitemaps_v3/product_about_sitemap1.xml.gz
  • https://www.producthunt.com/sitemaps_v3/product_about_sitemap2.xml.gz
  • etc.

Si quelqu’un en a besoin, pourquoi ne pas envisager de custom le Google Sheet et de développer une petite solution ? Curieux d’avoir vos retours. :slight_smile:

1 « J'aime »

Ça a l’air cool !
Par contre, la problématique est souvent en amont : trouver l’url du sitemap de certains sites qui en sont pas « standards » (/sitempa.xml, /site-map.xml etc…)

Tu regardes le robots.txt :slight_smile:

1 « J'aime »