API ou script pour ne récupérer que l'article d'une page

Bonjour, une question probablement neuneu : comment récupérer uniquement le contenu d’un article dans une page ? (et donc supprimer les contenus secondaires comme la navigation, les sidebar, les commentaires, les footers)…

Existe t-il des scripts (php) ou api déjà prêt à l’emploi ? Merci pour vos lumières.

Salut Renaud, check la toolbox.
Tu as aussi ce projet open avec une UI pour gérer ses crawlers → https://github.com/holgerd77/django-dynamic-scraper

1 « J'aime »

Bonjour Renaud,

iFramely fait très bien le travail je crois.

Maxence.

1 « J'aime »

Merci pour les infos

thx pour l’info !