API ou script pour ne récupérer que l'article d'une page


#1

Bonjour, une question probablement neuneu : comment récupérer uniquement le contenu d’un article dans une page ? (et donc supprimer les contenus secondaires comme la navigation, les sidebar, les commentaires, les footers)…

Existe t-il des scripts (php) ou api déjà prêt à l’emploi ? Merci pour vos lumières.


#2

Salut Renaud, check la toolbox.
Tu as aussi ce projet open avec une UI pour gérer ses crawlers → https://github.com/holgerd77/django-dynamic-scraper


#3

Bonjour Renaud,

iFramely fait très bien le travail je crois.

Maxence.


#4

Merci pour les infos


#5

thx pour l’info !


Communauté initiée par @camillebesse avec l'aide de @Cebri@JulienD@VivianSolide@Boristchangang
Follow @growthhackingfr