Comment automatiser un script Python pour scraper des annuaires ?

Bonjour à tous,

Je travaille sur un projet qui implique de scraper régulièrement des annuaires en ligne avec un script Python. Je me pose la question de la meilleure manière de le faire tourner automatiquement, même si mon ordinateur est éteint.

Je me demande notamment :

  • Faut-il héberger le script sur un serveur ou VPS, ou sur google sheet?

  • Est-ce qu’une solution comme n8n suffirait pour automatiser ça ?

  • Comment vous mettriez ce type de projet en œuvre pour qu’il fonctionne de façon fiable chaque semaine ?

Je suis preneur de retours d’expérience, conseils ou bonnes pratiques pour automatiser ce genre de workflow Python.

Merci d’avance :folded_hands:

Salut, je pense le mieux c’est de prendre un VPS et que t’installe n8n, pour que ca tourne chaque semaine tu peux utiliser https://docs.n8n.io/integrations/builtin/core-nodes/n8n-nodes-base.scheduletrigger/

1 « J'aime »

Oui, je pensais à ça. Après ma réflexion c’est aussi est-ce que j’utilise n8n ou bien directement en python.

Si tu la déjà en python tu peux aussi juste lancer ton script sur ton serveur et utiliser un cron et ca fonctionnera directement sans install et config n8n

Si ça t’embête pas tu pourrais le dire quel stack t’utiliserai ? digital ocean ?

çà dépends de la complexité du scraping et donc du script python, avec n8n tu sera assez rapidement limité ou alors il faut que N8N lance un script installé sur la machine hébergeant n8n, c’est faisable, je le fais, mais çà demande un peu de tuyauterie. Sinon pour ce genre de besoin j’utilise airflow qui lance des scripts à une fréquence donnée

Si ta 0 budget je te conseille de d’orienter vers Cloudflare Workers vu que tu veux lancer une fois par semaine ta 3000 minutes gratos

Si tu veux pas te prendre la tête tu prends un VPS chez hetzner (je passe que par eux maintenant) mais tu peux très bien utiliser Digital Ocean ou autre service

Si ta d’autres questions n’hésite pas

1 « J'aime »

Si c’est du puthon, Heroku est pas mal et pas cher