Recherche prestataires scraping

Développeur Python – Scraper données publiques + automatisation mensuelle

Contexte
Je développe un produit de data intelligence B2B autour des sûretés mobilières (nantissements, gages, crédits-bails) publiées au Registre national (suretesmobilieres.fr). J’ai besoin d’un pipeline automatisé pour extraire ces données à partir d’une liste de SIRENs et les livrer chaque mois sous forme structurée.

Mission
La mission comporte deux volets :

  1. Setup initial — Reverse engineering de l’API backend du site suretesmobilieres.fr (déjà partiellement identifiée via DevTools), développement d’un scraper Python robuste avec gestion des erreurs, retries et reprise sur interruption, livraison des données au format JSONL ou CSV.

  2. Automatisation mensuelle — Mise en place d’un job automatisé (cron sur VPS, GitHub Actions, ou n8n selon ta recommandation) qui s’exécute le 1er de chaque mois sur une liste de SIRENs mise à jour, et livre le fichier résultat.

Stack attendue

  • Python (requests, Playwright si nécessaire)
  • Gestion propre des rate limits et des tokens de session
  • Code commenté et maintenable
  • Bonus : expérience scraping de sites gouvernementaux/para-publics français

Livrable

  • Script Python documenté
  • Pipeline automatisé opérationnel
  • Courte documentation de maintenance

Volume
Quelques milliers de SIRENs par mois. Pas de contrainte de temps réel — un run nocturne convient parfaitement.

Budget
Setup : forfait à discuter (j’estime 1-2 jours de travail). Run mensuel : maintenance légère, ouvert à un petit forfait mensuel ou à une passation complète.

Profil recherché
Dev Python avec expérience en scraping/data ingestion. La maîtrise des outils d’analyse réseau (DevTools, Burp) est un plus. Pas besoin d’un profil senior — un bon junior ou mid avec de l’autonomie suffit largement.

Bonjour. Je vous ai envoyé un message direct.