Surveiller & extraire de la data depuis n'importe quel site, sans code

Hello les cracks de la croissance

Je développe dans l’ombre une extension Chrome pour extraire, surveiller et analyser n’importe quel site web, sans aucune connaissance technique.

DataSaucer s’adresse à tous les non-tech qui aimeraient exploiter la data du web pour propulser leurs stratégies marketing, sales, produit et RH. Sans se prendre la tête.

Quoi ? Encore un outil de scraping ?

Oui, il existe plein d’outils de scraping. Personnellement j’en ai testé une vingtaine en trois ans, mais je les ai tous trouvés soit incomplets, soit chronophages (nécessité de maintenance, learning curve), soit trop chers.

En créant DataSaucer, mon souhait est de créer un unique outil capable de couvrir autant de besoins que possible dans les principaux départements des startups. Que les profils non-tech n’aient plus besoin de faire appel à des tech pour exploiter la data du web, et qu’ils puissent itérer rapidement.

Les key features

  • Invincible: résiste aux protections anti-scraping les plus connues (code source dynamiques, fingerprint, DataDome, …) et aux mises à jour du site (utilise le computer vision au lieu de faire confiance au code source de la page)
  • Surveillance des pages web: Recevez des alertes (SMS, email, push notif) quand une page change
  • Intégration native de GPT-4 Plus pour interpréter, résumer des pages
  • Leadgen: Recherche auto des emails et numéros de téléphone B2B (waterfall)
  • Utilise l’IA pour deviner et nettoyer les données que vous souhaitez récupérer
  • Possibilité de lancer vos bots dans le cloud (via appel API, sur un fréquence donnée, manuellement, via Zapier)

Quelques cas d’usage

  • Leadgen
  • Surveillance de la concurrence
  • Etude de marché (exemple plus bas sur les screenshots)
  • Surveillance et analyse des feedbacks client

Sa petite bouille

  1. Son icône apparait sur les sites que vous allez probablement scraper:

  1. Quand vous cliquez sur l’icône, vous voyez vos bots:

  1. Cliquez sur le + pour créer un nouveau bot pour la page actuelle:

  1. Un workflow complet (trouver les pain points les plus fréquents en growth hacking

Next steps

Pour le moment ce n’est qu’un side project au stade prototype (la techno est néanmoins fonctionnelle mais instable)

J’attends de collecter assez de data sur les cas d’utilisation avant de m’engager en full time dessus :slight_smile:

Du coup vos avis et critiques sont les bienvenus :upside_down_face:


PS: si vous voulez rester au jus, vous pouvez vous abonner à ce thread et à la page LinkedIn :wink:

11 « J'aime »

Bravo ! Belle aventure !

C’est sympa. Je reste au jus

Ca a l’air mechamment cool
Quelle lib tu utilises pour le computer vision?

Canon ! Je suis preneur à sa sortie

Super on attends de voir pour tester =)