Scrapper le site : industrie.usinenouvelle.com

Bonjour à tous,
Je cherche à scraper les entreprises dans les classements des usines de chaque département français sur le site industrie.usinenouvelle.com, quelqu’un aurait une idée ? Ou quelqu’un l’aurait déjà fait ?
Dans l’idéal, il me faudrait le nom de l’entreprise, le code NAF, le domaine de l’entreprise ainsi que l’adresse postale, la ville et le code postal.
Toute proposition est bonne à entendre :grin:

Réponse naïve : avec un compte ?
image

Hello @Matteo77 :wave:

Comme le dit Morph, si tu peux avoir un compte ça fonctionne x)
Mais si tu veux pas avoir de compte, webscraper.io peut être une solution. Il faut juste mapper les informations dont tu as besoin (ils ont des tutos simple) et après tu récupères tranquillement les infos

image

je pense que je peux m’aligner :grin: en tout cas si t’y arrives pas avec les outils précédemment mentionnés on peut en discuter, c’est pas si simple que çà car sans compte on est bloqué dans la navigation, de plus le site est buggé !! pourtant avec le montant des abonnements il y a moyen de faire un site correct je pense :sunglasses:

après y’a peut être d’autres solutions que ce scraper ce site, les données SIREN ou INPI sont en open data et si tu utilises siretinfo par exemple tu peux cibler les industries qui t’intéressent et avoir le même niveau d’information

En effet, je n’ai pas précisé que je n’avais pas de compte :sweat_smile:

Hello @Diposite
Je viens de trouver un tuto qui m’a l’air pas mal pour webscraper.io, je vais essayer avec cette solution ! Je te remercie

Hello @DJousto
Petite boite donc petit budget :sweat_smile:
Je vais d’abord faire le tour des solutions gratuites et si ça ne fonctionne pas, je reviendrai vers toi, je te remercie tout de même pour la proposition !

Ah oui… je n’avais pas vu les prix, c’est vrai qu’il y a un intérêt à scrapper :stuck_out_tongue:

Sur le site, il est effectivement pas mal buggé : FF ou Chrome, j’ai vu des choses qui ne fonctionnent pas :frowning:

encore une app d’info pro digital …
pour leur fournir de la data, elle est facilement faisable pour les growth du forum.

Tu devrais faire un sruc from scratch avec morph ou djousto

Un échantillon de 6000