Scrapping infogreffe

Bonjour,
Je dois vérifier régulièrement une liste de nom et prénom (environ 500 noms) sur le site Infogreffe et récupérer les données trouvées. J’aurais besoin de faire cette vérification régulièrement. Connaitriez-vous un moyen de faire ?
Merci bcp
Katel

Un simple script de scrap et un cron suffiront.
Je ne comprends pas bien la difficulté de la chose.

Bonjour, merci pour ton retour.
Pour info, je ne suis pas programmeuse
La difficulté, peut-être, le formulaire de recherche à remplir avec chaque nom ?
Cdt

Hello Katelm,

Je ne sais pas si c’est exactement ce que tu cherche, mais voici une piste :

L’URL de chaque recherche est le suivant : « https://www.infogreffe.fr/recherche-dirigeant-entreprise/resultats-recherche-dirigeant-entreprise.html?ga_cat=dir&ga_q=[Prenom]%20[Nom] », ce qui signifie qu’il suffit de remplacer le prénom et le nom à chaque fois.

Si tu n’est pas dev, tu peux regarder l’outil https://webscraper.io/ (la version gratuite est suffisante), ils propose quelques tutos qui peuvent t’être très utiles.
Pour info il te faudra comprendre ce que sont les xpath et comment les récupérer, je t’ai mis une photo ci dessous sur la manipulation à faire sur chrome

Si toutefois cela ne suffit pas, malheureusement il va falloir passer par du code en python par exemple, mais une fois maitriser tu peux absolument tout scrapper (pour d’autre projets futurs par exemple) et de façon beaucoup plus simple.

Bonne chance !

Salut @katelm,
Si grâce à @sam42 tu arrives bien à récrée l’URL (je n’ai pas vérifié) il te suffit d’utiliser la formule imporxml sur Google sheet !
=IMPORTXML(« URL » ; « REQUÊTE XPATH »)
Demande si tu n’arrivez pas à faire les requêtes xpath, jte donnerais un coup de main

Bonjour,

Merci @sam42 et @Kev_Mas - je regarde tout ça.

Belle journée,
Katel

je viens de verifier avec google sheet et la fonction importxml(), il y a un soucis par rapport au à l’url.
tu vas revenir automatiquement sur ta précédente recherches !
il doit y avoir details au niveau des caches qui fait que tu reviens automatiquement à te recherches précédente.
il faut relancer une nouvelle recherche pour que le nouvel URL fonctionne
dans tous les cas, l’importxml ne fonctionne pas a cause du script dans le code !

Bonjour @katelm ,
je voudrais savoir si vous avez réussi votre scrapping sur infogreffe car j 'arrive pas meme avec du python , je voudrais bien échanger avec vous sur ce sujet .
Cordialement .

XXXX XXXXXX

Ce sujet a été automatiquement fermé après 365 jours. Aucune réponse n’est permise dorénavant.