Scrap Dealroom

Hello les growth !

J’ai vu que le sujet avait été évoqué l’année dernière, mais sans réponse précise.

Auriez-vous trouver un moyen de scrapper Dealroom sur le site de la Frenchtech ?

Merci d’avance pour vos réponses ! :blush:

Ouai c’est assez facile tout est dans le source code dans un bon gros JSON qui s’appelle « window.INITIAL_STATE » comme 90% des sites récents

De mémoire faut faire le cochon en front pour récupérer toutes les URLs, le sitemap mène nulle part, et après c’est bonheur, le JSON en question est accessible même sans être loggé, il se contentent de pas afficher la data proprement mais elle est là. C’est open-bar ce site :slight_smile:

Sinon la data est là, et c’est enrichi par societeinfo (gratos) ici.

3 « J'aime »

Ah ! Je ne pensais pas que c’était aussi facile ahah, je vais check tout ça, merci pour la valeur ! :wink:

Bonsoir

Je ne connais pas le fonctionnement de ce window.INITIAL_STATE donc je cherche à apprendre :wink:
Savez vous s il est possible de récupérer le JSON d un profil linkedin via cette astuce ?
Bien évidement en étant logger avec son compte linkedin