Linkedin Companies

Bonjour,

Dans les pages des profiles de personnes, les liens vers les sociétés dans lesquelles il travaila maintenant cette forme :
https://www.linkedin.com/company/11513053

et lorsque l’on clique sur ce lien, linkedin le transforme dans l’url suivante :
https://www.linkedin.com/company/gima-transmission-technology/

Et je cherche a récupérer le nom (gima-transmission-technology) en fonction de l’ID (11513053) de la société.

Donc :

  • Savez vous s’il existe une sorte de base de concordance ID vs Nom
    Ou
  • Un moyen technique à partir d’une URL donnée (ici …/11513053) de retrouver l’Url afficher par le site ( ici …gima-transmission-technology/)

Merci d’avance pour votre aide

Jessica

Hello @Jessica,

Il s’agit d’un lien de redirection → si tu veux avoir le lien final (et donc le nom de l’entreprise), il te faut regarder la réponse http.

Tu peux le faire assez simplement avec Python et la lib qui va bien (Lib « requests » de mémoire).

Sans passer par du code, tout dépend ce que tu cherches à faire ou à automatiser : tu as une liste de profil linkedin dont tu souhaites récupérer l’entreprise, c’est bien ça ?

Bonjour Alexandre,

Merci pour ton aide.
Effectivement, un code python c’est juste parfait … mais j’ai l’impression que Linkedin bloque un peu ces request avec les redirections
Voici mon code (qui fonctionne avec d’autres liens « http://httpbin.org/redirect/3 » par exemple)

import requests
starturl = 'https://www.linkedin.com/company/11513053'
r = requests.head(starturl, allow_redirects=True)
print(r.url)

Si tu as une idée ?

Jessica

Je viens de regarder : apparemment il n’y a pas de redirection quand tu fais ça depuis un notebook python.

Le status_code n’est pas 300 (code pour la redirection) mais 999.

Je pense que LinkedIn te bloque car il ne voit pas de user agent ou de token de session :confused:

Il faudrait essayer avec Selenium en récupérant le token de session

Le cookie de connexion li_at (et jsessionid) est nécessaire

1 « J'aime »

Je confirme, en essayant en navigation privée il faut se log avant d’être redirigé.

Tu peux probablement récupérer la liste des urls en scrapant les pages avec captaindata, phantombuster ou texau si tu ne veux pas t’embêter à coder je pense :wink:

Merci pour votre aide, effectivement le but n’est pas de cramer mon compte linkedin … ce qui va etre le cas en scrappant ce type de data brutalement :((

Donc je reviens sur la première piste, savoir s’il y avait un leaks qui trainait quelque part intégrant l’ID de la Companie et son nom (ou son url) dans les datas dispo ?

Il y a un leak, reste à le trouver :slight_smile:

Dans ce cas, je sais que brightdata propose du scraping linkedin hors connexion, à partir de $5 pour 1000 pages.

Sur leur doc je ne vois que la partie profil, pas société mais ils en parlent, n’hésite pas à aller discuter avec eux et nous faire un retour d’expérience pour savoir si ça marche bien !

2 « J'aime »

Je confirme que tu peux récupérer la donnée de société, on passe par eux de notre côté ^^ Ca marche très bien

@Jessica Oui facile à trouver d’ailleurs en torrent, mais on ne le partagera pas lol En plus il fait 1TB décompressé.

ça peut être utile, uniquement l’ID de la compagnie est présent pour la conversion.

Sinon en soit c’est une base scrapée, pas de grand intérêt.

Et oui tu n’échappera pas à la redirection et la nécessité de faire ça logguée.
Ou derrière une batterie de proxies, une requête par proxies, LinkedIn n’affichera en clair qu’une requête puis te demandera de te logger.

Si seul le nom de la compagnie t’intéresse (et pas l’URL avec le nom au lieu de l’ID), alors autant scraper des profils depuis Sales Navigator leads search en recherchant sur la dite compagnie, la liste de chaque profils scrapés dans la recherche te donnera l’ID que tu pourra reconstituer avec l’URL de base linkedin.com/sales/company/ID

Merci beaucoup pour votre aide.

Mais je ne suis pas dans une démarche commerciale donc je n’ai pas de Sales Navigator ni de moyen pour payer des services externes (ce qui serait d’ailleurs bien mieux …)
Je suis juste dans une démarche d’apprentissage du GrowthHacking, et donc de passer les obstacles qui se présentent un a un :wink:

@amz : Si jamais tu as le lien de ton torrent, n’hésites pas en MP ;-))) pas de soucis our le 1To, je peux utiliser un des serveurs de mon école. Ces infos ont effectivement l’air de bien correspondre à ce que je cherche. …

Merci d’avance

Jessica