Dans les pages des profiles de personnes, les liens vers les sociétés dans lesquelles il travaila maintenant cette forme : https://www.linkedin.com/company/11513053
Il s’agit d’un lien de redirection → si tu veux avoir le lien final (et donc le nom de l’entreprise), il te faut regarder la réponse http.
Tu peux le faire assez simplement avec Python et la lib qui va bien (Lib « requests » de mémoire).
Sans passer par du code, tout dépend ce que tu cherches à faire ou à automatiser : tu as une liste de profil linkedin dont tu souhaites récupérer l’entreprise, c’est bien ça ?
Merci pour ton aide.
Effectivement, un code python c’est juste parfait … mais j’ai l’impression que Linkedin bloque un peu ces request avec les redirections
Voici mon code (qui fonctionne avec d’autres liens « http://httpbin.org/redirect/3 » par exemple)
import requests
starturl = 'https://www.linkedin.com/company/11513053'
r = requests.head(starturl, allow_redirects=True)
print(r.url)
Je confirme, en essayant en navigation privée il faut se log avant d’être redirigé.
Tu peux probablement récupérer la liste des urls en scrapant les pages avec captaindata, phantombuster ou texau si tu ne veux pas t’embêter à coder je pense
Merci pour votre aide, effectivement le but n’est pas de cramer mon compte linkedin … ce qui va etre le cas en scrappant ce type de data brutalement :((
Donc je reviens sur la première piste, savoir s’il y avait un leaks qui trainait quelque part intégrant l’ID de la Companie et son nom (ou son url) dans les datas dispo ?
Dans ce cas, je sais que brightdata propose du scraping linkedin hors connexion, à partir de $5 pour 1000 pages.
Sur leur doc je ne vois que la partie profil, pas société mais ils en parlent, n’hésite pas à aller discuter avec eux et nous faire un retour d’expérience pour savoir si ça marche bien !
Et oui tu n’échappera pas à la redirection et la nécessité de faire ça logguée.
Ou derrière une batterie de proxies, une requête par proxies, LinkedIn n’affichera en clair qu’une requête puis te demandera de te logger.
Si seul le nom de la compagnie t’intéresse (et pas l’URL avec le nom au lieu de l’ID), alors autant scraper des profils depuis Sales Navigator leads search en recherchant sur la dite compagnie, la liste de chaque profils scrapés dans la recherche te donnera l’ID que tu pourra reconstituer avec l’URL de base linkedin.com/sales/company/ID
Mais je ne suis pas dans une démarche commerciale donc je n’ai pas de Sales Navigator ni de moyen pour payer des services externes (ce qui serait d’ailleurs bien mieux …)
Je suis juste dans une démarche d’apprentissage du GrowthHacking, et donc de passer les obstacles qui se présentent un a un
@amz : Si jamais tu as le lien de ton torrent, n’hésites pas en MP ;-))) pas de soucis our le 1To, je peux utiliser un des serveurs de mon école. Ces infos ont effectivement l’air de bien correspondre à ce que je cherche. …