J'ai des URL Linkedin et j'aimerais avoir leur Company

Bonjour à tous !
J’ai scrappé via Phantombuster une liste d’URL de personnes correspondant à un groupe X. J’ai comme infos : Prenom / NOM / Jobtitle mais malheureusement je n’ai pas l’entreprise. Savez-vous s’il existe un scrap pour cela ?
Je vous remercie

Hello,

Est-ce que tu peux préciser quelle brique (API) exactement tu as utilisé pour obtenir cette 1ère extraction? A priori il doit s’agit de « Linkedin Search Export » ?

Si tu veux obtenir l’entreprise des personnes, il te faudra utiliser l’API qui se nomme « Linkedin Profile Scraper », et l’utiliser à partir de l’URL de chaque page profil dont tu disposes.

1 « J'aime »

Merci de ta réponse @ScrapingExpert :slight_smile: Yes c’est cette brique là que j’ai utilisé. Yes j’ai testé mais ça me donne un CSV complètement désordonné et va me chercher des infos dont je n’ai pas besoin comme le détail des missions dans le profil. J’ai testé Texau qui fait le même boulot mais range mieux, le hic c’est que Linkedin te repère et te demande si tu n’es pas un robot.

En fait il n’y a aucun problème de CSV complètement désordonné,c 'est simplement Microsoft Excel qui ne sait pas ouvrir proprement un fichier CSV… (dû au fait que PhantomBuster utilise un séparateur qui n’est pas celui par défaut pour Excel)

Après avoir vu et testé ça avec les étudiants de promo précédentes que je forme, on en est arrivé à la conclusion que Open Office faisait parfaitement le job pour ouvrir correctement un CSV, même mieux que Google Sheet :slight_smile:

Quant aux informations supplémentaires dont tu n’as pas besoin, ce n’est pas un problème non plus, il te suffit d’effacer ces colonnes.

Simple et efficace merci beaucoup !

1 « J'aime »

Hello, je ne suis pas d’accord avec toi. Excel ouvre parfaitement bien les csv à condition de passer par l’onglet « Données », Nouvelle Requête, A partir d’un fichier/ d’un dossier.
Bonus, tu choisis ton encodage et tu peux traiter plusieurs dizaines de csv si tu les as stockés dans le même dossier.
tu peux attager aussi directement le fichier csv stocké sur AWS.
Ca ouvre alors PowerQuery qui te permet de figer des traitements et des transformations et ne sélectionner que ce que tu veux…

Et pourtant, ce que tu viens de décrire prouve bien que Excel ne sait pas ouvrir automatiquement et facilement un CSV… Ca fonctionne bien si on le paramètre pour en arriver là.

Si tu préfères, c’est ce que je lui reproche: ce n’est pas simple pour des débutants lambdas… il faut savoir où configurer ça :confused:

A titre de comparaison, quand on ouvre un CSV avec Open Office, il t’ouvre d’emblée la petite popup qui propose encodage + séparateur, avec un aperçu du tableur final :slight_smile:

En résumé, quand une personne qui ne maitrises pas vraiment ce qu’est un CSV, par exemple mes clients ou étudiants que j’ai en formation, et qu’ils utilisent Excel pour ouvrir ce CSV, ils concluent tous que l’extract est faux, que toutes les données sont décalées et que mon travail est mal fait… alors que non :sweat_smile:

Pour résoudre le problème du CSV de PhantomBuster qui s’ouvre mal, il est possible de le télécharger pour le convertir en JSON avec un service tel que https://www.csvjson.com/ (ou prendre directement le JSON dans PhantomBuster), puis reconvertir le JSON en CSV, mais avec un encodage compatible Excel.

Par exemple, sur https://www.csvjson.com/, le « Semi-colon (CSV French) » fonctionne correctement.

1 « J'aime »

Dans la même idée, peut être plus simple pour des « non devs », dis moi ce que tu en penses:

Convertir directement le CSV de sortie de PhantomBuster en Excel (.xslx) en 3-4 clics:

  1. Dans le PhantomBuster concerné, là où on trouve les fichiers générés contenant les données: faire un copié du lien du CSV (clic droit et copier adresse du lien)

  2. Aller sur: https://convertio.co/fr/csv-xlsx/

  3. Cliquer sur conversion à partir d’un lien/URL (icone tout à droite dans la section rouge)

  4. Coller le lien du CSV issu de Phantom Buster dans la zone texte « Ajoutez l’URL… »

  5. Convertir le CSV en XLSX et télécharger le fichier prêt :slight_smile:


3 « J'aime »

En effet, encore plus simple :smiley:

Bonjour,
J’ai passé des heures à « nettoyer » un CSV pour le convertir en XLS et je découvre Convertio qui est juste hyper-simple et efficace donc je recommande et MERCI pour l’information.

Hello, Merci pour l’info. Quand tu dis chaque page profil, tu parles du profil linkedin entreprise ou du profil linkedin de la personne ?

Pourquoi ne pas faire un =importdata("") dans spreadsheet?

1 « J'aime »

Hello,

Je vois que ces histoires de scrapings/format de données LinkedIn sont assez painfuls

Si vous scrapez aussi Linkedin Sales Nav, Evaboot fait l’équivalent des Phantoms:

  • Export Search
  • Profile Scraper
  • Account Scraper
  • Account Employees
  • URL Converter

:arrow_right: 5 slots en un 1 clic, sans aucun paramétrage

+la donnée est nettoyée et il n’y pas de données inutiles dans le fichier

Egalement on a pas mal bossé sur le formatage des CSV avec les users (qui est quand même toujours un problème au 21ème siècle alors qu’on lance des fusées sur Mars) et on a fini par trouver un format qui marche apparement avec tous les logiciels

Chaud d’avoir vos retours si vous testez

Vous passez combien de temps à traiter les fichiers que vous scrapez en moyenne?

J’ai l’impression que la plupart des outils se contentent de balancer la donnée brute sans prendre tous les enjeux derrière

Ce serait cool de pas avoir besoin d’être Data Engineer pour faire de la Lead Generation

3 « J'aime »