J'ai des URL Linkedin et j'aimerais avoir leur Company

Bonjour à tous !
J’ai scrappé via Phantombuster une liste d’URL de personnes correspondant à un groupe X. J’ai comme infos : Prenom / NOM / Jobtitle mais malheureusement je n’ai pas l’entreprise. Savez-vous s’il existe un scrap pour cela ?
Je vous remercie

Hello,

Est-ce que tu peux préciser quelle brique (API) exactement tu as utilisé pour obtenir cette 1ère extraction? A priori il doit s’agit de « Linkedin Search Export » ?

Si tu veux obtenir l’entreprise des personnes, il te faudra utiliser l’API qui se nomme « Linkedin Profile Scraper », et l’utiliser à partir de l’URL de chaque page profil dont tu disposes.

Merci de ta réponse @ScrapingExpert :slight_smile: Yes c’est cette brique là que j’ai utilisé. Yes j’ai testé mais ça me donne un CSV complètement désordonné et va me chercher des infos dont je n’ai pas besoin comme le détail des missions dans le profil. J’ai testé Texau qui fait le même boulot mais range mieux, le hic c’est que Linkedin te repère et te demande si tu n’es pas un robot.

En fait il n’y a aucun problème de CSV complètement désordonné,c 'est simplement Microsoft Excel qui ne sait pas ouvrir proprement un fichier CSV… (dû au fait que PhantomBuster utilise un séparateur qui n’est pas celui par défaut pour Excel)

Après avoir vu et testé ça avec les étudiants de promo précédentes que je forme, on en est arrivé à la conclusion que Open Office faisait parfaitement le job pour ouvrir correctement un CSV, même mieux que Google Sheet :slight_smile:

Quant aux informations supplémentaires dont tu n’as pas besoin, ce n’est pas un problème non plus, il te suffit d’effacer ces colonnes.

Simple et efficace merci beaucoup !

1 J'aime

Hello, je ne suis pas d’accord avec toi. Excel ouvre parfaitement bien les csv à condition de passer par l’onglet « Données », Nouvelle Requête, A partir d’un fichier/ d’un dossier.
Bonus, tu choisis ton encodage et tu peux traiter plusieurs dizaines de csv si tu les as stockés dans le même dossier.
tu peux attager aussi directement le fichier csv stocké sur AWS.
Ca ouvre alors PowerQuery qui te permet de figer des traitements et des transformations et ne sélectionner que ce que tu veux…

Et pourtant, ce que tu viens de décrire prouve bien que Excel ne sait pas ouvrir automatiquement et facilement un CSV… Ca fonctionne bien si on le paramètre pour en arriver là.

Si tu préfères, c’est ce que je lui reproche: ce n’est pas simple pour des débutants lambdas… il faut savoir où configurer ça :confused:

A titre de comparaison, quand on ouvre un CSV avec Open Office, il t’ouvre d’emblée la petite popup qui propose encodage + séparateur, avec un aperçu du tableur final :slight_smile:

En résumé, quand une personne qui ne maitrises pas vraiment ce qu’est un CSV, par exemple mes clients ou étudiants que j’ai en formation, et qu’ils utilisent Excel pour ouvrir ce CSV, ils concluent tous que l’extract est faux, que toutes les données sont décalées et que mon travail est mal fait… alors que non :sweat_smile:

Pour résoudre le problème du CSV de PhantomBuster qui s’ouvre mal, il est possible de le télécharger pour le convertir en JSON avec un service tel que https://www.csvjson.com/ (ou prendre directement le JSON dans PhantomBuster), puis reconvertir le JSON en CSV, mais avec un encodage compatible Excel.

Par exemple, sur https://www.csvjson.com/, le « Semi-colon (CSV French) » fonctionne correctement.

Dans la même idée, peut être plus simple pour des « non devs », dis moi ce que tu en penses:

Convertir directement le CSV de sortie de PhantomBuster en Excel (.xslx) en 3-4 clics:

  1. Dans le PhantomBuster concerné, là où on trouve les fichiers générés contenant les données: faire un copié du lien du CSV (clic droit et copier adresse du lien)

  2. Aller sur: https://convertio.co/fr/csv-xlsx/

  3. Cliquer sur conversion à partir d’un lien/URL (icone tout à droite dans la section rouge)

  4. Coller le lien du CSV issu de Phantom Buster dans la zone texte « Ajoutez l’URL… »

  5. Convertir le CSV en XLSX et télécharger le fichier prêt :slight_smile:


3 J'aimes

En effet, encore plus simple :smiley:

Bonjour,
J’ai passé des heures à « nettoyer » un CSV pour le convertir en XLS et je découvre Convertio qui est juste hyper-simple et efficace donc je recommande et MERCI pour l’information.