Je scrap LinkedIn via l’opérateur Google site:fr.linkedin.com/in/
Tous les résultats renvoyés sont sous la même forme : prénom puis nom.
Savez-vous comment je peux faire pour enregistrer du coup les 2 premier mots de chaque résultats pour toutes les pages pour obtenir le prénom puis le nom de la personne ?
Également, est-il possible de récupérer la ville d’exercice de l’activité dans le profil Linkedin ?
Pour faire très simple tu peux ouvrir ta console chrome et coller ce bout de code et faire entrée :
var div = document.createElement("div");
var body = document.getElementById("gsr");
var parentDiv = body.appendChild(div);
var table = `<table><tbody>`;
$$(".srg h3 span").forEach((h3) => {
let civ = h3.textContent.split(" - ")[0];
let civParse = civ.split(" ");
let firstname = civParse[0];
civParse[0] = "";
let lastname = civParse.join(" ");
table += `<tr><td>${firstname}</td><td>${lastname}</td></tr>`;
});
table += `</tbody></table>`;
div.innerHTML += table;
Cela va te faire en bas de page un tableau que tu peux copier dans un Google Sheet ou autre. Tu peux rajouter num=100 dans l’url Google pour avoir 100 résultats sur la même page.
Je confirme l’approche de @rmaz, il vaut mieux faire un split sur le caractère -.
Par contre d’expérience il y a dans certains résultats une autre barre horizontale, plus longue, qui est un caractère spécial : – : il faut le prendre en compte si tu veux tous les résultats.
Et petite astuce supplémentaire : si tu cherches des personnes travaillant dans une société précise (p.e Google), les résultats sont mieux avec le filtre intitle : intitle:Google site:fr.linkedin.com/in/, ça évitera de faux résultats positifs (les personnes ayant anciennement travaillé dans la société).
Merci pour vos réponses et en effet le code de @rmaz fonctionne bien !
@ClementAubry merci pour l’astuce ;). Pour le caractère spécial, je l’ai simplement supprimé via la commande Excel =SUBSTITUE(CELLULE;"-";" ")
J’ai également besoin de récupérer la ville de la personne, pensez-vous que cela soit possible, en sachant que le scrap se ferait du coup depuis Linkedin puisque Google ne les affiches pas ?