Scrap google des 2 premiers mots de résultats

Bonjour à tous,

Je scrap LinkedIn via l’opérateur Google site:fr.linkedin.com/in/

Tous les résultats renvoyés sont sous la même forme : prénom puis nom.

Savez-vous comment je peux faire pour enregistrer du coup les 2 premier mots de chaque résultats pour toutes les pages pour obtenir le prénom puis le nom de la personne ?

Également, est-il possible de récupérer la ville d’exercice de l’activité dans le profil Linkedin ?

Merci !

Via une regex avec parenthèses capturantes?

Pour faire très simple tu peux ouvrir ta console chrome et coller ce bout de code et faire entrée :

    var div = document.createElement("div");
    var body = document.getElementById("gsr");
    var parentDiv = body.appendChild(div);
    var table = `<table><tbody>`;
    $$(".srg h3 span").forEach((h3) => {
    	let civ = h3.textContent.split(" - ")[0];
    	let civParse = civ.split(" ");
    	let firstname = civParse[0];

    	civParse[0] = "";
    	let lastname = civParse.join(" ");

    	table += `<tr><td>${firstname}</td><td>${lastname}</td></tr>`;
    });
    table += `</tbody></table>`;
    div.innerHTML += table;

Cela va te faire en bas de page un tableau que tu peux copier dans un Google Sheet ou autre. Tu peux rajouter num=100 dans l’url Google pour avoir 100 résultats sur la même page.

7 « J'aime »

Je confirme l’approche de @rmaz, il vaut mieux faire un split sur le caractère -.
Par contre d’expérience il y a dans certains résultats une autre barre horizontale, plus longue, qui est un caractère spécial : : il faut le prendre en compte si tu veux tous les résultats.

Et petite astuce supplémentaire : si tu cherches des personnes travaillant dans une société précise (p.e Google), les résultats sont mieux avec le filtre intitle : intitle:Google site:fr.linkedin.com/in/, ça évitera de faux résultats positifs (les personnes ayant anciennement travaillé dans la société).

1 « J'aime »

Merci pour vos réponses et en effet le code de @rmaz fonctionne bien !

@ClementAubry merci pour l’astuce ;). Pour le caractère spécial, je l’ai simplement supprimé via la commande Excel =SUBSTITUE(CELLULE;"-";" ")

J’ai également besoin de récupérer la ville de la personne, pensez-vous que cela soit possible, en sachant que le scrap se ferait du coup depuis Linkedin puisque Google ne les affiches pas ?

Merci !