Le scraping sur LinkedIn est il mort ?


#1

Hello les GH,

De sources sûres et concocordantes, LinkedIn s’apprêterait à mettre en place des solutions anti-scraping très robustes.

Ces solutions devraient arriver dans le trimestre en cours.

Jusqu’a présent, pour générer des leads B2B alimentant nos campagnes de cold mailing nous mettions en place le process suivant :

  1. Définition des ICP (Ideal Customer Profil)
  2. Identification des targets sur LinkedIn/ Sales Nav.
  3. Scraping LinkedIn/Sales Nav. Search result avec API Phantombuster
  4. Import des résultats de scraping dans Dropcontact pour retrouver les mails B2B et enrichir les infos de leads
  5. Création de campagnes de cold mailing avec Klenty

Mais depuis quelques temps, le scraping en mass (environ 4000 profils/mois) du search result LinkedIn est de plus en plus compliqué pour rester sous les radars…

Considérant l’update anti scraping de LinkedIn qui va arriver prochainement, cela risque de devenir un vrai casse tête.

Des idées ?


#2

Hello,

Ta question d’idées c’est vis à vis de solutions éventuelles pour contrecarrer Lkdin ou c’est plus par rapport au fait de trouver d’autres sources de data en éliminant celle-ci?

Quand on regarde en arrière, ça ne date pas juste d’il y a 6 mois ces mesures d’anti scraping, mais facilement deux ans, et améliorés constamment il n’y a aucun doutes là dessus.

Par contre tu aurais des exemples de blocages que tu as constaté, ou un ensemble de critères définissant une situation qui mène à une détection que tu aurais remarqué?

Sans savoir ce qu’ils ont mis en place ou ce qui est à venir, ça reste difficile à contourner :confused:


#3

Les solutions à venir chez LinkedIn semble être des versions boostées de Datadome.
Ma question est effectivement de trouver soit une solution de contournement du problème sur LinkedIn ou à défaut une alternative pertinente pour alimenter ma base de leads ciblés en volume.


#4

Hello

Voici une astuce de Mikael Monjour lors de son interview :

ette astuce consiste à faire du dorking, c’est à dire faire de la recherche précise des personnes, via les profils.

Pour optimiser ma prospection sur LinkedIn, j’utilise un outil externe qui s’appelle Findera .

C’est un outil américain qui référence quasiment 1 million de Français avec leur nom et prénom, leur poste et les URLs Linkedin.

|500x175

Une fois que vous avez fait votre recherche sur Findera, il faut récupérer les données.

Pour scrapper Findera, il y a un petit outil qui est merveilleux pour le scapping en ligne qui s’appelle Instant Data Scrapper .

|500x313

C’est un outil très simple à utiliser : vous cliquez dessus, et cela reconnait les paramètres du site, et vous pouvez scrapper et récupérer le tout dans un CSV.

Ensuite vous uploadez le fichier de scrapping de Findera sur LinkedIn Helper, et ensuite il ne vous rester plus qu’à ajouter ces contacts.

|365x500

Par exemple, si vous voulez ajouter les directeurs commerciaux de Paris, vous scrappez avec Findera, ensuite vous automatisez l’invitation avec LinkedIn Helper.

Ce qui est intéressant de passer par Findera et non sur LinkedIn directement, parce que cela va beaucoup plus vite, et ensuite parce que sur LinkedIn la recherche est limité à 10 contacts par pages maximum…

Alors que sur Findera la recherche est limitée à 100 contacts / page… De plus, on ne crée pas des limites pour LinkedIn.

Voir => http://www.conseilsmarketing.com/e-marketing/3-astuces-de-growth-hacking-pour-facebook-linkedin


#5

Merci pour l’astuce, l’idee à l’air bonne mais impossible de se rendre sur Findera…Site inaccessible/serveur introuvable.
Sais tu pourquoi ?


#6

argh… je vais voir


#7

Malheureusement cela ne résout pas plusieurs problèmes:

  1. L’outil ne référence qu’au mieux 1M de profils Français, il en manque donc
  1. Cela nécessite d’utiliser un tool comment Linkedin Helper qui n’est pas à l’abri des solutions de blocage de Lkdin…

#8

Il y aura toujours le scraping via Google :

site:fr.linkedin.com/in “CTO”

Avec comme résultat :

Tu as le prénom, nom, entreprise. Assez pour recomposer un email.

CF : Récupérer le nom de domaine à partir du nom d'entreprise


#9

C’est pas faux :wink::+1:

Ton best tool pour scraper at scale sur Google serait quoi ? Et avec quelles limites ?
Thanks Camille !


#10

Le problème majeur sur Google ça ne serait pas les blocages intempestifs de type Google ReCaptcha?


#11

On peut scraper d autres search engines avec la commande site: et capmonster casse les recaptchas si besoin.


#12

Scrapebox forever :wink:


#13

Avec du proxy non. Par contre il y a la limite de résultat par requête, du coup il faut du keyword longue traine pour être exhaustif :

site:fr.linkedin.com/in “CTO” “Nantes”
site:fr.linkedin.com/in “CTO” “Bordeaux”
etc…


#14

Idem, le serveur Fidera semble down.


#15

Growth Buster, tu a des sources ? Pour le moment j’utilise linkedin helper et drop contact pour ca, mais je dois faire grand max 4k recherche par mois en effet. Car le but est de cibler un maximum.

Top ta solution Frederic !


#16

Oui le scrapping sur linkedin c’est useless.

Tu as des fuites de données sur le dark web contenant 770M d’emails.

Franchement à quoi ça sert de continuer à scrapper linkedin ?


#17

Pour cibler précisément.

Ce n’est pas avec une combo list de 770M de lignes email:password périmé qui va t’aider à démarcher :sweat_smile:


#18

Je pensais que LinkedHelper était rapidement repéré par Linekdin lorsqu’il était en extension chrome…J’ai vu passer quelque part un moyen de passer par le console pour éviter l’extension Chrome. Le sujet n’a pas été développé depuis.

@GrowthBuster, je procède de la même que toi pour les scraps URL --> Dropcontact. plutôt efficace.

Pour la détection Linkedin, elle est liée au profil automatisant des tâches quotidienne sans interaction (like,partage…) sur ce même profil. J’ai subi un blocage sur un des comptes ou il ne se passait rien mise à part l’automatisation de scrap & ajout. En revanche, sur les autres profils qui vivent, pas de problème à déclarer, j’ai pu même intensifier les actions des scripts.


#19

PAR AVANCE JE M’EXCUSE… Je suis un gros débutant.

J’ai essayé anyleads (la session test est inconstante) Phantombuster (me parait assez complet mais la contrainte de frequence est un peu pénible)
je cherche à enrichir avec dropcontact et j’ai essayé hunter.io

  • pipedrive (je découvre)
    On m’a recommandé Mixmax pour terminer
    qu’en pensez vous ?
  1. Définition des ICP (Ideal Customer Profil)
  2. Identification des targets sur LinkedIn/ Sales Nav.
  3. Scraping LinkedIn/Sales Nav. Search result avec API Phantombuster
  4. Import des résultats de scraping dans Dropcontact pour retrouver les mails B2B et enrichir les infos de leads
  5. Création de campagnes de cold mailing avec Klenty

@GrowthBuster API Phatombuster avec profilee scraper ou juste search export + dropcontact
tu me conseilles Klenty pour l’emailing ?

Désolé pour les questions basiques
la next step c’est le scraping via google et le scraping de pdf d’événements des suggestions ?


Team : CamilleBriceJulienVivianBorisXavierSteven.