Hello,
Vis à vis de Link.ed in, changer constamment son IP et son UA peut sembler être une bonne méthode, mais elle est fortement déconseillée si on cherche à scraper des profils, logué avec son compte utilisateur.
Je m’explique: Un peu comme le fait Facebook, quand on va se connecter depuis un nouvel emplacement (autre IP, autre User-agent), Link.ed in va estimer qu’il s’agit d’une activité suspicieuse/frauduleuse, et demander à l’utilisateur de confirmer son identité, via par exemple l’envoi d’un code sur son téléphone portable.
Mais au fait, pourquoi scraper Link.ed in avec son propre compte, et non pas en mode « déconnecté »?
Il y a plusieurs avantages à cela, d’une part vous êtes un utilisateur réel, votre compte est fiable, et vous ne risquez pas de vous faire bannir aussi rapidement que si il s’agissait d’un compte factice créé il y a deux jours, qui lui est quasiment vide en terme d’informations et de contenu.
D’autre part, cela permet de prendre un Premium, et pour ma part j’ai remarqué qu’en Premium je n’avais jamais été bloqué, du coup je n’ai plus du tout les mêmes contraintes qu’avec un compte factice.
Concernant la limite des 500 par jour, je l’ai au niveau de mes recherches. Même en Premium, si on dépasse 500 et quelques recherches, on est restreint pendant 24H (la recherche se limite aux membres faisant parti de notre réseau proche ou secondaire).
Pour résumer, je pense qu’en automatisant ses actions sur Link.ed in, en se faisant passer pour une vrai personne, en évitant d’utiliser des outils qui ne se comportent pas forcément comme de vrais navigateurs, les chances d’éviter ces fameuses limites seront meilleures.