Scraper +400k followers compte Instagram avec PhantomBuster

Bonjour à tous,
Après en avoir tant entendu parler j’ai souhaité tester PhantomBuster sur Instagram.
J’ai essayé de scraper les 400k followers d’un profil Instagram mais ça bloque à 10k ou 20k followers et je vois cette erreur:

Profile has around 437902 followers.
:warning: Couldn’t load followers list, Instagram rate limit probably reached.
:warning: Stopping the agent. You should retry in 15min.

J’imagine que cela est lié au fait qu’Instagram utilise de l’AJAX avec un scroll « finit » de la liste des followers… Quelqu’un connait-il une solution afin de s’assurer de scraper TOUS les followers? Hormis la solution de réitérer le process manuellement 50 fois jusqu’à avoir choppé tous les followers.
Merci !

cc @NaileT

Hello @m_a_x_e_n_c_e !

Si un Phantom t’affiche un message d’erreur qui évoque des « rate limits », cela signifie que tu devrais cadender ton scraping.

En l’occurence tu peux activer l’option « repeated launches » lors du setup de ton phantom pour qu’il se lance automatiquement jusqu’à X fois par jour.

Ton fichier .csv sera automatiquement mis à jour avec les nouveaux profiles scrapés.

N’hésite pas si tu as d’autres questions à ce sujet !

Naïlé

PS : Thanks pour le cc @Camille

Merci Nailé, je le lance en auto une fois par heure et on va voir ce que ça donne.
Cependant pour l’option Session Cookie, il semble que l’option soit obligatoire, j’ai tenté de mettre « XXXXXXXXXXXXXX » mais ça n’a pas pris non plus:
cookie

My bad, l’astuce du session cookie fonctionne uniquement pour Instagram Profile Scraper !

Salut Maxence,

Je précise 2 choses suite à la réponse de Naïlé (qui bosse aussi chez Phantombuster mais qui a passé moins de temps que moi à ponçer les Phantoms Insta ;): Scraper 400k followers c’est ambitieux.

Premièrement parce qu’on ne peut pas scraper plus de 9k followers par lancement. Qu’il faut espacer les lancements de 10min minimum pour préserver ton cookie. Et d’autre part parce que la requête open graph qui est scrapée a une durée de vie de 6h. Donc un max théorique de 669 = 324k followers. Et me ce chiffre me paraît dur à obtenir.

En plus tu te retrouveras avec un fichier énorme que certains softs de spreadsheet ne pourront pas ouvrir (ou mettront max de temps). Google Sheets par exemple.

Je ne sais pas quel est ton objectif mais tous les utilisateurs qui sont venus nous voir avec des montants importants de followers à scraper (les 30 million + followers de Lady gaga par exemple) pouvaient toujours résoudre leurs besoins en scrapant moins mais en ciblant mieux.

N’hésite pas à m’envoyer un DM sur le Slack si tu veux qu’on en parler.

Excellente soirée,

-Jules

1 « J'aime »

salut les gars, honoré de parler à la team de ce superbe produit :wink: Et merci pour vos retours de qualité. Effectivement 400k+ de followers c’est démesuré, initialement un de mes clients souhaite que je scrappe 200k followers sur 10 différents profils. Donc cela me semble faisable d’après ce que tu me dis.
Après les 400k+ followers c’est juste moi et ma manie de triturer le jouet, pour voir à quel moment il casse :man_shrugging:

Par curiosité j’ai laissé tourné cette nuit (1 fois par heure) et j’étais déjà à 124k followers. Mais je vais l’arrêter car utiliser mon compte Instagram perso n’est pas forcément l’idéal, car le risque de blocage reste existant j’imagine.

Pour les fichiers lourds j’utilise glogg, je vous le conseille, j’ai pu ouvrir des fichiers de plus de 2 millions de ligne sans problème. Sinon étant Data Scientist, j’utilise une BDD type PostgreSQL et là plus de soucis.
En tout cas une nouvelle fois merci pour vos retours très intéressants, au plaisir.

1 « J'aime »

Avec plaisir! Merci pour glogg, j’avais déjà cherché une solution pour ce genre de problème et donc je note ça dans ma petite liste d’outils.

Pour ce qui est du scraping, Insta est relativement coulant: Ce qui les embêtes plus c’est l’automatisation d’action. Je reste curieux de ce que ton client pourrait bien faire de ces 200k followers…

1 « J'aime »

@julespb À propos de l’automatisation d’action, tu parles surtout de l’auto-follow ? Prends-tu aussi en compte tout ce qui est auto-like et auto-watch ? Je suis curieux sur les deux derniers points car selon moi insta n’a pas à se soucier de ça, c’est plutôt cool pour leurs cibles et donc savoir s’ils peuvent ghost des comptes sur ces deux derniers types d’action

Bonjour m_a_x_e_n_c_e,

Comme le souligne en partie NaileT, les réseaux sociaux imposent des limites d’envois journalières. Si on les dépasse, on peut être considéré comme un spammeur et voire son compte banni.

Il y a d’autres soucis avec PhantomBuster :

  1. Il est relativement complexe à configurer.
  2. On est obligé de passer par des VPS, pour éviter d’être détecté.

Je te propose un autre outil pour scraper Instagram. Il est facile d’utilisation et 100% safe.

Il s’agit de PhoneBot. :grinning:

Bonjour à tous, je trouve cela intéressant idee de scraper des followers insta. Mais clairement qu’elle sont les informations exactes que l’on reçoit avec le fameux logiciel?