Puppeteer headless Datadome

Hello tout le monde,

Par curiosité j’ai récemment créé un script pour récupérer quelques données sur un site protégé par Datadome.

Pour le moment j’ai réalisé tous mes tests en n’ayant pas puppeteer en mode headless afin de pouvoir visualiser le résultats de mes diverses instructions et voir que tout fonctionne bien.

J’ai ensuite passé le navigateur en headless (sans le mode stealth) et à ma grande surprise le script s’est exécuté sans prendre de captcha.

Par la suite j’ai mis mon script sur un serveur (sur une instance EC2) et là, il est directement bloqué (or l’exact même script n’est pas bloqué quand je le lance depuis mon PC derrière un VPN + proxy bien sûr).

Je me suis dit que le mode stealth pourrait aider, je passe quasiment tous les tests sur CreepJS et https://bot.incolumitas.com/ mais il semblerait que je ne l’utilise pas correctement car je me fais ban directement et ce même sans être headless.

Est-ce que qu’une âme charitable pourrait me donner un coup de main ? Je pense réellement ne pas être bien loin du but, la frustration est à son maximum aha :sweat_smile:

Merci ! :pray:t3:

Sur l’instance EC2 t’as mis un vpn + proxy aussi ?

Tu as essayé de passer par un proxy avec ip 4G/5G ?

Non non mais je cherchais surtout à comprendre la différence.
Et surtout étonné que le headless sur mon mac fonctionne parfaitement sans stealth ni rien :sweat_smile:

C’est pour un tout petit projet perso pour m’amuser en apprenant le node donc désolé si je pose des questions bêtes aha

Hello !

Non pas VPN mais Proxy oui. Pourquoi ?

Salut ! Peut-être que ton proxy est détecté ?
C’est assez facile de détecter les IPs non-résidentielles aujourd’hui (getipintel, iphub, …)

Hello,

Je ne pense pas car j’utilise le même proxy sur mon serveur et sur mon PC.
Je pense que cela est plus dû à ma configuration de puppeteer qui a amené à ce qu’il se fasse ban. Car en effet, cela ne fonctionne plus, même depuis mon PC.

Plus le temps passe plus je me dis qu’il n’est pas possible de bypasser Datadome.

J’y ai passé des heures, ai essayé des tonnes de configurations différentes en headless (via stealth et plein d’autres techniques) mais aucun résultat.

Je pense réellement être près du but mais rien n’y fait… Je désespère aha.

Pas sur qu’il y ait quelqu’un qui continue à avoir des scripts avec puppeteer arrivant à contourner les protections …? :confused:

Si si il y en a qui y arrivent encore :slight_smile:

Avec puppeteer en headless ?

J’ai vu que tu vendais ce genre de services, j’imagine que du coup il sera difficile de demander un peu d’aide :upside_down_face:

C’est plus compliqué de faire passer headless que headfull, et oui effectivement je vend ce service, tu peux me présenter tes besoin si tu tu es interressé à outsourcer.

vous pouvez le faire un headless virtuel en xvbf: cela fonctionne avec datadome.
Mais vous n’aurez que franchi la première porte

1 « J'aime »