Scraping Gaz Tarif Réglementé

Bonjour à tous,

j’ai une solution de scraping qui permet aux gens de récupérer leurs factures automatiquement.
C’est une solution python en utilisant selenium.

J’ai un problème pour passer le recaptcha v3 de sites tels que Gaz Tarif Réglementé ou Engie.
J’utilise un service de résolution de captcha.
Je sais récupérer le sitekey, l’action et je récupère bien un token du service de résolution de captcha.
Mais je ne sais comment utiliser ce token par la suite.

Toute idée sera la bienvenue.
Merci de votre aide

Petite recherche Google ? :joy::joy:
1er résultat recherche Google: https://medium.com/@jsoverson/bypassing-captchas-with-headless-chrome-93f294518337
C’est bien expliqué :slight_smile:

2 « J'aime »

Il me semble que l’article ne traite que de recaptcha v2 et non pas du v3?

Merci beaucoup pour ce lien et le temps pris à me lire.
Il s’agit effectivement du recaptcha v2 que je résous déjà sans souci.
Mon problème est avec le recaptcha v3.
Une fois le token récupéré du service de résolution de captcha, je suis censé faire un POST avec ce token vers une url de Gaz TR puis faire appel à la fonction javascript onConnectSuccess définie dans clientlib_gabarit-reborn-login-page.js. Et c’est là que je sèche pour l’instant …

tu peux donner l’url de la page stp ?

https://gaz-tarif-reglemente.fr/login-page.html

loginPageController est dispo en global (tu peux taper loginPageController dans la console).

Tu peux copier le contenu de la fonction inData, onConnectSuccess et appeler toi même tout ça :slight_smile:

2 « J'aime »

Impressionnant

Merci beaucoup. Je vais tester ça et je reviendrai vous donner le résultat.