Captcha Solver

Bonjour,

Je pense que vous avez deja été confronté à ce type de soucis : résoudre des captcha pour pouvoir scraper tranquillement ;-))
A mon tour d’y être confronté.
Avez-vous des idées à me fournir ?
Je me retrouve avec ce type d’image très simple mais pour laquelle j’ai un peu de mal …

Mon code est en python (selenium dans ce cas) mais s’il y a des astuces online ou autre, je suis preneur.

Je pourrai acheter un lot sur 2captcha, mais le but de l’exercice est de trouver une solution complètement gratuite

Merci pour votre aide.

d’imagemy_shot_1

Hello !

Si tu ne veux pas utiliser 2captcha et consorts, tu peux passer par une libraire OCR (tesseract par exemple). Jamais fait personnellement, j’exporte tout sur 2captcha/anticaptcha.

Regarde aussi si tu ne peux pas bypass l’apparition du captcha, en utilisant des cookies valides ou en trouvant tes données sur un autre endpoint.

La logique m’intéresse, pourquoi ne pas utiliser 2captcha ? Est-ce un challenge perso ?

Dans ce cas regarde en effet une librairie OCR, je ne vois pas d’autre option :wink:

Oui, c’est un petit challenge, cela permet d’apprendre, de renforcer ses compétences au lieu d’aller les « acheter » :wink:
J’ai effectivement du code qui tourne avec pytesseract, mais le resultat n’est pas vraiement top (le pourcentage de succès est plutôt autour de 50%) donc je cherche des solutions pour soit améliorer le paramétrage de tesseract ou d’autres solutions.

Vu que l’image reste du captcha de base (une des premières versions de Captcha) ca doit être jouable sans trop de soucis …

Je continue à creuser … mais si vous avez une pelle/pioche à me proposer, n’hésitez pas :wink:

Hello @pierre.falque,

En espérant que ce soit la pelle et la pioche que tu recherches :grin: :

En plus poussé : machine learning « Captcha TensorFlow », une playlist YouTube intéressante :