Je pense que vous avez deja été confronté à ce type de soucis : résoudre des captcha pour pouvoir scraper tranquillement ;-))
A mon tour d’y être confronté.
Avez-vous des idées à me fournir ?
Je me retrouve avec ce type d’image très simple mais pour laquelle j’ai un peu de mal …
Mon code est en python (selenium dans ce cas) mais s’il y a des astuces online ou autre, je suis preneur.
Je pourrai acheter un lot sur 2captcha, mais le but de l’exercice est de trouver une solution complètement gratuite
Si tu ne veux pas utiliser 2captcha et consorts, tu peux passer par une libraire OCR (tesseract par exemple). Jamais fait personnellement, j’exporte tout sur 2captcha/anticaptcha.
Regarde aussi si tu ne peux pas bypass l’apparition du captcha, en utilisant des cookies valides ou en trouvant tes données sur un autre endpoint.
Oui, c’est un petit challenge, cela permet d’apprendre, de renforcer ses compétences au lieu d’aller les « acheter »
J’ai effectivement du code qui tourne avec pytesseract, mais le resultat n’est pas vraiement top (le pourcentage de succès est plutôt autour de 50%) donc je cherche des solutions pour soit améliorer le paramétrage de tesseract ou d’autres solutions.
Vu que l’image reste du captcha de base (une des premières versions de Captcha) ca doit être jouable sans trop de soucis …
Je continue à creuser … mais si vous avez une pelle/pioche à me proposer, n’hésitez pas