Scrapper les mails d'un annuaire d'avocats

Ah ah génial :slight_smile:

Oops, je viens de cracher un peu sur les sélecteurs CSS je crois… Didn’t I ? :innocent:

Eheh, je n’avais même noté :stuck_out_tongue_winking_eye: En effet CSS se base sur les blocks et non pas sur son contenu. Et oui, CSS3 devait intégrer :contains() mais ça n’a pas été retenu :neutral_face:

A savoitr que jQuery intègre nativement la spec :contains(). On peut donc passer outre la lacune de CSS3 si on bosse en javascript. En sachant que des bibliothèques comme Cheerio.js (HTML parseur) se basent elles-mêmes sur jQuery.

Un rapide exemple fait sur le vif (sur cette page même):

Pour revenir un peu sur le sujet de l’extension, il ne me semble pas en effet qu’elle prenne en compte cette définition.

Bon, et pour info, vu que pour moi vous parlez un merveilleux chinois post antique, combien cela se facture-t-il de devoir générer une vraie base entièrement scrappée de plusieurs barreaux ?

Pour une réponse claire je te conseille de faire ça en MP avec @ScrapingExpert.

1 « J'aime »

Salut
Je suis aussi intéressé par la bdd des avocats. De mon coté j’ai scrappé les pages jaunes pour ça, du coup j’ai pas mal de leads, mais il m’en manque beaucoup d’adresses mails.
@Squatou @ScrapingExpert si vous voulez faire un peu de troc…on doit pouvoir s’aider…

Hello , merci pour la proposition…mais je dispose déja de la quasi totalité des bases des divers barreaux.

1 « J'aime »