Scraping annuaire

Bonjour,

Je cherche a scraper avec web scraper un annuaire de compagnie d’assurance , mais je n’arrive pas soit j’ai des enregistrements sont vide où soit décaler.

L’annuaire est https://www.jechercheunassureur.com/

Avez-vous un peu de temps comment faire avec webscraper ( j’arrive avec d’autres sites, mais pas celui la) ?
Bonne journée

Bonjour,

Je n’utilise pas le logiciel web scraper mais je viens de scraper le site avec un peu de code Python.
J’ai plus de 12 000 résultats dans un fichier CSV si ça vous intéresse.

Peux tu m’aider : J’essaye de scraper avec webscraper apollo.io mais je bloque as tu un tip pour m’aider?

tu as plus simple que webscraper, tu as la formule IMPORTXML…

en A1 tu mets << https://www.jechercheunassureur.com/ >>

en A3 tu mets cette formule << =IMPORTXML(D1;"//*[@id=‹ les_departement ›]//li//div/a") >>

en B3 tu mets cette formule << =IMPORTXML(D1;"//*[@id=‹ les_departement ›]//li//div/a/@href") >>

en D1 tu crées une validation de donnée, (à partir d’une plage de données) et mets << =$A$3:$A >> en plage de données

en E1 tu mets cette formule << =A1&INDEX(B3:B;EQUIV(D1;A3:A;0)) >>

en D3 tu mets cette formule << =IMPORTXML(E1;"//div[@class=‹ info-societe ›]/h3/text()[1]") >>

en E3 tu mets cette formule << =IMPORTXML(E1;"//*[@id=‹ adresse ›]") >>

en F3 tu mets cette formule << =IMPORTXML(E1;"//div[@class=‹ info-societe ›]/div[@class=‹ row ›]/div[@class=‹ col-md-8 ›]/p[2]/span[@title=‹ No. téléphone ›]/a") >>

en G3 tu mets cette formule << =IMPORTXML(E1;"//div[@class=‹ info-societe ›]/div[@class=‹ row ›]/div[@class=‹ col-md-8 ›]/p[2]/a[@title=‹ E-mail adresse ›]") >>

2 « J'aime »

et hop tu as ton petit logiciel perso qui va t’afficher le nom, adresse, tel et email de tous les assureurs du département que tu auras choisi dans ta liste déroulante… tu n’auras plus qu’a les copiée sur une autre…
ET TOUT CA SANS SCRIPT !!! :wink:

2 « J'aime »

Merci, je vais essayer dans le week-end.