Scraping annuaire

Olivier_Niel · Août 19, 2021, 6:09

Bonjour,

Je cherche a scraper avec web scraper un annuaire de compagnie d’assurance , mais je n’arrive pas soit j’ai des enregistrements sont vide où soit décaler.

L’annuaire est https://www.jechercheunassureur.com/

Avez-vous un peu de temps comment faire avec webscraper ( j’arrive avec d’autres sites, mais pas celui la) ?
Bonne journée

TitanX · Août 19, 2021, 3:22

Bonjour,

Je n’utilise pas le logiciel web scraper mais je viens de scraper le site avec un peu de code Python.
J’ai plus de 12 000 résultats dans un fichier CSV si ça vous intéresse.

Olivier_Niel · Août 23, 2021, 8:33

Peux tu m’aider : J’essaye de scraper avec webscraper apollo.io mais je bloque as tu un tip pour m’aider?

Kev_Mas · Décembre 31, 2021, 3:19

tu as plus simple que webscraper, tu as la formule IMPORTXML…

en A1 tu mets << https://www.jechercheunassureur.com/ >>

en A3 tu mets cette formule << =IMPORTXML(D1;"//*[@id=‹ les_departement ›]//li//div/a") >>

en B3 tu mets cette formule << =IMPORTXML(D1;"//*[@id=‹ les_departement ›]//li//div/a/@href") >>

en D1 tu crées une validation de donnée, (à partir d’une plage de données) et mets << =$A$3:$A >> en plage de données

en E1 tu mets cette formule << =A1&INDEX(B3:B;EQUIV(D1;A3:A;0)) >>

en D3 tu mets cette formule << =IMPORTXML(E1;"//div[@class=‹ info-societe ›]/h3/text()[1]") >>

en E3 tu mets cette formule << =IMPORTXML(E1;"//*[@id=‹ adresse ›]") >>

en F3 tu mets cette formule << =IMPORTXML(E1;"//div[@class=‹ info-societe ›]/div[@class=‹ row ›]/div[@class=‹ col-md-8 ›]/p[2]/span[@title=‹ No. téléphone ›]/a") >>

en G3 tu mets cette formule << =IMPORTXML(E1;"//div[@class=‹ info-societe ›]/div[@class=‹ row ›]/div[@class=‹ col-md-8 ›]/p[2]/a[@title=‹ E-mail adresse ›]") >>

Kev_Mas · Décembre 31, 2021, 3:22

et hop tu as ton petit logiciel perso qui va t’afficher le nom, adresse, tel et email de tous les assureurs du département que tu auras choisi dans ta liste déroulante… tu n’auras plus qu’a les copiée sur une autre…
ET TOUT CA SANS SCRIPT !!!

Olivier_Niel · Décembre 31, 2021, 8:34

Merci, je vais essayer dans le week-end.