Bonjour à tous,
Nouveau sur le site, je tiens d’abord à vous remercier pour les conseils donnés, c’est vraiment top !
Voici ma problématique :
Je possède un fichier excel (base de données clients) très incomplet, comportant notamment les infos suivantes : « nom de la société » / « numéro département ».
Je souhaiterais automatiser plusieurs choses, notamment :
- recherche du numéro de SIRET, via un process du type : ramener automatiquement la première page issue d’une recherche google avec « nom de la société » + « numéro département » + VERIF (l’idée est d’accéder à l’URL de la page verif.com concernée, qui s’affichera généralement en première position, puis de scraper le SIRET sur la page par la suite, ou même plus simplement le récupérer directement via l’URL concerné - ce qui est possible avec verif)
- recherche automatique du numéro de téléphone de la société, s’affichant à droite à chaque recherche google sur une société (en tapant « nom de la société » + « numéro département »)
Pour ceci, j’ai tout d’abord pensé à la fonction importxml de google spreadsheet. J’ai donc lu attentivement et suivi le tuto donné par deux.io (ImportXml & ImportHtml: Scraper avec Google Spreadsheet), cependant cela ne fonctionne pas chez moi pour de nombreux sites, dont google, et renvoi sans cesse la même erreur #N/A (impossible de récupérer cette URL : « URL google concerné ») ! J’avoue ne vraiment pas comprendre…même une simple requête du type =IMPORTXML(« test";"//title - Google Zoeken ») renvoi vers cette même erreur (cela marche pourtant avec d’autres sites). Plus précisément, cela marche vraiment très rarement, de manière aléatoire…
Pour info, je n’ai pas encore essayé de passer par un proxy mais je ne pense pas que cela soit nécessaire étant donné qu’il s’agit de google spreadsheet…?
Je vous sollicite donc afin d’avoir vos conseils à ce sujet…! Une idée du problème ? Peut-être que cette méthode n’est pas la plus adaptée pour cet usage, je suis prêt à passer par un soft dédié au scraping si cela s’avère être la seule solution. A ce sujet, j’ai pu constater qu’il existe un très grand nombre d’outil de ce type, certains abordables en terme de prix (scrapebox, seotools for excel,…), lequel me conseillerez-vous pour cet usage particulièrement ? Sachant que je ne sais pas coder !
Je vous remercie d’avance et bonne journée à tous !
Romain