Hello à tous,
Encore une question un peu précise désolé
Avoir les références d’une entreprise c’est un super levier pour pleins de raison. Je cherche a scaler le process, car aller sur chaque site web récupérer les logos à la main, c’est comment dire… un peu chiant
Qui a déjà automatisé un truc du genre ?
Je pense que c’est assez difficile à automatiser car chaque site internet à sa propre structure.
Donc s’il n’y a pas une structure commune sur les sites avec une partie « Nos références », difficile de trouver un système d’automatisation. De plus, il s’agit souvent d’images qui ressemblent à tous les autres fichiers images du site.
Pour extraire les images d’un site plus rapidement ce site peut t’aider : https://extract.pics/
Il permet de télécharger rapidement les images d’un site à partir d’une URL. Tu peux sélectionner les images que tu veux récupérer puis cliquer sur « Download Selected ». Tu peux même faire une recherche par nom de fichier.
Pour bien comprendre tu souhaite juste récupérer les logos des entreprises ? SI c’est le cas tu peux utiliser un scraper pour cibler les logos uniquements tu n’aura pas un taux de succès de 100% mais ça peut toujours te faire gagner du temps.
Plutôt le nom des références, après les logos c’est déjà un bon début. Tu peux m’en dire plus sur ta technique pour scrapper les logos références des entreprises ?
@Thomas_Lucyfer@Kevin-Zimmermann : vous pouvez m’expliquer votre process étape par étape pour trouver les références avec l’API de Clearbit ? Un exemple simple https://zapier.com/, ils ont 5 références sur leur page d’accueil.
Il faut ajouter à la main les urls de ces sites et utiliser la fonction autocomplete with logo. En gros c’est juste pour récupérer les logos rapidement plus que pour autre chose.
Si tu ne veux pas le faire toi-même il y a toujours moyen d’embaucher un virtual assistant sur fiverr ou upwork
@steph1,
Pour les API de reconnaissance de logo en AI, la question que je me pose c’est si elle isole tous les « texte + image qui ressemble à un logo » d’une image ou si elles ont une réelle capacité de reconnaissance de logo.
Sans certitude, deux cases à tester et qui vont peut-être fonctionner :
Extraction des images avec extract.pics mentionné par @Antoine_Moulard
Je vais tester l’api vision merci !
Pour ce qui est de Clearbit malheureusement je n’ai pas trop envie d’ajouter les urls des références à la main, étant donné que tout le but de ce post c’est de faire exactement l’inverse
Et pour ne pas avoir à entrer les urls à la main tu peux utiliser un robot RPA ou CheatLayer (en ce moment sur AppSumo) par exemple. Tu lui dis/montre quoi faire, tu donne des délais et il te le fait, un peu comme du scraping mais dans l’autre sens!