Scraping URL site web ou nom de domaine

Bonjour,
Avec Dropcontact, la qualification d’email est meilleure en important la colonne des sites web.
J’utilise actuellement Duxsoup pour visiter des profils et cet outil me permet d’obtenir sur mon CRM les sites web mais j’aimerais arrêter cette solution.
J’ai vu quelques sujets qui évoquaient Societe.info. Le test n’a pas été concluant (11 sites trouvés sur 25 entreprises importées).

Avez-vous d’autres outils à me conseiller ?
Merci ! :slight_smile:

votre but est de trouver les URLs des sites web à partir des noms des entreprises ?

Hello Arnaud, Oui c’est bien cela. Par exemple je donne « TotalEnergies » et on me donne « https://www.totalenergies.fr/ »

J’ai la solution facile pour ça!!
Jette un oeil sur ce post linkedin: Adrien Velter on LinkedIn: Le tip du jour 😎 Vous avez une liste de centaines ou milliers… | 227 comments

Tout ce que tu as à faire maintenant, c’est d’installer notre add-on ImportFromWeb depuis Google workspace: https://workspace.google.com/marketplace/app/importfromweb_web_scraping_in_google_she/278587576794

Puis tu ouvres un google sheets et tu entres;
=IMPORTFROMGOOGLE(A1,« link »,« numResults:1 »)
avec A1=blablacar

et bien sûr, tu tires la formule vers le bas sur toutes tes requêtes en colonne A

1 « J'aime »

Hello @Adrien_NDNB !
Merci pour cette astuce ! :slight_smile:

J’ai tenté de la mettre en place mais j’ai une erreur « Fonction inconnue : IMPORTFROMGOOGLE. ». Pourtant j’ai bien installé ImportFromWeb depuis Google Workspace.


Saurais-tu m’aider ?
Merci !

@Anne_Gecova as-tu bien activé l’add-on via ton menu Extensions > ImportFromWeb > Activate add-on ?
Si oui, n’hésite pas à partager ta feuille et je regarderai !

@Adrien_NDNB Ah oui en effet, il n’était pas activé ! Merci :slight_smile:

Hello Anne, :wave:

L’enrichissement en sites web est bien une fonctionnalité de Dropcontact. Si on enrichit les données de l’entreprise TotalEnergies, alors Dropcontact va ajouter https://www.totalenergies.fr/.

Si le nom de l’entreprise est suffisamment discriminant, alors Dropcontact va trouver le bon site web et de manière automatique :robot:

Un exemple concret :
La recherche de l’adresse email chez TotalEnergies :

  • Dropcontact va rechercher le site web de TotalEnergies, ce nom étant suffisamment discriminant Dropcontact va correctement trouver le site www.totalenergies.fr et va correctement trouver une adresse email.

Par contre, si on fait la recherche d’une adresse email dans une entreprise ABC :

  • Dropcontact va rechercher le site web de ABC,
  • ce nom n’étant pas suffisamment discriminant, Dropcontact pourrait trouver abc.com alors que c’était peut-être abc.net ou a-b-c.fr qui pourraient aussi exister.

Que ce soit avec Dropcontact ou un autre outil, si on recherche le site web d’une entreprise ABC, alors l’outil pourrait identifier abc.com alors que vous cherchiez chez abc.net.

Si votre source de données est LinkedIn, alors vous avez tout intérêt à utiliser un outil de scraping LinkedIn tel que DuxSoup qui extrait le bon site web “à la source”, directement sur le profil Linkedin de la personne, sans avoir à rechercher avec un outil tiers.

Nous avons listé tous les outils cités ici (hors DuxSoup) qui permettent d’extraire le site web au moment de scraper les informations du profil LinkedIn.

Si votre source de données n’est pas LinkedIn et que cette donnée n’est pas disponible (comme c’est le cas dans votre CRM), alors vous pouvez laisser Dropcontact rechercher le site web par lui même :blush:

L’ajout du bon site web permet d’améliorer le pourcentage d’emails trouvés de 10 à 20% en moyenne avec Dropcontact, mais l’enrichissement de l’email avec le nom de l’entreprise (sans site web renseigné) fonctionne également. Il n’est pas nécessaire d’utiliser un autre outil qui recherche les sites web à partir du nom de l’entreprise.

Caroline
:love_letter: support@droponctact.io

Bonjour Caroline,

j’ai crée rocketlead.fr et j’ai pas mal de site de niche de base de données de niche ( par secteur).

Concernant votre poste et votre intervention : " Par contre, si on fait la recherche d’une adresse email dans une entreprise ABC :

de mon côté je suis capable de trouver le site web quand il y’a un doute, j’utilise mongodb et solar, je vais chercher à scorer des infos dans le site, il ne faut pas utiliser que le nom