[-PARTAGE-] Liste 2500+ mandataires immobiliers Efficity (mail & téléphone)

Salut, je vous partage un fichier Excel avec les 2597 mandataires immobiliers Efficity. Je l’ai scrapé il y a quelques jours (en juillet 2023 pour les personnes qui tomberaient sur ce post des mois/années plus tard).

La feuille contient 11 colonnes :

  • Identifiant : cet identifiant ne vient pas d’Efficity. Ce sont des nombres naturels uniques pour permettre d’importer les données dans vos bases de données relationnelles/CRM ou tout autre logiciel nécessitant des clés uniques.

  • Civilité : titre de civilité Madame ou Monsieur (attention, je suis tombé par hasard sur une Caroline dont le titre de civilité était Monsieur sur le site d’Efficity).

  • Prénom/Nom : le site ne donne pas accès au prénom seul et nom seul. En général il n’y a que deux mots, par exemple « Jean Cule ». Ici Jean est le prénom et Cule le nom de famille, mais il y a parfois des prénoms/noms composés et pas sûr de savoir qu’est-ce que le prénom ou le nom, par exemple « Ketty Boka Mandeziba » est-ce que Ketty Boka est le prénom ou seulement Ketty. Je le précise pour les personnes qui souhaiteraient envoyer des mail du type « Bonjour Jean, je suis Daisy Draté, CEO de machin truc etc» (donc envoyer un mail sans le nom de famille) en ne conservant que le premier mot de la cellule.

  • Adresse Mail : bon bah c’est l’adresse mail professionnelle individuelle.

  • Numéro de téléphone : il s’agit le plus souvent de numéro de téléphone mobile. Je n’ai pas supprimé l’indicatif (+33 en général) car certains numéros possèdent un autre indicatif (+594 pour la Guyane, +262 pour l’Île de la Réunion etc).

  • Lien URL : il s’agit du lien URL vers le profil Efficity.

  • Nombre de biens à vendre : il s’agit du nombre de biens que le/la mandataire propose à la vente actuellement.

  • Nombre de biens vendus/sous compromis : il s’agit du nombre de biens précédemment vendus par le/la mandataire ou actuellement sous compromis de vente.

  • Note Immodvisor : note individuelle du/de la mandataire immobilier sur le site internet https://immodvisor.com. Lorsque la cellule est vide, le/la mandataire ne possède tout simplement pas de note. Pour les personnes non notées sur immodvisor, on remarquera que sur leurs profils Efficity, il y a toujours une note. Ce n’est pas leur note individuelle mais la note globale d’Efficity (4,9/5 actuellement).

  • Ville : ville où le/la mandataire exerce.

  • Département : département de la ville où le/la mandataire exerce son activité. Il y a 56 cellules vides dans la colonne « Département ». Ces données étaient manquantes sur le site Efficity mais il est cependant aisé de retrouver le département avec le nom de la ville.

J’ai uploadé le fichier :dart:ICI:dart:, aucune idée de la durée de conservation du fichier par l’hébergeur (30 jours d’après leurs dires, mais bon… les paroles n’engagent que ceux qui les écoutent… tu connais). Si vous passez par là & que le fichier n’est plus dispo, tagguez moi dans le post ou alors tout bon samaritain qui l’aurait téléchargé entre temps et ré-uploadé. Je peux aussi vous filez le CSV – script de scraping – script de nettoyage des données si cela vous intéresse.

:warning::warning:ATTENTION:warning::warning:, ce fichier date de juillet 2023, si vous passez par là des années plus tard, il y a de très fortes chances qu’il soit « périmé » vu le taux de turnover élevé chez les mandataires immobiliers. Pareil pour le script de récupération de données, il y a fort à parier que l’architecture du site aura évolué entre temps.

@+ les bg (& les moches aussi SUUUUUIIIIII)

8 « J'aime »

Merci pour le partage :+1:t2:

pour ce problème il y a une solution https://www.npmjs.com/package/parse-full-name

Merci Mcr87 !
C’est propre comme base :slight_smile:

Oui, on peut aussi utiliser le format de l’adresse mail (première lettre du/des prénoms et nom de famille en entier) pour trouver ce qui fait partie du prénom ou du nom, mais flemme, je n’utilise absolument pas cette liste, c’était juste pour le fun & la partager aux gens qui pourraient en avoir l’utilité.

Par exemple, cas compliqué, identifiant 916, ligne 918 « Ned - Preston M’Beri - Elenga ». Qui peut deviner quels sont le/les prénoms et le/les noms de familles. L’adresse mail vous donne la solution [email protected]. Ned - Preston semblent être les prénoms et M’Beri- Elenga les noms de famille.

Il faut aussi prendre en compte que parfois, pour les femmes (c’est très rare pour les hommes), elles portent leur nom de jeune fille ET celui de leur mari. Mais difficultés supplémentaires, elles ont peut-être ajouté le nom de famille APRÈS être devenue mandataire. Pour des raisons évidentes, elles n’ont pas changé leur adresse mail qui ne possède que leur nom de jeune fille. L’inverse est aussi possible (nom du mari, divorce donc on reprend le nom de jeune fille mais on conserve le même mail avec le nom du mari)

2 « J'aime »

Quel outil pour obtenir ce résultat de scrap ?

Salut, je l’ai fait deux fois pour me faire la main, une fois avec libcurl en C++ et une autre avec le framework Scrapy en python. Pour le nettoyage des données, j’ai utilisé la bibliothèque python pandas 2.0 avec un notebook.

Hello ! Merci beaucoup du partage !

Il y’ aurait un moyen d’enrichir les profils linkedin des personnes de ta liste ?

Merci d’avance

Salut, oui c’est totalement possible avec des services tiers. Phantombuster, Derrick App parmi tant d’autres. Personnellement cette liste n’a aucune utilité pour moi, je l’ai scrapé pour le fun, je n’ai aucun intérêt à l’enrichir. À toi de voir quel service tu préfères pour enrichir ces données.

Parfait, merci pour la réponse !

@LaGruge Hello, je veux bien un lien à jour ou le csv si toujours dispo, Merci ! :grinning:

Salut, voici le nouveau lien :dart: ICI :dart: (uploadé le 29 août 2023, donc probablement disparu pour les personnes passant ici le 29 septembre 2023).

1 « J'aime »

Merci beaucoup ! :wave:

Mon dieu que ce genre de partage est cool de ta part ! Merci beaucoup !!

Merci c’est claase de ta part

Merci pour le partage !

Est-ce que tu pourrais me partager le script de scraping et de nettoyage, ça serait top ! :slight_smile:

Salut, pour le fichier de nettoyage, il est au format .ipynb (Jupyter Notebook, c’est totalement gratuit). C’est okay pour toi ou tu préfères que je l’héberge en ligne ?

Si un jour ils ont un problème de backup, je sais qui va etre contacté haha😅

1 « J'aime »

Merci c’est super sympa mais oui le 29/09 est passé et on a plus accès au lien. Pourrais-tu le reposter si cela ne te dérange pas ?

Salut, voici un nouveau lien (uploadé le 02 octobre 2023) ici

2 « J'aime »