Sraping Bien ici - site d'annonces immobilières

Hello tout le monde :slight_smile:

Je voudrais savoir si quelqu’un d’entre vous à déjà scrapé le site bien ici ?

Si oui, avez-vous réussi à récupérer l’emplacement sur la carte des biens figurant sur la droite (dans la vue « carte ».

Mon objectif serait de pouvoir visualiser rapidement la distance qui sépare un bien de l’agence qui s’en charge.

Merci pour vos retours et votre aide !!

Je vous souhaite une bonne soirée et à très vite j’espère :wink:

Hello @MarieGainche,

Merci pour ton message, effectivement demande intéressante.
Est-ce que par emplacement sur la carte de biens tu parles des annonces?

Si oui, on vient de sortir un script Python qui permet de scraper tous les listings Bien’Ici à partir de n’importe quelle URL de recherche Bien’Ici !

:yellow_heart:

En entrée:

  • le lien de recherche Bien’Ici e.g. https://www.bienici.com/recherche/achat/france/chateau
  • la page max à atteindre e.g. 2

Et en sortie tous les listings, ensuite sauvegardés dans un fichier .csv.

$ python3 bienici-listings-scraper.py -u https://www.bienici.com/recherche/achat/france/chateau -p 1  
going to page: 1
total results: 555
total results to scrape: 25
scraped: Domaine 6 hectares proche Etretat
scraped: Château à vendre dans le lot avec dépendances et piscine
...
scraped: Domaine et Château avec Parc de plus de 18000m² !
scraped: Vente Château 29 pièces
scraped: CHATEAU
scraped: MORVAN LAVAULT DE FRETOY
scraped: Château
scraped: Château fin XIXe -début XXe Siècle
max page reached
csv written
elapsed: 0.50 s
~~ success
_       _         _            
| |     | |       | |          
| | ___ | |__  ___| |_ __ __  
| |/ _ \| '_ \/ __| __/| '__|
| | (_) | |_) \__ \ |_ | |  
|_|\___/|_.__/|___/\__||_|  

Et un exemple de ce qui sort au format csv

:point_down:

ici

:point_up:

NB: on va sortir très prochainement un article pour expliquer comment on a fait ça, et un no-code scraper sur lobstr.io si les gens sont chauds

Très curieux d’avoir vos retours!

1 « J'aime »

Bonjour et merci beaucoup pour la réponse @SashaLobstr !! :slight_smile:

Est-ce que par emplacement sur la carte de biens tu parles des annonces?
Oui, c’est bien ça :wink:

Ca m’a l’air tès bien comme résultats

Peut on aussi avoir les prix et superficies de ces annonces de locations ou ventes ?

Merci d’avance :slight_smile:

1 « J'aime »

Hello @MarieGainche

Je t’en prie!

:grin:

Et le tutoriel de comment on en est arrivés là:

NB: on a fait du reverse de javascript — en utilisant ChatGPT pour le comprendre et le traduire en Python, ça vaut le détour pour les plus nerds d’entre nous :nerd_face:

NB2: ça permet maintenant de scraper les biens immobiliers depuis n’importe quel URL de recherche de départ — quel que soit le type de bien, les filtres avancés utilisés ou la localisation e.g. https://www.bienici.com/recherche/achat/france/chateau/10-pieces-et-plus?surface-min=1000&cheminee=oui chateau, +10 pièces, 1000m2 mini, avec cheminée

NB3: on va bientôt développer un scraper no-code je vous tiens au courant :nerd_face: :nerd_face:

Peut on aussi avoir les prix et superficies de ces annonces de locations ou ventes ?

Normalement tu dois pouvoir retrouver ça en jouant un peu avec la fonction de parsing.
N’hésite pas à me MP si besoin.

:pray:

5 « J'aime »

Il faut tout de même être un peu calé pour se lancer là dedans :slight_smile:
Mais c’est top

1 « J'aime »

Bravo pour le tuto @SashaLobstr !

Hello @tous

L’utilisation du package a maintenant été simplifié avec succès!


L’installation se fait directement avec pip:

$ pip3 install bieniciscraper

Et l’utilisation intuitive directement depuis la ligne de commande:

$ bieniciscraper -u https://www.bienici.com/recherche/achat/france/chateau -l 10 -o demo.csv
going to page: 1
total results: 591
total results to scrape: 10
scraped: Château à vendre dans le lot avec dépendances et piscine.
scraped: Turenne Collonges la rouge - Demeure du XVIII siècle de 300 m² habitables sur une parcelle 1,9 ha à rénover entièrement
scraped: Manoir 15 pièces BIVIERS
scraped: Château du XVIème siècle et son parc au coeur de Lyon
scraped: Domaine 3 hectares proche Etretat
scraped: Vente Château 19 pièces
scraped: ANCIENNE DEPENDANCE DE L'ABBAYE DE CONQUES, CONSTITUEE D'UN CHATEAU
scraped: Château
scraped: Vente Château 8 pièces
scraped: DOMAINE D'EXCEPTION MONTS DU LYONNAIS
limit reached
csv written
elapsed: 1.20 s
~~ success
 _       _         _            
| |     | |       | |          
| | ___ | |__  ___| |_ __ __  
| |/ _ \| '_ \/ __| __/| '__|
| | (_) | |_) \__ \ |_ | |  
|_|\___/|_.__/|___/\__||_|  

Avec 3 variables dynamiques qui donnent de la flexibilité à l’usage:

--url/-u l’URL de recherche Bien’Ici
--limit/-l le nombre max. de bien à récupérer
--output/-o le nom du fichier dans lequel les données sont sauvegardées

Et toujours 13 attributs récupérés par bien

:sparkles:

NB: le repo github est ici — n’hésitez pas à nous laisser une petite star! :star2:

NB2: le no-code-scraper arrive très vite — si ça vous intéresse à fond, vous pouvez nous laisser un vote juste là

Amusez-vous bien!

:grin:

3 « J'aime »