Est-ce légal de scraper pages jaunes ?

Bonjour à tous !

Ma question est plus légale que technique.
J’aimerais scraper pages jaunes pour constituer une base de données de mobiles de professionnels de santé (infirmiers, kiné etc…).
J’ai cru comprendre qu’il existe déjà des tonnes de moyens de s’y prendre, ça ne m’inquiète pas plus que ça.

Mais, dans la mesure où le modèle éco de pages jaunes repose sur la data, j’imagine qu’ils se prémunissent du risque de se les faire absorber. Certains numéros sont peut-être « piégés » pour les alerter lorsque les datas sont utilisées sans leur accord ?
Je me demande ce qu’il en est de la légalité d’utiliser ces numéros de tél pour des campagnes de prospection SMS massives ?

Qu’en pensez-vous ?

Merci pour vos éclairages, ça m’aiderait grandement et je ne trouve aucune réponse satisfaisante sur les internets.

:pray:

La jurisprudence du bon con indique que la data reste une propriété intellectuelle. Maintenant il y a le telephone sous api siren en open data .

Ou est ce que cette api est elle dispo ?

https://api.gouv.fr › sirene_v3
API Sirene - api.gouv.fr

je ne suis pas sur que l’API SIRENE fournisse les numéros de téléphone, je l’utilise de temps en temps et n’ai jamais vu çà. Scraper les pages jaunes n’est pas simple il y a des protections, d’un point de vue légal, si c’est pour sa propre utilisation je pense qu’il n’y a pas énormément de risques (vous pourrez toujours dire que vous avez relevé les numéros à la main), par contre si c’est pour établir une base de données qui sera revendue c’est interdit

1 « J'aime »

Pour ça il faut du cold mailling pour avoir l’accord des intéressés

Le grattage en général est une zone grise totale, dépend de l’endroit où vous vivez et aussi d’où vous grattez
Très probablement si c’est pour votre usage personnel c’est bien

Bonjour.
Vous pouvez essayer le logiciel contact express…il y a une démo de démarrage … Pour commencer

Merci pour cette réponse :slight_smile:
Effectivement, ce n’est que pour une utilisation personnelle et je ne revendrai en aucun cas ces données (je suis déjà assez en stress de les utiliser pour moi haha).

@Kirat, le scraping des données de PagesJaunes est explicitement interdit dans les CGU.

Conformément aux dispositions de la loi n° 98-536 du 1er juillet 1998, portant transposition dans le Code de la propriété intellectuelle de la directive 96/9/CE du 11 mars 1996, concernant la protection juridique des bases de données, Solocal est producteur de sa base de données, accessible sur le présent site, et dont elle est seule propriétaire.

En accédant au présent site, vous reconnaissez que les données le composant sont légalement protégées et, conformément aux dispositions de la loi du 1er juillet 1998 précitée, vous vous interdisez notamment d’extraire, réutiliser, stocker, reproduire, représenter ou conserver, directement ou indirectement, sur un support quelconque, par tout moyen et sous toute forme que ce soit, tout ou partie qualitativement ou quantitativement substantielle du site auquel vous accédez ainsi que d’en faire l’extraction ou la réutilisation répétée et systématique de parties qualitativement et quantitativement non substantielles lorsque ces opérations excèdent manifestement les conditions d’utilisation normale.

Si vous souhaitez acheter ou louer des numéros SMS pour des campagnes de prospection, il existe des solutions légales pour le faire, notamment https://www.marketingconnect.fr/

L’INSEE ne fournit plus les numéros de téléphone en opendata depuis mai 2018 :triumph:

1 « J'aime »

Merci pour cette réponse.

J’ai en effet bien lu les CGU.
Mais, je ne les ai jamais signées ni acceptées :thinking:
Dans ce cas, SoLocal pourrait très bien intégrer n’importe quelle clause alambiquée dans ses CGU, et je devrais m’y plier sans y avoir consenti ?
Si je pousse le raisonnement, s’il y avait marqué dans les CGU que je dois de l’argent à Pages Jaunes pour le simple fait d’avoir accédé au site, cela ferait foi ? Ça ne tient pas, soyons honnêtes.

D’autant plus que les numéros étant accessibles, je pourrais très bien embaucher quelqu’un pour les récupérer les unes après les autres. Ou bien envoyer un SMS à chaque infirmière, l’une après l’autre.

En quoi est-ce que c’est différent de faire preuve d’efficacité en bricolant un bout de code qui automatise tout ça ? :grinning:

Le fait d’utiliser un service en ligne suppose la connaissance et l’acceptation de ses CGU.

Tout extraction et réutilisation répétée et/ou substantielle de données issues d’une base de données protégée va à l’encontre du code de la propriété intellectuelle : les producteurs de base de données ont des droits sur les contenus qu’ils produisent, même s’ils les mettent en ligne.

Recopier des infos à la main ou en quantité non substantielle (qlq centaines de données) relèvent d’un usage autorisé par les CGU.

Extraire des milliers de données de manière répétée et automatisée d’une base de données en ligne est une infraction au droit français et européen.

Si vous ne respectez pas les CGU d’un site mais que vous vous faites attraper « la main dans le pot de confiture », vous pouvez vous retrouver devant le tribunal et être condamnés.

confère le jugement récent concernant Le Bon Coin ; il existe aussi une jurisprudence similaire concernant PagesJaunes.

1 « J'aime »

Je me permets d’ajouter mon grain de sel vu que c’est mon métier :

  • Effectivement les CGU sont une première raison, c’est un contrat d’adhésion engageant la responsabilité contractuelle de l’utilisateur. Que ce soit à des fins personnelles ou professionnelles, si c’est interdit contractuellement c’est interdit.
  • Ensuite tous les sites d’annuaires, d’annonces, etc. sont des bases de données. A ce titre elles sont protégés d’une part grâce au droit sui generis des bases de données, et d’autre part grace aux droits d’auteur. Le fait de pomper le travail d’un autre pour l’exploiter sans son autorisation engage votre responsabilité délictuelle.

Il y a bien sûr des exceptions mais aucun d’entre nous ici n’exploite quelques lignes. Extraire des centaines de données n’est certainement pas un usage permettant d’éviter la massue du droit des bases de données.

Il n’y a donc absolument aucune zone grise en la matière, juste une difficulté de constatation et a plus forte raison de preuve.

3 « J'aime »