Les site mentionnent-ils un mot spécifique ?

Bonjour,

Je cherche à partir d’une liste de site web, à savoir si leur site mentionne le mot « RSE » ou « développement durable ». Je cherche à avoir une réponse type OUI/NON ou un compteur de mot pour chaque site.

Merci de votre aide et bon courage pour tous vos projets,

Diogène

Salut @diogene378,

J’imagine que ta liste doit être très longue pour avoir ce type de besoin. Il faudrait préciser combien tu as de sites à monitorer pour t’aider.

Le soft auquel je pense qui s’en rapprocherait est Hexowatch (deal appsumo). Il fait bien le job sur du monitoring de mots clés / contenus mais ça sera limite pour plusieurs dizaines ou centaines de sites.

Merci de ta réponse @Fabien_Paupier,

Pour l’instant environ 500 sites, mais probablement plus par la suite.

Je ne connaissais pas le monitoring, je vais me renseigner merci :slight_smile:

Bonjour,

Nous scrapons régulièrement 7 000 000 de sites web français, nous classons les mots clés et nous pouvons vous fournir les sites avec une sélection de mots-clés, plus leur siren/siret et de coordonnées de contact : email, téléphone, réseaux sociaux. Souhaitez-vous un devis sur une recherche précise?

Voici un exemple :
|http://23dd.fr|Synthèses, débats et documents à propos du développement durable|
|https://pierrepelletier.com/|Services conseils en développement durable et stratégique|
|https://www.pdl-trdd.org/|Trophées Régionaux du Développement Durable des Pays de la Loire|
|http://oha-architecture.com|Olivier Henry Architecte. Atelier darchitecture et de développement durable.|
|https://www.koom.org/|Plateforme de crowd-acting sur le développement durable. Citoyens et entreprises agissent ensemble… et vous |
|https://www.econav.org/|Le réseau EcoNav : connaitre le nautisme durable et les activités maritimes en connexion avec le développement durable|
|https://www.ritimo.org/|Réseau dinformation et de documentation pour la solidarité et le développement durable. 75 lieux pour sinformer et (…)|
|https://www.devdurjouyenjosas.fr/|Retrouvez tous les acteurs et les projets de la ville de Jouy-en-Josas dans le domaine du développement durable .|
|http://paulineroulleau.fr|Rapports développement durable et intégrés, communications institutionnelles et contenus de marques sur les sujets de développement durable.|
|http://plusdevert.org|Plus de Vert, bureau détude en environnement, développement durable, énergies, aide les maîtres douvrages, architectes et urbanistes pour un monde plus vert.|

Cordialement,

Stéphane Olaïzola

1 « J'aime »

Les gars, il va falloir faire mieux que de scraper la balise description et keywords. Je pensais que vous faisiez une synthèse à partir d’éléments épars en utilisant un algo de NLP.

Hello @diogene378,

La demande a été faite il y a un an, mais ça peut potentiellement servir à d’autres :slight_smile:

On peut croiser sur gsheet les fonctions IMPORTDATA et REGEXMATCH pour trouver des mot-clés sur un URL.

J’ai créé ce template gsheet que vous pouvez ré-utiliser sans avoir besoin de coder :star2:

Attention :

  • Il faut faire des variantes de mot-clés en fonction des accents
  • C’est très lent !