Je cherche à partir d’une liste de site web, à savoir si leur site mentionne le mot « RSE » ou « développement durable ». Je cherche à avoir une réponse type OUI/NON ou un compteur de mot pour chaque site.
Merci de votre aide et bon courage pour tous vos projets,
J’imagine que ta liste doit être très longue pour avoir ce type de besoin. Il faudrait préciser combien tu as de sites à monitorer pour t’aider.
Le soft auquel je pense qui s’en rapprocherait est Hexowatch (deal appsumo). Il fait bien le job sur du monitoring de mots clés / contenus mais ça sera limite pour plusieurs dizaines ou centaines de sites.
Nous scrapons régulièrement 7 000 000 de sites web français, nous classons les mots clés et nous pouvons vous fournir les sites avec une sélection de mots-clés, plus leur siren/siret et de coordonnées de contact : email, téléphone, réseaux sociaux. Souhaitez-vous un devis sur une recherche précise?
Voici un exemple :
|http://23dd.fr|Synthèses, débats et documents à propos du développement durable|
|https://pierrepelletier.com/|Services conseils en développement durable et stratégique|
|https://www.pdl-trdd.org/|Trophées Régionaux du Développement Durable des Pays de la Loire|
|http://oha-architecture.com|Olivier Henry Architecte. Atelier darchitecture et de développement durable.|
|https://www.koom.org/|Plateforme de crowd-acting sur le développement durable. Citoyens et entreprises agissent ensemble… et vous |
|https://www.econav.org/|Le réseau EcoNav : connaitre le nautisme durable et les activités maritimes en connexion avec le développement durable|
|https://www.ritimo.org/|Réseau dinformation et de documentation pour la solidarité et le développement durable. 75 lieux pour sinformer et (…)|
|https://www.devdurjouyenjosas.fr/|Retrouvez tous les acteurs et les projets de la ville de Jouy-en-Josas dans le domaine du développement durable .|
|http://paulineroulleau.fr|Rapports développement durable et intégrés, communications institutionnelles et contenus de marques sur les sujets de développement durable.|
|http://plusdevert.org|Plus de Vert, bureau détude en environnement, développement durable, énergies, aide les maîtres douvrages, architectes et urbanistes pour un monde plus vert.|
Les gars, il va falloir faire mieux que de scraper la balise description et keywords. Je pensais que vous faisiez une synthèse à partir d’éléments épars en utilisant un algo de NLP.