Trouver des wordpress français avec des caractère chinois.

Salut à tous,

Un certain nombre de wordpress se font pirater dans le seul but d’indexer des pages sur google.
Les pirates sont souvent des chinois ou des russes et les nouvelles pages indexés présentent des caractères dans ces langues.
En faisant une recherche google insite: on peut voir que les metas ne sont pas dans notre alphabet.
Pour un client qui travaille en sécurité je dois trouver le plus possible de wordpress piratés. L’idée est de scraper Google.
Connaissez-vous des outils ou des recherches google spécifiques pour trouver tous les wordpress français qui présentent des caractères russes ou chinois ?
(ça peut être en cherchant dans les sitemaps)

Merci à vous !

Hello @JosephCt

Je te conseille :

  1. d’utiliser des opérateurs booléens pour faire tes recherches directement dans le moteur de recherche, ex en image dessous, et d’utiliser des mots clés en russe, chinois ou anglais

  2. D’éviter d’utiliser Google, car Google supprime ce genre de résultats de son index, pas trés quali et pose des problèmes de sécu pour les utilisateurs, ça se comprend. Et si tu spammes Google avec ce genre de requêtes il va te bloquer sans proxy. Utilise un moteur comme Tor plutôt.

  3. Repérer des pattern et des mots clés, au fil de tes recherches tu en trouveras assez facilement



    Cadeau…

1 « J'aime »

Hello,

Wappalyzer puis lead list puis dans techno tu mets wordpress puis IP en France et en langue chinois.

Je pense que c’est plus simple que de faire des recherches à la main sur Google

2 « J'aime »

Vraiment top ! Merci. Quand tu dis d’utiliser Tor c’est à dire utiliser google via Tor ?

Merci, c’est le site que je cherchais depuis longtemps ! Par contre ça n’a pas l’air de fonctionner pour trouver des sites piratés par des chinois. Mais Wappalyzer je m’en souviendrais c’est génial !