webarchive

Bonjour

Je cherche à aspirer les articles de blog expiré. Avez-vous une astuce simple pour le faire ?

les caches de moteurs de recherche éventuellement ? (avec une recherche spécifique -site pour cibler les articles du site en question)

Je voulais dire automatiser avec les webarchive.

Je l’avais fait avec des simple GET et ensuite un spinning / traduction et enfin publier sur WP avec WP-cli

Néanmoins:

Webarchive est super capricieux: il génère beaucoup d’erreurs en accès

il faut bien entendu mettre à jour les liens internes, ainsi que les ressources (images)

Il fallait indiquer la date à utiliser dans webarchive

Le résultat était très moyen: cela faisait très contenu généré automatiquement. (pages/menu/template/formulaire contact…)
J’était arrivé à un résultat où un blog entier était crée de manière totalement autonome juste avec 1 seule ligne de commande de style

/createWPBlog.sh nouveauNomDeDomaine webarchiveURL

Google détectait je pense l’auto génération à cause de la traduction approximative. Peut être qu’il y avait un content rating humain qui pénalisait ce blog auto généré.

Il existe un certain nombre de services comme https://archivarix.com/ mais … bof…

1 « J'aime »

Ok merci de votre retour