créer une base de donnée de sujets marronniers

Bonjour tout le monde,
Je cherche à créer une BDD de sujets marronniers dans les sujets média (ce sont des sujets que les médias reprennent sur le meme calendrier, que ce soit Rolland Garros, la journée de la femme, la fête de la pomme a trifouilli les oies etc.)

Je ne pense pas que mettre des humains sur ce travail soit pertinent mais je ne sais pas comment procéder pour autant (machine learning?) et suis preneur de suggestions.

Merci!