Documenter sa pensée

Hello la team !

Peut-être une question un peu anodine : est-ce que vous avez trouvé un framework pour documenter votre façon de penser et tout ce que vous savez ?

De mon côté, je récupère absolument tout :

  • Scraping massif : Je scrape toute ma vie, mes conversations et tout ce que je publie sur internet.

  • Influences : Je récupère aussi tout le contenu que je regarde.

  • Architecture RAG : Je mets tout ça dans une base de données et je traite ça avec une IA en RAG.

Je fais évoluer la donnée en rediscutant avec le système pour intégrer mes réflexions et mes influences. Je trouve que ce n’est pas si mal, mais je suis chaud de savoir : qu’est-ce que vous faites de votre côté ?

Intéressant !
Et impressionnant !

Ça m’inspire plein de questions !!!
Ça représente quel volume pour le moment ? Ta base vectorielle doit être énorme !
Les vidéos tu les transcris puis tu vectorises la transcription ?
Est-ce qu’au bout d’un moment les idées ne sont pas trop diluées dans le reste ? Ou il y a un système de poids/priorisation ?
Tu gardes aussi le contenu brut pour refaire les embedding au cas ou ?
(première slave de questions :wink: )

Mon setup n’est pas encore parfait, mais l’idée est là. Je centralise mes données provenant de growthhacking.fr, de WhatsApp, ainsi que de mon serveur Discord de formation pour capturer ma manière d’expliquer les choses.

Côté YouTube, j’ai fait un tri sélectif : j’ai retenu 15 à 20 chaînes vraiment pertinentes (on oublie les vidéos de Michou, ça n’a rien à faire dans la data). J’y ajoute aussi mes « pensées directes » : je brainstorme à voix haute, j’enregistre le tout, puis je transcris avec Whisper avant de tout vectoriser. L’idée est que l’IA ne se contente pas de déduire des choses de mes conversations, mais qu’elle intègre directement ma réflexion brute.

Pour l’instant, les tests sont impressionnants, l’IA décèle des nuances très personnelles. Je discute avec elle comme sur ChatGPT ; quand elle fait une erreur, je la corrige, je re-vectorise et je mets à jour la base de données.

Mon défi actuel : transformer ça en un chatbot pour mes clients et élèves, tout en m’assurant qu’ils ne puissent pas « dumper » mes informations personnelles (emails, infos privées, etc.) qui se trouvent dans la base. »