Ça, c’est énorme et c’est ce qui manque à GPT. Pour ça, que Google Bard peut tuer le game grâce à son gigantesque crawl quotidien. Et on comprend mieux le deal d’openai avec Microsoft. C’est pour pouvoir avoir accès au crawl de Bing.
Maintenant que le code est open source, la vraie différence viendra de celui qui apportera le plus de data à son IA.
Au final avec nos discussions sur le scraping, on était au cœur de l’avenir de l’IA sans le savoir
D’ailleurs je commence à me demander si Meta n’a pas utilisé Bright Data justement pour concevoir le dataset leaké en question :