Automatisation enrichissement activité d'entreprise avec l'IA

Bonjour,

J’essaye d’automatiser l’enrichissement en activité de quelques milliers d’entreprises (on veut un texte de 3 ou 4 lignes qui résume bien l’activité de l’entreprise). J’ai essayé l’API de GPT pour cela en utilisant GPT 3.5 Turbo et 4.1 Mini, mais je suis très déçu, il est souvent à coté de la plaque et se trompe d’activité. Alors que les mêmes requêtes fonctionnent très bien quand je les passe sur les prompts normaux via l’interface Copilot (qui utilise GPT). Puis je trouver une solution à cela ? Faut-il que j’essaye plutôt avec Claude AI d’Anthropic ? Merci de vos tuyaux.

1 « J'aime »

bonjour @jean4, qu’est ce que tu entends par l’enrichissement en “activité” d’une entreprise ?

est-ce que tu parles de l’identification de l’activité professionnelle réelle qu’elle exerce (plombier, charcutier, organisme de formation, etc) ?

de la rédaction d’un texte décrivant l’activité de cette entreprise sur la base de quelques mots clefs ?

Si ton use case tourne autour de la rédaction d’un texte descriptif sur une entreprise, nous avons utilisé GPT 3.5 puis GPT 4o sur un use case similaire, pour rédiger des courts textes de 600-700 caractères, et cela fonctionne très bien.

Toute la difficulté étant de bien rédiger ton prompt :wink:

Pour des infos au plus près de ce que communique l’entreprise, une alternative serait peut être d’utiliser un “moteur de trouve” type perplexity, deepseek en bash nocturne si t’es short en budget. C’est la qualité du jeton de recherche d’info web préalable, masqué ou non par le service, qui va faire la différence.

Bonjour Wyatt, merci de ta réponse. Il s’agit d’un texte descriptif sur une entreprise, et dans l’idéal avec les spécificités et points forts de l’entreprise. En se basant en priorité sur le site web de l’entreprise en question pour trouver les sources, mais si il n’y a pas de site web, l’IA a le droit de se débrouiller pour chercher ailleurs. Peux tu m’aider sur la rédaction du prompt ou m’indiquer grosso modo ton mode opératoire ? J’ai demandé à GPT5 de m’aider à rédiger la requête, j’ai fait ce qu’il a dit mais ça n’a pas amélioré les résultats

Merci ljvd. Puis je améliorer la qualité du jeton de recherche de GPT ? je n’y connais pas grand chose

Claygent assez simple si tu ne veux pas te prendre la tête
Tu peux mettre ta propre clé API test tes résultats en fonction des prompts et des versions de GPT

Je ne sais pas

T’as changé d’avis sur Clay Louis ?

Avec l’API de Perplexity ou même via GPT, tu peux largement faire le taf. Tu fais ça avec un petit Apps Script :wink:

Tu peux utiliser N8N, avec un agent IA et Tavily (ça permet de rechercher et scraper en même temps)
ça donne un résultat assez correct et tu peux avoir les infos direct en base de donnée.

Avec le nom et le type d’activité le résultat est correcte.

Merci Test 7845, mais j’ai un script qui lance les enrichissements. J’ai finalement de bons résultats avec Perplexity. Je ne le savais pas mais les API de GPT5 et Claude AI ne font pas des recherches web en temps réel, sauf si on prend des plugins et / ou un compte pro, alors que l’API de perplexity le permet. (Mistral aussi apparemment)

2 « J'aime »

Non juste en orchestration c’est pratique sans utilisé un seul crédit avec ses propres API
Les point négatif sont toujours les mêmes (les fausses promesses, le find people, le prix, la bdd…)
On est sur un projet d’un clay maison sur baserow avec EraB2B