Comment formater un résultat de requête via API ?

Bonjour ,

Je souhaite réaliser un suivi de donnée automatique avec une analyse une fois par jour . Actuellement avec Insomnia j’ai réussi a extraire le code via la requête de l’API.
Hélas je rencontre un formatage du texte qui ne me permet pas de l’exploiter en l’état.
Il y a des caractères gênants l’utilisation à savoir : , \n, \t
Y a t’il possibilité de supprimer les caractères inutiles ?

Voici un exemple :

"<div class=\"product-grid__card-container small-6 large-4\" data-gtm-container-type=\"ProductSmall\" data-gtm-container-name=\"Defcon vava\" data-queryid=\"\" data-indexname=\"\" data-objectid=\"\" data-position=\"\">\n\t\t<div class=\"product-grid__card product-card\">\n\t\t\t<div class=\"product-complementary product-complementary-right\">\n\t\t\t\t<span clas

Merci d’avance pour votre aide

Bonjour,

Tu peux supprimer ici avec le language REGEX.

Pas besoin d’apprendre, go sur Chatgpt demande lui de supprimer ces caractères avec le language REGEX. Ensuite, pour exécuter la commande regex python, Google sheet, C+, etc …

1 « J'aime »

voici une formule REGEX qui permet d’enlever les chaines de caractères « , \n » et « , \t » d’une chaine de caractères :

=REGEXREPLACE(A1, « ,[ \n\t] », «  »)

REGEXREPLACE(A1, « ,[ \n\t] », «  »)

`=REGEXREPLACE(A1, « ,[ \n\t] », «  »)

`

Merci pour ta réponse , je n’arrive pas a avoir des données viable pour cette extraction . L’API renvoi vers un code HTML moins pratique qu’un fichier JSON .
D’habitude j’utilise la requête indiqué XHR pour extraire le JSON qui me permet de trouver les données nécessaire , cette fois cela me renvoi vers une réponse de requête en HTML sous cette forme :


    "pagination": {
        "currentPage": "2",
        "numberOfPages": "599",
        "totalNumberOfResults": "7184",
        "searchResultsType": ""
    },
    "productListerHtml": "\u003Cdiv class=\"product-grid__card-container small-6 large-4\" data-gtm-container-type=\"ProductSmall\" data-gtm-container-name=\"Duramo 10\" data-queryid=\"\" data-indexname=\"\" data-objectid=\"\" data-position=\"\"\u003E\n\t\t\u003Cdiv class=\"product-grid__card product-card\"\u003E\n\t\t\t\

Mon but serait de récupérer le code HTML contenu après productlisterHTML , hélas le code html semble formater avec de nombreux caractères remplaçant les \ par exemple .
\u003E\n\t\t\u003C

C’est encodé en unicode pour ne pas « casser » le json.
Tu peux faire appel à une fonction (en fonction du langage utilisé, ou plein de « replace » dans une feuille de calcul) pour décoder le contenu de « productListerHtml » et ensuite parser le HTML obtenu.

Merci pour la réponse je vais essayer

bonjour, quel langage comptes-tu utiliser à terme pour réaliser ce suivi ? si c’est en python par exemple l’unicode est automatiquement interprété, ensuite il suffit d’extraire les données (regex) ou de parser le html avec une librairie python (requests_html, beautifull soup …)

Bonjour,

J’ai utilisé directement beautiful soup pour utiliser les données.