Parser automatiquement les compositions INCI d’un site e-commerce ?

Pour toutes les discussions javascript, jQuery et autres frameworks
Répondre
Rafaëlle
Messages : 10
Enregistré le : 18 oct. 2024, 13:50

Parser automatiquement les compositions INCI d’un site e-commerce ?

Message par Rafaëlle » 17 févr. 2026, 12:20

Bonjour,

Je bosse sur un petit outil perso en JS pour analyser automatiquement les listes d’ingrédients (INCI) de produits cosmétiques affichés sur différents sites.

L’idée serait de parser les compositions pour ensuite catégoriser les actifs (émollients, conservateurs, agents hydratants, etc.).

Certains ont déjà travaillé sur ce type d’extraction / nettoyage de données un peu “complexes” côté front ? Regex suffisent ou vous passez par un parsing plus structuré ?
Modifié en dernier par Rafaëlle le 02 mars 2026, 10:03, modifié 1 fois.

Avatar du membre
webmaster
Administrateur du site
Messages : 648
Enregistré le : 28 févr. 2017, 15:19

Re: Parser automatiquement les compositions INCI d’un site e-commerce ?

Message par webmaster » 17 févr. 2026, 12:53

Bonjour,

Les regexp sont possibles mais la tendance est d'utiliser l'IA

Il y a ca par exemple qui a l'air d'être particulièrement performant :
https://github.com/ScrapeGraphAI/Scrapegraph-ai
TJS : 25 ans et mon livre Tout JavaScript chez Dunod
https://www.toutjavascript.com/livre/index.php

melomane
Messages : 3
Enregistré le : 02 mars 2026, 00:09

Re: Parser automatiquement les compositions INCI d’un site e-commerce ?

Message par melomane » 02 mars 2026, 00:41

bonjour

pour parser il faudrait connaître le format des donné par exemple si les donné sont une chaîne de caractère et que chaque ingrédients est suivi d'une virgule on pourrait utiliser la méthode "split" de l'objet "string"

Répondre