Page 1 sur 1

Parser automatiquement les compositions INCI d’un site e-commerce ?

Posté : 17 févr. 2026, 12:20
par Rafaëlle
Bonjour,

Je bosse sur un petit outil perso en JS pour analyser automatiquement les listes d’ingrédients (INCI) de produits cosmétiques affichés sur différents sites.

L’idée serait de parser les compositions pour ensuite catégoriser les actifs (émollients, conservateurs, agents hydratants, etc.).

Certains ont déjà travaillé sur ce type d’extraction / nettoyage de données un peu “complexes” côté front ? Regex suffisent ou vous passez par un parsing plus structuré ?

Re: Parser automatiquement les compositions INCI d’un site e-commerce ?

Posté : 17 févr. 2026, 12:53
par webmaster
Bonjour,

Les regexp sont possibles mais la tendance est d'utiliser l'IA

Il y a ca par exemple qui a l'air d'être particulièrement performant :
https://github.com/ScrapeGraphAI/Scrapegraph-ai

Re: Parser automatiquement les compositions INCI d’un site e-commerce ?

Posté : 02 mars 2026, 00:41
par melomane
bonjour

pour parser il faudrait connaître le format des donné par exemple si les donné sont une chaîne de caractère et que chaque ingrédients est suivi d'une virgule on pourrait utiliser la méthode "split" de l'objet "string"