Bonjour,
Je bosse sur un petit outil perso en JS pour analyser automatiquement les listes d’ingrédients (INCI) de produits cosmétiques affichés sur différents sites.
L’idée serait de parser les compositions pour ensuite catégoriser les actifs (émollients, conservateurs, agents hydratants, etc.).
Certains ont déjà travaillé sur ce type d’extraction / nettoyage de données un peu “complexes” côté front ? Regex suffisent ou vous passez par un parsing plus structuré ?
Parser automatiquement les compositions INCI d’un site e-commerce ?
Parser automatiquement les compositions INCI d’un site e-commerce ?
Modifié en dernier par Rafaëlle le 02 mars 2026, 10:03, modifié 1 fois.
Re: Parser automatiquement les compositions INCI d’un site e-commerce ?
Bonjour,
Les regexp sont possibles mais la tendance est d'utiliser l'IA
Il y a ca par exemple qui a l'air d'être particulièrement performant :
https://github.com/ScrapeGraphAI/Scrapegraph-ai
Les regexp sont possibles mais la tendance est d'utiliser l'IA
Il y a ca par exemple qui a l'air d'être particulièrement performant :
https://github.com/ScrapeGraphAI/Scrapegraph-ai
TJS : 25 ans et mon livre Tout JavaScript chez Dunod
https://www.toutjavascript.com/livre/index.php
https://www.toutjavascript.com/livre/index.php
Re: Parser automatiquement les compositions INCI d’un site e-commerce ?
bonjour
pour parser il faudrait connaître le format des donné par exemple si les donné sont une chaîne de caractère et que chaque ingrédients est suivi d'une virgule on pourrait utiliser la méthode "split" de l'objet "string"
pour parser il faudrait connaître le format des donné par exemple si les donné sont une chaîne de caractère et que chaque ingrédients est suivi d'une virgule on pourrait utiliser la méthode "split" de l'objet "string"
