Salut à tous,
Je bosse depuis quelques mois sur un projet perso qui m'éclate pas mal : une app web qui analyse les données de matchs de tennis (stats ATP, surfaces, historique des confrontations) pour essayer de modéliser les performances des joueurs.
Côté stack, j'utilise Node.js pour le backend avec une API qui va chercher les données sur des sources ouvertes, et React en front pour la visualisation. Le plus intéressant c'est la partie algo : j'ai commencé avec une régression logistique basique, puis je suis passé sur du XGBoost via TensorFlow.js pour capturer les patterns plus complexes (fatigue, adaptation surface, forme récente sur les 10 derniers matchs).
Le truc qui m'a surpris c'est à quel point les features liées au service (% premières balles, points gagnés derrière le 2e service) sont discriminantes par rapport au reste. Beaucoup plus que le classement ATP brut en tout cas.
Si ça intéresse quelqu'un, j'ai trouvé un algorithme pronostic tennis assez bien foutu qui m'a donné pas mal d'idées pour structurer mon propre modèle. C'est orienté data science appliquée au sport, ça change des tutos classiques.
Est-ce que d'autres ici ont déjà bossé sur du machine learning appliqué à des données sportives ? Je cherche surtout des retours sur la feature engineering et le choix des modèles pour ce type de données séquentielles.
Merci !
