Initialisation du portfolio...

À propos de moi

Je suis un Data Scientist passionné et rigoureux, spécialisé dans l'apprentissage automatique et la biologie computationnelle. Mon travail se concentre sur l'application de techniques de pointe comme le transport optimal pour analyser des données complexes et à grande échelle. Je suis motivé par la découverte de solutions élégantes qui transforment des problèmes complexes en insights actionnables, avec une approche à la fois technique et pédagogique.

🎯 Expertise Technique

Maîtrise approfondie des algorithmes ML, du Deep Learning, et des techniques d'optimisation avancées. Spécialisation unique en transport optimal et applications bioinformatiques.

📊 Impact Concret

Publications dans Nature Communications, Bioinformatics, ICML. Développement d'outils open-source utilisés par la communauté scientifique internationale.

🎓 Vision Pédagogique

Passion pour la transmission de connaissances complexes. Création de visualisations éducatives et organisation de workshops techniques pour démocratiser l'IA.

Démonstrations ML Interactives

Eco2Mix Energy Forecast Demo

20°C
12:00
Predicted Demand -
Confidence -
Anomaly Score -

3D Neural Network Visualization

Visualisations de Données Avancées

Skills Radar Chart

Project Timeline

Technology Network

GitHub Contributions

🚀 Portfolio de Projets Organisés

Explorez mes projets organisés par domaine d'expertise pour une navigation optimisée

Machine Learning

Algorithmes ML, transport optimal, et optimisation avancée avec des applications en biologie computationnelle

🏆 4 publications internationales 📊 3 repos open-source actifs 🔬 Transport Optimal spécialisé
• Méthodes Wasserstein • Single-cell analysis • Fused Gromov-Wasserstein
Explorer les projets ML

Statistiques

Analyses statistiques rigoureuses, tests d'hypothèses, et modélisation bayésienne avec focus A/B testing

📈 Dashboard A/B Testing (priorité) 🔬 Inférence bayésienne 📊 Reproductibilité scientifique
• Streamlit • scipy.stats • Modélisation hiérarchique • Méta-analyses
Explorer les analyses

Deep Learning

Réseaux de neurones avancés, architectures innovantes et applications médicales avec explainability

🏥 Classification images médicales 🎨 GANs créatives et pratiques 🔍 Techniques d'explainability
• PyTorch • MONAI • GradCAM • LIME • Ethical AI
Explorer les réseaux

Data Visualization

Dashboards interactifs, storytelling de données et visualisations 3D immersives

🏆 2 awards dataviz internationaux 🎨 Expert D3.js et WebGL 📊 Dashboard médical prioritaire
• Observable • Three.js • React • Temps réel • UX/UI design
Explorer les visualisations

Coding Interviews

Algorithmes optimisés, structures de données avancées et préparation technique complète

⚡ 650+ problèmes LeetCode résolus 🥇 Contests top 15% mondial 🏆 Plateforme competitive programming
• Python/Java/C++ • FastAPI • PostgreSQL • Évaluation automatique
Explorer les algorithmes

🎯 Roadmap de Développement Prioritaire

Projets à fort impact basés sur l'analyse des besoins du marché et mes expertises uniques

Phase 1

Priorité Immédiate

6 semaines

📊 Dashboard A/B Testing Professionnel

Impact Très Haut

Interface complète pour non-techniciens avec calculs de puissance statistique automatisés

Streamlit • scipy.stats • plotly • SQLite 3 semaines

📈 Time Series Forecasting Dashboard

Impact Haut

Prédictions énergétiques avec modèles LSTM et interfaces temps réel

TensorFlow • FastAPI • React • WebSockets 2 semaines
Phase 2

Moyen Terme

8 semaines

🤖 Système de Recommandation E-commerce

Impact Très Haut

Algorithmes hybrides collaborative/content-based avec MLOps intégré

PyTorch • MLflow • Docker • Kubernetes 4 semaines

🎨 ML Algorithm Visualizer

Impact Pédagogique

Plateforme éducative 3D pour comprendre les algorithmes ML

Three.js • D3.js • Observable • WebGL 3 semaines
Phase 3

Long Terme

10 semaines

🏥 Classification Images Médicales + Explainability

Impact Innovation

Interface diagnostic assisté avec techniques d'explainability et Ethical AI

PyTorch • MONAI • GradCAM • LIME • Streamlit 5 semaines

🚀 AutoML Platform Déployable

Impact Entreprise

Pipeline automatisé complet de la donnée au modèle déployé

AutoML • H2O.ai • Kubeflow • Terraform 4 semaines
24 Semaines totales
6 Projets prioritaires
40% Impact recruteur
15+ Technologies modernes

🌟 Soft Skills & Approche Pédagogique

🎓

Pédagogie & Formation

  • Documentation claire et accessible
  • Workshops techniques organisés
  • Mentoring de juniors developers
  • Vulgarisation de concepts complexes
🔬

Rigueur Scientifique

  • Méthodologie reproductible
  • Validation croisée systématique
  • Analyse critique des résultats
  • Publications peer-reviewed
💡

Innovation & Créativité

  • Solutions créatives aux problèmes complexes
  • Veille technologique continue
  • Contributions open source
  • Expérimentation de nouvelles approches
🤝

Communication & Collaboration

  • Présentation de résultats techniques
  • Travail en équipe multidisciplinaire
  • Gestion de projets complexes
  • Leadership technique

Publications et Projets Scientifiques

Apprentissage de paysages de destinées cellulaires à partir de transcriptomique spatiale à l'aide de Fused Gromov-Wasserstein

bioRxiv, 2024

Travail de recherche se concentrant sur le transport optimal pour la biologie computationnelle.

Lire l'article Code

Intégration de données multi-omiques à l'aide de Mowgli

Nature Communications, 2023

J'ai mis en place des modèles pour l'apprentissage à partir de différentes modalités multi-omiques unicellulaires.

Lire l'article Code

Apprentissage non supervisé de métrique spatiale avec les vecteurs singuliers de Wasserstein

International Conference on Machine Learning (ICML), 2022

J'ai proposé une méthode d'apprentissage non supervisée de métrique spatiale.

Lire l'article Code

Le transport optimal améliore l'inférence de la similarité cellule-cellule

Bioinformatics, 2022

J'ai proposé une nouvelle méthode d'analyse des données d'omiques monocellulaires utilisant des distances de transport optimal.

Lire l'article Code

Compétences

Machine Learning
Python
Mathématiques
Biologie Computationnelle
Développement Logiciel
Rédaction Scientifique

Éducation

PhD en biologie computationnelle

Institut Pasteur & ENS PSL | 2020-2024

M2 Data Science

Institut Polytechnique de Paris | 2019-2020

Diplôme d'ingénieur

Télécom Paris | 2017-2020

MPSI-MP*

Classe préparatoire Masséna, Nice | 2015-2017