⬅️ Retour à l'accueil
🌟 Projet 4 : A/B Testing & Statistiques sur les données d’Olist
🧩 Contexte et objectifs
Ce projet d’une journée avait pour objectif d’explorer un sous-ensemble du dataset public Olist (Brésil) afin de formuler des hypothèses business, d’extraire des insights descriptifs et de tester des hypothèses à l’aide de méthodes statistiques et d’A/B testing. L’approche reposait sur une analyse en Python (pandas, numpy, plotly express) et incluait une restitution orale des résultats.
📊 Données utilisées
- Données Olist (version réduite : commandes, clients, produits, paiements, évaluations)
- Données traitées dans un DataFrame après exploration et nettoyage
🔍 Méthodologie
- Exploration & nettoyage : types de données, valeurs manquantes, doublons
- Statistiques descriptives :
- Prix moyen/écart-type/boîtes à moustaches (commande)
- Répartition par catégorie produit, mode de paiement, satisfaction client
- Analyse des délais de livraison (moyenne, médiane, écart-type)
- Corrélations exploratoires :
- Prix vs satisfaction
- Délai de livraison vs satisfaction
- Catégorie produit vs note
- A/B Testing (exemples) :
- Livraison à temps vs satisfaction moyenne (t-test)
- Méthode de paiement vs taux de complétion commande (chi²)
- Catégories produit vs valeur commande (ANOVA)
📈 Résultats
- Les délais de livraison ont un impact significatif sur la satisfaction client (p-value < 0.05)
- Certaines catégories produit influencent la note moyenne donnée par les clients
- Aucune différence significative détectée entre les méthodes de paiement sur le taux de commande finalisée
📌 Outils
Python (pandas, numpy, plotly, scipy.stats), Jupyter
🗣️ Présentation
Slides synthétiques avec visualisations + explication des tests
Accéder au notebook sur Google Colab