MA MÉTHODOLOGIE

PRINCIPALES SOURCES DE DONNÉES

FICHIERS

  • CSV
  • JSON
  • PARQUET
  • API

  • WEB
  • ERP
  • TSM
  • CRM
  • SGBD

  • MYSQL
  • POSTGRESQL
  • SAAP
  • EXTRACTIONS

    Identifications des métriques

  • Etude de chaque éléments des fichiers et de leurs relations.
  • Choix des tables et(ou) des fichiers sources.
  • Etude de chaque métrique et leur compréhension
  • Identifications des métriques significatives.
  • Contrôle de la qualité des données

  • Choix des métriques.
  • Cohérence des formats de chaque métrique.
  • EXPLORATORY DATA ANALYSIS

    Nettoyage des données

  • Gestion des valeurs manquantes.
  • Détection des valeurs aberrantes.
  • Gestion des valeurs nulles
  • Détection des doublons.
  • Analyse de corrélation.
  • Distribution des données.
  • choix des Indicateur clés (KPIs)

    CRÉATIONS DASHBOARD

    Bien choisir les graphiques permet de mettre les indicateurs clés en valeur de manière claire et pertinente.

    BARCHART

    Le barchart est un outil polyvalent pour comparer visuellement des catégories de données qualitatives, facilitant ainsi l’interprétation et la prise de décision. A ne pas confondre avec l'histogramme.

    Voici ses principales utilités :

  • Comparer des catégories
  • Identifier les tendances
  • Visualiser des relations temporelles
  • LINE-CHARTS

    Line chart (ou graphique en ligne) est utilisé pour représenter les variations d'une variable continue dans le temps ou par rapport à une autre variable continue.

    Il est particulièrement utile pour :

  • Suivre les tendances temporelles
  • Comparer plusieurs séries de données
  • Aider à visualiser les corrélations
  • HISTOGRAMME EMPILÉ

    Un histogramme empilé est idéal pour visualiser la composition et la contribution de sous-groupes dans la distribution d'une variable continue, apportant une vue détaillée et comparative pour des analyses segmentées.

    Voici ses principales utilités :

  • Analyser des distributions segmentées
  • Comparer les proportions entre sous-catégories
  • Observer les tendances globales et spécifiques
  • DIAGRAMME CIRCULAIRE

    Un diagramme circulaire est idéal pour visualiser la répartition proportionnelle de catégories au sein d’un tout, mais il est généralement limité à quelques catégories pour éviter des difficultés d’interprétation.

    Ses principales utilités sont :

  • Illustrer des parts de pourcentages
  • Aider à identifier les catégories dominantes ou minoritaires
  • Analyser des données statiques (répartition d'un total sans évolution temporelle).
  • ÉTUDE DES EAUX EN FRANCE (2023)

    DASHBOARD

    TOYS AND MODELS

    Analyse des ventes

    DASHBOARD

    Au Coeur du Marché du Vin

    CONTEXTE:

    Le Domaine des Croix, un producteur renommé de vins de qualité, envisage de conquérir le marché américain, un marché vaste et compétitif. Afin d'en assurer sa réussite, il est crucial de définir des prix attractifs pour leurs bouteilles de vin. Pour ce faire, nous avons recueilli et analysé un ensemble de données comprenant 130 000 bouteilles de vin, sur les prix moyens observés sur le marché américain. Grâce à elle nous pourrons déterminer une stratégie de tarification optimale pour le Domaine des Croix.

    OBJECTIF:

    L'objectif de cette analyse est de recommander un prix de vente pour les bouteilles de vin du Domaine des Croix sur le marché américain. Nous devons non seulement identifier des prix compétitifs, mais aussi veiller à ce que ceux-ci reflètent la qualité et le prestige des vins du Domaine. Le but est de fournir une recommandation claire et justifiée qui permettra au Domaine des Croix de réussir sa conquête du marché américain.

    ENJEUX:

    L'enjeu principal de cette démarche réside dans l'équilibre entre compétitivité et perception de la qualité. En effet, un prix trop bas pourrait dévaluer la perception du vin du Domaine des Croix, tandis qu'un prix trop élevé pourrait le rendre inaccessible aux consommateurs potentiels. Avec notre analyse pédagogique, nous viserons à rendre ces éléments compréhensibles pour le client, afin qu'il puisse apprécier et adhérer pleinement à la stratégie proposée.

    ANALYSE DES DONNÉES

    MÉTHODOLOGIE

    Nous avons commencé par explorer la base de données fourni par le client, nous en avons fait une EDA (Exploratory Data Analysis). Nous avons nettoyé celle ci en supprimant les doublons, remplacer les valeurs manquantes et ne garder que les colonnes qui vont nous servir. Nous avons ensuite connecté le csv a un outil de business intelligence pour créer le dashboard final

    OUTILS & LANGAGE

    Langage Python , DAX Bibliothèque pandas, seaborn Outil de visualisation POWER BI

    Fonction en Python permettant par exemple d’extraire les millésimes de la colonne 'titre' du Dataset: utilisation d’une expression régulière (regex) pour isoler la date

    Formule en DAX permet par exemple de calculer la moyenne des notes l’année précédente

    RECOMMANDATIONS

    Suite à l'analyse approfondie du marché américain du vin, pour le lancement du Pinot Noir 2016, noté 94 sur 100, Je conseille de se positionner sur le segment du haut de gamme, voire du très haut de gamme.
    Pourquoi ?
    Pinot Noir 2016 a reçu une note prestigieuse de 94/100, un indicateur fort de sa qualité exceptionnelle. Ce niveau de reconnaissance place naturellement votre produit dans la catégorie des vins haut de gamme.
    Le marché du très haut de gamme valorise l'exclusivité. En limitant la disponibilité de votre vin et en créant une image de rareté, vous pouvez justifier des prix plus élevés et attirer les collectionneurs et amateurs de vin sophistiqués

    DASHBOARD

    ÉTUDE DE MARCHÉ DE LA RESTAURATION ASIATIQUE

    Le restaurant Ptéah de Nantes souhaite obtenir une analyse détaillée de la répartition des ingrédients dans ses recettes, ainsi que le coût de chaque élément de sa recette. En complément, j'ai fourni une étude de marché exhaustive sur le secteur du fast food asiatique en France

    CARTOGRAPHIE RESTAURANTS ASIATIQUES

    Exploration des Services par Catégorie

    Répartition des Offres de Services

    COÛTS DES MATIÈRES PREMIÈRES ET DE L'ÉNERGIE

    Les prix des matières premières ont considérablement augmenté. Pour l’huile de friture (400%) ou pour l’huile d’olive (300%)...
    Cela met une pression énorme sur les restaurateurs qui doivent trouver des solutions pour maintenir leur rentabilité. De plus, l’inflation sur l’énergie pourrait impacter les coûts de structure en 2024, réduisant ainsi la rentabilité des établissements.
    Plus d’un restaurateur sur deux a décidé de revoir sa stratégie d’achat comme une priorité. Face à cette augmentation les restaurateurs ont dû ajuster légèrement leurs prix.
    Certains ont aussi fait preuve d’une belle réactivité en retirant de leur menu les produits dont les prix ont flambé. 66% ont fait le choix de proposer d’avantage de produits locaux, des options végétariennes pour 32 % d’entre eux, ou des plats à emporter pour 31 %.
    Les restaurants peuvent tirer parti de plusieurs tendances pour se développer, notamment en proposant des produits bio, attendus par 77 % des Français, et en adaptant leur offre aux végétariens et aux végétaliens, dont la population a augmenté de 8,4 % entre 2015 et 2020.

    ADAPTATION À LA DEMANDE :

    L’adaptation des restaurateurs aux nouvelles tendances de consommation, telles que les produits locaux (66 %), végétariens (32 %) et les options de vente à emporter (31 %), montre leur capacité à répondre aux attentes changeantes des clients. Cette flexibilité pourrait leur permettre de se démarquer sur un marché concurrentiel et de capter de nouvelles parts de marché.

    EXPANSION DE LA LIVRAISON ET DU CLICK AND COLLECT :

    La progression de 35% de ces services entre 2020 et 2021 témoigne d’une évolution des modes de consommation, en partie due au développement du télétravail. Les restaurateurs pourraient profiter de cette tendance pour diversifier leurs sources de revenus et toucher un public plus large, notamment en zone urbaine.

    IMDB Logo
    INSEE Logo
    CNC Logo
    IMDB Logo
    INSEE Logo
    CNC Logo
    IMDB Logo
    INSEE Logo
    CNC Logo

    LE CINÉMA DANS LA CREUSE :

    Système de recommandation

    Vivez la magie du 7ème art!

    Projet académique (Wild Code School)

    SUJET :

    Un cinéma en perte de vitesse situé dans la Creuse vous contacte. Il a décidé de passer le cap du digital en créant un site Internet taillé pour les locaux.il vous demande de créer un moteur de recommandations de films qui à terme, enverra des notifications aux clients via Internet.

    Films français :

    La part de marché des films français en 2022 était d’environ 40,9 %. Cela représente une légère augmentation par rapport à 2021 (40,6 %) et une hausse significative par rapport à la moyenne de 37,2 % entre 2017 et 2019.

    Films américains :

    Les films américains ont représenté environ 43 % du marché en 2022. Cette part est en baisse par rapport à 2018, où elle était d’environ 48 %.

    Description :

    La taille des bulles indique le nombre de films
    pour chaque pays. Les grosses bulles signifient
    une plus grande représentation ou une popularité plus
    élevée pour ce genre dans ce pays.

    Observations par genre

    DRAME

    Beaucoup de films produits dans ce genre. Les États-Unis (grande bulle bleue) dominent avec une note moyenne autour de 6. La France et le Royaume-Uni sont également bien représentés avec des tailles moyennes.

    COMEDIE

    Les films comiques américains ont une bulle relativement grande, avec une note moyenne de 6. La France est bien présente dans ce genre.

    SCIENCE-FICTION:

    Les films de science-fiction américains semblent dominer avec une grosse bulle, montrant une note moyenne autour de 6.

    HORREUR:

    Les films d'horreur ont une note assez basse, notamment ceux provenant des États-Unis et du Japon.

    DOCUMENTAIRE:

    Les films documentaires américains sont notés autour de 6 avec une bulle assez large.

    États-Unis (US) :

    Les États-Unis sont très présents dans presque tous
    les genres avec de grandes bulles,
    particulièrement en drama, documentaire, comédie, science-fiction, et horreur.
    Ils semblent avoir des notes moyennes légèrement plus élevées que la moyenne
    pour la plupart des genres.

    France (FR) :

    La France est bien représentée dans les genres drame, comédie, et romance,
    avec des notes proches de 6.

    Japon (JP) :

    Le Japon a des films particulièrement bien notés en animation et
    documentaire, avec une note moyenne autour de 6.
    Le pays est également présent dans le genre horreur,
    mais avec une note plus basse (autour de 5).

    Royaume-Uni (GB) :

    Le Royaume-Uni est assez présent dans des genres comme
    comédie, drame, et science-fiction, avec des
    notes proches de 6.

    Inde (IN) :

    L'Inde semble se concentrer sur les genres comme romance
    et drame, avec des notes moyennes entre 5 et 6.

    Conclusion

    Les États-Unis dominent en termes de volume de production
    ou de popularité dans plusieurs genres, notamment en drame,
    science-fiction, et documentaire.
    Les autres pays comme la France, le Japon et le Royaume-Uni
    se démarquent également dans certains genres spécifiques.
    Les genres drame, comédie, et science-fiction semblent recevoir
    les meilleures notes en général, tandis que les films d'horreur
    ont des notes plus basses.
    Cela montre les différences dans les préférences de production
    et la réception critique des films selon le pays et le genre.

    ANALYSE DES GENRES

    Dataset final contenant plus de 150 000 films

    L'analyse des données cinématographiques offre une perspective fascinante sur les préférences culturelles et les tendances mondiales en matière de divertissement. Dans cette étude, j'ai exploré une vaste collection de films à travers différents pays, en me concentrant particulièrement sur la répartition des genres cinématographiques.

    Le Genre Cinématographique Dominant :
    Découvrez le Leader Incontesté!

    Genres les plus populaires :
    Quels sont ceux qui rapportent le plus ?

    SYSTEME DE RECOMMANDATION

    Créez des systèmes de recommandations puissants ! développer en Python avec les bibliothèques incontournables : Scikit-Learn, Pandas et Streamlit.

    DASHBOARD

    ANALYSE DES VENTES

    Projet académique (Wild Code School)