Dans le cadre de la formation Google Data Analytics (environ 180 heures on line) une étude de cas est demandée. Cette analyse porte sur des données publiques ce qui autorise le partage du travail sur les plateformes telles que GitHub, Kaggle, Tableau ou Google Sites.
J'ai choisi de m'intéresser à l'analyse des données de Cyclistic, une société qui propose des locations de vélos en libre-service au sein de Chicago. Les données disponibles concernent les locations effectuées entre le 01/09/2023 et 31/08/2024. L'objectif de l'étude de cas est de caractériser le comportement des usagers occasionnels ( Pass' au trajet ou à la journée) de celui des membres abonnés pour attirer davantage les détenteurs de Pass' vers la formule abonnement.
L'analyse complète est effectuée avec RStudio et Excel et sa rédaction ainsi que le code R réalisés en R Markdown sont disponibles au format docx en annexe.
Représentation de la fréquence horaire des locations
Dans le coin inférieur gauche, les boutons - et + permettent d'éclater la vue depuis le trimestre jusqu'au jour
Top 30 des fréquentations des stations de location de vélos à Chicago (du 01/09/23 au 31/08/24)
Vues séparées des abonnés vs utilisateurs occasionnels. Visualisation interactive réalisée avec Tableau Public.
Autres réalisations
En marge de ce travail j'ai réalisé un tutoriel pour apprendre à manipuler les données géographiques en Excel. La difficulté majeure est la non reconnaissance de certains noms de départements comme entité géographique.
L'objectif du travail consiste à attribuer plusieurs départements à des secteurs différents. Ces secteurs sont à leur tour identifiés comme données de type géographique. Travail réalisé avec Tableau Public. Les données correspondent aux surfaces des départements et l'agrégation de celles-ci à la surface des secteurs