Résumé
Jeune diplômé d'une école d'ingénieur, l'ENSAI (École nationale de la statistique et de l'analyse de l'information) en filière Génie Statistique & Data Science, Ranujan est Data Scientist au sein de la Banque Nationale des Données de maladies rares au sein de l'AP-HP.
Expériences professionnelles
Data scientist
AP-HP DSN-BNDMR , Paris
De Juillet 2024 à Aujourd'hui

Data scientist
Total Energies One Tech , Courbevoie - Stage
De Avril 2023 à Septembre 2023
Mission: Réaliser des prévisions probabilistes de l’irradiation solaire afin d’anticiper la production d’énergie solaire dans le cadre de la transition énergétique
Tâches:
-Collecte des données internes (données provenant des capteurs des stations photovoltaïque de TotalEnergies) et des données externes (simulations des valeurs d’irradiance réalisées à partir de modèle physique, dites Numerical Weather Prediction)
-Nettoyage des données (traitement des valeurs aberrantes, doublons, des valeurs manquantes, traitement des heures et données, concaténation des données internes et externes),Normalisation des données pour combler la saisonnalité de l’irradiance solaire
-Étude descriptive avec la corrélation entre les simulations des modèles physiques et la valeur réelle de l’irradiance
-Combinaisons des simulations à l’aide des modèles de régressions et géométriques (la valeur d’irradiance observée représente la variable cible (target) et les valeurs d’irradiance simulées représentent les variables explicatives (features)) pour trouver une simulation optimale en utilisant différentes métriques
-Recherche bibliographique sur les prévisions probabilistes et les modèles de machine learning associés
-Assister à des séminaires sur le thème de l’énergie renouvelable et de la Data Science
-Réalisation des prévisions probabilistes de l’irradiance sur une journée à l’aide du modèle Natural -Gradient Boosting (NGBoost) et évaluation des résultats
-Réunion hebdomadaire avec l’équipe Digital pour suivre la progression des projets (Méthode de Scrum)
Environnement fonctionnel : Méthode d’Agile (Scrum), Combinaison des prévisions, Régression linéaire, Prévision probabiliste, Data Visualisation, Statistiques descriptives, Machine Learning, Méthode d’optimisation, Régularisation (norme L1), métrique (MAE, RMSE, skill score, CRPS, NRMSE)
Environnement technique : Azure Databricks, R, Python
Statisticien stagiaire
AP-HP , Paris - Stage
De Juillet 2022 à Septembre 2022
Contexte: Étude de l’impact de la multicolinéarité sur le surajustement des données dans des problèmes de survie et automatisation des sorties SAS sous format Word
Tâches:
-Modélisation (Modèle de Cox, Régularisation : Lasso et Elastic-net) : 3 modèles, un sans la pénalité, un avec la pénalité Lasso et un dernier avec la pénalité Elastic-net
-Simuler des jeux de données en faisant varier des paramètres comme l’importance d’une certaine dans les données 5 fois (51 variables, 5000 observations) afin de créer de la multicolinéarité, sous R
-Importer des données et étude statistiques (corrélation), sous Python
-Évaluation des performances de chaque modèles avec la métrique C-index
-Automatisation des sorties SAS sous format Word en utilisant des MACRO initialement implémentés et en les améliorant
Environnement fonctionnel : Modèle de Cox, Régularisation, Statistique descriptive, Data visualisation
Environnement technique : Python, R, SAS, Google Colab
Statisticien stagiaire
INJEP INSTITUT NATIONAL DE LA JEUNESSE ET DE L'EDUCATION POPULAIRE , Paris cedex1 - Stage
De Juin 2021 à Juillet 2021
Contexte: Étude statistique sur l’enquête Trajectoire et Origine 2 - 2ème vague de discrimination sur les thématiques de la politique & sociale
Tâches:
-Réaliser des études statistiques sur les résultats d’un questionnaire avec des tris croisés (analyse univariés et bi-variés)
-Visualisation des résultats
-Partage des résultats avec le maître de stage
Environnement fonctionnel : Statistique descriptives, Data Visualisation
Environnement technique : R
Formations complémentaires
CPGE - filière scientifique
Lycée Jacques Decour - Maths, Physique
2017 à 2020
Cours suivis : Mathématiques, Physiques, Chimie, Français, Anglais, Informatique et Science d'ingénieur
Résultats des concours 2020 : CCINP - attribution : ENSAI-filière ingénieure
Baccalauréat Générale
Lycée Turgot - Scientifique
2014 à 2017
Section : Scientifique - SVT
Spécialité : Mathématiques
Option suivis : TaLenS
Associations
Parcours officiels
Langues
Anglais - Technique
Allemand - Notions
Tamoul - Notions
Français - Langue maternelle
Compétences
Centres d'intérêt
- Football
- manga