photo de profil d'un membre

Ranujan

CV-Ranujan

Paris (75010) France

Résumé

Jeune diplômé d'une école d'ingénieur, l'ENSAI (École nationale de la statistique et de l'analyse de l'information) en filière Génie Statistique & Data Science, Ranujan est Data Scientist au sein de la Banque Nationale des Données de maladies rares au sein de l'AP-HP.

Expériences professionnelles

Data scientist

AP-HP DSN-BNDMR , Paris

De Juillet 2024 à Aujourd'hui

Data scientist

Total Energies One Tech , Courbevoie - Stage

De Avril 2023 à Septembre 2023

Mission: Réaliser des prévisions probabilistes de l’irradiation solaire afin d’anticiper la production d’énergie solaire dans le cadre de la transition énergétique

Tâches:
-Collecte des données internes (données provenant des capteurs des stations photovoltaïque de TotalEnergies) et des données externes (simulations des valeurs d’irradiance réalisées à partir de modèle physique, dites Numerical Weather Prediction)
-Nettoyage des données (traitement des valeurs aberrantes, doublons, des valeurs manquantes, traitement des heures et données, concaténation des données internes et externes),Normalisation des données pour combler la saisonnalité de l’irradiance solaire
-Étude descriptive avec la corrélation entre les simulations des modèles physiques et la valeur réelle de l’irradiance
-Combinaisons des simulations à l’aide des modèles de régressions et géométriques (la valeur d’irradiance observée représente la variable cible (target) et les valeurs d’irradiance simulées représentent les variables explicatives (features)) pour trouver une simulation optimale en utilisant différentes métriques
-Recherche bibliographique sur les prévisions probabilistes et les modèles de machine learning associés
-Assister à des séminaires sur le thème de l’énergie renouvelable et de la Data Science
-Réalisation des prévisions probabilistes de l’irradiance sur une journée à l’aide du modèle Natural -Gradient Boosting (NGBoost) et évaluation des résultats
-Réunion hebdomadaire avec l’équipe Digital pour suivre la progression des projets (Méthode de Scrum)

Environnement fonctionnel : Méthode d’Agile (Scrum), Combinaison des prévisions, Régression linéaire, Prévision probabiliste, Data Visualisation, Statistiques descriptives, Machine Learning, Méthode d’optimisation, Régularisation (norme L1), métrique (MAE, RMSE, skill score, CRPS, NRMSE)

Environnement technique : Azure Databricks, R, Python

Statisticien stagiaire

AP-HP , Paris - Stage

De Juillet 2022 à Septembre 2022

Contexte: Étude de l’impact de la multicolinéarité sur le surajustement des données dans des problèmes de survie et automatisation des sorties SAS sous format Word

Tâches:
-Modélisation (Modèle de Cox, Régularisation : Lasso et Elastic-net) : 3 modèles, un sans la pénalité, un avec la pénalité Lasso et un dernier avec la pénalité Elastic-net
-Simuler des jeux de données en faisant varier des paramètres comme l’importance d’une certaine dans les données 5 fois (51 variables, 5000 observations) afin de créer de la multicolinéarité, sous R
-Importer des données et étude statistiques (corrélation), sous Python
-Évaluation des performances de chaque modèles avec la métrique C-index
-Automatisation des sorties SAS sous format Word en utilisant des MACRO initialement implémentés et en les améliorant

Environnement fonctionnel : Modèle de Cox, Régularisation, Statistique descriptive, Data visualisation

Environnement technique : Python, R, SAS, Google Colab

Statisticien stagiaire

INJEP INSTITUT NATIONAL DE LA JEUNESSE ET DE L'EDUCATION POPULAIRE , Paris cedex1 - Stage

De Juin 2021 à Juillet 2021

Contexte: Étude statistique sur l’enquête Trajectoire et Origine 2 - 2ème vague de discrimination sur les thématiques de la politique & sociale

Tâches:
-Réaliser des études statistiques sur les résultats d’un questionnaire avec des tris croisés (analyse univariés et bi-variés)
-Visualisation des résultats
-Partage des résultats avec le maître de stage

Environnement fonctionnel : Statistique descriptives, Data Visualisation

Environnement technique : R

Formations complémentaires

CPGE - filière scientifique

Lycée Jacques Decour - Maths, Physique

2017 à 2020

Cours suivis : Mathématiques, Physiques, Chimie, Français, Anglais, Informatique et Science d'ingénieur
Résultats des concours 2020 : CCINP - attribution : ENSAI-filière ingénieure

Baccalauréat Générale

Lycée Turgot - Scientifique

2014 à 2017

Section : Scientifique - SVT
Spécialité : Mathématiques
Option suivis : TaLenS

Associations

Association Forum ENSAI

http://forum-ensai.com/

Chargé de communication interne

Parcours officiels

ENSAI – Ingénieur – 2023 – Génie Statistique

Langues

Anglais - Technique

Allemand - Notions

Tamoul - Notions

Français - Langue maternelle

Compétences

Méthodes agiles
Organization Skills
Recherche et développement (R et D)
Azure DevOps
Azure Databricks
Solar irradiance
Photovoltaïque
Microsoft Teams
Statistiques Bayésienne
Time Series Analysis
Natural Language Processing (NLP)
Deep Learning
Chaîne de Markov
Plan d'expérience
Fiabilité
Filtrage
Microsoft PowerPoint
Apprentissage automatique
statistique descriptive
Statistiques multivariées
Modélisation logistique
Analyse de survie
Latex
Programmation SAS
Google Drive
Apprentissage non supervisé
Apprentissage supervisé
Cloud Computing
régression logistique
Régression linéaire
Communication
Travail d’équipe
Python (langage de programmation)
R
Microsoft Excel
R (Programming Language)
SQL

Centres d'intérêt

  • Football
  • manga