Responsabilités
- Collecter et intégrer des données issues de diverses sources, y compris publiques, privées ou extraites par scrapping, afin de produire des données structurées, propres et exploitables.
- Garantir le bon fonctionnement continu des flux de données actuellement en production.
- Surveiller quotidiennement les pipelines de traitement des données.
- Identifier rapidement les erreurs, anomalies, interruptions ou modifications de format dans les flux.
- Mettre en place des systèmes d'alerte et des contrôles pour assurer la qualité des données.
- Contribuer à l'élaboration d’un système robuste de fiabilité des données.
- Participer à l'évolution progressive de l'architecture data.
- Optimiser les performances des pipelines existants.
- Améliorer la structure et l'efficacité des bases de données.
- Réduire les coûts liés à l'infrastructure data.
- Instaurer des pratiques rigoureuses en matière de gestion de versions, de tests, de suivi et de documentation.
- Industrialiser les processus de traitement de données pour accompagner l’expansion en France et en Europe.
Mode de travail
Hybride — Paris
Autres
- Prise en charge totale des frais de transport.
- Modalité de travail hybride à Paris.
- Locaux situés à Station F, au sein de l’incubateur TotalEnergies On.
- Accès direct aux fondateurs et implication dans les décisions produit.