
PO & Platform Engineer – GenAI & GPU Platform (X/H/F)
- Hybrid
- Guyancourt , Île-de-France, France
- €55,000 - €75,000 per year
- Saint-Quentin en Yvelines
Job description
Localisation : Saint-Quentin-en-Yvelines
Télétravail : 2 jours par semaine
Rémunération : 55 000 € – 75 000 €
Client : Grand acteur du secteur bancaire
À propos du poste
Nous recherchons un Product Owner AI pour rejoindre un programme stratégique de construction et d’exploitation d’une plateforme d’intelligence artificielle à grande échelle.
Vous évoluerez au cœur d’une plateforme critique combinant :
infrastructures GPU as a Service
environnements cloud AWS / GCP
systèmes on-premise
workloads IA, IA générative et MLOps en production
Ce poste se situe à l’intersection du product management, du DevSecOps et de l’ingénierie plateforme, dans un environnement technique complexe et exigeant.
Votre mission
Vous êtes responsable de la conception, du pilotage et de l’évolution d’une plateforme IA stratégique supportant des cas d’usage de production en intelligence artificielle et GenAI.
Votre objectif est de garantir une plateforme :
robuste
scalable
sécurisée
industrialisée pour des workloads IA critiques
Vos responsabilités
Pilotage produit & roadmap plateforme
Définir et piloter la roadmap de la plateforme IA et des services GenAI
Recueillir et structurer les besoins métiers et techniques
Prioriser et gérer le backlog (Jira)
Construire et faire évoluer des offres de services IA internes (GPU, MLOps, GenAI)
2. Plateforme IA & architecture
Concevoir et faire évoluer une plateforme IA hybride (on-premise, AWS, GCP)
Déployer et opérer une offre GPU as a Service
Contribuer à l’intégration et l’exploitation de plateformes MLOps (Dataiku)
Garantir la performance, la scalabilité et la résilience des services
3. DevSecOps & exploitation (MCO / MCS)
Assurer le maintien en condition opérationnelle et de sécurité des plateformes
Automatiser les infrastructures et déploiements (Kubernetes, Docker, Ansible)
Superviser les workloads IA et GPU en production
Appliquer les standards de sécurité (IAM, durcissement, Vault)
4. IA générative & industrialisation MLOps
Industrialiser des cas d’usage IA générative (LLMs, RAG, agents, etc.)
Travailler avec des outils tels que Hugging Face et vLLM
Accompagner les data scientists dans la mise en production des modèles
Optimiser l’utilisation des ressources GPU (CUDA, Run:AI)
5. Coordination & pilotage transverse
Assurer l’interface entre équipes infrastructure, data science et métiers
Coordonner les dépendances avec les autres projets de la plateforme
Suivre les livrables, risques et arbitrages techniques
Porter une vision cohérente entre produit et architecture
Environnement technique
Python, Linux, Kubernetes, Docker, OpenShift, Ansible, Terraform, AWS (S3), GCP, Dataiku, Hugging Face, vLLM, CUDA, Run:AI, Vault, GitLab CI, Jenkins, Jira.
Profil recherché
8 ans d’expérience minimum en ingénierie plateforme, DevSecOps, MLOps ou architecture cloud
Expérience confirmée sur des environnements cloud et hybrides (AWS, GCP, on-premise)
Forte maîtrise des architectures conteneurisées (Kubernetes, Docker, OpenShift)
Expérience dans la conception et l’exploitation de plateformes IA ou MLOps
Bonne connaissance des environnements GPU et du déploiement de modèles IA (LLMs, CUDA)
Maîtrise des outils CI/CD et d’automatisation (GitLab CI, Jenkins, Ansible)
Bonne culture sécurité (IAM, durcissement, conformité)
Expérience en rôle de Product Owner technique, Tech Lead ou Platform Lead
Capacité à évoluer dans des environnements complexes et multi-interlocuteurs
Anglais professionnel (utilisation opérationnelle, non courant exigé)
Qui sommes-nous ?
Orness est une ESN à taille humaine (200 consultants), spécialisée dans les infrastructures, les réseaux et l’ingénierie des systèmes.
Depuis plus de 20 ans, nous accompagnons les grands acteurs des secteurs de la finance et de l’énergie sur des projets critiques où la fiabilité, la performance et la sécurité sont essentielles.
Processus de recrutement
Nous privilégions un processus simple, transparent et rapide :
Premier échange court avec l’équipe RH (5 à 10 minutes)
Entretien RH approfondi (environ 1 heure)
Entretien technique (environ 1 heure)
Rencontre avec le client (30 minutes à 1 heure)
or
All done!
Your application has been successfully submitted!
You've already applied for this job
We appreciate your interest in this position. Unfortunately, you have already applied for this job.
