Skip to main content
Publiez votre CV - Laissez les employeurs vous trouver

Emplois Sujet Thèse Deep Learning (75757 Paris)

Trier par : -
    • Applicants should be motivated to work at the interface between multi-fidelity modeling and scientific machine learning, including topics such as representation…
    • Recent developments in machine learning, particularly deep learning, have enabled the design of large-scale, robust foundation models [22] with strong…
    • Master's degree (or equivalent) in computer science (machine learning, artificial intelligence), or related fields - Strong background in computer science,…
    • Au sein de la Recherche Avancée et plus particulièrement du Département Digital d'Innovation et de Transformation, nous recherchons un(e) Doctorant(e) CIFRE -…
    • Vous maîtrisez les principaux outils du domaine (frameworks de deep learning, librairies spécialisées NLP, etc.).
  • Gagnez du temps

    Postulez avec un CV IndeedMettez à jour votre CV Indeed maintenant
    • OoD samples pose a challenge to DL models as they are not represented in the training data and can naturally arrive during deployment (i.e., a distribution…
    • Bonne maîtrise du paysage IA/ML : machine learning classique, deep learning, NLP, computer vision, GenAI/LLMs.
    • Entretien avec les équipes Talent Acquisition.
    • Une très bonne connaissance du machine learning (classique et deep learning) pour l’extraction de données et la recommandation avec idéalement une première…
    • Nous accompagnons nos clients dans l’optimisation de leurs performances grâce à des solutions IA avancées, en les aidant à tirer parti des dernières avancées en…
    • La plupart des architectures de deep learning sacrifient l'explicabilité pour la performance, ou inversement.
    • Les modèles obtenus sont plus précis, plus frugaux…
    • QOIA est un éditeur logiciels spécialisé dans la gestion des temps et des activités des ressources humaines.
    • Aujourd’hui, les générations Y et Z, représentent…

Job Post Details

'Scientific machine learning' multi-fidélité avec entrées hétérogènes // Multi-Fidelity Scientific Machine Learning with Heterogeneous Inputs - job post

Institut Polytechnique de Paris École polytechnique
Palaiseau (91)
Créez un compte Indeed avant de continuer sur le site web de l'entreprise.

Lieu

Palaiseau (91)

Description du poste

Réf ABG-137385
ADUM-73002 Sujet de Thèse
31/03/2026
Institut Polytechnique de Paris École polytechnique
Lieu de travail
Palaiseau Cedex - Ile-de-France - France
Intitulé du sujet
'Scientific machine learning' multi-fidélité avec entrées hétérogènes // Multi-Fidelity Scientific Machine Learning with Heterogeneous Inputs
Mots clés
multi-fidélité, Entrées hétérogènes, Scientific Machine Learning
Multi-Fidelity , Heterogeneous Inputs, Scientific Machine Learning
Description du sujet
De nombreux problèmes d'ingénierie et de sciences reposent sur des phénomènes physiques complexes, difficiles à reproduire expérimentalement, et pour lesquels les campagnes de mesure sont coûteuses. La simulation numérique est donc essentielle pour la prédiction, la conception et l'aide à la décision. Dans des applications multi-physiques, fortement couplées et paramétrées, une simulation haute fidélité du système complet est souvent trop coûteuse pour être répétée (optimisation, quantification d'incertitudes, calibration, contrôle). Un exemple illustratif est l'hémodynamique computationnelle : les simulations 3D instationnaires sur géométries artérielles patient-spécifiques nécessitent la résolution des équations de Navier–Stokes, couplées à l'élasticité des parois et à des conditions aux limites issues de données cliniques ; elles sont précises mais trop coûteuses pour des études paramétriques systématiques, d'où l'usage de modèles simplifiés (1D), réduits ou surrogats.

L'enjeu scientifique central est de combiner, de manière rigoureuse, l'information issue de modèles de fidélité différente pour obtenir la précision du modèle haute fidélité à coût réduit : c'est l'objectif des méthodes multi-fidélité. Toutefois, une limite importante reste insuffisamment traitée : la présence d'entrées et/ou de sorties hétérogènes entre modèles (paramétrisations différentes, discrétisations distinctes, variables d'état non partagées), qui empêche l'application directe des cadres multi-fidélité standards supposant un espace d'entrée commun et une correspondance point à point des sorties.

Cette thèse, financée par le projet MediTwin (jumeaux numériques patient-spécifiques en santé), vise à développer des méthodes multi-fidélité scalables capables de fusionner des modèles aux paramétrisations non concordantes et des structures de données hétérogènes. Le travail abordera : (i) la définition de représentations latentes communes reliant des espaces d'entrée hétérogènes ; (ii) la construction de surrogats multi-fidélité cohérents malgré ces hétérogénéités ; (iii) la quantification et la propagation des incertitudes dues au faible volume de données haute fidélité et aux erreurs d'alignement/embedding ; (iv) la conception de stratégies d'échantillonnage adaptatif (active learning) pour sélectionner efficacement les simulations haute fidélité. La méthodologie s'appuiera sur l'apprentissage de représentations (autoencodeurs/VAEs, Deep CCA), l'apprentissage d'opérateurs (DeepONet, Fourier Neural Operator), des approches probabilistes (co-krigeage en espace latent, modèles hybrides deep-probabilistes) et des techniques d'optimisation bayésienne pour le plan d'expériences.
-
-

Many engineering and scientific problems involve complex physical phenomena that are difficult—and sometimes impossible—to reproduce experimentally, while experimental campaigns are costly in time and resources. Numerical simulation is therefore essential for prediction, design, and decision support. In modern multi-physics applications with strong couplings across scales and high-dimensional parameterizations, a single high-fidelity simulation is often too expensive to be run repeatedly for optimization, uncertainty quantification (UQ), calibration, or control. A representative example is computational hemodynamics: fully resolved simulations of blood flow in patient-specific arterial geometries require solving the three-dimensional, time-dependent Navier–Stokes equations, often coupled with vessel wall elasticity and boundary conditions inferred from clinical data. Although highly informative, such simulations are computationally intensive, which limits their use in large parametric studies; hence the need for simplified or surrogate models (e.g., 1D network models, reduced-order models, or data-driven surrogates).

The key scientific challenge is to combine information from models of different fidelity levels in a principled way to approach high-fidelity accuracy at reduced computational cost—this is the goal of multi-fidelity modeling. However, a major limitation remains insufficiently addressed: heterogeneous inputs and outputs across fidelities. In many applications, low- and high-fidelity models do not share the same parameterization, discretization, or state variables, which prevents the direct use of standard multi-fidelity frameworks that assume a common input space and pointwise correspondence of outputs.

This PhD, funded through the MediTwin project (patient-specific digital twins for medical applications), aims to develop scalable multi-fidelity methods capable of merging information from models with mismatched parameterizations and heterogeneous data structures. The research will investigate (i) how to define common latent representations linking heterogeneous input spaces across fidelities; (ii) how to build multi-fidelity surrogates that remain consistent under such heterogeneities; (iii) how to quantify and propagate uncertainty induced by limited high-fidelity data and representation mismatch; and (iv) how to design adaptive sampling strategies (active learning) to select expensive high-fidelity evaluations so as to maximize information gain. Methodologically, the work will draw on representation learning (autoencoders/VAEs, CCA/Deep CCA), operator learning (DeepONet, Fourier Neural Operator), probabilistic multi-fidelity modeling (latent-space co-kriging, deep probabilistic surrogates), and Bayesian optimization for adaptive experimental design.
-
-

Début de la thèse : 01/10/2026
Nature du financement
Précisions sur le financement
Financement d'autres établissements publics à caractère industriel et commercial (ADEME, ADIT , ANDRA, Bpifrance, BRGM., CIRAD, CNES, Universcience, CSTB., IFPEN, IFREMER, INERIS, IRSN)*
Présentation établissement et labo d'accueil
Institut Polytechnique de Paris École polytechnique
Etablissement délivrant le doctorat
Institut Polytechnique de Paris École polytechnique
Ecole doctorale
574 Mathématiques Hadamard
Profil du candidat
Candidat inscrit (ou issu) d'un Master en ingénierie, mathématiques appliquées ou discipline proche. Spécialisation souhaitée en machine learning, quantification d'incertitudes, optimisation ou domaines connexes. Intérêt/compétences en modélisation numérique, surrogats, méthodes probabilistes, et/ou apprentissage d'opérateurs (DeepONet/FNO) constituent un atout.
Candidates should be enrolled in (or have completed) a Master's degree in engineering, applied mathematics, computational sciences, or a closely related discipline. A specialization and strong interest in machine learning, uncertainty quantification (UQ), optimization, or related fields is expected. Applicants should be motivated to work at the interface between multi-fidelity modeling and scientific machine learning, including topics such as representation learning (e.g., autoencoders/VAEs), cross-modal alignment, and operator learning (e.g., DeepONet, Fourier Neural Operator). Good programming skills (e.g., Python and standard scientific/ML libraries) and the ability to conduct independent research, analyze results critically, and communicate effectively in English are important assets.
Date limite de candidature
31/08/2026
Permettez aux employeurs de vous trouver.Téléchargez votre CV