FAIRomics – Bourse de doctorat en mathématiques appliquées – Transport optimal pour améliorer l’intégration des bases de données

Organisation/Entreprise
Université Toulouse III – Paul Sabatier
Domaine de recherche
Sciences Biologiques
L’informatique
Mathématiques » Mathématiques appliquées
La physique
Profil de chercheur
Chercheur de première étape (R1)
Pays
France
Date limite d’inscription
Type de contrat
Temporaire
Statut du travail
À temps plein
Date de début de l’offre
Le poste est-il financé par le programme-cadre de recherche de l’UE ?
HE/MSCA
Numéro de réference
DC12
Numéro de convention de subvention Marie Curie
101120449
L’emploi est-il lié au poste du personnel au sein d’une infrastructure de recherche ?
Non

Description de l’offre

« FAIRification des données multiOmics pour relier des bases de données et créer des graphes de connaissances pour les aliments fermentés » Réseau doctoral MSCA-DN-JD.

L’initiative FAIROmics, un programme de recherche interdisciplinaire, rassemblera des universités, des centres de recherche et des entreprises privées pour permettre la FAIRification de l’interopérabilité des données et des bases de données omiques et développer des graphiques de connaissances pour une prise de décision basée sur les données afin de concevoir rationnellement des communautés microbiennes pour conférer les caractéristiques souhaitables aux plantes. à base d’aliments fermentés dans le contexte de la science ouverte et de sa réglementation. Le programme de formation FAIROmics vise à développer les compétences des doctorants à l’interface entre l’intelligence artificielle, les sciences de la vie, les sciences humaines et sociales.     

Les alternatives végétales aux produits laitiers et à la viande ont gagné en popularité ces dernières années pour diverses raisons, notamment la durabilité et les bienfaits pour la santé, ainsi que les tendances de style de vie et les restrictions alimentaires. Cependant, les produits alimentaires à base de plantes peuvent être déséquilibrés sur le plan nutritionnel et leurs profils aromatiques peuvent limiter leur acceptation par les consommateurs. Les micro-organismes sont utilisés dans la fabrication de produits alimentaires depuis des millénaires. Cependant, la diversité des communautés microbiennes à l’origine des fermentations végétales, ainsi que leurs principales caractéristiques génétiques et phénotypiques ainsi que les synergies potentielles entre les membres de la communauté, restent mal caractérisées. De nombreuses données existent, mais elles sont réparties dans différentes littératures (scientifiques et grises) ou, dans le meilleur des cas, dans différentes bases de données. Cependant, elles ne sont pas toujours réutilisables car difficiles à trouver et à accéder et parce que les bases de données ne sont pas systématiquement interopérables.

A noter que ce poste de doctorat donnera lieu à l’obtention d’un  double diplôme  après la réalisation d’un séjour dans chacun de ces organismes : L’ Université de Toulouse III – Paul Sabatier (UT3), France et l’ Université de Bologne (UNIBO), Italie .

Nous recherchons un doctorant (DC) pour rejoindre notre projet sur plusieurs sites dans l’UE avec une maîtrise dans une discipline pertinente (mathématiques appliquées, statistiques, physique, biostatistique, bioinformatique ou informatique) intéressée par les applications biologiques.

Objectifs:

  • Améliorer l’interopérabilité des bases de données.
  • Contribuer au développement de méthodes basées sur le transport optimal.
  • Appliquer les développements à l’intégration de bases de données.
  • Caractérisez, testez et validez le processus de fusion de bases de données avec des approches de génération de données synthétiques.

Résultats attendus:

Les résultats attendus sont, dans un premier temps, une comparaison approfondie entre le transport optimal et d’autres approches habituellement utilisées pour l’intégration de bases de données. Cette comparaison sera principalement orientée vers des applications pratiques, mais des travaux théoriques restent à réaliser et pourraient également être abordés dans ce projet (en fonction du candidat qui sera sélectionné). Un autre résultat attendu est l’extension des outils déjà disponibles dans le package R OTrecod pour résoudre davantage de problèmes d’intégration de bases de données et d’imputation de données manquantes.

Localisation et détachements prévus :

Le doctorant sera principalement basé à l’UNI3 à Toulouse, France pendant 22 mois . Deux détachements sont prévus :

  • Un à l’Université de Szeged (USZ) pendant deux mois avec Lazlo Vidacs pour confronter les approches de transport optimales aux méthodes d’apprentissage automatique.
  • Un à UNIBO à Bologne pendant 12 mois avec le prof. Daniel Reomndini pour apprendre et appliquer des techniques d’apprentissage multiple (utiles pour caractériser la structure de données intégrée) et de génération de données synthétiques (pour valider et étendre les ensembles de données intégrés obtenus grâce à des approches de transport optimales).

Inscription au doctorat :

Organisme délivrant le 1er degré : Université Toulouse III – Paul Sabatier, https://www.univ-tlse3.fr/home
Organisme délivrant le 2e degré : Alma Mater Studiorum Universitá di Bologna, https://www.unibo.it/en /page d’accueil

Équipe de superviseurs :

Université Toulouse III – Paul Sabatier :

A Toulouse, le doctorant fera partie de l’équipe Statistiques et Optimisation. Cette équipe couvre un spectre allant de la théorie aux applications. Une grande partie des applications est orientée vers la biologie avec de nombreuses collaborations avec l’INRAE ​​et l’INSERM. La thèse sera encadrée par Sébastien Déjean (statistiques, analyse de données omiques), Philippe Saint-Pierre (biostatistiques, apprentissage automatique) et Nicolas Savy  (biostatistiques, probabilités, apprentissage automatique).

Université de Bologne :

À Bologne, le professeur Daniel Remondini est professeur titulaire et chef du groupe de biophysique du département de physique et d’astronomie de l’UNIBO. Il travaille depuis plus de 20 ans sur l’analyse et la modélisation de données biologiques en médecine (multi-omique, imagerie, textes et chaînes symboliques), en appliquant les méthodes de théorie des réseaux, d’apprentissage automatique et d’intelligence artificielle. Le professeur Remondini enseigne dans les cours biomédicaux (Physique pour la médecine et la biotechnologie, École de spécialisation en physique médicale) et dans le Master de Physique appliquée (Réseaux complexes, Reconnaissance de formes).

Description des établissements d’accueil :

L’Université Toulouse III – Paul Sabatier est une référence pédagogique en région Occitanie. Il propose un large éventail de programmes dans les domaines des sciences, de la technologie et de la santé. L’Institut de Mathématiques (IMT) fédère la communauté mathématique de la région toulousaine. Il est composé de 6 équipes principales qui couvrent un très large spectre des mathématiques allant des aspects théoriques jusqu’aux applications.

Le groupe de recherche d’UNIBO est actif depuis près de 20 ans dans la modélisation et l’analyse de processus biologiques et de données à haut débit. Le groupe applique et développe des algorithmes de bioinformatique et d’analyse statistique, ainsi que des approches basées sur les réseaux pour les systèmes complexes. Cette expertise a également été appliquée dans des contextes cliniques et industriels en relation avec le développement d’outils automatisés de diagnostic et de classification. La théorie des réseaux, la mécanique statistique, l’apprentissage automatique et l’apprentissage profond font partie des outils utilisés à ces fins.

Exigences

Domaine de recherche
Mathématiques » Mathématiques appliquées
niveau d’éducation
Master ou équivalent
Domaine de recherche
La physique
niveau d’éducation
Master ou équivalent
Domaine de recherche
L’informatique
niveau d’éducation
Master ou équivalent
Domaine de recherche
Sciences Biologiques
niveau d’éducation
Master ou équivalent
Compétences/qualifications
  • Une maîtrise ou un diplôme d’ingénieur en mathématiques appliquées, statistiques, biostatistiques, bioinformatique ou informatique.
  • Utilisateur expérimenté du logiciel statistique R, et au moins des connaissances de base dans un autre langage de programmation (Python, …) et système de gestion de bases de données.
  • Une expérience de l’analyse de données réelles multivariées et de données biologiques serait un plus.
  • Intérêt pour la biologie, les processus biologiques et la complexité de la vie.
  • Formation et expérience de recherche antérieure pertinentes pour le poste choisi.
  • Réseautage et bonnes compétences en communication (compétences en rédaction et en présentation).
  • Volonté de voyager à l’étranger à des fins de recherche, de formation et de diffusion.
Exigences particulières
  • N’importe quelle nationalité
  • Candidat au doctorat (DC) :  Le candidat ne doit pas avoir obtenu de doctorat.
  • Règle de mobilité :  Le DC ne doit pas avoir résidé ou exercé une activité principale (travail, études, etc.) dans le pays de son organisation d’accueil pendant plus de 12 mois* au cours des trois années précédant immédiatement la date de sélection dans le même organisme de nomination. organisation internationale.

* EXCLUS : les courts séjours tels que les vacances, les services nationaux obligatoires tels que le service militaire obligatoire et les procédures d’obtention du statut de réfugié au titre de la Convention générale.

  • Langue :  les candidats doivent démontrer des capacités de lecture, d’écriture et d’expression orale courantes en anglais (B2).
Langues
ANGLAIS
Niveau
Bien
Domaine de recherche
InformatiqueSciences biologiquesPhysiqueMathématiques » Mathématiques appliquées
Années d’expérience en recherche
1 – 4

Informations Complémentaires

Avantages

Nous offrons

  • Un programme de formation complet, interactif et international couvrant les aspects plus larges et l’interface entre la vie. sciences, science des données, intelligence artificielle et sciences humaines et sociales, ainsi que compétences transférables.
  • Une équipe enthousiaste de professionnels avec qui coopérer.
  • Plan Personnel de Développement de Carrière (PDCP) pour préparer les jeunes chercheurs à leur future carrière.
    Chaque DC suivra une formation individuelle dans des instituts individuels selon la description du PCDP.
  • Une rémunération attractive et conforme au règlement du programme MSCA-DN pour les doctorants. Le salaire exact sera confirmé et sera basé sur une allocation de subsistance de 3400€/mois* (facteur de correction à appliquer par pays) + allocation de mobilité de 600€/mois. Par ailleurs, les chercheurs peuvent également bénéficier d’une allocation familiale** de 660€/mois, selon leur situation familiale. Des déductions fiscales et sociales (y compris les pensions) basées sur les réglementations nationales et celles de l’entreprise s’appliqueront. 

*salaire brut mensuel.

**famille = être marié/être dans une relation de statut équivalent à un mariage reconnu par la législation du pays ou de la région où il a été formalisé/avoir des enfants à charge qui sont entretenus par le chercheur.

Critère d’éligibilité
  • N’importe quelle nationalité
  • Candidat au doctorat (DC) :  Le candidat ne doit pas avoir obtenu de doctorat.
  • Règle de mobilité :  Le DC ne doit pas avoir résidé ou exercé une activité principale (travail, études, etc.) dans le pays de son organisation d’accueil pendant plus de 12 mois* au cours des trois années précédant immédiatement la date de sélection dans le même organisme de nomination. organisation internationale.

* EXCLUS : les courts séjours tels que les vacances, les services nationaux obligatoires tels que le service militaire obligatoire et les procédures d’obtention du statut de réfugié au titre de la Convention générale.

  • Langue :  les candidats doivent démontrer des capacités de lecture, d’écriture et d’expression orale courantes en anglais (B2).
Processus de sélection

Le processus de sélection est basé sur les mérites de l’égalité des chances et sera conforme au  Code de conduite européen pour le recrutement des chercheurs .

  1. Les candidats  postulent à un poste en utilisant le  formulaire de candidature en ligne disponible sur le site FAIROmics.
  2. Le  chef de projet FAIROmics fournit un premier écran  des candidatures écrites pour  vérifier l’éligibilité  du candidat et transmet les candidatures éligibles aux superviseurs du DC.
  3. Les  superviseurs du DC  sélectionneront les  meilleurs candidats sur la base de leur CV, de leurs dossiers académiques, de leurs lettres de recommandation et de motivation et de leurs compétences adéquates.  Afin de mieux évaluer le meilleur candidat, les candidats présélectionnés pourraient être invités à rédiger un résumé des documents scientifiques fournis pertinents pour le sujet de recherche.
  4. Les candidats sélectionnés seront  interviewés lors d’une réunion en ligne par le comité de sélection  (deux superviseurs principaux et deux représentants d’un bénéficiaire ou d’un partenaire associé, avec au moins une personne extérieure au projet du CD).
  5. Les  meilleurs candidats seront choisis par les  encadrants principaux . Le chef de projet européen communiquera les candidats retenus au consortium et aux partenaires.
Site Web pour plus de détails sur le travail
Job Catégorie: Mathématiques
Job Type: Doctorat
Job Location: France

Apply for this position

Allowed Type(s): .pdf, .doc, .docx