Thématiques

Les applications biologiques nécessitant une infrastructure de recherche bioinformatique à grande échelle sont nombreuses. L'école Cumulo NumBio s'articulera autour des besoins bioinformatiques concernant l'intégration des outils et des données biologiques, l'interopérabilité, et leur rapport avec une infrastructure informatique de type cloudLes thématiques abordées sont les suivantes.

Le programme de l’école sera réparti sur 7 demi-journées et comportera une alternance de présentations magistrales et d’ateliers pratiques des différents thèmes scientifiques et solutions techniques de l’école. Les intervenants seront issus des communautés biologie/bioinformatique et informatique.

Les intervenants comme les participants seront invités à afficher des posters de leurs travaux.

Besoins des sciences du vivant

Les technologies de séquençage sont capables de produire des teraoctets (To) de données par expérience et sont devenues emblématiques des améliorations technologiques engendrant un déluge de données ces dernières années. Mais ce ne sont pas les seules. Le grand intérêt de toutes ces nouvelles technologies haut-débit, c’est qu’elles permettent aux biologistes d’adopter une démarche encyclopédique  pour étudier les questions biologiques d’intérêt en leur donnant accès à  l’ensemble du génome d’un organisme, à tous les transcrits, toutes les protéines, toutes les interactions. Des exemples de la génomique et de la protéomique seront présentés pour poser la problématique.

Coordination: Christophe BRULEY (CEA iRTSV/BGE/EDyP), Christine GASPIN (INRA UBIA & PF GenoToul Bioinfo), Thierry GRANGE (CNRS Institut Jacques MONOD), Claudine MEDIGUE (CNRS CEA/Genoscope & PF MicroScope), Claude THERMES (CNRS CGM), Alain VIARI (INRIA)

Infrastructures bioinformatiques

L'Institut Français de Bioinformatique (IFB) est une infrastructure nationale de service en bio-informatique issue d¹un appel à propositions « Infrastructures en Biologie et Santé » du programme national des «Investissements d'Avenir». Ce projet rassemble des plates-formes de bioinformatique dépendant des cinq principaux organismes publics de recherche, CNRS, INRA, INRIA, CEA et INSERM, des universités, du CIRAD, et des Instituts Pasteur et Curie, soit une trentaine de plates-formes regroupées en six pôles régionaux couvrant le territoire national. L'IFB est également le nœud français de l’infrastructure de recherche européenne d’ELIXIR.

L'IFB a pour mission principale de fournir des services de base en bioinformatique aux chercheurs et ingénieurs des sciences du vivant. Pour pouvoir gérer les grandes masses de données produites et réaliser sur ces dernières les analyses à grande échelle appropriées, il est nécessaire de disposer d’une infrastructure informatique dédiée, convenablement dimensionnée. L'IFB met en place un cloud académique pour les sciences du vivant, actuellement en phase pilote.

Coordination: Christophe BLANCHET (CNRS IFB), Olivier COLLIN (CNRS IFB-GO PF GenOuest), Jean-François GIBRAT (INRA IFB)

Infrastructures de cloud de production

Cette thématique aborera les infrastructures de cloud pluridisciplinaires disponibles à la communauté académique pour le traitement des données.

Coordination: Vincent BRETON (CNRS IDG), Charles LOOMIS (Sixsq)

Recherche en cloud computing

La recherche française dans le domaine des infrastructure de cloud produit des solutions innovantes pour répondre aux problématiques toujours plus complexes des applications scientifiques, dont les sciences du vivant.

Coordination: Michel DAYDE (CNRS IRIT), Frédéric DESPREZ (INRIA LIP)

Intégration des données et des outils bioinformatiques

Au-delà de la simple gestion de ce flot de données, le rôle central que joue la bioinformatique est d’aider les biologistes à extraire des connaissances biologiques à partir de ces grandes masses de données brutes. Beaucoup d’analyses sont constituées par un enchaînement de logiciels, les sorties des uns étant les entrées des autres d’où l’intérêt manifesté par les bioinformaticiens pour les workflows et autres pipelines.

Coordination: Sarah COHEN-BOULAKIA (Université Paris-Sud LRI), Christine FROIDEVAUX (Université Paris-Sud LRI)

Gestion des données dans le cloud

Ces différents traitements requièrent l’utilisation de grosses quantités de données mises à jours régulièrement et devant être accédées en mode fichier pour des questions de compatibilité avec l’ensemble de ces outils logiciels historiques. Ces caractéristiques nécessitent de s’appuyer sur une infrastructure informatique adaptée aux problèmes rencontrés. 

Coordination: Gabriel ANTONIU (INRIA KerData)

Personnes connectées : 1