Linux & données génomiques

Formation continue courte

Linux pour l'analyse de données génomiques

Mise à jour : 04/06/2021

Période ?
  • Date de début : 27/09/2021
  • Date de fin : 01/10/2021
  • 35 heures
Pour qui ?
  • salarié ou demandeur d'emploi

Professionnels du secteur public ou privé confrontés à la nécessité d’automatiser des analyses génomiques du fait de l’augmentation des quantités de données.

Où ?
  • Montpellier SupAgro (Campus la Gaillarde)

Objectifs

Le système d’exploitation Linux est disponible sur de nombreux ordinateurs. Il constitue notamment le cœur du système d’exploitation des ordinateurs MAC, c’est également le système d’exploitation de la majorité des serveurs/clusters de calculs. Même s’il dispose d’une interface graphique conviviale, sa force repose essentiellement sur la possibilité d’utiliser un ensemble de commandes textuelles très puissantes qu’il est possible d’enchainer pour réaliser automatiquement des tâches complexes et/ou répétitives.

Ceci permet de traiter plus facilement des données stockées sous formes de nombreux (des milliers) ou de très volumineux (>Gb) fichiers. De plus, des dizaines d'outils liés à l’analyse de données génomiques (notamment pour le traitement de données NGS) ne sont disponibles que pour Linux.

Les objectifs de cette formations sont :

  • Connaître les commandes de base du système Linux et savoir les utiliser pour traiter des données génomiques.
  • A la fin du module vous serez capable d’écrire des scripts simples en « bash » (le langage de base de Linux)
  • Ceci constitue également une introduction à l’écriture de scripts en Perl ou Python.

Thèmes

  • Informatique, bio-statistique, data sciences
  • Contenu et programme

    Langues d'enseignement : en français

    • Manipulation de nombreux fichiers fasta et fastq (les renommer, en déplacer un sous-ensemble, les trier, compter le nombre de séquences qu’ils contiennent, etc.)
    • Collecte des résultats contenus dans plusieurs fichiers pour obtenir un fichier de synthèse analysable facilement à l’aide de tableurs (e.g. Excel) ou de R
    • Enchainement des étapes nécessaires à une analyse phylogénétique s’appuyant sur plusieurs gènes
    • Enchainement des étapes nécessaires à l’identification de polymorphisme à partir de données NGS
  • Conditions d'admission

    • Prérequis : Connaissances de bases en génomique. Les exemples seront traités essentiellement du point de vue de l’automatisation des tâches (l’intérêt et les fondements de ces analyses ne seront   que brièvement évoquées). Aucune compétence en informatique n’est pré-requise, mais un goût pour l’outil informatique et pour la logique sont essentiels.
    • Date limite d’inscription : 07/09/2021

Responsables pédagogiques

Partenaires

Intervenants :

  • Vincent RANWEZ, professeur, Montpellier SupAgro
  • Muriel TAVAUD, maître de conférences, Montpellier SupAgro
  • Alexandre DEHNE-GARCIA, ingénieur INRAE

Lieu

Montpellier SupAgro
Campus de La Gaillarde
2 place Pierre Viala
Montpellier

Inscription

Tarifs

410 € nets de taxes/jour/participant soit 2 050 € pour les 5 jours (non dissociables)
Agents du Cirad, de l’INRAE, et autofinancement : nous contacter
Déjeuners pris en charge par Montpellier SupAgro

Contacts

L'institut Agro | Montpellier SupAgro
2 place Pierre Viala
34060 Montpellier - France
Tél. : +33 (0)4 99 61 22 00 Tél. : +33 (0)4 99 61 22 00
Fax : +33 (0)4 99 61 29 00
contact@supagro.fr

Sous la tutelle de :

Bloc Marianne - République Française

Membre de :

Fondateur de :

Certifié & labellisé :