Linux & données génomiques

Formation continue courte

Linux pour l'analyse de données génomiques

Mise à jour : 29/03/2024

Le système d’exploitation Linux est disponible sur de nombreux ordinateurs. Il constitue notamment le cœur du système d’exploitation des ordinateurs MAC, c’est également le système d’exploitation de la majorité des serveurs/clusters de calculs. Même s’il dispose d’une interface graphique conviviale, sa force repose essentiellement sur la possibilité d’utiliser un ensemble de commandes textuelles très puissantes qu’il est possible d’enchainer pour réaliser automatiquement des tâches complexes et/ou répétitives.


Période ?
  • Dates à définir
Pour qui ?
  • salarié·e ou demandeur·se d'emploi

Professionnels du secteur public ou privé confrontés à la nécessité d’automatiser des analyses génomiques du fait de l’augmentation des quantités de données.

Où ?
  • L'Institut Agro Montpellier (Campus la Gaillarde)

Objectifs

Ceci permet de traiter plus facilement des données stockées sous formes de nombreux (des milliers) ou de très volumineux (>Gb) fichiers. De plus, des dizaines d'outils liés à l’analyse de données génomiques (notamment pour le traitement de données NGS) ne sont disponibles que pour Linux.

Les objectifs de cette formations sont :

  • Connaître les commandes de base du système Linux et savoir les utiliser pour traiter des données génomiques.
  • A la fin du module vous serez capable d’écrire des scripts simples en « bash » (le langage de base de Linux)
  • Ceci constitue également une introduction à l’écriture de scripts en Perl ou Python.

Thèmes

  • Informatique, bio-statistique, data sciences
  • Contenu et programme

    Langues d'enseignement : en français

    • Manipulation de nombreux fichiers fasta et fastq (les renommer, en déplacer un sous-ensemble, les trier, compter le nombre de séquences qu’ils contiennent, etc.)
    • Collecte des résultats contenus dans plusieurs fichiers pour obtenir un fichier de synthèse analysable facilement à l’aide de tableurs (e.g. Excel) ou de R
    • Enchainement des étapes nécessaires à une analyse phylogénétique s’appuyant sur plusieurs gènes
    • Enchainement des étapes nécessaires à l’identification de polymorphisme à partir de données NGS
  • Conditions d'admission

    • Prérequis : Connaissances de bases en génomique. Les exemples seront traités essentiellement du point de vue de l’automatisation des tâches (l’intérêt et les fondements de ces analyses ne seront   que brièvement évoquées). Aucune compétence en informatique n’est pré-requise, mais un goût pour l’outil informatique et pour la logique sont essentiels.
    • Date limite d’inscription : 11/09/2023

Responsables pédagogiques

Partenaires

Intervenants :

  • Vincent RANWEZ, professeur, L'Institut Agro Montpellier
  • Muriel TAVAUD, maître de conférences, L'Institut Agro Montpellier
  • Alexandre DEHNE-GARCIA, ingénieur INRAE

Encadrement :

  • Isabel MARTIN GRANDE, ingénieure pédagogique numérique, l'Institut Agro Montpellier

Lieu

L'Institut Agro Montpellier
Campus de La Gaillarde
2 place Pierre Viala
Montpellier

Inscription

A noter

Evaluation de la satisfaction
(2023)

Pédagogie & animation
100 %

Contenu & réponses aux attentes
100 %

Satisfaction globale
100 %

Tarifs

425 € nets de taxes/jour/participant soit 2 125 € pour les 5 jours (non dissociables)
Agents du Cirad, de lNRAE, et autofinancement : nous contacter
Déjeuners pris en charge par l'Institut Agro Montpellier

Date limite d'inscription : 11/09/2023

Contacts

Membre de :

Fondateur de :

Certifié & labellisé :