En poursuivant votre navigation sur ce site, vous acceptez l'utilisation de cookies pour réaliser des statistiques de visites.

Gestion de vos préférences sur les cookies

Certaines fonctionnalités de ce site s’appuient sur des services proposés par des sites tiers. Ces fonctionnalités déposent des cookies permettant notamment à ces sites de tracer votre navigation. Ces cookies ne sont déposés que si vous donnez votre accord. Vous pouvez les accepter ou les refuser.

Autoriser Interdire

Linux & données génomiques

Formation continue courte

Linux pour l'analyse de données génomiques

Mise à jour : 07/10/2019

Période ?
  • Dates à définir
Pour qui ?
  • salarié ou demandeur d'emploi

Professionnels du secteur public ou privé confrontés à la nécessité d’automatiser des analyses génomiques du fait de l’augmentation des quantités de données.

Où ?
  • Montpellier SupAgro (Campus la Gaillarde)

Objectifs

Le système d’exploitation Linux est disponible sur de nombreux ordinateurs. Il constitue notamment le cœur du système d’exploitation des ordinateurs MAC, c’est également le système d’exploitation de la majorité des serveurs/clusters de calculs. Même s’il dispose d’une interface graphique conviviale, sa force repose essentiellement sur la possibilité d’utiliser un ensemble de commandes textuelles très puissantes qu’il est possible d’enchainer pour réaliser automatiquement des tâches complexes et/ou répétitives.

Ceci permet de traiter plus facilement des données stockées sous formes de nombreux (des milliers) ou de très volumineux (>Gb) fichiers. De plus, des dizaines d'outils liés à l’analyse de données génomiques (notamment pour le traitement de données NGS) ne sont disponibles que pour Linux.

Les objectifs de cette formations sont :

  • Connaître les commandes de base du système Linux et savoir les utiliser pour traiter des données génomiques.
  • A la fin du module vous serez capable d’écrire des scripts simples en « bash » (le langage de base de Linux)
  • Ceci constitue également une introduction à l’écriture de scripts en Perl ou Python.

Thèmes

  • Informatique, bio-statistique, data sciences
  • Contenu et programme

    Langues d'enseignement : en français

    • Manipulation de nombreux fichiers fasta et fastq (les renommer, en déplacer un sous-ensemble, les trier, compter le nombre de séquences qu’ils contiennent, etc.)
    • Collecte des résultats contenus dans plusieurs fichiers pour obtenir un fichier de synthèse analysable facilement à l’aide de tableurs (e.g. Excel) ou de R
    • Enchainement des étapes nécessaires à une analyse phylogénétique s’appuyant sur plusieurs gènes
    • Enchainement des étapes nécessaires à l’identification de polymorphisme à partir de données NGS
  • Conditions d'admission

    Prérequis : Connaissances de bases en génomique. Les exemples seront traités essentiellement du point de vue de l’automatisation des tâches (l’intérêt et les fondements de ces analyses ne seront   que brièvement évoquées). Aucune compétence en informatique n’est pré-requise, mais un goût pour l’outil informatique et pour la logique sont essentiels.

Responsables pédagogiques

Partenaires

Intervenants :

  • Vincent RANWEZ, professeur, Montpellier SupAgro
  • Muriel TAVAUD, maître de conférences, Montpellier SupAgro
  • Alexandre DEHNE-GARCIA, ingénieur Inra

Lieu

Montpellier SupAgro
Campus de La Gaillarde
2 place Pierre Viala
Montpellier

Inscription

Tarifs

410 € nets de taxes/jour/participant soit 2 050 € pour les 5 jours (non dissociables)
Agents du Cirad, de l’Inra, et autofinancement : nous contacter
Déjeuners pris en charge par Montpellier SupAgro

Contacts

Montpellier SupAgro
2 place Pierre Viala
34060 Montpellier. France
Tél. : +33 (0)4 99 61 22 00 Tél. : +33 (0)4 99 61 22 00
Fax : +33 (0)4 99 61 29 00
contact@supagro.fr

Sous la tutelle de :

Membre de :

Fondateur de :

Certifié & labellisé :