ESIL 2ème Année: Bioinformatique sous Unix

Duree: 6 x 3H
V.2.0


Objectifs


NOTE: A chaque fois qu'il sera fait référence au "répertoire PROF", il s'agira de: /export/homes/personnels/gbma/dgaut/TPan2-avance.

a) Prise en main d'Unix

b) Récupération de génomes complets via un serveur ftp

La plupart de génomes complètement séquencés sont déposé d'une part dans Genbank et d'autre part sur les serveurs Web ou ftp des différentes institutions ayant généré ces séquences. Nous allons ici récupérer un génome complet sur le serveur ftp du NCBI.

c) Analyse d'un fichier au format Genbank

Objectif: Extraire rapidement les informations présentes dans un fichier Genbank.

d) Préparation d'un fichier de séquence pour les requètes Blast

Objectif: Blast ne travaille pas sur un fichier Fasta. Il faut pré-traiter les fichiers Fasta avec le programme.

e) Prise en main de Blast

Objectif: Savoir exécuter Blast en local.

f) Prise en main de Clustalw

Objectif: réaliser un alignement en mode local. Indispensable lorsque l'on travaille sur des séquences top-secret, ou lorsque les séquences sont trop nombreuses ou trop longues pour les serveurs Web publics.

g) Prise en main des pftools.

Objectifs: Construire un profil (ou matrice score-position) synthétisant les informations contenues dans un alignement de séquences. Utiliser ce profil pour faire une recherche dans une banque.

h) Construction d'une banque de données des transporteurs ABC du génome de M. genitalium

Objectif: A l'aide des logiciels Blast, ClustalW et pftools, collecter la totalité des membres d'une famille de protéines dans un génome. Présenter cette famille sous forme d'un alignement multiple.




i) Rapport

Rapport en deux pages maxi (plus alignement) sur l'exercice h) uniquement.