Comment réaliser in silico l'analyse fonctionnelle détaillée d'une protéine?
Déterminer avec fiabilité la fonction d'une
protéine d'après sa séquence demande
l'application d'un protocole bien précis. On peut lire
à ce sujet le papier de Bork et Koonin (Nature genetics,
1998, 18, 313). Les principaux points sont les suivants:
1. Eléments structuraux
L'identification des éléments suivants permet
de s'assurer que les recherches d'homologies se déroulent sans artefact.
- Régions de basse complexité (pour masquage)
- Régions transmembranaires
- Répétitions internes (ex: D1-D2-D1)
2. Homologies
C'est par homologie que l'on identifie le plus souvent les
domaines/motifs fonctionnels de la protéine...
- Identification de domaines connus (Prosite-Prodom)
- Recherches itératives pour l'extension des homologies
- Manuellement ou avec PSI Blast
- PAM250 au lieu de BLOSUM62
- Si protéine modulaire: masquer les domaines identifiés et lancer
la recherche sur la partie restante.
- Précautions essentielles: ne pas considérer que les meilleurs scores
Blast, ne pas croire systématiquement les annotations, Tenir
compte du contexte (par ex: pas de séquence signal dans un doigt de zinc)
3. Synthèse
- Alignement multiple pour visualisation finale des domaines conservés/absents.
- Vérifier la présence de paralogues (par ex:
substrats différents). La meilleure approche est de
réaliser l'arbre phylogénétique.