Décrire un ensemble de séquences à l'aide d'un profil
Matrice score-position (Position Weight Matrices)
|
positions |
| 1 | 2 | 3 | 4 | 5 |
D | 0.04 | 0.01 | 0.00 | 0.02 | 0.11 |
F | 0.01 | 0.03 | 0.01 | 0.12 | 0.03 |
R | 0.00 | 0.00 | 0.04 | 0.02 | 0.01 |
etc.. |
- Plus subtil que les consensus: Pour chaque position de l'alignement, on
détermine la fréquence d'observation des différents résidus.
- Ceci est résumé dans un tableau qui donne pour chaque position
les fréquences des 20 a.a.
- Une matrice de score est calculée à partir du tableau, selon la
formule:
Sb,i = log(Fb,i /Fb) (Fb est la
fréquence observée dans le génome analysé)
- La recherche est effectuée en faisant glisser une fenêtre sur la
séquence à analyser et en calculant le score total à chaque position de la fenêtre.
- Une banque de profils interrogeable est disponible à l'ISREC:
Profilescan
- La banque de motifs Prosite est maintenant distribuée sous forme de profils.