Vaut-il mieux comparer les protéines ou l'ADN?
La meilleure façon de détecter des similarités entre séquences
est généralement la comparaison au niveau protéique.
- Il existe 20 aa contre 4 bases. La probabilité de trouver une "lettre" donnée par hasard
est donc plus importante pour les bases.
- Plusieurs codons produisent le même aa. 134 / 549 substitutions de bases sont synonymes.
Les séquences protéiques sont plus informatives.
- La raison principale est en fait
l'existence d'outils de comparaison plus puissants
pour les aa: utilisation des propriétés physicochimiques ou des substitutions
observées dans l'évolution. Même lorsque les aa sont différents, on est capable de retrouver
des similarités. On en est tout à fait incapable au niveau des bases.
Il existe en fait des cas où la séquence d'ADN est plus conservée que
la séquence protéique, ce qui enlève du poids à l'argument 1
Les comparaisons avec les séquences protéiques ne permettent de
détecter que les régions codantes. Evidemment, on utilisera toujours
la séquence ADN/ARN pour analyser ce qui n'est pas traduit!