Les gènes non codants
Que sont-ils?
Il existe un grand nombre de gènes produisant des ARN dont la fonction n'est pas
de coder pour une protéine. Ces gènes sont transcrits, mais pas traduits.
- Les ARNt. Potentiellement 64 différents dans un génomes, en pratique une quarantaine
dans les génomes microbiens. Probablement beaucoup plus dans les génomes de mammifères.
- Les ARNr: 5S, 16S, 23S pour les procaryotes, 5.5S, 18S et 28S pour
les eucaryotes. Ces molécules de 120, 1500 et 3000 nt, repectivement, sont généralement
observées en quelques exemplaires chez les procaryotes (7 opérons chez coli),
alors que les génomes vertébrés peuvent
accueillir plusieurs dizaines de copies identiques.
- Les ARNsn (small nuclear RNA) éléments du spliceosome.
- Les ARNsno , guides de méthylation.
- Autres ARN 4.5S, 10Sa, Spot42, DicF, MicF, OxyS, DsrA, 6S (procaryotes)
produits des gènes XIST, H19, IPW, 7H4, His-1, NTT (mammifères).
Détection
- Les ARN sont généralement transcrits par les polymérases I et III: n'utilisent pas les
mêmes promoteurs que les gènes protéiques: les programmes classiques ne fonctionnent pas.
- Il n'existe pas de "banque de données d'ARN" pour faire des recherches par homologie.
(Mais on peut utiliser Genbank).
- Les séquences des ARN sont généralement peu conservées: les recherches d'homologie
échouent souvent.
- Les ARN non messagers ne sont pas polyadénylés: on ne les retrouve donc théoriquement
pas dans les banques d'EST.
- Il n'y a bien sûr pas d'ORF à détecter
- Les gènes d'ARN sont fréquemment interrompus par des introns.
Ces difficultés rendent peu applicables les approches conventionnelles, sauf dans le
cas des ARNr 16-18S et 23-28S, qui possèdent des zones conservées suffisamment grandes
pour être détectées par Blast. Le nombre de représentants de ces ARN dans Genbank est
de plus considérable: plus de 1500 ARNr 16S-23S, plus de 200 ARNr 23S-28S, représentant
tous les règnes vivants. On est donc pratiquement certain de détecter la présence de
tels gènes par simple Blast contre Genbank.
Programmes de détection
Dans TRNASCAN de Fichant et Burks, les éléments importants,
appariements et séquences conservées, sont
recherchés directement par le programme. D'autres programmes existent
pour rechercher des ARN spécifiques, mais ils sont plus délicats d'utilisation et
restent utilisés surtout par les initiés.