Autres banques de séquence
Banques protéiques
- Swissprot. La mieux annotée des banques protéiques.
Release 39 (2001): 101247 entrées, 37 135 523 aa.
Attention: toutes les
protéines connues n'y sont pas! Visiter le serveur
- PIR (Protein Identification Resource), EMBL.
- NR Protéique (Non-redundent): Banque protéique du NCBI = Traduction de tous les CDS de
GenBank + PDB + SwissProt + PIR + PRF - redondances.
Banques nucléotidiques
- NR nucléique (Non-redundant). Banque combinée: Genbank+refseq+pdb (20x10e9 nt / oct. 2002)
- gbEST / dbEST: Inclus dans Genbank
- Unigene:
banque d'ESTs classifiés ("clusterisés"). Dans chaque cluster Unigene
sont regroupés des EST ayant une similarité de séquence
significative. On peut donc trouver des transcripts différents et des
artefacts (chimères, etc.). Unigene ne propose pas de mRNA
reconstruits (contigs) à partir des séquences d'un cluster.
- TIGR Human Gene Index (HGI). Ici encore on a
clusterisé les EST, mais HGI est une banque de "contigs", c.a.d. de
séquences de mRNA reconstruites à partir des EST d'un même
cluster. Les clusters étant souvent hétérogènes, ils produisent
souvent plusieurs contigs. Ces contigs doivent théoriquement
correspondre à des mRNA alternatifs.
- Banques de gènes (cf page "index de gènes")
- Banques spécialisées
Certaines collections de séquences, bien que généralement présentes dans Genbank,
sont beaucoup plus utiles lorsqu'elles sont rassemblées dans des
banques spécialisées:
- Récepteurs des lymphocytes T (réarrangements de l'ADN)
- Génomes HIV, collections de séquences ENV obtenue chez le même individu, etc.