Identifier les groupes d'orthologues

On utilise les logiciels de comparaison de séquence pour rechercher les orthologues dans chaque espèce.

Comment différencier orthologue de paralogue? On s'attend à ce que les orthologues soient les plus semblables (meilleur score BLAST).

Il existe des protocoles selectionnant des groupes d'au moins 3 protéines ayant réciproquement les meilleurs score (cf COG).

Ces procédures permettent de s'abstraire du niveau de ressemblance entre orthologues.

Permettent d'identifier les grandes fonctions ancestrales, communes à certaines classes d'organismes.

Un groupe d'ortholoue très répandu (p. ex. eucaryotes, archae et eubactéries) est un bon candidat pour des travaux expérimentaux.

Les grandes classes fonctionnelles

(d'après Riley, 1993)
Traduction Métabolisme énergétique Transcription
Processus cellulaires Pur., pyr., nucléosides et nucléotides Métabolisme acides gras et phospholipides
Biosynthèses aminoacides Métabolisme intermédiaire central Protéines de transport et de liaison
Enveloppe cellulaire Réplication Fonctions Régulatoires
Biosynthèse cofacteurs, gpe prosthétiques et transporteurs Protéines ribosomiques Autres

Protéome Eucaryote

Functional categories in eukaryotic proteomes. The classification categories were derived from
functional classification systems, including the top-level biological function category of the Gene Ontology
project (GO; see http://www.geneontology.org).
Distribution of the homologues of the predicted human proteins. For each protein, a homologue
to a phylogenetic lineage was considered present if a search of the NCBI nonredundant protein sequence
database, using the gapped BLASTP program, gave a random expectation (E ) value of  0.001.
Additional searches for probable homologues with lower sequence conservation were performed using the
PSI-BLAST program, run for three iterations using the same cut-off for inclusion of sequences into the
profile328.
Protéome d'Arabidopsis