Enzymes Hyperthermophiles Impliquées Dans Les Voies De Biosynthese : Cas De L'Adénylosuccinate Synthétase Et Des Ornithine Et Aspartate Carbamoyltransferases
Bernard LABEDAN, Ahmed BOUYOUB et Anne BOYEN*
Institut de Génétique et Microbiologie, BMGE, Université Paris-Sud, Bat 40991405 Orsay Cedex
* Microbiologie VUB et ULB, Vlaams Interuniversitair Instituut voor Biotechnologie et Institut de Recherches du CERIA-COOVI. Av. E. Gryzon, 1. B-1070 Bruxelles.
La séquence d'une phase ouverte de lecture codant pour un homologue de
l'adénylosuccinate synthétase a été déterminée dans notre laboratoire par Ahmed BOUYOUB
dans le cas d'une souche de Pyrococcus sp. (souche ST700 de l'IFREMER) qui pousse à
102*C. Cette protéine hyperthermophile présente des caractéristiques remarquables : (1) elle est
plus courte que ses homologues mésophiles et le déficit (21%) en acides aminés se traduit par la
perte de deux hélices a et trois brins b. Ces deux structures sont assez périphériques et leur perte
pourrait ne pas être dommageable à l'activité enzymatique, mais importante pour le maintien de
la structure globulaire à haute température. (2) Plus surprenant, on trouve un grand nombre de
substitutions dans des résidus complètement conservés chez tous les homologues, et qui
souvent correspondent à des positions cruciales pour l'activité enzymatique et/ou le maintien de
la structure globulaire chez Escherichia coli. Malgré ces changements drastiques, nous avons pu
montrer que cette enzyme hyperthermophile devait être fonctionnelle in vivo puisque le gène
d'archaebactérie est capable de complémenter un mutant auxotrophe purA de Escherichia coli.
Pour déterminer comment l'accumulation de ces substitutions reflétait l'histoire de cette
protéine, nous avons reconstruit un arbre phylogénétique. Il apparaît que PurA est une protéine
parfaitement orthologue et est un bon marqueur phylogénétique puisque l'arbre obtenu est
similaire à l'arbre des ARN 16S/18S. Par contre, l'hyperthermophilie ne se limiterait pas à ces
substitutions dans la mesure où la topologie de l'arbre n'est pas modifiée quand elles ne sont
pas prises en compte.
A côté de ce cas simple d'une protéine orthologue donnant un arbre phylogénétique
orthodoxe, nous avons étudié un cas beaucoup plus complexe de deux protéines paralogues
donnant un arbre hétérodoxe. En effet, les ATCases et les OTCases que nous avons étudiées
avec Anne BOYEN du laboratoire de Nicolas GLANSDORFF à Bruxelles, présentent
manifestement des liens de parenté. Elles ont une parenté fonctionnelle (utilisation du même
mécanisme de fixation du carbamoylphosphate). C'est la moitié N-terminale (correspondant à ce
que l'on appelle la région polaire) qui assure pour chaque enzyme cette fonction, l'autre moitié
(la région équatoriale) étant plus spécialisée dans l'interaction avec, soit l'aspartate, soit
l'ornithine. Cette similitude de fonction s'accompagne d'une bonne similitude des séquences
primaires, essentiellement limitée à la région polaire. Cependant, même si les structures
primaires des régions équatoriales ont beaucoup divergé, il y a une bonne conservation au
niveau des structures secondaires. Ces deux protéines doivent donc provenir d'une duplication
en tandem d'un gène codant pour une carbamoyltransferase à spectre large. Puisque l'on trouve
ces deux protéines chez des représentants des trois grands domaines du Vivant, y compris les
archaebactéries, il faut admettre que cette duplication a dû se produire avant la divergence de ces
grands domaines, dans le dernier ancêtre commun. Autrement dit, ces deux protéines ont les
caractéristiques attendues de protéines paralogues.
Si cette hypothèse est bonne, nous avons donc un outil permettant de tester la topologie
de l'arbre du Vivant, puisque l'on peut enraciner chaque arbre de gène par la famille paralogue.
Nous avons donc aligné les quelques 50 séquences d'ATCases et d'OTCases disponibles.
Comme attendu, cet alignement a été relativement aisé dans la moitié N-terminale et dans
l'extremité C-terminale. Par contre, l'alignement des régions équatoriales a été très laborieux.
Cependant, une fois obtenu, cet alignement nous a permis d'obtenir un seul arbre, quelle que
soit la méthode utilisée, parcimonie ou distance. Cet arbre confirme clairement l'existence de
deux familles de gènes paralogues. On obtient aussi la même topologie en utilisant les
séquences entières ou seulement les régions polaires, et presque la même topologie en utilisant
les régions équatoriales. Donc, cet arbre semble bien refléter l'histoire de ces deux protéines.
Cependant, si on essaie maintenant d'interpréter cet arbre de gènes comme un arbre d'espèces,
on se heurte à différents problèmes. Dans le cas des eucaryotes, la topologie est conforme à ce
que l'on admet habituellement pour l'enchaînement des espèces. Par contre, dans le cas des
procaryotes, on note que (1) les archaebactéries se retrouvent au milieu des bactéries et sont
polyphylétiques, (2) les bactéries elles-mêmes sont polyphylétiques.
En fait, on peut distinguer à l'intérieur de chaque famille des sous-familles. Par
exemple, dans le cas des ATCases, on aurait une famille I correspondant à un groupe de
bactéries et une famille II correspondant au reste des bactéries et à tous les eucaryotes. Ces deux
familles ont au moins deux signatures qui les distinguent aisément dans l'alignement multiple.
On a donc un arbre dont le message est brouillé par différents niveaux de paralogie. De plus, on
a un deuxième niveau de brouillage qui correspond à plusieurs cas potentiels de transfert
horizontal. Le cas le plus frappant est celui qui réunit sur le même noeud les OTCases de
l'archaebactérie Halobacterium salinarium et du petit pois.
Donc, cet arbre ne pourra être utilisé comme outil pour tester l'Arbre du Vivant que
lorsque tous les cas de paralogie et transferts horizontaux auront été résolus.