Enzymes Hyperthermophiles Impliquées Dans Les Voies De Biosynthese : Cas De L'Adénylosuccinate Synthétase Et Des Ornithine Et Aspartate Carbamoyltransferases

Bernard LABEDAN, Ahmed BOUYOUB et Anne BOYEN*
Institut de Génétique et Microbiologie, BMGE, Université Paris-Sud, Bat 40991405 Orsay Cedex
* Microbiologie VUB et ULB, Vlaams Interuniversitair Instituut voor Biotechnologie et Institut de Recherches du CERIA-COOVI. Av. E. Gryzon, 1. B-1070 Bruxelles.
La séquence d'une phase ouverte de lecture codant pour un homologue de l'adénylosuccinate synthétase a été déterminée dans notre laboratoire par Ahmed BOUYOUB dans le cas d'une souche de Pyrococcus sp. (souche ST700 de l'IFREMER) qui pousse à 102*C. Cette protéine hyperthermophile présente des caractéristiques remarquables : (1) elle est plus courte que ses homologues mésophiles et le déficit (21%) en acides aminés se traduit par la perte de deux hélices a et trois brins b. Ces deux structures sont assez périphériques et leur perte pourrait ne pas être dommageable à l'activité enzymatique, mais importante pour le maintien de la structure globulaire à haute température. (2) Plus surprenant, on trouve un grand nombre de substitutions dans des résidus complètement conservés chez tous les homologues, et qui souvent correspondent à des positions cruciales pour l'activité enzymatique et/ou le maintien de la structure globulaire chez Escherichia coli. Malgré ces changements drastiques, nous avons pu montrer que cette enzyme hyperthermophile devait être fonctionnelle in vivo puisque le gène d'archaebactérie est capable de complémenter un mutant auxotrophe purA de Escherichia coli. Pour déterminer comment l'accumulation de ces substitutions reflétait l'histoire de cette protéine, nous avons reconstruit un arbre phylogénétique. Il apparaît que PurA est une protéine parfaitement orthologue et est un bon marqueur phylogénétique puisque l'arbre obtenu est similaire à l'arbre des ARN 16S/18S. Par contre, l'hyperthermophilie ne se limiterait pas à ces substitutions dans la mesure où la topologie de l'arbre n'est pas modifiée quand elles ne sont pas prises en compte. A côté de ce cas simple d'une protéine orthologue donnant un arbre phylogénétique orthodoxe, nous avons étudié un cas beaucoup plus complexe de deux protéines paralogues donnant un arbre hétérodoxe. En effet, les ATCases et les OTCases que nous avons étudiées avec Anne BOYEN du laboratoire de Nicolas GLANSDORFF à Bruxelles, présentent manifestement des liens de parenté. Elles ont une parenté fonctionnelle (utilisation du même mécanisme de fixation du carbamoylphosphate). C'est la moitié N-terminale (correspondant à ce que l'on appelle la région polaire) qui assure pour chaque enzyme cette fonction, l'autre moitié (la région équatoriale) étant plus spécialisée dans l'interaction avec, soit l'aspartate, soit l'ornithine. Cette similitude de fonction s'accompagne d'une bonne similitude des séquences primaires, essentiellement limitée à la région polaire. Cependant, même si les structures primaires des régions équatoriales ont beaucoup divergé, il y a une bonne conservation au niveau des structures secondaires. Ces deux protéines doivent donc provenir d'une duplication en tandem d'un gène codant pour une carbamoyltransferase à spectre large. Puisque l'on trouve ces deux protéines chez des représentants des trois grands domaines du Vivant, y compris les archaebactéries, il faut admettre que cette duplication a dû se produire avant la divergence de ces grands domaines, dans le dernier ancêtre commun. Autrement dit, ces deux protéines ont les caractéristiques attendues de protéines paralogues. Si cette hypothèse est bonne, nous avons donc un outil permettant de tester la topologie de l'arbre du Vivant, puisque l'on peut enraciner chaque arbre de gène par la famille paralogue. Nous avons donc aligné les quelques 50 séquences d'ATCases et d'OTCases disponibles. Comme attendu, cet alignement a été relativement aisé dans la moitié N-terminale et dans l'extremité C-terminale. Par contre, l'alignement des régions équatoriales a été très laborieux. Cependant, une fois obtenu, cet alignement nous a permis d'obtenir un seul arbre, quelle que soit la méthode utilisée, parcimonie ou distance. Cet arbre confirme clairement l'existence de deux familles de gènes paralogues. On obtient aussi la même topologie en utilisant les séquences entières ou seulement les régions polaires, et presque la même topologie en utilisant les régions équatoriales. Donc, cet arbre semble bien refléter l'histoire de ces deux protéines. Cependant, si on essaie maintenant d'interpréter cet arbre de gènes comme un arbre d'espèces, on se heurte à différents problèmes. Dans le cas des eucaryotes, la topologie est conforme à ce que l'on admet habituellement pour l'enchaînement des espèces. Par contre, dans le cas des procaryotes, on note que (1) les archaebactéries se retrouvent au milieu des bactéries et sont polyphylétiques, (2) les bactéries elles-mêmes sont polyphylétiques. En fait, on peut distinguer à l'intérieur de chaque famille des sous-familles. Par exemple, dans le cas des ATCases, on aurait une famille I correspondant à un groupe de bactéries et une famille II correspondant au reste des bactéries et à tous les eucaryotes. Ces deux familles ont au moins deux signatures qui les distinguent aisément dans l'alignement multiple. On a donc un arbre dont le message est brouillé par différents niveaux de paralogie. De plus, on a un deuxième niveau de brouillage qui correspond à plusieurs cas potentiels de transfert horizontal. Le cas le plus frappant est celui qui réunit sur le même noeud les OTCases de l'archaebactérie Halobacterium salinarium et du petit pois. Donc, cet arbre ne pourra être utilisé comme outil pour tester l'Arbre du Vivant que lorsque tous les cas de paralogie et transferts horizontaux auront été résolus.